Автор работы: Пользователь скрыл имя, 08 Марта 2012 в 17:32, курсовая работа
Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.
Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку.
Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.
Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя показывает уровень этого признака, отнесенный к единице совокупности.
Изучая общественные явления и стремясь выявить их характерные, типичные черты в конкретных условиях места и времени, статистики широко используют средние величины. С помощью средних можно сравнивать между собой различные совокупности по варьирующим признакам.
Средние, которые применяются в статистике, относятся к классу степенных средних. Из степенных средних наиболее часто применяется средняя арифметическая, реже – средняя гармоническая; средняя гармоническая применяется только при исчислении средних темпов динамики, а средняя квадратическая – только при исчислении показателей вариации.
Средняя арифметическая есть частное от деления суммы вариант на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных ее единиц. Средняя арифметическая – наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.
По своему определяющему свойству средняя гармоническая должна применяться тогда, когда общий объем признака образуется как сумма обратных значений вариант. Ее применяют тогда, когда в зависимости от имеющего материала веса приходиться не умножать, а делить на варианты или, что то же самое, умножать на обратное их значение. Средняя гармоническая в этих случаях – это величина обратная средней арифметической из обратных значений признака.
К средней гармонической
следует прибегать в тех
Распределительные средние – мода и медиана, их сущность и способы исчисления.
Мода — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем — значение модальной величины признака по формуле:
где:
Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.
Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение варианта приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле:
Ме = (n(число признаков в совокупности) + 1)/2,
(в случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда).
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:
где:
Свойства медианы
1.Медиана не зависит от тех значений признака, которые расположены по обе стороны от нее.
2.Аналитические операции с медианой весьма ограничены, поэтому при объединении двух распределений с известными медианами невозможно заранее предсказать величину медианы нового распределения.
3.Медиана обладает свойством минимальности. Его суть заключается в том, что сумма абсолютных отклонений значений х, от медианы представляет собой минимальную величину по сравнению с отклонением X от любой другой величины
Моду и медиану в интервальном ряду распределения можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения (рис. 1).
Рис. 1
Медиана рассчитывается по кумуляте (рис. 2). Для её определения из точки на шкале накопленных частот (частностей), соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.
Рис. 2
В симметричных распределениях мода и медиана совпадают.
Мода и медиана в отличии от степенных средних являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.
Мода применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака. Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.
Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.
Соотношения между средней арифметической, медианой и модой
Для одномодального симметричного
ряда распределения средняя
К. Пирсон на основе выравнивания различных
типов кривых определил, что для умеренно
асимметричных распределений справедливы
такие приближенные соотношения между
средней арифметической, медианой и модой:
Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и внутреннего строения рядов распределения пользуются структурными средними, которые представлены ,в основном, модой и медианой.
Пример. Таблица 1. Найти моду и медиану.
Возрастные группы |
Число студентов |
Сумма накопленных частот ΣS |
До 20 лет |
346 |
346 |
20 — 25 |
872 |
1218 |
25 — 30 |
1054 |
2272 |
30 — 35 |
781 |
3053 |
35 — 40 |
212 |
3265 |
40 — 45 |
121 |
3386 |
45 лет и более |
76 |
3462 |
Итого |
3462 |
Решение:
В данном примере модальный интервал находится
в пределах возрастной группы 25-30 лет,
так как на этот интервал приходится наибольшая
частота (1054).
Рассчитаем величину моды:
Это значит что модальный возраст студентов равен 27 годам.
Вычислим медиану. Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:
Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.
Кроме моды и медианы могут быть использованы такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили -10 частей и перцентили — на 100 частей.
Нахождение моды и медианы в дискретном вариационном ряду
Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 2. с распределение семей по числу детей.
Пример. Таблица 2. Распределение семей по числу детей
Группа семей по числу детей |
Число семей |
0 |
10 |
1 |
30 |
2 |
75 |
3 |
35 |
4 |
20 |
5 |
15 |
Итого |
185 |
Очевидно, в этом примере модой будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет или, иначе, можно сказать, что все варианты одинаково модальны. В других случаях не одна, а две варианты могут быть наибольшей частоты. Тогда будет две моды, распределение будет бимодальным. Бимодальные распределения могут указывать на качественную неоднородность совокупности по исследуемому признаку.
Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному результату добавить Ѕ. Так, в распределении 185 семьи по числу детей медианой будет: 185/2 + Ѕ = 93, т.е. 93-я варианта, которая делит упорядоченный ряд пополам. Для того чтобы выяснить значение 93-ей варианты, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 40. Ясно, что здесь 93 варианты нет. Если прибавить к 40 частоту 3-й варианты, то получим сумму, равную 40 + 75 = 115. Следовательно, 93-я варианта соответствует третьему значению варьирующего признака, и медианой будет семья, имеющая двоих детей.
Мода и медиана в
данном примере совпали. Если бы у
нас была четная сумма частот (например,
184), то, применяя указанную выше формулу,
получим номер медианной
Квартили и децили – дополнительные характеристики вариационного ряда
Дополнительно к медиане для характеристики вариационного ряда исчисляют квартили, которые делят ряд по сумме частот на четыре равные части, и децили, которые делят ряд на десять равных частей. Второй квартиль равен медиане, а первый – Q1 и третий – Q3 исчисляют аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ј численности частот, а для третьего квартиля – варианта, отсекающая ѕ численности частот. Исчислим для нашего примера первый и третий квартили:
Q1 = XQ1 +iQ1 * (∑f/4 – SQ1-1)/fQ1,
Q1 = 300 + 50 * (125–60)/100 = 332,5
Для расчета первого квартиля находим ј всех частот: ∑f/4 составит 125 (500/4). Из таблицы 3 видно, что 125-я варианта находится в интервале 300 – 350.
Следовательно, XQ1 = 300. Сумма накопленных частот до этого интервала равна 60 (SQ1-1), частота этого интервала – 100. Расчет дает значение первого квартиля 332,5 тыс. руб. Это означает, что у трех четвертей всех рабочих заработная плата составляет 332,5 тыс. руб. и выше.
Рассчитаем третий квартиль. Три четверти численности частот (3/4 ∑f) составит 375 = 500*3/ 4. 375-я варианта находится в интервале 400 – 450. Следовательно:
Q3 = XQ3 + iQ3 * (3/4∑f – SQ3-1)/fQ3,
Q3 = 400 + 50 *(375 – 275)/180 = 427,75
Третий квартиль составляет 427,75 тыс. руб. Следовательно, заработная плата каждого четвертого работника превышает 427,75 тыс. руб.
Исходя из проделанной работы, можно сделать вывод, что средние величины и их разновидности в статистике играют большую роль. Средние показатели широко применяются в анализе, так как именно в них находят свое проявление закономерности массовых явлений и процессов как во времени, так и в пространстве. Так, например, закономерность повышения производительности труда находит свое выражение в статистических показателях роста средней выработки на одного работающего в промышленности, закономерность неуклонного роста уровня благосостояния населения проявляется в статистических показателях увеличения средних доходов рабочих и служащих и т.д.
Широкое применение имеют такие описательные характеристики распределения варьирующего признака как мода и медиана. Они являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.