Автор работы: Пользователь скрыл имя, 07 Ноября 2011 в 18:18, курсовая работа
При изучении социально-экономических явлений и процессов статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупности. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Нередко эти факторы действуют в противоположном направлении и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (чисто случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет. Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической.
Данные рис. 1.1 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже - крайние; малые и большие значения признака. Форма этого распределения близка к рассматриваемому в курсе математической статистики закону нормального распределения. Великий русский математик А. М. Ляпунов (1857 - 1918) доказал, что нормальное распределение образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего влияния. Случайное сочетание множества примерно равных факторов, влияющих на вариацию урожайности зерновых культур, как природных, так и агротехнических, экономических, создает близкое к нормальному закону распределения распределение хозяйств области по урожайности.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого вариационного ряда называется полигоном (от греч. слова - многоугольник).
Понятие частости
Если в табл. 1.1 число хозяйств с тем или иным уровнем урожайности выразить в процентах к итогу, принимая все число хозяйств (143) за 100%, то средняя урожайность может быть вычислена так:
где w - частость 7-й категории вариационного ряда;
Кумулятивное распределение
Преобразованной формой вариационного ряда является ряд накопленных частот, приведенный в табл. 1.1. Это ряд значений числа единиц совокупности с меньшими и равными нижней границе соответствующего интервала значениями признака. Такой ряд называется кумулятивным. Можно построить кумулятивное распределение «не меньше, чем», а можно «больше, чем». В первом случае график кумулятивного распределения называется кумулятой, во втором - огивой (рис. 1.2).
Плотность, распределения
Если приходится иметь дело с вариационным рядом с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала. Полученное отношение называется плотностью распределения:
Плотность
распределения используется как
для расчета обобщающих показателей,
так и для графического изображения
вариационных рядов с неравными
интервалами.
Рис. 1.2.
Огива и кумулята распределения
по урожайности.
ГЛАВА 2. Структурные средние величины (Мода и медиана).
Абсолютные и относительные показатели.
Структурные средние величины.
Средние являются обобщающими статистическими характеристиками изучаемого массового явления (совокупности) по тому или иному варьирующему признаку и одновременно своего рода абстракцией. Они отражают то общее, что присуще всем единицам совокупности.
Поэтому наравне со средними в качестве общих статистических характеристик изучаемого признака могут быть использованы величины конкретных вариантов, занимающих в ранжированном (построенном в прядке возрастания или убывания) ряду индивидуальных значений признака определенное положение.
В статистических исследованиях в качестве вспомогательных описательных статистических характеристик распределения варьирующего признака широко применяются мода и медиана.
Мода – это наиболее часто встречающееся значение варьирующего признака в вариационном ряду.
Модой распределения
Для дискретного ряда (ряд, в котором значение варьирующего признака представлены отдельными числовыми показателями) модой является значение варьирующего признака обладающего наибольшей частотой.
Для интервального ряда
где: - нижняя граница модального интервала;
- величина модального интервала;
- частота модального интервала;
Применяется мода при экспертных оценках, при установлении размера изделий, который пользуется наибольшим спросом (одежда, обувь), медиана используется при статистическом контроле качества продукции.
Медиана - это значение варьирующего признака, приходящееся на середину ряда, расположенного в порядке возрастания или убывания числовых значений признака, т.е. величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером , где n- число изучаемых единиц.
Для
определения медианы в
где: - нижняя граница модального интервала;
- величина модального интервала;
- накопленная
частота интервала,
- частота медианного интервала;
Медианный интервал не обязательно совпадает с модальным.
Пример.Таблица 2.1.Распределение рабочих участка по квалификации
Тарифный разряд рабочего (xi) | Число рабочих, имеющих данный разряд (fi) | Частости (wi) | Накопленные частоты(Si) |
1 | 2 | 3 | 4 |
2
3 4 5 6 |
1
5 8 4 2 |
0,05
0,25 0,40 0,20 0,10 |
1
6 14 18 20 |
Итого | 20 | 1,00 |
Медиану можно определить графически. Для этого строится кумулята. Для определения Ме высоту наибольшей ординаты делят пополам. Через полученную точку проводятся прямую, параллельную оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения и является Ме.
Наряду с медианой для более полной характеристики совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относят квартили и децили.
Квартили делят ряд по сумме частот на 4 равные части, а децили на 10 равных частей. Квартилей насчитывается три, а децилей – девять.
Расчёт
этих показателей вариационном ряду
аналогичен расчёту медианы. Он начинается
с нахождения порядкового номера
соответствующего варианта и определения
по накопленным частотам того интервала,
в котором этот вариант находится.
Формулы для квартилей в
нижний (или первый квартиль):
,
верхний (или третий квартиль):
, где
– нижние границы соответствующих квартильных интервалов;
- сумма частот ряда;
– накопленные частоты интервалов, предшествующие соответствующим квартильным;
– частоты соответствующих квартильным интервалов.
Вторым квартилем является медиана.
По
соотношению между средней
Эмпирически установлено, что для умеренно ассиметричных рядов разность между модой и средней арифметической примерно в 3 раза превышает разность между медианой и средней Это соотношение можно использовать в отдельных случаях для определения третьего показателя по двум известным.
Абсолютные и относительные показатели
Для измерения вариации признака используют как абсолютные, так и относительные показатели.
К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.
К
относительным показателям
Размах вариации R. Это самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:
Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.
Среднее линейное отклонение d, которое вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.
Формула среднего линейного отклонения (простая):
Формула среднего линейного отклонения (взвешенная):
При использовании показателя среднего линейного отклонения возникают определенные неудобства, связанные с тем, что приходится иметь дело не только с положительными, но и с отрицательными величинами, что побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень широкое распространение. К таким показателям относятся среднее квадратическое отклонение ϭ и среднее квадратическое отклонение в квадрате ϭ², которое называют дисперсией.
Средняя квадратическая простая:
Средняя квадратическая взвешенная:
Информация о работе Статистическое изучение вариации массовых явлений