Автор работы: Пользователь скрыл имя, 24 Января 2012 в 19:47, курсовая работа
Цель работы – статистическое исследование рядов распределения.
Для реализации этой цели поставлены следующие задачи: дать понятие и классификацию рядов распределения, изучить сопоставимость уровней ряда распределения - основные предпосылки его анализа, аналитические и средние показатели ряда распределения, статистические подходы к изучению рядов распределения.
В табл. 4 представлены результаты двухсот
испытаний показателя прочности швейных
ниток. Требуется проанализировать колебание
прочности швейных ниток. Из этого вариационного
ряда видно, в каких пределах колеблется
прочность швейных ниток и как с нарастанием
прочности при растяжении до 825 г постепенно
увеличивается число испытаний, а затем
постепенно уменьшается. Наиболее распространенная
прочность швейных ниток при растяжении
оказалась в интервале 775 - 825 (группа 5)
со средним значением 800 г
Таблица 4
Данные испытания прочности швейных ниток
№ группы | Прочность при растяжении, в граммах | Число испытаний прочности швейных ниток |
1 | 575-625 | 8 |
2 | 625-675 | 16 |
3 | 675-725 | 24 |
4 | 725-775 | 33 |
5 | 775-825 | 36 |
6 | 825-875 | 34 |
7 | 875-925 | 26 |
8 | 925-975 | 16 |
9 | 975-1025 | 7 |
ИТОГО | 200 |
На
основе такого вариационного ряд могут
быть исчислены и показатели вариации:
средняя, дисперсия, среднеквадратическое
отклонение, коэффициент вариации, мода,
медиана и др. Для оценки близости эмпирического
отношения к теоретическому нормальному
пользуются специальными показателями,
которые называются согласия. Они разработаны
Пирсоном, Колмогоровым, Романовским и
Ястремским. Наиболее простым и доступным
является критерий Пирсона:
Чем меньше отклонение между эмпирическими и теоретическими частотами, тем меньше значение х2, а значит, теоретическое распределение лучше воспроизводит эмпирическое, и наоборот. Если эмпирические частоты совпадают с теоретическими, х2 = 0.
Вычисление х2 Пирсона связано с показателем, который называется числом степеней свободы. Под числом степеней свободы К понимают количество независимых величин, которые могут принимать независимые значения, не изменяющие заданные характеристики. Так, если средняя выработка рабочих участка равна
деталей, то пять значений из шести могут быть произвольными, а шестое должно быть единственно возможным, при котором средняя выработка 300 деталей останется без изменений. В данном случае задан один параметр (х), поэтому число степеней свободы будет равно: 6-1 = 5.
В нашем примере распределения ткачих по степени выполнения норм выделено семь групп, функция нормального распределения имеет два параметра: и . Кроме того, исчисление критерия х2 связано с ограничительным условием: [2, с.140]
Следовательно, число степеней свободы будет равно: К =7-2-1=4. обозначим число групп m, число параметров r и получим К = т-r-1. По специальной таблице находим значение х2, соответствующее данному числу степеней свободы и заданной вероятности. По этой же таблице для заданного критерия х2 при разных значениях степеней свободы можно определить вероятность того, что расхождение между теоретическими и эмпирическими частотами изучаемого ряда является случайным. Если фактическое значение критерия х2 меньше табличного, то отклонение между эмпирическими и теоретическими частотами являются случайными, несущественными, и можно сделать вывод о том, что теоретическое распределение хорошо воспроизводит эмпирическое, и, наоборот, если фактическое значение больше табличного, то отклонения являются существенными и эмпирический ряд распределения не подчиняется закону нормального распределения.
Пример. Рассчитаем критерий х2 по данным табл. 5. Следовательно, х2 = 8,18. Теперь по таблице находим критическое значение х2 для заданной вероятности и числа степеней свободы. При К=4 и Р = 0,95 получим х2 = 9,49. В нашем примере фактическое значение х2 = 8,18, а табличное х2 = 9,49 т.е. фактическое значение меньше табличного. Следовательно, с вероятностью 0,95 можно утверждать, что распределение ткачих по степени выполнения норм подчиняется закону нормального распределения.
Таблица 5
Распределение ткачих по степени выполнения норм
Номер
группы |
Эмпирические частоты
(f) |
Теоретические
частоты (f1) |
Отклонение (f-f1) |
Квадрат отклонения (f-f1)2 |
Отношение
|
1
2 3 4 5 6 7 |
2
15 26 32 12 9 4 |
5
13 24 28 20 8 2 |
-3
2 2 4 8 1 2 |
9
4 4 16 64 1 4 |
1.80
0.32 0.17 0.57 3.20 0.12 2.0 |
Итого | 100 | 100 | — | — | 8,18 |
Критерий согласия Колмогорова ( ) рассматривает близость эмпирического и теоретического распределения путем сравнения их накопленных частот. Критерий лямбда равен максимальной разности накопленных эмпирических и теоретических частот (без учета знаков), поделенный на корень квадратный из числа наблюдений.
где D — максимальная разность накопленных эмпирических и теоретических частот, а n — объем совокупности. По сравнительной таблице находим вероятность, с которой можно утверждать, что отклонение эмпирических частот от теоретических является несущественным, случайным, т.е. фактическое распределение подчиняется закону нормального распределения.
Пример. Рассчитаем критерий по данным, приведенным в табл. 6 В нашем примере D = 5, п = 100, откуда = 5/10= 0,5. По таблице определяем, что значению X = 0,5 соответствует вероятность 0,963. Следовательно, с вероятностью 0,963 можно утверждать, что отклонение эмпирических частот от теоретических является случайным, т.е: распределение ткачих по степени выполнения норм выработки подчиняется закону нормального распределения.
Таблица 6
Распределение ткачих по степени выполнения норм
Номер
группы |
Эмпирические
частоты |
Теоретические
частоты |
Накопленные частоты | Отклонение | |
эмпирические | теоретические | ||||
1
2 3 4 5 6 7 |
2
15 26 32 12 9 4 |
5
13 24 28 20 8 2 |
2
17 43 75 87 96 100 |
5
18 42 70 90 98 100 |
+3
+1 -1 -5 +3 +2 - |
Итого | 100 | 100 | — | — | — |
В явлениях различных аспектов рыночного хозяйства асимметричные распределения встречаются значительно чаще, чем симметричные. Имеется много функций, характеризующих закономерности эмпирических асимметричных распределений. Распределение, которое с помощью логарифмирования переменной х может быть приведено к нормальному, называется логарифмически нормальным распределением. Частоты такого распределения определяются на основе интегральной функции нормального распределения
Вывод: для объективной оценки близости эмпирических и теоретических частот также пользуются критериями согласия. Некоторые асимметричные распределения могут быть приведены к фермер приближающейся к нормальной, путем преобразования значений признака х. Например, путем логарифмирования переменной асимметричное распределение может быть приведено к нормальному[11, с.140].
3. Графическое изображение рядов распределения
Для
визуального подбора
Таблица 7
Статистический ряд распределения выручки магазина
Интервалы ai – bi |
xi | Wi | WHi | Wi / h |
15,7 – 20,2 | 17,9 | 0,05 | 0,05 | 0,01 |
20,2 – 24,7 | 22,4 | 0,12 | 0,17 | 0,03 |
24,7 – 29,2 | 26,9 | 0,26 | 0,43 | 0,06 |
29,2 – 33,7 | 31,4 | 0,3 | 0,73 | 0,07 |
33,7 – 38,2 | 35,9 | 0,14 | 0,87 | 0,03 |
38,2 – 42,7 | 40,4 | 0,09 | 0,96 | 0,02 |
42,7 – 47,2 | 44,9 | 0,02 | 0,98 | 0,004 |
47,2 – 51,7 | 49,4 | 0,01 | 0,99 | 0,002 |
51,7 – 56,2 | 53,9 | 0,01 | 1 | 0,002 |
Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.
Полигон – ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – частоты. Гладкая кривая, соединяющая точки – это эмпирическая плотность распределения[5, с.96].
Кумулята – ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – накопленные частоты. Для дискретных рядов на оси откладываются сами значения признака, а для интервальных – середины интервалов.
На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения. Для построения гистограммы относительных частот (частостей) по оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте Wi данного i–го интервала. Тогда высота элементарного прямоугольника должна быть равна Wi / h; в нашем примере h=4,5 (рис. 1). Следовательно, площадь под гистограммой равна сумме всех относительных частот, т.е. единице. Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезками прямой (рис. 2). Гистограмма и полигон являются аппроксимациями кривой плотности (дифференциальной функции) теоретического распределения (генеральной совокупности). Поэтому по их виду можно судить о гипотетическом законе распределения.
Для построения кумуляты дискретного ряда по оси абсцисс откладывают значения признака, а по оси ординат – относительные накопленные частоты WHi . Полученные точки соединяют отрезками прямых. Для интервального ряда по оси абсцисс откладывают верхние границы группировки (рис. 3). С кумулятой сопоставляется график интегральной функции распределения F(x). В нашем примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля. Коэффициент асимметрии оказался положительным ( A˜s = 0,6), что свидетельствует о правосторонней асимметрии данного распределения. Эксцесс также оказался положительным ( -E˜k= 0,82). Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальной имеет более крутую вершину. Гистограмма и полигон напоминают кривую нормального распределения (рис. 3.2 и рис. 3.3). Все это дает возможность выдвинуть гипотезу о том, что распределение выручки магазина является нормальным [5, с.98].