Автор работы: Пользователь скрыл имя, 24 Марта 2011 в 18:19, лабораторная работа
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Средняя арифметическая ( ) 456,52
Мода (Mo)
Медиана
(Me)
Размах
вариации (R)
Среднее квадратическое отклонение (σn) 100,99
Коэффициент асимметрии К.Пирсона (Asп) 0,02
6σn=605,94 млн.руб.,
= 456,52> Mo=455> Me=453.25 млн.руб.
Расхождение между признаками
, Mo, Me незначительно, ассиметрия незначительная,
поэтому распределение относится к нормальному
типу.
3. В нормальном и близким к нему распределениях крайние варианты значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем серединные (лежащие в диапазоне ( )). Следовательно, по проценту выхода значений признака за пределы диапазона ( ) можно судить о соответствии длины «хвостов» распределения нормальному закону.
Заключение
по п 3 Крайние варианты значения признака
(близкие к хmin и хmax) встречаются в 6% всех
случаев, что не превышает 7%, следовательно,
можно судить о близкому к нормальному
закону распределения.
Вывод: Гистограмма является одновершинной, существенно асимметричной, “хвосты” распределения не очень длинны, т.к. 6% вариантов лежат за пределами интервала ( ), следовательно, можно судить о близкому к нормальному закону распределения.
II. Статистический анализ генеральной совокупности
Задача 1. Рассчитанные генеральные показатели представлены в табл.10.
Таблица 10
Описательные статистики генеральной совокупности
Обобщающие статистические показатели совокупности по изучаемым признакам | Признаки | |
Среднегодовая стоимость основных производственных фондов | Выпуск продукции | |
Стандартное отклонение | 86,10 | 102,71 |
Дисперсия | 7413,80 | 10550,16 |
Асимметричность As | -0,152503649 | 0,042954448 |
Эксцесс Ek | -0,344943844 | -0,205332365 |
Ожидаемый размах вариации признаков RN | 507,93720762 | 605,9254734 |
Величина дисперсии генеральной совокупности может быть оценена непосредственно по выборочной дисперсии .
В математической статистике доказано, что при малом числе наблюдений (особенно при n 40-50) для вычисления генеральной дисперсии по выборочной дисперсии следует использовать формулу
При достаточно больших n значение поправочного коэффициента близко к единице (при n=100 его значение равно 1,101, а при n=500 - 1,002 и т.д.). Поэтому при достаточно больших n можно приближено считать, что обе дисперсии совпадают:
Рассчитаем отношение для двух признаков:
Для первого признака =7413,80/7166,67=1,03448; для второго признака =10550,16/10198,49=1,03448.
Вывод: Степень расхождения между признаками оценивается величиной дисперсии, так как расхождения не имеется, то выборка является репрезентативной.
Для
нормального распределения
В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.
Ожидаемый размах вариации признаков RN:
- для первого признака RN =86,10*6=516,60 млн. руб.
- для второго признака RN =102,71*6=616,26 млн. руб.
Величина расхождения между показателями: RN и Rn:
- для первого признака |RN -Rn|=516,60-507.96=8.64 млн. руб.
-
для второго признака |RN
-Rn| =616.26-605.94=10.32 млн. руб.
Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.
Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность
определяет ошибку репрезентативности для средней величины признака.
Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой) выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней .
Для изучаемых признаков средние ошибки выборки даны в табл. 3:
- для признака Среднегодовая стоимость основных производственных фондов
=15.45603702
- для признака Выпуск продукции
=18.437725
Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.
Для уровней надежности P=0,954; P=0,997; P=0,683 оценки предельных ошибок выборки даны в табл. 3, табл. 4а и табл. 4б.
Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
,
Предельные ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 11.
Таблица 11
Предельные
ошибки выборки и ожидаемые границы
для генеральных средних
Доверительная
вероятность Р |
Коэффициент
доверия t |
Предельные ошибки выборки | Ожидаемые
границы для средних | ||
для
первого
признака |
для второго
признака |
для первого
признака |
для второго
признака | ||
0,683 | 1 | 15,73742636 | 18,77339831 | 464.26 |
437.75 |
0,954 | 2 | 32,2229167 | 38,43917272 | 447.78 |
418.08 |
0,997 | 3 | 50,06844198 | 59,72735203 | 423.93 |
396.79 |
Задача 3 Значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.
Показатель асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.
Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. (среднее значение больше серединного Me и модального Mo).
Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного Me и модального Mo).
Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:
|As| 0,25 - асимметрия незначительная;
0,25<|As| 0.5 - асимметрия заметная (умеренная);
|As|>0,5 - асимметрия существенная.
Вывод: Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная левосторонняя асимметрия (As= -0.21<0). Соответственно левая часть эмпирической кривой оказывается длиннее правой и распределении чаще встречаются более низкие значения признака. По оценочной школе ассиметрия незначительная , так как As= -0.21 0,25.
Для признака Выпуск продукции наблюдается незначительная правосторонняя асимметрия (As= 0,02>0), соответственно правая часть эмпирической кривой оказывается длиннее левой, что означает преимущественное появление в распределении более высоких значений признака. По оценочной школе ассиметрия незначительная , так как As= 0,02 0,25.
Показатель эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.
Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.
Если Ek>0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.
Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.
Для
нормального распределения Ek=0
Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.
Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel