Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 24 Марта 2011 в 18:19, лабораторная работа

Краткое описание

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Содержимое работы - 1 файл

Лабораторная работа по статистике.doc

— 397.50 Кб (Скачать файл)

Средняя арифметическая ( )                                         456,52

Мода (Mo)                                                                         455

Медиана (Me)                                                                    453,25

Размах  вариации (R)                                                         420

Среднее квадратическое отклонение (σn)                      100,99

Коэффициент асимметрии К.Пирсона (Asп)                  0,02

n=605,94 млн.руб.,

= 456,52> Mo=455> Me=453.25 млн.руб.

          Расхождение между признаками , Mo, Me незначительно, ассиметрия незначительная, поэтому распределение относится к нормальному типу. 

      3. В нормальном и близким к нему распределениях крайние варианты значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем серединные (лежащие в диапазоне ( )). Следовательно, по проценту выхода значений признака за пределы диапазона ( ) можно судить о соответствии длины «хвостов» распределения нормальному закону.

Заключение  по п 3 Крайние варианты значения признака (близкие к хmin и хmax) встречаются в 6% всех случаев, что не превышает 7%, следовательно, можно судить о близкому к нормальному закону распределения. 

Вывод: Гистограмма является одновершинной, существенно асимметричной, “хвосты” распределения не очень длинны, т.к. 6% вариантов лежат за пределами интервала ( ), следовательно, можно судить о близкому к нормальному закону распределения.

     

      II. Статистический анализ  генеральной совокупности

Задача 1. Рассчитанные генеральные показатели представлены в табл.10.

      Таблица 10

      Описательные  статистики генеральной совокупности

Обобщающие  статистические показатели совокупности по изучаемым признакам Признаки
Среднегодовая стоимость основных производственных фондов Выпуск  продукции
Стандартное отклонение 86,10 102,71
Дисперсия 7413,80 10550,16
Асимметричность As -0,152503649 0,042954448
Эксцесс Ek -0,344943844 -0,205332365
Ожидаемый размах вариации признаков RN 507,93720762 605,9254734
 

      Величина  дисперсии генеральной совокупности может быть оценена непосредственно по выборочной дисперсии .

      В математической статистике доказано, что при малом числе наблюдений (особенно при n 40-50) для вычисления генеральной дисперсии по выборочной дисперсии следует использовать формулу

              

      При достаточно больших n значение поправочного коэффициента близко к единице (при n=100 его значение равно 1,101, а при n=500 - 1,002 и т.д.). Поэтому при достаточно больших n можно приближено считать, что обе дисперсии совпадают:

.

     Рассчитаем отношение для двух признаков:

      Для первого признака =7413,80/7166,67=1,03448; для второго признака =10550,16/10198,49=1,03448.

Вывод: Степень расхождения между признаками оценивается величиной дисперсии, так как расхождения не имеется, то выборка является репрезентативной.

      Для нормального распределения справедливо  равенство RN=6sN.

      В условиях близости распределения единиц генеральной совокупности к нормальному  это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

      Ожидаемый размах вариации признаков RN:

      - для первого признака RN =86,10*6=516,60 млн. руб.

      - для второго признака RN  =102,71*6=616,26 млн. руб.

Величина расхождения между показателями: RN и Rn:

      - для первого признака |RN -Rn|=516,60-507.96=8.64 млн. руб.

      - для второго признака |RN -Rn| =616.26-605.94=10.32 млн. руб. 

      Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.

      Как правило, статистические характеристики выборочной и генеральной совокупностей  не совпадают, а отклоняются на некоторую  величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность

   

= |
-
|

определяет  ошибку репрезентативности для средней  величины признака.

      Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой)  выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней .

     Для изучаемых признаков средние  ошибки выборки  даны в табл. 3:

     - для признака Среднегодовая стоимость основных производственных фондов

      =15.45603702

    - для признака Выпуск продукции

    =18.437725

      Предельная  ошибка выборки  определяет границы, в пределах которых  лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1,  гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.

      Для уровней надежности P=0,954; P=0,997; P=0,683 оценки предельных ошибок выборки даны в табл. 3, табл. 4а и табл. 4б.

      Для генеральной средней предельные значения и доверительные интервалы  определяются выражениями:

                             ,

               

      Предельные  ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 11.

      Таблица 11

Предельные  ошибки выборки и ожидаемые границы  для генеральных средних 

Доверительная

вероятность

      Р

Коэффициент

доверия

      t

Предельные  ошибки выборки Ожидаемые границы для средних 
для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683 1 15,73742636 18,77339831 464.26
495.74
437.75
475.29
0,954 2 32,2229167 38,43917272 447.78
512.22
418.08
494.96
0,997 3 50,06844198 59,72735203 423.93
530.07
396.79
516.25
 

     Задача 3 Значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.

        Показатель  асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

      Если  асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. (среднее значение больше серединного Me и модального Mo).

      Если  асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного Me и модального Mo).

     Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:

     |As|  0,25  - асимметрия незначительная;

     0,25<|As| 0.5 - асимметрия заметная (умеренная);

     |As|>0,5  - асимметрия существенная.

      Вывод: Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная левосторонняя асимметрия (As= -0.21<0). Соответственно левая часть эмпирической кривой оказывается длиннее правой и распределении чаще встречаются более низкие значения признака. По оценочной школе ассиметрия незначительная , так как As= -0.21 0,25.

      Для признака Выпуск продукции наблюдается незначительная правосторонняя асимметрия (As= 0,02>0), соответственно правая часть эмпирической кривой оказывается длиннее левой, что означает преимущественное появление в распределении более высоких значений признака. По оценочной школе ассиметрия незначительная , так как As= 0,02 0,25.

          Показатель эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.

      Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.

      Если  Ek>0, то вершина кривой распределения располагается выше  вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.

      Если  Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

       Для нормального распределения Ek=0. При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения.

       Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel