Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 20 Февраля 2012 в 13:02, лабораторная работа

Краткое описание

Цель работы – освоение методики априорного статистического анализа структуры наблюдаемой совокупности с применением компьютерных средств экономико-статистических расчетов.

Содержимое работы - 1 файл

212104-б Статистика ВЗФЭИ Лабораторная 1 вариант 1.doc

— 1.04 Мб (Скачать файл)


Лабораторная работа №1

Автоматизированный априорный анализ статистической совокупности в среде MS Excel

 

Вариант 1

 


Цель работы – освоение методики априорного статистического анализа структуры наблюдаемой совокупности с применением компьютерных средств экономико-статистических расчетов.

Постановка задачи

При проведении статистического наблюдения за деятельностью предприятии корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Исходные данные представлены в таблице 1.

Таблица 1

Исходные данные

 

А

В

С

3

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

4

1

152,00

154,50

5

2

180,50

169,50

6

3

186,50

189,00

7

4

197,00

210,00

8

5

125,00

105,00

9

6

207,50

180,00

10

7

213,50

243,00

11

8

158,00

165,00

12

9

195,50

193,50

13

10

227,00

241,50

14

11

249,50

255,00

15

12

80,00

225,00

16

13

188,00

201,00

17

14

207,50

219,00

18

15

239,00

265,50

19

16

275,00

285,00

20

17

203,00

192,00

21

18

225,50

228,00

22

19

177,50

142,50

23

20

228,50

195,00

24

21

255,50

262,50

25

22

173,00

148,50

26

23

135,50

139,50

27

24

233,00

223,50

28

25

207,50

195,00

29

26

192,50

184,50

30

27

147,50

120,00

31

28

201,50

187,50

32

29

234,50

205,50

33

30

222,50

195,00

34

31

275,00

75,00

35

32

161,00

174,00

 

Статистический анализ выборочной совокупности

1. Выявление и удаление из выборки аномальных единиц наблюдения

1) построим диаграмму рассеяния изучаемых признаков.

При построении диаграммы рассеяния по оси Х расположим значения признака Среднегодовая стоимость основных производственных фондов, а по оси Y – соответствующие значения признака Выпуск продукции.

 

 

На построенном графике находим аномальные точки. Таких точек в данной выборке – две.

Запишем информацию об аномальных точках в таблицу 2.

 

2. Рассчитаем обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию (), средние отклонения – линейное () и квадратическое (), коэффициент вариации (), структурный коэффициент асимметрии К.Пирсона ()

1) расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента ОПИСАТЕЛЬНАЯ СТАТИСТИКА

Получим таблицу 3.

2) Оценка предельных ошибок выборки для различных уровней надежности в режиме ОПИСАТЕЛЬНАЯ СТАТИСТИКА

Расчет предельной ошибки выборки при Р=0,683 и при Р=0,997

 

3) Расчет описательных параметров выборочной совокупности с использование инструмента МАСТЕР ФУНКЦИЙ

 

3. Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов

 

1) Построение промежуточной таблицы

 

2) Генерация выходной таблицы и графиков

 

 

3. Заключительный этап

1) Анализ обобщающих показателей описательной статистики

1.1. Степень колеблемости признака.

Значение коэффициента вариации признака Среднегодовая стоимость основных производственных фондов составило 17,8%. Так как значение коэффициента вариации находится в интервале 0% ≤≤ 40%, следовательно колеблемость признака незначительная.

 

1.2. Однородность совокупности.

Так как ≤ 33%, то совокупность является количественно однородной по данному признаку.

 

1.3. Оценка надежности (типичности) средней величины .

Так как ≤ 40%, то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

 

1.4. Устойчивость индивидуальных значений признака.

Находим отношение показателей и :

0,804565737 > 0,8

следовательно, значения признака неустойчивы, в них имеются «аномальные» выбросы. Т.е., несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдении при выполнении Задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы (2)) и рассматривать в качестве возможных «кандидатов» на исключение из выборки.

 

1.5. Определение границ диапазонов рассеяния значении признака относительно средней.

Согласно вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значении признака будут находиться в диапазоне (2), а 89% значений – в диапазоне (3).

В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:

68,3% войдет в диапазон              ()

95,4% попадет в диапазон              ( 2)

99,7% появится в диапазоне              ( 3)

Таблица 9

Распределение значений признака по диапазонам рассеяния признака относительно

 

Границы диапазонов

Количество значений хi, находящихся в диапазоне

 

Первый признак

Второй признак

Первый признак

Второй признак

- ≤  xi ≤+

164,3285829;

235,6714171

153,0970624;

238,2029376

20

23

- 2≤  xi ≤+ 2

128,6571657;

271,3428343

110,5441248;

280,7558752

29

29

- 3≤  xi ≤+ 3

92,98574861;

307,0142514

67,99118714;

323,3088129

30

30

 

 

Количество значений хi, находящихся в диапазоне

Процентное соотношение рассеяния значений

 

Первый признак

Второй признак

Первый признак

Второй признак

- ≤  xi ≤+

20

23

66,667

76,667

- 2≤  xi ≤+ 2

29

29

96,667

96,667

- 3≤  xi ≤+ 3

30

30

100

100

 

Полученные данные примерно согласуются с ожидаемым по правилу «трех сигм»

 

1.6. Максимально допустимая ошибка наблюдения

В статистической практике величину 3 считают в условиях нормального и близких к нему распределений максимально допустимой ошибкой наблюдения и отбрасывают результаты наблюдений, для которых

.

3 = 3*35,67141713 = 107,0142514

 

1.7. Для нормального распределения справедливо равенство

R = 6 = 6*35,67141713 = 214,0285028

В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

 

2) Анализ типа закономерности распределения

2.1. При анализе формы гистограммы видно, что гистограмма имеет одновершинную форму, есть основания предполагать, что выборка является однородной по данному признаку.

 

2.2. Оценка близости эмпирических данных к нормальной форме распределения.

Нормальное распределение является симметричным, и для него выполняются соотношения:

= Мо = Ме, As = 0, Asn = 0, R = 6

= 200

Мо = 207,5

Ме = 202,25

As = -0,152503649,

Asn = -0,21025237,

R = 150

Eк = -0,344943844

Таким образом можно сказать что гистограмма приблизительно симметрична. Значение эксцесса близко к нулю, следовательно есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.



Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel