Статистический анализ данных выборочного наблюдения

Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 16:54, курсовая работа

Краткое описание

Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
1. Овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
2. Приобретение навыков работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
3. Развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

Содержание работы

Введение……………………………………………………………………………………………….3

1. Сводка и группировка данных статистического наблюдения……………………………………...4
2. Вариационный анализ……………………………………………………………………………….. 8
3. Проверка гипотезы о нормальном характере распределения……………………………………...10
4. Корреляционно-регрессионный анализ……………………………………………………………. 11
5. Множественный корреляционно-регрессионный анализ………………………………………….15
6. Анализ качественных признаков……………………………………………………………...……..16
7. Интервальные оценки………………………………………………………………………………...18

Заключение………………………………………………………..………………………… ………....19
Литература………………………………………………………………………………………………20

Содержимое работы - 1 файл

Трифонова Ольга, 8202 на 5.doc

— 4.09 Мб (Скачать файл)

                                                                                            

Результаты вычислений функции ЛИНЕЙН

 

0,500511583

3,95570884

 

0,002322999

0,30930392

 

0,997143206

0,7751022

 

46422,68082

133

 

27889,97729

79,9041958

 

ЛИНЕЙН рассчитывает прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные. Уравнение для прямой линии имеет следующий вид: y = ax + b где зависимое значение y — функция независимого значения x, значения a — коэффициенты, соответствующие каждой независимой переменной x, а   b — постоянная.

a,b- это коэффициенты уравнения Y=aX+b

sb,sa - это стандартные значения ошибок для a,b

Se- стандартная ошибка оценки Y

Уравнение в данном случае будет:

Yрегр=3,9+0,5*X         

Данное уравнение называют уравнением регрессии, оно показывает нам зависимость между X и Y, в нашем случае между БТП и EQ. Предполагают, что зависимость между признаками X и Y линейная, т.к. в виде Y=a+b*X. Линейная означает, что с увеличением X пропорционально увеличивается или уменьшается Y. Видим, что с увеличением X, пропорционально увеличивается Y. При изменении X на одно число, Yрегр  будет меняться на 0,5.

 

Вывод: В этом пункте было построено уравнение регрессионной связи результативного признака (БТП) с факторным признаком (EQ). Было получено уравнение регрессии в виде Yрегр=3,9+0,5*X, показывающее зависимость между БТП и EQ.

 

6. Расчет прогнозов по уравнению регрессии

 

Делаем прогноз для среднего значения БТП, например, для EQ=200

БТП=3,9+0,5*200= 103,9

Делаем прогноз для среднего значения БТП, например, для EQ=100

БТП=3,9+0,5*100= 53,9

По прогнозам видим, что с увеличением EQ, значение БТП тоже увеличивается. С помощью данного уравнения мы можем сделать прогнозы БТП с другими значениями EQ.

 

   Вывод: Здесь проведен расчет прогнозов по полученному уравнению регрессии из предыдущего пункта. В уравнение подставлены значения EQ и получены тем самым прогноз БТП. Заметили, что если изменить X на любое число, Y будет меняться на 0,5.

7. Доверительные интервалы для прогнозов

С помощью инструмент «Анализ данных» и средства «Регрессия», мы получаем следующие данные:

 

ВЫВОД ИТОГОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

Множественный R

0,99857058

 

 

 

 

 

 

 

R-квадрат

0,99714321

 

 

 

 

 

 

 

Нормированный R-квадрат

0,99712173

 

 

 

 

 

 

 

Стандартная ошибка

0,7751022

 

 

 

 

 

 

 

Наблюдения

135

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

df

SS

MS

F

Значимость F

 

 

 

Регрессия

1

27889,97729

27889,98

46422,68082

4,5265E-171

 

 

 

Остаток

133

79,90419583

0,600783

 

 

 

 

 

Итого

134

27969,88148

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

3,95570884

0,309303923

12,78907

6,40413E-25

3,343917669

4,5675

3,343918

4,5675

Переменная X 1

0,50051158

0,002322999

215,4592

4,5265E-171

0,495916781

0,505106

0,495917

0,505106

 

  ДОВЕРИТЕЛЬНЫЙ  ИНТЕРВАЛ  - вероятность, с которой можно утверждать, что ошибка выборки не превысит некоторую заданную величину, называют  доверительной  вероятностью. Обычно в социальных и маркетинговых исследованиях значения  доверительной  вероятности принимают равным 95%. Пределы, в которых с  доверительной  вероятностью может находиться значение характеристики генеральной совокупности, называют  доверительным   интервалом 

  СТАНДАРТНАЯ ОШИБКА - величина, характеризующая случайную ошибку выборки - стандартное отклонение выборочного распределения статистики.

 

Рассчитать доверительные интервалы для прогнозного среднего значения Y

X среднее= 130,0

Значение t= 1,98                          степени свободы = n-2= 135-2= 133

   

    Стандартная ошибка рассчитывается для конкретного значения Xо

Тогда, для Xо=100

     Стандартная ошибка прогнозирования =0,10

А, для Xо =200

Стандартная ошибка прогнозирования = 0,18

 

Доверительные интервалы для прогнозных средних значений будут с 95% уровнем доверит. вероятности

 

Тогда, для x0=

 

 

100

 

Интервал

 

(

53,71

54,09

)

 

 

 

 

 

 

Тогда, для x0=

 

 

200

 

Интервал

 

(

103,55

104,25

)

 

Подставив в уравнение регрессии значение фактора X, мы получили точечный прогноз, но вероятность такого прогноза крайне мала. Поэтому мы находим стандартную ошибку прогнозирования и  доверительный   интер­вал  прогноза, в который с 95% вероятностью попадают  прогнозные  оценки.  Стандартная  ошибка является мерой точности прогноза. Расчет  доверительного   интервала  говорит о том, что фактические оценки будут попадать в рассчитанный интервал   в 95 % слу­чаев.

 

Вывод: В этом пункте находим доверительные интервалы для прогнозов. Были найдены стандартные ошибки для конкретных значений  X и получены доверительные интервалы (53.71; 54,09) и (103,55; 104,25), говорящие, что фактические оценки будут попадать в этот интервал.

 

 

8.        Корреляционная решетка для пары признаков Баллы по тренингу "Продажа" и "EQ"

         По формуле Стерджесса находим количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика).

Столбец1

 

 

 

 

 

 

h=

12,5

Среднее

130,014815

 

 

 

Стандартная ошибка

2,48079378

 

 

 

Медиана

132

 

 

 

Мода

140

 

 

 

Стандартное отклонение

28,824219

 

 

 

Дисперсия выборки

830,8356

 

 

 

Эксцесс

-1,1818875

 

 

 

Асимметричность

-0,0362871

 

 

 

Интервал

100

 

 

 

Минимум

78

 

 

 

Максимум

178

 

 

 

Сумма

17552

 

 

 

Счет

135

 

 

 

Создадим корреляционную решетку через Сводные таблицы:

Корреляция

EQ

 

 

 

 

 

 

 

 

БТП

78-90,5

90,5-103

103-115,5

115,5-128

128-140,5

140,5-153

153-165,5

165,5-178

Общий итог

43-49,25

14

3

 

 

 

 

 

 

17

49,25-55,5

 

10

1

 

 

 

 

 

11

55,5-61,75

 

 

20

 

 

 

 

 

20

61,75-68

 

 

1

13

1

 

 

 

15

68-74,25

 

 

 

1

19

2

 

 

22

74,25-80,5

 

 

 

 

2

8

3

 

13

80,5-86,75

 

 

 

 

 

1

15

 

16

86,75-93

 

 

 

 

 

 

1

20

21

Общий итог

14

13

22

14

22

11

19

20

135

Информация о работе Статистический анализ данных выборочного наблюдения