Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 16:54, курсовая работа
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
1. Овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
2. Приобретение навыков работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
3. Развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.
Введение……………………………………………………………………………………………….3
1. Сводка и группировка данных статистического наблюдения……………………………………...4
2. Вариационный анализ……………………………………………………………………………….. 8
3. Проверка гипотезы о нормальном характере распределения……………………………………...10
4. Корреляционно-регрессионный анализ……………………………………………………………. 11
5. Множественный корреляционно-регрессионный анализ………………………………………….15
6. Анализ качественных признаков……………………………………………………………...……..16
7. Интервальные оценки………………………………………………………………………………...18
Заключение………………………………………………………..………………………… ………....19
Литература………………………………………………………………………………………………20
Результаты вычислений функции ЛИНЕЙН |
| |
0,500511583 | 3,95570884 |
|
0,002322999 | 0,30930392 |
|
0,997143206 | 0,7751022 |
|
46422,68082 | 133 |
|
27889,97729 | 79,9041958 |
|
ЛИНЕЙН рассчитывает прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные. Уравнение для прямой линии имеет следующий вид: y = ax + b где зависимое значение y — функция независимого значения x, значения a — коэффициенты, соответствующие каждой независимой переменной x, а b — постоянная.
a,b- это коэффициенты уравнения Y=aX+b
sb,sa - это стандартные значения ошибок для a,b
Se- стандартная ошибка оценки Y
Уравнение в данном случае будет:
Yрегр=3,9+0,5*X
Данное уравнение называют уравнением регрессии, оно показывает нам зависимость между X и Y, в нашем случае между БТП и EQ. Предполагают, что зависимость между признаками X и Y линейная, т.к. в виде Y=a+b*X. Линейная означает, что с увеличением X пропорционально увеличивается или уменьшается Y. Видим, что с увеличением X, пропорционально увеличивается Y. При изменении X на одно число, Yрегр будет меняться на 0,5.
Вывод: В этом пункте было построено уравнение регрессионной связи результативного признака (БТП) с факторным признаком (EQ). Было получено уравнение регрессии в виде Yрегр=3,9+0,5*X, показывающее зависимость между БТП и EQ.
6. Расчет прогнозов по уравнению регрессии
Делаем прогноз для среднего значения БТП, например, для EQ=200
БТП=3,9+0,5*200= 103,9
Делаем прогноз для среднего значения БТП, например, для EQ=100
БТП=3,9+0,5*100= 53,9
По прогнозам видим, что с увеличением EQ, значение БТП тоже увеличивается. С помощью данного уравнения мы можем сделать прогнозы БТП с другими значениями EQ.
Вывод: Здесь проведен расчет прогнозов по полученному уравнению регрессии из предыдущего пункта. В уравнение подставлены значения EQ и получены тем самым прогноз БТП. Заметили, что если изменить X на любое число, Y будет меняться на 0,5.
7. Доверительные интервалы для прогнозов
С помощью инструмент «Анализ данных» и средства «Регрессия», мы получаем следующие данные:
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R | 0,99857058 |
|
|
|
|
|
|
|
R-квадрат | 0,99714321 |
|
|
|
|
|
|
|
Нормированный R-квадрат | 0,99712173 |
|
|
|
|
|
|
|
Стандартная ошибка | 0,7751022 |
|
|
|
|
|
|
|
Наблюдения | 135 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
| df | SS | MS | F | Значимость F |
|
|
|
Регрессия | 1 | 27889,97729 | 27889,98 | 46422,68082 | 4,5265E-171 |
|
|
|
Остаток | 133 | 79,90419583 | 0,600783 |
|
|
|
|
|
Итого | 134 | 27969,88148 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% |
Y-пересечение | 3,95570884 | 0,309303923 | 12,78907 | 6,40413E-25 | 3,343917669 | 4,5675 | 3,343918 | 4,5675 |
Переменная X 1 | 0,50051158 | 0,002322999 | 215,4592 | 4,5265E-171 | 0,495916781 | 0,505106 | 0,495917 | 0,505106 |
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ - вероятность, с которой можно утверждать, что ошибка выборки не превысит некоторую заданную величину, называют доверительной вероятностью. Обычно в социальных и маркетинговых исследованиях значения доверительной вероятности принимают равным 95%. Пределы, в которых с доверительной вероятностью может находиться значение характеристики генеральной совокупности, называют доверительным интервалом
СТАНДАРТНАЯ ОШИБКА - величина, характеризующая случайную ошибку выборки - стандартное отклонение выборочного распределения статистики.
Рассчитать доверительные интервалы для прогнозного среднего значения Y
X среднее= 130,0
Значение t= 1,98 степени свободы = n-2= 135-2= 133
Стандартная ошибка рассчитывается для конкретного значения Xо
Тогда, для Xо=100
Стандартная ошибка прогнозирования =0,10
А, для Xо =200
Стандартная ошибка прогнозирования = 0,18
Доверительные интервалы для прогнозных средних значений будут с 95% уровнем доверит. вероятности
Тогда, для x0= |
|
| 100 |
| |
Интервал |
| ( | 53,71 | 54,09 | ) |
|
|
|
|
|
|
Тогда, для x0= |
|
| 200 |
| |
Интервал |
| ( | 103,55 | 104,25 | ) |
Подставив в уравнение регрессии значение фактора X, мы получили точечный прогноз, но вероятность такого прогноза крайне мала. Поэтому мы находим стандартную ошибку прогнозирования и доверительный интервал прогноза, в который с 95% вероятностью попадают прогнозные оценки. Стандартная ошибка является мерой точности прогноза. Расчет доверительного интервала говорит о том, что фактические оценки будут попадать в рассчитанный интервал в 95 % случаев.
Вывод: В этом пункте находим доверительные интервалы для прогнозов. Были найдены стандартные ошибки для конкретных значений X и получены доверительные интервалы (53.71; 54,09) и (103,55; 104,25), говорящие, что фактические оценки будут попадать в этот интервал.
8. Корреляционная решетка для пары признаков Баллы по тренингу "Продажа" и "EQ"
По формуле Стерджесса находим количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика).
Столбец1 |
|
|
| |
|
|
| h= | 12,5 |
Среднее | 130,014815 |
|
|
|
Стандартная ошибка | 2,48079378 |
|
|
|
Медиана | 132 |
|
|
|
Мода | 140 |
|
|
|
Стандартное отклонение | 28,824219 |
|
|
|
Дисперсия выборки | 830,8356 |
|
|
|
Эксцесс | -1,1818875 |
|
|
|
Асимметричность | -0,0362871 |
|
|
|
Интервал | 100 |
|
|
|
Минимум | 78 |
|
|
|
Максимум | 178 |
|
|
|
Сумма | 17552 |
|
|
|
Счет | 135 |
|
|
|
Создадим корреляционную решетку через Сводные таблицы:
Корреляция | EQ |
|
|
|
|
|
|
|
|
БТП | 78-90,5 | 90,5-103 | 103-115,5 | 115,5-128 | 128-140,5 | 140,5-153 | 153-165,5 | 165,5-178 | Общий итог |
43-49,25 | 14 | 3 |
|
|
|
|
|
| 17 |
49,25-55,5 |
| 10 | 1 |
|
|
|
|
| 11 |
55,5-61,75 |
|
| 20 |
|
|
|
|
| 20 |
61,75-68 |
|
| 1 | 13 | 1 |
|
|
| 15 |
68-74,25 |
|
|
| 1 | 19 | 2 |
|
| 22 |
74,25-80,5 |
|
|
|
| 2 | 8 | 3 |
| 13 |
80,5-86,75 |
|
|
|
|
| 1 | 15 |
| 16 |
86,75-93 |
|
|
|
|
|
| 1 | 20 | 21 |
Общий итог | 14 | 13 | 22 | 14 | 22 | 11 | 19 | 20 | 135 |
Информация о работе Статистический анализ данных выборочного наблюдения