Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 16:54, курсовая работа
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
1. Овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
2. Приобретение навыков работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
3. Развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.
Введение……………………………………………………………………………………………….3
1. Сводка и группировка данных статистического наблюдения……………………………………...4
2. Вариационный анализ……………………………………………………………………………….. 8
3. Проверка гипотезы о нормальном характере распределения……………………………………...10
4. Корреляционно-регрессионный анализ……………………………………………………………. 11
5. Множественный корреляционно-регрессионный анализ………………………………………….15
6. Анализ качественных признаков……………………………………………………………...……..16
7. Интервальные оценки………………………………………………………………………………...18
Заключение………………………………………………………..………………………… ………....19
Литература………………………………………………………………………………………………20
Корреляционная решетка – это аналитическая группировка единиц совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной решетки можно сделать предположение о наличии и направлении связи, а также предварительную оценку тесноты связи.
Рассчитать эмпирическое корреляционное отношение, коэффициент детерминации
| 78-90,5 | 90,5-103 | 103-115,5 | 115,5-128 | 128-140,5 | 140,5-153 | 153-165,5 | 165,5-178 | Общий итог | Средние | Групповые средние (EQ) |
|
43-49,25 | 14 | 3 |
|
|
|
|
|
| 17 | 46,1 | 86,5 | 238,9 |
49,25-55,5 |
| 10 | 1 |
|
|
|
|
| 11 | 52,4 | 97,9 | 84,1 |
55,5-61,75 |
|
| 20 |
|
|
|
|
| 20 | 58,6 | 109,3 | 63,9 |
61,75-68 |
|
| 1 | 13 | 1 |
|
|
| 15 | 64,9 | 121,8 | 7,6 |
68-74,25 |
|
|
| 1 | 19 | 2 |
|
| 22 | 71,1 | 134,8 | 3,8 |
74,25-80,5 |
|
|
|
| 2 | 8 | 3 |
| 13 | 77,4 | 147,7 | 30,2 |
80,5-86,75 |
|
|
|
|
| 1 | 15 |
| 16 | 83,6 | 158,5 | 96,0 |
86,75-93 |
|
|
|
|
|
| 1 | 20 | 21 | 89,9 | 171,2 | 263,3 |
Общий итог | 14 | 13 | 22 | 14 | 22 | 11 | 19 | 20 | 135 |
|
| 787,7 |
Средние | 84,3 | 96,8 | 109,3 | 121,8 | 134,3 | 146,8 | 159,3 | 171,8 |
|
|
|
|
Групповые средние (БТП) | 46,1 | 50,9 | 58,6 | 65,3 | 71,4 | 76,8 | 83,0 | 89,9 |
|
|
|
|
| 54,4 | 31,5 | 17,6 | 1,4 | 0,9 | 4,9 | 27,3 | 64,4 | 202,6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсия для БТП | 208,73 |
|
|
|
|
|
|
|
|
|
| |
Факторная дисперсия для БТП | 202,58 |
|
|
|
|
|
|
|
|
|
| |
ЭКО | 0,97 |
|
|
|
|
|
|
|
|
|
|
В корреляционной таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.
Эмпирическое корреляционное отношение (ЭКО) показывает тесноту связи между исследуемым явлением (БТП) и группировочным признаком (EQ). ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем сильнее корреляционная связь между признаками. В нашем случае значение ЭКО=0,97, значит связь между БТП и EQ достаточно сильная.
Видно, что ЭКО меньше чем коэффициент корреляции. Поэтому связь между признаками БТП и EQ считаем линейной.
Вывод: В этом пункте рассчитано эмперическое корреляционное отношение (ЭКО). Была построена корреляционная таблица, рассчитана факторная дисперсия и дисперсия для БТП, получено ЭКО, равное 0,97. Т.к 0,97<коэффициента корреляции (1,00) можно сделать вывод, что связь между БТП и EQ линейная.
5. Множественный корреляционно- регрессионный анализ.
Применяем Регрессия из Анализа данных.
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R | 0,999428 |
|
|
|
|
|
|
|
R-квадрат | 0,998856 |
|
|
|
|
|
|
|
Нормированный R-квадрат | 0,996378 |
|
|
|
|
|
|
|
Стандартная ошибка | 0,818799 |
|
|
|
|
|
|
|
Наблюдения | 20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
| df | SS | MS | F | Значимость F |
|
|
|
Регрессия | 13 | 3512,527 | 270,1944 | 403,0159839 | 1,02886E-07 |
|
|
|
Остаток | 6 | 4,022586 | 0,670431 |
|
|
|
|
|
Итого | 19 | 3516,55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% |
Y-пересечение | 5,75988 | 9,134132 | 0,630589 | 0,551555849 | -16,59053549 | 28,1103 | -16,5905 | 28,1103 |
Переменная X 1 | 0,026835 | 0,04831 | 0,555476 | 0,598653319 | -0,091375611 | 0,145046 | -0,09138 | 0,145046 |
Переменная X 2 | 0,186185 | 0,262995 | 0,707942 | 0,505538291 | -0,457339532 | 0,829709 | -0,45734 | 0,829709 |
Переменная X 3 | -0,16346 | 0,284071 | -0,57541 | 0,585927974 | -0,858553839 | 0,531638 | -0,85855 | 0,531638 |
Переменная X 4 | 0,045525 | 0,100539 | 0,45281 | 0,666598293 | -0,200485636 | 0,291536 | -0,20049 | 0,291536 |
Переменная X 5 | -1,78099 | 2,527092 | -0,70476 | 0,507381579 | -7,964557588 | 4,402584 | -7,96456 | 4,402584 |
Переменная X 6 | -0,36306 | 0,542428 | -0,66933 | 0,528188282 | -1,690334359 | 0,964213 | -1,69033 | 0,964213 |
Переменная X 7 | 0,000849 | 0,018587 | 0,045677 | 0,965049796 | -0,044632382 | 0,04633 | -0,04463 | 0,04633 |
Переменная X 8 | 0,482225 | 0,031312 | 15,40049 | 4,73812E-06 | 0,405606692 | 0,558844 | 0,405607 | 0,558844 |
Переменная X 9 | -0,00077 | 0,000906 | -0,85289 | 0,426450187 | -0,002988628 | 0,001444 | -0,00299 | 0,001444 |
Переменная X 10 | 0,001463 | 0,00296 | 0,494354 | 0,638632437 | -0,005778965 | 0,008705 | -0,00578 | 0,008705 |
Переменная X 11 | -0,01921 | 1,179062 | -0,01629 | 0,987529735 | -2,904270405 | 2,865852 | -2,90427 | 2,865852 |
Переменная X 12 | -0,68404 | 2,154273 | -0,31753 | 0,761602457 | -5,955359037 | 4,587274 | -5,95536 | 4,587274 |
Переменная X 13 | -0,29099 | 0,762668 | -0,38154 | 0,715949613 | -2,157168127 | 1,575194 | -2,15717 | 1,575194 |
Множественно корреляционно- регрессионный анализ состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.
Анализируя полученные данные, видим, что p-значение для X8 слишком велико и необходимо исключить ее из рассмотрения.
Кажется, что нет смысла в этом примере использовать множественную регрессию для прогнозирования БТП.
Вывод: В данном пункте проведен множественный корреляционно- регрессионный анализ. Для этого применена Регрессия с помощью описательной статистики. Из полученных данных мы видим, что р-значение (4,73812Е-06) для переменной Х8 слишком велико и ее необходимо исключить из рассмотрения. В моем примере нет смысла использовать множественную регрессию.
6. Анализ качественных признаков.
10. Расчет коэффициентов ассоциации и контингенции для признаков.
| Высшее |
|
|
| Здесь |
|
Пол | 0 | 1 | Общий итог |
| a= | 39 |
0 | 39 | 28 | 67 |
| b= | 28 |
1 | 30 | 38 | 68 |
| c= | 30 |
Общий итог | 69 | 66 | 135 |
| d= | 38 |
|
|
|
|
|
|
|
| Коэффициенты: |
|
|
|
| |
| Коэффициент контингенции |
|
| -1,0 |
|
|
| Коэффициент ассоциации |
|
| 0,1 |
|
|
| Наличие судимости |
|
|
| Здесь |
|
Пол | 0 | 1 | Общий итог |
| a= | 58 |
0 | 58 | 9 | 67 |
| b= | 9 |
1 | 44 | 24 | 68 |
| c= | 44 |
Общий итог | 102 | 33 | 135 |
| d= | 25 |
|
|
|
|
|
|
|
| Коэффициенты: |
|
|
|
|
|
| Коэффициент контингенции |
| 1,0 |
|
|
|
| Коэффициент ассоциации |
| 0,3 |
|
|
|
Коэффициенты ассоциации и контингенции применяются для определения тесноты связи двух качественных признаков., каждый который состоит только их двух групп. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0,5, а Кк > 0,3. В первом случае связь считается не подтвержденной, а во втором подтвержденной.
Коэффициент контингенции, равный -1 говорит об абсолютной отрицательной связи качественных признаков. Коэффициент контингенции, равный +1 говорит об абсолютной положительной связи качественных признаков, а нулевое значение говорит о независимости признаков.
Но недостатком коэффициента контингенции является то, что он не различает полной и абсолютной связанности признаков, давая для этих случаев +1 или -1, т.е. этот коэффициент существенно завышает оценку связи признаков. А у коэффициента ассоциации этого недостатка нет. Коэффициент ассоциации при независимости признаков также равен нулю, а значения +1, -1 принимает только при абсолютной связанности признаков.
Вывод: В этом пункте проведен анализ качественных признаков. В результате были получены коэффициент контингенции, равный -1,0 в первом случае, и 1,0 во втором, и коэффициент ассоциации, равный 0,1 в первом случае, и 0,3 во втором. В первом случае связь качественных признаков считается не подтвержденной (Кк< 0,3), а во втором- подтвержденной (Кк> 0,3).
11 Расчет коэффициента Спирмена.
| 12 Расчет коэффициента Кендалла
|
Информация о работе Статистический анализ данных выборочного наблюдения