Автор работы: Пользователь скрыл имя, 16 Марта 2012 в 17:10, курсовая работа
Простейшим из показателей данной группы является вариационный размах. Он равен 51 (в нашем случае). Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.
Введение…………………………………………………………………………………………………………6
Пункт A. Сводка и группировка данных, числовая статистика………………………………………….. 7
Пункт B. Проверка гипотез…………………………………………………………………………………...13
Пункт C. Корреляционно-регрессионный анализ…………………………………………………………..15
Пункт D. Множественный корреляционно-регрессионный анализ……………………………………….20
Пункт E. Анализ качественных признаков…………………………………………………………………..23
Пункт G. Интервальные оценки………………………………………………………………………………24
Вывод…………………………………………………………………………………………………………….25
Список литературы……………………………………………………………………………………………..27
Казанский Государственный Технический Университет им. А.Н. Туполева
Курсовая работа по дисциплине «Статистика»
Сабитов Ш.Р.
Автор:
Студентка группы 8207:
Шакирова А.А.
Введение…………………………………………………………
Пункт A. Сводка и группировка данных, числовая статистика………………………………………….. 7
Пункт B. Проверка гипотез……………………………………………………………
Пункт C. Корреляционно-регрессионный анализ…………………………………………………………..
Пункт D. Множественный корреляционно-регрессионный анализ……………………………………….20
Пункт E. Анализ качественных признаков………………………………………………………
Пункт G. Интервальные оценки………………………………………………………………
Вывод…………………………………………………………………
Список литературы……………………………………………………
Табельный номер | Разряд продавца | Баллы по тренингу "Продажи" | Баллы по тренингу "Новая техника" | Баллы по тренингу "Сервисное обслуживание" | Кол-во жалоб от покупателей за год | Возраст | Опыт работы | Пол | IQ | EQ | Средняя зарплата/месяц | Средняя премия/месяц | Высшее | Высшее техническое | Наличие судимости | Годовой объем продаж |
1 | 3 | 85 | 24 | 83 | 3 | 38 | 7 | ж | 114 | 163 | 7064 | 1345 | 0 | 0 | 0 | 4679,798 |
2 | 2 | 76 | 38 | 63 | 4 | 23 | 5 | м | 132 | 145 | 6523 | 1478 | 0 | 0 | 1 | 3890,568 |
3 | 2 | 84 | 2 | 121 | 2 | 49 | 11 | ж | 136 | 158 | 8305 | 1972 | 1 | 0 | 0 | 6291,815 |
4 | 3 | 93 | 13 | 110 | 1 | 47 | 10 | м | 128 | 178 | 7964 | 1330 | 0 | 0 | 0 | 5525,68 |
5 | 3 | 85 | 26 | 83 | 2 | 35 | 7 | ж | 125 | 164 | 7675 | 1498 | 0 | 0 | 0 | 5149,423 |
6 | 2 | 84 | 13 | 104 | 3 | 41 | 9 | м | 154 | 158 | 7882 | 1739 | 0 | 0 | 1 | 5218,117 |
7 | 2 | 63 | 4 | 132 | 8 | 59 | 12 | ж | 94 | 117 | 8935 | 1118 | 0 | 0 | 0 | 5637,52 |
8 | 2 | 58 | 29 | 92 | 7 | 34 | 8 | ж | 133 | 107 | 7680 | 2193 | 1 | 1 | 1 | 4401,294 |
9 | 3 | 87 | 39 | 64 | 2 | 20 | 5 | ж | 120 | 164 | 6919 | 1456 | 0 | 0 | 0 | 4222,165 |
10 | 2 | 80 | 19 | 111 | 4 | 48 | 10 | ж | 144 | 152 | 8336 | 1857 | 1 | 0 | 0 | 5919,302 |
11 | 1 | 52 | 28 | 83 | 7 | 31 | 7 | м | 115 | 95 | 7437 | 985 | 0 | 0 | 1 | 3671,662 |
12 | 2 | 51 | 19 | 132 | 10 | 55 | 12 | ж | 166 | 93 | 7929 | 2342 | 1 | 1 | 0 | 5217,038 |
13 | 2 | 88 | 24 | 110 | 2 | 43 | 10 | м | 78 | 167 | 7234 | 1172 | 0 | 0 | 0 | 5383,201 |
14 | 2 | 64 | 23 | 111 | 8 | 49 | 10 | м | 81 | 121 | 8372 | 1406 | 1 | 0 | 0 | 5437,585 |
15 | 2 | 58 | 24 | 103 | 7 | 41 | 9 | ж | 101 | 111 | 7152 | 2138 | 1 | 1 | 0 | 4714,941 |
16 | 1 | 43 | 23 | 92 | 9 | 37 | 8 | м | 161 | 78 | 7390 | 2147 | 1 | 1 | 1 | 4249,6 |
17 | 3 | 92 | 39 | 50 | 1 | 20 | 4 | м | 92 | 176 | 6386 | 2127 | 1 | 0 | 0 | 4068,028 |
18 | 2 | 63 | 15 | 103 | 6 | 43 | 9 | ж | 168 | 121 | 7527 | 1513 | 0 | 0 | 0 | 4791,916 |
19 | 2 | 50 | 30 | 72 | 8 | 24 | 6 | м | 113 | 94 | 6337 | 1137 | 0 | 0 | 0 | 3844,307 |
20 | 2 | 52 | 25 | 84 | 10 | 33 | 7 | м | 169 | 99 | 6805 | 1442 | 0 | 0 | 1 | 4084,104 |
21 | 2 | 61 | 8 | 151 | 7 | 63 | 14 | ж | 125 | 113 | 8327 | 2094 | 1 | 1 | 0 | 6363,924 |
22 | 1 | 50 | 23 | 103 | 12 | 43 | 9 | ж | 121 | 95 | 7987 | 1531 | 1 | 0 | 0 | 5052,084 |
23 | 2 | 44 | 35 | 83 | 12 | 27 | 7 | ж | 143 | 82 | 7226 | 1070 | 0 | 0 | 0 | 4232,719 |
24 | 2 | 65 | 21 | 73 | 6 | 30 | 6 | м | 112 | 119 | 7352 | 1423 | 0 | 0 | 0 | 4106,045 |
25 | 2 | 51 | 33 | 70 | 12 | 22 | 6 | ж | 141 | 94 | 6478 | 2171 | 1 | 1 | 0 | 3925,936 |
26 | 2 | 57 | 20 | 91 | 6 | 39 | 8 | ж | 153 | 108 | 7543 | 1914 | 1 | 0 | 0 | 4603,959 |
27 | 2 | 85 | 17 | 144 | 2 | 59 | 13 | м | 106 | 163 | 8579 | 1468 | 0 | 0 | 0 | 7328,35 |
28 | 2 | 86 | 6 | 122 | 2 | 49 | 11 | ж | 85 | 163 | 7989 | 2396 | 1 | 1 | 0 | 6309,245 |
29 | 2 | 80 | 30 | 61 | 3 | 21 | 5 | м | 155 | 149 | 6677 | 1497 | 0 | 0 | 1 | 3807,861 |
30 | 2 | 54 | 19 | 143 | 7 | 58 | 13 | м | 118 | 103 | 7939 | 1460 | 1 | 0 | 1 | 6635,424 |
31 | 2 | 72 | 19 | 83 | 4 | 33 | 7 | м | 163 | 137 | 7159 | 1243 | 0 | 0 | 0 | 4570,483 |
32 | 3 | 90 | 15 | 103 | 2 | 45 | 9 | м | 148 | 169 | 7356 | 1975 | 1 | 0 | 1 | 5210,108 |
33 | 2 | 54 | 29 | 70 | 10 | 24 | 6 | м | 142 | 102 | 6417 | 1615 | 1 | 0 | 1 | 4002,383 |
34 | 3 | 85 | 12 | 100 | 2 | 42 | 9 | ж | 123 | 162 | 7400 | 1475 | 0 | 0 | 0 | 4995,243 |
35 | 3 | 79 | 25 | 100 | 3 | 45 | 9 | ж | 158 | 151 | 7890 | 1840 | 1 | 0 | 0 | 5492,177 |
36 | 2 | 70 | 34 | 60 | 4 | 23 | 5 | м | 137 | 130 | 6498 | 1673 | 1 | 0 | 1 | 3745,219 |
37 | 2 | 80 | 33 | 63 | 3 | 20 | 5 | ж | 120 | 151 | 6904 | 1932 | 1 | 0 | 0 | 3681,896 |
38 | 1 | 48 | 31 | 83 | 10 | 28 | 7 | ж | 85 | 88 | 6474 | 1849 | 1 | 1 | 0 | 4007,394 |
39 | 2 | 59 | 28 | 62 | 8 | 23 | 5 | ж | 169 | 112 | 6586 | 2453 | 1 | 1 | 0 | 3336,289 |
40 | 3 | 82 | 30 | 62 | 3 | 27 | 5 | ж | 173 | 159 | 6772 | 1440 | 0 | 0 | 1 | 3807,492 |
41 | 2 | 62 | 13 | 100 | 8 | 39 | 9 | ж | 105 | 118 | 7138 | 1182 | 0 | 0 | 0 | 4809,031 |
42 | 2 | 68 | 25 | 72 | 7 | 32 | 6 | ж | 84 | 126 | 7306 | 940 | 0 | 0 | 0 | 3928,966 |
43 | 3 | 80 | 6 | 134 | 3 | 57 | 12 | м | 177 | 152 | 8296 | 2408 | 1 | 1 | 0 | 6205,729 |
44 | 2 | 79 | 13 | 104 | 4 | 38 | 9 | м | 155 | 148 | 7811 | 1389 | 0 | 0 | 0 | 5874,459 |
45 | 2 | 86 | 7 | 103 | 3 | 47 | 9 | м | 83 | 164 | 7606 | 2270 | 1 | 1 | 1 | 5660,22 |
46 | 2 | 57 | 6 | 130 | 8 | 58 | 12 | ж | 173 | 105 | 7962 | 1375 | 0 | 0 | 0 | 6132,896 |
47 | 2 | 58 | 28 | 60 | 10 | 24 | 5 | ж | 172 | 106 | 7049 | 2187 | 1 | 1 | 0 | 3434,625 |
48 | 1 | 51 | 9 | 102 | 10 | 46 | 9 | м | 94 | 92 | 7335 | 849 | 0 | 0 | 0 | 5027,656 |
49 | 2 | 75 | 11 | 100 | 4 | 40 | 9 | м | 98 | 142 | 7547 | 1091 | 0 | 0 | 0 | 5222,54 |
50 | 2 | 77 | 18 | 102 | 4 | 43 | 9 | м | 111 | 146 | 8090 | 2328 | 1 | 1 | 0 | 5112,696 |
51 | 2 | 70 | 34 | 60 | 5 | 20 | 5 | ж | 143 | 134 | 6001 | 1960 | 1 | 0 | 0 | 3650,221 |
52 | 2 | 69 | 31 | 72 | 5 | 26 | 6 | м | 158 | 133 | 7174 | 1885 | 1 | 0 | 1 | 3991,879 |
53 | 3 | 91 | -1 | 124 | 1 | 51 | 11 | м | 145 | 175 | 7648 | 2621 | 1 | 1 | 0 | 6955,984 |
54 | 2 | 62 | 19 | 91 | 7 | 34 | 8 | ж | 117 | 118 | 7580 | 2221 | 1 | 1 | 0 | 4344,439 |
55 | 2 | 73 | 20 | 82 | 6 | 33 | 7 | ж | 123 | 135 | 7575 | 1095 | 0 | 0 | 0 | 4449,698 |
56 | 2 | 58 | 23 | 72 | 7 | 29 | 6 | ж | 105 | 106 | 7363 | 2048 | 1 | 1 | 0 | 3615,538 |
57 | 1 | 52 | 13 | 142 | 7 | 59 | 13 | ж | 81 | 99 | 8698 | 2179 | 1 | 1 | 0 | 6267,763 |
58 | 1 | 42 | 21 | 91 | 11 | 40 | 8 | м | 121 | 78 | 7541 | 1655 | 1 | 0 | 1 | 3931,086 |
59 | 2 | 89 | -2 | 142 | 2 | 59 | 13 | м | 102 | 168 | 8511 | 2111 | 1 | 0 | 0 | 7597,159 |
60 | 1 | 45 | 12 | 123 | 13 | 50 | 11 | м | 143 | 82 | 7961 | 1321 | 0 | 0 | 0 | 5511,538 |
61 | 2 | 45 | 5 | 130 | 12 | 57 | 12 | ж | 173 | 84 | 7930 | 1722 | 1 | 0 | 0 | 5839,523 |
62 | 2 | 45 | 15 | 102 | 9 | 37 | 9 | м | 167 | 83 | 6940 | 1272 | 0 | 0 | 0 | 4467,018 |
63 | 2 | 82 | 19 | 84 | 4 | 33 | 7 | м | 136 | 158 | 7112 | 1258 | 0 | 0 | 1 | 4448,791 |
64 | 2 | 68 | 26 | 73 | 7 | 25 | 6 | ж | 177 | 128 | 7122 | 2392 | 1 | 1 | 0 | 3795,137 |
65 | 3 | 83 | 4 | 133 | 4 | 60 | 12 | ж | 178 | 157 | 8695 | 1672 | 0 | 0 | 0 | 7111,62 |
66 | 2 | 53 | 27 | 62 | 10 | 26 | 5 | ж | 145 | 96 | 7117 | 1404 | 0 | 0 | 0 | 3175,176 |
67 | 2 | 54 | 20 | 124 | 9 | 50 | 11 | м | 102 | 102 | 8017 | 1315 | 0 | 0 | 1 | 5539,513 |
68 | 2 | 58 | 20 | 120 | 7 | 52 | 11 | ж | 140 | 109 | 8113 | 1273 | 0 | 0 | 0 | 5238,062 |
69 | 1 | 46 | 10 | 140 | 12 | 62 | 13 | м | 128 | 82 | 8637 | 1383 | 1 | 0 | 1 | 6106,926 |
70 | 3 | 79 | 20 | 144 | 3 | 60 | 13 | м | 146 | 151 | 8106 | 1626 | 0 | 0 | 1 | 6611,669 |
71 | 2 | 71 | 23 | 101 | 4 | 41 | 9 | м | 176 | 136 | 7197 | 1917 | 1 | 0 | 0 | 4792,612 |
72 | 3 | 90 | 2 | 120 | 2 | 54 | 11 | ж | 99 | 169 | 7844 | 1475 | 0 | 0 | 0 | 6340,387 |
73 | 2 | 64 | 14 | 90 | 8 | 38 | 8 | ж | 128 | 121 | 7589 | 1356 | 0 | 0 | 0 | 4781,29 |
74 | 2 | 51 | 38 | 64 | 9 | 23 | 5 | ж | 162 | 91 | 6735 | 1106 | 0 | 0 | 0 | 3186,8 |
75 | 1 | 43 | 24 | 104 | 13 | 37 | 9 | м | 149 | 79 | 7629 | 2209 | 1 | 1 | 1 | 4753,799 |
76 | 3 | 88 | 18 | 132 | 2 | 53 | 12 | м | 171 | 171 | 8378 | 1645 | 0 | 0 | 0 | 6823,139 |
77 | 2 | 73 | 12 | 141 | 5 | 60 | 13 | м | 121 | 139 | 8164 | 1468 | 0 | 0 | 1 | 7214,573 |
78 | 1 | 43 | 10 | 110 | 9 | 48 | 10 | м | 154 | 80 | 7729 | 2062 | 1 | 1 | 0 | 4830,874 |
79 | 2 | 51 | 35 | 70 | 11 | 25 | 6 | м | 178 | 95 | 7125 | 1288 | 0 | 0 | 1 | 4042,2 |
80 | 2 | 68 | 26 | 64 | 7 | 24 | 5 | м | 155 | 129 | 6229 | 1777 | 1 | 0 | 1 | 3777,727 |
81 | 2 | 77 | 24 | 114 | 4 | 46 | 10 | м | 151 | 145 | 8206 | 1659 | 0 | 0 | 0 | 6243,209 |
82 | 2 | 58 | 39 | 62 | 9 | 23 | 5 | ж | 105 | 110 | 6946 | 1001 | 0 | 0 | 0 | 3632,52 |
83 | 2 | 63 | 30 | 72 | 6 | 27 | 6 | ж | 177 | 118 | 6887 | 1398 | 0 | 0 | 0 | 4141,537 |
84 | 1 | 47 | 17 | 123 | 8 | 50 | 11 | м | 139 | 84 | 8114 | 1434 | 1 | 0 | 1 | 5656,744 |
85 | 2 | 56 | 15 | 90 | 7 | 43 | 8 | ж | 124 | 103 | 7532 | 1673 | 1 | 0 | 0 | 4864,642 |
86 | 2 | 62 | 15 | 114 | 6 | 44 | 10 | м | 93 | 115 | 7769 | 1639 | 1 | 0 | 0 | 5457,271 |
87 | 2 | 55 | 34 | 94 | 7 | 35 | 8 | м | 153 | 102 | 7592 | 2449 | 1 | 1 | 1 | 4028,452 |
88 | 2 | 56 | 21 | 101 | 7 | 42 | 9 | м | 131 | 106 | 7459 | 1922 | 1 | 0 | 0 | 4941,518 |
89 | 2 | 81 | 22 | 83 | 4 | 28 | 7 | м | 134 | 151 | 7211 | 1552 | 0 | 0 | 0 | 4804,244 |
90 | 2 | 57 | 3 | 112 | 6 | 52 | 10 | ж | 117 | 106 | 8210 | 1379 | 0 | 0 | 0 | 5631,851 |
91 | 2 | 61 | 0 | 144 | 6 | 58 | 13 | ж | 136 | 113 | 8198 | 1242 | 0 | 0 | 0 | 6458,315 |
92 | 2 | 82 | 30 | 64 | 4 | 20 | 5 | м | 82 | 159 | 6959 | 2020 | 1 | 0 | 0 | 3808,988 |
93 | 1 | 50 | 8 | 101 | 9 | 44 | 9 | ж | 111 | 90 | 7514 | 877 | 0 | 0 | 0 | 5056,14 |
94 | 2 | 52 | 24 | 123 | 9 | 49 | 11 | м | 128 | 94 | 7605 | 1008 | 0 | 0 | 1 | 5445,016 |
95 | 2 | 76 | -2 | 132 | 3 | 63 | 12 | ж | 83 | 144 | 8359 | 1735 | 1 | 0 | 0 | 6254,095 |
96 | 2 | 75 | 37 | 61 | 4 | 22 | 5 | м | 164 | 145 | 6178 | 2123 | 1 | 0 | 0 | 4183,765 |
97 | 2 | 66 | 29 | 90 | 6 | 38 | 8 | м | 143 | 126 | 7556 | 1878 | 1 | 0 | 0 | 4487,802 |
98 | 2 | 84 | -3 | 134 | 2 | 55 | 12 | м | 105 | 157 | 8197 | 1410 | 0 | 0 | 1 | 6314,414 |
99 | 2 | 76 | 5 | 110 | 4 | 48 | 10 | ж | 108 | 142 | 7631 | 2343 | 1 | 1 | 0 | 5375,794 |
100 | 2 | 80 | 23 | 102 | 3 | 48 | 9 | ж | 81 | 153 | 7826 | 1961 | 1 | 0 | 0 | 5437,184 |
101 | 2 | 56 | 18 | 114 | 10 | 47 | 10 | м | 124 | 102 | 8098 | 2172 | 1 | 1 | 1 | 5675,961 |
102 | 2 | 80 | 1 | 123 | 4 | 54 | 11 | м | 104 | 152 | 7965 | 2397 | 1 | 1 | 0 | 5671,704 |
103 | 2 | 76 | 30 | 72 | 5 | 26 | 6 | м | 83 | 144 | 6839 | 1670 | 1 | 0 | 1 | 4122,741 |
104 | 3 | 88 | 15 | 141 | 2 | 64 | 13 | ж | 124 | 166 | 8355 | 2597 | 1 | 1 | 0 | 6752,536 |
105 | 2 | 79 | 15 | 120 | 4 | 54 | 11 | м | 137 | 150 | 8458 | 1537 | 0 | 0 | 0 | 6364,151 |
106 | 2 | 73 | 40 | 63 | 4 | 21 | 5 | м | 136 | 141 | 6819 | 2532 | 1 | 1 | 0 | 4032,528 |
107 | 1 | 53 | -13 | 131 | 10 | 64 | 12 | ж | 95 | 100 | 8394 | 1459 | 1 | 0 | 0 | 6280,845 |
108 | 2 | 72 | -8 | 132 | 6 | 62 | 12 | м | 170 | 137 | 8610 | 2255 | 1 | 1 | 0 | 6562,455 |
109 | 2 | 82 | 5 | 144 | 3 | 57 | 13 | м | 137 | 153 | 7905 | 1674 | 0 | 0 | 1 | 7164,671 |
110 | 2 | 55 | -2 | 141 | 7 | 62 | 13 | м | 156 | 100 | 8282 | 1388 | 0 | 0 | 1 | 6524,063 |
111 | 2 | 71 | -2 | 131 | 6 | 64 | 12 | м | 161 | 135 | 9085 | 1472 | 0 | 0 | 0 | 6719,966 |
112 | 2 | 59 | 21 | 91 | 8 | 35 | 8 | м | 108 | 110 | 6899 | 1443 | 1 | 0 | 1 | 5021,007 |
113 | 2 | 67 | 27 | 72 | 7 | 23 | 6 | ж | 84 | 127 | 6658 | 2174 | 1 | 1 | 0 | 3882,984 |
114 | 1 | 50 | 17 | 104 | 7 | 36 | 9 | м | 139 | 89 | 7541 | 995 | 0 | 0 | 0 | 5114,935 |
115 | 2 | 54 | 19 | 124 | 10 | 53 | 11 | м | 167 | 102 | 8007 | 1495 | 0 | 0 | 0 | 5154,146 |
116 | 3 | 90 | 15 | 112 | 2 | 52 | 10 | м | 161 | 171 | 8071 | 2617 | 1 | 1 | 1 | 5845,272 |
117 | 2 | 56 | 36 | 54 | 10 | 19 | 4 | м | 161 | 106 | 6162 | 1313 | 0 | 0 | 0 | 3128,85 |
118 | 2 | 76 | 8 | 144 | 5 | 56 | 13 | м | 176 | 142 | 8320 | 1897 | 1 | 0 | 1 | 6663,032 |
119 | 3 | 89 | 35 | 64 | 2 | 23 | 5 | ж | 121 | 170 | 6319 | 1268 | 0 | 0 | 0 | 4197,26 |
120 | 2 | 70 | 0 | 131 | 7 | 63 | 12 | ж | 91 | 132 | 8884 | 1184 | 0 | 0 | 0 | 6377,176 |
121 | 1 | 51 | 14 | 103 | 11 | 36 | 9 | ж | 119 | 95 | 7743 | 1624 | 1 | 0 | 0 | 4859,774 |
122 | 2 | 53 | 24 | 72 | 9 | 29 | 6 | ж | 166 | 97 | 6756 | 1961 | 1 | 0 | 0 | 3819,973 |
123 | 2 | 84 | -10 | 131 | 3 | 62 | 12 | м | 104 | 163 | 8965 | 2370 | 1 | 1 | 0 | 6965,026 |
124 | 2 | 86 | 32 | 61 | 2 | 21 | 5 | м | 82 | 167 | 6242 | 1216 | 0 | 0 | 1 | 4424,326 |
125 | 3 | 89 | 15 | 103 | 2 | 37 | 9 | ж | 169 | 170 | 7651 | 2290 | 1 | 0 | 0 | 5937,398 |
126 | 2 | 56 | 34 | 40 | 7 | 18 | 3 | ж | 135 | 104 | 6132 | 1272 | 0 | 0 | 0 | 2889,373 |
127 | 2 | 68 | 2 | 114 | 7 | 49 | 10 | м | 170 | 128 | 8046 | 1212 | 0 | 0 | 0 | 5521,913 |
128 | 1 | 51 | 33 | 80 | 11 | 32 | 7 | м | 135 | 92 | 7064 | 1209 | 0 | 0 | 0 | 4159,437 |
129 | 1 | 51 | 19 | 82 | 10 | 35 | 7 | ж | 94 | 95 | 7051 | 873 | 0 | 0 | 0 | 4262,641 |
130 | 2 | 58 | 29 | 81 | 8 | 37 | 7 | ж | 178 | 105 | 7725 | 1931 | 1 | 0 | 0 | 3869,462 |
131 | 2 | 70 | 6 | 100 | 5 | 49 | 9 | ж | 122 | 131 | 7934 | 2151 | 1 | 1 | 0 | 5421,559 |
132 | 1 | 50 | 24 | 84 | 11 | 29 | 7 | ж | 78 | 90 | 6975 | 1991 | 1 | 1 | 0 | 4416,159 |
133 | 2 | 49 | 18 | 144 | 8 | 60 | 13 | ж | 122 | 89 | 8571 | 1081 | 0 | 0 | 0 | 6109,164 |
134 | 2 | 71 | 19 | 90 | 4 | 38 | 8 | м | 87 | 133 | 6939 | 1772 | 1 | 0 | 0 | 4452,495 |
135 | 2 | 86 | 29 | 91 | 2 | 34 | 8 | ж | 148 | 161 | 7327 | 2464 | 1 | 1 | 0 | 5067,586 |
136 | 3 | 84 | 7 | 114 | 2 | 48 | 10 | ж | 177 | 159 | 7844 | 2649 | 1 | 1 | 1 | 6144,594 |
137 | 3 | 89 | 24 | 111 | 1 | 50 | 10 | м | 117 | 170 | 8036 | 1376 | 0 | 0 | 0 | 5808,391 |
138 | 2 | 68 | 21 | 91 | 6 | 39 | 8 | ж | 137 | 125 | 7837 | 2125 | 1 | 1 | 0 | 4275,955 |
139 | 2 | 62 | 30 | 84 | 9 | 30 | 7 | м | 93 | 117 | 6543 | 2095 | 1 | 1 | 1 | 4320,886 |
140 | 2 | 67 | 23 | 82 | 7 | 32 | 7 | ж | 82 | 127 | 7555 | 1676 | 1 | 0 | 0 | 4769,242 |
141 | 1 | 56 | 25 | 100 | 9 | 45 | 9 | ж | 97 | 102 | 8196 | 1161 | 0 | 0 | 0 | 4736,267 |
142 | 2 | 89 | 7 | 141 | 2 | 61 | 13 | м | 119 | 169 | 8277 | 2496 | 1 | 1 | 0 | 6983,711 |
143 | 3 | 87 | -6 | 142 | 2 | 60 | 13 | м | 133 | 167 | 8254 | 2416 | 1 | 1 | 0 | 7636,687 |
144 | 3 | 87 | 20 | 121 | 3 | 51 | 11 | ж | 167 | 165 | 7792 | 1506 | 0 | 0 | 0 | 5976,703 |
145 | 2 | 62 | 33 | 51 | 5 | 21 | 4 | м | 113 | 117 | 6393 | 1092 | 0 | 0 | 0 | 3169,274 |
146 | 3 | 90 | 16 | 92 | 2 | 38 | 8 | м | 112 | 172 | 7778 | 1611 | 0 | 0 | 1 | 5432,361 |
147 | 2 | 50 | 34 | 61 | 11 | 22 | 5 | ж | 153 | 94 | 6705 | 1354 | 0 | 0 | 0 | 3674,386 |
148 | 2 | 63 | 11 | 124 | 6 | 49 | 11 | м | 149 | 117 | 7755 | 1292 | 0 | 0 | 1 | 5777,044 |
149 | 1 | 51 | 19 | 101 | 12 | 41 | 9 | ж | 127 | 95 | 7436 | 2276 | 1 | 1 | 0 | 4694,307 |
150 | 2 | 58 | 23 | 133 | 8 | 54 | 12 | м | 83 | 109 | 8089 | 2287 | 1 | 1 | 1 | 5838,73 |
151 | 1 | 50 | 32 | 82 | 9 | 32 | 7 | ж | 147 | 93 | 7123 | 1962 | 1 | 1 | 0 | 4061,944 |
152 | 2 | 72 | 33 | 72 | 5 | 28 | 6 | м | 109 | 136 | 6878 | 2230 | 1 | 1 | 0 | 4384,64 |
153 | 2 | 74 | 3 | 134 | 5 | 62 | 12 | м | 86 | 139 | 8652 | 1133 | 0 | 0 | 0 | 6085,767 |
154 | 1 | 49 | 34 | 73 | 8 | 27 | 6 | ж | 95 | 91 | 6573 | 840 | 0 | 0 | 0 | 3546,152 |
155 | 2 | 57 | 15 | 122 | 9 | 49 | 11 | ж | 118 | 109 | 7859 | 1247 | 0 | 0 | 0 | 5099,652 |
156 | 3 | 90 | 28 | 102 | 1 | 42 | 9 | м | 111 | 171 | 7442 | 2263 | 1 | 1 | 0 | 5203,433 |
157 | 3 | 78 | 3 | 113 | 3 | 48 | 10 | ж | 153 | 146 | 7979 | 1566 | 0 | 0 | 0 | 5073,068 |
158 | 2 | 55 | 12 | 101 | 9 | 45 | 9 | ж | 118 | 102 | 7693 | 1159 | 0 | 0 | 0 | 4626,472 |
159 | 2 | 74 | 19 | 103 | 4 | 42 | 9 | ж | 166 | 142 | 7208 | 2612 | 1 | 1 | 0 | 4973,723 |
160 | 2 | 48 | 2 | 120 | 9 | 52 | 11 | м | 145 | 91 | 8557 | 1886 | 1 | 0 | 0 | 5828,041 |
Введение.
Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.
Курсовой проект включает задания, позволяющие освоить применение методов статистики для решения конкретных задач управления. Охватывает разделы «Сводка и группировка данных», «Вариационный анализ», «Моделирование рядов распределения», «Выборочное распределение», «Корреляционно-регрессионный анализ», «Ряды динамики».
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;
развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.
А-1. Сводка и группировка данных.
1-2. По формуле Стерждесса ( n=1+3,322*LOG(160) ) определим ширины и границы интервалов для данных по баллам всех тренингов.
Число групп: n=8,3220866 округляя до целого: n=8
3. Используя модуль "Описательная статистика" инструмента "Анализ данных" получаем значения минимального и максимального элементов для изучаемых признаков.
Тренинги "Продажи" | Тренинги "Новая техника" | Тренинги "Сервисное обслуживание" | |||
Среднее | 67,2 | Среднее | 18,76875 | Среднее | 100,15 |
Стандартная ошибка | 1,146974418 | Стандартная ошибка | 0,919658719 | Стандартная ошибка | 2,101440806 |
Медиана | 67 | Медиана | 19,5 | Медиана | 101,5 |
Мода | 51 | Мода | 19 | Мода | 72 |
Стандартное отклонение | 14,50820631 | Стандартное отклонение | 11,63286489 | Стандартное отклонение | 26,58135725 |
Дисперсия выборки | 210,4880503 | Дисперсия выборки | 135,3235456 | Дисперсия выборки | 706,5685535 |
Эксцесс | -1,31327182 | Эксцесс | -0,46619186 | Эксцесс | -1,00254215 |
Асимметричность | 0,099185833 | Асимметричность | -0,36757008 | Асимметричность | -0,02088328 |
Интервал | 51 | Интервал | 53 | Интервал | 111 |
Минимум | 42 | Минимум | -13 | Минимум | 40 |
Максимум | 93 | Максимум | 40 | Максимум | 151 |
Сумма | 10752 | Сумма | 3003 | Сумма | 16024 |
Счет | 160 | Счет | 160 | Счет | 160 |
Ширину интервала находим, поделив разность максимального и минимального значений на число групп n
(Xmax-Xmin)/n:
Ширина интервала h1=6,4 Ширина интервала h2=6,6 Ширина интервала h3=14
4. Простые группировки между признаком «БТП» и остальными
После мы создаем простые группировки между признаками «БТП» и другими. Заданную задачу мы решаем с помощью сводных таблиц. Сводная таблица – это динамическая итоговая таблица, обобщающая результаты базы данных. Используются для суммирования, анализа, исследования и представления сводных данных. Диаграммы и графики представляют возможность наглядно проиллюстрировать результаты анализа. Также позволяют принимать решения и делать выводы на основе полученной информации, производить громоздкие вычисления.
Графики часто используются для иллюстрации непрерывных данных. Они полезны для выявления тенденций.
Диаграмма – это визуальное представление числовых значений. Представление числовых данных в форме наглядных диаграмм делает эти данные более понятными и доступными. Диаграмма позволяет визуально заметить тенденцию или повторяемость данных, которые в таблице остались бы незамеченными.
Гистограмма – один из наиболее популярных типов диаграмм. Гистограммы часто используются для сравнения дискретных данных. Они могут иллюстрировать как отличия данных одного ряда между собой, так и отличия между разными рядами.
| Значения |
|
Баллы по тренингу "Продажи" | Количество по полю Табельный номер | Среднее по полю Баллы по тренингу "Новая техника" |
42-50,5 | 21 | 20,24 |
50,5-59 | 41 | 21,61 |
59-67,5 | 19 | 19,16 |
67,5-76 | 23 | 18,74 |
76-84,5 | 29 | 14,76 |
84,5-93 | 27 | 17,37 |
Общий итог | 160 | 18,77 |
График зависимость БТП и баллы по тренингу «Новая техника».
Судя по графику и таблице можно сделать вывод, что наибольшее количество баллов БТП в диапазоне 50,5-59 набрало 41 чел. Наименьшее количество баллов по БТП в диапазоне 76-84,5 набрало 29 человек. Большее количество человек (41) набрали в диапазоне 50,5-59
Баллы по треннингу "Продажи" | Среднее по полю Баллы по тренингу "Сервисное обслуживание" |
42-50,5 | 101,19 |
50,5-59 | 96,95 |
59-67,5 | 96,68 |
67,5-76 | 92,61 |
76-84,5 | 106,41 |
84,5-93 | 106,33 |
Общий итог | 100,2 |
По результатам, полученным в таблице и на графике, можно сделать вывод о следующем: наибольшее усредненное количество баллов(106,41)набрали участники, находившиеся в диапазоне от 76 до 84,5 баллов по БТП; наихудший же усредненный результат(92,61) по тренингу сервисное обслуживание показали участники, набравшие от 67,5 до 76.
Баллы по треннингу "Продажи" | Среднее по полю Опыт работы |
42-50,5 | 8,90 |
50,5-59 | 8,51 |
59-67,5 | 8,47 |
67,5-76 | 8,09 |
76-84,5 | 9,38 |
84,5-93 | 9,44 |
Общий итог | 8,81 |
По полученным таблице и графику можно сделать вывод о следующем: усредненный опыт работы всех участников равен 8,81лет; наибольшее количество баллов по БТП набрали участники с усредненным опытом работы = 9,44 лет; наихудший результат показали участники с усредненным опытом работы = 8,09 лет.
Пол | Количество по полю Баллы по тренингу "Продажи" |
Ж | 76 |
М | 84 |
Общий итог | 160 |
Из полученных таблицы и графика можно вывести следующее: количество баллов по БТО у женщин равняется 76; количество БТП у мужчин равняется 84; общий средний БТП равен 160. Отсюда можно сделать вывод, что значение БТП не имеет прямой зависимости от пола участника.
Баллы по треннингу "Продажи" | Среднее по полю Средняя зарплата/месяц |
42-50,5 | 7497,81 |
50,5-59 | 7485,98 |
59-67,5 | 7453,63 |
67,5-76 | 7436,61 |
76-84,5 | 7795,28 |
84,5-93 | 7633,22 |
Общий итог | 7557,50 |
График БТП и з/п
По полученным из таблицы и графика данным можно предположить следующее: усредненная з/п = 7557,5; наибольшая усредненная з/п= 7795,28 приходится на участников, набравших от 76 до 84,5 БТП; наименьшая усредненная з/п= 7436,61 приходится на участников, набравших от 67,5 до 76 БТП.
| Значения |
|
Баллы по треннингу "Продажи" | Среднее по полю IQ | Среднее по полю EQ |
42-50,5 | 132,7 | 86,5 |
50,5-59 | 132,2 | 101,2 |
59-67,5 | 119,8 | 118,3 |
67,5-76 | 136,3 | 134,5 |
76-84,5 | 134,1 | 151,6 |
84,5-93 | 121,6 | 168,0 |
Общий итог | 130,0 | 126,5 |
График БТП IQ EQ
По полученным из таблицы и графика данным можно предположить следующее: среднее значение по EQ=126,5 среднее значение по IQ=130,0; наибольший усредненный уровень EQ имеют участники, набравшие от 84,5до 93 БТП; наименьший усредненный уровень EQ имеют участники, набравшие от 42 до 50,5 БТП; наибольший усредненный уровень IQ имеют участники, набравшие от 67,5 до 76 БТП; наименьший усредненный уровень IQ имеют участники, набравшие от 59 до 67,5 . Отсюда можно сделать вывод, что среднее значение по IQ не имеет прямой зависимости от EQ .
5. Сложные группировки между «БТП» и др.
|
| Значения |
|
Баллы по тренингу "Продажи" |
Пол | Среднее по полю Опыт работы | Количество по полю Табельный номер |
42-50,5 | Ж | 8,2 | 10 |
| М | 9,55 | 11 |
42-50,5 Итог |
| 8,90 | 21 |
50,5-59 | Ж | 8,2 | 25 |
| М | 9 | 16 |
50,5-59 Итог |
| 8,51 | 41 |
59-67,5 | Ж | 8,82 | 11 |
| М | 8 | 8 |
59-67,5 Итог |
| 8,47 | 19 |
67,5-76 | Ж | 7,75 | 8 |
| М | 8,27 | 15 |
67,5-76 Итог |
| 8,09 | 23 |
76-84,5 | Ж | 9,36 | 11 |
| М | 9,39 | 18 |
76-84,5 Итог |
| 9,38 | 29 |
84,5-93 | Ж | 8,73 | 11 |
| М | 9,94 | 16 |
84,5-93 Итог |
| 9,44 | 27 |
Общий итог |
| 8,81 | 160 |
График БТП, пол, сред. опыт работы.
По полученным из таблицы и графика данным можно предположить следующее: наибольшее количество участников(41) набрали от 50,5 до 59 БТП; наименьшее количество участников(19) набрали от 59 до 67,5 БТО; усредненный опыт работы у мужчин и женщин в каждом интервале БТП практически равен; наибольшую опыт работы имеют участники(женщины),набравшие от 84,5до 93 БТП; наименьший усредненный опыт работы имеют участники(мужчины),набравшие от 59 до 67,5 БТП.
|
| Значения |
|
Баллы по тренингу "Продажи" | Баллы по тренингу "Новая техника" | Среднее по полю IQ | Количество |
42-50,5 |
|
|
|
| -4,5-4 | 145 | 1 |
| 4-12,5 | 141,8 | 5 |
| 12,5-21 | 141,75 | 4 |
| 21-29,5 | 126 | 5 |
| 29,5-38 | 122,6666667 | 6 |
42-50,5 Итог |
| 132,7142857 | 21 |
50,5-59 |
|
|
|
| -13--4,5 | 95 | 1 |
| -4,5-4 | 136,5 | 2 |
| 4-12,5 | 128,3333333 | 3 |
| 12,5-21 | 125,6153846 | 13 |
| 21-29,5 | 133,2142857 | 14 |
| 29,5-38 | 150,5 | 6 |
| 38-46,5 | 133,5 | 2 |
50,5-59 Итог |
| 132,2195122 | 41 |
59-67,5 |
|
|
|
| -4,5-4 | 136 | 1 |
| 4-12,5 | 122,6666667 | 3 |
| 12,5-21 | 122,2 | 5 |
| 21-29,5 | 111,2857143 | 7 |
| 29,5-38 | 127,6666667 | 3 |
59-67,5 Итог |
| 119,8421053 | 19 |
67,5-76 |
|
|
|
| -13--4,5 | 170 | 1 |
| -4,5-4 | 127 | 4 |
| 4-12,5 | 113,6666667 | 3 |
| 12,5-21 | 134,75 | 4 |
| 21-29,5 | 145,8 | 5 |
| 29,5-38 | 142,2 | 5 |
| 38-46,5 | 136 | 1 |
67,5-76 Итог |
| 136,2608696 | 23 |
76-84,5 |
|
|
|
| -13--4,5 | 104 | 1 |
| -4,5-4 | 116,2 | 5 |
| 4-12,5 | 158,8333333 | 6 |
| 12,5-21 | 140,4285714 | 7 |
| 21-29,5 | 131 | 4 |
| 29,5-38 | 122,6 | 5 |
| 38-46,5 | 132 | 1 |
76-84,5 Итог |
| 134,137931 | 29 |
84,5-93 |
|
|
|
| -13--4,5 | 133 | 1 |
| -4,5-4 | 115,3333333 | 3 |
| 4-12,5 | 102,5 | 4 |
| 12,5-21 | 142,8888889 | 9 |
| 21-29,5 | 115,5 | 6 |
| 29,5-38 | 101,5 | 2 |
| 38-46,5 | 106 | 2 |
84,5-93 Итог |
| 121,5925926 | 27 |
Из данных таблицы и графика можно предположить следующее: наибольшее количество участников от 38 до 46,5 БТНТ входят в интервал БТП от 50,5 до 59; наименьшее количество участников от 29,5 до 38 БТНТ входят в интервал БТП от 59 до 67,5; наибольший усредненный IQ имеют участники БТП по БТНТ от 67,5 до 76; наибольшее количество участников имеют IQ=158,8 и входят в интервал БТНТ от 4 до 12,5;
А-2. Вариационный анализ признака "Баллы по тренингу Продажи"
Гистограмма, кумулята и огива распределения сотрудников по БТП.
Баллы по тренингу "Продажи" | число участников |
42-50,5 | 21 |
50,5-59 | 41 |
59-67,5 | 19 |
67,5-76 | 23 |
76-84,5 | 29 |
84,5-93 | 27 |
Общий итог | 160 |
Баллы по тренингу "Продажи" | Число участников | Данные для кумуляты | Данные для огивы | Отклонения от среднего |
42 | 1 | 1 | 160 | 25,20 |
43 | 3 | 4 | 159 | 24,20 |
44 | 1 | 5 | 156 | 23,20 |
45 | 3 | 8 | 155 | 22,20 |
46 | 1 | 9 | 152 | 21,20 |
47 | 1 | 10 | 151 | 20,20 |
48 | 2 | 12 | 150 | 19,20 |
49 | 2 | 14 | 148 | 18,20 |
50 | 7 | 21 | 146 | 17,20 |
51 | 9 | 30 | 139 | 16,20 |
52 | 4 | 34 | 130 | 15,20 |
53 | 3 | 37 | 126 | 14,20 |
54 | 4 | 41 | 123 | 13,20 |
55 | 3 | 44 | 119 | 12,20 |
Диаграмма распределения вариационного ряда БТП.
Для расчёта Отклонение от среднего мы используем функцию ABS. ABS возвращает модуль (абсолютную величину) числа.
2. Расчет показателей | |
Среднее значение | 67,2 |
Мода | 51 |
Медиана | 67 |
Размах вариации | 51 |
Среднее линейное отклонение | 13 |
Среднее квадратическое отклонение | 14,51 |
Дисперсия | 210,49 |
Относительный размах вариации | 0,76 |
Относительное линейное отклонение | 0,1 |
Коэффициент вариации | 0,22 |
Коэффициент асимметрии | 0,1 |
Коэффициент эксцесса | -1,31 |
Минимум | 42 |
Максимум | 93 |
Оценка.
Анализ вышеприведенного графика позволяет примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной совокупности. В данном случае медиана =67.
Среднее квадратическое отклонение показывает, что количество набранных баллов отклоняются от усредненного значения на 14,51.
Размах вариации в данном случае=51. Рассчитанная величина свидетельствует о значительном относительном уровне колеблемости баллов по тренингу. Кумулята и Огива необходимы для графического изображения вариационного ряда. При помощи Кумуляты (кривая сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Если при графическом изображении вариационного ряда оси кумуляты поменять местами, то мы получим Огиву.
Анализ произведенных расчетов:
Простейшим из показателей данной группы является вариационный размах. Он равен 51 (в нашем случае). Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.
Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 12,8. Именно на это значение отклоняется в среднем количество набранных баллов участниками, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,51. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения.
Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 210,49.
К относительным показателям вариации относят: относительный размах вариации (0,76), относительное линейное отклонение (0,1) и коэффициент вариации (0,22). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима. Исчисляется в процентах; в нашем случае относительный разброс случайной величины составляет 22%.
Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 0,1.
Относительный размах вариации (0,76) отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака допустимый.
Среднее значение — числовая характеристика множества чисел, т.е. наших данных; — некоторое число, заключённое между наименьшим и наибольшим из их значений. В нашем случае среднее значение является обобщающим показателем, характеризующий типический уровень баллов по тренингу Продажи, который равен 67,2.
Мода — значение во множестве наблюдений, которое встречается наиболее часто. В нашей совокупности, этим числом является 51. Иногда в совокупности встречается более чем одна мода. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило, если встречается более чем одна мода, значит набор данных не подчиняется нормальному распределению. Следовательно, мы можем утверждать, что наша совокупность данных подчиняется нормальному распределению.
Описание использованных функций при расчете показателей в пункте 1 и 2:
Среднее значение =СУММПРОИЗВ(БТП;Число участников)/60.
Мода возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Для дискретного ряда мода определяется как значение признака, которому соответствует наибольшая частота, для интервального ряда – по формуле : M 0 = X0+ (fM0-fM0-1)/(fM0-fM0+1)*l , где Х0 – начальное значение модального интервала , fM0; fM0+1 - частота появления признака соответственно в интервале модальном, предшествующем модальному и следующем за модальным; l – длина интервала. Находим с помощью функции Excel =МОДА (БТП).
Медиана — это число, которое является серединой множества чисел. Медиана для дискретного ряда определяется как значение признака центральной единицы ряда (если в ряду нечетное число единиц) или как полусумма значений двух центральных единиц (если в ряду четное число единиц). Для интервального ряда медиану определяют по формуле: М е = Х 0 + ((∑fi/2-fMe-1 )/ f Me )* lде X0– начальное значение медианного интервала; fMe-1 – накопленная частота в интервале, предшествующем медианному; f Me – частота появления признака в медианном интервале; l– длина интервала. Находим с помощью функции Excel =МЕДИАНА (БТП).
Среднее линейное отклонение =СУММПРОИЗВ(Отклонение от среднего;Число участников)/160.
Среднее квадратическое отклонение - показывает степень отклонения. находим с помощью функции =СТАНДОТКЛОН (БТП).
Размах вариации представляет собой разницу между максимальным и минимальным значений признака: Хmax – Хmin. Размах вариации имеет один недостаток - он оценивает лишь границы варьирования признака и не отражает колебленность внутри этих границ. Этого недостатка лишена дисперсия, рассчитываемая как средний квадрат отклонений значений признака от их средней величины. Находится с помощью функции =ДИСПР (БТП).
Относительный размах вариации =Размах вариации/среднее значение и относительное линейное отклонение =Среднее линейное отклонение/среднее значение находим путем деления размаха вариации показателей на его среднее значение. Аналогично и относительное линейное отклонение.
Коэффициент асимметрии характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значенийнтральный момент третьего порядка. Используем функцию =СКОС (БТП).
Коэффициент Эксцесса характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределениеЭКСЦЕСС (БТП).
Коэффициент вариации находится путем деления среднего квадратического отклонения на среднее значение показателей.
B-3. Проверка гипотезы о нормальном характере распределения признака БТП для уровня значимости 0,05.
В этом разделе необходимо дать краткую характеристику нормального распределения и проверить гипотезу о нормальном законе распределения по указанному в задании признаку. Для этого можно воспользоваться критерием согласия Пирсона или критерий χ 2 (Хи –квадрат).
Эту проверку можно осуществить двумя способами: с помощью вычислений и графически. Преимущества графического – наглядность.
1 способ. Проверка гипотезы о нормальном распределении исследуемого признака через критерий Пирсона.
Идея критерия Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т.е. значений которые бы имели место в случае нормального характера распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.
Нам понадобятся следующие данные:
n= | 160 | число интервалов= |
| 6 | |
max= | 93 |
|
|
|
|
min= | 42 | длина интервала= |
| 1 | |
среднеквадрат.отклон.= | 14,50820631 | среднее= |
|
| 67,2 |
матожидание= | 67,2 | средне квадратическое отклонение = | 14,51 | ||
размах вариации= | 51 | Ширина интервала b= |
| 8 | |
интервал изменения= | 8,5 |
|
|
|
|
Столбцы Баллы по тренингу "Продажи" (t) и Число участников (Эмпирические частоты) берём из предыдущих пунктов.
Для того чтобы найти теоретические частоты нам необходимо будет найти середины интервалов по формуле: число min+ширину интервала(b), далее рассчитываем теоретическое распределение через формулу: НОРМРАСП(середина интервала; среднее; стандартное отклонение; ложь). И наконец рассчитываем теоретические частоты по формуле: произведение теоретическое значение распределения, число строк, ширина интервала). Можно сделать и проще. рассчитать через функцию = НОРМРАСП. Формула будет выглядеть следующим образом:
=НОРМРАСП(Х(i);среднее; стандартное_откл; интегральная)*b *n. Где Х(i) это БТП. Как увидим ниже значения получились одинаковые.
|
|
|
|
|
|
| 2 сопособ: |
Баллы по тернингу Продажи | Число участников (Эмпирические частоты) | Теоретические частоты | χ2 | Середины интервалов | теоретическое значение распределения |
| теоретические частоты |
42-49 | 14 | 12 | 0,30 | 46 | 0,009454476 |
| 12,101729 |
50-57 | 40 | 23 | 12,03 | 54 | 0,018177909 |
| 23,267724 |
58-65 | 24 | 33 | 2,46 | 62 | 0,025787004 |
| 33,007365 |
66-73 | 22 | 35 | 4,56 | 70 | 0,026990337 |
| 34,547632 |
74-81 | 23 | 27 | 0,51 | 78 | 0,020843287 |
| 26,679408 |
82-89 | 29 | 15 | 12,53 | 86 | 0,01187612 |
| 15,201434 |
90-97 | 8 | 6 | 0,41 | 94 | 0,004992677 |
| 6,3906263 |
Сумма | 160 | 151 | 33 |
|
|
| 151,19592 |
Таким образом, находим Теоретические частоты для каждого Х(i) из столбца БТП.
Далее необходимо найти χ2. Хи-квадрат статистика=(Наблюдаемая частота – Ожидаемая частота)^2/Ожидаемая частота.
Критерий χ2 применяется в двух случаях: 1. Для сопоставления эмпирического распределения признака с теоретическим. 2. Для сопоставления двух и более эмпирических распределений одного и того же признака друг с другом.
Вычисляем через функцию =СУММ () сумму столбца χ2. Получаем 33.
Используя функцию ХИ2ОБР для уровня значимости 0,05 и степени свободы (n-1, т.е. 51-1) 50 получаем =ХИ2ОБР(0,1;СЧЁТ(значения БТП)-1)=68.
Если значение статистики «Хи-квадрат» больше критического значения, то это является свидетельством того, что наблюдаемые частоты значимо отличаются от тех, которые ожидаются. В этом случае следует отклонить нулевую гипотезу и принять альтернативную гипотезу, сделав вывод о том, что наблюдаемые выборочные проценты значимо отличаются от заданных опорных значений.
Если значение статистики «Хи-квадрат» меньше критического значения, то наблюдаемые значения не очень отличаются от значений, которые можно ожидать. В этом случае следует принять нулевую гипотезу (как приемлемую возможность) и сделать вывод, что наблюдаемые выборочные проценты не имеет значимых отличий от заданных опорных значений.
В нашем случае получается 33 меньше 68. Отсюда делаем вывод, что нет оснований отклонить гипотезу о нормальном распределении выборки по признаку Баллы по тренингу "Продажи".
2 способ. Теперь мы попробуем проделать тоже самое с помощью графического метода. Наиболее простой, но весьма приближенный метод оценки согласия результатов с тем или иным распределением – графический. По этому методу результаты располагают в вариационном ряду. Затем для каждого результата xi рассчитывают накопленную частотность по формуле, где i – номер результата в вариационном ряду, n – объём выборки. Используя накопленные частности как значения функции распределения, для каждого W(i) находят соответствующие значения квантиля предполагаемого распределения. В частности, для нормального распределения находят квантили стандартного нормального распределения zi. Результаты наносят на график в координатах x – z. Поскольку предполагается, что значения xi являются квантилями того же вида распределения, что и zi, между значениями x и z должна быть линейная зависимость. Если нанесенные на график точки укладываются вдоль прямой линии лишь с небольшими отклонениями, считается, что результаты удовлетворительно описываются выбранным теоретическим распределением. При больших отклонениях от прямой экспериментальное распределение не соответствует выбранному теоретическому.
W (i)=i/n+1, где i – табельный номер; x – БТП; W=i/n+1; z=НОРМСТОБР(W(i)).
i | x | W | z | 81 | 68,00 | 0,5031056 | 0,0077846 |
1 | 43,08 | 0,0062112 | -2,4999136 | 82 | 68,12 | 0,5093168 | 0,0233558 |
2 | 43,53 | 0,0124224 | -2,2438086 | 83 | 68,15 | 0,5155280 | 0,0389326 |
3 | 43,60 | 0,0186335 | -2,0828261 | 84 | 69,57 | 0,5217391 | 0,0545189 |
4 | 43,69 | 0,0248447 | -1,9626278 | 85 | 69,76 | 0,5279503 | 0,0701185 |
5 | 44,35 | 0,0310559 | -1,8654968 | 86 | 70,14 | 0,5341615 | 0,0857351 |
6 | 44,79 | 0,0372671 | -1,7833204 | 87 | 70,30 | 0,5403727 | 0,1013726 |
7 | 45,74 | 0,0434783 | -1,7116753 | 88 | 70,54 | 0,5465839 | 0,1170350 |
8 | 46,06 | 0,0496894 | -1,6478723 | 89 | 70,54 | 0,5527950 | 0,1327262 |
9 | 47,03 | 0,0559006 | -1,5901489 | 90 | 70,68 | 0,5590062 | 0,1484501 |
10 | 48,74 | 0,0621118 | -1,5372847 | 91 | 70,88 | 0,5652174 | 0,1642108 |
11 | 48,74 | 0,0683230 | -1,4883980 | 92 | 71,16 | 0,5714286 | 0,1800124 |
12 | 48,84 | 0,0745342 | -1,4428302 | 93 | 71,21 | 0,5776398 | 0,1958590 |
13 | 49,08 | 0,0807453 | -1,4000756 | 94 | 71,68 | 0,5838509 | 0,2117551 |
14 | 49,70 | 0,0869565 | -1,3597374 | 95 | 71,83 | 0,5900621 | 0,2277048 |
15 | 49,78 | 0,0931677 | -1,3214979 | 96 | 71,84 | 0,5962733 | 0,2437126 |
16 | 49,85 | 0,0993789 | -1,2850988 | 97 | 72,27 | 0,6024845 | 0,2597831 |
17 | 49,86 | 0,1055901 | -1,2503270 | 98 | 72,42 | 0,6086957 | 0,2759211 |
18 | 50,40 | 0,1118012 | -1,2170046 | 99 | 72,45 | 0,6149068 | 0,2921312 |
19 | 50,40 | 0,1180124 | -1,1849813 | 100 | 72,63 | 0,6211180 | 0,3084184 |
20 | 50,80 | 0,1242236 | -1,1541292 | 101 | 72,90 | 0,6273292 | 0,3247879 |
21 | 51,10 | 0,1304348 | -1,1243382 | 102 | 72,90 | 0,6335404 | 0,3412449 |
22 | 51,75 | 0,1366460 | -1,0955131 | 103 | 73,03 | 0,6397516 | 0,3577948 |
23 | 52,17 | 0,1428571 | -1,0675705 | 104 | 73,14 | 0,6459627 | 0,3744433 |
24 | 52,20 | 0,1490683 | -1,0404376 | 105 | 73,61 | 0,6521739 | 0,3911963 |
25 | 52,37 | 0,1552795 | -1,0140498 | 106 | 73,77 | 0,6583851 | 0,4080597 |
26 | 53,08 | 0,1614907 | -0,9883498 | 107 | 73,77 | 0,6645963 | 0,4250401 |
27 | 53,46 | 0,1677019 | -0,9632866 | 108 | 73,93 | 0,6708075 | 0,4421439 |
28 | 53,66 | 0,1739130 | -0,9388143 | 109 | 73,96 | 0,6770186 | 0,4593780 |
29 | 53,94 | 0,1801242 | -0,9148918 | 110 | 73,99 | 0,6832298 | 0,4767497 |
30 | 54,05 | 0,1863354 | -0,8914817 | 111 | 74,05 | 0,6894410 | 0,4942665 |
31 | 54,42 | 0,1925466 | -0,8685503 | 112 | 74,14 | 0,6956522 | 0,5119362 |
32 | 54,79 | 0,1987578 | -0,8460667 | 113 | 74,41 | 0,7018634 | 0,5297673 |
33 | 56,43 | 0,2049689 | -0,8240029 | 114 | 74,62 | 0,7080745 | 0,5477684 |
34 | 56,70 | 0,2111801 | -0,8023332 | 115 | 74,81 | 0,7142857 | 0,5659488 |
35 | 56,80 | 0,2173913 | -0,7810338 | 116 | 74,92 | 0,7204969 | 0,5843183 |
36 | 57,50 | 0,2236025 | -0,7600830 | 117 | 75,12 | 0,7267081 | 0,6028870 |
37 | 57,93 | 0,2298137 | -0,7394606 | 118 | 75,45 | 0,7329193 | 0,6216660 |
38 | 58,46 | 0,2360248 | -0,7191481 | 119 | 75,83 | 0,7391304 | 0,6406669 |
39 | 59,56 | 0,2422360 | -0,6991280 | 120 | 75,88 | 0,7453416 | 0,6599019 |
40 | 59,63 | 0,2484472 | -0,6793843 | 121 | 75,95 | 0,7515528 | 0,6793843 |
41 | 59,65 | 0,2546584 | -0,6599019 | 122 | 76,08 | 0,7577640 | 0,6991280 |
42 | 60,27 | 0,2608696 | -0,6406669 | 123 | 76,18 | 0,7639752 | 0,7191481 |
43 | 60,66 | 0,2670807 | -0,6216660 | 124 | 76,24 | 0,7701863 | 0,7394606 |
44 | 60,80 | 0,2732919 | -0,6028870 | 125 | 76,34 | 0,7763975 | 0,7600830 |
45 | 61,12 | 0,2795031 | -0,5843183 | 126 | 76,83 | 0,7826087 | 0,7810338 |
46 | 61,36 | 0,2857143 | -0,5659488 | 127 | 76,95 | 0,7888199 | 0,8023332 |
47 | 61,40 | 0,2919255 | -0,5477684 | 128 | 76,99 | 0,7950311 | 0,8240029 |
48 | 61,49 | 0,2981366 | -0,5297673 | 129 | 78,05 | 0,8012422 | 0,8460667 |
49 | 61,58 | 0,3043478 | -0,5119362 | 130 | 78,06 | 0,8074534 | 0,8685503 |
50 | 61,72 | 0,3105590 | -0,4942665 | 131 | 78,28 | 0,8136646 | 0,8914817 |
51 | 61,81 | 0,3167702 | -0,4767497 | 132 | 78,36 | 0,8198758 | 0,9148918 |
52 | 62,50 | 0,3229814 | -0,4593780 | 133 | 78,53 | 0,8260870 | 0,9388143 |
53 | 62,73 | 0,3291925 | -0,4421439 | 134 | 79,05 | 0,8322981 | 0,9632866 |
54 | 62,81 | 0,3354037 | -0,4250401 | 135 | 79,49 | 0,8385093 | 0,9883498 |
55 | 63,21 | 0,3416149 | -0,4080597 | 136 | 79,53 | 0,8447205 | 1,0140498 |
56 | 63,45 | 0,3478261 | -0,3911963 | 137 | 80,13 | 0,8509317 | 1,0404376 |
57 | 63,57 | 0,3540373 | -0,3744433 | 138 | 81,55 | 0,8571429 | 1,0675705 |
58 | 63,57 | 0,3602484 | -0,3577948 | 139 | 81,72 | 0,8633540 | 1,0955131 |
59 | 64,23 | 0,3664596 | -0,3412449 | 140 | 83,17 | 0,8695652 | 1,1243382 |
60 | 64,38 | 0,3726708 | -0,3247879 | 141 | 83,44 | 0,8757764 | 1,1541292 |
61 | 64,49 | 0,3788820 | -0,3084184 | 142 | 83,67 | 0,8819876 | 1,1849813 |
62 | 64,62 | 0,3850932 | -0,2921312 | 143 | 83,79 | 0,8881988 | 1,2170046 |
63 | 64,63 | 0,3913043 | -0,2759211 | 144 | 84,44 | 0,8944099 | 1,2503270 |
64 | 65,05 | 0,3975155 | -0,2597831 | 145 | 84,53 | 0,9006211 | 1,2850988 |
65 | 65,20 | 0,4037267 | -0,2437126 | 146 | 84,60 | 0,9068323 | 1,3214979 |
66 | 65,21 | 0,4099379 | -0,2277048 | 147 | 85,03 | 0,9130435 | 1,3597374 |
67 | 65,24 | 0,4161491 | -0,2117551 | 148 | 85,59 | 0,9192547 | 1,4000756 |
68 | 65,42 | 0,4223602 | -0,1958590 | 149 | 86,22 | 0,9254658 | 1,4428302 |
69 | 65,56 | 0,4285714 | -0,1800124 | 150 | 86,46 | 0,9316770 | 1,4883980 |
70 | 65,64 | 0,4347826 | -0,1642108 | 151 | 87,05 | 0,9378882 | 1,5372847 |
71 | 65,67 | 0,4409938 | -0,1484501 | 152 | 87,23 | 0,9440994 | 1,5901489 |
72 | 65,92 | 0,4472050 | -0,1327262 | 153 | 87,81 | 0,9503106 | 1,6478723 |
73 | 65,96 | 0,4534161 | -0,1170350 | 154 | 88,10 | 0,9565217 | 1,7116753 |
74 | 66,40 | 0,4596273 | -0,1013726 | 155 | 88,10 | 0,9627329 | 1,7833204 |
75 | 66,62 | 0,4658385 | -0,0857351 | 156 | 88,47 | 0,9689441 | 1,8654968 |
76 | 66,66 | 0,4720497 | -0,0701185 | 157 | 88,64 | 0,9751553 | 1,9626278 |
77 | 66,89 | 0,4782609 | -0,0545189 | 158 | 89,07 | 0,9813665 | 2,0828261 |
78 | 67,47 | 0,4844720 | -0,0389326 | 159 | 89,54 | 0,9875776 | 2,2438086 |
79 | 67,58 | 0,4906832 | -0,0233558 | 160 | 94,82 | 0,9937888 | 2,4999136 |
80 | 67,59 | 0,4968944 | -0,0077846 |
Строим диаграмму, где Х-БТП, У это z.
Добавляем линию тренда.
С-4. Корреляционный анализ между признаком БТП по всем представленным в наблюдении признакам.
КОРРЕЛ Возвращает коэффициент корреляции меду интервалами ячеек массив1 и массив2. Коэффициент корреляции используется для определения наличия взаимосвязи между двумя свойствами.
Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению
математического ожидания другой.
Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
Используя функции =КОРЕЛЛ(), рассчитаем коэффициент корреляции между признаками.
| Баллы по тренингу "Продажи" | Баллы по тренингу "Сервисное обслживание" | Баллы по тренингу "Новая техника" | Возраст | Опыт работы | IQ | EQ | Средняя зарплата/месяц |
Баллы по тренингу "Продажи" | 1,00 | -0,17 | 0,11 | 0,13 | 0,11 | -0,07 | 1,00 | 0,13 |
Баллы по тренингу "Сервисное обслуживание" | -0,17 | 1,00 | -0,79 | -0,83 | -0,79 | 0,04 | -0,16 | -0,76 |
Баллы по тренингу "Новая техника" | 0,11 | -0,79 | 1,00 | 0,97 | 1,00 | -0,02 | 0,10 | 0,88 |
Возраст | 0,13 | -0,83 | 0,97 | 1,00 | 0,13 | -0,04 | 0,12 | 0,91 |
Опыт работы | 0,11 | -0,79 | 1,00 | 0,97 | 1,00 | -0,03 | 0,10 | 0,88 |
IQ | -0,07 | 0,04 | -0,02 | -0,04 | -0,03 | 1,00 | -0,07 | -0,03 |
EQ | 1,00 | -0,16 | 0,10 | 0,12 | 0,10 | -0,07 | 1,00 | 0,12 |
Средняя зарплата/месяц | 0,13 | -0,76 | 0,88 | 0,91 | 0,88 | -0,03 | 0,12 | 1,00 |
Видно, что самая сильная связь между Баллы по тренингу "Продажи" и EQ.
Для определения тесноты связи необходимо провести корреляционный анализ.
Процедура корреляционного анализа включает:
- построение корреляционной решетки;
- построение поля корреляции;
- расчет показателей корреляции;
- анализ и оценку наличия, направления и тесноты корреляционной связи по
группировке, графику и расчетным показателям.
Теперь построим график корреляционного поля между признаком БТП и остальными признаками.
В системе координата оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимые через эти оси, обозначаются точкой. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
Видим, что у БТП и EQ имеется связь(0,5х+3,57).
С-5. Построить уравнение линейной регрессионной связи результативного признака с факторным признаком, наиболее тесно связанным с результативным.
Построим уравнение линейной регрессионной связи результативного признака с факторным признаком, наиболее тесно связанным с результативным.Факторный признак - EQ, результативный - "Баллы по тренингу Продажи".
Используя функцию ЛИНЕЙН получаем:
Коэффициенты уравнения регрессии |
|
|
|
|
| ||
0,50 | 3,57 | m,b | уравнение регрессии Yрегр= | 0,5Х+3,57 |
| ||
0,0024 | 0,3169 | sem,seb | 160 |
|
|
|
|
0,9963 | 0,8868 | r2,sey |
|
|
|
|
|
42403,79 | 158 | F,df | Подставляя вместо х нужные нам переменные(EQ) мы сможем прогнозировать значение(БТП) | ||||
33343,36 | 124,24 | sspeг,ssocт |
Здесь m и b, коэффициенты уравнения, которое мы и искали, т.е. зависимость между ЮТП и EQ описывается в виде Yрегр=0,5х+3,57.
Sspeг ( регрессионная сумма квадратов) равно сумме квадратов разностей между пронозными значениями и средней арифметической исходных значений(в нашем случае = 33343,36), а ssocт ( остаточная сумма квадратов) равно сумме квадратовв разностей между прогнозными и исходными значениями(в нашем примере равен 124,24). Их сумма равна ssper + ssoст = sstotal, т.е. общей сумме квадратов.
Коэффициент детерминированности r2показывает(0,9963), насколько хорошо уравнение, полученное с помощью реггрессионного анализа, объясняет взаимосвязь между переменными. Он равен sspeг/(sspeг+ ssoст). Чем меньше остаточная сумма квадратов, тем больше значение коэффициента детерминированности r2. Суть в следующем – ssрег – сумма квадратов объясняемая регрессией, а ssoст – сумма квадратов, объясняемая случайными ошибками, поэтому r2 фактически показывает насколько Y объясняется X-ом, т.е. насколько количество баллов в тренингах Продажи, в нашем примере, объясняется значениями EQ. В нашем примере значение равно = 0,99, что является хорошим показателем, т.е. фактически 99% изменения Y ( БТП) можно объяснить изменением Х (EQ).
Параметры F и df используются при проверке статистических гипотез. F-это статистика или наблюдаемое значение; df – степени свободы.
Параметр sey является стандартной ошибкой оценки для Yрегр . Можно сказать, что sey является некоторым аналогом среднеквадратического отклонения для Y, только отклонение не около среднего, а около значений вычисленных по уравнению Yрегр=0,5х+3,57. Sey измеряет степень отличия реальных значений Y от оценочной (прогнозной) величины Yрегр. Т.е. показывает примерно, какую величину ошибки мы допускаем, когда используем вместо исходного значения Y значение Yрегр. Реальное значение Y в 95% случаев, скорее всего будет в диапазоне ± 2 sey
С-6. По уравнению связи рассчитать прогноз среднего значения результативного признака для значений факторного признака БТП равных 1,2*xmax; 1,3*xmax; 1,5*xmax , где xmax – максимальное выборочное значение факторного признака.
EQxmax= | 178 |
|
|
Делаем прогноз среднего значения БТП, для EQ=1,2*xmax= : | |||
БТП=3,57+0,5*(178*1,2)= | 111 |
|
|
Делаем прогноз среднего значения БТП, для EQ=1,3*xmax= : | |||
БТП=3,57+0,5*(1,3*178)= | 120 |
|
|
Делаем прогноз среднего значения БТП, для EQ=1,5*хmax= : | |||
БТП=3,57+0,5*(1,5*178)= | 138 |
|
|
m и b это коэффициенты нашего уравнения, т.е. зависимость между количеством баллов по тренингу Продажи и уровня EQ описывается в виде Yрегр=0,5х+3,57. Т.е. мы можем строить прогнозы, подставляя под Х (1,2 *хмах; 1,3*хмах; 1Б5*хмах, где хмах – максимальное выборочное значение факторного признака, т.е. EQ). Интерпретация коэффициента m. Фактически это означает на какую величину меняется Yрегр при изменении Х на одну единицу. В данном случае это 0,5. Т.е. при изменении уровня EQ, количество баллов БТП будет меняться на 0,5.
С-7. Определить доверительные интервалы для прогнозных значений (уровень значимости 0,01).
Через инструмент Excel «Анализ данных» и средства «Регрессия», получаем следующие данные:
Регрессионная статистика | |||||||||
Множественный R | 0,998142149 | ||||||||
R-квадрат | 0,99628775 | ||||||||
Нормированный R-квадрат | 0,996264255 | ||||||||
Стандартная ошибка | 0,886752357 | ||||||||
Наблюдения | 160 | ||||||||
Дисперсионный анализ |
|
|
|
|
|
|
|
| |
| df | SS | MS | F | Значимость F |
|
|
| |
Регрессия | 1 | 33343,36 | 33343,3599 | 42403,79 | 6,4E-194 |
|
|
| |
Остаток | 158 | 124,2401 | 0,78632974 |
|
|
|
|
| |
Итого | 159 | 33467,6 |
|
|
|
|
|
| |
|
|
|
|
|
|
|
|
| |
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | 3,565113142 | 0,316877 | 11,25079679 | 6,11E-22 | 2,939253 | 4,190973 | 2,9392529 | 4,190973 | |
Переменная X 1 | 0,503166884 | 0,002443 | 205,9218012 | 6,4E-194 | 0,498341 | 0,507993 | 0,4983408 | 0,507993 | |
Где y-БТП; x-EQ. |
Рассчитаем сначала стандартную ошибку прогнозирования, затем доверительный интервал. Для этого нам понадобятся значения:
X среднее(СРЗНАЧ(EQ)=126 |
Значение t находим с помощью функции =СТЬЮДРАСПОБР(0,01;n-2)=3
Степень свободы = n-2, т.е. 160-2
Теперь рассчитаем стандартную ошибку для конкретного значения Х0.
Затем найдем доверительные интервалы для прогнозных средних значений будут с 99% уровнем доверительной вероятности.
для x0=1,2*Хmax, х0=1,3*Хmax, x0=1,5*xmax.
Тогда, для x0=1,2*178= | 213,6 |
| |||
Станд.ошибка прогнозирования(=КОРЕНЬ(se^2/ | 0,224 | ||||
Интервал= | (110,43 | 111,65) | |||
А, для x0=1,3*178= | 231,4 |
| |||
Станд.ошибка прогнозирования (=КОРЕНЬ(Se^2/160+Sb^2*(B124- | 0,266 | ||||
Интервал= | (119,28 | 120,72) | |||
Тогда, для x0=1,5*178= | 267 |
| |||
Станд.ошибка прогнозирования(=КОРЕНЬ(Se^2/ | 0,350 | ||||
Интервал | (137,0 | 138,86) |
Оценка произведенных расчетов.
Любой прогнозируемый результат получаем с какой-то ошибкой . Ошибка прогнозирования, если упрощенно, то это разница между прогнозом и фактическим значением. Зная ошибку прогнозирования можно определиться с точностью прогноза. Чем выше точность, тем больше требуется времени. В нашем примере стандартные ошибки достаточно малы(0,22; 0,26; 0,35), соответственное мы можем достаточно точно прогнозировать значения БТП .
Доверительные интервалы для прогнозных средних значений будут с 99% уровнем доверительной вероятности.
для x0=1,2*Хmax=1,2*178=213,6 Интервал (Прогноз среднего значения БТП, для EQ= 1,2*Хmax – t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ= 1,2*Хmax + t* Станд.ошибка прогнозирования, для Х0). Т.е.(110,43;11,65).
А для х0=1,3*Xmax=1,3*178=231,4
Интервал (Прогноз среднего значения БТП, для EQ=1,3*Xmax - t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ=1,3*Xmax + t* Станд.ошибка прогнозирования, для Х0) Т.е.( 119,28;120,72).
А для х0=1,3*Xmax=1,3*178=231,4
Интервал (Прогноз среднего значения БТП, для EQ=1,5*Xmax - t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ=1,5*Xmax + t* Станд.ошибка прогнозирования, для Х0) Т.е.(137,00;138,86).
Основываясь на данных наблюдений, мы определяем границы, т.е. наши интервалы, в которых с заданной степенью достоверности лежит прогнозируемый параметр. Т.е. с 99% вероятностью прогнозные значения будут в этих интервалах.
C-8. Для пары признаков БТП и факторным признаком, наиболее тесно связанным с результативным рассчитать отдельно: эмпирическое корреляционное отношение (ЭКО), коэффициент детерминации
Сравнить значения ЭКО и коэффициента детерминации.
По формуле Стерджесса найдём количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика). Среднее значение для БТП и EQ.
n=1+3,322*LOG(EQ)=8; h=( Хmax-Xmin)/160=12
EQ | |
|
|
Среднее | 126,469 |
Стандартная ошибка | 2,27528 |
Медиана | 126 |
Мода | 102 |
Стандартное отклонение | 28,7802 |
Дисперсия выборки | 828,301 |
Эксцесс | -1,3164 |
Асимметричность | 0,09298 |
Интервал | 100 |
Минимум | 78 |
Максимум | 178 |
Сумма | 20235 |
Счет | 160 |
Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.
Построим корреляционную решетку для пары признаков БТП и EQ. Корреляционная решетка – это аналитическая группировка единиц совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной решетки можно сделать предположение о наличии и направлении связи, а также предварительную оценку тесноты связи.
Корреляционная решетка | EQ |
|
|
|
|
|
|
|
|
|
БТП | 78-89 | 90-101 | 102-113 | 114-125 | 126-137 | 138-149 | 150-161 | 162-173 | 174-185 | Общий итог |
42-50,5 | 13 | 8 |
|
|
|
|
|
|
| 21 |
50,5-59 |
| 17 | 24 |
|
|
|
|
|
| 41 |
59-67,5 |
|
| 4 | 12 | 3 |
|
|
|
| 19 |
67,5-76 |
|
|
| 1 | 16 | 6 |
|
|
| 23 |
76-84,5 |
|
|
|
|
| 10 | 18 | 1 |
| 29 |
84,5-93 |
|
|
|
|
|
| 1 | 23 | 3 | 27 |
Общий итог | 13 | 25 | 28 | 13 | 19 | 16 | 19 | 24 | 3 | 160 |
Теперь необходимо рассчитать коэффициент детерминации, корреляционное отношение.
| EQ |
|
|
|
|
|
|
|
|
|
|
|
|
БТП | 78-89 | 90-101 | 102-113 | 114-125 | 126-137 | 138-149 | 150-161 | 162-173 | 174-185 | Общий итог | средние значения интервалов | Групповые средние (EQ) |
|
42-50,5 | 13 | 8 |
|
|
|
|
|
|
| 21 | 46,25 | 87,69048 | 197,37 |
50,5-59 |
| 17 | 24 |
|
|
|
|
|
| 41 | 54,75 | 100,939 | 167,02 |
59-67,5 |
|
| 4 | 12 | 3 |
|
|
|
| 19 | 63,25 | 115,9211 | 13,21 |
67,5-76 |
|
|
| 1 | 16 | 6 |
|
|
| 23 | 71,75 | 129,8913 | 1,68 |
76-84,5 |
|
|
|
|
| 10 | 18 | 1 |
| 29 | 80,25 | 146,0862 | 69,75 |
84,5-93 |
|
|
|
|
|
| 1 | 23 | 3 | 27 | 88,75 | 161,3148 | 204,90 |
Общий итог | 13 | 25 | 28 | 13 | 19 | 16 | 19 | 24 | 3 | 160 |
|
| 653,94 |
Средние | 83,5 | 94,5 | 105,5 | 116,5 | 127,5 | 138,5 | 149,5 | 160,5 | 171,5 |
|
|
|
|
Групповые средние (БТП) | 46,25 | 52,03 | 55,96 | 63,90 | 70,41 | 77,06 | 80,70 | 88,40 | 88,75 |
|
|
|
|
| 35,66 | 35,96 | 22,09 | 0,88 | 1,22 | 9,73 | 21,63 | 67,39 | 8,71 | 203,27 |
|
|
|
Дисперсия = ДИСПР(БТП)=210,49
Факторная дисперсия для БТП=СУММ(Групповых средних БТП)=203,27
ЭКО= Факторная дисперсия/Дисперсия=0,97
ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем большая доля вариации падает на группировочный признак.
ЭКО меньше, чем коэффициент корреляции,т.е.(0,97<1), что говорит о линейной связи между признаками БТП и EQ. Подобные действия необходимы для принятия эффективных управленческих решений, что бы знать, в какой мере социально-экономические явления и процессы связаны между собой.
D-9. Множественный корреляционно-регрессионный анализ.
Провести множественный корреляционно-регрессионный анализ признака «БТП» со всеми возможными факторными (рассматриваем порядковые качественные признаки как количественные, номинальные, как категориальные переменные).Для удобства сократим таблицу.
Баллы по тренингу "Продажи" | Баллы по тренингу "Новая техника" | Баллы по тренингу "Сервисное обслуживание" | Кол-во жалоб от покупателей за год | Возраст | Опыт работы | Пол | IQ | EQ | Средняя зарплата/месяц | Средняя премия/месяц | Высшее | Высшее техническое | Наличие судимости | Годовой объем продаж |
85 | 24 | 83 | 3 | 38 | 7 | 0 | 114 | 163 | 7064 | 1345 | 0 | 0 | 0 | 4679,798 |
76 | 38 | 63 | 4 | 23 | 5 | 1 | 132 | 145 | 6523 | 1478 | 0 | 0 | 1 | 3890,568 |
84 | 2 | 121 | 2 | 49 | 11 | 0 | 136 | 158 | 8305 | 1972 | 1 | 0 | 0 | 6291,815 |
93 | 13 | 110 | 1 | 47 | 10 | 1 | 128 | 178 | 7964 | 1330 | 0 | 0 | 0 | 5525,68 |
85 | 26 | 83 | 2 | 35 | 7 | 0 | 125 | 164 | 7675 | 1498 | 0 | 0 | 0 | 5149,423 |
84 | 13 | 104 | 3 | 41 | 9 | 1 | 154 | 158 | 7882 | 1739 | 0 | 0 | 1 | 5218,117 |
63 | 4 | 132 | 8 | 59 | 12 | 0 | 94 | 117 | 8935 | 1118 | 0 | 0 | 0 | 5637,52 |
58 | 29 | 92 | 7 | 34 | 8 | 0 | 133 | 107 | 7680 | 2193 | 1 | 1 | 1 | 4401,294 |
87 | 39 | 64 | 2 | 20 | 5 | 0 | 120 | 164 | 6919 | 1456 | 0 | 0 | 0 | 4222,165 |
80 | 19 | 111 | 4 | 48 | 10 | 0 | 144 | 152 | 8336 | 1857 | 1 | 0 | 0 | 5919,302 |
52 | 28 | 83 | 7 | 31 | 7 | 1 | 115 | 95 | 7437 | 985 | 0 | 0 | 1 | 3671,662 |
… | … | … | … | … | … | … | … | … | … | … | … | … | … | … |
50 | 32 | 82 | 9 | 32 | 7 | 0 | 147 | 93 | 7123 | 1962 | 1 | 1 | 0 | 4061,944 |
72 | 33 | 72 | 5 | 28 | 6 | 1 | 109 | 136 | 6878 | 2230 | 1 | 1 | 0 | 4384,64 |
74 | 3 | 134 | 5 | 62 | 12 | 1 | 86 | 139 | 8652 | 1133 | 0 | 0 | 0 | 6085,767 |
49 | 34 | 73 | 8 | 27 | 6 | 0 | 95 | 91 | 6573 | 840 | 0 | 0 | 0 | 3546,152 |
57 | 15 | 122 | 9 | 49 | 11 | 0 | 118 | 109 | 7859 | 1247 | 0 | 0 | 0 | 5099,652 |
90 | 28 | 102 | 1 | 42 | 9 | 1 | 111 | 171 | 7442 | 2263 | 1 | 1 | 0 | 5203,433 |
78 | 3 | 113 | 3 | 48 | 10 | 0 | 153 | 146 | 7979 | 1566 | 0 | 0 | 0 | 5073,068 |
55 | 12 | 101 | 9 | 45 | 9 | 0 | 118 | 102 | 7693 | 1159 | 0 | 0 | 0 | 4626,472 |
74 | 19 | 103 | 4 | 42 | 9 | 0 | 166 | 142 | 7208 | 2612 | 1 | 1 | 0 | 4973,723 |
48 | 2 | 120 | 9 | 52 | 11 | 1 | 145 | 91 | 8557 | 1886 | 1 | 0 | 0 | 5828,041 |
Применяем «Регрессия» из «Анализа данных». В этом примере У - БТП, Х - все остальные признаки.
Регрессионная статистика | ||||||||
Множественный R | 0,998385 | |||||||
R-квадрат | 0,996772 | |||||||
Нормированный R-квадрат | 0,99646 | |||||||
Стандартная ошибка | 0,86315 | |||||||
Наблюдения | 160 | |||||||
Дисперсионный анализ |
|
|
|
| ||||
| df | SS | MS | F | Значимость F | |||
Регрессия | 14 | 33359,57088 | 2382,826491 | 3198,302709 | 6,5315E-173 | |||
Остаток | 145 | 108,0291244 | 0,745028444 |
|
| |||
Итого | 159 | 33467,6 |
|
|
| |||
| Коэф- фициенты | Стандартная ошибка | t-статистика | P- Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% |
Y-пересечение | 4,733749 | 1,940538044 | 2,439400425 | 0,01591896 | 0,898354417 | 8,569144244 | 0,898354417 | 8,569144244 |
Переменная X 1 | -0,01766 | 0,01104373 | -1,59889171 | 0,11202144 | -0,03948521 | 0,00416975 | -0,03948521 | 0,00416975 |
Переменная X 2 | -0,00374 | 0,053841488 | -0,06950520 | 0,94468325 | -0,11015778 | 0,10267325 | -0,11015778 | 0,102673258 |
Переменная X 3 | -0,15237 | 0,06237696 | -2,44278932 | 0,01577626 | -0,27565930 | -0,02908823 | -0,27565930 | -0,02908823 |
Переменная X 4 | -0,04246 | 0,028923749 | -1,46815167 | 0,14422896 | -0,09963107 | 0,01470216 | -0,09963107 | 0,01470216 |
Переменная X 5 | 0,143447 | 0,580552144 | 0,247087088 | 0,80519032 | -1,00399087 | 1,29088475 | -1,00399087 | 1,29088475 |
Переменная X 6 | -0,23173 | 0,161064411 | -1,43874224 | 0,15237861 | -0,55006746 | 0,08660711 | -0,55006746 | 0,08660711 |
Переменная X 7 | 0,001827 | 0,003007463 | 0,607392769 | 0,54454030 | -0,00411741 | 0,00777084 | -0,00411741 | 0,00777084 |
Переменная X 8 | 0,492635 | 0,007910321 | 62,27746252 | 1,5628E-106 | 0,47700032 | 0,50826918 | 0,47700032 | 0,50826918 |
Переменная X 9 | 0,000514 | 0,000245585 | 2,09208252 | 0,03817414 | 2,83952E-05 | 0,00099917 | 2,83952E-05 | 0,00099917 |
Переменная X 10 | -0,00083 | 0,00054437 | -1,533491115 | 0,12733390 | -0,00191071 | 0,00024113 | -0,00191071 | 0,00024113 |
Переменная X 11 | 0,114743 | 0,326430342 | 0,351507269 | 0,72571808 | -0,53043372 | 0,75991899 | -0,53043372 | 0,75991899 |
Переменная X 12 | 0,597639 | 0,327388612 | 1,825473636 | 0,06998723 | -0,04943106 | 1,244709621 | -0,049431063 | 1,244709621 |
Переменная X 13 | 0,28552 | 0,185592425 | 1,538422739 | 0,12612466 | -0,08129631 | 0,65233556 | -0,08129631 | 0,65233552 |
Переменная X 14 | -0,00012 | 0,000256751 | -0,45914156 | 0,64682006 | -0,00062534 | 0,00038957 | -0,00062534 | 0,00038957 |
Проанализировать корреляционную таблицу, p-значение и отбросить лишние факторные (X) признаки. В нашем примере отбросим все, кроме X3, X8, X9.
Баллы по тренингу "Продажи" | Баллы по тренингу "Сервисное обслуживание" | Опыт работы | EQ |
85 | 83 | 7 | 163 |
76 | 63 | 5 | 145 |
84 | 121 | 11 | 158 |
93 | 110 | 10 | 178 |
85 | 83 | 7 | 164 |
84 | 104 | 9 | 158 |
63 | 132 | 12 | 117 |
58 | 92 | 8 | 107 |
87 | 64 | 5 | 164 |
80 | 111 | 10 | 152 |
52 | 83 | 7 | 95 |
… | … | … | … |
50 | 82 | 7 | 93 |
72 | 72 | 6 | 136 |
74 | 134 | 12 | 139 |
49 | 73 | 6 | 91 |
57 | 122 | 11 | 109 |
90 | 102 | 9 | 171 |
78 | 113 | 10 | 146 |
55 | 101 | 9 | 102 |
74 | 103 | 9 | 142 |
48 | 120 | 11 | 91 |
Регрессионная статистика | ||||||||||||||||||||
Множественный R | 0,998163 | |||||||||||||||||||
R-квадрат | 0,99633 | |||||||||||||||||||
Нормированный R-квадрат | 0,996259 | |||||||||||||||||||
Стандартная ошибка | 0,887344 | |||||||||||||||||||
Наблюдения | 160 | |||||||||||||||||||
Дисперсионный анализ |
|
|
|
| ||||||||||||||||
| df | SS | MS | F | Значимость F | |||||||||||||||
Регрессия | 3 | 33344,76874 | 11114,92291 | 14116,34099 | 1,1096E-189 | |||||||||||||||
Остаток | 156 | 122,8312617 | 0,787379882 |
|
| |||||||||||||||
Итого | 159 | 33467,6 |
|
|
| |||||||||||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||||||||||||
Y-пересечение | 3,073519 | 0,692465675 | 4,438514106 | 1,70492E-05 | 1,705699894 | 4,441337441 | 1,705699894 | 4,441337441 | ||||||||||||
Переменная X 1 | 0,019979 | 0,050360335 | 0,396721812 | 0,692114796 | -0,079497096 | 0,119455183 | -0,079497096 | 0,119455183 | ||||||||||||
Переменная X 2 | -0,16615 | 0,505533016 | -0,328663289 | 0,74285098 | -1,164723176 | 0,832422889 | -1,164723176 | 0,832422889 | ||||||||||||
Переменная X 3 | 0,50281 | 0,002459854 | 204,4065261 | 2,022E-191 | 0,497951287 | 0,507669125 | 0,497951287 | 0,507669125 |
Отметим, что в данном случае БТП не зависит от БТНТ, поэтому уберем переменную X1 и оставим только признаки X7, X10.
Баллы по тренингу "Продажи" | Баллы по тренингу "Сервисное обслуживание" | Опыт работы | EQ |
85 | 83 | 7 | 163 |
76 | 63 | 5 | 145 |
84 | 121 | 11 | 158 |
93 | 110 | 10 | 178 |
85 | 83 | 7 | 164 |
84 | 104 | 9 | 158 |
63 | 132 | 12 | 117 |
58 | 92 | 8 | 107 |
87 | 64 | 5 | 164 |
80 | 111 | 10 | 152 |
52 | 83 | 7 | 95 |
… | … | … | … |
50 | 82 | 7 | 93 |
72 | 72 | 6 | 136 |
74 | 134 | 12 | 139 |
49 | 73 | 6 | 91 |
57 | 122 | 11 | 109 |
90 | 102 | 9 | 171 |
78 | 113 | 10 | 146 |
55 | 101 | 9 | 102 |
74 | 103 | 9 | 142 |
48 | 120 | 11 | 91 |
Регрессионная статистика | |
Множественный R | 0,998162 |
R-квадрат | 0,996327 |
Нормированный R-квадрат | 0,996281 |
Стандартная ошибка | 0,88482 |
Наблюдения | 160 |
Дисперсионный анализ |
|
|
|
| ||||||||||
| df | SS | MS | F | Значимость F | |||||||||
Регрессия | 2 | 33344,68369 | 16672,34184 | 21295,44551 | 7,101E-192 | |||||||||
Остаток | 157 | 122,9163141 | 0,782906459 |
|
| |||||||||
Итого | 159 | 33467,6 |
|
|
| |||||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||||||
Y-пересечение | 3,260535 | 0,393494265 | 8,286106471 | 4,87125E-14 | 2,483309779 | 4,037760966 | 2,483309779 | 4,037760966 | ||||||
Переменная X 1 | 0,003451 | 0,002653613 | 1,300330805 | 0,195393214 | -0,001790813 | 0,008691964 | -0,001790813 | 0,008691964 | ||||||
Переменная X 2 | 0,502843 | 0,002450873 | 205,1688499 | 1,1319E-192 | 0,498001777 | 0,507683651 | 0,498001777 | 0,507683651 |
Анализируя полученные данные, видим, что p-значение для X1 слишком велико и необходимо исключить ее из рассмотрения. Кажется, что нет смысла в этом примере использовать множественную регрессию для прогнозирования БТП. Возможно, необходимо перебрать другие, потенциальные по влиянию на Y комбинации факторных признаков. Проанализировать определитель произведения матрицы факторных признаков, проанализировать коэффициенты частичной корреляции.
Е-10. Для пар признаков «Пол» и наличие судимости: коэффициент ассоциации и коэффициент контингенции.
Используются для измерения связи между двумя качественными признаками, состоящими только из двух групп.
Они необходим для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка ≥ 0.5 или Кк ≥ 0,3.
При построении критерия оценки тесноты связи атрибутивных признаков естественно потребовать, чтобы он изменялся в пределах от -1 до +1 (подобно коэффициенту корреляции), причем чтобы +1 соответствовал абсолютной положительной связанности, -1 - абсолютной отрицательной связи, а нулевое значение - независимости признаков.
Коэффициент контингенции Юла:
Легко видеть, что при независимости признаков , при абсолютной положительной связи , при абсолютной отрицательной связи .
Недостатком коэффициента Юла является то, что он не различает полной и абсолютной связанности признаков, давая для этих случаев +1 или -1, т.е. коэффициент Юла существенно завышает оценку связи признаков.
Указанного недостатка не имеет коэффициент ассоциации Пирсона
который при независимости признаков также равен нулю, а значения +1, -1 принимает только при абсолютной связанности признаков.
Количество по полю Высшее техническое | наличие судимости |
|
| a= | 73 |
Пол | нет | да | Общий итог | b= | 3 |
ж | 73 | 3 | 76 | c= | 47 |
м | 47 | 37 | 84 | d= | 37 |
Общий итог | 120 | 40 | 160 |
Таблица сопряженности признаков. Атрибутивные признаки A и B являются независимыми.
Рассчитываем коэффициенты :
Коэффициент контингенции: = (a*d-b*c)/((a+b)*(b+d)*(a+c)*( | 0,462 |
Коэффициент ассоциации: =(a*d-b*c)/(a*d+b*c) = | 0,9 |
Коэффициенты ассоциации и контингенции применяются для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп( пол, наличие судимости). Коэффициент ассоциации Пирсона измеряется от —1 до +1 и интерпретируется так: чем ближе коэффициент к 1, тем теснее связь, положительная или отрицательная. В нашем случае коэффициент ассоциации почти равен единицы(0,9), это свидетельствует о существенной связи между признаками. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, т.к. 0,462<0,9.
Е-11. Для пар признаков «БТП» и «БТСО» рассчитать: коэффициент Спирмена.
Коэффициент Спирмена rs не является параметрическим критерием в отличии от коэффициента Пирсона:
rs = 1 – (6∑d2/n(n2 – 1), где d — разница между значениями рангов для каждой единицы. Так же как и коэффициент Пирсона, значение rs изменяется от -1 до +1. Значимость коэффициента Спирмена может быть проверена таким же образом, что и значение коэффициента Пирсона.
БТП и БТСО. Используя функцию КОРРЕЛ рассчитаем коэффициент корреляции между рангами, который является искомым коэффициентом.
rs= | 0,1383 |
При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи. Справедливо утверждение, что в нашем случае коэффициент равен 0,138, что свидетельствует о слабой тесноты связи между признаками.
Е-12. Для пар признаков «БТСО и «БТНТ», рассчитать: коэффициент Кендалла.
Коэффициент Кендалла, как и коэффициент Спирмена, подсчитывается для признаков, измеренных по ранговой шкале, по формуле:
, где S+ - х-БТСО, у-S- .
P=СУММ(Совпадений)=2694
Q=СУММ(Инверсий)= 10026
Тогда τ=(P-Q)/(0,5*160*(160-1))=-0,
Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.
Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. коэффициент Кендалла дает более осторожную и, видимо, более объективную оценку степени связи двух признаков, чем коэффициент Спирмена. В нашем примере он равен -0,58 и, может быть, наиболее реально показывает тесноту связи.
Е-13 Для пары признаков БТП и БТСО рассчитать коэффициент Спирмена и коэффициент корреляции. Объяснить различия.
В пункте Е-11 мы нашли для пары признаков БТП и БТСО коэффициент Спиремена, который равен 0,138, а также рассчитали в пункте С-4 коэффициент корреляции равный -0,17. Теперь рассмотрим основные различия между этими коэффициентами.
Коэффициент корреляции рангов Спирмена, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин. В нашем случае баллы по Продажам и по Сервисному обслуживанию. В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков – затруднителен.
Корреляция же предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).
Для получения адекватного результата по расчету коэффициента корреляции, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально. Обязательным условием использования коэффициента Спирмена является равенство размаха переменных.
Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.
Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений.
G-16. Определить доверительный интервал для среднего генеральной совокупности по признаку БТП с уровнем значимости 0,01.
Доверительный интервал в статистике — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он накрывает данный параметр с заданной вероятностью.
Используем функцию ДОВЕРИТ().
Выборочное среднее |
| 67,2 | ||
Объем выборки |
| = | 160 | |
Ширина доверительного интервала | 3 |
Интервал = (выборочное среднее-ширина выб.интервала; выборочное среднее+ширина выб.интервала (64,25;70,15)
т.е. искомый доверительный интервал 64,25< Хср.ген <70,15. Итак ,с вероятностью 0,99 можно утверждать, что интервал (64,25; 70,15) содержит внутри себя среднее количество баллов по тренингу Продажи.
|
|
G-17. Определить долю единиц генеральной совокупности, для которых значение признака БТП больше 90 с уровнем значимости 0.01.
Всего значений > 90 |
| 3 | |
Доля |
|
| 0,02 |
Ширина доверительного интервала для доли | 0,01 | ||
| |||
t |
|
| 2,61 |
=СЧЁТЕСЛИ(БТП;">90").
=Всего значений/n=3/160.
=КОРЕНЬ(Доля*(1-Доля)/160)= КОРЕНЬ(0,02*(1-0,02)/160).
=СТЬЮДРАСПОБР(0,01;159).
Доверительный интервал=( Доля - t *Ширину доверительного Интервала для доли;Доля+t *Ширину доверительного Интервала для доли)=(-0,009;0,047)
Сначала разберемся, что такое уровень значимости статистического критерия. Это ограничение сверху на вероятность ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она на самом деле верна). В нашем случае = 0.01.
Мы получаем характеристику генеральной совокупности по соответствующим показателям выборки, с условием, если БТП больше 90. Показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки. С этими условиями можно утверждать, что в доверительный интервал от -0,009 до 0,047 входит доля генеральной совокупности признака БТП с уровнем значимости 0,01.
Вывод по всем пунктам проделанной работы:
А-1. Сводка и группировка данных, числовая статистика.
В результате статистического наблюдения обычно получают «сырой» материал, записи об отдельных единицах наблюдения. Так и в нашем случае материал непригоден для непосредственного использования ни для практических целей, ни для целей научного анализа. Возникает необходимость в специальной обработке статистических данных, т.е. в сводке материалов наблюдения. Т.е. мы проделали комплекс последовательных действий по обобщению конкретных признаков, образующих совокупность в целях выявления типических черт и закономерностей, присущих изучаемому явлению в целом.
А-2.Вариационный анализ БТП.
Первый этап вариационного анализа - это построение вариационного ряда. Так как изучаемый нами признак относится к непрерывному виду, то необходимо строить интервальный ряд. По формуле Стержесса определяем длину интервала. Полученное значение k=8. Следовательно, будет 6 интервалов. Минимальное значение признака равно =42,а максимальное =93. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.
Кумулята и Огива необходимы для графического изображения вариационного ряда. При помощи Кумуляты (кривая сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Если при графическом изображении вариационного ряда оси кумуляты поменять местами, то мы получим Огиву.
В-3.Проверка гипотез.
Исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.
Эта задача представляет собой частный случай более общей проблемы, заключающейся в подборе теоретической функции распределения, в некотором смысле наилучшим образом согласующейся с опытными данными.
Наша выборка достаточно большого объема и равна 160. Для удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку, где хi значения середин интервалов, а пi число вариант, попавших в i-й интервал (эмпирические частоты).
По полученным данным можно вычислить выборочное среднее(67,2) и выборочное среднее квадратическое отклонение(14,51). Тогда можно найти количество чисел из выборки объема n, которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты).
Наша цель сравнить эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выяснить, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины. Смысл ее очевиден: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот. Имея ввиду, что уровень значимости у нас равен 0,05 и степени свободы = 10, мы получаем 35 а это больше искомой величины хи-квадрат. Отсюда делаем вывод, что нет оснований отклонить гипотезу о нормальном распределении выборки по признаку БТП.
С-4. Корреляционный анализ между БТП и остальными признаками.
Корреляционным анализом называется совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками. В нашем случае мы находили зависимость между БТП и остальными признаками, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
Графически взаимосвязь двух признаков изображали с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Такую тесную связь между признаками нам показала пара БТП и EQ. Это можно увидеть на графике, точки тесно сгруппированы.
С-5. Построить уравнение линейной регрессионной связи между БТП и EQ(в моем случае).
Находим коэффициенты уравнения регрессии с помощью функции ЛИНЕЙН. Статистический смысл уравнения: с увеличением х на 1 ед., y возрастает в среднем на а ед.
C-6. По уравнению связи рассчитать прогноз среднего значения результативного признака.
По полученному уравнению мы проводим прогноз количества баллов по Продажам, в зависимости от изменения максимального значения EQ в 1,2; 1,3 и в 1,5 раз. Мы получили прогнозные значения, с помощью которых сможем сделать прогноз относительно того, чему будут равняться баллы по тренингу Продажи при выборе определенного уровня EQ.
C-7. Определить доверительные интервалы для прогнозных значений, если уровень значимости 0,01.
Через инструмент Excel «Анализ данных» и средства «Регрессия», получаем данные(коэффициенты, стандартные ошибки, t-статистика, р-значение и т.д.), где у-БТП, а х-EQ.
Для построения доверительного интервала мы рассчитали х-среднее, значение t, стандартную ошибку прогнозирования, используя коэффициенты уравнения регрессии. Учитывая, что уровень значимости у нас 0,01, то с 99% вероятностью прогнозные значения будут в этих интервалах.
С-8. Рассчитать ЭКО и коэффициент детерминации для признаков БТП и EQ.
Сначала по формуле Стерджесса найдём количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика). Среднее значение для БТП и EQ.
n=1+3,322*LOG(EQ)=8; h=( Хmax-Xmin)/160=12. Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.
Построим корреляционную решетку для пары признаков БТП и EQ. Корреляционная решетка – это аналитическая группировка единиц совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной решетки можно сделать предположение о наличии и направлении связи, а также предварительную оценку тесноты связи.
Далее мы рассчитываем коэффициент детерминации, корреляционное отношение. ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем большая доля вариации падает на группировочный признак.
ЭКО меньше, чем коэффициент корреляции,т.е.(0,97<1), что говорит о линейной связи между признаками БТП и EQ. Подобные действия необходимы для принятия эффективных управленческих решений, что бы знать, в какой мере социально-экономические явления и процессы связаны между собой.
D-9.Множественный корреляционно-регрессионный анализ.
Множественный корреляцонно-регрессионный анализ это метод установления зависимости одной переменной от двух или более независимых переменных. В нашем случае большинство независимых переменных являются категориальными, в этом случае лучше использовать дисперсионный анализ. Что мы и делаем через анализ данных, Excel рассчитывает нам дисперсионный анализ. Как показано в работе, анализ на основе множественной регрессии основан на использовании более чем одной независимой переменной в уравнении регрессии. Это усложняет анализ, делая его многомерным. Однако регрессионная модель более полно отражает действительность, так как в реальности исследуемый параметр, как правило, зависит от множества факторов. Все, что касается множественной регрессии, концептуально является идентичным парной регрессии, за исключением того, что используется более чем одна переменная. Под этим углом зрения слегка изменяются терминология и статистические расчеты.
Е-10.Рассчитать коэффициент ассоциации и коэффициент контингенции для пары признаков Пол и Судимость.
Используются для измерения связи между двумя качественными признаками, состоящими только из двух групп.Они необходим для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. Коэффициент контингенции(0,462) всегда меньше коэффициента ассоциации(0,9). Коэффициент контингенции и ассоциации определяют связь двух качественных признаков. Различия между этими коэффициентами в том, что коэффициент контингенции в отличие от коэффициента ассоциации завышает оценку связи признаков.
Е-11.Рассчитать коэффициент Спирмена для БТП и БТНТ.
При использовании коэффициента ранговой корреляции Спирмена мы условно оценивают тесноту связи между признаками БТП и БТНТ, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи. Справедливо утверждение, что в нашем случае коэффициент равен 0,138, что свидетельствует о слабой тесноты связи между признаками. Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции. Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.
Е-12.Рассчитать коэффициент Кендалла для БТП и БТНТ.
Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. коэффициент Кендалла дает более осторожную и, видимо, более объективную оценку степени связи двух признаков, чем коэффициент Спирмена. В нашем примере он равен -0,58 и, может быть, наиболее реально показывает тесноту связи.
Е-13.Рассчитать коэффициент Спирмена и коэффициент корреляции для пар признаков БТП и БТНТ. Объяснить различия.
В пункте Е-11 мы нашли для пары признаков БТП и БТСО коэффициент Спиремена, который равен 0,138, а также рассчитали в пункте С-4 коэффициент корреляции равный -0,17. Теперь рассмотрим основные различия между этими коэффициентами.
Коэффициент корреляции рангов Спирмена, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин. В нашем случае баллы по Продажам и по Сервисному обслуживанию. В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков – затруднителен.
Корреляция же предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).
Для получения адекватного результата по расчету коэффициента корреляции, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально. Обязательным условием использования коэффициента Спирмена является равенство размаха переменных.
Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции. Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений.
G-16. Определить доверительный интервал для среднего генеральной совокупности по признаку БТП с уровнем значимости 0,01.
Доверительный интервал в статистике — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он накрывает данный параметр с заданной вероятностью. Использую функцию ДОВЕРИТ нашли интервал. Искомый доверительный интервал 64,25< Хср.ген <70,15. Итак ,с вероятностью 0,99 можно утверждать, что интервал (64,25; 70,15) содержит внутри себя среднее количество баллов по тренингу Продажи.
G-17. Определить долю единиц генеральной совокупности, для которых значение признака БТП больше 90 с уровнем значимости 0.01.
Соотношение численности выборочной и генеральной совокупностей называется долей выборки в генеральной совокупности.
Сначала разберемся, что такое уровень значимости статистического критерия. Это ограничение сверху на вероятность ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она на самом деле верна). В нашем случае = 0.01.
Мы получаем характеристику генеральной совокупности по соответствующим показателям выборки, с условием, если БТП больше 90. Показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки. С этими условиями можно утверждать, что в доверительный интервал от -0,009 до 0,047 входит доля генеральной совокупности признака БТП с уровнем значимости 0,01.
Список литературы:
Джини К. Средние величины. – М.: Статистика, 1970.
Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. – Кн.1. –М.: Финансы и статистика, 1986.
Теория статистики: Учебник/Под. Ред. Проф. Р.А. Шмойловой. – 3-е изд., перераб. – М.: Финансы и статистика, 1999.
Книга–справочник Популярный экономико-статистический словарь-справочник/Под. Ред. И.И.Елисеевой. – М.: Финансы и статистика, 1993.
Российский статистический ежегодник: Официальное издание. – М.: Госкомстат РФ, 1998.