Автор работы: Пользователь скрыл имя, 19 Января 2012 в 13:41, дипломная работа
По данным автотранспортного предприятия был организован массив данных по 50 водителям. Автотранспортное предприятие страхует водителей от дорожно-транспортных происшествий и желает закладывать в амортизационные расходы некую сумму для ремонта автомобилей, выделять средства для повышения квалификации водителей (курсы водителей АТП, проводимых сотрудниками учебных центров ГИБДД) и социальный пакет на диспансеризацию и лечение работников АТП.
Omnibus Tests of Model Coefficients | ||||
Chi-square | df | Sig. | ||
Step 1 | Step | 29.865 | 4 | .000 |
Block | 29.865 | 4 | .000 | |
Model | 29.865 | 4 | .000 |
Таблица
6. Объединенные тесты
для коэффициентов модели 1
На
основе данных таблицы 7 ,проведем анализ
полученной модели.
Variables in the Equation | |||||||
B | S.E. | Wald | df | Sig. | Exp(B) | ||
Step 1a | X1 | .037 | .027 | 1.887 | 1 | .169 | 1.037 |
X2 | 2.601 | .899 | 8.363 | 1 | .004 | 13.471 | |
X3 | -2.129 | .846 | 6.338 | 1 | .012 | .119 | |
X4 | -2.616 | 1.087 | 5.798 | 1 | .016 | .073 | |
Constant | -.257 | 1.196 | .046 | 1 | .830 | .774 | |
a. Variable(s) entered on step 1: X1, X2, X3, X4. |
Таблица
7. Модель 1
Наблюдаемая
статистическая значимость коэффициентов
вычисляется на основе статистики Вальда,
имеющая распределение хи-
Квадратный
корень из статистики Вальда приблизительно
равен отношению величины к его
стандартной ошибке – также как
для t- статистики в обычной линеной
модели.
Age * DTP Crosstabulation | ||||
DTP | Total | |||
.00 | 1.00 | |||
Age | 18.00 | 2 | 3 | 5 |
19.00 | 1 | 4 | 5 | |
20.00 | 1 | 0 | 1 | |
23.00 | 0 | 1 | 1 | |
25.00 | 1 | 0 | 1 | |
28.00 | 1 | 0 | 1 | |
31.00 | 0 | 1 | 1 | |
35.00 | 2 | 0 | 2 | |
38.00 | 1 | 0 | 1 | |
39.00 | 1 | 0 | 1 | |
40.00 | 1 | 0 | 1 | |
42.00 | 1 | 0 | 1 | |
44.00 | 2 | 0 | 2 | |
45.00 | 2 | 0 | 2 | |
47.00 | 1 | 0 | 1 | |
48.00 | 1 | 1 | 2 | |
50.00 | 0 | 1 | 1 | |
52.00 | 1 | 0 | 1 | |
55.00 | 3 | 1 | 4 | |
57.00 | 1 | 0 | 1 | |
59.00 | 0 | 2 | 2 | |
60.00 | 0 | 1 | 1 | |
61.00 | 0 | 2 | 2 | |
62.00 | 0 | 2 | 2 | |
63.00 | 0 | 1 | 1 | |
66.00 | 0 | 3 | 3 | |
67.00 | 1 | 1 | 2 | |
68.00 | 1 | 0 | 1 | |
69.00 | 0 | 1 | 1 | |
Total | 25 | 25 | 50 |
Таблица 8. Частота попадания в ДТП по возрастным группам
В нашем случае (таблица 7) значимой является переменная Х2.
На основе модели логистической регрессии можно построить предсказание, произойдет или не произойдет событие – попасть в ДТП. Если предсказанное значение вероятности события больше 0.5, считем, что событие произойдет, если меньше 0.5, считаем что событие не произойдет.
На
основе данных таблицы 9 можно определить
число верно и неверно
Classification Tablea | |||||
Observed | Predicted | ||||
DTP | Percentage Correct | ||||
.00 | 1.00 | ||||
Step 1 | DTP | .00 | 21 | 4 | 84.0 |
1.00 | 5 | 20 | 80.0 | ||
Overall Percentage | 82.0 | ||||
a. The cut value is .500 |
Таблица
9. Таблица классификации
модели 1
Обратимся
к таблицам сопряженности (таблица
8) для более детального анализа
переменных модели. Следует обратить
внимание на то, что в возрасте до
25 лет и после 57 лет шансы попасть
в ДТП увеличиваются. Введем переменную
Х5, равную нулю для водителей, возраст
которых от 25 до 55 лет и единице в других
случаях. Описательные статистики для
новой переменной представлены в таблице
10.
Descriptive Statistics | |||||
N | Minimum | Maximum | Mean | Std. Deviation | |
Age<25>55 | 50 | .00 | 1.00 | .5600 | .50143 |
Valid N (listwise) | 50 |
Таблица
10. Описательные статистики
для Х5
Построим
уравнение логистической
Omnibus Tests of Model Coefficients | ||||
Chi-square | df | Sig. | ||
Step 1 | Step | 32.314 | 4 | .000 |
Block | 32.314 | 4 | .000 | |
Model | 32.314 | 4 | .000 |
Таблица
11. Объединенные тесты
для коэффициентов модели 2
Model Summary | |||
Step | -2 Log likelihood | Cox & Snell R Square | Nagelkerke R Square |
1 | 37.000a | .476 | .635 |
a. Estimation terminated at iteration number 6 because parameter estimates changed by less than .001. |
Таблица 12.
Сводка для модели 2
Classification Tablea | |||||
Observed | Predicted | ||||
DTP | Percentage Correct | ||||
.00 | 1.00 | ||||
Step 1 | DTP | .00 | 22 | 3 | 88.0 |
1.00 | 4 | 21 | 84.0 | ||
Overall Percentage | 86.0 | ||||
a. The cut value is .500 |
Таблица
13. Таблица классификации
модели 2
Variables in the Equation | |||||||
B | S.E. | Wald | df | Sig. | Exp(B) | ||
Step 1a | X2 | 2.696 | .969 | 7.738 | 1 | .005 | 14.819 |
X3 | -1.833 | .894 | 4.207 | 1 | .040 | .160 | |
X4 | -.992 | 1.020 | .947 | 1 | .330 | .371 | |
X5 | 2.049 | 1.025 | 3.993 | 1 | .046 | 7.760 | |
Constant | -1.115 | 1.355 | .677 | 1 | .411 | .328 | |
a. Variable(s) entered on step 1: X2, X3, X4, X5. |
Таблица
14. Модель 2
Качество
модели 2 улучшилось по сравнению с
моделью 1, так как значение (-2Log(L))
теперь рано 37, что ниже, чем в модели 1.
Процент корректно предсказанных событий
увеличилось с 82% до 86%. Однако остается
статистическая не значимость переменной
Х4 (семейное положение).
Correlation Matrix | ||||||
Constant | X2 | X3 | X4 | X5 | ||
Step 1 | Constant | 1.000 | -.296 | -.436 | -.640 | -.795 |
X2 | -.296 | 1.000 | -.255 | -.258 | .274 | |
X3 | -.436 | -.255 | 1.000 | .305 | .167 | |
X4 | -.640 | -.258 | .305 | 1.000 | .390 | |
X5 | -.795 | .274 | .167 | .390 | 1.000 |
Таблица
15. Матрица парных
коэффициентов корреляции
При анализе матрицы парных коэффициентов корреляции, обращает на себя внимание тот факт, что переменная Х5 имеет высокий уровень корреляции с константой.
Используем
все возможные варианты комбинаций
переменных в модели.
Variables in the Equation | |||||||
B | S.E. | Wald | df | Sig. | Exp(B) | ||
Step 1a | X5 | 2.603 | .704 | 13.656 | 1 | .000 | 13.500 |
Constant | -1.504 | .553 | 7.404 | 1 | .007 | .222 | |
Step 2b | X2 | 2.476 | .867 | 8.149 | 1 | .004 | 11.888 |
X5 | 2.941 | .884 | 11.064 | 1 | .001 | 18.932 | |
Constant | -2.986 | .910 | 10.777 | 1 | .001 | .050 | |
Step 3c | X2 | 2.514 | .914 | 7.555 | 1 | .006 | 12.348 |
X3 | -1.601 | .848 | 3.565 | 1 | .059 | .202 | |
X5 | 2.515 | .923 | 7.430 | 1 | .006 | 12.373 | |
Constant | -2.005 | 1.010 | 3.944 | 1 | .047 | .135 | |
a. Variable(s) entered on step 1: X5. | |||||||
b. Variable(s) entered on step 2: X2. | |||||||
c. Variable(s) entered on step 3: X3. |
Информация о работе Вероятность попадания в дорожно-транспортное происшествие