Вероятность попадания в дорожно-транспортное происшествие

Автор работы: Пользователь скрыл имя, 19 Января 2012 в 13:41, дипломная работа

Краткое описание

По данным автотранспортного предприятия был организован массив данных по 50 водителям. Автотранспортное предприятие страхует водителей от дорожно-транспортных происшествий и желает закладывать в амортизационные расходы некую сумму для ремонта автомобилей, выделять средства для повышения квалификации водителей (курсы водителей АТП, проводимых сотрудниками учебных центров ГИБДД) и социальный пакет на диспансеризацию и лечение работников АТП.

Содержимое работы - 1 файл

проект.doc

— 503.50 Кб (Скачать файл)
Omnibus Tests of Model Coefficients
    Chi-square df Sig.
Step 1 Step 29.865 4 .000
Block 29.865 4 .000
Model 29.865 4 .000
 

Таблица 6. Объединенные тесты для коэффициентов модели 1 

     На  основе данных таблицы 7 ,проведем анализ полученной модели. 

Variables in the Equation
    B S.E. Wald df Sig. Exp(B)
Step 1a X1 .037 .027 1.887 1 .169 1.037
X2 2.601 .899 8.363 1 .004 13.471
X3 -2.129 .846 6.338 1 .012 .119
X4 -2.616 1.087 5.798 1 .016 .073
Constant -.257 1.196 .046 1 .830 .774
a. Variable(s) entered on step 1: X1, X2, X3, X4.
 

     Таблица 7. Модель 1 

     Наблюдаемая статистическая значимость коэффициентов  вычисляется на основе статистики Вальда, имеющая распределение хи-квадрат. При проверке гипотезы о равенстве  нулю при обычной или индикаторной переменной число степеней свободы равно 1.

     Квадратный  корень из статистики Вальда приблизительно равен отношению величины к его  стандартной ошибке – также как  для t- статистики в обычной линеной  модели. 
 
 

Age * DTP Crosstabulation
    DTP Total
    .00 1.00
Age 18.00 2 3 5
19.00 1 4 5
20.00 1 0 1
23.00 0 1 1
25.00 1 0 1
28.00 1 0 1
31.00 0 1 1
35.00 2 0 2
38.00 1 0 1
39.00 1 0 1
40.00 1 0 1
42.00 1 0 1
44.00 2 0 2
45.00 2 0 2
47.00 1 0 1
48.00 1 1 2
50.00 0 1 1
52.00 1 0 1
55.00 3 1 4
57.00 1 0 1
59.00 0 2 2
60.00 0 1 1
61.00 0 2 2
62.00 0 2 2
63.00 0 1 1
66.00 0 3 3
67.00 1 1 2
68.00 1 0 1
69.00 0 1 1
Total 25 25 50
 

     Таблица 8. Частота попадания  в ДТП по возрастным группам

     В нашем случае (таблица 7) значимой является переменная Х2.

     На  основе модели логистической регрессии  можно построить предсказание, произойдет или не произойдет событие – попасть  в ДТП. Если предсказанное значение вероятности события больше 0.5, считем, что событие произойдет, если меньше 0.5, считаем что событие не произойдет.

     На  основе данных таблицы 9 можно определить число верно и неверно предсказанных  наблюдений в каждой из категорий, а  также процент корректных предсказаний. На первом этапе процент корректных предсказаний составляет 82%. 

Classification Tablea
  Observed Predicted
  DTP Percentage Correct
  .00 1.00
Step 1 DTP .00 21 4 84.0
1.00 5 20 80.0
Overall Percentage     82.0
a. The cut value is .500

     Таблица 9. Таблица классификации модели 1 

     Обратимся к таблицам сопряженности (таблица 8) для более детального анализа  переменных модели. Следует обратить внимание на то, что в возрасте до 25 лет и после 57 лет шансы попасть  в ДТП увеличиваются. Введем переменную Х5, равную нулю для водителей, возраст которых от 25 до 55 лет и единице в других случаях. Описательные статистики для новой переменной представлены в таблице 10. 
 
 

Descriptive Statistics
  N Minimum Maximum Mean Std. Deviation
Age<25>55 50 .00 1.00 .5600 .50143
Valid N (listwise) 50        
 

     Таблица 10. Описательные статистики для Х5 

     Построим  уравнение логистической регрессии (модель 2), используя новую переменную Х5. 

Omnibus Tests of Model Coefficients
    Chi-square df Sig.
Step 1 Step 32.314 4 .000
Block 32.314 4 .000
Model 32.314 4 .000

Таблица 11. Объединенные тесты для коэффициентов модели 2 

Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 37.000a .476 .635
a. Estimation terminated at iteration number 6 because parameter estimates changed by less than .001.

     Таблица 12. Сводка для модели 2 

Classification Tablea
  Observed Predicted
  DTP Percentage Correct
  .00 1.00
Step 1 DTP .00 22 3 88.0
1.00 4 21 84.0
Overall Percentage     86.0
a. The cut value is .500
 

     Таблица 13. Таблица классификации модели 2 

Variables in the Equation
    B S.E. Wald df Sig. Exp(B)
Step 1a X2 2.696 .969 7.738 1 .005 14.819
X3 -1.833 .894 4.207 1 .040 .160
X4 -.992 1.020 .947 1 .330 .371
X5 2.049 1.025 3.993 1 .046 7.760
Constant -1.115 1.355 .677 1 .411 .328
a. Variable(s) entered on step 1: X2, X3, X4, X5.
 

     Таблица 14. Модель 2 

     Качество  модели 2 улучшилось по сравнению с  моделью 1, так как значение (-2Log(L)) теперь рано 37, что ниже, чем в модели 1. Процент корректно предсказанных событий увеличилось с 82% до 86%. Однако остается статистическая не значимость переменной Х4 (семейное положение). 
 

Correlation Matrix
    Constant X2      X3      X4      X5     
Step 1 Constant 1.000 -.296 -.436 -.640 -.795
X2      -.296 1.000 -.255 -.258 .274
X3      -.436 -.255 1.000 .305 .167
X4      -.640 -.258 .305 1.000 .390
X5      -.795 .274 .167 .390 1.000
 

     Таблица 15. Матрица парных коэффициентов корреляции 

     При анализе матрицы парных коэффициентов корреляции, обращает на себя внимание тот факт, что переменная Х5 имеет высокий уровень корреляции с константой.

     Используем  все возможные варианты комбинаций переменных в модели. 

Variables in the Equation
    B S.E. Wald df Sig. Exp(B)
Step 1a X5 2.603 .704 13.656 1 .000 13.500
Constant -1.504 .553 7.404 1 .007 .222
Step 2b X2 2.476 .867 8.149 1 .004 11.888
X5 2.941 .884 11.064 1 .001 18.932
Constant -2.986 .910 10.777 1 .001 .050
Step 3c X2 2.514 .914 7.555 1 .006 12.348
X3 -1.601 .848 3.565 1 .059 .202
X5 2.515 .923 7.430 1 .006 12.373
Constant -2.005 1.010 3.944 1 .047 .135
a. Variable(s) entered on step 1: X5.
b. Variable(s) entered on step 2: X2.
c. Variable(s) entered on step 3: X3.

Информация о работе Вероятность попадания в дорожно-транспортное происшествие