Лабораторная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 30 Сентября 2011 в 06:52, лабораторная работа

Краткое описание

Задание 1: С помощью коэффициентов парной корреляции проанализируйте тесноту связи между эндогенной и экзогенными переменными. Сделать вывод.
Задание 2: На 5%-ом уровне оцените значимость найденных коэффициентов. Сделать выводы
Задание 3: Проверьте условия отсутствия мультиколлинеарности между факторами. Сделайте выводы.

Содержимое работы - 1 файл

отчет.docx

— 39.24 Кб (Скачать файл)

Министерство  образования и науки Российской Федерации.

Алтайский государственный технический университет

им. И.И. Ползунова 
 
 
 

Отчет по лабораторной работе №1

Вариант №4 
 
 
 
 
 
 
 
 
 

                                                                          Выполнила студентка 

 гр. ГМУ-81  Желтухина П.С 
 
 
 
 

Барнаул 2011

Задание 1: С помощью коэффициентов парной корреляции проанализируйте тесноту связи между эндогенной и экзогенными переменными. Сделать вывод. 

     Используем  Excel/сервис/анализ данных/КОРРЕЛЯЦИЯ.

     Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:

       Таблица 1. Коэффициенты парной  корреляции

  Y Х1 ХЗ Х5
Y 1      
Х1 0,008487 1    
ХЗ 0,89572 -0,04 1,00  
Х5 -0,05621 0,33 -0,02 1

     Проанализируем  коэффициенты корреляции между результирующим признаком У и каждым из факторов Хj :

     r (У, Х1 ) = 0,008 > 0, следовательно, между переменными У и Х1 наблюдается прямая корреляционная зависимость.

     r (У, Х1 ) = 0,008< 0,4 – эта зависимость слабая.

     r (У, Х3 ) = 0,895 > 0, наблюдается прямая корреляционная зависимость между У и Х3.

     r (У, Х3 ) = 0,895> 0,7 – эта зависимость тесная.

     r (У, Х5 )  = -0,056<0, значит между переменными У и Х5 обратная корреляционная зависимость.

     | r (У, Х5 )|= |-0,056|<0,4 – зависимость слабая.

     |0,008|<|-0,056|<|0,895| - значит наиболее информативный фактор Х3.

       Вывод: наиболее тесная зависимость наблюдается между переменными У и Х3, которая является прямой, т.е при увеличении значений фактора Х3 увеличивается и величина фактора У . А между факторами У и Х1, У и Х5 – зависимость является слабой, причем во втором случае она является обратной. Что означает, что при увеличении значений фактора Х5 величина У уменьшается.

     Наиболее  информативным фактором является фактор Х3. 

    Задание 2: На 5%-ом уровне оцените значимость найденных коэффициентов. Сделать выводы.

       Для проверки значимости найденных  коэффициентов корреляции используем кртерий Стьюдента.

     Для каждого коэффициента корреляции r (У, Хj ) вычислим t-статистику по формуле t = и занесем результаты расчетов в корреляционную таблицу: 

     Таблица 2. Корреляционная таблица

  Y Х1 ХЗ Х5 t - статистики
Y 1        
Х1 0,008487 1     0,051628963
ХЗ 0,89572 -0,04 1,00   12,25424373
Х5 -0,05621 0,33 -0,02 1 0,342472429

     По  таблице критических точек распределения  Стьюдента при уровне значимости α= 5% = 0,05 и числе степеней свободы k = n-2 = 39-2 =37 определим критическое значение tкр = 2,026192 (функция СТЬЮДЕНТРАСПОБР).

     Сопоставим фактические значения t с критическим tкр и сделаем выводы в соответствии со схемой: 

                                 

     t(r(Y,X1)) = 0,051< tкр = 2,026, следовательно, коэффициент r(Y,X1) не является значимым.

     t(r(Y,X3)) = 12,254 > tкр = 2,026, следовательно, коэффициент r(Y,X3) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной связи между признаками Y и X3.

     t(r(Y,X5)) = 0,342 < tкр = 2,026, следовательно, коэффициент r(Y,X5) не является значимым.

     Вывод: Таким образом, наиболее тесная и значимая зависимость наблюдается между факторами Y и X3.

     Задание 3: Проверьте  условия отсутствия мультиколлинеарности между факторами. Сделайте выводы. 

     Мультиколлинеарность  факторов – это тесная зависимость  между факторными переменными. Включение  в модель мультиколлинеарных факторов нежелательна, т.к. возрастают стандартные  ошибки. Если факторы между собой  тесно связаны, то  в модель рекомендуется  включать более информативный фактор.

     Используем  схему проверки:

     |r(Xi,Xj)|>0,8 то мультиколлинеарность между Xi и Xj считается установленной, то в этом случаев модель включается наиболее информативный фактор. 

     |r(Xi,Xj)| <0,8 то проверяем 2 дополнительных неравенства:

     |r(Xi,Xj)|< |r(Y,,Xi)|

     |r(Xi,Xj)|< |r(Y,,Xj)|

     При выполнении трех форме говорят об отсутствии мультиколлинеарности и  в модель можно включать оба фактора.

     Если  главное условие выполняется, а 1 или оба дополнительных не выполнены, то говорят о мультиколлинеарности в слабой форме, в этом случае в  модель рекомендуется включать наиболее информативный фактор.

     Проанализируем  полученные результаты:

     |r(X1,X3)| = |-0,04|<0,8 проверяем 2 дополнительных неравенства:

     |r(X1,X3)|> |r(Y,,X1)|

     |r(X1,X3)|> |r(Y,,X3)| - мультиколлинеарность присутствует в слабой форме.

     |r(X1,X5)| = 0,33|<0,8 проверяем 2 дополнительных неравенства:

     |r(X1,X5)|< |r(Y,,X1)|

     |r(X1,X5)|> |r(Y,,X5)| - мультиколлинеарность присутствует в слабой форме. 

     |r(X3,X5)| = -0,02|<0,8 проверяем 2 дополнительных неравенства:

     |r(X3,X5)|< |r(Y,,X3)|

     |r(X3,X5)|< |r(Y,,X5)|- условия выполняются в модель можно включать оба фактора.

Вывод: Проведенный анализ показал, что наблюдается слабая мультиколлинеарная зависимость между факторами X1 и X3, X1 и X5. Для того чтобы избежать стандартных ошибок рекомендуется включать в модель фактор X3 – наиболее информативный фактор. 

     Задание 4: Постройте линейную множественную модель (1) с полным перечнем факторов и модель (2) с наиболее информативны фактором.  Объясните смысл коэффициентов моделей (1) и (2). Исходные данные и результаты моделирования для модели (2) покажите на чертеже. 

     Для построения линейной множественной  модели используем программу РЕГРЕССИЯ (Анализ данных).

     Результаты  вычислений представлены в таблицах: 

Регрессионная статистика        
Множественный R 0,8984931        
R-квадрат 0,8072899        
Нормированный R-квадрат 0,7907719        
Стандартная ошибка 26,385831        
Наблюдения 39        
           
Дисперсионный анализ        
  df SS MS F Значимость F
Регрессия 3 102078,5688 34026,18961 48,87331 1,33422E-12
Остаток 35 24367,42348 696,2120994    
Итого 38 126445,9923      
 
 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -12,412456 12,53764407 -0,990015 0,328962 -37,86522637 13,0403149 -37,865226 13,04031
Переменная X 1 7,4422423 9,039058129 0,823342677 0,415888 -10,90802125 25,7925059 -10,908021 25,79251
Переменная X 2 1,5915632 0,13176587 12,07872104 4,86E-14 1,324064253 1,85906213 1,32406425 1,859062
Переменная X 3 -0,8699274 1,206422418 -0,72108025 0,475649 -3,319095092 1,57924034 -3,3190951 1,57924
 
 
ВЫВОД ОСТАТКА  
     
Наблюдение Предсказанное Y Остатки
1 31,133095 6,866905339
2 36,777712 30,22228839
3 35,907784 3,092215765
4 37,181035 7,818965213
5 38,050962 1,949037836
6 42,183516 -2,18351606
7 42,035224 -1,03522449
8 45,366642 -3,36664244
9 51,277156 -13,2771558
10 68,963329 -1,96332917
11 73,087082 26,91291812
12 77,755031 15,2449686
13 78,800334 -17,7003342
14 78,800334 -8,50033421
15 80,471554 4,528446416
16 79,601626 -19,6016262
17 84,653077 40,34692309
18 97,331259 -14,3312587
19 104,69936 55,30064481
20 99,326145 -19,326145
21 97,135905 27,86409482
22 107,43761 -2,43760689
23 110,04739 -20,047389
24 112,30282 -14,3028174
25 119,74506 -14,7450597
26 109,54474 22,45525629
27 116,11706 6,882941342
28 119,75592 -37,7559245
29 115,911 -30,9109965
30 122,83973 -30,3397287
31 128,21845 41,78155069
32 133,2699 -46,3699
33 149,63041 -21,6304066
34 163,58719 -45,5871933
35 158,60644 -28,1064415
36 164,07553 35,92447303
37 219,80748 7,19252142
38 218,49268 16,50732348
39 237,37244 42,6275557

Информация о работе Лабораторная работа по "Статистике"