Автор работы: Пользователь скрыл имя, 30 Сентября 2011 в 06:52, лабораторная работа
Задание 1: С помощью коэффициентов парной корреляции проанализируйте тесноту связи между эндогенной и экзогенными переменными. Сделать вывод.
Задание 2: На 5%-ом уровне оцените значимость найденных коэффициентов. Сделать выводы
Задание 3: Проверьте условия отсутствия мультиколлинеарности между факторами. Сделайте выводы.
Министерство образования и науки Российской Федерации.
Алтайский
государственный технический
им. И.И.
Ползунова
Отчет по лабораторной работе №1
Вариант
№4
гр. ГМУ-81
Желтухина П.С
Барнаул 2011
Задание
1: С помощью коэффициентов
парной корреляции проанализируйте
тесноту связи между
эндогенной и экзогенными
переменными. Сделать
вывод.
Используем Excel/сервис/анализ данных/КОРРЕЛЯЦИЯ.
Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:
Таблица 1. Коэффициенты парной корреляции
Y | Х1 | ХЗ | Х5 | |
Y | 1 | |||
Х1 | 0,008487 | 1 | ||
ХЗ | 0,89572 | -0,04 | 1,00 | |
Х5 | -0,05621 | 0,33 | -0,02 | 1 |
Проанализируем коэффициенты корреляции между результирующим признаком У и каждым из факторов Хj :
r (У, Х1 ) = 0,008 > 0, следовательно, между переменными У и Х1 наблюдается прямая корреляционная зависимость.
r (У, Х1 ) = 0,008< 0,4 – эта зависимость слабая.
r (У, Х3 ) = 0,895 > 0, наблюдается прямая корреляционная зависимость между У и Х3.
r (У, Х3 ) = 0,895> 0,7 – эта зависимость тесная.
r (У, Х5 ) = -0,056<0, значит между переменными У и Х5 обратная корреляционная зависимость.
| r (У, Х5 )|= |-0,056|<0,4 – зависимость слабая.
|0,008|<|-0,056|<|0,895| - значит наиболее информативный фактор Х3.
Вывод: наиболее тесная зависимость наблюдается между переменными У и Х3, которая является прямой, т.е при увеличении значений фактора Х3 увеличивается и величина фактора У . А между факторами У и Х1, У и Х5 – зависимость является слабой, причем во втором случае она является обратной. Что означает, что при увеличении значений фактора Х5 величина У уменьшается.
Наиболее
информативным фактором является фактор
Х3.
Задание 2: На 5%-ом уровне оцените значимость найденных коэффициентов. Сделать выводы.
Для проверки значимости
Для
каждого коэффициента корреляции r
(У, Хj ) вычислим t-статистику по формуле
t =
и занесем результаты расчетов в корреляционную
таблицу:
Таблица 2. Корреляционная таблица
Y | Х1 | ХЗ | Х5 | t - статистики | |
Y | 1 | ||||
Х1 | 0,008487 | 1 | 0,051628963 | ||
ХЗ | 0,89572 | -0,04 | 1,00 | 12,25424373 | |
Х5 | -0,05621 | 0,33 | -0,02 | 1 | 0,342472429 |
По
таблице критических точек
Сопоставим
фактические значения t с критическим
tкр и сделаем выводы в соответствии
со схемой:
t(r(Y,X1)) = 0,051< tкр = 2,026, следовательно, коэффициент r(Y,X1) не является значимым.
t(r(Y,X3)) = 12,254 > tкр = 2,026, следовательно, коэффициент r(Y,X3) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной связи между признаками Y и X3.
t(r(Y,X5)) = 0,342 < tкр = 2,026, следовательно, коэффициент r(Y,X5) не является значимым.
Вывод: Таким образом, наиболее тесная и значимая зависимость наблюдается между факторами Y и X3.
Задание
3: Проверьте
условия отсутствия
мультиколлинеарности
между факторами. Сделайте
выводы.
Мультиколлинеарность факторов – это тесная зависимость между факторными переменными. Включение в модель мультиколлинеарных факторов нежелательна, т.к. возрастают стандартные ошибки. Если факторы между собой тесно связаны, то в модель рекомендуется включать более информативный фактор.
Используем схему проверки:
|r(Xi,Xj)|>0,8
то мультиколлинеарность между Xi
и Xj считается установленной,
то в этом случаев модель включается наиболее
информативный фактор.
|r(Xi,Xj)| <0,8 то проверяем 2 дополнительных неравенства:
|r(Xi,Xj)|< |r(Y,,Xi)|
|r(Xi,Xj)|< |r(Y,,Xj)|
При выполнении трех форме говорят об отсутствии мультиколлинеарности и в модель можно включать оба фактора.
Если главное условие выполняется, а 1 или оба дополнительных не выполнены, то говорят о мультиколлинеарности в слабой форме, в этом случае в модель рекомендуется включать наиболее информативный фактор.
Проанализируем полученные результаты:
|r(X1,X3)| = |-0,04|<0,8 проверяем 2 дополнительных неравенства:
|r(X1,X3)|> |r(Y,,X1)|
|r(X1,X3)|> |r(Y,,X3)| - мультиколлинеарность присутствует в слабой форме.
|r(X1,X5)| = 0,33|<0,8 проверяем 2 дополнительных неравенства:
|r(X1,X5)|< |r(Y,,X1)|
|r(X1,X5)|>
|r(Y,,X5)| - мультиколлинеарность
присутствует в слабой форме.
|r(X3,X5)| = -0,02|<0,8 проверяем 2 дополнительных неравенства:
|r(X3,X5)|< |r(Y,,X3)|
|r(X3,X5)|< |r(Y,,X5)|- условия выполняются в модель можно включать оба фактора.
Вывод:
Проведенный анализ показал, что наблюдается
слабая мультиколлинеарная зависимость
между факторами X1
и X3, X1 и X5.
Для того чтобы избежать стандартных ошибок
рекомендуется включать в модель фактор
X3 – наиболее информативный фактор.
Задание
4: Постройте
линейную множественную
модель (1) с полным перечнем
факторов и модель (2)
с наиболее информативны
фактором. Объясните
смысл коэффициентов
моделей (1) и (2). Исходные
данные и результаты
моделирования для
модели (2) покажите на
чертеже.
Для построения линейной множественной модели используем программу РЕГРЕССИЯ (Анализ данных).
Результаты
вычислений представлены в таблицах:
Регрессионная статистика | |||||
Множественный R | 0,8984931 | ||||
R-квадрат | 0,8072899 | ||||
Нормированный R-квадрат | 0,7907719 | ||||
Стандартная ошибка | 26,385831 | ||||
Наблюдения | 39 | ||||
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 102078,5688 | 34026,18961 | 48,87331 | 1,33422E-12 |
Остаток | 35 | 24367,42348 | 696,2120994 | ||
Итого | 38 | 126445,9923 |
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | -12,412456 | 12,53764407 | -0,990015 | 0,328962 | -37,86522637 | 13,0403149 | -37,865226 | 13,04031 |
Переменная X 1 | 7,4422423 | 9,039058129 | 0,823342677 | 0,415888 | -10,90802125 | 25,7925059 | -10,908021 | 25,79251 |
Переменная X 2 | 1,5915632 | 0,13176587 | 12,07872104 | 4,86E-14 | 1,324064253 | 1,85906213 | 1,32406425 | 1,859062 |
Переменная X 3 | -0,8699274 | 1,206422418 | -0,72108025 | 0,475649 | -3,319095092 | 1,57924034 | -3,3190951 | 1,57924 |
ВЫВОД ОСТАТКА | ||
Наблюдение | Предсказанное Y | Остатки |
1 | 31,133095 | 6,866905339 |
2 | 36,777712 | 30,22228839 |
3 | 35,907784 | 3,092215765 |
4 | 37,181035 | 7,818965213 |
5 | 38,050962 | 1,949037836 |
6 | 42,183516 | -2,18351606 |
7 | 42,035224 | -1,03522449 |
8 | 45,366642 | -3,36664244 |
9 | 51,277156 | -13,2771558 |
10 | 68,963329 | -1,96332917 |
11 | 73,087082 | 26,91291812 |
12 | 77,755031 | 15,2449686 |
13 | 78,800334 | -17,7003342 |
14 | 78,800334 | -8,50033421 |
15 | 80,471554 | 4,528446416 |
16 | 79,601626 | -19,6016262 |
17 | 84,653077 | 40,34692309 |
18 | 97,331259 | -14,3312587 |
19 | 104,69936 | 55,30064481 |
20 | 99,326145 | -19,326145 |
21 | 97,135905 | 27,86409482 |
22 | 107,43761 | -2,43760689 |
23 | 110,04739 | -20,047389 |
24 | 112,30282 | -14,3028174 |
25 | 119,74506 | -14,7450597 |
26 | 109,54474 | 22,45525629 |
27 | 116,11706 | 6,882941342 |
28 | 119,75592 | -37,7559245 |
29 | 115,911 | -30,9109965 |
30 | 122,83973 | -30,3397287 |
31 | 128,21845 | 41,78155069 |
32 | 133,2699 | -46,3699 |
33 | 149,63041 | -21,6304066 |
34 | 163,58719 | -45,5871933 |
35 | 158,60644 | -28,1064415 |
36 | 164,07553 | 35,92447303 |
37 | 219,80748 | 7,19252142 |
38 | 218,49268 | 16,50732348 |
39 | 237,37244 | 42,6275557 |