Автор работы: Пользователь скрыл имя, 15 Февраля 2013 в 15:44, контрольная работа
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х..
Из таблиц 1.2, 1.3, 1.4 видно, что наибольшее значение коэффициента детерминации имеет фактор X3 (0,715).
Исходя из данного критерия наиболее адекватной является модель уравнения регрессии зависимости цены квартиры от общей площади квартиры (Х3)
Б) Средняя ошибка аппроксимации:
Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели Еi = Yi - YТi, содержащиеся в столбце Остатки итогов программы РЕГРЕССИЯ (таблица «вывод остатка»). Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле Еотн.i = 100 с помощью функции ABS.
Выполнение расчетов для модели (3):
Наблюдение |
Предсказанное Y-цена квартиры, тыс. руб. |
Остатки |
Относительный остаток | |
1 |
95,48979294 |
19,51021 |
0,204317199 | |
2 |
114,6179543 |
-29,618 |
0,258405888 | |
3 |
86,38849036 |
-17,3885 |
0,201282489 | |
4 |
71,88810998 |
-14,8881 |
0,207101146 | |
5 |
116,3148073 |
68,28519 |
0,587072225 | |
6 |
36,56271523 |
19,43728 |
0,531614916 | |
7 |
87,15978719 |
-2,15979 |
0,024779629 | |
8 |
248,3608244 |
16,63918 |
0,066995975 | |
9 |
101,0431301 |
-40,3931 |
0,399761271 | |
10 |
121,0968476 |
8,903152 |
0,073520926 | |
11 |
54,76532038 |
-8,76532 |
0,160052389 | |
12 |
79,4468189 |
35,55318 |
0,447509184 | |
13 |
88,23960275 |
-17,2796 |
0,195825935 | |
14 |
51,68013307 |
-12,1801 |
0,235683083 | |
15 |
62,94106677 |
15,95893 |
0,253553587 | |
16 |
86,38849036 |
-26,3885 |
0,305463034 | |
17 |
131,5864845 |
-31,5865 |
0,240043532 | |
18 |
85,61719353 |
-34,6172 |
0,404325254 | |
19 |
138,0653779 |
18,93462 |
0,137142435 | |
20 |
152,7200176 |
-29,22 |
0,191330633 | |
21 |
60,93569501 |
-5,7357 |
0,094127014 | |
22 |
110,298692 |
-14,7987 |
0,134169243 | |
23 |
85,46293416 |
-27,8629 |
0,326023608 | |
24 |
76,51589095 |
-12,0159 |
0,157037849 | |
25 |
114,926473 |
-22,9265 |
0,199488181 | |
26 |
100,1175739 |
-0,11757 |
0,001174358 | |
27 |
57,07921087 |
23,92079 |
0,419080586 | |
28 |
36,25419649 |
28,7458 |
0,792895893 | |
29 |
87,46830592 |
22,53169 |
0,257598382 | |
30 |
49,05772385 |
-6,95772 |
0,141827286 | |
31 |
97,95794279 |
37,04206 |
0,378142457 | |
32 |
42,42457112 |
-2,82457 |
0,066578661 | |
33 |
81,91496875 |
-24,915 |
0,304156482 | |
34 |
41,65327429 |
38,34673 |
0,920617319 | |
35 |
76,51589095 |
-15,5159 |
0,202779981 | |
36 |
114,926473 |
-45,3265 |
0,394395406 | |
37 |
221,3654354 |
28,63456 |
0,129354271 | |
38 |
86,38849036 |
-21,8885 |
0,253372761 | |
39 |
70,19125696 |
54,80874 |
0,780848576 | |
40 |
124,182035 |
28,11797 |
0,226425385 | |
Среднее значение |
28,26% |
По столбцу относительных погрешностей найдем среднее значение отн = 28,26% (с помощью функции СРЗНАЧ).
Выполнение расчетов для модели (5):
Наблюдение |
Предсказанное Y-цена квартиры, тыс. руб. |
Остатки |
Относительный остаток | |
1 |
97,33101061 |
17,66899 |
0,181535045 | |
2 |
89,78073243 |
-4,78073 |
0,05324898 | |
3 |
91,66830198 |
-22,6683 |
0,247286156 | |
4 |
82,23045425 |
-25,2305 |
0,306826157 | |
5 |
82,23045425 |
102,3695 |
1,244910376 | |
6 |
84,1180238 |
-28,118 |
0,334268716 | |
7 |
102,9937192 |
-17,9937 |
0,174706957 | |
8 |
99,21858016 |
165,7814 |
1,670870714 | |
9 |
101,1061497 |
-40,4561 |
0,4001354 | |
10 |
91,66830198 |
38,3317 |
0,418156519 | |
11 |
84,1180238 |
-38,118 |
0,453149302 | |
12 |
84,1180238 |
30,88198 |
0,367126744 | |
13 |
89,78073243 |
-18,8207 |
0,209629972 | |
14 |
93,55587152 |
-54,0559 |
0,5777924 | |
15 |
106,7688583 |
-27,8689 |
0,261020477 | |
16 |
101,1061497 |
-41,1061 |
0,406564287 | |
17 |
82,23045425 |
17,76955 |
0,216094462 | |
18 |
91,66830198 |
-40,6683 |
0,443646289 | |
19 |
84,1180238 |
72,88198 |
0,866425207 | |
20 |
102,9937192 |
20,50628 |
0,199102245 | |
21 |
97,33101061 |
-42,131 |
0,432863178 | |
22 |
91,66830198 |
3,831698 |
0,041799596 | |
23 |
89,78073243 |
-32,1807 |
0,358436956 | |
24 |
99,21858016 |
-34,7186 |
0,349920147 | |
25 |
97,33101061 |
-5,33101 |
0,054771964 | |
26 |
84,1180238 |
15,88198 |
0,188805864 | |
27 |
86,00559334 |
-5,00559 |
0,058200788 | |
28 |
89,78073243 |
-24,7807 |
0,276013926 | |
29 |
99,21858016 |
10,78142 |
0,108663315 | |
30 |
104,8812888 |
-62,7813 |
0,598593796 | |
31 |
102,9937192 |
32,00628 |
0,310759539 | |
32 |
89,78073243 |
-50,1807 |
0,558925407 | |
33 |
95,44344107 |
-38,4434 |
0,402787668 | |
34 |
87,89316289 |
-7,89316 |
0,08980406 | |
35 |
99,21858016 |
-38,2186 |
0,385195798 | |
36 |
87,89316289 |
-18,2932 |
0,208129532 | |
37 |
108,6564279 |
141,3436 |
1,300830286 | |
38 |
102,9937192 |
-38,4937 |
0,37374822 | |
39 |
95,44344107 |
29,55656 |
0,309676166 | |
40 |
93,55587152 |
58,74413 |
0,627904241 | |
Среднее значение |
40,17% |
По столбцу относительных погрешностей найдем среднее значение отн = 40,17% (с помощью функции СРЗНАЧ).
Выполнение расчетов для модели (6):
Наблюдение |
Предсказанное Y-цена квартиры, тыс. руб. |
Остатки |
Относительный остаток | |
1 |
75,33626321 |
39,66374 |
0,526489304 | |
2 |
93,32053829 |
-8,32054 |
0,089160848 | |
3 |
93,32053829 |
-24,3205 |
0,260612923 | |
4 |
87,32577993 |
-30,3258 |
0,34727179 | |
5 |
87,32577993 |
97,27422 |
1,11392329 | |
6 |
75,33626321 |
-19,3363 |
0,256666078 | |
7 |
83,12944908 |
1,870551 |
0,022501664 | |
8 |
132,2864676 |
132,7135 |
1,003228333 | |
9 |
105,9095308 |
-45,2595 |
0,427341435 | |
10 |
69,34150484 |
60,6585 |
0,874779042 | |
11 |
93,32053829 |
-47,3205 |
0,507075282 | |
12 |
75,33626321 |
39,66374 |
0,526489304 | |
13 |
108,3074342 |
-37,3474 |
0,344827984 | |
14 |
99,31529665 |
-59,8153 |
0,602276776 | |
15 |
114,9016684 |
-36,0017 |
0,313325898 | |
16 |
105,310055 |
-45,3101 |
0,430253835 | |
17 |
87,32577993 |
12,67422 |
0,14513721 | |
18 |
105,310055 |
-54,3101 |
0,51571576 | |
19 |
99,31529665 |
57,6847 |
0,580823955 | |
20 |
107,1084825 |
16,39152 |
0,153036595 | |
21 |
105,310055 |
-50,1101 |
0,475833528 | |
22 |
108,3074342 |
-12,8074 |
0,11825074 | |
23 |
101,7132 |
-44,1132 |
0,43370182 | |
24 |
96,91739331 |
-32,4174 |
0,334484783 | |
25 |
72,33888402 |
19,66112 |
0,271791807 | |
26 |
75,33626321 |
24,66374 |
0,327382004 | |
27 |
71,13993235 |
9,860068 |
0,138601026 | |
28 |
72,93835986 |
-7,93836 |
0,108836556 | |
29 |
90,92263495 |
19,07737 |
0,209819756 | |
30 |
98,11634498 |
-56,0163 |
0,570917567 | |
31 |
93,32053829 |
41,67946 |
0,446626889 | |
32 |
84,92787658 |
-45,3279 |
0,533722005 | |
33 |
93,32053829 |
-36,3205 |
0,38920198 | |
34 |
84,32840075 |
-4,3284 |
0,051327912 | |
35 |
96,91739331 |
-35,9174 |
0,370598012 | |
36 |
105,310055 |
-35,7101 |
0,339094448 | |
37 |
113,1032409 |
136,8968 |
1,210369907 | |
38 |
84,92787658 |
-20,4279 |
0,240532054 | |
39 |
87,32577993 |
37,67422 |
0,431421513 | |
40 |
111,3048134 |
40,99519 |
0,368314589 | |
Среднее значение |
41,03% |
По столбцу относительных погрешностей найдем среднее значение отн = 41,03% (с помощью функции СРЗНАЧ).
В) Для проверки значимости модели регрессии используется F-тест. Для этого выполняется сравнение и критического (табличного) значений F-критерия Фишера.
Расчетные значения приведены в таблицах 1.2, 1.3, 1.4 (обозначены буквой F).
Разнесем результаты в сводную таблицу:
Модель |
R-квадрат |
F | |
X3 |
0,715 |
28,26% |
95,313 |
X5 |
0,021 |
40,17% |
0,832 |
X6 |
0,077 |
41,03% |
3,165 |
Оценим точность построенных моделей в соответствии со схемой:
отн1 = 28,26% > 15%, отн2 = 40,17% > 15%, отн3 = 41,03% > 15%. Точность всех трех моделей неудовлетворительная. Ближе к 15% отн модели (Х3).
Проверим значимость полученных уравнений с помощью F - критерия Фишера.
F - статистики определены программой РЕГРЕССИЯ (таблицы «Дисперсионный анализ») и представлены в последнем столбце сводной таблицы.
С помощью функции FРАСПОБР найдем значение Fкр = 4,10 для уровня значимости α = 5%, и чисел степеней свободы k1 = 1, k2 = 38.
Схема проверки:
F = 95,313 > Fкр = 4,10, следовательно уравнение модели (X3) является значимой и ее использование целесообразно.
F = 0,832 < Fкр = 4,10, следовательно уравнение модели (X5) не является значимой и ее использование нецелесообразно.
F = 3,165 < Fкр = 4,10, следовательно уравнение модели (X6) не является значимой и ее использование нецелесообразно.
Зависимая переменная Y достаточно хорошо описывается включенной в модель (Х3) факторной переменной Х3.
Вывод: на основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (Х3) зависимости цены квартиры от ее общей площади. Однако эту модель нецелесообразно использовать для прогнозирования в реальных условиях, поскольку ее точность неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.
5. Для выбранной модели зависимости цены квартиры от общей площади квартиры осуществим прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения.
Рассчитаем прогнозное значение Х, по условию оно составит 80% от максимального значения.
Рассчитаем Хmax в Excel с помощью функции МАКС.
= 169,5кв.м
=0,8 *169,5 = 135,6 кв.м
Для получения прогнозных оценок зависимой переменной подставим полученное значение независимой переменной в линейное уравнение:
= -13,109+1,543*135,6 = 196,07 тыс.долл.
Определим доверительный интервал прогноза, который будет иметь следующие границы:
Для вычисления доверительного интервала для прогнозного значения рассчитываем величину отклонения от линии регрессии. Для модели парной регрессии величина отклонения рассчитывается:
, т.е. значение стандартной ошибки из таблицы 1.2.
(Так как число степеней свободы равно единице, то знаменатель будет равен n-2).
= 27,851
Для расчета коэффициента воспользуемся функцией Excel СТЬЮДРАСПОБР, вероятность возьмем равную 0,1, число степеней свободы 38.
= 1,686
По столбцу данных Х3 найдем среднее значение = 42,04 (функция СРЗНАЧ) и определим = 31068,79 (функция КВАДРОТКЛ);
U=50,72
Определим верхнюю и нижнюю границы интервала.
U+=196,50+50,72= 246,79
U-=196,50-50,72= 145,34
Таким образом, прогнозное значение = 196,07 тыс.долл., будет находиться между нижней границей, равной 145,34 тыс.долл. и верхней границей, равной 246,79 тыс.долл.
Фактические и модельные значения, точки прогноза представлены графически на рисунке 1.2.
Рисунок 1.2.
6. Используя пошаговую множественную регрессию (метод исключения), построим модель формирования цены квартиры за счёт значимых факторов.
Для построения множественной регрессии воспользуемся функцией Регрессия программы Excel, включив в нее все факторы. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.
Таблица 1.5
Регрессионная статистика | |||||
Множественный R |
0,859133222 |
||||
R-квадрат |
0,738109894 |
||||
Нормированный R-квадрат |
0,716285718 |
||||
Стандартная ошибка |
27,42723504 |
||||
Наблюдения |
40 |
||||
Дисперсионный анализ |
|||||
df |
SS |
MS |
F | ||
Регрессия |
3 |
76325,3 |
25441,77 |
33,82075 | |
Остаток |
36 |
27081,12 |
752,2532 |
||
Итого |
39 |
103406,4 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | ||
Y-пересечение |
14,03808781 |
19,14992 |
0,733062 |
0,468267 | |
X3 (общая площадь квартиры) |
1,696055642 |
0,178063 |
9,525005 |
2,24E-11 | |
X5 (этаж квартиры) |
0,083714215 |
1,208402 |
0,069277 |
0,945153 | |
X6(площадь кухни) |
-3,814797999 |
2,255565 |
-1,69128 |
0,099424 |