Автор работы: Пользователь скрыл имя, 15 Февраля 2013 в 15:44, контрольная работа
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х..
Получаем модель вида:
Y=14,038+1,696*X3+0,084*X5-3,
Поскольку < (4,10 < 33,821), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно 0,069, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36: =1,688.
Поскольку 0,069 < 1,688 модель следует признать не адекватной.
Поскольку фактор X5 статистически не значим, то построим модель с учетом только факторов Х3 и Х6.
Таблица 1.6
Регрессионная статистика |
||||
Множественный R |
0,859112903 |
|||
R-квадрат |
0,73807498 |
|||
Нормированный R-квадрат |
0,723916871 |
|||
Стандартная ошибка |
27,05586127 |
|||
Наблюдения |
40 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
2 |
76321,68 |
38160,84242 |
52,1309 |
Остаток |
37 |
27084,73 |
732,0196288 |
|
Итого |
39 |
103406,4 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
14,04035138 |
18,8906 |
0,743245502 |
0,462027 |
X6(площадь кухни) |
-3,759364352 |
2,080306 |
-1,807121155 |
0,07888 |
X3 (общая площадь квартиры) |
1,696496871 |
0,17554 |
9,664443592 |
1,15E-11 |
Получаем модель вида:
Y=14,040+1,696*X3-3,759*X6
Поскольку < (4,10 < 52,131), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно 1,807, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36: =1,688.
Поскольку 1,807 > 1,688 модель следует признать адекватной.
Коэффициент парной корреляции независимых переменных X3 (общая площадь квартиры) и X6 (площадь кухни) меньше 0,8 (см. табл. 1.1.) в исходных данных отсутствует мультиколлинеарность.
7. Оцените качество построенной модели.
Для оценки качества выбранной множественной модели YТ = 14,040+1,696*X3-3,759*X6 аналогично п.4 данной задачи используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F - критерий Фишера.
Коэффициент детерминации R-квадрат выпишем из итогов РЕГРЕССИИ (таблица «Регрессионная статистика» для модели).
R2 = 0,738, следовательно, вариация цены квартиры Y на 73,8% объясняется по данному уравнению вариацией общей площади квартиры Х3 и площади кухни Х6.
Используем исходные данные Yi и найденные программой РЕГРЕССИЯ остатки Еi (таблица «Вывод остатка» для модели). Рассчитаем относительные погрешности и найдем среднее значение отн.
Наблюдение |
Предсказанное Y-цена квартиры, тыс. руб. |
Остатки |
Относительный остаток |
1 |
107,1581806 |
7,841819 |
0,073179848 |
2 |
116,9166488 |
-31,9166 |
0,272986346 |
3 |
85,87075602 |
-16,8708 |
0,196466839 |
4 |
73,68304979 |
-16,683 |
0,226416385 |
5 |
122,5421597 |
62,05784 |
0,506420325 |
6 |
42,35200015 |
13,648 |
0,322251601 |
7 |
93,10992385 |
-8,10992 |
0,087100531 |
8 |
239,5670592 |
25,43294 |
0,106162095 |
9 |
94,09281115 |
-33,4428 |
0,355423658 |
10 |
139,079393 |
-9,07939 |
0,065282087 |
11 |
51,09257017 |
-5,09257 |
0,0996734 |
12 |
89,51461316 |
25,48539 |
0,28470644 |
13 |
78,50814138 |
-7,54814 |
0,096144696 |
14 |
43,94021208 |
-4,44021 |
0,101051221 |
15 |
46,55029192 |
32,34971 |
0,694941036 |
16 |
78,35202732 |
-18,352 |
0,234225303 |
17 |
139,3374787 |
-39,3375 |
0,282318003 |
18 |
77,50377888 |
-26,5038 |
0,341967569 |
19 |
138,9440368 |
18,05596 |
0,129951336 |
20 |
150,1735835 |
-26,6736 |
0,177618346 |
21 |
50,35982895 |
4,840171 |
0,096111745 |
22 |
102,7680466 |
-7,26805 |
0,070722826 |
23 |
79,5897478 |
-21,9897 |
0,276288698 |
24 |
72,75755744 |
-8,25756 |
0,113494154 |
25 |
130,4137234 |
-38,4137 |
0,294552769 |
26 |
112,2476712 |
-12,2477 |
0,10911292 |
27 |
67,54696358 |
13,45304 |
0,199165672 |
28 |
43,51644652 |
21,48355 |
0,493688139 |
29 |
88,56204957 |
21,43795 |
0,242067009 |
30 |
41,80804027 |
0,29196 |
0,006983339 |
31 |
98,59448255 |
36,40552 |
0,369244977 |
32 |
42,7837053 |
-3,18371 |
0,074413968 |
33 |
80,9509151 |
-23,9509 |
0,295869603 |
34 |
42,3113933 |
37,68861 |
0,890743693 |
35 |
72,75755744 |
-11,7576 |
0,161599122 |
36 |
109,7372194 |
-40,1372 |
0,365757576 |
37 |
221,9083298 |
28,09167 |
0,126591328 |
38 |
91,13386611 |
-26,6339 |
0,292249931 |
39 |
71,81690323 |
53,1831 |
0,740537316 |
40 |
116,1568363 |
36,14316 |
0,3111583 |
25,46% |
По столбцу относительных погрешностей найдем среднее значение отн = 25,46% (с помощью функции СРЗНАЧ).
Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.
С помощью F - критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов РЕГРЕССИИ (таблица «дисперсионный анализ» для модели ) F = 52,131.
С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F = 61,01 > Fкр = 3,25, следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель факторными переменными Х3 и Х6.
Дополнительно с помощью t - критерия Стьюдента проверим значимость отдельных коэффициентов модели.
t - статистики для коэффициентов уравнения регрессии приведены в итогах программы РЕГРЕССИЯ. Для выбранной модели получены следующие значения (табл. 1.6).
Критическое значение tкр найдено для уровня значимости α = 5% и числа степеней свободы k = 40 - 2 - 1 = 37. tкр = 2,03 (функция СТЬЮДРАСПОБР).
Для свободного коэффициента a= 14,04 определена статистика t(a) = 0,74.
|t(a)| = 0,74 < tкр = 2,03, следовательно, свободный коэффициент a не является значимым, его можно исключить из модели.
Для коэффициента регрессии
b1 = -3,76 определена статистика
t(b1)= -1,81.
|t(b1)| = 1,81 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор можно исключить из модели.
Для коэффициента регрессии b2=1,696 определена статистика t(b2)= 9,66.
|t(b2)| = 9,66 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор общей площади квартиры нужно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости α = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,46 = 46%; коэффициент регрессии b1 - на уровне 0,08 = 8%;, а коэффициент регрессии b2 - на уровне 1,15E-11 = 0,0000000000115 = 0,0000000001%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества однофакторной и выбранной множественной модели используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
Y3=-13,109+1,542*X3 |
0,707456 |
Y=14,040+1,696*X3-3,759*X6 |
0,723916 |
Таким образом, при добавлении в уравнение регрессии фактора Х6 качество модели улучшилось, что говорит в пользу сохранения фактора Х6 в модели.
Средние коэффициенты эластичности в случае линейной модели определяются формулами Эj = bj * .
С помощью функции СРЗНАЧ найдем: = 69,208, = 10,055, = 93,65. Тогда Э3 = 1,25, Э6 = -0,40 .
Следовательно, при изменении общей площади на 1% цена квартиры увеличится в среднем на 1,25%.
Увеличение площади кухни на 1% приводит к уменьшению цены квартиры в среднем на 0,40%.
Бета-коэффициенты определяются формулами βj = bj * .
С помощью функции СТАНДОТКЛОН найдем SX3 = 28,224; SX6 = 2,382; SY = 51,492. Тогда
β3= 0,930 β6= -0,174
Таким образом, при увеличении только фактора Х3 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,93 своего стандартного отклонения SY, а при увеличении только фактора Х6 на одно его стандартное отклонение - уменьшается на 0,174 SY.
Дельта-коэффициенты определяются формулами Δj = βj * .
Коэффициенты парной корреляции r(Y, X3) = 0,846, и r(Y, X6) = 0,277 найдены с помощью программы КОРРЕЛЯЦИЯ. Коэффициент детерминации R2 = 0,738 определен для рассматриваемой двухфакторной модели программой РЕГРЕССИЯ.
Вычислим дельта-коэффициенты:
Δ3 = 1,065; Δ6 =-0,065.
Поскольку Δ6 < 0, то факторная переменная Х6 выбрана неудачно и ее нужно исключить из модели.
Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y (цены квартиры) на 100% объясняется воздействием фактора Х3 (общей площадью квартиры).
Список литературы