Автор работы: Пользователь скрыл имя, 15 Февраля 2013 в 15:44, контрольная работа
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х..
Задача 1. Вариант 5
Эконометрическое моделирование стоимости квартир в Московской области
Даны следующие исходные данные:
Y-цена квартиры, тыс. руб. |
X3 (общая площадь квартиры) |
X5 (этаж квартиры) |
X6(площадь кухни) |
115 |
70,4 |
9 |
7 |
85 |
82,8 |
5 |
10 |
69 |
64,5 |
6 |
10 |
57 |
55,1 |
1 |
9 |
184,6 |
83,9 |
1 |
9 |
56 |
32,2 |
2 |
7 |
85 |
65 |
12 |
8,3 |
265 |
169,5 |
10 |
16,5 |
60,65 |
74 |
11 |
12,1 |
130 |
87 |
6 |
6 |
46 |
44 |
2 |
10 |
115 |
60 |
2 |
7 |
70,96 |
65,7 |
5 |
12,5 |
39,5 |
42 |
7 |
11 |
78,9 |
49,3 |
14 |
13,6 |
60 |
64,5 |
11 |
12 |
100 |
93,8 |
1 |
9 |
51 |
64 |
6 |
12 |
157 |
98 |
2 |
11 |
123,5 |
107,5 |
12 |
12,3 |
55,2 |
48 |
9 |
12 |
95,5 |
80 |
6 |
12,5 |
57,6 |
63,9 |
5 |
11,4 |
64,5 |
58,1 |
10 |
10,6 |
92 |
83 |
9 |
6,5 |
100 |
73,4 |
2 |
7 |
81 |
45,5 |
3 |
6,3 |
65 |
32 |
5 |
6,6 |
110 |
65,2 |
10 |
9,6 |
42,1 |
40,3 |
13 |
10,8 |
135 |
72 |
12 |
10 |
39,6 |
36 |
5 |
8,6 |
57 |
61,6 |
8 |
10 |
80 |
35,5 |
4 |
8,5 |
61 |
58,1 |
10 |
10,6 |
69,6 |
83 |
4 |
12 |
250 |
152 |
15 |
13,3 |
64,5 |
64,5 |
12 |
8,6 |
125 |
54 |
8 |
9 |
152,3 |
89 |
7 |
13 |
Решение:
При решении данной задачи расчеты и построение графиков и диаграмм будем вести с использованием настройки Excel Анализ данных.
1. Рассчитаем матрицу парных коэффициентов корреляции и оценим статистическую значимость коэффициентов корреляции.
Чтобы рассчитать матрицу парных коэффициентов корреляции скопируем таблицу с исходными данными в Excel. Далее воспользуемся инструментом Корреляция, входящим в настойку Анализ данных.
В диалоговом окне Корреляция в поле Входной интервал вводим диапазон ячеек, содержащих исходные данные. Так как мы выделили и заголовки столбцов, то устанавливаем флажок Метки в первой строке.
Получили следующие результаты:
Таблица 1.1. Матрица парных коэффициентов корреляции:
Y-цена квартиры, тыс. руб. |
X3 (общая площадь квартиры) |
X5 (этаж квартиры) |
X6(площадь кухни) | |
Y-цена квартиры, тыс. руб. |
1 |
|||
X3 (общая площадь квартиры) |
0,845551302 |
1 |
||
X5 (этаж квартиры) |
0,146382617 |
0,228859567 |
1 |
|
X6(площадь кухни) |
0,277274009 |
0,485159132 |
0,413008439 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная Y, т.е. цена квартиры имеет более тесную связь с Х3 (общая площадь квартиры). Коэффициент корреляции равен 0,845.Это означает, что на 84,5 зависимая переменная Y (цена квартиры) зависит от показателя Х4 общая площадь квартиры. Также зависимая переменная Y (цена квартиры) имеет среднюю связь с Х6 (площадь кухни) и слабую связь с Х5 (этаж квартиры).
Статистическая значимость коэффициентов корреляции определим с помощью t-критерия Стьюдента. Табличное значение сравниваем с расчетными значениями.
Для каждого коэффициента r(Y, Xj) вычислим t-статистику по формуле t = и занесем результаты расчетов в корреляционную таблицу:
Y-цена квартиры, тыс. руб. |
X3 (общая площадь квартиры) |
X5 (этаж квартиры) |
X6(площадь кухни) |
Критерий Стьюдента | |
Y-цена квартиры, тыс. руб. |
1 |
||||
X3 (общая площадь квартиры) |
0,845551302 |
1 |
9,762849051 | ||
X5 (этаж квартиры) |
0,146382617 |
0,228859567 |
1 |
0,912189112 | |
X6(площадь кухни) |
0,277274009 |
0,485159132 |
0,413008439 |
1 |
1,77898418 |
Вычислим табличное значение с помощью функции СТЬЮДРАСПОБР.
tтабл.= 2,024 при доверительной вероятности равной 0,95 и степенью свободы (n-2)
Статистическим значимым является фактор Х3.
2. Построим поле корреляции результативного признака (стоимости квартиры) и наиболее тесно связанного с ним фактора (жилой площади квартиры).
Для этого воспользуемся инструментом построения точечной диаграммы программы Excel.
В результате получаем поле корреляции цены квартиры, тыс. долл. и жилой площади квартиры, кв.м. (рисунок 1.1.)
Рисунок 1.1.
3. Рассчитаем параметры линейной парной регрессии для каждого фактора Х.
Для расчета параметров линейной парной регрессии воспользуемся инструментом Регрессия, входящим в настойку Анализ данных.
В диалоговом окне Регрессия в поле Входной интервал Y вводим адрес диапазона ячеек, которые представляет зависимую переменную, т.е. стоимость квартир. В поле Входной интервал Х вводим адрес диапазона, который содержит значения независимых переменных. Выполним поочередно вычисления параметры парной регрессии для каждого фактора.
Для Х3 получили следующие данные, представленные в таблице 1.2:
Таблица 1.2
Регрессионная статистика |
||||
Множественный R |
0,845551 |
|||
R-квадрат |
0,714957 |
|||
Нормированный R-квадрат |
0,707456 |
|||
Стандартная ошибка |
27,85076 |
|||
Наблюдения |
40 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
73931,14 |
73931,14 |
95,31322 |
Остаток |
38 |
29475,27 |
775,6651 |
|
Итого |
39 |
103406,4 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
-13,1088 |
11,7886 |
-1,11199 |
0,273128 |
X3 (общая площадь квартиры) |
1,542594 |
0,158007 |
9,762849 |
6,62E-12 |
Уравнение регрессии зависимости цены квартиры от общей площади квартиры имеет вид:
Y3=-13,109+1,543*X3
Для Х5 получили следующие данные, представленные в таблице 1.3:
Таблица 1.3
Регрессионная статистика |
||||
Множественный R |
0,146383 |
|||
R-квадрат |
0,021428 |
|||
Нормированный R-квадрат |
-0,00432 |
|||
Стандартная ошибка |
51,6034 |
|||
Наблюдения |
40 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
2215,779 |
2215,779 |
0,832089 |
Остаток |
38 |
101190,6 |
2662,911 |
|
Итого |
39 |
103406,4 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
80,34288 |
16,71508 |
4,806612 |
2,42E-05 |
X5 (этаж квартиры) |
1,88757 |
2,069274 |
0,912189 |
0,36742 |
Уравнение регрессии зависимости цены квартиры от этажа квартиры имеет вид:
Y5=80,343+1,888*X5
Для Х6 получили следующие данные, представленные в таблице 1.4:
Таблица 1.4
Регрессионная статистика |
||||
Множественный R |
0,277274 |
|||
R-квадрат |
0,076881 |
|||
Нормированный R-квадрат |
0,052588 |
|||
Стандартная ошибка |
50,11997 |
|||
Наблюдения |
40 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
7949,975 |
7949,975 |
3,164785 |
Остаток |
38 |
95456,44 |
2512,011 |
|
Итого |
39 |
103406,4 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
33,37295 |
34,79737 |
0,959065 |
0,343589 |
X6(площадь кухни) |
5,994758 |
3,369765 |
1,778984 |
0,083243 |
Уравнение регрессии зависимости цены квартиры от площади кухни имеет вид:
Y6=33,373+5,995*X6
4. Оценим качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Установим, какая модель является лучшей.
Коэффициент детерминации, среднюю ошибку аппроксимации мы получили в результате расчетов, проведенных в пункте 3.
А) Коэффициент детерминации определяет, какая доля вариации признака У учтена в модели и обусловлена влиянием не него фактора Х. Чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели