Автор работы: Пользователь скрыл имя, 18 Декабря 2010 в 00:41, курсовая работа
Целью работы является построение и исследование адекватной модели, отражающей влияние данного набора факторов на значение результативного признака цены предложения таунхаусов в Подмосковье в 2009 году.
Продажа таунхаусов в Подмосковье очень популярное направление на рынке загородной недвижимости, что неудивительно, ведь это один из наиболее современных типов загородных домов. Объектом исследования выбрана совокупность из 50 таунхаусов в разных направлениях от Москвы. В качестве основного метода рассматривается регрессионный анализ. Для определения оценок параметров эконометрической модели, проведение тестов, определяющих значимость найденных оценок и модели в целом, используется пакет MS Excel и STATISTICA_61_RU.
1.Введение…………………………………………………….....3
2.Описание предметной области………………………………4
3.Постановка задачи…………………………………………….9
4.Моделирование……………………………………………......9
5.Проверка выполнения предпосылок МНК………………...20
6.Эластичность и ошибка аппроксимации……………...…...23
7.Интерпретация окончательной модели………..…..............24
8.Заключение………………………….……………………….26
9.Список использованной литературы……………………….27
Проверим факторы на вариативность, мультиколлинеарность. Построим линейную модель, проверим её на значимость уравнения и значимость параметров уравнения регрессии.
Вариация
– это изменение значения признака
у отдельных единиц совокупности.
Считается, что если коэффициент вариации
больше 35%, то выборка неоднородна.
В нашем случае сильно варьирующими являются такие факторы, как:
- количество этажей
- площадь строения
- площадь участка
- загрязненность воздуха.
Для того чтобы определить коррелированность факторов, находят матрицу парных коэффициентов корреляции. Считается, что связь достаточно сильная, если коэффициент по абсолютной величине превышает 0,7, и слабая, если он менее 0,3. (Если парный коэффициент корреляции по модулю больше 0,7, то факторы коррелированны между собой.)
Таблица 3.3 Матрица парных коэффициентов корреляции
Значимость
уравнения множественной
F= ;
где n – объем выборки,
m – число параметров в уравнениях,
R2 – коэффициент детерминации,
(n-m-1) – число степеней свободы.
Оценка значимости параметров линейной регрессии основана на определение стандартной ошибки по каждому параметру. Принято стандартные ошибки обозначать mb; ma.
Значимость параметров парной линейной регрессии определяются путем проверки статистической гипотезы. В качестве критерия используется t критерий Стьюдента. Наблюдаемые значения t критерия находятся следующим образом:
Затем
наблюдаемые значения сравнивают с
табличными значениями t критерием. Табличные
значения находят, используя заданное
число уровней значимости
и число степеней свободы (n-2).
Теснота линейной взаимосвязи между переменной y и рядом переменных xi, рассматриваемых в целом, может быть определена с помощью коэффициента множественной корреляции. С помощью множественного коэффициента (по мере приближения R к 1) делается вывод о тесноте взаимосвязи. Величина R2, называемая множественным коэффициентом детерминации, показывает, какую долю вариации исследуемой переменной (y) объясняет вариация остальных учтенных переменных (x, z).
В данной линейной модели 4 фактора оказались
сильно варьирующими. Для того чтобы избавиться
от вариативности, преобразуем факторы
на значения квадратных корней. И получаем
следующие вариации после преобразования:
Факторы | Вариация |
Количество этажей | 0,219463 |
Отдаленность от Москвы | 0,078833 |
Отдаленность от МКАД | 0,158238 |
Площадь строения | 0,215933 |
Площадь участка | 0,202481 |
Загрязненность воздуха | 0,189235 |
Все вариации меньше 0,35, это говорит об однородности выборки.
Рассмотрим теперь коррелированность факторов линейной модели, преобразованных.
Таблица 3.6 Матрица парных коэффициентов корреляции
В матрице парных коэффициентов корреляции присутствует коррелированные факторы – площадь строения и количество этажей. От коррелированности факторов можно избавиться путем объединения этих факторов. Объединим факторы площадь строения и количество этажей. Для этого находим отношение первого фактора ко второму, и получаем цену за квадратный метр на этаж. В дальнейшем вместо фактора цены будет использоваться фактор цена за квадратный метр на этаж.
Таким образом, для исследования модели у нас остается 4 фактора.
Рассмотрим для этих 4 факторов следующие модели:
- линейную;
- логарифмическую;
- полулогарифмическую;
- экспоненциальную по данным полулогарифмической модели;
- экспоненциальную по данным логарифмической модели;
- экспоненциальную по данным линейной модели.
И получаем для них следующие показатели:
Модели | Вариативность факторов | R2 | Коррелированность факторов |
Линейная | Сильно варьирующие факторы отсутствуют | 0,055094 | Мультиколлиниарность отсутствует |
Логарифмическая | Сильно варьируют
площадь участка и |
0,043556 | Мультиколлиниарность отсутствует |
Полулогарифмическая | Сильно варьирующие факторы отсутствуют | 0,051402 | Мультиколлиниарность отсутствует |
Экспоненциальная по полулог. модели | Сильно варьирует отдаленность от Москвы | 0,063639 | Мультиколлиниарность отсутствует |
Экспоненциальная по лог. модели | Сильно варьирующие факторы отсутствуют | 0,048754 | Мультиколлиниарность отсутствует |
Экспоненциальная по линейной модели | Сильно варьирующие факторы отсутствуют | 0,049562 | Мультиколлиниарность отсутствует |
Факторы | P-Значение | |||||
Линейная | Лог. | Полулог. | Эксп. по полулог. | Эксп. по лог. | Эксп. по лин. | |
Отдаленность от Москвы | 0,000266 | 6,83E-08 | 1,04E-10 | 2,91473E-20 | 0,000411 | 0,076724 |
Отдаленность от МКАД | 0,739329 | 0,729842 | 0,723729 | 0,569707477 | 0,733346 | 0,619313 |
Площадь участка | 0,999681 | 0,950482 | 0,892477 | 0,889027072 | 0,970336 | 0,230403 |
Загрязненность воздуха | 0,167824 | 0,221457 | 0,190294 | 0,166303642 | 0,194912 | 0,519178 |
При уровне значимости 0,05, все рассматриваемые модели являются не значимыми.
По этой причине используем кластерный анализ, который разделит исходную выборку из 50 переменных с 6 факторами на 2 выборки.
Получаем 2 выборки.
Особый интерес представляет второй кластер, он занимает 90% на рынке. В дальнейшим будем использовать модель, построенную для второго кластера. Построим по этим данным 3 модели:
- линейную;
- логарифмическую;
- экспоненциальную.
Построив линейную модель, мы получаем высокую вариативность факторов, по этой причине преобразуем значения факторов переходя к корням: И, исходя из этого, построим остальные модели, получим следующие показатели:
Модели | Вариативность факторов | R2 | Коррелированность факторов |
Линейная | Сильно
варьирующие факторы |
0,867274 | Сильно
коррелированные факторы |
Логарифмическая | Сильно варьирующими факторами являются площадь участка и загрязненность воздуха | 0,848004 | Сильно
коррелированные факторы |
Экспоненциальная по лог. модели | Сильно
варьирующие факторы |
0,85615495 | Сильно
коррелированные факторы |
Таблица 3.11 P – Значения параметров при факторах в модели
Факторы | P-Значение | ||
Линейная | Логарифмическая | Экспоненциальная | |
Количество этажей | 3,74929E-10 | 2,32E-07 | 1,65444E-08 |
Отдаленность от Москвы | 0,042511694 | 0,0317 | 0,03438359 |
Отдаленность от МКАД | 0,635523487 | 0,368258 | 0,491828437 |
Площадь строения | 8,29359E-08 | 5,31E-09 | 1,56341E-08 |
Площадь участка | 0,045825363 | 0,130262 | 0,089705056 |
Загрязненность воздуха | 0,227502734 | 0,154519 | 0,186986331 |