Построение эконометрической модели для оценки средней стоимости таунхаусов в Подмосковье

Автор работы: Пользователь скрыл имя, 18 Декабря 2010 в 00:41, курсовая работа

Краткое описание

Целью работы является построение и исследование адекватной модели, отражающей влияние данного набора факторов на значение результативного признака цены предложения таунхаусов в Подмосковье в 2009 году.

Продажа таунхаусов в Подмосковье очень популярное направление на рынке загородной недвижимости, что неудивительно, ведь это один из наиболее современных типов загородных домов. Объектом исследования выбрана совокупность из 50 таунхаусов в разных направлениях от Москвы. В качестве основного метода рассматривается регрессионный анализ. Для определения оценок параметров эконометрической модели, проведение тестов, определяющих значимость найденных оценок и модели в целом, используется пакет MS Excel и STATISTICA_61_RU.

Содержание работы

1.Введение…………………………………………………….....3
2.Описание предметной области………………………………4
3.Постановка задачи…………………………………………….9
4.Моделирование……………………………………………......9
5.Проверка выполнения предпосылок МНК………………...20
6.Эластичность и ошибка аппроксимации……………...…...23
7.Интерпретация окончательной модели………..…..............24
8.Заключение………………………….……………………….26
9.Список использованной литературы……………………….27

Содержимое работы - 1 файл

Курсовая по эконометрике.doc

— 274.50 Кб (Скачать файл)

                                        Таблица 3.1 Исходные данные линейной модели

     Проверим факторы на вариативность, мультиколлинеарность. Построим линейную модель, проверим её на значимость уравнения и значимость параметров уравнения регрессии.

     Вариация  – это изменение значения признака у отдельных единиц совокупности. Считается, что если коэффициент вариации больше 35%, то выборка неоднородна. 

                                                         Таблица 3.2 Вариативность признаков

     В нашем случае сильно варьирующими являются такие факторы, как:

      - количество этажей

      - площадь строения

      - площадь участка

      - загрязненность воздуха.

     Для того чтобы определить коррелированность факторов, находят матрицу парных коэффициентов корреляции. Считается, что связь достаточно сильная, если коэффициент по абсолютной величине превышает 0,7, и слабая, если он менее 0,3. (Если парный коэффициент корреляции по модулю больше 0,7, то факторы коррелированны между собой.)

                   Таблица 3.3 Матрица парных коэффициентов корреляции 

     Значимость  уравнения множественной регрессии  оценивается с помощью F-критерия Фишера:

     F= ;

     где n – объем выборки,

           m – число параметров в уравнениях,

           R2 – коэффициент детерминации,

           (n-m-1) – число степеней свободы.

     Оценка  значимости параметров линейной регрессии  основана на определение стандартной  ошибки по каждому параметру. Принято стандартные ошибки обозначать mb; ma.

     

     

     Значимость  параметров парной линейной регрессии  определяются путем проверки статистической гипотезы. В качестве критерия используется t критерий Стьюдента. Наблюдаемые значения t критерия находятся следующим образом:

     

     

     Затем наблюдаемые значения сравнивают с  табличными значениями t критерием. Табличные значения находят, используя заданное число уровней значимости и число степеней свободы (n-2). 
 
 
 
 
 
 
 
 
 
 

                                                                                       Таблица 3.4 Регрессия

      Теснота линейной взаимосвязи между переменной y и  рядом переменных xi, рассматриваемых в целом, может быть определена с помощью коэффициента множественной корреляции. С помощью множественного коэффициента (по мере приближения R к 1) делается вывод о тесноте взаимосвязи. Величина R2, называемая множественным коэффициентом детерминации, показывает, какую долю вариации исследуемой переменной (y) объясняет вариация остальных учтенных переменных (x, z).

         В данной линейной модели 4 фактора оказались сильно варьирующими. Для того чтобы избавиться от вариативности, преобразуем факторы на значения квадратных корней. И получаем следующие вариации после преобразования: 
 
 
 

                                                                     Таблица 3.5 Вариации факторов

               Факторы      Вариация
               Количество  этажей      0,219463
               Отдаленность  от Москвы      0,078833
               Отдаленность  от МКАД      0,158238
               Площадь строения      0,215933
               Площадь участка      0,202481
               Загрязненность  воздуха      0,189235

     Все вариации меньше 0,35, это говорит об однородности выборки.

     Рассмотрим  теперь коррелированность факторов линейной модели, преобразованных.

                     Таблица 3.6 Матрица парных коэффициентов корреляции

     

     В матрице парных коэффициентов корреляции присутствует коррелированные факторы – площадь строения и количество этажей. От коррелированности факторов можно избавиться путем объединения этих факторов. Объединим факторы площадь строения и количество этажей. Для этого находим отношение первого фактора ко второму, и получаем цену за квадратный метр на этаж. В дальнейшем вместо фактора цены будет использоваться фактор цена за квадратный метр на этаж.

     Таким образом, для исследования модели у нас остается 4 фактора.

       Рассмотрим для этих 4 факторов  следующие модели:

      - линейную;

      - логарифмическую;

      - полулогарифмическую;

      - экспоненциальную по данным  полулогарифмической модели;

      - экспоненциальную по данным  логарифмической модели;

      - экспоненциальную по данным  линейной модели.

     И получаем для них следующие показатели:

                                                                      Таблица 3.7 Сравнение моделей

     
Модели Вариативность факторов R2 Коррелированность факторов
Линейная Сильно варьирующие  факторы отсутствуют 0,055094 Мультиколлиниарность  отсутствует
Логарифмическая Сильно варьируют  площадь участка и загрязненность воздуха 0,043556 Мультиколлиниарность  отсутствует
Полулогарифмическая Сильно варьирующие  факторы отсутствуют 0,051402 Мультиколлиниарность  отсутствует
Экспоненциальная  по полулог. модели Сильно варьирует  отдаленность от Москвы 0,063639 Мультиколлиниарность  отсутствует
Экспоненциальная  по лог. модели Сильно варьирующие  факторы отсутствуют 0,048754 Мультиколлиниарность отсутствует
Экспоненциальная  по линейной модели Сильно варьирующие  факторы отсутствуют 0,049562 Мультиколлиниарность  отсутствует
 
 
 
 
 
 
 
 

                                                               Таблица 3.8. P – Значение факторов

     
Факторы P-Значение
Линейная Лог. Полулог. Эксп. по полулог. Эксп. по лог. Эксп. по лин.
Отдаленность  от Москвы 0,000266 6,83E-08 1,04E-10 2,91473E-20 0,000411 0,076724
Отдаленность  от МКАД 0,739329 0,729842 0,723729 0,569707477 0,733346 0,619313
Площадь участка 0,999681 0,950482 0,892477 0,889027072 0,970336 0,230403
Загрязненность  воздуха 0,167824 0,221457 0,190294 0,166303642 0,194912 0,519178
 

     При уровне значимости 0,05, все рассматриваемые модели являются не значимыми.

     По  этой причине используем кластерный анализ, который разделит исходную выборку из 50 переменных с 6 факторами на 2 выборки.

     Получаем 2 выборки.

                                                              Таблица 3.9 Данные новых выборок

       

       

     Особый  интерес представляет второй кластер, он занимает 90% на рынке. В дальнейшим будем использовать модель, построенную для второго кластера. Построим по этим данным 3 модели:

      - линейную;

      - логарифмическую;

      - экспоненциальную.

     Построив  линейную модель, мы получаем высокую  вариативность факторов, по этой причине преобразуем значения факторов переходя к корням: И, исходя из этого, построим остальные модели, получим следующие показатели:

                                                               Таблица 3.10 Сравнение 3х моделей

     Модели            Вариативность факторов      R2      Коррелированность факторов
     Линейная      Сильно  варьирующие факторы отсутствуют      0,867274      Сильно  коррелированные факторы отсутствуют
     Логарифмическая      Сильно  варьирующими факторами являются площадь  участка и загрязненность воздуха      0,848004            Сильно  коррелированные факторы отсутствуют
     Экспоненциальная  по лог. модели      Сильно  варьирующие факторы отсутствуют      0,85615495            Сильно  коррелированные факторы отсутствуют

              Таблица 3.11 P – Значения параметров при факторах в модели

     
Факторы P-Значение
Линейная Логарифмическая Экспоненциальная
Количество  этажей 3,74929E-10 2,32E-07 1,65444E-08
Отдаленность  от Москвы 0,042511694 0,0317 0,03438359
Отдаленность  от МКАД 0,635523487 0,368258 0,491828437
Площадь строения 8,29359E-08 5,31E-09 1,56341E-08
Площадь участка 0,045825363 0,130262 0,089705056
Загрязненность  воздуха 0,227502734 0,154519 0,186986331

Информация о работе Построение эконометрической модели для оценки средней стоимости таунхаусов в Подмосковье