Составление прогноза цен однокомнатных квартир в городе Набережные Челны

Автор работы: Пользователь скрыл имя, 25 Ноября 2011 в 10:05, курсовая работа

Краткое описание

Тема данной курсовой работы является составление прогноза цен однокомнатных квартир в городе Набережные Челны. Например, агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных футах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома. Как только эта информация собрана для различных домов, было бы интересно посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой он был продан. Например, могло бы оказаться, что число спальных комнат является лучшим предсказывающим фактором (предиктором) для цены продажи дома в некотором специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы дороже, учитывая их расположение и характеристики.

Содержание работы

Содержание 2
Введение 3
1.Теоретические сведения 5
1.1 Множественная регрессия 5
1.2 Регрессионный анализ 5
1.3 Классическая линейная модель множественной регрессии 8
1.4 Оценка параметров классической модели множественной регрессии методом наименьших квадратов 12
2. Отбор и анализ факторных признаков, включаемых в модель множественной регрессии 16
2.1Корреляционный анализ 17
2.2 Частные коэффициенты корреляции 18
2.3 Коэффициент корреляции совокупного воздействия 18
2.4 Оценка значимости параметров уравнения линейной регрессии 19
3.Исходные данные 21
4.Результаты анализа 23
5.Анализ полученных данных 29
6.Заключение 30
7.Список использованной литературы 31

Содержимое работы - 1 файл

курсовая готовая.doc

— 599.50 Кб (Скачать файл)

,

где – диагональный элемент обратной матрицы , – остаточная дисперсия, характеризующая степень рассеяния фактических значений относительно расчетных значений : ( – число наблюдений, – число параметров, – число степеней свободы).

      Критическое значение находится по таблице: .

      Если  , то нулевая гипотеза принимается. Если , то нулевая гипотеза отвергается: .

 
 
 
 

3.Исходные данные

     На  основе проведенного анализа изучаемой  предметной области, а именно экономического содержания и сущности продаж однокомнатных квартир, были выделены следующие факторы:

  • цена за квартиру (рублей);
  • район города
  • этаж
  • общая площадь квартиры (м2.);
  • жилая площадь квартиры (м2.);
  • площадь кухни (м2.);
  • наличие телефона ;
  • наличие балкона ;

    Таким образом, для анализа предметной области были выбраны факторы, указанные  в таблице

Исходные  данные

  цена  за квартиру район города этаж Общая площадь  квартиры (м2) Жилая площадь  квартиры (м2) площадь кухни  квартиры (м2) наличие телефона наличие балкона
    y x1 x2 x3 x4 x5 x6 x7
янв.07 1 975 1 1 33 19 6 1 0
фев.07 2 1250 1 1 30 16 6,5 1 1
мар.07 3 1350 1 1 38,74 18,64 10 0 1
апр.07 4 1070 1 1 30 16 6 1 1
май.07 5 1330 3 5 29 16 6 0 1
июн.07 6 1250 4 3 39 21 8 0 0
июл.07 7 1150 4 4 30 16 6,5 1 1
авг.07 8 1270 4 2 35 19 10 1 1
сен.07 9 1175 4 5 36 17 9 1 0
окт.07 10 1200 4 4 30 17 6,3 0 1
ноя.07 11 1365 4 3 36 15 9,4 1 1
дек.07 12 1150 4 1 36 19 9 1 1
янв.08 13 1200 4 2 29 16 6 1 0
фев.08 14 1200 4 3 35,5 18,5 8 1 0
мар.08 15 1700 4 16 47,5 18 16 1 1
апр.08 16 1150 2 1 30 16 6,5 0 0
май.08 17 1220 2 5 46 28 10 1 1
июн.08 18 1180 3 5 33 20 6 1 1
июл.08 19 990 1 5 30 17 6 1 1
авг.08 20 980 1 7 37 20 8,5 1 1
сен.08 21 800 1 5 28 14 6 0 1
окт.08 22 870 1 7 30 13 9 1 1
ноя.08 23 1580 3 3 44,1 25,8 8 0 1
дек.08 24 1000 3 5 30 16 6 0 1
янв.09 25 1410 4 8 36 17 9 1 1
фев.09 26 1550 4 5 40 17 10 1 1
мар.09 27 1320 4 1 33 19 6 1 1
апр.09 28 1200 4 9 32 16 8 0 1
май.09 29 1190 4 4 30 16 6 1 1
июн.09 30 1180 5 4 29 15,5 6 1 1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

4.Результаты анализа

Проведение  многомерного линейного  корреляционного  анализа

 

    

    Multiple R - коэффициент множественной корреляции;

    Характеризует тесноту линейной связи между  зависимой и всеми независимыми переменными. Может принимать значения от 0 до 1. Так как =0,832842>0.7 то связь тесная.

    R? - коэффициент детерминации;

    Численно  выражает долю вариации зависимой переменной, объясненную с помощью регрессионного уравнения. Чем больше R2, тем большую долю вариации объясняют переменные, включенные в модель. Так как =0,693627, то 69,3% изменчивости переменной у можно объяснить изменчивостью переменных х1,х2,х3,х4,х5,х6,х7.

    adjusted R? - скорректированный коэффициент детерминации;

    Скорректированный R? можно с большим успехом применять для выбора наилучшего подмножества независимых переменных в регрессионном уравнении.

    F - F-критерий;

    df - число степеней свободы для F-критерия;

    p - вероятность нулевой гипотезы для F-критерия;

    Standard error of estimate - стандартная ошибка оценки (уравнения);

    Intercept - свободный член уравнения;

    Std.Error - стандартная ошибка свободного члена уравнения;

    t - t-критерий для свободного члена уравнения;

    p - вероятность нулевой гипотезы для свободного члена уравнения.

    Beta - -коэффициенты уравнения.

    Это стандартизированные регрессионные  коэффициенты, рассчитанные по стандартизированным  значениям переменных. По их величине можно сравнить и оценить значимость зависимых переменных, так как коэффициент показывает на сколько единиц стандартного отклонения изменится зависимая переменная при изменении на одно стандартное отклонение независимой переменной при условии постоянства остальных независимых переменных. Свободный член в таком уравнении равен 0.

    Отбор и анализ факторных  признаков, включаемых в модель множественной  регрессии

 

       Расчетные данные коэффициентов корреляции между  результирующим показателем Y (цена квартиры) и каждым j-ым фактором xj представлены в следующей таблице:

    Таким образом между фактором У и факторами Х1,Х3,Х4 и Х5 существует умеренная связь. Анализируя таблицу, приходим к выводу, что не подходит ни один фактор, так как все факторы попарно зависимы между собой

    Исследуем частную корреляцию между переменными при исключении (элиминировании) влияния остальных переменных.

 
y1x1      
Correlations
Control Variables    y1 x1
x3 & x4 & x5 & x6 & x7  & x2 y1 1,000 0,609
x1 0,609 1,000
       
y1x2      
Correlations
Control Variables    y1 x2
x3 & x4 & x5 & x6 & x7 & x1 y1 1,000 -0,244
x2 -0,244 1,000
*. Correlation is significant at 0.05 level
       
y1x3      
Correlations
Control Variables    y1 x3
x4 & x5 & x6 & x7 & x1 & x2 y1 1,000 0,484
x3 0,484 1,000
*. Correlation is significant at 0.05 level
       
y1x4      
Correlations
Control Variables    y1 x4
x5 & x6 & x7 & x1 & x2 & x3 y1 1,000 -0,352
x4 -0,352 1,000
       
y1x5      
Correlations
Control Variables    y1 x5
x6 & x7 & x1 & x2 & x3 & x4 y1 1,000 -0,178
x5 -0,178 1,000
       
y1x6      
Correlations
Control Variables    y1 x6
x7 & x1 & x2 & x3 & x4 & x5 y1 1,000 -0,168
x6 -0,168 1,000
       
y1x7      
       
Correlations
Control Variables    y1 x7
x1 & x2 & x3 & x4 & x5 & x6 y1 1,000 0,320
x7 0,320 1,000
       
 

Сводная таблица значений коэффициентов  корреляции между факторами х1 и  х3:

 

     После проведения частного корреляционного  анализа была выявлена одна зависимость: у (x1, x3). Эта модель, в которой независимые факторы влияют в большей степени на зависимую переменную у.

     Рассмотрим коэффициент совокупного воздействия.

 
R(x1,x3)                
  1 0,51 0,65     1 0,13  
D= 0,51 1 0,13   D11= 0,13 1  
  0,65 0,13 1          
                 
  R(x1,x3)= 0,778885            
                 
 

Построим Множественную  линейную регрессию:

 

    Для модели были определены неизвестные  параметры уравнения регрессии, оценена их значимость, значимость всего уравнения, найдены корреляционное отношение η и коэффициент детерминации R2, точность аппроксимации δ, проведен анализ наличия автокорреляции остатков.

    При проведении оценки значимости коэффициентов уравнения регрессии используют tтеор=2,09 при числе степеней свободы k = N-3-1 = 20 и уровня значимости α = 5%.

    При проведении анализа на наличие автокорреляции в остатках с помощью критерия Дарбина-Уотсона используют dн = 1,19 и dв =1,55 , при уровне значимости α = 5%, числе наблюдений N = 30, числе независимых переменных модели k = 2.

 

 

 

 

Уравнение множественной  линейной регрессии имеет вид:

     у=263,07+63,14*x1+22,23*х3

     где  х1 – район города

          х3 – общая площадь квартиры.

 

5.Анализ полученных данных

    В результате проведенного исследования было получено следующее уравнение:

          у=263,07+63,14*x1+22,23*х3

    Данная  зависимость характеризует взаимосвязь между районом города, общей площади квартиры и стоимость квартиры.

    Параметр  a1=63,14 показывает, что стоимость однокомнатной квартиры в среднем увеличивается на 30,5 при включение такого фактора как «Район города». Параметр a2=22,23 показывает, что стоимость однокомнатной квартиры в среднем увеличивается на 22,23 при увеличении такого фактора как «Общая площадь квартиры» на 1 кв.метр. Параметр a0 =263,07 экономически не интерпретируется, он включает в себя неучтенные в модели факторы, влияющие на стоимость. Поскольку абсолютное значение a0 больше a1 и a2, то влияние неучтенных факторов на стоимость однокомнатной квартиры более существенно, чем влияние включенных, поэтому в модель можно дополнительно добавить другие факторы.

    Множественный коэффициент детерминации R2 =0,77 показывает, что 77% вариации результативного признака обусловлены изменением факторов: район города и общая площадь квартиры.

 

Регрессионный анализ

Регрессионная статистика
Принятые наименования формула Результат
1 Коэффициент множественной  корреляции 0,77
2 Коэффициент детерминации, R2 0,607
3 Скорректированный R2 0,578
4 Стандартная ошибка 128,09
5 Количество  наблюдений n 30

Информация о работе Составление прогноза цен однокомнатных квартир в городе Набережные Челны