Автор работы: Пользователь скрыл имя, 25 Ноября 2011 в 10:05, курсовая работа
Тема данной курсовой работы является составление прогноза цен однокомнатных квартир в городе Набережные Челны. Например, агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных футах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома. Как только эта информация собрана для различных домов, было бы интересно посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой он был продан. Например, могло бы оказаться, что число спальных комнат является лучшим предсказывающим фактором (предиктором) для цены продажи дома в некотором специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы дороже, учитывая их расположение и характеристики.
Содержание 2
Введение 3
1.Теоретические сведения 5
1.1 Множественная регрессия 5
1.2 Регрессионный анализ 5
1.3 Классическая линейная модель множественной регрессии 8
1.4 Оценка параметров классической модели множественной регрессии методом наименьших квадратов 12
2. Отбор и анализ факторных признаков, включаемых в модель множественной регрессии 16
2.1Корреляционный анализ 17
2.2 Частные коэффициенты корреляции 18
2.3 Коэффициент корреляции совокупного воздействия 18
2.4 Оценка значимости параметров уравнения линейной регрессии 19
3.Исходные данные 21
4.Результаты анализа 23
5.Анализ полученных данных 29
6.Заключение 30
7.Список использованной литературы 31
где – диагональный элемент обратной матрицы , – остаточная дисперсия, характеризующая степень рассеяния фактических значений относительно расчетных значений : ( – число наблюдений, – число параметров, – число степеней свободы).
Критическое значение находится по таблице: .
Если , то нулевая гипотеза принимается. Если , то нулевая гипотеза отвергается: .
3.Исходные данные
На основе проведенного анализа изучаемой предметной области, а именно экономического содержания и сущности продаж однокомнатных квартир, были выделены следующие факторы:
Таким образом, для анализа предметной области были выбраны факторы, указанные в таблице
Исходные данные
№ | цена за квартиру | район города | этаж | Общая площадь квартиры (м2) | Жилая площадь квартиры (м2) | площадь кухни квартиры (м2) | наличие телефона | наличие балкона | |
y | x1 | x2 | x3 | x4 | x5 | x6 | x7 | ||
янв.07 | 1 | 975 | 1 | 1 | 33 | 19 | 6 | 1 | 0 |
фев.07 | 2 | 1250 | 1 | 1 | 30 | 16 | 6,5 | 1 | 1 |
мар.07 | 3 | 1350 | 1 | 1 | 38,74 | 18,64 | 10 | 0 | 1 |
апр.07 | 4 | 1070 | 1 | 1 | 30 | 16 | 6 | 1 | 1 |
май.07 | 5 | 1330 | 3 | 5 | 29 | 16 | 6 | 0 | 1 |
июн.07 | 6 | 1250 | 4 | 3 | 39 | 21 | 8 | 0 | 0 |
июл.07 | 7 | 1150 | 4 | 4 | 30 | 16 | 6,5 | 1 | 1 |
авг.07 | 8 | 1270 | 4 | 2 | 35 | 19 | 10 | 1 | 1 |
сен.07 | 9 | 1175 | 4 | 5 | 36 | 17 | 9 | 1 | 0 |
окт.07 | 10 | 1200 | 4 | 4 | 30 | 17 | 6,3 | 0 | 1 |
ноя.07 | 11 | 1365 | 4 | 3 | 36 | 15 | 9,4 | 1 | 1 |
дек.07 | 12 | 1150 | 4 | 1 | 36 | 19 | 9 | 1 | 1 |
янв.08 | 13 | 1200 | 4 | 2 | 29 | 16 | 6 | 1 | 0 |
фев.08 | 14 | 1200 | 4 | 3 | 35,5 | 18,5 | 8 | 1 | 0 |
мар.08 | 15 | 1700 | 4 | 16 | 47,5 | 18 | 16 | 1 | 1 |
апр.08 | 16 | 1150 | 2 | 1 | 30 | 16 | 6,5 | 0 | 0 |
май.08 | 17 | 1220 | 2 | 5 | 46 | 28 | 10 | 1 | 1 |
июн.08 | 18 | 1180 | 3 | 5 | 33 | 20 | 6 | 1 | 1 |
июл.08 | 19 | 990 | 1 | 5 | 30 | 17 | 6 | 1 | 1 |
авг.08 | 20 | 980 | 1 | 7 | 37 | 20 | 8,5 | 1 | 1 |
сен.08 | 21 | 800 | 1 | 5 | 28 | 14 | 6 | 0 | 1 |
окт.08 | 22 | 870 | 1 | 7 | 30 | 13 | 9 | 1 | 1 |
ноя.08 | 23 | 1580 | 3 | 3 | 44,1 | 25,8 | 8 | 0 | 1 |
дек.08 | 24 | 1000 | 3 | 5 | 30 | 16 | 6 | 0 | 1 |
янв.09 | 25 | 1410 | 4 | 8 | 36 | 17 | 9 | 1 | 1 |
фев.09 | 26 | 1550 | 4 | 5 | 40 | 17 | 10 | 1 | 1 |
мар.09 | 27 | 1320 | 4 | 1 | 33 | 19 | 6 | 1 | 1 |
апр.09 | 28 | 1200 | 4 | 9 | 32 | 16 | 8 | 0 | 1 |
май.09 | 29 | 1190 | 4 | 4 | 30 | 16 | 6 | 1 | 1 |
июн.09 | 30 | 1180 | 5 | 4 | 29 | 15,5 | 6 | 1 | 1 |
4.Результаты анализа
Проведение многомерного линейного корреляционного анализа
Multiple R - коэффициент множественной корреляции;
Характеризует тесноту линейной связи между зависимой и всеми независимыми переменными. Может принимать значения от 0 до 1. Так как =0,832842>0.7 то связь тесная.
R? - коэффициент детерминации;
Численно выражает долю вариации зависимой переменной, объясненную с помощью регрессионного уравнения. Чем больше R2, тем большую долю вариации объясняют переменные, включенные в модель. Так как =0,693627, то 69,3% изменчивости переменной у можно объяснить изменчивостью переменных х1,х2,х3,х4,х5,х6,х7.
adjusted R? - скорректированный коэффициент детерминации;
Скорректированный R? можно с большим успехом применять для выбора наилучшего подмножества независимых переменных в регрессионном уравнении.
F - F-критерий;
df - число степеней свободы для F-критерия;
p - вероятность нулевой гипотезы для F-критерия;
Standard error of estimate - стандартная ошибка оценки (уравнения);
Intercept - свободный член уравнения;
Std.Error - стандартная ошибка свободного члена уравнения;
t - t-критерий для свободного члена уравнения;
p - вероятность нулевой гипотезы для свободного члена уравнения.
Beta - -коэффициенты уравнения.
Это
стандартизированные
Расчетные данные коэффициентов корреляции между результирующим показателем Y (цена квартиры) и каждым j-ым фактором xj представлены в следующей таблице:
Таким образом между фактором У и факторами Х1,Х3,Х4 и Х5 существует умеренная связь. Анализируя таблицу, приходим к выводу, что не подходит ни один фактор, так как все факторы попарно зависимы между собой
Исследуем частную корреляцию между переменными при исключении (элиминировании) влияния остальных переменных.
y1x1 | |||
Correlations | |||
Control Variables | y1 | x1 | |
x3 & x4 & x5 & x6 & x7 & x2 | y1 | 1,000 | 0,609 |
x1 | 0,609 | 1,000 | |
y1x2 | |||
Correlations | |||
Control Variables | y1 | x2 | |
x3 & x4 & x5 & x6 & x7 & x1 | y1 | 1,000 | -0,244 |
x2 | -0,244 | 1,000 | |
*. Correlation is significant at 0.05 level | |||
y1x3 | |||
Correlations | |||
Control Variables | y1 | x3 | |
x4 & x5 & x6 & x7 & x1 & x2 | y1 | 1,000 | 0,484 |
x3 | 0,484 | 1,000 | |
*. Correlation is significant at 0.05 level | |||
y1x4 | |||
Correlations | |||
Control Variables | y1 | x4 | |
x5 & x6 & x7 & x1 & x2 & x3 | y1 | 1,000 | -0,352 |
x4 | -0,352 | 1,000 | |
y1x5 | |||
Correlations | |||
Control Variables | y1 | x5 | |
x6 & x7 & x1 & x2 & x3 & x4 | y1 | 1,000 | -0,178 |
x5 | -0,178 | 1,000 | |
y1x6 | |||
Correlations | |||
Control Variables | y1 | x6 | |
x7 & x1 & x2 & x3 & x4 & x5 | y1 | 1,000 | -0,168 |
x6 | -0,168 | 1,000 | |
y1x7 | |||
Correlations | |||
Control Variables | y1 | x7 | |
x1 & x2 & x3 & x4 & x5 & x6 | y1 | 1,000 | 0,320 |
x7 | 0,320 | 1,000 | |
Сводная таблица значений коэффициентов корреляции между факторами х1 и х3:
После проведения частного корреляционного анализа была выявлена одна зависимость: у (x1, x3). Эта модель, в которой независимые факторы влияют в большей степени на зависимую переменную у.
Рассмотрим коэффициент совокупного воздействия.
|
Построим Множественную линейную регрессию:
Для модели были определены неизвестные параметры уравнения регрессии, оценена их значимость, значимость всего уравнения, найдены корреляционное отношение η и коэффициент детерминации R2, точность аппроксимации δ, проведен анализ наличия автокорреляции остатков.
При проведении оценки значимости коэффициентов уравнения регрессии используют tтеор=2,09 при числе степеней свободы k = N-3-1 = 20 и уровня значимости α = 5%.
При проведении анализа на наличие автокорреляции в остатках с помощью критерия Дарбина-Уотсона используют dн = 1,19 и dв =1,55 , при уровне значимости α = 5%, числе наблюдений N = 30, числе независимых переменных модели k = 2.
Уравнение множественной линейной регрессии имеет вид:
у=263,07+63,14*x1+22,23*х
где х1 – район города
х3 – общая площадь квартиры.
5.Анализ полученных данных
В результате проведенного исследования было получено следующее уравнение:
у=263,07+63,14*x1+
Данная зависимость характеризует взаимосвязь между районом города, общей площади квартиры и стоимость квартиры.
Параметр a1=63,14 показывает, что стоимость однокомнатной квартиры в среднем увеличивается на 30,5 при включение такого фактора как «Район города». Параметр a2=22,23 показывает, что стоимость однокомнатной квартиры в среднем увеличивается на 22,23 при увеличении такого фактора как «Общая площадь квартиры» на 1 кв.метр. Параметр a0 =263,07 экономически не интерпретируется, он включает в себя неучтенные в модели факторы, влияющие на стоимость. Поскольку абсолютное значение a0 больше a1 и a2, то влияние неучтенных факторов на стоимость однокомнатной квартиры более существенно, чем влияние включенных, поэтому в модель можно дополнительно добавить другие факторы.
Множественный коэффициент детерминации R2 =0,77 показывает, что 77% вариации результативного признака обусловлены изменением факторов: район города и общая площадь квартиры.
Регрессионный анализ
Регрессионная статистика | |||
№ | Принятые наименования | формула | Результат |
1 | Коэффициент множественной корреляции | 0,77 | |
2 | Коэффициент детерминации, R2 | 0,607 | |
3 | Скорректированный R2 | 0,578 | |
4 | Стандартная ошибка | 128,09 | |
5 | Количество наблюдений | n | 30 |
Информация о работе Составление прогноза цен однокомнатных квартир в городе Набережные Челны