Корреляционный и регрессионный анализ выборки

Автор работы: Пользователь скрыл имя, 12 Апреля 2012 в 21:41, курсовая работа

Краткое описание

Предметом изучения данной работы является рынок недвижимости. В данном случае нас будет интересовать совокупность предлагаемых на продажу двухкомнатных квартир.
С помощью статистических методов исследуем имеющуюся выборочную совокупность по признакам цены, общей площади и этажа. Выявим взаимосвязи между этими факторами и установим зависимость результирующего признака от признаков-факторов.

Содержание работы

Введение 2
1. Определение предмета исследования 3
1.1.Исследование статистического распределения признаков с помощью
интервального (дискретного) вариационного ряда 4
1.2.Выявление зависимости результативного признака от признаков-
факторов 13
Определение доверительных интервалов средней цены 15
Корреляционный и регрессионный анализ выборки 15
Заключение 17
Список литературы 18

Содержимое работы - 1 файл

курсовая Макса.doc

— 720.00 Кб (Скачать файл)

 
 
 
 

    Гистограмма  распределения представляет собой  графическое изображение интервального ряда распределения. Для ее построения на оси абсцисс откладываются равные отрезки, которые соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, высоты которых пропорциональны частостям интервалов. Далее представим гистограмму: 
 
 
 

 
 
 
 

  Для построения  кумулятивной кривой нужно рассчитать  накопленные частости, показывающие, сколько единиц совокупности  имеют значения признака не  больше, чем рассматриваемое значение, и определяющиеся последовательным  суммированием частостей интервалов. Кумулята распределения:

Среднее арифметическое взвешенное:

 

    
 
 
 
 

 Дисперсия:

    Среднее  квадратическое отклонение: 

    Коэффициент  вариации: 

   

Совокупность однородна по цене, т. к. коэффициент вариации меньше 33%. Модальным интервалом является от 2580-2750 тыс. руб., т. к. он имеет наибольшую частоту. Мода распределения:

   Медианный  интервал- от 2070 до 2240тыс. руб., т. к. он приходится на середину ряда. 

    Медиана: 

Асимметрия: - т.к. значение то наблюдается левосторонняя асимметрия. 

    Эксцесс: 

-т.к.  то распределение плосковершинное.

Аналогично исследуем  распределения факторных признаков и

   Построим  вариационный ряд распределения,  для этого упорядочим наблюдения  по возрастанию признака- время эксплуатации ( ).

    Подсчитаем  размах вариации:

 Тогда интервалы распределения:

    • 30-37
    • 37-44
    • 44-51
    • 51-58
    • 58-65
 

Ряд распределения  представим в таблице 3. 

                      Группы  по цене, тыс. руб. Частота Частость, % Накопленная частость,% Середина  интервала
                      30-37 1 2 2 33,5
                      37-44 16 32 34 40,5
                      44-51 17 34 68 47,5
                      51-58 13 26 94 54,5
                      58-65 3 6 100 61,5
                      Сумма 50 100    

 
 

Гистограмма распределения: 

  
 
 
 
 
 
 

     Кумулята распределения: 

 
 
 
 
 
 

   Среднее  арифметическое взвешенное:

  

   Дисперсия:

  

  Среднее  квадратическое отклонение:

Коэффициент вариации:

Модальным интервалом является от 44 до51, т. к. он имеет наибольшую частоту. Мода распределения:

  

   Медианный  интервал – от 44 до 51, т. к. он  приходится на середину ряда.

   Медиана: 

Асимметрия: - правосторонняя асимметрия.

  Эксцесс:   

  

   - распределение плосковершинное.

 

 Построим  вариационный ряд распределения,  для этого упорядочим наблюдения  по возрастанию признака- время эксплуатации ( ). 

Подсчитаем размах вариации:

Число интервалов выберем 4 по два значения признака, тогда интервалы распределения:

    • 1-2
    • 3-4
    • 5-6
    • 7-8
 

Ряд распределения  представим в таблице 3.

                      Группы  по цене, тыс. руб. Частота Частость, % Накопленная частость,% Середина  интервала
                      1-2 6 12 12 1,5
                      3-4 11 22 34 3,5
                      5-6 27 54 88 5,5
                      7-8 6 12 100 7,5
                      Сумма 50 100    

 

      Гистограмма распределения:

 

      Кумулята  распределения: 

 

Среднее арифметическое взвешенное:

  

   Дисперсия:

    
 

Среднее квадратическое отклонение: .

Коэффициент вариации:

Модальный интервал от 3 до 4, т. к. он имеет наибольшую частоту.

Мода распределения:

      Медианный интервал –от 5 до 6, т. к. он приходится на середину ряда. 

Медиана:  

Асимметрия:

Эксцесс:

- распределение плосковершинное.

Совокупность  считается однородной, если коэффициент  вариации не превышает 33%. В нашем  случае совокупность однородна по признаку Y и Х1 но неоднородна по признаку Х2, т. к. коэффициент вариации по нему значительно больше 33%. Нормальность распределения исследуемых факторных признаков (Х2) проводится с помощью правила «трех сигм». 

Для признака Х2:

На основе сопоставления  данных гр. 3 и гр. 4 делаем вывод о  наличии нормальности распределения. Резко выделяющихся единиц по уровню признаков-факторов нет.

 

1.2 Выявление зависимости  результативного  признака от признаков-факторов 
 
 

   Аналитическая группировка продаваемых квартир по общей площади: 
 

                      Группы  по общей площади, кв. м. Групповая средняя цены Групповая средняя этажа
                      30-37 2000000 2
                      37-44 2142500 2,94
                      44-51 2384706 3,24
                      51-58 2602923 4,15
                      58-65 2587000 4,33

 

         

           
 
 

Аналитическая группировка продаваемых квартир по этажам: 

                      Группы  по этажам Групповая средняя цены Групповая средняя общей  площади
                      1-2 2258333 47
                      3-4 2341481 46,9
                      5-6 2452636 52,4
                      7-8 2475000 51,5

 

На основе данных аналитической группировки построим график эмпирической линии связи:

 

   По виду  графиков предполагаем линейную  зависимость цены квартиры от общей площади и этажа. 
 

2. Определение доверительных  интервалов средней  цены

Средняя цена квартиры была определена выше, по данной выборке  она составляет 2365,8  тыс. руб. Средняя  ошибка выборки:

 

Для доверительной  вероятности 95% коэффициент Стьюдента  t=1,96.

Тогда средняя  ошибка:

И средняя цена квартиры с вероятностью 95% заключена в интервале от (2365,8 -92,61) до (2365,8 +92,61), т.е. в интервале [2273,19-2458,41].

   Для доверительной  вероятности 90% коэффициент Стьюдента  t=1,65.

   Тогда  средняя ошибка:  
 
 

   И средняя  цена квартиры с вероятностью 90% заключена в интервале от (2365,8 -77,96) до (2365,8 +77,96), т. е. в интервале [2287,84-2443,76].

   Необходимая  численность выборки при определении  средней цены продаваемых квартир, чтобы с вероятностью 0,95 предельная ошибка выборки не превышала 10 тыс. руб.

   Для доверительной  вероятности 95% коэффициент Стьюдента  t=1,96.Тогда средняя ошибка:  

   Тогда 

   Отсюда 

 Т. е. достаточная численность выборки 4291 квартир. 

   3. Корреляционный и регрессионный анализ выборки

Вычислим парные коэффициенты корреляции по формуле:

Матрица парных коэффициентов:

   Теснота  связи между признаками Y и Х1 и Х2 прямая, т. к. коэффициент парной корреляции в интервале от 0

до1.

    

Вычислим коэффициенты a и b. Получаем уравнение регрессии: 

      Y=1139,03+252,39Х1 

   Таким образом, каждый квадратный метр увеличивает цену квартиры в среднем на 252390 рублей.

 

 

                              Заключение 

   В результате исследования статистического распределения признаков Y, Х1 Х2 было установлено, что признаки нормально распределены. Средняя цена квартиры равна 2365,8 тыс. руб., средняя общая площадь равна 47,64 кв. м., средний этаж 4ый. Наиболее часто встречаются квартиры с ценой от 2580 - 2750. руб., с общей площадью 47,5 кв. м. на 3-4 этаже.

 

  Половина  квартир имеет цену меньше медианой

Информация о работе Корреляционный и регрессионный анализ выборки