Регрессионно-корреляционный анализ

Автор работы: Пользователь скрыл имя, 17 Января 2012 в 14:59, курсовая работа

Краткое описание

При исследовании социально-экономических явлений приходиться иметь дело с взаимосвязанными показателями, а именно результативными показателями и факторами. Если в анализе участвует один фактор, он называется однофакторным или парным, если несколько, то многофакторным или множественный. В целом такой анализ, связывающий факторы и результаты, называют регрессионно-корреляционный анализ.

Содержание работы

Исходная информация для априорного анализа 4
Введение 5
1. Предмет, методы и задачи банковской статистики 6
2.Априорный анализ исходной информации 18
2.1. Оценка однородности совокупности и проверка нормального закона распределения для Результата У (Валовой региональный продукт, тыс. руб. на чел.) 18
2.2. Оценка однородности совокупности и проверка нормального закона распределения для фактора Х1 (Соотношение среднедушевых доходов и прожиточного минимума) 21
2.3. Оценка однородности совокупности и проверка нормального закона распределения для фактора Х2 (доля граждан с доходами ниже прожиточного минимума, %) 24
3. Парный регрессионно-корреляционный анализ 27
3.1. Построение и анализ поля корреляции 27
3.2. Построение (расчёт) уравнения регрессии 29
3.3. Интерпретация параметров уравнения регрессии 30
3.4. Корреляционный анализ 31
3.5. Оценка адекватности параметров регрессионно-корреляционного анализа 31
3.6. Использование ранговых коэффициентов 34
4. Множественный регрессионно-корреляционный анализ 37
4.1. Линейное уравнение множественной регрессии 38
4.2. Линейный коэффициент частной корреляции 39
4.3. Показатели эластичности 39
4.4. Коэффициент множественной корреляции 40
4.5. F-критерий Фишера для уравнения и множественного коэффициента корреляции 41
Заключение 42
Литература: 43

Содержимое работы - 1 файл

Курсовая готовая.docx

— 363.05 Кб (Скачать файл)
 

     Для проверки используем правило трёх сигм:

    1. [ ] 68% всех значений статистической совокупности.

     22*0,68 = 15, значит 15 значений должны попадать  в интервал [ ]

     23,07 – 5,86 = 17,21

     23,07 + 5,86 = 28,93

     Получаем  интервал [17,21 ; 28,93]. В данный интервал попадает 15 значений данной совокупности.

    1. В интервал  ] должно попадать 95% всех значений совокупности.

     22*0,95 = 20,9 21

     23,07 – 2*5,86 = 11,35

     23,07 + 2*5,86 = 34,79

     В интервал [11,35 ; 34,79] попадает 20 значений данной совокупности.

    1. В интервал  ] должно попадать 99% всех значений совокупности.

     22*0,99 = 21,78 22

     23,07 – 3*5,86 = 5,49

     23,07 + 3*5,86 = 40,65

     В интервал [5,49 ; 40,65] попадает 22 значения данной совокупности.

     Вывод: мы имеем информацию близкую к нормальному закону распределения.

Раздел  №3: «парный регрессионно-корреляционный анализ»

3.1. Построение и анализ  поля корреляции

     Для построения поля корреляции и проведения анализа используем данные, представленные в задании.

     
Субъекты  Российской Федерации Доля граждан  с доходами ниже прожиточного минимума, % Валовой региональный продукт, тыс. руб. на чел.
Х У
1 7,60 46,73
2 10,80 46,75
3 11,80 47,79
4 21,40 47,88
5 21,50 49,57
6 22,10 50,40
7 22,90 51,85
8 23,10 52,98
9 23,30 55,96
10 23,30 56,20
11 23,80 59,03
12 24,00 62,71
13 24,30 63,99
14 24,90 65,92
15 25,00 65,96
16 25,80 66,75
17 26,20 72,11
18 26,20 72,48
19 28,40 73,90
20 28,60 75,10
21 31,10 75,27
22 31,50 82,20
 

     В нашем случае имеем положительное  поле корреляции, то есть зависимость  между Х и У будет прямой.

     

     В случае отрицательной зависимости  она будет обратная.

 

     

     3.2. Построение (расчёт) уравнения регрессии

     Для этого построим специальную таблицу  подстановки. Для описания зависимости  между Х и У запишем уравнение  парной регрессии:

     

х = а01х

 
     
Х У Х2 Х*У
х=2 5,9+1,52Х
У2
1 2 3 4 5 6
7,60 46,73 57,76 355,15 37,45 2183,69
10,80 46,75 116,64 504,90 42,32 2185,56
11,80 47,79 139,24 563,92 43,84 2283,88
21,40 47,88 457,96 1024,63 58,43 2292,49
21,50 49,57 462,25 1065,76 58,58 2457,18
22,10 50,40 488,41 1113,84 59,49 2540,16
22,90 51,85 524,41 1187,37 60,71 2688,42
23,10 52,98 533,61 1223,84 61,01 2806,88
23,30 55,96 542,89 1303,87 61,32 3131,52
23,30 56,20 542,89 1309,46 61,32 3158,44
23,80 59,03 566,44 1404,91 62,08 3484,54
24,00 62,71 576,00 1505,04 62,38 3932,54
24,30 63,99 590,49 1554,96 62,84 4094,72
24,90 65,92 620,01 1641,41 63,75 4345,45
25,00 65,96 625,00 1649,00 63,90 4350,72
25,80 66,75 665,64 1722,15 65,12 4455,56
26,20 72,11 686,44 1889,28 65,72 5199,85
26,20 72,48 686,44 1898,98 65,72 5253,35
28,40 73,90 806,56 2098,76 69,07 5461,21
28,60 75,10 817,96 2147,86 69,37 5640,01
31,10 75,27 967,21 2340,90 73,17 5665,57
31,50 82,20 992,25 2589,30 73,78 6756,84
           
507,60 1341,53 12466,50 32095,27 1341,35 84368,61
 

     а0 , а1 – параметры уравнения.

     Данные  параметры определяют с помощью  метода наименьших квадратов из системы  нормальных уравнений.

     n*a0 + a1*Σx = Σy

    a0*Σx + a1*Σx2 = Σx*y

     22*a0 + 507,6*а1 = 1341,53                     :22

    507,6*a0+ 12466,5*a1 = 32095,27            :507,6

 

     a0 + 23,07*a1 = 60,97

    a0 + 24,55*a1 = 63,22

    1,48*a1 = 2,25

    a1= 2,25/1,48=1,52

    a0 = 63,22-24,55*1,52

    a0 = 25,9

     Определив параметры, запишем уравнение регрессии:

     

х=2 5,9+1,52Х

     В уравнение регрессии последовательно  подставляем значения Х и результаты записываем в 5-ый столбик.

     Вывод: Так как суммарные показатели во 2-ом и 5-ом столбике совпадают, уравнение регрессии рассчитано правильно.

     3.3. Интерпретация параметров уравнения регрессии

     а0 =25,9 – это начало линии регрессии. Этот параметр может быть положительным и отрицательным.

     а1= 1,52 означает, что если доля граждан с доходами ниже прожиточного минимума, увеличится на 1, то значение результата валового регионального продукта увеличится на 1,52 тыс. руб. на человека.

 

     Дадим интерпретацию в процентах

     Для этого используем показатель эластичности.

     Э = а1* (%) = 1,52* = 0,57%

     Это означает, что если доля граждан  с доходами ниже прожиточного минимума увеличится на 1%, то валовой региональный продукт увеличится на 0,57% от среднего уровня.

     Нанесём линию регрессии на поле корреляции.

     Хmin = х = 37,45

     Xmax = х = 73,8

3.4. Корреляционный анализ

     Для оценки силы влияния фактора на результат  используем парный коэффициент корреляции.

     

;       

Парный  коэффициент можно рассчитать и  по другой формуле:

     Дадим интерпритацию этого показателя.

     Коэффициент корреляции может быть положительным  или отрицательным. Его знак всегда совпадает со знаком поля корреляции. По абсолютной величине его значение меняется от 0 до 1. Чем ближе к 1, тем  сильнее зависимость между фактором и результатом.

    В нашем случае rху равен 0,82, а это значит, что фактор оказывает сильное положительное влияние на результат.

     Дадим интерпритацию в процентах.

     Для этого используем коэффициент детерминации.

     Д = r2xy = (0,82)2=0,672 = 67%

     Это означает, что 67% колебаний результата У объясняется действием нашего фактора, а остальные 33% объясняются  действием неучтённых нами факторов.

3.5. Оценка адекватности  параметров регрессионно-корреляционного  анализа

    Для проверки адекватности необходимо установить достоверность проверенных расчетов. Для этого используем специальный  статистические критерии и статистические таблицы.

     3.5.1.Проверка  адекватности уравнения в целом:

    Имеем уравнение  .

    Для проверки используем следующие показатели:

      – остаточная дисперсия,  которая находится по формуле:

     , где

    • - отклонение от линии регрессии;
    • n-2 – число степеней свободы;
    • 2 –число параметров.

       Для проверки адекватности используем  Fф – критерий Фишера: .

    

     .

    Сравним полученное значение Fф с табличным значением. Доверительная вероятность P = 0,95, уровень значимости α = 0,05%.

    V2 = n – 2, V1 = n = 22 , V2 = 22 – 2 = 20.

    В нашем случае   Fт =2.12

    Рассчитав фактическое значение по формуле  и определив табличное значение, сравниваем эти показатели и делаем вывод.

    Вывод: Fф  > Fт – уравнение в целом адекватно, то есть достоверно и его можно использовать для дальнейшего анализа.

 

     3.5.2. Проверка адекватности параметров уравнения регрессии

    Для параметра а0:

    ошибка а0 = mа0 =

    Для проверки используем статистический t-критерий Стьюдента.

     = .

 

    Для параметра а1

    ошибка а1 = mа1 = .

    Также применим критерий Стьюдента

     .

    Сравним полученные значения t с табличным. В таблице α = 0,05 число степеней свободы равно 22-2=20. tтаб = 2,09.

     ta0 ,ta1 > чем tт, значит параметры уравнения можно считать адекватными, уравнение с данными параметрами можно использовать для дальнейшего анализа.

 

     3.5.3. Проверка адекватности коэффициента корреляции.

    Используем  t-критерий Стьюдента.

    

     .

    tф  >  tт - значение коэффициента корреляции достоверно.

    Найдем  доверительные интервалы для  параметров уравнения.

Информация о работе Регрессионно-корреляционный анализ