Автор работы: Пользователь скрыл имя, 17 Января 2012 в 14:59, курсовая работа
При исследовании социально-экономических явлений приходиться иметь дело с взаимосвязанными показателями, а именно результативными показателями и факторами. Если в анализе участвует один фактор, он называется однофакторным или парным, если несколько, то многофакторным или множественный. В целом такой анализ, связывающий факторы и результаты, называют регрессионно-корреляционный анализ.
Исходная информация для априорного анализа 4
Введение 5
1. Предмет, методы и задачи банковской статистики 6
2.Априорный анализ исходной информации 18
2.1. Оценка однородности совокупности и проверка нормального закона распределения для Результата У (Валовой региональный продукт, тыс. руб. на чел.) 18
2.2. Оценка однородности совокупности и проверка нормального закона распределения для фактора Х1 (Соотношение среднедушевых доходов и прожиточного минимума) 21
2.3. Оценка однородности совокупности и проверка нормального закона распределения для фактора Х2 (доля граждан с доходами ниже прожиточного минимума, %) 24
3. Парный регрессионно-корреляционный анализ 27
3.1. Построение и анализ поля корреляции 27
3.2. Построение (расчёт) уравнения регрессии 29
3.3. Интерпретация параметров уравнения регрессии 30
3.4. Корреляционный анализ 31
3.5. Оценка адекватности параметров регрессионно-корреляционного анализа 31
3.6. Использование ранговых коэффициентов 34
4. Множественный регрессионно-корреляционный анализ 37
4.1. Линейное уравнение множественной регрессии 38
4.2. Линейный коэффициент частной корреляции 39
4.3. Показатели эластичности 39
4.4. Коэффициент множественной корреляции 40
4.5. F-критерий Фишера для уравнения и множественного коэффициента корреляции 41
Заключение 42
Литература: 43
Для проверки используем правило трёх сигм:
22*0,68 = 15, значит 15 значений должны попадать в интервал [ ]
23,07 – 5,86 = 17,21
23,07 + 5,86 = 28,93
Получаем интервал [17,21 ; 28,93]. В данный интервал попадает 15 значений данной совокупности.
22*0,95 = 20,9 21
23,07 – 2*5,86 = 11,35
23,07 + 2*5,86 = 34,79
В интервал [11,35 ; 34,79] попадает 20 значений данной совокупности.
22*0,99 = 21,78 22
23,07 – 3*5,86 = 5,49
23,07 + 3*5,86 = 40,65
В интервал [5,49 ; 40,65] попадает 22 значения данной совокупности.
Вывод: мы имеем информацию близкую к нормальному закону распределения.
Для построения поля корреляции и проведения анализа используем данные, представленные в задании.
Субъекты Российской Федерации | Доля граждан с доходами ниже прожиточного минимума, % | Валовой региональный продукт, тыс. руб. на чел. |
№ | Х | У |
1 | 7,60 | 46,73 |
2 | 10,80 | 46,75 |
3 | 11,80 | 47,79 |
4 | 21,40 | 47,88 |
5 | 21,50 | 49,57 |
6 | 22,10 | 50,40 |
7 | 22,90 | 51,85 |
8 | 23,10 | 52,98 |
9 | 23,30 | 55,96 |
10 | 23,30 | 56,20 |
11 | 23,80 | 59,03 |
12 | 24,00 | 62,71 |
13 | 24,30 | 63,99 |
14 | 24,90 | 65,92 |
15 | 25,00 | 65,96 |
16 | 25,80 | 66,75 |
17 | 26,20 | 72,11 |
18 | 26,20 | 72,48 |
19 | 28,40 | 73,90 |
20 | 28,60 | 75,10 |
21 | 31,10 | 75,27 |
22 | 31,50 | 82,20 |
В нашем случае имеем положительное поле корреляции, то есть зависимость между Х и У будет прямой.
В случае отрицательной зависимости она будет обратная.
Для этого построим специальную таблицу подстановки. Для описания зависимости между Х и У запишем уравнение парной регрессии:
Х | У | Х2 | Х*У | У2 | |
1 | 2 | 3 | 4 | 5 | 6 |
7,60 | 46,73 | 57,76 | 355,15 | 37,45 | 2183,69 |
10,80 | 46,75 | 116,64 | 504,90 | 42,32 | 2185,56 |
11,80 | 47,79 | 139,24 | 563,92 | 43,84 | 2283,88 |
21,40 | 47,88 | 457,96 | 1024,63 | 58,43 | 2292,49 |
21,50 | 49,57 | 462,25 | 1065,76 | 58,58 | 2457,18 |
22,10 | 50,40 | 488,41 | 1113,84 | 59,49 | 2540,16 |
22,90 | 51,85 | 524,41 | 1187,37 | 60,71 | 2688,42 |
23,10 | 52,98 | 533,61 | 1223,84 | 61,01 | 2806,88 |
23,30 | 55,96 | 542,89 | 1303,87 | 61,32 | 3131,52 |
23,30 | 56,20 | 542,89 | 1309,46 | 61,32 | 3158,44 |
23,80 | 59,03 | 566,44 | 1404,91 | 62,08 | 3484,54 |
24,00 | 62,71 | 576,00 | 1505,04 | 62,38 | 3932,54 |
24,30 | 63,99 | 590,49 | 1554,96 | 62,84 | 4094,72 |
24,90 | 65,92 | 620,01 | 1641,41 | 63,75 | 4345,45 |
25,00 | 65,96 | 625,00 | 1649,00 | 63,90 | 4350,72 |
25,80 | 66,75 | 665,64 | 1722,15 | 65,12 | 4455,56 |
26,20 | 72,11 | 686,44 | 1889,28 | 65,72 | 5199,85 |
26,20 | 72,48 | 686,44 | 1898,98 | 65,72 | 5253,35 |
28,40 | 73,90 | 806,56 | 2098,76 | 69,07 | 5461,21 |
28,60 | 75,10 | 817,96 | 2147,86 | 69,37 | 5640,01 |
31,10 | 75,27 | 967,21 | 2340,90 | 73,17 | 5665,57 |
31,50 | 82,20 | 992,25 | 2589,30 | 73,78 | 6756,84 |
507,60 | 1341,53 | 12466,50 | 32095,27 | 1341,35 | 84368,61 |
а0 , а1 – параметры уравнения.
Данные параметры определяют с помощью метода наименьших квадратов из системы нормальных уравнений.
n*a0 + a1*Σx = Σy
a0*Σx + a1*Σx2 = Σx*y
22*a0 + 507,6*а1 = 1341,53 :22
507,6*a0+ 12466,5*a1 = 32095,27 :507,6
a0 + 23,07*a1 = 60,97
a0 + 24,55*a1 = 63,22
1,48*a1 = 2,25
a1= 2,25/1,48=1,52
a0 = 63,22-24,55*1,52
a0 = 25,9
Определив параметры, запишем уравнение регрессии:
В
уравнение регрессии
Вывод: Так как суммарные показатели во 2-ом и 5-ом столбике совпадают, уравнение регрессии рассчитано правильно.
а0 =25,9 – это начало линии регрессии. Этот параметр может быть положительным и отрицательным.
а1= 1,52 означает, что если доля граждан с доходами ниже прожиточного минимума, увеличится на 1, то значение результата валового регионального продукта увеличится на 1,52 тыс. руб. на человека.
Дадим интерпретацию в процентах
Для этого используем показатель эластичности.
Э = а1* (%) = 1,52* = 0,57%
Это означает, что если доля граждан с доходами ниже прожиточного минимума увеличится на 1%, то валовой региональный продукт увеличится на 0,57% от среднего уровня.
Нанесём линию регрессии на поле корреляции.
Хmin = х = 37,45
Xmax = х = 73,8
Для оценки силы влияния фактора на результат используем парный коэффициент корреляции.
;
Парный коэффициент можно рассчитать и по другой формуле:
Дадим
интерпритацию этого
Коэффициент
корреляции может быть положительным
или отрицательным. Его знак всегда
совпадает со знаком поля корреляции.
По абсолютной величине его значение
меняется от 0 до 1. Чем ближе к 1, тем
сильнее зависимость между
В нашем случае rху равен 0,82, а это значит, что фактор оказывает сильное положительное влияние на результат.
Дадим интерпритацию в процентах.
Для этого используем коэффициент детерминации.
Д = r2xy = (0,82)2=0,672 = 67%
Это означает, что 67% колебаний результата У объясняется действием нашего фактора, а остальные 33% объясняются действием неучтённых нами факторов.
Для
проверки адекватности необходимо установить
достоверность проверенных
3.5.1.Проверка
адекватности уравнения в
Имеем уравнение .
Для проверки используем следующие показатели:
– остаточная дисперсия, которая находится по формуле:
, где
Для проверки адекватности
.
Сравним полученное значение Fф с табличным значением. Доверительная вероятность P = 0,95, уровень значимости α = 0,05%.
V2 = n – 2, V1 = n = 22 , V2 = 22 – 2 = 20.
В нашем случае Fт =2.12
Рассчитав
фактическое значение по формуле
и определив табличное
Вывод: Fф > Fт – уравнение в целом адекватно, то есть достоверно и его можно использовать для дальнейшего анализа.
3.5.2. Проверка адекватности параметров уравнения регрессии
Для параметра а0:
ошибка а0 = mа0 =
Для проверки используем статистический t-критерий Стьюдента.
= .
Для параметра а1
ошибка а1 = mа1 = .
Также применим критерий Стьюдента
.
Сравним полученные значения t с табличным. В таблице α = 0,05 число степеней свободы равно 22-2=20. tтаб = 2,09.
ta0 ,ta1 > чем tт, значит параметры уравнения можно считать адекватными, уравнение с данными параметрами можно использовать для дальнейшего анализа.
3.5.3. Проверка адекватности коэффициента корреляции.
Используем t-критерий Стьюдента.
.
tф > tт - значение коэффициента корреляции достоверно.
Найдем доверительные интервалы для параметров уравнения.