Множественная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 19 Декабря 2010 в 23:04, курсовая работа

Краткое описание

Задачами работы являются:
- изучение построения уравнения множественной регрессии;
- изучение множественной корреляциии
-включение факторов в уравнение множественной регрессии
- проверка качества построенной модели
- оценка мультиколлинеарности факторов
- оценка гетероскедастичности
- рассмотрение изучаемой темы на практических примерах

Содержание работы

Введение 3
1. Множественная регрессия 6
2. Множественная корреляция 8
3. Включение факторов в уравнение множественной регрессии 10
4. Проверка качества построенной модели 13
5. Оценка мультиколлинеарности факторов 14
6. Оценка гетероскедастичности 16
Практическая часть 18
Пример 1 18
Пример 2 23
Заключение 32
Список литературы 34

Содержимое работы - 1 файл

33498 Эконометрика Множественная регрессия и корреляция.doc

— 594.50 Кб (Скачать файл)

     =

    

    Сравнивая и приходим к выводу о целесообразности включения в модель фактора после фактора , так как . Гипотезу о несущественности прироста за счёт включения дополнительного фактора отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора после фактора .

    Целесообразность  включения в модель фактора  после фактора проверяет :

     =

    Низкое  значение свидетельствует о статистической незначимости прироста за счёт включения в модель фактора (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надёжной и что нет необходимости улучшать её, включая дополнительный фактор (средний возраст безработного).

    Пример 2

     Используя статистический материал, приведенный  в таблице 1, необходимо:

         1) построить линейное уравнение множественной регрессии, пояснить экономический смысл его параметров;

         2) дать сравнительную оценку тесноты  связи факторов с результативным  признаком с помощью средних  (общих) коэффициентов эластичности;

         3) оценить статистическую значимость коэффициентов регрессии с помощью t-критерия и нулевую гипотезу о незначимости уравнения с помощью F-критерия;

         4) оценить качество уравнения посредством  определения средней ошибки аппроксимации.

 

      Таблица 1.

     Исходные данные

№ п/п Чистый доход, млн. дол. США Оборот капитала, млн. дол. США Использованный капитал, млн. дол. США
yi x1i x2i
1 1,50 5,90 5,90
2 5,50 53,10 27,10
3 2,40 18,80 11,20
4 3,00 35,30 16,40
5 4,20 71,90 32,50
6 2,70 93,60 25,40
7 1,60 10,00 6,40
8 2,40 31,50 12,50
9 3,30 36,70 14,30
10 1,80 13,80 6,50
S 28,40 370,60 158,20

     Для определения неизвестных параметров b0 , b1 , b2 уравнения множественной линейной регрессии используем стандартную систему нормальных уравнений, которая имеет вид:

      (7)

     Для решения этой системы вначале  необходимо определить значения величин  Σ x12 , Σ x22 , Σ x1y , Σ x2y , Σ x1 x2 . Эти значения определяем из таблицы 1, дополняя ее соответствующими колонками (табл. 2).

     Таблица 2

     К расчету коэффициентов регрессии

№ п/п yi x1i x2i x1iyi x2iyi x1ix2i x1i2 x1i2
1 1,50 5,90 5,90 8,85 8,85 34,81 34,8 1 34,81
2 5,50 53,10 27,10 292,05 149,05 1439,01 2819,61 734,41
3 2,40 18,80 11,20 45,12 26,88 210,56 353,44 125,44
4 3,00 35,30 16,40 105,90 49,20 578,92 1246,09 268,96
5 4,20 71,90 32,50 301,98 136,50 2336,75 5169,61 1056,25
6 2,70 93,60 25,40 252,72 68,58 2377,44 8760,96 645,16
7 1,60 10,00 6,40 16,00 10,24 64,00 100,00 40,96
8 2,40 31,50 12,50 75,60 30,00 393,75 992,25 156,25
9 3,30 36,70 14,30 121,11 47,19 524,81 1346,89 204,49
10 1,80 13,80 6,50 24,84 11,70 89,70 190,44 42,25
S 28,40 370,60 158,20 1244,17 538,19 8049,75 21014,10 3308,98

     Тогда система (7) приобретает вид:

      (8)

     Для решения данной системы воспользуемся  методом Гаусса , который заключается в последовательном исключении неизвестных: делим первое уравнение системы на 10, затем умножаем полученное уравнение на 370,6 и вычитаем его из второго уравнения системы, далее умножаем полученное уравнение на 158,20 и вычитаем его из третьего уравнения системы. Повторяя указанный алгоритм для преобразованных второго и третьего уравнений системы, получим:

.

     После преобразования имеем:

      . (9)

     Откуда

     

     Тогда окончательно зависимость чистого  дохода от оборота капитала и использованного  капитала в виде линейного уравнения  множественной регрессии имеет  вид:

      . (10)

     Из  полученного эконометрического  уравнения видно, что с увеличением  используемого капитала чистый доход  увеличивается, и наоборот, с увеличением  оборота капитала чистый доход уменьшается. Кроме того, чем больше величина коэффициента регрессии, тем значительнее влияние объясняющей переменной на зависимую переменную. В рассматриваемом примере величина коэффициента регрессии b2 больше, чем величина коэффициента b1 , следовательно, используемый капитал оказывает значительно большее влияние на чистый доход, чем оборот капитала. Для количественной оценки указанного вывода определим частные коэффициенты эластичности12:

      .

     Анализ  полученных результатов также показывает, что большее влияние на чистый доход оказывает используемый капитал. Так, в частности, при увеличении используемого капитала на 1% чистый доход увеличивается на 1,17%. В то же время с ростом оборота капитала на 1% чистый доход снижается на 0,5%.

     Расчетное значение критерия Фишера Fp :

     

     Где

     

     Величина  критического значения FКРИТ определяется по статистическим таблицам и для уровня значимости α = 0,05 равняется 4,74. Так как Fp > FКРИТ, то нулевая гипотеза отвергается, и полученное уравнение регрессии принимается статистически значимым.13

     Оценка  статистической значимости коэффициентов  регрессии b1 и b2 по t-критерию сводится к сопоставлению численного значения этих коэффициентов с величиной их случайных ошибок mb1 и mb2 по зависимости:

      . (11)

     Рабочая формула для расчета теоретического значения t-статистики имеет вид:

      , (12)

     где парные коэффициенты корреляции и коэффициент  множественной корреляции рассчитываются по формулам:

      ; (13)

      ; (14)

      ; (15)

      . (16)

     Тогда расчетные значения t-статистик соответственно равны:

     

     Поскольку критическое значение t-статистики, определенное по статистическим таблицам для уровня значимости α = 0,05, равное tКРИТ = 2,36, больше по абсолютной величине, чем tb1T = -1,798, то нулевая гипотеза не отвергается и объясняющая переменная x1 является статистически незначимой и ее можно исключить из уравнения регрессии. И наоборот, для второго коэффициента регрессии tb2T > tКРИТ (3,3 >2,36) и объясняющая переменная x2 является статистически значимой.14

     Для определения средней ошибки аппроксимации воспользуемся формулой (10). Для удобства расчетов преобразуем таблицу 1 в таблицу 3, в которой в колонке рассчитаны текущие значения объясняющей переменной с использованием зависимости .

     Таблица 3.

     К расчету средней ошибки аппроксимации

№ п/п yi x1i x2i
1 1,50 5,90 5,90 1,93 0,286
2 5,50 53,10 27,10 4,59 0,165
3 2,40 18,80 11,20 2,55 0,0625
4 3,00 35,30 16,40 3,02 0,0006
5 4,20 71,90 32,50 5,01 0,193
6 2,70 93,60 25,40 2,69 0,0037
7 1,60 10,00 6,40 1,88 0,175
8 2,40 31,50 12,50 2,34 0,025
9 3,30 36,70 14,30 2,55 0,227
10 1,80 13,80 6,50 1,76 0,022
Σ 28,40 370,60 158,20 28,30 1,16

     Тогда средняя ошибка аппроксимации равна:

      .

     Полученное  значение не превышает допустимого предела, равного 12—15%.

     Общая теория приведенных выше методов  анализа описывается следующим  образом. После того как найдено  уравнение линейной регрессии, оценивается  значимость как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии в целом может выполняться с помощью различных критериев. Достаточно распространенным и эффективным является применение F-критерия Фишера. При этом выдвигается нулевая гипотеза H0 , что коэффициент регрессии равен нулю, т.е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения на две части — объясненную и необъясненную:

     

     Общая сумма квадратов отклонений индивидуальных значений результативного признака у от его среднего значения вызвана влиянием множества факторов.

     Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ОХ и у = . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов. Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс, обусловленный как влиянием фактора х, т.е. регрессией у по х, так и действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию.

     Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у. Это равносильно тому, что коэффициент детерминации rxy2 будет приближаться к 1. Любая сумма квадратов отклонений связана с числом степеней свободы, т.е. числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных требуется для образования данной суммы квадратов. Так, для общей суммы квадратов требуется (n - 1) независимых отклонений, т.к. по совокупности из единиц n после расчета среднего уровня свободно варьируют лишь отклонения (n - 1). При расчете объясненной, или факторной, суммы квадратов используются теоретические (расчетные) значения результативного признака у, найденные по линии регрессии: у(х) = а + bх.15 

Информация о работе Множественная регрессия и корреляция