Автор работы: Пользователь скрыл имя, 19 Декабря 2010 в 23:04, курсовая работа
Задачами работы являются:
- изучение построения уравнения множественной регрессии;
- изучение множественной корреляциии
-включение факторов в уравнение множественной регрессии
- проверка качества построенной модели
- оценка мультиколлинеарности факторов
- оценка гетероскедастичности
- рассмотрение изучаемой темы на практических примерах
Введение 3
1. Множественная регрессия 6
2. Множественная корреляция 8
3. Включение факторов в уравнение множественной регрессии 10
4. Проверка качества построенной модели 13
5. Оценка мультиколлинеарности факторов 14
6. Оценка гетероскедастичности 16
Практическая часть 18
Пример 1 18
Пример 2 23
Заключение 32
Список литературы 34
=
Сравнивая и приходим к выводу о целесообразности включения в модель фактора после фактора , так как . Гипотезу о несущественности прироста за счёт включения дополнительного фактора отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора после фактора .
Целесообразность включения в модель фактора после фактора проверяет :
=
Низкое значение свидетельствует о статистической незначимости прироста за счёт включения в модель фактора (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надёжной и что нет необходимости улучшать её, включая дополнительный фактор (средний возраст безработного).
Используя статистический материал, приведенный в таблице 1, необходимо:
1) построить линейное уравнение множественной регрессии, пояснить экономический смысл его параметров;
2)
дать сравнительную оценку
3)
оценить статистическую
4)
оценить качество уравнения
Таблица 1.
Исходные данные
№ п/п | Чистый доход, млн. дол. США | Оборот капитала, млн. дол. США | Использованный капитал, млн. дол. США |
yi | x1i | x2i | |
1 | 1,50 | 5,90 | 5,90 |
2 | 5,50 | 53,10 | 27,10 |
3 | 2,40 | 18,80 | 11,20 |
4 | 3,00 | 35,30 | 16,40 |
5 | 4,20 | 71,90 | 32,50 |
6 | 2,70 | 93,60 | 25,40 |
7 | 1,60 | 10,00 | 6,40 |
8 | 2,40 | 31,50 | 12,50 |
9 | 3,30 | 36,70 | 14,30 |
10 | 1,80 | 13,80 | 6,50 |
S | 28,40 | 370,60 | 158,20 |
Для
определения неизвестных
(7)
Для решения этой системы вначале необходимо определить значения величин Σ x12 , Σ x22 , Σ x1y , Σ x2y , Σ x1 x2 . Эти значения определяем из таблицы 1, дополняя ее соответствующими колонками (табл. 2).
Таблица 2
К расчету коэффициентов регрессии
№ п/п | yi | x1i | x2i | x1iyi | x2iyi | x1ix2i | x1i2 | x1i2 |
1 | 1,50 | 5,90 | 5,90 | 8,85 | 8,85 | 34,81 | 34,8 1 | 34,81 |
2 | 5,50 | 53,10 | 27,10 | 292,05 | 149,05 | 1439,01 | 2819,61 | 734,41 |
3 | 2,40 | 18,80 | 11,20 | 45,12 | 26,88 | 210,56 | 353,44 | 125,44 |
4 | 3,00 | 35,30 | 16,40 | 105,90 | 49,20 | 578,92 | 1246,09 | 268,96 |
5 | 4,20 | 71,90 | 32,50 | 301,98 | 136,50 | 2336,75 | 5169,61 | 1056,25 |
6 | 2,70 | 93,60 | 25,40 | 252,72 | 68,58 | 2377,44 | 8760,96 | 645,16 |
7 | 1,60 | 10,00 | 6,40 | 16,00 | 10,24 | 64,00 | 100,00 | 40,96 |
8 | 2,40 | 31,50 | 12,50 | 75,60 | 30,00 | 393,75 | 992,25 | 156,25 |
9 | 3,30 | 36,70 | 14,30 | 121,11 | 47,19 | 524,81 | 1346,89 | 204,49 |
10 | 1,80 | 13,80 | 6,50 | 24,84 | 11,70 | 89,70 | 190,44 | 42,25 |
S | 28,40 | 370,60 | 158,20 | 1244,17 | 538,19 | 8049,75 | 21014,10 | 3308,98 |
Тогда система (7) приобретает вид:
(8)
Для решения данной системы воспользуемся методом Гаусса , который заключается в последовательном исключении неизвестных: делим первое уравнение системы на 10, затем умножаем полученное уравнение на 370,6 и вычитаем его из второго уравнения системы, далее умножаем полученное уравнение на 158,20 и вычитаем его из третьего уравнения системы. Повторяя указанный алгоритм для преобразованных второго и третьего уравнений системы, получим:
.
После преобразования имеем:
. (9)
Откуда
Тогда окончательно зависимость чистого дохода от оборота капитала и использованного капитала в виде линейного уравнения множественной регрессии имеет вид:
. (10)
Из полученного эконометрического уравнения видно, что с увеличением используемого капитала чистый доход увеличивается, и наоборот, с увеличением оборота капитала чистый доход уменьшается. Кроме того, чем больше величина коэффициента регрессии, тем значительнее влияние объясняющей переменной на зависимую переменную. В рассматриваемом примере величина коэффициента регрессии b2 больше, чем величина коэффициента b1 , следовательно, используемый капитал оказывает значительно большее влияние на чистый доход, чем оборот капитала. Для количественной оценки указанного вывода определим частные коэффициенты эластичности12:
.
Анализ полученных результатов также показывает, что большее влияние на чистый доход оказывает используемый капитал. Так, в частности, при увеличении используемого капитала на 1% чистый доход увеличивается на 1,17%. В то же время с ростом оборота капитала на 1% чистый доход снижается на 0,5%.
Расчетное значение критерия Фишера Fp :
Где
Величина критического значения FКРИТ определяется по статистическим таблицам и для уровня значимости α = 0,05 равняется 4,74. Так как Fp > FКРИТ, то нулевая гипотеза отвергается, и полученное уравнение регрессии принимается статистически значимым.13
Оценка статистической значимости коэффициентов регрессии b1 и b2 по t-критерию сводится к сопоставлению численного значения этих коэффициентов с величиной их случайных ошибок mb1 и mb2 по зависимости:
. (11)
Рабочая
формула для расчета
, (12)
где парные коэффициенты корреляции и коэффициент множественной корреляции рассчитываются по формулам:
; (13)
; (14)
; (15)
. (16)
Тогда расчетные значения t-статистик соответственно равны:
Поскольку критическое значение t-статистики, определенное по статистическим таблицам для уровня значимости α = 0,05, равное tКРИТ = 2,36, больше по абсолютной величине, чем tb1T = -1,798, то нулевая гипотеза не отвергается и объясняющая переменная x1 является статистически незначимой и ее можно исключить из уравнения регрессии. И наоборот, для второго коэффициента регрессии tb2T > tКРИТ (3,3 >2,36) и объясняющая переменная x2 является статистически значимой.14
Для определения средней ошибки аппроксимации воспользуемся формулой (10). Для удобства расчетов преобразуем таблицу 1 в таблицу 3, в которой в колонке рассчитаны текущие значения объясняющей переменной с использованием зависимости .
Таблица 3.
К расчету средней ошибки аппроксимации
№ п/п | yi | x1i | x2i | ||
1 | 1,50 | 5,90 | 5,90 | 1,93 | 0,286 |
2 | 5,50 | 53,10 | 27,10 | 4,59 | 0,165 |
3 | 2,40 | 18,80 | 11,20 | 2,55 | 0,0625 |
4 | 3,00 | 35,30 | 16,40 | 3,02 | 0,0006 |
5 | 4,20 | 71,90 | 32,50 | 5,01 | 0,193 |
6 | 2,70 | 93,60 | 25,40 | 2,69 | 0,0037 |
7 | 1,60 | 10,00 | 6,40 | 1,88 | 0,175 |
8 | 2,40 | 31,50 | 12,50 | 2,34 | 0,025 |
9 | 3,30 | 36,70 | 14,30 | 2,55 | 0,227 |
10 | 1,80 | 13,80 | 6,50 | 1,76 | 0,022 |
Σ | 28,40 | 370,60 | 158,20 | 28,30 | 1,16 |
Тогда средняя ошибка аппроксимации равна:
.
Полученное значение не превышает допустимого предела, равного 12—15%.
Общая
теория приведенных выше методов
анализа описывается следующим
образом. После того как найдено
уравнение линейной регрессии, оценивается
значимость как уравнения в целом,
так и отдельных его
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от его среднего значения вызвана влиянием множества факторов.
Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ОХ и у = . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов. Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс, обусловленный как влиянием фактора х, т.е. регрессией у по х, так и действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию.
Очевидно,
что если сумма квадратов отклонений,
обусловленная регрессией, будет больше
остаточной суммы квадратов, то уравнение
регрессии статистически значимо и фактор
х оказывает существенное воздействие
на результат у. Это равносильно тому,
что коэффициент детерминации rxy2
будет приближаться к 1. Любая сумма квадратов
отклонений связана с числом степеней
свободы, т.е. числом свободы независимого
варьирования признака. Число степеней
свободы связано с числом единиц совокупности
и с числом определяемых по ней констант.
Применительно к исследуемой проблеме
число степеней свободы должно показать,
сколько независимых отклонений из n
возможных
требуется для образования данной суммы
квадратов. Так, для общей суммы квадратов
требуется (n - 1) независимых отклонений,
т.к. по совокупности из единиц n после
расчета среднего уровня свободно варьируют
лишь отклонения (n - 1). При расчете
объясненной, или факторной, суммы
квадратов
используются теоретические (расчетные)
значения результативного признака
у, найденные по линии регрессии: у(х)
= а + bх.15