Автор работы: Пользователь скрыл имя, 06 Декабря 2012 в 11:04, лабораторная работа
В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23
Глава 6. Проверка статистической значимости уравнения в целом и отдельных коэффициентов уравнения
После определения уравнения
Достоверность самой величины R2 оценивается с помощью F-распределения, которое определяет а – вероятность того, что зависимость у от хi отсутствует; следовательно, (1-а) – вероятность того, что такая зависимость существует. Определение этой величины производится с помощью статистической функции FРАСП, куда необходимо ввести Fрасч., число аргументов (n = 2) и число степеней свободы (df = 17).
а |
1 - а |
7,29816E-11 |
0,999999999927 |
Полученное значение (1 – а) очень близко к единице, что позволяет судить о достоверности наличия зависимости между у и хi.
Коэффициент множественной корреляции R служит основным показателем тесноты линейной корреляционной связи. Если R = 1, то связь между у и хi является функциональной и линейной, при R = 0 линейная корреляционная связь отсутствует, что, однако, не исключает наличия в этом случае нелинейной зависимости. В данной задаче R = 0,97519, что говорит о достаточно сильной корреляционной зависимости.
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза H0, о том, что коэффициент регрессии равен нулю, т.е. bi = 0, и, следовательно, фактор хi не оказывает влияния на результат у. Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым. В данной задаче значимость F близка к нулю, т.е. такова вероятность принятия нулевой гипотезы.
Параметры bi называются коэффициентами регрессии, величина каждого из которых показывает среднее изменение результата с изменением фактора на одну единицу. В таблице «Дисперсионный анализ» приведены стандартные ошибки для коэффициентов регрессии.
Свободный член уравнения регрессии может не иметь экономического содержания. В рассматриваемой задаче то, что а > 0, свидетельствует об опережении изменения факторов над изменением результата.
Используя t-критерий Стьюдента, определяется достоверность коэффициентов регрессии:
t |
10,11645 |
2,259368 |
-2,69243 |
12,80225 |
b |
2,34E-08 |
0,038168 |
0,016018 |
8,01E-10 |
1-b |
1 |
0,961832 |
0,983982 |
1 |
где t = bn/s[bn]
t = a0/s[a0]
b - вероятность того, что значения bn и a0 не достоверны
(1-b) - вероятность того, что значения bn и a0 достоверны.
В данной задаче коэффициенты регрессии признаются значимыми, так как полученное значение (1 - b) очень близко к единице, т. е. характеризует вероятность того, что коэффициенты уравнения регрессии достоверны.
В таблице «Дисперсионный анализ» Р-значение характеризует вероятность принятия нулевой гипотезы по каждому коэффициенту регрессии. В рассматриваемой задаче нулевую гипотезу можно отвергнуть.
Графы таблицы «Дисперсионный анализ», где указаны нижние 95% и верхние 95% показывают границы нахождения значений коэффициентов регрессии. Значения считаются экономически достоверными, если лежат в достаточно узком однознаковом диапазоне. Коэффициенты рассматриваемой регрессии удовлетворяют этому требованию.
Модель yi` ряда уi cчитается адекватной, если правильно отражает систематические компоненты этого ряда. Это требование эквивалентно требованию, чтобы остаточная компонента ei = yi – yi’, где i = 1¸n, удовлетворяла следующим свойствам:
7.1. ПРОВЕРКА ОТСУТСТВИЯ
ИЛИ НАЛИЧИЯ
Дисперсия случайного члена уравнения регрессии в каждом наблюдении должна быть постоянной.
Под понятием дисперсия имеется в виду возможное поведение случайного члена уравнения регрессии до того, как сделана выборка.
В том случае, когда дисперсия каждого отклонения ei неодинакова для всех значений xi, имеет место гетероскедастичности.
Часто появление проблемы гетероскедастичности
можно предвидеть заранее, основываясь
на знании характера данных. В таких
случаях можно предпринять
В настоящее время существует достаточно большое число тестов для обнаружения гетероскедастичности, в которых делаются различные предположения о зависимости между дисперсией случайного члена уравнения регрессии и величиной объясняющей переменной.
При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайного члена уравнения регрессии будет либо увеличиваться, либо уменьшаться по мере увеличения Х. И поэтому в регрессии, оцениваемой с помощью метода наименьших квадратов, абсолютные величины остатков и значения Х будут коррелированны.
Данные по Х и остатки (ei) упорядочиваются по возрастанию. Затем находится ранг для каждого значения Х и ei.
Коэффициент ранговой корреляции определяют по формуле:
где n – количество наблюдений
D =R-Rε
Если предположить, что коэффициент корреляции для генеральной совокупности равен нулю, то коэффициент ранговой корреляции имеет нормальное распределение c математическим ожиданием равным нулю:
M(rxe) = 0
и дисперсией:
в больших выборках.
Следовательно, соответствующая тестовая статистика равна:
и при использовании
При проверке наличия или отсутствия гетероскедастичности в исследуемой модели, с помощью теста ранговой корреляции Спирмена, получаем: rxe=0,275; rx<1,96
Cледовательно, гипотеза об отсутствии гетероскедастичности принимается.
Автокорреляция обычно встречается в регрессионном анализе при использовании данных временных рядов.
Постоянная направленность воздействия не включенных в уравнение переменных является наиболее частой причиной положительной автокорреляции, обычной для экономического анализа.
Автокорреляция в большинстве случаев представляет тем более существенную проблему, чем меньше интервал между наблюдениями. Чем больше этот интервал, тем менее правдоподобно, что при переходе от одного наблюдения к другому, характер влияния неучтенных переменных будет сохраняться.
Автокорреляция может быть также отрицательной. Это означает, что корреляция между последовательными значениями случайного члена отрицательна. В этом случае за положительным значением в одном наблюдении идет отрицательное значение в следующем и наоборот.
В литературе широко известна статистика Дарбина-Уотсона, которая определяется следующим образом:
Расчетное значение d-критерия в интервале от 2 до 4 свидетельствует об отрицательной связи. В этом случае его надо преобразовать по формуле:
d`=4-d
и в дальнейшем используем значение d. Расчетное значение критерия d или d` сравниваается с верхним d1 и нижним d2 критическими значениями статистики Дарвина-Уотсона.
Для
5%-го уровня значимости эти
значения для ряда количества
определяемых параметров
n |
p=1 |
p=2 |
p=3 | |||
d1 |
d2 |
d1 |
d2 |
d1 |
d2 | |
15 |
1,08 |
1,36 |
0,95 |
1,54 |
0,82 |
1,75 |
20 |
1,2 |
1,41 |
1,1 |
1,54 |
1 |
1,68 |
30 |
1,35 |
1,49 |
1,28 |
1,57 |
1,21 |
1,65 |
Если расчетное значение критерия d больше верхнего табличного значения d2, то
гипотеза о независимости
Если расчетное значение d меньше нижнего табличного d1 ,то эта гипотеза отвергается и модель считается неадекватной.
Если значение d находится между значениями d1 и d2, включая сами эти значения, то считается, что нет достаточных оснований делать тот или иной вывод и необходимы дальнейшие исследования, например по большему числу наблюдений.
Вывод об адекватности
модели делается, если все 4 проверки
свойств остаточной
В данной задаче:
d =2,0225 - критерий Дарвина-Уотсона
Расчетное значение d-критерия свидетельствует об отрицательной связи.
d`=1.9775 и d1= 1 , d2=1,68.
Так как расчетное значение критерия d больше верхнего табличного значения d2, то гипотеза о независимости уровней остаточной последовательности, то есть об отсутствии в ней автокорреляции принимается.
7.3. ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ
1. ПРОВЕРКА СЛУЧАЙНОСТИ КОЛЕБАНИЙ УРОВНЕЙ ОСТАТОЧНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Проверка случайности колебаний уровней остаточной последовательности означает проверку гипотезы о правильности выбора уравнения регрессии. Используя линейное уравнение регрессии, полученное путем замены переменной, находим отклонение теоретически вычисленных значений производительности труда от фактических значений.
Для исследования случайности отклонений от уравнения регрессии находятся разности:
ei = yi - ỹi
(i=1, 2,…,n)
ỹi – теоретически вычисленные значения производительности труда,
ei – остаточная компонента.
Характер этих отклонений изучается с помощью ряда непараметрических критериев. Одним из таких критериев является критерий серий, основанный на медиане выборки.
Ряд из величин ei располагают в порядке возрастания их значений и находят медиану em полученного вариационного ряда, то есть серединное значение при нечетном n или среднюю арифметическую из 2-х соседних серединных значений при четном n. Возвращаясь к исходной последовательности ei и сравнивая значения этой последовательности с em, ставим знак "+", если значение ei превосходит медиану, и знак "-", если оно меньше медианы. Соответственно, значение ei опускается, если ei = em.
Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии