Определение параметров нестационарного нелинейного уравнения регрессии

Автор работы: Пользователь скрыл имя, 06 Декабря 2012 в 11:04, лабораторная работа

Краткое описание

В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %

Содержание работы

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23

Содержимое работы - 1 файл

Отчёт 3.doc

— 271.50 Кб (Скачать файл)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 6. Проверка статистической значимости уравнения в целом и отдельных коэффициентов уравнения

 

После определения уравнения регрессии  определяем достоверность полученной зависимости по величине коэффициента множественной детерминации, который для данной задачи равен R2 =0,9510. При R2 = 1 имеется функциональная зависимость, при R2 = 0 зависимость отсутствует. Полученное значение является достаточно высоким и подтверждает достоверность наличия зависимости между у и хi.

Достоверность самой величины R2 оценивается с помощью F-распределения, которое определяет а – вероятность того, что зависимость у от хi отсутствует; следовательно, (1-а) – вероятность того, что такая зависимость существует. Определение этой величины производится с помощью статистической функции FРАСП, куда необходимо ввести Fрасч., число аргументов (n = 2) и число степеней свободы (df = 17).

 

а

1 - а

7,29816E-11

0,999999999927


 

Полученное значение (1 – а) очень близко к единице, что позволяет судить о достоверности наличия зависимости между у и хi.

Коэффициент множественной корреляции R служит основным показателем тесноты линейной корреляционной связи. Если R = 1, то связь между у и х является функциональной и линейной, при R = 0 линейная корреляционная связь отсутствует, что, однако, не исключает наличия в этом случае нелинейной зависимости. В данной задаче R = 0,97519, что говорит о достаточно сильной корреляционной зависимости.

Оценка значимости уравнения  регрессии в целом дается с  помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза H0, о том, что коэффициент регрессии равен нулю, т.е.      bi = 0, и, следовательно, фактор хi не оказывает влияния на результат у. Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым. В данной задаче значимость F близка к нулю, т.е. такова вероятность принятия нулевой гипотезы.

Параметры bi называются коэффициентами регрессии, величина каждого из которых показывает среднее изменение результата с изменением фактора на одну единицу. В таблице «Дисперсионный анализ» приведены стандартные ошибки для коэффициентов регрессии.

Свободный член уравнения регрессии может не иметь экономического содержания. В рассматриваемой задаче то, что а > 0, свидетельствует об опережении изменения факторов над изменением результата.

Используя t-критерий Стьюдента, определяется достоверность коэффициентов регрессии:

 

t

10,11645

2,259368

-2,69243

12,80225

b

2,34E-08

0,038168

0,016018

8,01E-10

1-b

1

0,961832

0,983982

1


 

где t = bn/s[bn]     

      t = a0/s[a0]

      b - вероятность того, что значения bn и a0 не достоверны

      (1-b) - вероятность того, что значения bn и a0 достоверны.

В данной задаче коэффициенты регрессии  признаются значимыми, так как полученное значение (1 - b) очень близко к единице, т. е. характеризует вероятность того, что коэффициенты уравнения регрессии достоверны.

 

В таблице «Дисперсионный анализ»  Р-значение характеризует вероятность  принятия нулевой гипотезы по каждому  коэффициенту регрессии. В рассматриваемой  задаче нулевую гипотезу можно отвергнуть.

Графы таблицы «Дисперсионный анализ», где указаны нижние 95% и верхние 95% показывают границы нахождения значений коэффициентов регрессии. Значения считаются экономически достоверными, если лежат в достаточно узком однознаковом диапазоне. Коэффициенты рассматриваемой регрессии удовлетворяют этому требованию.

Модель yi` ряда уi cчитается адекватной, если правильно отражает систематические компоненты этого ряда. Это требование эквивалентно требованию, чтобы остаточная компонента ei = yi – yi’, где i = 1¸n, удовлетворяла следующим свойствам:

    1. случайность колебаний уровней остаточной последовательности;
    2. соответствие распределения случайной компоненты нормальному закону распределения;
    3. равенство нулю математического ожидания случайной компоненты;
    4. независимость значений уровней случайной компоненты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 7. ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ УРАВНЕНИЯ РЕГРЕССИИ

7.1. ПРОВЕРКА ОТСУТСТВИЯ  ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ  ИССЛЕДУЕМОЙ МОДЕЛИ

 

Дисперсия случайного члена уравнения регрессии в каждом наблюдении должна быть постоянной.

Под понятием дисперсия имеется  в виду возможное поведение случайного члена уравнения регрессии до того, как сделана выборка.

В том случае, когда дисперсия  каждого отклонения ei неодинакова для всех значений xi, имеет место гетероскедастичности.

Часто появление проблемы гетероскедастичности можно предвидеть заранее, основываясь  на знании характера данных. В таких  случаях можно предпринять соответствующие  действия по устранению этого эффекта  на этапе спецификации модели регрессии. Это позволит уменьшить или возможно устранить необходимость формальной проверки.

В настоящее время существует достаточно большое число тестов для обнаружения  гетероскедастичности, в которых  делаются различные предположения  о зависимости между дисперсией случайного члена уравнения регрессии и величиной объясняющей переменной.

При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия  случайного члена уравнения регрессии  будет либо увеличиваться, либо уменьшаться по мере увеличения Х. И поэтому в регрессии, оцениваемой с помощью метода наименьших квадратов, абсолютные величины остатков и значения Х будут коррелированны.

Данные по Х и остатки (ei) упорядочиваются по возрастанию. Затем находится ранг для каждого значения Х и ei.

Коэффициент ранговой корреляции определяют по формуле:

 


где n – количество наблюдений

      D =R-Rε

Если предположить, что коэффициент  корреляции для генеральной совокупности равен нулю, то коэффициент ранговой корреляции имеет нормальное распределение c математическим ожиданием равным нулю:

 

M(rxe) = 0

 

и дисперсией:


 

в больших выборках.

Следовательно, соответствующая  тестовая статистика равна:

 

и при использовании двухстороннего критерия нулевая гипотеза об отсутствии гетероскедастичности будет отклонена для генеральной совокупности при уровне значимости в 5%, если она превысит значение 1,96.

 

При проверке наличия  или отсутствия гетероскедастичности в исследуемой модели, с помощью  теста ранговой корреляции Спирмена, получаем: rxe=0,275; rx<1,96

Cледовательно, гипотеза об отсутствии гетероскедастичности принимается.

7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ

Автокорреляция обычно встречается  в регрессионном анализе при  использовании данных временных  рядов.

Постоянная направленность воздействия не включенных в уравнение переменных является наиболее частой причиной положительной автокорреляции, обычной для экономического анализа.

Автокорреляция в большинстве  случаев представляет тем более  существенную проблему, чем меньше интервал между наблюдениями. Чем больше этот интервал, тем менее правдоподобно, что при переходе от одного наблюдения к другому, характер влияния неучтенных переменных будет сохраняться.

Автокорреляция может быть также  отрицательной. Это означает, что  корреляция между последовательными значениями случайного члена отрицательна. В этом случае за положительным значением в одном наблюдении идет отрицательное значение в следующем и наоборот.

В литературе широко известна статистика Дарбина-Уотсона, которая определяется следующим образом:

 

Расчетное значение d-критерия в интервале от 2 до 4 свидетельствует об отрицательной связи. В этом случае его надо преобразовать по формуле:

d`=4-d

и в дальнейшем используем значение  d. Расчетное значение критерия d или d` сравниваается с верхним d1 и нижним d2  критическими значениями статистики Дарвина-Уотсона.

          Для  5%-го уровня значимости эти  значения для ряда количества  определяемых параметров приведены  в таблице:

n

p=1

p=2

p=3

d1

d2

d1

d2

d1

d2

15

1,08

1,36

0,95

1,54

0,82

1,75

20

1,2

1,41

1,1

1,54

1

1,68

30

1,35

1,49

1,28

1,57

1,21

1,65


 

   Если расчетное значение  критерия d больше верхнего табличного значения d2, то

гипотеза о независимости уровней  остаточной последовательности, то есть об отсутствии в ней автокорреляции принимается.

   Если расчетное значение d меньше нижнего табличного d1 ,то эта гипотеза отвергается и модель считается неадекватной.

   Если значение d находится между значениями d1 и d2, включая сами эти значения, то считается, что нет достаточных оснований делать тот или иной вывод и необходимы дальнейшие исследования, например по большему числу наблюдений.

   Вывод об адекватности  модели делается, если все 4 проверки  свойств остаточной последовательности  дают положительный результат.  Для адекватных моделей имеет  смысл ставить задачу оценки  их точности.

В данной задаче:

d =2,0225  -  критерий Дарвина-Уотсона

Расчетное значение d-критерия свидетельствует  об отрицательной связи.

d`=1.9775 и d1= 1 ,  d2=1,68.

Так как расчетное значение критерия d больше верхнего табличного значения d2, то гипотеза о независимости уровней остаточной последовательности, то есть об отсутствии в ней автокорреляции принимается.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.3. ОЦЕНКА АДЕКВАТНОСТИ  РЕГРЕССИОННОЙ МОДЕЛИ

1. ПРОВЕРКА  СЛУЧАЙНОСТИ КОЛЕБАНИЙ УРОВНЕЙ  ОСТАТОЧНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Проверка случайности колебаний уровней остаточной последовательности означает проверку гипотезы о правильности выбора уравнения регрессии. Используя линейное уравнение регрессии, полученное путем замены переменной, находим отклонение теоретически вычисленных значений производительности труда от фактических значений.

Для исследования случайности отклонений от уравнения регрессии находятся  разности:

 

ei = yi - ỹi

(i=1, 2,…,n)

 

        ỹi  – теоретически вычисленные значения производительности труда,

        ei – остаточная компонента.

 

Характер этих отклонений изучается  с помощью ряда непараметрических  критериев. Одним из таких критериев  является критерий серий, основанный на медиане выборки.

Ряд из величин ei располагают в порядке возрастания их значений и находят медиану em  полученного вариационного ряда, то есть серединное значение при нечетном n или среднюю арифметическую из 2-х соседних серединных значений при четном n.   Возвращаясь к исходной последовательности ei и сравнивая значения этой последовательности с em, ставим знак "+", если значение ei превосходит медиану, и знак "-", если оно меньше медианы. Соответственно, значение ei опускается, если ei = em.

Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии