Определение параметров нестационарного нелинейного уравнения регрессии

Автор работы: Пользователь скрыл имя, 06 Декабря 2012 в 11:04, лабораторная работа

Краткое описание

В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %

Содержание работы

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23

Содержимое работы - 1 файл

Отчёт 3.doc

— 271.50 Кб (Скачать файл)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 4. Проверка наличия мультиколлинеарности между факторами

 

Мультиколлинеарность – это  коррелированность двух или нескольких объясняющих переменных в уравнении  регрессии.

Проблема мультиколлинеарности возникает только для случая множественной регрессии, поскольку в парной регрессии лишь одна объясняющая переменная.

Оценка коэффициента регрессии  может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.

Это бывает в том случае, когда  какие-то факторы линейно связаны  между собой и меняются синхронно. Связь зависимой переменной с  изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.

Природа мультиколлинеарности нагляднее  всего может быть продемонстрирована на примере совершенной мультиколлинеарности, то есть строгой линейной связи между объясняющими переменными.

Например, имеем уравнение вида:

 

уi = α + β1x1i + β2x2i + Ui

 

Если x2i =λx1, то:

 

уi = α + β1x1i + β2 λ x1i + Ui

уi = α + x1i1 + λ β2) + Ui

При определении величин коэффициентов  данного уравнения, мы найдем оценку  α = a и

γ =  β1 + λβ2. Из данного выражения  невозможно найти оценки β1 и β2 в отдельности, так как имеется одно уравнение с двумя неизвестными.

Следовательно, совершенная мультиколлинеарность не позволяет определить коэффициенты регрессии, то есть    β1 и β2 и разделить вклады переменных х1 и х2 в объяснение поведения переменной у.

  Несовершенная, то есть стохастическая  связь переменных х1 и х2 характеризуется величиной коэффициента парной корреляции между ними:

 

Матрица коэффициентов  парной корреляции

 

 Y

Z1

Z2

T

Y

1

     

Z1

-0,49258

1

   

Z2

0,963733

-0,51662

1

 

T

-0,74588

0,857272

-0,71499

1


 

Для проверки значимости коэффициентов  парной корреляции используют критерий Стьюдента. Для этой цели требуется  найти для каждого коэффициента парной корреляции значение критерия Стьюдента, который рассчитывается по формуле:

 

Где r-значение коээффициента парной корреляции; n-число наблюдений (n=20).

Полученные данные занесем в  таблицу №5.

 

Чем больше по абсолютной величине значение корреляции к единице, тем ближе  мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных х1 и х2 на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.

Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.

Мультиколлинеарность обычно приводит к вырождению матрицы переменных и, следовательно, к тому, что главный  определитель уменьшает свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.

 

При проверке наличия мультиколлинеарности между факторами, мы получили следующее  значение коэффициента корреляции: rz1z2=-0,51662 ;  rz1z2<0,8

Значит, полученное нами расчетное  значение коэффициента парной корреляции меньше предельного значения, следовательно, в данной модели отсутствует мультиколлинеарность между факторами.

Проверка значимости коэффициентов парной корреляции, используя t-критерий Стьюдента

 

Y

Z

Z

T

Y

1

     

Z

2,401347

1

   

Z

15,32131

2,5599

1

 

T

4,750899

7,064206

4,338906

1


 

Сравним tф (фактическое значение) для каждого коэффициента парной корреляции с t-критическим (табличное значение) для 5 % уровня значимости (двустороннего) и числа степеней свободы n = n - 2 (в нашем случае n = 18). В данном случае tкр= 2,101.

Если tф > tкр, то  коэффициент парной корреляции признается значимым. В рассматриваемом случае все коэффициенты парной корреляции признаются значимыми.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ

Произведем построение уравнения  регрессии вида (2). Для построения статистической модели, характеризующей значимость и точность найденного уравнения регрессии, используем табличный процессор «Excel», применив команды «Сервис» - «Анализ данных» - «Регрессия».

В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал Х» вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Затем устанавливаем флажки в окнах «Метки» и «Уровень надежности». Установим переключатель «Новый рабочий лист» и поставим флажки в окошках «Остатки», «График остатков». После всех вышеперечисленных действий нажимаем кнопку «ОК» в диалоговом окне «Регрессия». Далее производим форматирование полученных результатов расчета коэффициентов уравнения регрессии и статистических характеристик. Получаем следующие таблицы:

Таблица №5

 

Регрессионная статистика

Множественный R

0,9752

R-квадрат

0,9510

Нормированный R-квадрат

0,9418

Стандартная ошибка

1,0319

Наблюдения

20


 

Таблица №6

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

3

330,7338

110,2446

103,414

1,09E-10

Остаток

16

17,05682

1,066051

   

Итого

19

347,7906

     

 

Таблица №7

 

Коэф-фициен-ты

Стан-дартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересече-ние

21,24592

1,662909

12,77636

8,25E-10

17,72071

24,77113

17,72071

24,77113

Z1

-13,8033

6,122783

2,25442

0,038539

0,823604

26,78304

0,823604

26,78304

Z2

1,616608

0,16131

10,02175

2,67E-08

1,274646

1,95857

1,274646

1,95857

T

-0,27135

0,100811

-2,69165

0,016044

-0,48506

-0,05764

-0,48506

-0,05764


 

 

      

  Таблица №8

ВЫВОД ОСТАТКА

Наблюдение

Предсказанный Y

Остатки

1

42,11714

-0,07714

2

35,19378

0,676222

3

36,79666

0,393344

4

36,62479

-0,33479

5

34,43152

0,008479

6

34,29928

-0,73928

7

30,14897

-0,71897

8

28,3476

0,122401

9

29,2477

-1,1377

10

29,61504

1,444959

11

27,88182

-0,36182

12

29,08309

-0,83309

13

29,94998

2,340019

14

30,53102

-0,30102

15

30,43222

-0,53222

16

31,13292

1,687078

17

33,54188

-1,25188

18

27,14929

-0,67929

19

27,1268

0,503196

20

24,5985

-0,2085


При определении параметров уравнения  линейной регрессии используется стандартная  программа пакета «Еxcel» ЛИНЕЙН ( ). В эту функцию необходимо ввести исходные данные (предварительно выделив блок ячеек, в котором строк всегда 5 столбцов: n + 1 = 2+1 = 3) в формате:  =ЛИНЕЙН (интервал значений Y; блок значений Х; константа; статистика). Для запуска программы нажимаем сочетание клавиш <Shift> + <Ctrl> + <Enter>. Получим результат поиска решения в виде таблицы:

 

Таблица №9

Уравнение регрессии

 

bn

bn-1

b1

a0

s[ bn]

s[ bn-1]

s[ b1]

s[a0]

R2

s[g]

     

Fрасч

df

     

SSreg

SSresid

     

 

где приняты следующие обозначения:

a, b1,…, bn-1, bn – неизвестные величины в уравнении регрессии

s [a], s [bn] средние квадратические отклонения полученных значений

R2 - величина, характеризующая достоверность

df - число степеней свободы, определяемое по формуле: df = k – (n+1)

где k – число строк в таблице исходных данных

      n – число аргументов

Ssreg – регрессионная сумма квадратов

SSresid - остаточная сумма квадратов

Эти две величины, необходимые для вычисления результатов, при оценке полученных данных не рассматриваются.                                                                                       

Таблица №10

 

Уравнение регрессии

b2

b1

b0

a0

1,623116

13,55135

-0,26597

21,17071

0,160443

5,997849

0,098785

1,653671

0,9510

1,0319

#Н/Д

#Н/Д

103,5414

16

#Н/Д

#Н/Д

330,7537

17,03686

#Н/Д

#Н/Д


 

Таким образом, искомое уравнение  регрессии имеет вид:

 

у =21,24592 - 0,27135T - 13,80332Z1 + 1,616608Z2

 

После определения уравнения регрессии целесообразно оценить достоверность полученной зависимости.

Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии