Определение параметров нестационарного нелинейного уравнения регрессии
Лабораторная работа, 06 Декабря 2012, автор: пользователь скрыл имя
Краткое описание
В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %
Содержание работы
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23
Содержимое работы - 1 файл
Отчёт 3.doc
— 271.50 Кб (Скачать файл)
Глава 4. Проверка наличия мультиколлинеарности между факторами
Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии.
Проблема мультиколлинеарности возникает только для случая множественной регрессии, поскольку в парной регрессии лишь одна объясняющая переменная.
Оценка коэффициента регрессии может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.
Это бывает в том случае, когда какие-то факторы линейно связаны между собой и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.
Природа мультиколлинеарности нагляднее
всего может быть продемонстрирована
на примере совершенной
Например, имеем уравнение вида:
уi = α + β1x1i + β2x2i + Ui
Если x2i =λx1, то:
уi = α + β1x1i + β2 λ x1i + Ui
уi = α + x1i (β1 + λ β2) + Ui
При определении величин
γ = β1 + λβ2. Из данного выражения невозможно найти оценки β1 и β2 в отдельности, так как имеется одно уравнение с двумя неизвестными.
Следовательно, совершенная
Несовершенная, то есть
Матрица коэффициентов парной корреляции
Y |
Z1 |
Z2 |
T | |
Y |
1 |
|||
Z1 |
-0,49258 |
1 |
||
Z2 |
0,963733 |
-0,51662 |
1 |
|
T |
-0,74588 |
0,857272 |
-0,71499 |
1 |
Для проверки значимости коэффициентов парной корреляции используют критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение критерия Стьюдента, который рассчитывается по формуле:
Где r-значение коээффициента парной корреляции; n-число наблюдений (n=20).
Полученные данные занесем в таблицу №5.
Чем больше по абсолютной величине значение корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных х1 и х2 на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.
Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.
Мультиколлинеарность обычно приводит к вырождению матрицы переменных и, следовательно, к тому, что главный определитель уменьшает свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.
При проверке наличия мультиколлинеарности между факторами, мы получили следующее значение коэффициента корреляции: rz1z2=-0,51662 ; rz1z2<0,8
Значит, полученное нами расчетное
значение коэффициента парной корреляции
меньше предельного значения, следовательно,
в данной модели отсутствует
Проверка значимости коэффициентов парной корреляции, используя t-критерий Стьюдента
Y |
Z |
Z |
T | |
Y |
1 |
|||
Z |
2,401347 |
1 |
||
Z |
15,32131 |
2,5599 |
1 |
|
T |
4,750899 |
7,064206 |
4,338906 |
1 |
Сравним tф (фактическое значение) для каждого коэффициента парной корреляции с t-критическим (табличное значение) для 5 % уровня значимости (двустороннего) и числа степеней свободы n = n - 2 (в нашем случае n = 18). В данном случае tкр= 2,101.
Если tф > tкр, то коэффициент парной корреляции признается значимым. В рассматриваемом случае все коэффициенты парной корреляции признаются значимыми.
Глава 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ
Произведем построение уравнения регрессии вида (2). Для построения статистической модели, характеризующей значимость и точность найденного уравнения регрессии, используем табличный процессор «Excel», применив команды «Сервис» - «Анализ данных» - «Регрессия».
В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал Х» вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Затем устанавливаем флажки в окнах «Метки» и «Уровень надежности». Установим переключатель «Новый рабочий лист» и поставим флажки в окошках «Остатки», «График остатков». После всех вышеперечисленных действий нажимаем кнопку «ОК» в диалоговом окне «Регрессия». Далее производим форматирование полученных результатов расчета коэффициентов уравнения регрессии и статистических характеристик. Получаем следующие таблицы:
Таблица №5
Регрессионная статистика | |
Множественный R |
0,9752 |
R-квадрат |
0,9510 |
Нормированный R-квадрат |
0,9418 |
Стандартная ошибка |
1,0319 |
Наблюдения |
20 |
Таблица №6
Дисперсионный анализ | ||||||||||||
df |
SS |
MS |
F |
Значимость F | ||||||||
Регрессия |
3 |
330,7338 |
110,2446 |
103,414 |
1,09E-10 | |||||||
Остаток |
16 |
17,05682 |
1,066051 |
|||||||||
Итого |
19 |
347,7906 |
||||||||||
|
Таблица №7 | ||||||||||||
Коэф-фициен-ты |
Стан-дартная ошибка |
t-статис-тика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |||||
Y-пересече-ние |
21,24592 |
1,662909 |
12,77636 |
8,25E-10 |
17,72071 |
24,77113 |
17,72071 |
24,77113 | ||||
Z1 |
-13,8033 |
6,122783 |
2,25442 |
0,038539 |
0,823604 |
26,78304 |
0,823604 |
26,78304 | ||||
Z2 |
1,616608 |
0,16131 |
10,02175 |
2,67E-08 |
1,274646 |
1,95857 |
1,274646 |
1,95857 | ||||
T |
-0,27135 |
0,100811 |
-2,69165 |
0,016044 |
-0,48506 |
-0,05764 |
-0,48506 |
-0,05764 | ||||
Таблица №8 ВЫВОД ОСТАТКА | ||
Наблюдение |
Предсказанный Y |
Остатки |
1 |
42,11714 |
-0,07714 |
2 |
35,19378 |
0,676222 |
3 |
36,79666 |
0,393344 |
4 |
36,62479 |
-0,33479 |
5 |
34,43152 |
0,008479 |
6 |
34,29928 |
-0,73928 |
7 |
30,14897 |
-0,71897 |
8 |
28,3476 |
0,122401 |
9 |
29,2477 |
-1,1377 |
10 |
29,61504 |
1,444959 |
11 |
27,88182 |
-0,36182 |
12 |
29,08309 |
-0,83309 |
13 |
29,94998 |
2,340019 |
14 |
30,53102 |
-0,30102 |
15 |
30,43222 |
-0,53222 |
16 |
31,13292 |
1,687078 |
17 |
33,54188 |
-1,25188 |
18 |
27,14929 |
-0,67929 |
19 |
27,1268 |
0,503196 |
20 |
24,5985 |
-0,2085 |
При определении параметров уравнения линейной регрессии используется стандартная программа пакета «Еxcel» ЛИНЕЙН ( ). В эту функцию необходимо ввести исходные данные (предварительно выделив блок ячеек, в котором строк всегда 5 столбцов: n + 1 = 2+1 = 3) в формате: =ЛИНЕЙН (интервал значений Y; блок значений Х; константа; статистика). Для запуска программы нажимаем сочетание клавиш <Shift> + <Ctrl> + <Enter>. Получим результат поиска решения в виде таблицы:
Таблица №9
Уравнение регрессии
bn |
bn-1 |
… |
b1 |
a0 |
|
s[ bn] |
s[ bn-1] |
… |
s[ b1] |
s[a0] |
R2 |
s[g] |
|||
Fрасч |
df |
|||
SSreg |
SSresid |
где приняты следующие обозначения:
a, b1,…, bn-1, bn – неизвестные величины в уравнении регрессии
s [a], s [bn] средние квадратические отклонения полученных значений
R2 - величина, характеризующая достоверность
df - число степеней свободы, определяемое по формуле: df = k – (n+1)
где k – число строк в таблице исходных данных
n – число аргументов
Ssreg – регрессионная сумма квадратов
SSresid - остаточная сумма квадратов
Эти две величины, необходимые для
вычисления результатов, при оценке полученных
данных не рассматриваются.
Таблица №10
Уравнение регрессии | |||||
b2 |
b1 |
b0 |
a0 | ||
|
1,623116 |
13,55135 |
-0,26597 |
21,17071 | ||
0,160443 |
5,997849 |
0,098785 |
1,653671 | ||
0,9510 |
1,0319 |
#Н/Д |
#Н/Д | ||
103,5414 |
16 |
#Н/Д |
#Н/Д | ||
330,7537 |
17,03686 |
#Н/Д |
#Н/Д | ||
Таким образом, искомое уравнение регрессии имеет вид:
у =21,24592 - 0,27135T - 13,80332Z1 + 1,616608Z2
После определения уравнения регрессии целесообразно оценить достоверность полученной зависимости.