Автор работы: Пользователь скрыл имя, 06 Декабря 2012 в 11:04, лабораторная работа
В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23
Глава 4. Проверка наличия мультиколлинеарности между факторами
Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии.
Проблема мультиколлинеарности возникает только для случая множественной регрессии, поскольку в парной регрессии лишь одна объясняющая переменная.
Оценка коэффициента регрессии может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.
Это бывает в том случае, когда какие-то факторы линейно связаны между собой и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.
Природа мультиколлинеарности нагляднее
всего может быть продемонстрирована
на примере совершенной
Например, имеем уравнение вида:
уi = α + β1x1i + β2x2i + Ui
Если x2i =λx1, то:
уi = α + β1x1i + β2 λ x1i + Ui
уi = α + x1i (β1 + λ β2) + Ui
При определении величин
γ = β1 + λβ2. Из данного выражения невозможно найти оценки β1 и β2 в отдельности, так как имеется одно уравнение с двумя неизвестными.
Следовательно, совершенная
Несовершенная, то есть
Матрица коэффициентов парной корреляции
Y |
Z1 |
Z2 |
T | |
Y |
1 |
|||
Z1 |
-0,49258 |
1 |
||
Z2 |
0,963733 |
-0,51662 |
1 |
|
T |
-0,74588 |
0,857272 |
-0,71499 |
1 |
Для проверки значимости коэффициентов парной корреляции используют критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение критерия Стьюдента, который рассчитывается по формуле:
Где r-значение коээффициента парной корреляции; n-число наблюдений (n=20).
Полученные данные занесем в таблицу №5.
Чем больше по абсолютной величине значение корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных х1 и х2 на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.
Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.
Мультиколлинеарность обычно приводит к вырождению матрицы переменных и, следовательно, к тому, что главный определитель уменьшает свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.
При проверке наличия мультиколлинеарности между факторами, мы получили следующее значение коэффициента корреляции: rz1z2=-0,51662 ; rz1z2<0,8
Значит, полученное нами расчетное
значение коэффициента парной корреляции
меньше предельного значения, следовательно,
в данной модели отсутствует
Проверка значимости коэффициентов парной корреляции, используя t-критерий Стьюдента
Y |
Z |
Z |
T | |
Y |
1 |
|||
Z |
2,401347 |
1 |
||
Z |
15,32131 |
2,5599 |
1 |
|
T |
4,750899 |
7,064206 |
4,338906 |
1 |
Сравним tф (фактическое значение) для каждого коэффициента парной корреляции с t-критическим (табличное значение) для 5 % уровня значимости (двустороннего) и числа степеней свободы n = n - 2 (в нашем случае n = 18). В данном случае tкр= 2,101.
Если tф > tкр, то коэффициент парной корреляции признается значимым. В рассматриваемом случае все коэффициенты парной корреляции признаются значимыми.
Глава 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ
Произведем построение уравнения регрессии вида (2). Для построения статистической модели, характеризующей значимость и точность найденного уравнения регрессии, используем табличный процессор «Excel», применив команды «Сервис» - «Анализ данных» - «Регрессия».
В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал Х» вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Затем устанавливаем флажки в окнах «Метки» и «Уровень надежности». Установим переключатель «Новый рабочий лист» и поставим флажки в окошках «Остатки», «График остатков». После всех вышеперечисленных действий нажимаем кнопку «ОК» в диалоговом окне «Регрессия». Далее производим форматирование полученных результатов расчета коэффициентов уравнения регрессии и статистических характеристик. Получаем следующие таблицы:
Таблица №5
Регрессионная статистика | |
Множественный R |
0,9752 |
R-квадрат |
0,9510 |
Нормированный R-квадрат |
0,9418 |
Стандартная ошибка |
1,0319 |
Наблюдения |
20 |
Таблица №6
Дисперсионный анализ | ||||||||||||
df |
SS |
MS |
F |
Значимость F | ||||||||
Регрессия |
3 |
330,7338 |
110,2446 |
103,414 |
1,09E-10 | |||||||
Остаток |
16 |
17,05682 |
1,066051 |
|||||||||
Итого |
19 |
347,7906 |
||||||||||
Таблица №7 | ||||||||||||
Коэф-фициен-ты |
Стан-дартная ошибка |
t-статис-тика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |||||
Y-пересече-ние |
21,24592 |
1,662909 |
12,77636 |
8,25E-10 |
17,72071 |
24,77113 |
17,72071 |
24,77113 | ||||
Z1 |
-13,8033 |
6,122783 |
2,25442 |
0,038539 |
0,823604 |
26,78304 |
0,823604 |
26,78304 | ||||
Z2 |
1,616608 |
0,16131 |
10,02175 |
2,67E-08 |
1,274646 |
1,95857 |
1,274646 |
1,95857 | ||||
T |
-0,27135 |
0,100811 |
-2,69165 |
0,016044 |
-0,48506 |
-0,05764 |
-0,48506 |
-0,05764 |
Таблица №8 ВЫВОД ОСТАТКА | ||
Наблюдение |
Предсказанный Y |
Остатки |
1 |
42,11714 |
-0,07714 |
2 |
35,19378 |
0,676222 |
3 |
36,79666 |
0,393344 |
4 |
36,62479 |
-0,33479 |
5 |
34,43152 |
0,008479 |
6 |
34,29928 |
-0,73928 |
7 |
30,14897 |
-0,71897 |
8 |
28,3476 |
0,122401 |
9 |
29,2477 |
-1,1377 |
10 |
29,61504 |
1,444959 |
11 |
27,88182 |
-0,36182 |
12 |
29,08309 |
-0,83309 |
13 |
29,94998 |
2,340019 |
14 |
30,53102 |
-0,30102 |
15 |
30,43222 |
-0,53222 |
16 |
31,13292 |
1,687078 |
17 |
33,54188 |
-1,25188 |
18 |
27,14929 |
-0,67929 |
19 |
27,1268 |
0,503196 |
20 |
24,5985 |
-0,2085 |
При определении параметров уравнения линейной регрессии используется стандартная программа пакета «Еxcel» ЛИНЕЙН ( ). В эту функцию необходимо ввести исходные данные (предварительно выделив блок ячеек, в котором строк всегда 5 столбцов: n + 1 = 2+1 = 3) в формате: =ЛИНЕЙН (интервал значений Y; блок значений Х; константа; статистика). Для запуска программы нажимаем сочетание клавиш <Shift> + <Ctrl> + <Enter>. Получим результат поиска решения в виде таблицы:
Таблица №9
bn |
bn-1 |
… |
b1 |
a0 |
s[ bn] |
s[ bn-1] |
… |
s[ b1] |
s[a0] |
R2 |
s[g] |
|||
Fрасч |
df |
|||
SSreg |
SSresid |
где приняты следующие обозначения:
a, b1,…, bn-1, bn – неизвестные величины в уравнении регрессии
s [a], s [bn] средние квадратические отклонения полученных значений
R2 - величина, характеризующая достоверность
df - число степеней свободы, определяемое по формуле: df = k – (n+1)
где k – число строк в таблице исходных данных
n – число аргументов
Ssreg – регрессионная сумма квадратов
SSresid - остаточная сумма квадратов
Эти две величины, необходимые для
вычисления результатов, при оценке полученных
данных не рассматриваются.
Таблица №10
Уравнение регрессии | |||||
b2 |
b1 |
b0 |
a0 | ||
1,623116 |
13,55135 |
-0,26597 |
21,17071 | ||
0,160443 |
5,997849 |
0,098785 |
1,653671 | ||
0,9510 |
1,0319 |
#Н/Д |
#Н/Д | ||
103,5414 |
16 |
#Н/Д |
#Н/Д | ||
330,7537 |
17,03686 |
#Н/Д |
#Н/Д |
Таким образом, искомое уравнение регрессии имеет вид:
у =21,24592 - 0,27135T - 13,80332Z1 + 1,616608Z2
После определения уравнения регрессии целесообразно оценить достоверность полученной зависимости.
Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии