Определение параметров нестационарного нелинейного уравнения регрессии

Автор работы: Пользователь скрыл имя, 06 Декабря 2012 в 11:04, лабораторная работа

Краткое описание

В данной работе необходимо рассмотреть линейную модель изучаемого экономического объекта. В качестве объекта исследования представлен производственный процесс, о котором известны следующие статистические данные:
1. Y(t) – ставка % рефинансирования Центробанка;
2. Х1(t) – уровень безработицы, %
3. Х2(t) – уровень инфляции, %

Содержание работы

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 3
ГЛАВА 2. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ НАБЛЮДЕНИЙ
МЕТОДОМ ИРВИНА 4
ГЛАВА 3. ПРИВЕДЕНИЕ ИСХОДНОГО НЕЛИНЕЙНОГО УРАВНЕНИЯ
РЕГРЕССИИ К ЛИНЕЙНОМУ ПУТЕМ ЗАМЕНЫ ПЕРЕМЕННОЙ 5
ГЛАВА 4. ПРОВЕРКА НАЛИЧИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ
ФАКТОРАМИ 7
ГЛАВА 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ 9
ГЛАВА 6. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ УРАВНЕНИЯ
В ЦЕЛОМ И ОТДЕЛЬНЫХ КОЭФФИЦИЕНТОВ УРАВНЕНИЯ 12
ГЛАВА 7.ПРОВЕРКА ОТСУТСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И
АВТОКОРРЕЛЯЦИИ ОСТАТКОВ, АДЕКВАТНОСТЬ И ТОЧНОСТЬ
УРАВНЕНИЯ РЕГРЕССИИ 14
7.1. ПРОВЕРКА ОТСУТСТВИЯ ИЛИ НАЛИЧИЯ ГЕТЕРОСКЕДАСТИЧ-
НОСТИ ИССЛЕДУЕМОЙ МОДЕЛИ 14
7.2. ПРОВЕРКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ 15
7.3 ОЦЕНКА АДЕКВАТНОСТИ РЕГРЕССИОННОЙ МОДЕЛИ 17
7.4. ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 20
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23

Скачать целиком (76.52 Кб) Сколько стоит заказать работу?

Содержимое работы - 1 файл

Отчёт 3.doc

— 271.50 Кб (Скачать файл)

Глава 4. Проверка наличия мультиколлинеарности между факторами

Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии.

Проблема мультиколлинеарности возникает только для случая множественной регрессии, поскольку в парной регрессии лишь одна объясняющая переменная.

Оценка коэффициента регрессии может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.

Это бывает в том случае, когда какие-то факторы линейно связаны между собой и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.

Природа мультиколлинеарности нагляднее всего может быть продемонстрирована на примере совершенной мультиколлинеарности, то есть строгой линейной связи между объясняющими переменными.

Например, имеем уравнение вида:

у_i = α + β₁x_1i + β₂x_2i + U_i

Если x_2i =λx₁, то:

у_i = α + β₁x_1i + β₂ λ x_1i + U_i

у_i = α + x_1i (β₁ + λ β₂) + U_i

При определении величин коэффициентов данного уравнения, мы найдем оценку α = a и

γ = β₁ + λβ₂. Из данного выражения невозможно найти оценки β₁ и β₂ в отдельности, так как имеется одно уравнение с двумя неизвестными.

Следовательно, совершенная мультиколлинеарность не позволяет определить коэффициенты регрессии, то есть β₁ и β₂ и разделить вклады переменных х₁ и х₂ в объяснение поведения переменной у.

Несовершенная, то есть стохастическая связь переменных х₁ и х₂ характеризуется величиной коэффициента парной корреляции между ними:

Матрица коэффициентов парной корреляции

	Y	Z1	Z2	T
Y	1
Z1	-0,49258	1
Z2	0,963733	-0,51662	1
T	-0,74588	0,857272	-0,71499	1

Для проверки значимости коэффициентов парной корреляции используют критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение критерия Стьюдента, который рассчитывается по формуле:

Где r-значение коээффициента парной корреляции; n-число наблюдений (n=20).

Полученные данные занесем в таблицу №5.

Чем больше по абсолютной величине значение корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных х₁ и х₂ на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.

Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.

Мультиколлинеарность обычно приводит к вырождению матрицы переменных и, следовательно, к тому, что главный определитель уменьшает свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.

При проверке наличия мультиколлинеарности между факторами, мы получили следующее значение коэффициента корреляции: r_z1z2=-0,51662 ; r_z1z2<0,8

Значит, полученное нами расчетное значение коэффициента парной корреляции меньше предельного значения, следовательно, в данной модели отсутствует мультиколлинеарность между факторами.

Проверка значимости коэффициентов парной корреляции, используя t-критерий Стьюдента

	Y	Z	Z	T
Y	1
Z	2,401347	1
Z	15,32131	2,5599	1
T	4,750899	7,064206	4,338906	1

Сравним t_ф (фактическое значение) для каждого коэффициента парной корреляции с t-критическим (табличное значение) для 5 % уровня значимости (двустороннего) и числа степеней свободы n = n - 2 (в нашем случае n = 18). В данном случае t_кр= 2,101.

Если t_ф > t_кр, то коэффициент парной корреляции признается значимым. В рассматриваемом случае все коэффициенты парной корреляции признаются значимыми.

Глава 5. ПОСТРОЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ

Произведем построение уравнения регрессии вида (2). Для построения статистической модели, характеризующей значимость и точность найденного уравнения регрессии, используем табличный процессор «Excel», применив команды «Сервис» - «Анализ данных» - «Регрессия».

В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал Х» вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Затем устанавливаем флажки в окнах «Метки» и «Уровень надежности». Установим переключатель «Новый рабочий лист» и поставим флажки в окошках «Остатки», «График остатков». После всех вышеперечисленных действий нажимаем кнопку «ОК» в диалоговом окне «Регрессия». Далее производим форматирование полученных результатов расчета коэффициентов уравнения регрессии и статистических характеристик. Получаем следующие таблицы:

Таблица №5

Регрессионная статистика
Множественный R	0,9752
R-квадрат	0,9510
Нормированный R-квадрат	0,9418
Стандартная ошибка	1,0319
Наблюдения	20

Таблица №6

Дисперсионный анализ
	df		SS		MS		F		Значимость F
Регрессия	3		330,7338		110,2446		103,414		1,09E-10
Остаток	16		17,05682		1,066051
Итого	19		347,7906
Таблица №7
		Коэф-фициен-ты	Стан-дартная ошибка	t-статис-тика	P-Значение	Нижние 95%		Верхние 95%		Нижние 95,0%	Верхние 95,0%
Y-пересече-ние		21,24592	1,662909	12,77636	8,25E-10	17,72071		24,77113		17,72071	24,77113
Z1		-13,8033	6,122783	2,25442	0,038539	0,823604		26,78304		0,823604	26,78304
Z2		1,616608	0,16131	10,02175	2,67E-08	1,274646		1,95857		1,274646	1,95857
T		-0,27135	0,100811	-2,69165	0,016044	-0,48506		-0,05764		-0,48506	-0,05764

Таблица №8 ВЫВОД ОСТАТКА
Наблюдение	Предсказанный Y	Остатки
1	42,11714	-0,07714
2	35,19378	0,676222
3	36,79666	0,393344
4	36,62479	-0,33479
5	34,43152	0,008479
6	34,29928	-0,73928
7	30,14897	-0,71897
8	28,3476	0,122401
9	29,2477	-1,1377
10	29,61504	1,444959
11	27,88182	-0,36182
12	29,08309	-0,83309
13	29,94998	2,340019
14	30,53102	-0,30102
15	30,43222	-0,53222
16	31,13292	1,687078
17	33,54188	-1,25188
18	27,14929	-0,67929
19	27,1268	0,503196
20	24,5985	-0,2085

При определении параметров уравнения линейной регрессии используется стандартная программа пакета «Еxcel» ЛИНЕЙН ( ). В эту функцию необходимо ввести исходные данные (предварительно выделив блок ячеек, в котором строк всегда 5 столбцов: n + 1 = 2+1 = 3) в формате: =ЛИНЕЙН (интервал значений Y; блок значений Х; константа; статистика). Для запуска программы нажимаем сочетание клавиш <Shift> + <Ctrl> + <Enter>. Получим результат поиска решения в виде таблицы:

Таблица №9

Уравнение регрессии

b_n	b_n-1	…	b₁	a₀
s[ b_n]	s[ b_n-1]	…	s[ b₁]	s[a₀]
R²	s[g]
F_расч	df
SS_reg	SS_resid

где приняты следующие обозначения:

a, b₁,…, b_n-1, b_n – неизвестные величины в уравнении регрессии

s [a], s [b_n] средние квадратические отклонения полученных значений

R² - величина, характеризующая достоверность

df - число степеней свободы, определяемое по формуле: df = k – (n+1)

где k – число строк в таблице исходных данных

n – число аргументов

Ssreg – регрессионная сумма квадратов

SSresid - остаточная сумма квадратов

Эти две величины, необходимые для вычисления результатов, при оценке полученных данных не рассматриваются.

Таблица №10

	Уравнение регрессии
b₂		b₁	b₀	a₀
1,623116		13,55135	-0,26597	21,17071
0,160443		5,997849	0,098785	1,653671
0,9510		1,0319	#Н/Д	#Н/Д
103,5414		16	#Н/Д	#Н/Д
330,7537		17,03686	#Н/Д	#Н/Д

Таким образом, искомое уравнение регрессии имеет вид:

у =21,24592 - 0,27135T - 13,80332Z₁ + 1,616608Z₂

После определения уравнения регрессии целесообразно оценить достоверность полученной зависимости.

Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии