Построение и анализ качества регрессионной модели (Германия)

Автор работы: Пользователь скрыл имя, 17 Апреля 2011 в 12:34, курсовая работа

Краткое описание

В данной работе была исследована совокупность данных и построена эконометрическая модель. В ходе работы было доказано, что большее влияние на поведение GDP оказывает Export, в то время как влияние ExRate незначительное. Проверка построенных моделей на соответствие предпосылкам МНК проводилась при помощи ряда тестов. Поэтому материалы данной работы можно использовать также и для сравнения простоты использования, трактовки результатов и итогов различных тестов.

Содержимое работы - 1 файл

Реферат. Германия.doc

— 794.50 Кб (Скачать файл)

Для проверки используем 3 метода: 

  1. статистика  Дарбина-Уотсона. Значение статистики уже было вычислено в 4 пункте:

DW= 1,74155552.

 По  “грубому” правилу автокорреляции  остатков в данной модели нет ( т.к. 1,5 <1,74< 2,5) 

  1. метод рядов. Для начала определим количество положительных и отрицательных отклонений модели (см. приложение 3). Затем найдем количество рядов ( непрерывных последовательностей  одинаковых знаков).

Пусть n- объем выборки;

          n1- количество положительных отклонений

 n2 – количество отрицательных

k- количество рядов 

По таблице  критических значений для нахождения АК по методй рядов, определим нижние и верхние границы k.

В нашем  случае

N=32

N1=17

N2=15

K=16

k1= 11; k2=23 

Следовательно k1< k < k2 и автокорреляция остатков данной модели отсутствует. 

С) графический  метод (путем построения графиков зависимости e от e(-1)):

 

Найдем, в каких четвертях главным образом сосредоточены точки на графике: 

I 9
III 7
   
II 8
IV 7
 
 

Преобладание  точек в 1 и 3 четвертях указывает  на наличие положительной линейной зависимости между отклонениями в момент времени t и в предыдущий момент времени (t-1), т.е. на положительную автокорреляцию в модели. 

8.Проверим построенную модель на наличие гетероскедастичности остатков путем проведения теста Парка. Хотелось бы отметить, что данная проблема в основном характерна для пространственных (перекрестных)данных, а значит вероятность обнаружения гетероскедастичности невысокая. 

Смысл теста Парка состоит в том, что если в модели присутствует гетероскедастичность, то можно предполагать наличие линейной зависимости между объясняющими переменными и оценкой дисперсии  отклонений.

Для того, чтобы однозначно трактовать полученные результаты, построим два отдельных уравнения регрессии для каждой из объясняющих переменных (см. приложение: 

Export 

ВЫВОД ИТОГОВ    
         
Регрессионная статистика      
Множественный R 0,0148      
R-квадрат 0,0002      
Нормированный R-квадрат -0,033      
Стандартная ошибка 1,5575      
Наблюдения 32      
         
Дисперсионный анализ    
  df SS MS F
Регрессия 1 0,016 0,016 0,0066
Остаток 30 72,773 2,4258  
Итого 31 72,789    
         
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 19,268 19,94 0,9663 0,3416
Переменная X 1 -0,132 1,6253 -0,081 0,9359
 
 

Коэффициент b1 – незначим как по грубому правилу t-статистики(<1), так и при анализе P-значения (незначим фактически на любом уровне значимости, a<P). Следователь не существует взаимосвязи между остатками и переменной,т.е. отсутствует гетероскедастичность. 

ExRate 

ВЫВОД ИТОГОВ    
         
Регрессионная статистика      
Множественный R 0,2082      
R-квадрат 0,0433      
Нормированный R-квадрат 0,0114      
Стандартная ошибка 1,5235      
Наблюдения 32      
         
Дисперсионный анализ    
  df SS MS F
Регрессия 1 3,154 3,154 1,3588
Остаток 30 69,635 2,3212  
Итого 31 72,789    
         
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 2,943 12,619 0,2332 0,8172
Переменная X 1 3,1756 2,7242 1,1657 0,2529
 
 

Коэффициент b1 в данном случае слабо взаимосвязан с GDP. Тем не менее, коэффициент статистически не значим(a<P), а следовательно гетероскедастичность не выявлена. 

9. Проверим  модель на соответствие третьей предпосылке- отсутствии мультиколлинеарности. 

Как и  предполагалось при анализе корреляционной матрицы, в модели присутствует мультиколлинеарность(высокий  частный коэффициент корреляции). 

10. проверим  модель на наличие точки разрыва.  В целом, при анализе графиков и проведении описательной статистики, была подтверждена равномерность рядов, отсутствие точек разрыва и выбросов.

Используем  для подтверждения результаты теста  Чоу.

Для начала, предположим, что разрыв наблюдается на 17 наблюдении. Разделим выборку на две части и найдем для каждой из них значение RSS(RSS для выборки в целом было найдено в предыдущих пунктах): 

RSS0= 2885020830

RSS1=1049108196

RSS2=1223780256

Рассчитаем  по формуле F наблюдаемое и сравним с F статистич. из таблицы: 

Fн = ((RSS0-RSS1-RSS2)/(RSS1+RSS2))*((n-2(m+1))/(m+1))= 2,334099

Fст = 8,64 

Fн < Fст , следовательно принимаем гипотезу об отсутствии необходимости разбиения, т.е. об отсутствии точки разрыва. 

11.

Скорректируем уравнение путем удаления незначимой переменной ExRate(имеет наименьшее значение t-статистики).

Построим  новую модель с помощью Excel(приложение 6). 

GDP= 386019 + 0,7721*Export 

Проведем  анализ новой модели: t-статистика коэффициента b1 указывает на наличие очень сильной взаимосвязи; R-высокий(переменная Export на 90% объясняет поведение GDP); помимо этого, можно предположить, что в новой модели также отсутствует автокорреляция и гетероскедастичность. Следовательно, модель 2 является качественной и адекватной.

Таким образом, можно утверждать, что путем исключения переменной исходная модель была улучшена.

Проверим  последнее утверждение с помощью  F-статистики. Для проверки используем гипотезу, предполагающую, что объяснение поведения эндогенной переменной будет адекватнее у новой(короткой) регрессии.

Рассчитаем  значение F-статистики: 

Fн =( ( R1^2-R2^2)/k)/(1-R^1)/(n-m-1)= 0,939 

Fст = 62,3

Fн< Fст , следовательно принимаем нулевую гипотезу о том, что RSS обеих моделей равны, а значит исключение переменной является целесообразным. 

Выводы 

В ходе исследования была достигнута цель работы: построена качественная эконометрическая модель и проведен ее детальный анализ. Оптимальной по итогам оказалась вторая модель( зависимость GDP от Export), которая была получена путем исключения незначимой переменной. Обоснованность исключения была также подтверждена по итогам F-статистики.

Помимо  проведения анализа значимости переменных, модель была исследована на соответствие предпосылкам МНК. Выяснилось, что в построенной модели тесты не выявили наличие автокорреляции и гетероскедастичности.

Для выявления  вышеупомянутых недостатков в работе был использован ряд тестов (в частности для исследования автокорреляции). Все тесты опровергли наличие автокорреляции остатков, однако наиболее простым в использовании и трактовке результатов оказался графический метод(тем не менее данный метод может дать неоднозначные результаты в других случаях). 
 
 

Приложение 

1) 
 

ВЫВОД ИТОГОВ            
                 
Регрессионная статистика              
Множественный R 0,95121              
R-квадрат 0,90481              
Нормированный R-квадрат 0,89824              
Стандартная ошибка 9974,14              
Наблюдения 32              
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия(ESS) 2 2,7E+10 1,4E+10 137,823 1,55E-15      
Остаток(RSS) 29 2,9E+09 9,9E+07          
Итого(TSS) 31 3E+10            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 369831 19579,8 18,8884 0,00 329785,6 409876 329786 409876
Переменная X 1 0,71689 0,07364 9,73475 0,00 0,566272 0,8675 0,56627 0,8675
Переменная X 2 272,594 281,375 0,96879 0,34 -302,8822 848,069 -302,88 848,069

Информация о работе Построение и анализ качества регрессионной модели (Германия)