Шпаргалка по эконометрике

Автор работы: Дарья *, 05 Сентября 2010 в 19:37, шпаргалка

Краткое описание

Пространственные данные – характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделенным сходным объектам в один и тот же момент времени. Таковы, например, данные по курсам покупки или продажи наличной валюты в конкретный день по разным обменным пунктам г. Москвы. Другим примером является, скажем, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени или период.

Содержимое работы - 1 файл

шпоры мои на печать!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!.doc

— 511.50 Кб (Скачать файл)

1) В  рег. модели величина Еi является случайной, а объясняющая переменная Xi – не случайная.

2) Мат.  ожидание ошибки = 0 М(Еi)=0

3) Дисперсия  ошибки (возмущения) постоянна для любого У: G²(Ei)=G², i=1,n или D(Ei)=G².

4) Возмущения  Ei и Ej (i≠j) являются независимыми или М(Еi Ej)=0

5) Случайная  составляющая Ei подчиняется НЗР.

Оценкой линейной модели yi = β0 + β1xi + Ei по выборке является уравнение регрессии ^y=b0+b1xi

^y – условное мат. ожидание переменной у, вычисленное при фиксированном значении х.

Воздействие неучтённых случ. факторов и ошибок модели опр-ся с помощью остаточной дисперсии G².

Несмещённая оценка это дисперсии есть выборочная остаточная дисперсия S².

S² = (∑(yi-^yi)²)/n-2 = ∑ei²/n-2

где ei = yi-^yi – невязка (ошибка, остатки) модели (остат. компонента). 

10. Основные предпосылки метода наименьших квадратов.

Свойства коэффициентов  регрессии существенным образом зависят от свойств случайной составляющей. Для того чтобы регрессионный анализ, основанный на обычном методе наименьших квадратов, давал наилучшие из всех возможных результаты, должны выполняться следующие условия, известные  как условия Гаусса – Маркова.

1) Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю. Фактически если уравнение регрессии включает постоянный член, то обычно это условие выполняется автоматически, так как роль константы состоит в определении любой систематической тенденции Y, которую не учитывают объясняющие переменные, включенные в уравнение регрессии.

2) возмущение (или зависимая переменнаяYi) есть величина случайная, а объясняющая переменная Xi- величина неслучайная.

Если это условие выполнено, то теоретическая ковариация между независимой переменной и случайным членом равна нулю.

 3) отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях. Случайные составляющие должны быть  независимы друг от друга.

В силу того, что  , данное условие можно записать следующим образом: . Возмущения не коррелированны (условие независимости случайных составляющих в различных наблюдениях).

Это условие  означает, что отклонения регрессии (а значит, и сама зависимая переменная) не коррелируют.

4) дисперсия случайной составляющей должна быть постоянна для всех наблюдений Величина , конечно, неизвестна.

5) подчинение НЗР 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

12. Линейная модель  парной регрессии.  Оценка параметров  с помощью МНК.

Если  в построении модели участвует 1 независимый  фактор и линейная независимая функция  – парная линейная модель регрессии . xi – независимый фактор, уi – исследуемая величина, ei – ошибки модели (остатки) ei=y-y, , - параметры модели. задает начальное условие развития показателя у , - коэф-т регрессии, который показывает на сколько изменится величина у при изменении фактора на 1 единицу, характеризует интенсивность изменения у с каждой единицей изменения фактора. Если >0, то связь между переменными прямая и регрессия положительная, если <0, то связь обратная и регрессия отрицательная.

Основную  информацию для анализа качества регрессионного уравнения можно  получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.

1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде. 2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле: . Для этого критерия задаются 2 таблич. границы d1 и d2.

3.Для  проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.

4.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: , р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки: . Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение . 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка. . 

13. Показатели качества  модели парной  регрессии.

Качество  регрессионной модели определяется на основе оценки ее точности, вычисления коэффициента детерминации, проверки значимости уравнения модели в целом и значимости отдельных коэффициентов этого уравнения. 1)Точность модели. Точность модели оценивается с помощью средней относительной ошибки аппроксимации  (%),    ,

предварительно  по уравнению модели нужно рассчитать значения YTi;  остатки Ei=Yi- YTi  и относительные погрешности   для каждого уровня исходных данных. Модель считается достаточно точно, если  ;  удовлетворительной по точности, если  ;  неудовлетворительной по точности, если  .

Коэффициент детерминации.

Рассмотрим  вариацию (разброс) значений  yi  относительно среднего значения  ,  которая определяется величиной .  Выразим      и запишем  Учитывая уравнение модели линейной регрессии и необходимые условия экстремума, согласно которым найдены коэффициенты  aj  этого уравнения, можно показать, что третье слагаемое в этом равенстве

Во втором слагаемом величина  yтi  определяется по уравнению регрессии. Другими словами, это величина y, спрогнозированная по значениям факторов Хi  в данном наблюдении. Т.О., представляет собой часть вариации  y,  объясненную регрессионным уравнением.В первом слагаемом остаток  выражает расхождение между фактическим и спрогнозированным значениями величины  у. Следовательно, - это та часть вариации у, которую мы не можем объяснить с помощью уравнения регрессии. Т.О, вариацию значений  y  можно представить в виде суммы двух частей: «объясненной» уравнением регрессии и «необъясненной»

 Коэффициентом детерминации  R2  называется отношениее .

Коэффициент детерминации показывает, какая доля вариации (изменения) результирующего признака  Y  учтена в модели и объясняется изменением факторных переменных.Свойства  R2:1В силу определения  .2R2 = 1  означает точную подгонку: все остатки Ei =0.3R2 = 0  означает, что вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных.

Зам.1 Коэффициент детерминации  R2  является универсальной, пригодной для любого типа эконометрической модели (линейной, нелинейной, парной, множественной) мерой взаимосвязи между переменными:В случае парной линейной регрессии коэффициент детерминации R2  равен квадрату коэффициента парной корреляции  .

Оценка  значимости уравнения  регрессии. Проверить значимость уравнения регрессии – значит установить: 1) в какой степени оно соответствует экспериментальным данным; достаточно ли включенных в него факторных переменных для описания результирующего признака; 2)целесообразно ли использование этого уравнения в дальнейших расчетах. Для оценки значимости уравнения регрессии (как парной, так и множественной) используется  F- тест Фишера-Снедекора. 1) Вычисляют статистику  ,  где R2 – коэффициент детерминации;n  -  количество наблюдений; p  -  количество факторов, включенных в модель (в случае парной регрессии р=1). 2) Критическое значение  Fкр  определяют при заданном уровне значимости  a (обычно 5%) и числах степеней  

свободы  k1=p,  k2= n – p – 1  по таблице критических точек распределения Фишера или в Excel : мастер функций / статистические / FРАСПОБР. Если  , то уравнение модели считается значимым, его использование    целесообразно. Если  ,  то уравнение модели значимым не является, его использование не улучшает качество прогнозирования по сравнению с простейшей моделью .

14.Анализ  статистической значимости параметров модели парной регрессии.

Значения  yi , соотв . данным Хi при теорит. знач. α и ß, являются случайными. Случайными яв-ся и рассчитанные по ним значения коэф-ов α и ß.

Надёжность  получаемых оценок α и ß  и    зависит от дисперсии случ. Отклонений (ошибок). По данным выборки эти отклонения и, соотв-но, их дисперсия не оцениваются- в расчётах используются откл. Зависимой переменной  от её      значений: . Т.К. ошибки  нормально распределены, то среднеквадратическое откл. Ошибок используется для измерения этой вариации. Среднек-откл. Коэффициентов известны как стандартные ошибки (отклонения):

где  – среднее значение независимой пер-ой  ;       -  стандартная ошибка вычесл-ся- ;

Проверка  знач-ти отдель-х  коэффиц-ов регрессии  связанна с опр. расчёт. знач. – t  критерия  (t - статистики) для соотв-их коэфф-в регрессии:              

Затем расчитанн-е знач-я  t сравниваются с табл. знач. t .Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюд.) и соотв-щем  уровне значимости α  ( 0,1;0,05). Если расчётное значение  t -критерия с (n -2) степенями свободы превосходит его табл.значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соотв-щий этому коэф-ту, следует исключить из модели (при этом её качество не ухудшается). 

11.Свойства  оценок МНК.

В тех  случаях, когда предпосылки выполняются, оценки, полученные по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности.

Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям.

Для практических целей важна не только несмещенность, но и эффективность оценок. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Поэтому несмещенность оценки должна дополняться минимальной дисперсией.

Степень достоверности доверительных интервалов параметров регрессии обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Информация о работе Шпаргалка по эконометрике