Автор работы: Дарья *, 05 Сентября 2010 в 19:37, шпаргалка
Пространственные данные – характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделенным сходным объектам в один и тот же момент времени. Таковы, например, данные по курсам покупки или продажи наличной валюты в конкретный день по разным обменным пунктам г. Москвы. Другим примером является, скажем, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени или период.
XTY=aXTX
Для погашения а умножим обе части этого уравнения на (ХТХ)-1, тогда
а= (XTХ)-1∙XTY
Решение задачи нахождения матицы, а возможно лишь в том случае, если строки и столбцы матрицы Х линейно независимы.
Свойства оценок МНК.
В тех случаях, когда предпосылки выполняются, оценки, полученные по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности.
Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям.
Для практических целей важна не только несмещенность, но и эффективность оценок. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Поэтому несмещенность оценки должна дополняться минимальной дисперсией.
Степень
достоверности доверительных
25. Понятие и причины автокорреляции остаток. Последствия автокорреляции остатков. Обнаружение автокорреляции остатков.
Независимость остатков проверяется с помощью критерия Дарбина – Уотсона.
Корреляционная зависимость между текущими уровнями некоторой переменной и уровнями этой же переменной, сдвинутыми на несколько шагов, называется автокорреляцией.
Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.
Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью критерия Дарбина – Уотсона. Численное значение коэффициента равно
Значение dw статистики близко к величине 2(1 – r(1)), где r(1) - выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина - Уотсона распределено в интервале от 0 до 4. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения критерия соответствуют положительной автокорреляции остатков, большие значения - отрицательной. Статистика учитывает только автокорреляцию первого порядка. Оценки, получаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения этих границ для уровня значимости α = 0,05 даны в специальных таблицах. При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 – ряд остатков не коррелирован; dw < d1 – остатки содержат автокорреляцию; d1 < dw < d2 – область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с табличными значениями dw критерий следует преобразовать по формуле dw´=4 – dw.
Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw < d2 ), то применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции
.
Для
принятия решения о наличии
или отсутствии автокорреляции
в исследуемом ряду
26. Проверка качества многофакторных регрессионных моделей. Оценка всего уравнения регрессии.
Проверка
гипотез с помощью t – статистик
и F – статистик. Качество регрессионной
модели определяется на основе оценки
ее точности. Точность модели оценивается
с помощью средней
Коэффициентом
детерминации R2 называется отношение
Коэффициент детерминации показывает,
какая доля вариации (изменения) результирующего
признака Y учтена в модели и объясняется
изменением факторных переменных. Свойства
R2: 1)В силу определения
; 2)R2 = 1: все остатки Ei =0; 3)R2 = 0 - вариация
зависимой переменной полностью обусловлена
воздействием неучтенных в модели переменных.
Чем ближе R2 к 1, тем лучше качество
модели, тем теснее наблюдения примыкают
к линии регрессии. Замечание . Коэффициент
детерминации R2 явл-ся универсальной,
пригодной для любого типа эконометрической
модели (линейной «не», парной, множественной)
мерой взаимосвязи между переменными:
1)В случае парной линейной регрессии коэффициент
детерминации R2 равен квадрату
коэффициента парной корреляции
; 2)Для линейной модели множественной
регрессии величина
называется коэффициентом множественной
корреляции и характеризует тесноту зависимости
м/у результирующей переменной и совокупностью
учтенных в модели факторов; 3)Для нелинейных
регрессионных моделей величина
называется индексом корреляции. Индекс
корреляции используется для характеристики
тесноты связи м/у переменными в соответствующей
нелинейной форме. Для оценки значимости
уравнения регрессии (как парной, так и
множественной) используется F- тест
Фишера. 1). Вычисляют статистику
, где R2 – коэффициент детерминации;
n - количество наблюдений; p -
количество факторов, включенных в модель.
2). Критическое значение Fкр определяют
при заданном уровне значимости a
(обычно 5%) и числах степеней свободы k1=p,
k2= n – p – 1 по таблице критических точек
распределения Фишера. 3). Если
, то уравнение модели считается значимым,
его использование целесообразно. Если
, то уравнение модели значимым не является.
После проверки по критерию Фишера значимости
уравнения в целом следует провести оценку
значимости отдельных параметров данного
уравнения с помощью теста Стъюдента.
1). Для каждого коэффициента модели вычисляют
t- статистику
. Здесь
- стандартное отклонение коэффициента
aj , которое зависит от стандартной ошибки
оценки
и формулы вычисления этого коэффициента.
Можно показать, что
, где cj+1 j+1 –
соответствующий диагональный элемент матрицы . 2). Критическое значение tкр зависит от заданного уровня значимости a и числа степеней свободы . Его определят по таблице Стъюдента. 3). Если , то соответствующий коэффициент aj является значимым, переменную Хj следует сохранить в модели. Если , то коэффициент aj значимым не является, нужно исключить переменную Хj из модели.
Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y
Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: . Альтернативная ей гипотеза о значимости уравнения — гипотеза о неравенстве нулю параметров регрессии.
Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.Для модели парной регрессии:
В качестве
меры точности применяют несмещенную
оценку дисперсии остаточной компоненты,
которая представляет собой отношение
суммы квадратов уровней остаточной компоненты
к величине (n- k -1), где k – количество факторов,
включенных в модель. Квадратный корень
из этой величины (
) называется стандартной ошибкой оценки.
27. Проверка качества многофакторных регрессионных моделей. Коэффициент детерминации R2. Скорректированный R2. Проверка гипотез с помощью t – статистик и F – статистик. Качество регрессионной модели определяется на основе оценки ее точности. Точность модели оценивается с помощью средней относительной ошибки аппроксимации (%). Предварительно по уравнению модели нужно рассчитать значения ; остатки и относительные погрешности для каждого уровня исходных данных. Модель считается достаточно точной, если ; удовлетворительной по точности, если ; неудовлетворительной по точности, если . Замечание. В качестве меры точности используется также несмещенная оценка дисперсии остаточной компоненты, квадратный корень из которой называется стандартной ошибкой оценки . Здесь n – количество наблюдений; р – количество факторов, включенных в модель (для парной модели р = 1).
Коэффициентом
детерминации R2 называется отношение
Коэффициент детерминации показывает,
какая доля вариации (изменения) результирующего
признака Y учтена в модели и объясняется
изменением факторных переменных. Свойства
R2: 1)В силу определения
; 2)R2 = 1: все остатки Ei =0; 3)R2 = 0 - вариация
зависимой переменной полностью обусловлена
воздействием неучтенных в модели переменных.
Чем ближе R2 к 1, тем лучше качество
модели, тем теснее наблюдения примыкают
к линии регрессии. Замечание . Коэффициент
детерминации R2 явл-ся универсальной,
пригодной для любого типа эконометрической
модели (линейной «не», парной, множественной)
мерой взаимосвязи между переменными:
1)В случае парной линейной регрессии коэффициент
детерминации R2 равен квадрату
коэффициента парной корреляции
; 2)Для линейной модели множественной
регрессии величина
называется коэффициентом множественной
корреляции и характеризует тесноту зависимости
м/у результирующей переменной и совокупностью
учтенных в модели факторов; 3)Для нелинейных
регрессионных моделей величина
называется индексом корреляции. Индекс
корреляции используется для характеристики
тесноты связи м/у переменными в соответствующей
нелинейной форме. Для оценки значимости
уравнения регрессии (как парной, так и
множественной) используется F- тест
Фишера. 1). Вычисляют статистику
, где R2 – коэффициент детерминации;
n - количество наблюдений; p -
количество факторов, включенных в модель.
2). Критическое значение Fкр определяют
при заданном уровне значимости a
(обычно 5%) и числах степеней свободы k1=p,
k2= n – p – 1 по таблице критических точек
распределения Фишера. 3). Если
, то уравнение модели считается значимым,
его использование целесообразно. Если
, то уравнение модели значимым не является.
После проверки по критерию Фишера значимости
уравнения в целом следует провести оценку
значимости отдельных параметров данного
уравнения с помощью теста Стъюдента.
1). Для каждого коэффициента модели вычисляют
t- статистику
. Здесь
- стандартное отклонение коэффициента
aj , которое зависит от стандартной ошибки
оценки
и формулы вычисления этого коэффициента.
Можно показать, что
, где cj+1 j+1 –
соответствующий
диагональный элемент матрицы
. 2). Критическое значение tкр зависит
от заданного уровня значимости a
и числа степеней свободы
. Его определят по таблице Стъюдента.
3). Если
, то соответствующий коэффициент
aj является значимым, переменную
Хj следует сохранить в модели. Если
, то коэффициент aj значимым не
является, нужно исключить переменную
Хj из модели.
29. Оценка влияния отдельных факторов на зависимую переменную на основе модели (коэффициенты эластичности, b - коэффициенты).
Важную роль при оценке влияния факторов играют коэффициенты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бета-коэффициенты b(j).
Эластичность
Y по отношению к Х(j) определяется
как процентное изменение Y, отнесенное
к соответствующему процентному изменению
Х. В общем случае эластичности не постоянны,
они различаются, если измерены для различных
точек на линии регрессии. По умолчанию
стандартные программы, оценивающие эластичность,
вычисляют ее в точках средних значений:
Эластичность ненормирована и может изменяться
от -∞ до +∞. Важно, что она безразмерна,
так что интерпретация эластичности Эj=2.0
означает, что если
изменится на 1%, то это приведет к изменению
на 2%. Если Эj=-0.5, то это означает, что увеличение
на 1% приведет к уменьшению
на 0.5%. Высокий уровень эластичности означает
сильное влияние независимой переменной
на объясняемую переменную.
где Sxj — среднеквадратическое отклонение фактора j
где .
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов.
Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.