Автор работы: Пользователь скрыл имя, 07 Января 2011 в 21:56, шпаргалка
работа содержит ответы на вопросы по дисциплине "Энометрика".
Y1,2,….K=F(X1, X2,…..XK) (2.6)
Построение моделей
Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые эти связи будут описывать.
Практика построения
Основное
значение имеют линейные уравнения
в силу их простоты и логичности экономической
интерпретации.
12.Проблемы построения модели регрессии. Пути их преодоления. Важнейшим этапом построения выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. Проблема отбора факторных признаков может быть решена на основе интуитивно-логических или многомерных методов анализа. Наиболее приемлемым способом является ШАГОВАЯ РЕГРЕССИЯ. Сущность этого метода заключается в последовательном включении факторов в уравнение регрессии и последующей их проверке на значимость. Факторы поочерёдно вводятся в уравнение прямым методом. При поверке на значимость определяется на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции.
При построении модели регрессии можно столкнуться с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включёнными в модель. Данная проблема существенно влияет на результаты исследования. Устранить её можно, исключив из корреляционной модели один или несколько линейно связанных факторов или преобразовав исходные признаки в новые укрупнённые факторы.
13.
Оценка существенности
корреляционной зависимости.
Измерение тесноты и направленности связи
является важной задачей корреляционно-регрессионного
анализа. Теснота связи при линейной зависимости
измеряется с помощью линейного коэффициента
корреляции:
где
-остаточная дисперсия, которая
показывает вариацию результативного
признака под влиянием неучтённых факторов.
Проверка значимости множественного коэффициента
корреляции определяется на основе F-критерия
Стьюдента.
Если t расчётное
больше t табличного при (α; V=n-k-1), где α
- уровень значимости, V=n-k-1 число степеней
свободы.
где - дисперсия результативного признака,
k – количество объясняющих переменных.
Проверка
адекватности этой модели осуществляется
с помощью расчёта средней ошибки аппроксимации
Величина данной ошибки не должна превышать 15 %.
15. Понятие случайной переменной. Ее математическое ожидание (М.О.).
Случайная переменная - это любая переменная значение которой, не может быть точно предсказано.
М.О-ие случайной величины- это взвешенное среднее всех ее возможных значений. При этом в качестве весового коэффициента берется вероятность соответствующего исхода.
Пусть случайная величина может принимать некоторые значения (E1,E2, …,En) и вероятность их получения равна (р1,р2,…,рn).Тогда М.О. случайной переменной определяется след.образом:
(3.1)
16. Правила расчета М.О.
Существуют следующие правила расчета М.О.:
Правило1: М.О. суммы нескольких переменных равно сумме их
М.О-ий:
(3.2)
Правило2: если случайную величину умножить на константу, то ее М.О-ие увеличится во столько же раз.
Е(а´ε)= а´Е(ε) (3.3)
Правило3: М.О. константы - есть она сама: F(a)=a (3.4)
17. 4-ре условия Гаус Маркова.
Для того чтобы анализ, основанный на методе наименьших квадратов давал лучшие результаты, необходимо выполнение условия Гас- Маркова для случайных составляющих:
1. М.О. случайного члена в любом наблюдении должно быть равно нулю: Е(εi)= 0
В некоторых ситуациях случайный член будет положительным иногда отрицательным, но он не должен иметь систематического смещения не в 1-ом из направлений.
Если уравнение регрессии включает постоянный член, то это условие выполняется автоматически. Т.к. роль константы состоит в том, чтобы
определить любую тенденцию, в которой не учитывают объясняющие переменные, включенные в уравнение регрессии.
2. Дисперсия случ. члена должна быть постоянна для всех наблюдений.
pop.var (Ei)- теоретическая вариация. (3.6)
pop.var(Ei) = ^2Ei -одинакова для всех i. (3.6) Если рассматриваемое условие не выполняется, то коэффициенты регрессии будут не эффективны.
3. Это условие предполагает отсутствие системной связи между значениями случайного члена в любых 2-ух наблюдениях.
(3.7)
Т.е. если случ. член велик и
положителен в олном
4. С.ч-н
должен быть независимо распределен от
объясняющей переменной. Значение независимой
переменной в каждом наблюдении должно
считаться полностью определенным внешними
причинами, которые не учитываются в уравнении
регрессии. Если условие выполняется,
то теоретическая вариация между независимой
переменной и случ. членом равна 0.
18.Условия гомо и гетероскедастич-сти. Последствия гетероске-сти.
Первые два условия Гаус
одинакова для всех i. Вместе с тем возможно, что теори-ское распред-е случайного члена яв-ся разным для различ-х наблюд-й выборки. Это не означает, что слячайный член будет иметь особенно большие отклонения в конце выборки, но вероят-сть их получения будет высокая, т.е имеет место условие гетероскедаст-ти: Ф(3.6) не одинакова для всех.
Рис. 1- Различия м/д гомо и гетероскедас-тью.
На рис.2 показано, как будет выглядеть характерная диаграмма распределения ф-ции y(x), если имеет место гетероскедаст-сть. Рис.2-Влияние гетероскед-сти на распредел-е ф-ции y(x).
При
отсутствии гетероскед-сти
19.Обнаружение гетероскедастичности.Тест ранговой корреляции Спирмена, тест Глейзера.
Проявление проблем гетероскед-сти можно предвидеть основываясь на знаниях характера данных. В этих случаях можно предпринимать действия на этапе спецификации модели регрессии. Это позволит уменьшить или устранить необходимость формальной проверки. В настоящее время используются следующие виды тестов гетероскед-сти, в которых делается предположение о наличие зависимости между дисперсией случайного члена и величиной объясняющей переменной: 1)Тест ранговой корреляции Спирмена.
При его выполнении предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения X и поэтому в регрессии, оцениваемой с помощью метода наименьших квадратов абсолютные величины остатков и значение X будут коррелированны. Данные по X и остатки упорядочиваются, а затем определяется коэффициент ранговой корреляции: Ф(3.9),
Где Дi- разность между рангом X и рангом е, е- остатки(отклонение) фактических значений Y от теоретических значений.
Чтобы использовать данный метод следует оценить регрессионную зависимость y(x) с помощью обычного метода наименьших квадратов, а затем вычислить абсолютные величины остатков еi по модулю, оценив их регрессию.
20.Обнаружение гетероскед-сти. Тест Голдфельда Квандта. Появление проблем гетероскед-сти можно предвидеть основываясь на знаниях характера данных. В этих случаях можно предпринимать действия на этапе спецификации модели регрессии. Это позволит уменьшить или устранить необходимость формальной проверки. В настоящее время используются следующие виды тестов гетероскед-сти, в которых делается предположение о наличие зависимости между дисперсией случайного члена и величиной объясняющей переменной: