Автор работы: Пользователь скрыл имя, 13 Ноября 2011 в 13:31, реферат
При функциональной зависимости двух величин значению одной из них обязательно соответствует одно или несколько точно определенных значений другой величины. Функциональная связь двух факторов возможна лишь при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. Функциональная связь одной величины с множеством других возможна, если эта величина зависит только от этого множества факторов. В реальных ситуациях существует бесконечно большое количество свойств самого объекта и внешней среды, влияющих друг на друга, поэтому такого рода связи не существуют, иначе говоря, функциональные связи являются математическими абстракциями. Их применение допустимо тогда, когда соответствующая величина в основном зависит от соответствующих факторов.
Введение………………………………………………………………………………….4
Нелинейная корреляция……………………………………………………………….6
Нелинейная корреляции для множественного уравнения регрессии..…….……10
Парная регрессия и корреляция………………………………………………….…..12
Оценка значимости уравнения регрессии…………………………………………...16
Оценка качества модели……………………………………………………………….18
Интервальная оценка функции регрессии и её параметров………………...…....21
Метод наименьших квадратов…………………………………………………….….24
Заключение……………………………………………………………………………....29
Список Литературы…………………………………………………………….….…..30
Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба-Дугласа:
, где P- объем продукции, L – затраты труда, К – величина капитала, b1+b2=1.
Логарифмируя ее, получим линейное уравнение в логарифмах
Ln P = lna + b1lnL + b2lnK
Индекс детерминации для нелинейных по оцениваемым параметрам функции принять называть «квази R2» определения по функциям, использующим логарифмические преобразования (степенная, экспонента), необходимо найти сначала теоретические значения ln y, затем трансформировать их через антилогарифмы, то есть найти теоретические значения результативного признака и далее определять индекс детерминации как «квази R2» по формуле
Величина индекса множественной корреляции, определенная как «квази R2» не будет совпадать с совокупным коэффициентом корреляции.
Для того, чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции. Он содержит поправку на число степеней свободы и рассчитывается по формуле
, где n – число наблюдений, m – число факторов.
Чем больше величина m, тем сильнее различия между .
Для линейной зависимость признаков скорректированный коэффициент корреляции определяется по той же формуле, что и индекс множественной корреляции. Отличие заключается лишь в том, что в линейной зависимости под m понимается число факторов, включенных в анализ, а в криволинейной зависимости это число параметров при х. Например, если y=f(x1,x2), то для линейной зависимости m = 2, а для регрессии вида
у = a + b1x12+b12x1 + b2x2 +b22x22
число
параметров при х = 4, то есть m = 4.
4. Парная регрессия
и корреляция
В математике мы привыкли к тому, что речь идет о функциональной зависимости, когда каждому значению одной переменной соответствует вполне определенное значение другой.
В
экономике в большинстве
Возникновение такой связи обусловлено тем, что зависимая переменная подвержена влиянию неконтролируемых или неучтенных факторов, а также случайными ошибками.
В силу неоднозначности статистической зависимости между и , представляет интерес усредненная по схема зависимости, т.е. закономерность в измерении условного математического ожидания (математическое ожидание случайной переменной , вычисленного в предположении, что переменная приняла значение ) в зависимости .
- независимая переменная, объясняющая, входная, предсказывающая, экзогенная, фактор, регрессор, факторный признак.
- зависимая переменная, функция отклика, объясняемая, выходная, результирующая, эндогенная переменная, результативный признак.
Нас интересует односторонняя зависимость случайной переменной от независимой переменной .
Определение: Когда каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой, то такая зависимость называется корреляционной.
Иначе, корреляционной зависимостью между двумя переменными называется функциональная зависимость между значениями одной и средним значением другой (условным математическим ожиданием),
это уравнение называется модельным уравнением регрессии (или просто уравнением регрессии, или функцией регрессии, а её график – линией регрессии).
Для точного описания уравнения регрессии необходимо знать условный закон распределения переменной при условии, что переменная примет значение , .
В статистической практике такой информации получить не удается, т.к. обычно имеется выборка пар значений объема .
В этом случае речь может идти о приближенном выражении, аппроксимации по выборке функции регрессии. Такой оценкой является выборочная линия (кривая) регрессии
- условная средняя переменной при фиксированном значении ,
- параметры кривой.
При должна сходиться по вероятности к функции регрессии .
Таким образом, эконометрическая модель имеет вид:
где - наблюдаемое значение зависимой переменной,
- объясненная часть, зависящая
от значений объясняющих
- случайная составляющая.
В многомерном случае, когда х – вектор, , где - могут считаться как случайными, так и детерминированными.
Итак, чтобы получить достаточно достоверные и информативные данные о распределении какой-либо случайной величины, необходимо иметь выборку её наблюдений достаточно большого объема. Такие выборки представляют собой наборы значений - число наблюдений, - количество объясняющих переменных.
Рассмотрим .
Парная регрессия – уравнение связи двух переменных .
Определение. Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки (выбора) вида модели, исходя из соответствующей теории связи между переменными.
Различают линейные и нелинейные регрессии. Нелинейные регрессии делят на два класса: регрессии, нелинейные относительно включенных объясняющих переменных, но линейных по оцениваемым параметрам, и, регрессии, нелинейные по оцениваемым параметрам.
Линейная: .
Нелинейные по объясняющим параметрам:
Регрессии, нелинейные по оцениваемым параметрам:
Если у нас есть набор значений двух переменных и то на плоскости эти значения можно отобразить точками, таким образом получаем поле корреляции, которое изображено на рис. 1.
Рис.1. Поле корреляции
Предположим, что нашей задачей является подобрать (подогнать) функцию из параметрического семейства функций , наилучшим способом описывающую зависимость y от x.
Подобрать функцию – это два шага:
1 шаг: спецификация модели
2 шаг: выбрать наилучшие значения параметров и .
В качестве меры отклонения функции от набора наблюдений можно взять:
1.
2.
3. в общем случае: , где - мера, с которой отклонение входит в функционал .
Примером такой меры может служить
функция Хубера, которая при малых
отклонениях квадратична, а при больших
линейна:
Наиболее
употребительной является функция
g вида 1.
5. Оценка значимости
уравнения регрессии
Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.
Обозначим через - теоретически вычисляемые по формуле значения, тогда
Преобразуем формулу дисперсии с учетом вышеуказанной суммы:
Далее
Так как имеет место равенство ,
и из МНК следуют два соотношения ,
то
(*)
Введем обозначения:
TSS (total sum of sguares) – вся дисперсия: сумма квадратов отклонений от среднего.
RSS (regression sum of sguares) – объясненная часть всей дисперсии (обусловленная
ESS (error sum of sguares) – остаточная сумма, дисперсия остаточная.
Определение. Коэффициентом детерминации, или долей объясненной дисперсии
называется
В силу определения .
Если , то это означает, что регрессия ничего не дает, т.е. не улучшает качество предсказания , по сравнению с тривиальным .
Если , то лежат на линии регрессии и между и y существует линейная функциональная зависимость, т.е. абсолютно точное совпадение: .
Для линейной регрессии определяется коэффициент регрессии по формуле:
или
.
Тогда