Автор работы: Пользователь скрыл имя, 18 Ноября 2011 в 17:00, курсовая работа
Численность безработного населения. Это социальное явление непосредственно связано с результирующим показателем, так как при отсутствии работы, человек лишается большой доли своего денежного дохода.
Цель курсовой работы – прогнозирование величины среднемесячных денежных доходов в расчёте на душу населения на 2004 год по данным 2001, 2002, 2003гг. с использованием программы Statistica 6.0
Введение.
Построение статистической модели показателей среднемесячных денежных доходов в расчёте на душу населения.
1. Теоретическая часть 1.1 Корреляция как частный случай статистической связи
1.2 Корреляционный анализ
1.3 Множественная и частная корреляция
1.4 Мультиколлинеарность
1.5 Регрессионные зависимости
1.6 Регрессионный анализ
1.7 Парная линейной регрессия
1.8 Множественная регрессия
1.9 Анализ вариации
1.10Проверка уравнения регрессии на значимость
1.11Вывод
2. Практическое применение метода корреляционно регрессионного анализа: Статистический анализ зависимости среднемесячных доходов в расчёте на душу населения.
,
которую сравнивают с табличным значением , где a- уровень значимости, u=n-2 –число степеней свободы. Если tрасч>tтабл, то принимаем гипотезу о наличии и существенности связи. В противном случае принимаем гипотезу об отсутствии связи. В случае, когда корреляция между фактором и откликом незначима, показатель х не включают в уравнение регрессии.
Кроме этого, следует помнить, что для адекватности оценивания связи между х и у необходимо, чтобы они:
-были случайными;
-имели
совместное нормальное
Иначе имеет место ложная корреляция, т.е. на одну из величин влияет некоторый случайный неучтенный фактор.
Если связь между случайными величинами значима и выборка произведена из нормальной генеральной совокупности, то доверительный интервал истинного значения коэффициента корреляции определяют для больших выборок как:
, где ua- критическая граница для нормального распределения, соответствующая уровню значимости a, n- объем выборки. Для небольшого объема выборки вместо ua используют ta,n- статистику Стьюдента.
Коэффициент корреляции достаточно точно оценивает степень тесноты связи лишь в случае наличия линейной зависимости. При наличии же нелинейной зависимости он недооценивает степень тесноты и может быть даже равен 0. В таких случаях мерой связи является выборочное корреляционное отношение:
, где - значения, полученные с помощью подстановки в уравнение парной линейной регрессии м/у у и х.
, т.е.
корреляционное отношение
оценивает наличие и
силу. Кроме этого hxy¹hyx , т.е. не является
симметричным. Значения парного коэффициента
корреляции и корреляционного отношения
по модулю совпадают, если расчетные значения
зависимой переменной получены по линейной
регрессии. Когда связь между переменными
уклоняется от линейной формы, то h
и r несколько отличаются по величине,
причем h всегда больше r
по модулю.
1.3. Множественная и частная корреляция.
В реальных экономических ситуациях парные взаимосвязи подвергаются влиянию со стороны других случайных величин, поэтому необходимо включать в исследование вычисление коэффициентов множественной и частной корреляции. Для этого анализу подвергают корреляционную матрицу:
которая
позволяет выделить
Чтобы оценить связь между i-м фактором и всем набором остальных рассчитывается выборочный множественный коэффициент корреляции:
,
где Q - определитель корреляционной матрицы,
Qii - алгебраическое дополнение корреляционной матрицы.
Этим
коэффициентом фиксируется
Для определения доли вариации исследуемого фактора, объясненной поведением остальных факторов, рассчитывается выборочный коэффициент детерминации: .
Как и в случае с парной корреляцией необходима проверка на статистическую значимость, которая в данном случае проводится с помощью статистики Фишера.
Гипотеза Н0: Ri=0; Н1: Ri¹0.
Расчетное значение статистики Фишера имеет вид:
Сравнивая его с табличным значением , делаем выводы: если Fр>Fт, то связь есть и она значима, в противном случае принимаем гипотезу Н0 об отсутствии связи между i-м фактором и набором р-1 факторов.
При наличии в исследовании нескольких случайных величин на величину rxy влияние могут оказывать прочие факторы. Для устранения такого влияния необходимо получить точечную оценку между х и у (т.е. очищенную от влияния прочих факторов)- выборочный частный коэффициент корреляции:
, где 1…р – факторы, влияние которых отсекается.
, т.е. коэффициент характеризует тесноту, наличие и направление связи.
Процедура проверки на значимость аналогична предыдущим. Используя статистику Стьюдента и принимая за гипотезу Н0 утверждение об отсутствии связи, а за гипотезу Н1- о наличии, имеем:
, которое сравниваем с tтабл с параметрами: a и n=n-p.
Н1 принимается в случае превышения tрасч над tтабл. Если же tрасч<tтабл, то принимаем гипотезу об отсутствии связи. Причины незначимости выборочных коэффициентов могут быть:
1.4. Мультиколлинеарность.
Еще одной важной предпосылкой корреляционного анализа является независимость включаемых в исследование факторов друг от друга, т.к. наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга. Такое явление получило название мультиколлинеарности.
Проявление мультиколлинеарности в явной форме подразумевает, что между факторными признаками существует функциональная зависимость, т.е. (присутствуют линейно зависимые столбцы). Это является одной из предпосылок регрессионного анализа, который рассматривается далее. В случае мультиколлинеарности некорректным является использование МНК, т.к. оценки параметров уравнения регрессии будут содержать систематические ошибки, и оценка значимости по t-критерию не будет иметь смысла.
Следствием мультиколлинеарности является:
Наличие мультиколлинеарности можно определить по ряду признаков:
Кроме
визуальных критериев наличия
Гипотезы: Н0: мультиколлинеарности между объясняющими переменными нет;
Н1: мультиколлинеарность есть.
Для проверки строится величина расчетного значения :
, где Q- определитель корреляционной матрицы
Сравниваем с табличным значением табл( ,a). Если расч> табл, то принимаем гипотезу о наличии мультиколлинеарности.
Однако мультиколлинеарность может быть устранена. Наиболее распространенными методами устранения являются пошаговые процедуры последовательного присоединения (удаления) факторов и смешанная процедура последовательного присоединения (удаления).
Последняя
группа методов заключается в последовательном
анализе факторных переменных на этапе
анализа корреляционной матрицы: если
известно, что между двумя факторами есть
мультиколлинеарность, один из них необходимо
удалить из рассмотрения. Оставляем, как
правило, наиболее адекватный с экономической
точки зрения фактор, либо имеющий максимальный
rxy .
1.5. Регрессионные зависимости.
Изучение корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значения зависимой переменной изменяются в зависимости от того, какие значения принимает другая переменная, рассматриваемая как причина по отношению к зависимой. В экономике регрессионный анализ имеет достаточно широкое применение. К задачам анализа:
В случае парной регрессионной зависимости имеем:
,
где f(x)- детерминированная составляющая регрессионной модели, которая отражает воздействие на зависимую переменную всех существенных факторов и фактически описывает поведение условного среднего у.
e-случайная
составляющая, отражающая совокупное
влияние всех случайных факторов.
1.6. Регрессионный анализ.
Ранее уже упоминалась одна из предпосылок регрессионного анализа (отсутствие мультиколлинеарности). Рассмотрим остальные, которые сформулированы в теореме Гаусса-Маркова:
1.7. Парная линейная регрессия.
В случае парной линейной регрессии зависимость результирующего признака представлена от одного фактора. Теоретическое уравнение имеет вид: , где b0, b1 – параметры генерального уравнения. Выборочное уравнение имеет вид: , где b0, b1 –оценки параметров, полученные из выборки, причем b0 –величина, которая выравнивает размерность между зависимой переменной у и х, а b1 –оценка, показывающая, на сколько изменится значение у при изменении х на еденицу. На основе имеющихся наблюдений необходимо подобрать наилучшие по определенному критерию оценки.
Информация о работе Анализ среднемесясячных доходов населения