Анализ среднемесясячных доходов населения

Автор работы: Пользователь скрыл имя, 18 Ноября 2011 в 17:00, курсовая работа

Краткое описание

Численность безработного населения. Это социальное явление непосредственно связано с результирующим показателем, так как при отсутствии работы, человек лишается большой доли своего денежного дохода.
Цель курсовой работы – прогнозирование величины среднемесячных денежных доходов в расчёте на душу населения на 2004 год по данным 2001, 2002, 2003гг. с использованием программы Statistica 6.0

Содержание работы

Введение.
Построение статистической модели показателей среднемесячных денежных доходов в расчёте на душу населения.
1. Теоретическая часть 1.1 Корреляция как частный случай статистической связи
1.2 Корреляционный анализ
1.3 Множественная и частная корреляция
1.4 Мультиколлинеарность
1.5 Регрессионные зависимости
1.6 Регрессионный анализ
1.7 Парная линейной регрессия
1.8 Множественная регрессия
1.9 Анализ вариации
1.10Проверка уравнения регрессии на значимость
1.11Вывод
2. Практическое применение метода корреляционно регрессионного анализа: Статистический анализ зависимости среднемесячных доходов в расчёте на душу населения.

Содержимое работы - 1 файл

Анализ среднемесячных денежных доходов населения.doc

— 498.00 Кб (Скачать файл)

,

которую сравнивают с табличным значением  , где a- уровень значимости, u=n-2 –число степеней свободы.  Если tрасч>tтабл, то принимаем гипотезу о наличии и существенности связи. В противном случае принимаем гипотезу об отсутствии связи. В случае, когда корреляция между фактором и откликом незначима, показатель х не включают в уравнение регрессии.

      Кроме этого, следует помнить, что для  адекватности оценивания связи между  х и у необходимо, чтобы они:  

      -были  случайными;

      -имели  совместное нормальное распределение.

Иначе имеет место ложная корреляция, т.е. на одну из величин влияет некоторый  случайный неучтенный фактор.

      Если  связь между случайными величинами значима и выборка произведена  из нормальной генеральной совокупности, то доверительный интервал истинного значения коэффициента корреляции определяют для больших выборок как:

                 , где ua- критическая граница для нормального распределения, соответствующая уровню значимости a, n- объем выборки. Для небольшого объема выборки вместо ua используют ta,n- статистику Стьюдента.

      Коэффициент корреляции достаточно точно оценивает  степень тесноты связи лишь в  случае наличия линейной зависимости. При наличии же нелинейной зависимости он недооценивает степень тесноты и может быть даже равен 0. В таких случаях мерой связи является выборочное корреляционное отношение:

             , где  - значения, полученные с помощью подстановки в уравнение парной линейной регрессии м/у у и х.

       , т.е.  корреляционное отношение оценивает наличие и силу. Кроме этого hxy¹hyx , т.е. не является симметричным. Значения парного коэффициента корреляции и корреляционного отношения по модулю совпадают, если расчетные значения зависимой переменной получены по линейной регрессии. Когда связь между переменными уклоняется от линейной формы, то h и r несколько отличаются по величине, причем h всегда больше r  по модулю. 
 

      1.3.  Множественная и частная корреляция.

      В реальных экономических ситуациях  парные взаимосвязи подвергаются влиянию  со стороны других случайных величин, поэтому необходимо включать в исследование вычисление коэффициентов множественной  и частной корреляции.  Для  этого анализу подвергают корреляционную матрицу:

              

 которая  позволяет выделить статистически  значимые взаимосвязи между переменными.

      Чтобы оценить связь между i-м фактором и всем набором остальных рассчитывается выборочный множественный коэффициент корреляции:

             ,

где Q - определитель корреляционной матрицы,

      Qii - алгебраическое дополнение корреляционной матрицы.

Этим  коэффициентом фиксируется наличие  и сила связи, т.к. . Стоит отметить и то, что величина Ri выше любого парного или частного коэффициента корреляции, а присоединение каждой новой предсказывающей переменной не может уменьшить величину Ri.

      Для определения доли вариации исследуемого фактора, объясненной поведением остальных  факторов, рассчитывается выборочный коэффициент детерминации: .

      Как и в случае с парной корреляцией  необходима проверка на статистическую значимость, которая в данном случае проводится с помощью статистики Фишера.

      Гипотеза  Н0: Ri=0; Н1: Ri¹0.

      Расчетное значение статистики Фишера имеет вид:

            

Сравнивая его с табличным значением  , делаем выводы: если Fр>Fт, то связь есть и она значима, в противном случае принимаем гипотезу Н0 об отсутствии связи между i-м фактором и набором р-1 факторов.

      При наличии в исследовании нескольких случайных величин на величину rxy влияние могут оказывать прочие факторы. Для устранения такого влияния необходимо получить точечную оценку между х и у (т.е. очищенную от влияния прочих факторов)- выборочный частный коэффициент корреляции

             , где 1…р  – факторы, влияние которых  отсекается.

       , т.е.  коэффициент характеризует тесноту, наличие и направление связи.

      Процедура проверки на значимость аналогична предыдущим. Используя статистику Стьюдента и принимая за гипотезу Н0 утверждение об отсутствии связи, а за гипотезу Н1- о наличии, имеем:

             , которое  сравниваем с tтабл с параметрами: a и n=n-p.

Н1 принимается в случае превышения tрасч над tтабл. Если же tрасч<tтабл, то принимаем гипотезу об отсутствии связи. Причины незначимости выборочных коэффициентов могут быть:

  • недостаточный объем выборки;
  • неверный выбор формы связи между случайными величинами;
  • наличие не включенных в исследование факторов, но существенно воздействующих на исследуемые показатели;
  • отсутствие связи вообще.
 

1.4.  Мультиколлинеарность.

Еще одной  важной предпосылкой корреляционного  анализа является независимость  включаемых в исследование факторов друг от друга, т.к. наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга. Такое явление получило название мультиколлинеарности.

Проявление  мультиколлинеарности  в явной  форме подразумевает, что между факторными признаками существует функциональная зависимость, т.е. (присутствуют линейно зависимые столбцы). Это является одной из предпосылок регрессионного анализа, который рассматривается далее. В случае мультиколлинеарности некорректным является использование МНК, т.к. оценки параметров уравнения регрессии будут содержать систематические ошибки, и оценка значимости по t-критерию не будет иметь смысла.

Следствием  мультиколлинеарности является:

  • резкое падение точности параметров, получаемых с помощью МНК;
  • неустойчивость выборочных характеристик;
  • невозможность содержательного прогноза;
  • отсутствие смысла содержательной интерпретации регрессионных зависимостей.

Наличие мультиколлинеарности можно определить по ряду признаков:

  • небольшие изменения данных приводят к существенному изменению оценок параметров;
  • коэффициенты уравнения регрессии имеют большие стандартные ошибки и высокий уровень значимости, при этом построенное уравнение характеризуется высоким коэффициентом детерминации и высоким совместным уровнем значимости факторных переменных;
  • коэффициенты в уравнении регрессии имеют неверный знак или неправдоподобную величину.

Кроме визуальных критериев наличия мультиколлинеарности существует формальные, один из которых - критерий .

Гипотезы: Н0: мультиколлинеарности между объясняющими переменными нет;

            Н1: мультиколлинеарность есть.

Для проверки строится величина расчетного значения :

       , где Q- определитель корреляционной матрицы

Сравниваем  с табличным значением  табл( ,a). Если расч> табл, то принимаем гипотезу о наличии мультиколлинеарности.

Однако  мультиколлинеарность может быть устранена. Наиболее распространенными методами устранения являются пошаговые процедуры последовательного присоединения (удаления) факторов и смешанная процедура последовательного присоединения (удаления).

Последняя группа методов  заключается в последовательном анализе факторных переменных на этапе анализа корреляционной матрицы: если известно, что между двумя факторами есть мультиколлинеарность, один из них необходимо удалить из рассмотрения. Оставляем, как правило, наиболее адекватный с экономической точки зрения фактор, либо имеющий максимальный  rxy . 

      1.5.  Регрессионные зависимости.

Изучение  корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значения зависимой переменной изменяются в зависимости от того, какие значения принимает другая переменная, рассматриваемая как причина по отношению к зависимой. В экономике регрессионный анализ имеет достаточно широкое применение. К задачам анализа:

  • установление формы зависимости;
  • оценка модельной функции или уравнения регрессии;
  • прогноз неизвестных значений зависимой переменной по модельному уравнению регрессии.

В случае парной регрессионной зависимости  имеем:

,

где f(x)- детерминированная составляющая регрессионной модели, которая отражает воздействие на зависимую переменную всех существенных факторов и фактически описывает поведение условного среднего у.

 e-случайная составляющая, отражающая совокупное влияние всех случайных факторов.  

      1.6.  Регрессионный анализ.

Ранее уже упоминалась одна из предпосылок регрессионного анализа (отсутствие мультиколлинеарности). Рассмотрим остальные, которые сформулированы в теореме Гаусса-Маркова:

  1. Зависимые переменные yi , ei- случайные величины, в то время как xi не является случайной.
  2. Случайная составляющая  и переменная у распределена по нормальному закону с параметрами М(ei)=0, D(ei)=D(yi)=s2
  3. Отдельные наблюдения уi , yj  и ei , ej  некоррелированны между собой, т.е.
 

1.7.  Парная линейная регрессия.

В случае парной линейной регрессии зависимость результирующего признака представлена от одного фактора. Теоретическое уравнение имеет вид: , где b0, b1 – параметры генерального уравнения. Выборочное уравнение имеет вид: , где b0, b1 –оценки параметров, полученные из выборки, причем b0 –величина, которая выравнивает размерность между зависимой переменной у и х, а  b1 –оценка, показывающая, на сколько изменится значение у при изменении х на еденицу. На основе имеющихся наблюдений необходимо подобрать наилучшие по определенному критерию  оценки.

Информация о работе Анализ среднемесясячных доходов населения