Анализ среднемесясячных доходов населения

Автор работы: Пользователь скрыл имя, 18 Ноября 2011 в 17:00, курсовая работа

Краткое описание

Численность безработного населения. Это социальное явление непосредственно связано с результирующим показателем, так как при отсутствии работы, человек лишается большой доли своего денежного дохода.
Цель курсовой работы – прогнозирование величины среднемесячных денежных доходов в расчёте на душу населения на 2004 год по данным 2001, 2002, 2003гг. с использованием программы Statistica 6.0

Содержание работы

Введение.
Построение статистической модели показателей среднемесячных денежных доходов в расчёте на душу населения.
1. Теоретическая часть 1.1 Корреляция как частный случай статистической связи
1.2 Корреляционный анализ
1.3 Множественная и частная корреляция
1.4 Мультиколлинеарность
1.5 Регрессионные зависимости
1.6 Регрессионный анализ
1.7 Парная линейной регрессия
1.8 Множественная регрессия
1.9 Анализ вариации
1.10Проверка уравнения регрессии на значимость
1.11Вывод
2. Практическое применение метода корреляционно регрессионного анализа: Статистический анализ зависимости среднемесячных доходов в расчёте на душу населения.

Содержимое работы - 1 файл

Анализ среднемесячных денежных доходов населения.doc

— 498.00 Кб (Скачать файл)

Для оценивания параметров используется МНК, суть которого заключается  в минимизации  сумм квадратов отклонений фактических значений наблюдений от модельных  для нахождения такой  функции, которая  наилучшим образом соответствует эмпирическим данным:

       , где Q является функцией неизвестных величин b0 , b1

Зная уравнение , представим:

Таким образом применение МНК сводится к задаче на экстремум. Для построения оценок определяют частные производные функции Q по переменным b0 , b1 и приравнивают их к нулю. После преобразований получим следующие формулы для определения параметров:

              ;  . 

      1.8.  Множественная регрессия.

      Однако  опять же в силу сложности взаимосвязей любых общественных и экономических  явлений на практике чаще всего используют множественную регрессию. Она полнее объясняет поведение зависимой переменной и позволяет сопоставить влияние включенных в уравнение факторов.

      Для линейной формы связи множественное  уравнение регрессии  генеральной  совокупности имеет вид:

             ,

      для выборки:

             .

      Как и в случае парной регрессии, задача оценивания заключается  в  том, чтобы с помощью МНК найти такие оценки параметров, которые минимизировали бы квадраты отклонений наблюдаемых значений у от вычисленных с помощью уравнения регрессии.

      Функция, значение которой  минимизирует, имеет  вид:

            

      Вектор  оценок параметров в данном случае примет вид: 

             ,        где  ;            .

      Использование МНК для оценки параметров регрессионного уравнения генеральной совокупности не случайно. Это объясняется рядом свойств оценок, рассчитанных по МНК:

  1. Свойство несмещенности - оценки не содержат систематических ошибок.
  2. Свойство состоятельности - при оценки .
  3. Свойство эффективности - оценки имеют минимальную дисперсию в классе линейных оценок.

Коэффициенты  уравнения множественной регрессии  показывают абсолютный размер влияния  факторов на уровень результативного  показателя. Однако по параметрам полученного  уравнения можно оценить еще  и долю каждого из факторов в изменении  уровня результативного показателя, т.е. сопоставить воздействие различных параметров  на у. Это может быть сделано:

- по  коэффициенту эластичности:

,  который   показывает, на сколько процентов  от своей средней изменяется  у при изменении хj на 1% от своей средней;  

-по  стандартизованному коэффициенту уравнения регрессии:

, который  показывает, на сколько единиц  своего среднеквадратического отклонения  изменяется у при изменении хj на величину одного среднеквадратического отклонения. 

      1.9.  Анализ вариации.

      Анализ  вариации результирующего показателя позволяет точнее оценить значимость уравнения регрессии, определить на сколько хорошо построенная модель описывает поведение, т.е. установить достаточно ли включенных в модель факторных признаков. Оценку  проводят на основе вариации результирующего показателя.

      Рассчитываем  оценки дисперсий:

      - Оценка общей дисперсии   характеризует разброс значений зависимого показателя вокруг средней

      -Оценка объясненной дисперсии:   характеризует вариацию зависимого показателя, объясненную уравнением регрессии.

      -Оценка остаточной дисперсии характеризует разброс значений относительно линии регрессии и фактически является оценкой точности воспроизведения экспериментальных данных.  В случае высокой остаточной дисперсии точность прогнозов результирующего показателя будет невелика и практическое применение построенного уравнения малоэффективно. Напротив, чем меньше остаточная дисперсия, тем больше уверенности, что уравнение регрессии подобрано верно. Большое значение остаточной дисперсии может быть обусловлено неверным выбором функции или отсутствием статистической взаимосвязи между зависимой и объясняющими переменными. На практике чаще используется показатель стандартной ошибки уравнения:         .

Для оценки качества уравнения регрессии используется показатель коэффициента детерминации, который является квадратом коэффициента множественной корреляции:

       , который  показывает, какая часть дисперсии  исследуемого показателя объясняется  влиянием включенных в уравнение  регрессии факторов. Если значение  R2 невелико, то можно сделать вывод, что факторы, оказывающие существенное влияние на результирующий показатель, в уравнение регрессии не вошли.

1.10. Проверка уравнения  регрессии  на  значимость.

Процедура проверки на значимость регрессионного уравнения заключается в следующем:

Формируются 2 гипотезы:

Н0: , т.е. уравнение регрессии в целом незначимо.   
 

Н1: , т.е. уравнение регрессии значимо.

Рассчитываем    ,  если Fр>Fт ( , то принимаем гипотезу Н1.Незначимость уравнения регрессии может быть обусловлена следующим:

  • малый объем выборки;
  • неверный выбор формы связи;
  • слабая зависимость между факторной и результирующими переменными либо отсутствие таковой вообще;
  • слабая колеблемость факторных и результативных показателей.

      Кроме проверки на значимость уравнения в  целом, существует процедура проверки на значимость собственно параметров уравнения регрессии:

      Н0: bj=0

      H1: bj¹0

  ,где  ,   Сjj – диагональный элемент матрицы  

      При  tрасч>tтабл принимаем гипотезу  о значимости параметров регрессионного уравнения.

      Незначимые  показатели можно исключить из уравнения  регрессии. 

           1.11.  Вывод.

      Подводя итог всего вышеизложенного, можно  сделать следующее заключение: построение многофакторных регрессионных моделей  позволяет дать количественное описание основных закономерностей изучаемых явлений, выделить существенные факторы, обусловливающие изменение экономических показателей, и оценить их влияние. Полученные модели в основном используют в двух направлениях - для сравнительного анализа и в прогнозировании. Корреляционно-регрессионной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы, влияющие на вариацию результативного признака, обладает высоким (не ниже 0,5) коэффициентом детерминации и коэффициентами регрессии, интерпретируемыми в соответствии с теоретическим знанием о природе связей в изучаемой системе.

      Приведенное определение Корреляционно-регрессионной  модели включает достаточно строгие  условия: далеко не всякое уравнение регрессии можно считать моделью. Использование регрессионной модели для прогнозирования состоит  в подстановке в уравнение регрессии ожидаемых значений факторных признаков для расчета точечного прогноза результативного признака и его доверительного интервала с заданной вероятностью. 

2. Практическое применение  метода корреляционно-регрессионного  анализа: Статистический анализ зависимости среднемесячных доходов в расчёте на душу населения.

T Y X1 X2 X3
1 3136,2 3364 1020,3 6,1
2 3229,7 3376 1126,8 6,1
3 3202,8 3405 1133,6 6,2
4 3286,2 3515 1134,7 6,3
5 3355,0 3578 1135,8 6,3
6 4295,1 4541 1138,0 6,2
7 2946,5 3760 1241,4 6,1
8 3291,1 3725 1322,7 6,0
9 3543,8 4031 1329,0 5,8
10 4021,4 4110 1331,7 5,7
11 3499,6 4187 1334,4 5,5
12 3868,8 4460 1337,2 5,4
13 4085,8 4597 1339,1 5,3
14 4086,2 4511 1459,3 5,5
15 3954,5 4521 1461,4 5,8
16 4231,6 4646 1461,4 6,2
17 4298,6 4694 1461,4 6,2
18 5429,3 5738 1462,3 5,1
19 3841,8 4696 1463,8 6,4
20 4396,2 4701 1501,1 6,6
21 4663,1 4986 1501,4 6,3
22 5016,2 5100 1608,1 6,1
23 4748,0 5221 1608,1 5,8
24 5008,8 5550 1609,7 5,7
 

      Y – Среднемесячные денежные доходы в расчёте на душу населения, руб.

      X1 – Номинальная начисленная среднемесячная заработная плата одного    работника, руб.

      X2 – Средний размер назначенной месячной пенсии, руб.

      X3 – Общая численность безработных, млн.человек. 

      Автокорреляция  временных рядов

            Исследуем уровни временных рядов на наличие в них автокорреляции, построим коррелограммы и определим их тип.

      В нашем случае коррелогаммы для каждого из временных рядов будут выглядеть следующим образом: 
 
 

   Проверка автокорреляции среднемесячных денежных доходов в расчёте на душу населения (Y): Автокорреляция первого типа – долгосрочные тенденции (значения коэффициентов больше нуля, значимы и постепенно снижаются). 
 

   Проверка автокорреляции фактора X3: Наблюдается автокорреляция 1-го типа. Ряд имеет долгосрочную тенденцию. 

  Проверка автокорреляции фактора X1: Наблюдается автокорреляция 1-го типа (значения коэффициентов больше нуля, значимы и постепенно снижаются), т.е. уровни зависят от предыдущего, ряд имеет долгосрочную тенденцию и хорошо описывается трендовыми моделями. 

    

 Проверка  автокорреляции фактора  X2: Автокорреляция 1-го типа (коэффициенты автокорреляции ведут себя, так же как и у предыдущих рядов).  
 
 
 
 

    Построение трендовой модели

    Для того чтобы отобразить зависимость показателя среднемесячного денежного дохода в расчёте на душу населения от времени, построим трендовую модель и проверим её на значимость по критерию Фишера и адекватность по критериям Гаусса-Маркова. Получаем:

Уравнение линейной модели:  =2969,033+80,598*T

Проверка  линейной модели на адекватность:

Информация о работе Анализ среднемесясячных доходов населения