Корреляционный и регрессионный анализ

Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа

Краткое описание

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Содержание работы

Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40

Содержимое работы - 1 файл

оформленная к.р. Зайнуллина Э.А..docx

— 171.30 Кб (Скачать файл)

P(0,240043≤ ρX3X4 ≤ 0,673215)=0,95

По полученным данным можно  сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1) Между индексом снижения себестоимости продукции (Y) и коэффициентом сменности оборудования (Х3), фондовооруженностью труда (Х4 ), между коэффициентом сменности оборудования (Х3) и фондовооруженностью труда (Х4 ) существует прямые умеренные связи.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. Расчёт частных коэффициентов корреляции.

Сравнение частных  и парных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между  двумя выбранными переменными при  исключении влияния остальных показателей (т.е. характеризуют «чистую» связь  только между этими признаками) и  важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы  усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:

                               ,

где Rij – алгебраическое дополнение элемента rij   корреляционной матрицы R ,   равное    Rij =(-1)i+j · Mij

Mij – минор элемента rij  корреляционной матрицы R,  т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца.

Воспользуемся встроенной функцией Excel и получаем:

R12=(-1)1+2·M12= 0,058179

  R11=(-1)1+1·M11= 0,707461

   R22=(-1)2+2·M22= 0,525866

R13=(-1)1+3·M13= -0,22778

R14=(-1)1+4·M14= -0,26455

R15=(-1)1+5·M15= -0,11419

R23=(-1)2+3·M23= -0,01329

R24=(-1)2+4·M24= 0,008101

R25=(-1)2+5·M25= 0,080993

R34=(-1)3+4·M34= 0,176752

R35=(-1)3+5·M35= 0,041594

R45=(-1)4+5·M45= -0,26879

R33=(-1)3+3·M33= 0,589136

R44=(-1)4+4·M44= 0,769891

R55=(-1)5+5·M55= 0,687242

 

Выборочные частные коэффициенты корреляции:

r12|345= -0,09538

r13|245= 0,352826

r14|235= 0,358459 и т.д.

 

 

Таким образом, получаем матрицу следующего вида:

Таблица 5

Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

 

Y

X1

X2

X3

X4

Y

1

-0,09538

0,35283

0,35846

0,163763

X1

-0,09538

1

0,023878

-0,01273

-0,13473

X2

0,352826

0,023878

1

-0,26245

-0,06537

X3

0,358459

-0,01273

-0,26245

1

0,36953

X4

0,163763

-0,13473

-0,06537

0,36953

1


 

 

 

Теперь необходимо проверить  значимость полученных частных коэффициентов  корреляции, т.е. гипотезу H0: ρij/{..} = 0.  

Для этого рассчитаем наблюдаемые  значения t-статистик для всех коэффициентов по формуле:                           

                                     

где l – порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3),  а n – количество наблюдений.                       

Построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..}   (таб.6).

Таблица 6

Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

t набл.

Y

X1

X2

X3

X4

Y

 

-0,64275887

2,529504

2,575789

1,113589

X1

-0,64275887

 

0,160224

-0,0854

-0,91211

X2

2,529503803

0,160224177

 

-1,82453

-0,43946

X3

2,575788914

-0,085402356

-1,82453

 

2,667698

X4

1,113589379

-0,912112642

-0,43946

2,667698

 

 

 

 

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости  α=0,05  и числа степеней свободы ν=n – l - 2.

 

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР,  введя в предложенное меню вероятность  α=0,05 и число степеней свободы   ν=n–l–2=50-3-2=45.  

Получаем   tкр= 2,014103359

По результатам, представленным в таблице 6, наблюдаемое значение     t-статистики больше критического tкр= 2,014103359 по модулю для частных коэффициентов корреляции 

 Следовательно, гипотеза  о равенстве нулю этих коэффициентов  отвергается с вероятностью ошибки, равной 0,05,  т.е. соответствующие  коэффициенты значимы.

Для остальных коэффициентов  наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается,т.е. - незначимы.

Отметим в матрице частных  коэффициентов корреляции значимые.

Таблица 7

Матрица частных  коэффициентов корреляции исследуемых  показателей с выделением значимых коэффициентов (при α=0,05)

 

 

Y

X1

X2

X3

X4

Y

1

-0,09538

0,35283

0,35846

0,163763

X1

-0,09538

1

0,023878

-0,01273

-0,13473

X2

0,352826

0,023878

1

-0,26245

-0,06537

X3

0,358459

-0,01273

-0,26245

1

0,36953

X4

0,163763

-0,13473

-0,06537

0,36953

1


 

 

Для значимых частных коэффициентов корреляции можно построить с   заданной   надёжностью γ   интервальную   оценку   ρmin ≤ ρ ≤ ρmax       с помощью Z-преобразования Фишера:

                                          

                                                     

 Алгоритм построения  интервальной оценки для частного  генерального коэффициента корреляции  такой же, как и для парного;  единственное отличие заключается  в расчёте  ΔZ :

                                          ,

где l – порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3),  а n – количество наблюдений. 

0,295475688

Построим с надёжностью  γ=0,95 и с учётом найденного

 0,295475688 доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами.  Расчёты представим в виде таблицы 8.

 

 

 

 

Таблица 8

Расчёт доверительных  интервалов для частных генеральных  коэффициентов корреляции исследуемых  экономических показателей с  надёжностью γ=0,95

 

r

Zr

Zmin

Zmax

ρmin

ρmax

Y X3

0,358459

0,375116577

0,079641

0,670592

0,079473

0,585369

Y X4

0,163763

0,165250967

-0,13022

0,460727

-0,12949

0,430676

X3 X4

0,369529

0,387877502

0,092402

0,683353

0,09214

0,593695


 

Таким образом, доверительные  интервалы с надёжностью γ=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P (≤0,585369)=0,95

P(-0,12949≤ ≤0,430676 )=0,95

P(0,09214≤ ≤0,593695)=0,95

Теперь построим таблицу  сравнения выборочных парных и частных  коэффициентов корреляции для всех переменных.

Сравнение парных и частных  коэффициентов играет важную роль в  выявлении механизмов воздействия  переменных друг на друга.

Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, т.е. их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то  остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то  остальные признаки ослабляют связь между рассматриваемыми двумя.

Таблица 9

Таблица сравнения  выборочных оценок парных и частных  коэффициентов корреляции пар исследуемых  показателей с выделением значимых коэффициентов (при α=0,05)

Между переменными

Коэффициент корреляции

парный

частный

Y X1

-0,161614211

-0,09538

Y X2

0,23801069

0,352826

Y X3

0,405706128

0,358459

Y X4

0,329475061

0,163763

X1 X2

0,016127603

0,023878

X1 X3

-0,139695773

-0,01273

X1 X4

-0,200319307

-0,13473

X2 X3

-0,180616129

-0,26245

X2 X4

-0,093519703

-0,06537

X3 X4

0,485923242

0,369529


 

По полученным данным можно  сделать следующие выводы.

Некоторые значимые корреляционные зависимости, полученные на этапе расчёта  парных коэффициентов корреляции, подтвердились  и при вычислении частных коэффициентов  корреляции. При этом выявлены следующие  механизмы воздействия переменных друг на друга:

 

  1. Наблюдается связь между изучаемым признаком Y –индексом снижения себестоимости продукции и факторным признаком X3 – коэффициентом сменности оборудования и между факторными признаками  X3 – коэффициентом сменности оборудования и X4 - фондовооруженностью труда. Обе зависимости прямые.
  2. Воздействие других переменных (трудоемкость единицы продукции X1, удельный вес покупных изделий X2 и фондовооруженность труда) ослабляет  прямую взаимосвязь между индексом снижения себестоимости продукции (Y) и коэффициентом сменности оборудования (X3), т.к.  величина частного коэффициент корреляции   меньше значения парного коэффициента корреляции .
  3. Аналогичная ситуация наблюдается и для значимой прямой связи между коэффициентом сменности оборудования (X3) и фондовооруженность труда (X4) - при исключении воздействия других переменных величина частного коэффициент корреляции меньше значения парного коэффициента корреляции. 

Информация о работе Корреляционный и регрессионный анализ