Корреляционный и регрессионный анализ

Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа

Краткое описание

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Содержание работы

Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40

Содержимое работы - 1 файл

оформленная к.р. Зайнуллина Э.А..docx

— 171.30 Кб (Скачать файл)

 

 

 

 

 

 

 

 

    1.  Расчёт множественных коэффициентов корреляции

 

Множественные коэффициенты корреляции служат мерой связи одной  переменной с совместным действием  всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции.  Множественный коэффициент корреляции, например,  для 1-го показателя Y вычисляется по формуле:

                         

где |R| - определитель корреляционной матрицы R;

Rii – алгебраическое дополнение элемента rii корреляционной матрицы R.

 Все алгебраические дополнения Rii были найдены в п.2.2 на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы.

R11=(-1)1+1·M11= 0,707461

R22=(-1)2+2·M22= 0,525866

R33=(-1)3+3·M33= 0,270791

R44=(-1)4+4·M44= 0,769891

R55=(-1)5+5·M55= 0,687242

 

Чтобы найти определитель корреляционной матрицы, воспользуемся  встроенной математической функцией Excel  МОПРЕД.

Получим     |R| =0,069523

 

Таким образом, получаем:

0,949594

0,931554

0,939144

0,95378

0,94807

 

Множественный коэффициент  детерминации R2i/{..}  (и его выборочная оценка r2i/{..})  показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.

Соответственно  (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.

Множественные коэффициенты детерминации получаются возведением  соответствующих множественных  коэффициентов корреляции в квадрат (таб. 10).  

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:  

                                     ,

где l – порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n – количество наблюдений.

Произведя расчёты, получим (таб.10).

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое  значение F-распределения для заданного уровня значимости α и числа степеней свободы числителя ν1=l и знаменателя ν2=n-l-1.

Можно найти значения Fкр  по таблицам математической статистики  или с помощью встроенной функции Excel.

Получаем 

 Fкр(0,05; 4; 45)= 2,57873918.

 

 

 

 

 

 

 

 

 

 

     Таблица 10

Множественные  коэффициенты корреляции и детерминации исследуемых  показателей с выделением значимых коэффициентов

(на уровне  значимости α=0,05)

Множественный коэффициент  корреляции

Множественный коэффициент  детерминации r2

Значение статистики  F набл

rY /{..}

0,949593835

0,901728451

103,2287083

rX1/{..}

0,931553953

0,867792768

73,84368066

rX2/{..}

0,939143815

0,881991105

84,08179679

rX3/{..}

0,953780495

0,909697232

113,3308987

rX4/{..}

0,948070279

0,898837253

99,9569449


 

Если наблюдаемое значение F-статистики превосходит ее критическое значение  Fкр=2,57873918, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты  значимо отличаются от нуля.

Полученные данные позволяют  сделать следующие выводы.

Множественный коэффициент  корреляции =0,9496 значим и имеет достаточно высокое значение, что говорит о том, показатель Y – индекс снижения себестоимости продукции имеет тесную связь с многомерным массивом факторных признаков X1 – трудоемкость единицы продукции, X2 – удельный вес покупных изделий,  X3 -  коэффициент сменности оборудования и X4 – фондовооруженность труда. Это даёт основание для проведения дальнейшего регрессионного анализа.

Множественный коэффициент  детерминации r2Y/{..}=0,9017 показывает, что 0,9017 %  доли дисперсии Y – индекс снижения себестоимости продукции, обусловлены изменениями факторных признаков.

Факторные признаки  тоже имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности.

Итак, полученные результаты корреляционного анализа, показавшие, что  показатель Y – индекс снижения себестоимости продукции имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели

 

 

 

 

 

 

 

 

 

 

 

 

  1. РЕГРЕССИОННЫЙ АНАЛИЗ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ

 

После того как с помощью  корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена  степень их тесноты, обычно переходят  к математическому описанию конкретного  вида зависимостей с использованием регрессионного анализа. С этой целью  подбирают класс функций, связывающий  результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа,  уравнение которой имеет  вид:

                          

для всех i=1,2,…n, или в матричной форме: ,                 

где

                     

 

Исследуем на основе линейной регрессионной модели зависимость  индекса снижения себестоимости продукции (Y) от трудоемкости единицы продукции (X1), удельного веса покупных изделий (X2), коэффициента сменности оборудования (X3) и фондовооруженности труда (X4).

3.1. Проверка исходных  данных на мультиколлинеарность

Одним из основных препятствий  эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она  возникает в случаях существования  достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk.        В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев  для определения наличия или  отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного  явления,  на которые следует обратить внимание. На практике о наличии  мультиколлинеарности обычно судят  по матрице парных коэффициентов  корреляции. Если один из элементов  матрицы R больше 0,8 ,

т.е.  | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или X (как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к  построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для  этого рассмотрим матрицу парных коэффициентов корреляции между  факторными признаками Xi.

 

 

 

 

 

 

Таблица 11

Матрица парных коэффициентов  корреляции факторных признаков

 

X1

X2

X3

X4

X1

1

0,016127603

-0,139695773

-0,20031931

X2

0,016127603

1

-0,180616129

-0,0935197

X3

-0,139695773

-0,180616129

1

0,485923242

X4

-0,200319307

-0,093519703

0,485923242

1


 

Поскольку значения коэффициентов  корреляции для всех пар объясняющих  переменных не превышают по модулю 0,8, то нет необходимости сокращать  набор объясняющих переменных.

 

 

 

 

 

 

 

 

 

 

 

 

3.2.  Построение  регрессионной модели  и её  интерпретация

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

Построение и оценка регрессионной  модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

Итак, приступаем к анализу.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные  признаки  (X1, X2, X3 , X4).

Результаты регрессионного анализа выдаются в следующем  виде (в скобках указаны принятые у нас обозначения):

ВЫВОД ИТОГОВ

 
   

Регрессионная статистика

Множественный R

0,54296618

R-квадрат

0,294812272

Нормированный R-квадрат

0,232128919

Стандартная ошибка

104,4570545

Наблюдения

50


 

Дисперсионный анализ

     
 

Df

(число степеней свободы ν)

SS(сумма квадратов отклонений Q)

MS(средний квадрат MS=SS/ν)

F(Fнабл= MSR/MSост)

Значимость F

Регрессия

4

205271,6045(QR)

51317,9011

4,70319878

0,002948273

Остаток

45

491007,431(Qост)

10911,2762

   

Итого

49

696279,0351(Qобщ)

     
           
 

Коэффи-циенты

(bi)

Стандарт-ная  ошибка

bi)

t-статис-тика

(tнабл)

P-Значение

Нижние 95%

(βimin)

Верхние 95%

(βimax)

Нижние 98,0%

(βimin)

Верхние 98,0%

(βimax)

Y-пересе-чение

-432,811

160,701399

-2,69326

0,0099058

-756,48

-109,142

-820,441

-45,1805

X1

-11,346

17,6512974

-0,64279

0,5236234

-46,898

24,20549

-53,923

31,23093

X2

257,8804

101,948974

2,529504

0,0149943

52,5446

463,2161

11,96762

503,7931

X3

319,0281

123,856529

2,575787

0,0133562

69,5682

568,4879

20,27175

617,7843

X4

7,903646

7,09745276

1,113589

0,2713685

-6,3914

22,19865

-9,21623

25,02352

Информация о работе Корреляционный и регрессионный анализ