Корреляционный и регрессионный анализ

Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа

Краткое описание

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Содержание работы

Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40

Содержимое работы - 1 файл

оформленная к.р. Зайнуллина Э.А..docx

— 171.30 Кб (Скачать файл)

 

 

Коэффициенты(bi)

Стандартная ошибка (Ŝbi)

t-статистика

(tнабл)

P-Значение

Нижние 95% (βimin)

Верхние 95% (βimax)

Нижние 98,0% (βimin)

Верхние 98,0% (βimax)

Y-пере-сечение

-492,412

154,66547

-3,184

0,0026

-803,56

-181,265

-864,9

-119,92

X2

257,7312

101,85144

2,5305

0,0148

52,8326

462,63

12,438

503,02

X3

395,7139

108,4907

3,6475

0,0007

177,459

613,969

134,43

656,99


 

Оценка коэффициентов  в случае двух объясняющих переменных имеет вид:

,

а уравнение регрессии  имеет вид:

 

Проверим на уровне α=0,05 значимость уравнения регрессии, т.е. гипотезу  H0: β23=0.      Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики   Fнабл= 8,4626.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F-распределения для уровня значимости α=0,05  и числа степеней свободы числителя ν1=k=2  и знаменателя ν2=n-k-1=47  находим критическое значение F-статистики, равное

                                           Fкр = 3,195056.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 8,4626> 3,1951, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05.  Следовательно, хотя бы один элемент вектора β=(β23)T  значимо отличается от нуля.

Проверим значимость отдельных  коэффициентов уравнения регрессии, т.е. гипотезу

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

 

Коэффициенты

t-статистика

Y-пере-сечение

-492,4116101

-3,183720371

X2

257,7312463

2,530462418

X3

395,713881

3,647445267


 

Их необходимо сравнить с  критическим значением  tкр, найденным для уровня значимости  α=0,05  и числа степеней свободы ν=n – k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР,  введя в предложенное меню вероятность  α=0,05 и число степеней свободы   ν= n–k-1=50-3-1=47.

Получаем   tкр= 2,01174048.

Для всех рассматриваемых  коэффициентов β023 наблюдаемое значение t-статистики  больше критического по модулю. Следовательно, гипотеза о равенстве нулю коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Также для всех этих коэффициентов   p-значения  не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми.

Т.к. в данном случае все  коэффициенты оказались значимыми, процесс исключения переменных прекращается.

 

Окончательная оценка регрессии  со значимыми коэффициентами имеет  вид:

 


 

Для значимых коэффициентов  регрессии можно найти с заданной доверительной вероятностью γ интервальные оценки.

Как уже обсуждалось выше, доверительные интервалы для  регрессионных коэффициентов выдаются Excel в последних столбцах таблицы результатов – нижние 95% и верхние 95%  и нижние 98% и верхние 98% - с заданными уровнями надёжности  для γ=0,95 (выдаётся всегда)  и γ=0,98 (выдаётся при установке соответствующей дополнительной надёжности).

 

Коэффициенты

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

-492,4116101

-803,5584

-181,26482

-864,89943

-119,924

X2

257,7312463

52,8325774

462,629915

12,43783078

503,0247

X3

395,713881

177,458753

613,969009

134,4308476

656,9969


 

Таким образом, интервальные оценки значимых генеральных коэффициентов  регрессии имеют вид:

 

 

 

 

 

Интерпретация результатов

 

Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Т.о. около 26,48% вариации индекса снижения себестоимости продукции (Y) объясняется вариацией удельного веса покупных изделий (X2) и коэффициентом сменности оборудования (X3), а 73,52% вариации вызвано воздействием неучтенных в модели и случайных факторов. Таким образом, можно сделать вывод, что модель недостаточно адекватно отражает исследуемый процесс.

Коэффициент регрессии показывает среднюю величину изменения зависимой  переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.

Коэффициент регрессии при X2 показывает, что при росте оборачиваемости ненормируемых оборотных средств на единицу рентабельность Y  в среднем увеличивается на единиц. Построенная выше интервальная оценка показывает, что с вероятностью 0,95  при росте оборачиваемости ненормируемых оборотных средств на единицу увеличение рентабельности будет в пределах от до единиц.

Коэффициент при X3 свидетельствует о том, что при росте коэффициента сменности оборудования на единицу индекс снижения себестоимости продукции в среднем увеличивается на 395,7139. Из полученной интервальной оценки можно сделать вывод, что с вероятностью 0,95  при росте фондоотдачи на единицу увеличение рентабельности будет в пределах от 177,4588 до 613,9690 единиц.

 

3.3. Сравнение исходных  данных с рассчитанными 

по уравнению  регрессии

В графе Предсказанное Y мы получили Y, рассчитанное по уравнению регрессии, т.е. Ŷ. Добавим столбец исходных данных Y (таб.12) и, выделив область этих двух столбцов,  построим диаграмму сравнения расчётных и реальных значений исследуемого показателя. Можно ранжировать предприятия в порядке возрастания значения признака и построить другую диаграмму сравнения (рис. 2).

Отклонения расчетного значения Y от фактического показаны в графе Остатки. Проанализировав графу Стандартные остатки можно прийти к выводу, что предприятия № 25, 39 демонстрируют большую рентабельность, чем в среднем по всем рассматриваемым предприятиям. А для предприятия № 31,32 характерна обратная ситуация – отрицательное отклонение от линии регрессии.

Таблица 12

Сравнительная таблица исходных данных показателя рентабельности (Y) с рассчитанными с помощью построенной линейной регрессионной модели               

 

ВЫВОД ОСТАТКА

   
       

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

152,8089054

51,39109461

0,502783745

2

164,2121966

45,38780338

0,444050665

3

180,5088771

42,09112294

0,411797658

4

198,3677241

38,33227593

0,375023054

5

144,8946278

-82,89462777

-0,81099793

6

106,5996213

-53,49962128

-0,523412473

7

31,04930343

141,0506966

1,379966664

8

123,5467671

-67,04676714

-0,655950703

Продолжение таб.12

 

9

10,43080372

42,16919628

0,412561487

10

102,7459272

-56,1459272

-0,549302554

11

39,7963867

13,4036133

0,131133982

12

7,306470568

22,79352943

0,223000039

13

45,13335186

101,2666481

0,990740223

14

-0,528911553

18,62891155

0,182255583

15

73,09455926

-59,49455926

-0,582063829

16

92,33323262

-2,533232618

-0,024783831

17

62,42062895

0,079371054

0,000776525

18

121,0483502

-74,74835017

-0,731298986

19

101,2626561

2,237343876

0,021889009

20

142,864336

-69,564336

-0,680581287

21

103,6576284

-27,05762836

-0,264717765

22

119,0180584

-46,0080584

-0,450118918

23

26,62403942

5,675960575

0,055530647

24

182,7215091

16,87849094

0,165130378

25

217,9710779

380,1289221

3,718983694

26

149,216447

-78,01644704

-0,763272347

27

65,64840683

25,15159317

0,246070108

28

95,74335074

-13,64335074

-0,133479449

29

129,5341977

-53,33419772

-0,521794055

30

117,1946561

2,305343904

0,022554286

31

140,8340442

-118,9340442

-1,163588839

32

175,0930164

-126,6930164

-1,239498588

33

213,3634737

-39,86347365

-0,390003496

34

154,9180927

-80,81809266

-0,79068219

35

105,5055799

-36,9055799

-0,361065002

36

171,3971133

-110,5971133

-1,082024642

37

191,3651476

164,2348524

1,606788388

38

150,0492527

114,7507473

1,122661637

39

148,0189609

378,5810391

3,703840011

40

174,3391062

-55,73910625

-0,545322429

41

116,5441907

-79,44419067

-0,777240648

42

138,9071972

-81,20719719

-0,794488987

43

126,774545

-75,17454503

-0,735468655

44

70,90647649

-6,206476491

-0,060720938

45

5,926644221

42,37335578

0,414558877

46

47,42487936

-32,42487936

-0,317228158

47

161,7383289

-74,23832889

-0,726309203

48

42,5560394

65,8439606

0,644183069

49

268,1918471

-0,89184707

-0,008725368

50

145,8308782

-111,6308782

-1,09213846


 

 

 

Рис.2. Диаграммы сравнения  исходных данных показателя индекса снижения себестоимости продукции (Y) с рассчитанными с помощью линейной регрессионной модели 

 

 


Информация о работе Корреляционный и регрессионный анализ