Корреляционный и регрессионный анализ

Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа

Краткое описание

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Содержание работы

Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40

Содержимое работы - 1 файл

оформленная к.р. Зайнуллина Э.А..docx

— 171.30 Кб (Скачать файл)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ  РОССИЙСКОЙ ФЕДЕРАЦИИ

 

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ

ЭКОНОМИКИ, СТАТИСТИКИ И ИНФОРМАТИКИ

 

Кафедра математической статистики и эконометрики

 

 

 

 

Курсовая работа:

«КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ»

 

 

 

Выполнила: Зайнуллина Э.А.

гр. ДЭТ-201

Преподаватель: к.т.н., доцент

Миронкина Ю.Н.

 

 

 

 

Москва 

2011

Содержание

  1. Подготовка данных…………………………………………..…………….3
  2. Корреляционный анализ экономических показателей…..5
    1. Построение матрицы парных коэффициентов корреляции………5
    2. Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
    3. Расчёт множественных коэффициентов корреляции……………19
  3. Регрессионный анализ экономических показателей…………………24

3.1 Проверка исходных данных  на мультиколлиниарность……………………………………………..…….25

3.2 Построение регрессионной  модели и её интерпретация…………..27

3.3 Сравнение исходных  данных с рассчитанными по  уравнению регрессии………………………………………………………………..…40

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. ПОДГОТОВКА ДАННЫХ

Таблица 1

Исходные данные

№п/п

Y

X1

X2

X3

X4

1

204,2

0,23

0,40

1,37

6,40

2

209,6

0,24

0,26

1,49

7,80

3

222,6

0,19

0,40

1,44

9,76

4

236,7

0,17

0,50

1,42

7,90

5

62,0

0,23

0,40

1,35

5,35

6

53,1

0,43

0,19

1,39

9,90

7

172,1

0,31

0,25

1,16

4,50

8

56,5

0,26

0,44

1,27

4,88

9

52,6

0,49

0,17

1,16

3,46

10

46,6

6,36

0,39

1,25

3,60

11

53,2

0,37

0,33

1,13

3,56

12

30,1

0,43

0,25

1,10

5,65

13

146,4

0,35

0,32

1,15

4,28

14

18,1

0,38

0,02

1,23

8,85

15

13,6

0,42

0,06

1,39

8,52

16

89,8

0,30

0,15

1,38

7,19

17

62,5

0,32

0,08

1,35

4,82

18

46,3

0,25

0,20

1,42

5,46

19

103,5

0,31

0,20

1,37

6,20

20

73,3

0,26

0,30

1,41

4,25

21

76,6

0,37

0,24

1,35

5,38

22

73,01

0,29

0,10

1,48

5,88

23

32,3

0,34

0,11

1,24

9,27

24

199,6

0,23

0,47

1,40

4,36

25

598,1

0,17

0,53

1,45

10,31

26

71,2

0,29

0,34

1,40

4,69

27

90,8

0,41

0,20

1,28

4,16

28

82,1

0,41

0,24

1,33

3,13

29

76,2

0,22

0,54

1,22

4,02

30

119,5

0,29

0,40

1,28

5,23

31

21,9

0,51

0,20

1,47

2,74

32

48,4

0,36

0,64

1,27

3,10

33

173,5

0,23

0,42

1,51

10,44

34

74,1

0,26

0,27

1,46

5,65

35

68,6

0,27

0,37

1,27

6,67

36

60,8

0,29

0,38

1,43

5,91

37

355,6

0,01

0,35

1,50

11,99

38

264,8

0,02

0,42

1,35

8,30

39

526,6

0,18

0,32

1,41

1,63

40

118,6

0,25

0,33

1,47

8,94

41

37,1

0,31

0,29

1,35

5,82

42

57,7

0,38

0,30

1,40

4,80

43

51,6

0,24

0,56

1,20

5,01

44

64,7

0,31

0,42

1,15

4,12

45

48,3

0,42

0,26

1,09

5,10


 

Продолжение таб.1

46

15,0

0,51

0,16

1,26

3,49

47

87,5

0,31

0,45

1,36

4,19

48

108,4

0,37

0,31

1,15

5,01

49

267,3

0,16

0,08

1,87

11,44

50

34,2

0,18

0,68

1,17

7,67


 

 

Y - индекс снижения себестоимости  продукции;

Х1 - трудоемкость единицы продукции;

 

Х2 - удельный вес покупных изделий;

 

Х3 - коэффициент сменности оборудования;

 

Х4 - фондовооруженность труда.

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. КОРРЕЛЯЦИОННЫЙ  АНАЛИЗ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ

 

2.1. Построение матрицы парных коэффициентов корреляции

 

Парные коэффициенты корреляции характеризуют взаимосвязь между  двумя выбранными переменными на фоне действия остальных показателей  и являются самыми распространёнными  показателями тесноты связи при  статистическом анализе данных.

Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Корреляционная матрица  рассчитывается Excel в следующем виде:

 

Y

X1

X2

X3

X4

Y

1

       

X1

-0,16161

1

0,016128

   

X2

0,238011

0,016128

1

   

X3

0,405706

-0,1397

-0,18062

1

 

X4

0,329475

-0,20032

-0,09352

0,485923

1


 

Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной и коэффициенты  rij=rji.

Итак, получили матрицу парных коэффициентов корреляции размерности k×k (в нашем случае 5×5).

 

 

Таблица 2

Матрица парных коэффициентов  корреляции исследуемых экономических  показателей

 

 

Y

X1

X2

X3

X4

Y

1

-0,16161

0,238011

0,405706

0,329475

X1

-0,16161

1

0,016128

-0,1397

-0,20032

X2

0,238011

0,016128

1

-0,18062

-0,09352

X3

0,405706

-0,1397

-0,18062

1

0,485923

X4

0,329475

-0,20032

-0,09352

0,485923

1


 

 

Теперь необходимо проверить  значимость полученных коэффициентов  корреляции, т.е. гипотезу H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

                                        

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij   (таб.3).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости  α=0,05  и числа степеней свободы ν=n-2=50-2=48. Для этого используем встроенную функцию Excel и получаем   tкр=2,010635

 

 

 

 

Таблица 3

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

t набл

Y

X1

X2

X3

X4

Y

 

-1,13461

1,697776

3,075277

2,417662

X1

-1,13461

 

0,11175

-0,97742

-1,41657

X2

1,697776

0,11175

 

-1,27227

-0,65078

X3

3,075277

-0,97742

-1,27227

 

3,85191

X4

2,417662

-1,41657

-0,65078

3,85191

 

 

По результатам, представленным в табл. 3, наблюдаемое значение   t-статистики больше критического tкр=2,010635 по модулю для парных коэффициентов корреляции  . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05,  т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов  наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т.е. коэффициенты

- незначимы.

Для проверки значимости парных коэффициентов корреляции можно  также воспользоваться таблицами  Фишера-Иейтса для нахождения критического значения rкр для уровня значимости α=0,05 и числа степеней свободы   ν=n-2=50-2=48.   

По таб. Фишера-Иейтса rкр (α=0,05; ν=48)= 0,273

Если соответствующий  коэффициент | rij | > rкр, то он считается значимым.

Отметим в матрице парных коэффициентов корреляции значимые.

 

 

Таблица 4

Матрица парных коэффициентов  корреляции исследуемых  показателей  с выделением значимых коэффициентов (при α=0,05)

 

Y

X1

X2

X3

X4

Y

1

-0,16161

0,238011

0,405706

0,329475

X1

-0,16161

1

0,016128

-0,1397

-0,20032

X2

0,238011

0,016128

1

-0,18062

-0,09352

X3

0,405706

-0,1397

-0,18062

1

0,485923

X4

0,329475

-0,20032

-0,09352

0,485923

1


 

Для значимых парных коэффициентов корреляции можно построить с   заданной   надёжностью γ   интервальную   оценку   ρmin ≤ ρ ≤ ρmax       с помощью Z-преобразования Фишера:

                                          

                                                     

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.

1). Zr По найденному выборочному коэффициенту корреляции  r                с     помощью Z-преобразования Фишера находят соответствующее значение Zr ,   являющееся гиперболическим арктангенсом r :

                                             

 

2). ΔZ Найдём значение tγ, соответствующее заданной надёжности γ=0,95.                - значение функции Лапласа.

В нашем случае для надёжности γ=0,95:   F(t)=0,975;    tγ =1,959964 (по таблице tγ =1,96).

Находим   0,28589

 

3). Zmin и Zmax   Теперь можно найти Zmin и Zmax:

Zmin = Zr  – ΔZ;      Zmax= Zr  + ΔZ

 

4). ρmin и ρmax   Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции   ρmin и ρmax   , соответствующие Zmin и Zmax.

Соответствующие значения ρmin и ρmax являются гиперболическими тангенсами Zmin и Zmax :                 .

Построим с надёжностью  γ=0,95 и с учётом найденного 0,28589 доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами.  Расчёты представим в виде таблицы.

Таблица 4

Расчёт доверительных  интервалов для парных генеральных  коэффициентов корреляции исследуемых  экономических показателей с  надёжностью γ=0,95

 

r

Zr

Zmin

Zmax

ρmin

ρmax

Y X3

0,405706

0,4305

0,1446

0,7164

0,143572

0,614644

Y X4

0,329475

0,3422

0,0563

0,6281

0,05629

0,556763

X3 X4

0,485923

0,5307

0,2448

0,8166

0,240043

0,673215


 

Таким образом, доверительные  интервалы с надёжностью γ=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:    

P(0,143572≤ ρYX3 ≤ 0,614644)=0,95

P(0,05629≤ ρYX4 ≤ 0,556763)=0,95

Информация о работе Корреляционный и регрессионный анализ