Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа
Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.
Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ЭКОНОМИКИ, СТАТИСТИКИ И ИНФОРМАТИКИ
Кафедра математической статистики и эконометрики
Курсовая работа:
«КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ»
Выполнила: Зайнуллина Э.А.
гр. ДЭТ-201
Преподаватель: к.т.н., доцент
Миронкина Ю.Н.
Москва
2011
Содержание
3.1 Проверка исходных данных
на мультиколлиниарность…………………
3.2 Построение регрессионной
модели и её интерпретация………….
3.3 Сравнение исходных
данных с рассчитанными по
уравнению регрессии……………………………
Таблица 1
Исходные данные
№п/п |
Y |
X1 |
X2 |
X3 |
X4 |
1 |
204,2 |
0,23 |
0,40 |
1,37 |
6,40 |
2 |
209,6 |
0,24 |
0,26 |
1,49 |
7,80 |
3 |
222,6 |
0,19 |
0,40 |
1,44 |
9,76 |
4 |
236,7 |
0,17 |
0,50 |
1,42 |
7,90 |
5 |
62,0 |
0,23 |
0,40 |
1,35 |
5,35 |
6 |
53,1 |
0,43 |
0,19 |
1,39 |
9,90 |
7 |
172,1 |
0,31 |
0,25 |
1,16 |
4,50 |
8 |
56,5 |
0,26 |
0,44 |
1,27 |
4,88 |
9 |
52,6 |
0,49 |
0,17 |
1,16 |
3,46 |
10 |
46,6 |
6,36 |
0,39 |
1,25 |
3,60 |
11 |
53,2 |
0,37 |
0,33 |
1,13 |
3,56 |
12 |
30,1 |
0,43 |
0,25 |
1,10 |
5,65 |
13 |
146,4 |
0,35 |
0,32 |
1,15 |
4,28 |
14 |
18,1 |
0,38 |
0,02 |
1,23 |
8,85 |
15 |
13,6 |
0,42 |
0,06 |
1,39 |
8,52 |
16 |
89,8 |
0,30 |
0,15 |
1,38 |
7,19 |
17 |
62,5 |
0,32 |
0,08 |
1,35 |
4,82 |
18 |
46,3 |
0,25 |
0,20 |
1,42 |
5,46 |
19 |
103,5 |
0,31 |
0,20 |
1,37 |
6,20 |
20 |
73,3 |
0,26 |
0,30 |
1,41 |
4,25 |
21 |
76,6 |
0,37 |
0,24 |
1,35 |
5,38 |
22 |
73,01 |
0,29 |
0,10 |
1,48 |
5,88 |
23 |
32,3 |
0,34 |
0,11 |
1,24 |
9,27 |
24 |
199,6 |
0,23 |
0,47 |
1,40 |
4,36 |
25 |
598,1 |
0,17 |
0,53 |
1,45 |
10,31 |
26 |
71,2 |
0,29 |
0,34 |
1,40 |
4,69 |
27 |
90,8 |
0,41 |
0,20 |
1,28 |
4,16 |
28 |
82,1 |
0,41 |
0,24 |
1,33 |
3,13 |
29 |
76,2 |
0,22 |
0,54 |
1,22 |
4,02 |
30 |
119,5 |
0,29 |
0,40 |
1,28 |
5,23 |
31 |
21,9 |
0,51 |
0,20 |
1,47 |
2,74 |
32 |
48,4 |
0,36 |
0,64 |
1,27 |
3,10 |
33 |
173,5 |
0,23 |
0,42 |
1,51 |
10,44 |
34 |
74,1 |
0,26 |
0,27 |
1,46 |
5,65 |
35 |
68,6 |
0,27 |
0,37 |
1,27 |
6,67 |
36 |
60,8 |
0,29 |
0,38 |
1,43 |
5,91 |
37 |
355,6 |
0,01 |
0,35 |
1,50 |
11,99 |
38 |
264,8 |
0,02 |
0,42 |
1,35 |
8,30 |
39 |
526,6 |
0,18 |
0,32 |
1,41 |
1,63 |
40 |
118,6 |
0,25 |
0,33 |
1,47 |
8,94 |
41 |
37,1 |
0,31 |
0,29 |
1,35 |
5,82 |
42 |
57,7 |
0,38 |
0,30 |
1,40 |
4,80 |
43 |
51,6 |
0,24 |
0,56 |
1,20 |
5,01 |
44 |
64,7 |
0,31 |
0,42 |
1,15 |
4,12 |
45 |
48,3 |
0,42 |
0,26 |
1,09 |
5,10 |
Продолжение таб.1
46 |
15,0 |
0,51 |
0,16 |
1,26 |
3,49 |
47 |
87,5 |
0,31 |
0,45 |
1,36 |
4,19 |
48 |
108,4 |
0,37 |
0,31 |
1,15 |
5,01 |
49 |
267,3 |
0,16 |
0,08 |
1,87 |
11,44 |
50 |
34,2 |
0,18 |
0,68 |
1,17 |
7,67 |
Y - индекс снижения себестоимости продукции; | ||
Х1 - трудоемкость единицы продукции; |
||
Х2 - удельный вес покупных изделий; |
||
Х3 - коэффициент сменности оборудования; |
||
Х4 - фондовооруженность труда. |
2. КОРРЕЛЯЦИОННЫЙ
АНАЛИЗ ЭКОНОМИЧЕСКИХ
2.1. Построение матрицы парных коэффициентов корреляции
Парные коэффициенты корреляции
характеризуют взаимосвязь
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.
Корреляционная матрица рассчитывается Excel в следующем виде:
Y |
X1 |
X2 |
X3 |
X4 | |
Y |
1 |
||||
X1 |
-0,16161 |
1 |
0,016128 |
||
X2 |
0,238011 |
0,016128 |
1 |
||
X3 |
0,405706 |
-0,1397 |
-0,18062 |
1 |
|
X4 |
0,329475 |
-0,20032 |
-0,09352 |
0,485923 |
1 |
Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной и коэффициенты rij=rji.
Итак, получили матрицу парных коэффициентов корреляции размерности k×k (в нашем случае 5×5).
Таблица 2
Матрица парных коэффициентов корреляции исследуемых экономических показателей
Y |
X1 |
X2 |
X3 |
X4 | |
Y |
1 |
-0,16161 |
0,238011 |
0,405706 |
0,329475 |
X1 |
-0,16161 |
1 |
0,016128 |
-0,1397 |
-0,20032 |
X2 |
0,238011 |
0,016128 |
1 |
-0,18062 |
-0,09352 |
X3 |
0,405706 |
-0,1397 |
-0,18062 |
1 |
0,485923 |
X4 |
0,329475 |
-0,20032 |
-0,09352 |
0,485923 |
1 |
Теперь необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таб.3).
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости α=0,05 и числа степеней свободы ν=n-2=50-2=48. Для этого используем встроенную функцию Excel и получаем tкр=2,010635
Таблица 3
Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей
t набл |
Y |
X1 |
X2 |
X3 |
X4 |
Y |
-1,13461 |
1,697776 |
3,075277 |
2,417662 | |
X1 |
-1,13461 |
0,11175 |
-0,97742 |
-1,41657 | |
X2 |
1,697776 |
0,11175 |
-1,27227 |
-0,65078 | |
X3 |
3,075277 |
-0,97742 |
-1,27227 |
3,85191 | |
X4 |
2,417662 |
-1,41657 |
-0,65078 |
3,85191 |
По результатам, представленным в табл. 3, наблюдаемое значение t-статистики больше критического tкр=2,010635 по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Для остальных коэффициентов
наблюдаемое значение t-статистики
меньше критического значения по модулю,
следовательно, гипотеза H0 не отвергается,
т.е. коэффициенты
Для проверки значимости парных
коэффициентов корреляции можно
также воспользоваться
По таб. Фишера-Иейтса rкр (α=0,05; ν=48)= 0,273
Если соответствующий коэффициент | rij | > rкр, то он считается значимым.
Отметим в матрице парных коэффициентов корреляции значимые.
Таблица 4
Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при α=0,05)
Y |
X1 |
X2 |
X3 |
X4 | |
Y |
1 |
-0,16161 |
0,238011 |
0,405706 |
0,329475 |
X1 |
-0,16161 |
1 |
0,016128 |
-0,1397 |
-0,20032 |
X2 |
0,238011 |
0,016128 |
1 |
-0,18062 |
-0,09352 |
X3 |
0,405706 |
-0,1397 |
-0,18062 |
1 |
0,485923 |
X4 |
0,329475 |
-0,20032 |
-0,09352 |
0,485923 |
1 |
Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью γ интервальную оценку ρmin ≤ ρ ≤ ρmax с помощью Z-преобразования Фишера:
Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.
1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r :
2). ΔZ Найдём значение tγ, соответствующее заданной надёжности γ=0,95. - значение функции Лапласа.
В нашем случае для надёжности γ=0,95: F(t)=0,975; tγ =1,959964 (по таблице tγ =1,96).
Находим 0,28589
3). Zmin и Zmax Теперь можно найти Zmin и Zmax:
Zmin = Zr – ΔZ; Zmax= Zr + ΔZ
4). ρmin и ρmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции ρmin и ρmax , соответствующие Zmin и Zmax.
Соответствующие значения ρmin и ρmax являются гиперболическими тангенсами Zmin и Zmax : .
Построим с надёжностью γ=0,95 и с учётом найденного 0,28589 доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.
Таблица 4
Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью γ=0,95
r |
Zr |
Zmin |
Zmax |
ρmin |
ρmax | |
Y X3 |
0,405706 |
0,4305 |
0,1446 |
0,7164 |
0,143572 |
0,614644 |
Y X4 |
0,329475 |
0,3422 |
0,0563 |
0,6281 |
0,05629 |
0,556763 |
X3 X4 |
0,485923 |
0,5307 |
0,2448 |
0,8166 |
0,240043 |
0,673215 |
Таким образом, доверительные интервалы с надёжностью γ=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:
P(0,143572≤ ρYX3 ≤ 0,614644)=0,95
P(0,05629≤ ρYX4 ≤ 0,556763)=0,95