Автор работы: Пользователь скрыл имя, 25 Апреля 2012 в 18:28, курсовая работа
Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.
Подготовка данных…………………………………………..…………….3
Корреляционный анализ экономических показателей…..5
Построение матрицы парных коэффициентов корреляции………5
Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции……………………………11
Расчёт множественных коэффициентов корреляции……………19
Регрессионный анализ экономических показателей…………………24
3.1 Проверка исходных данных на мультиколлиниарность……………………………………………..…….25
3.2 Построение регрессионной модели и её интерпретация…………..27
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии………………………………………………………………..…40
- Расчёт множественных коэффици
ентов корреляции
Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей.
Вычислим точечные оценки
множественных коэффициентов
где |R| - определитель корреляционной матрицы R;
Rii – алгебраическое дополнение элемента rii корреляционной матрицы R.
Все алгебраические
R11=(-1)1+1·M11= 0,707461
R22=(-1)2+2·M22= 0,525866
R33=(-1)3+3·M33= 0,270791
R44=(-1)4+4·M44= 0,769891
R55=(-1)5+5·M55= 0,687242
Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.
Получим |R| =0,069523
Таким образом, получаем:
0,949594
0,931554
0,939144
0,95378
0,94807
Множественный коэффициент детерминации R2i/{..}) (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.
Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.
Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат (таб. 10).
Проверим значимость полученных
множественных коэффициентов
Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:
где l – порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n – количество наблюдений.
Произведя расчёты, получим (таб.10).
Для определения значимости
множественных коэффициентов
Можно найти значения Fкр по таблицам математической статистики или с помощью встроенной функции Excel.
Получаем
Fкр(0,05; 4; 45)= 2,57873918.
Таблица 10
Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов
(на уровне значимости α=0,05)
Множественный коэффициент корреляции |
Множественный коэффициент детерминации r2 |
Значение статистики F набл | |
rY /{..} |
0,949593835 |
0,901728451 |
103,2287083 |
rX1/{..} |
0,931553953 |
0,867792768 |
73,84368066 |
rX2/{..} |
0,939143815 |
0,881991105 |
84,08179679 |
rX3/{..} |
0,953780495 |
0,909697232 |
113,3308987 |
rX4/{..} |
0,948070279 |
0,898837253 |
99,9569449 |
Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр=2,57873918, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты значимо отличаются от нуля.
Полученные данные позволяют сделать следующие выводы.
Множественный коэффициент корреляции =0,9496 значим и имеет достаточно высокое значение, что говорит о том, показатель Y – индекс снижения себестоимости продукции имеет тесную связь с многомерным массивом факторных признаков X1 – трудоемкость единицы продукции, X2 – удельный вес покупных изделий, X3 - коэффициент сменности оборудования и X4 – фондовооруженность труда. Это даёт основание для проведения дальнейшего регрессионного анализа.
Множественный коэффициент детерминации r2Y/{..}=0,9017 показывает, что 0,9017 % доли дисперсии Y – индекс снижения себестоимости продукции, обусловлены изменениями факторных признаков.
Факторные признаки тоже
имеют достаточно высокие значения
множественных коэффициентов
Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y – индекс снижения себестоимости продукции имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования – построению регрессионной модели
- РЕГРЕССИОННЫЙ АНАЛИЗ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ
После того как с помощью
корреляционного анализа
Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:
для всех i=1,2,…n, или в матричной форме: ,
где
Исследуем на основе линейной регрессионной модели зависимость индекса снижения себестоимости продукции (Y) от трудоемкости единицы продукции (X1), удельного веса покупных изделий (X2), коэффициента сменности оборудования (X3) и фондовооруженности труда (X4).
3.1. Проверка исходных данных на мультиколлинеарность
Одним из основных препятствий
эффективного применения множественного
регрессионного анализа является мультиколлинеарность.
Она возникает в случаях
Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного явления, на которые следует обратить внимание. На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8 ,
т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).
Прежде, чем переходить к
построению регрессионной модели, необходимо
проверить объясняющие
Таблица 11
Матрица парных коэффициентов корреляции факторных признаков
X1 |
X2 |
X3 |
X4 | |
X1 |
1 |
0,016127603 |
-0,139695773 |
-0,20031931 |
X2 |
0,016127603 |
1 |
-0,180616129 |
-0,0935197 |
X3 |
-0,139695773 |
-0,180616129 |
1 |
0,485923242 |
X4 |
-0,200319307 |
-0,093519703 |
0,485923242 |
1 |
Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то нет необходимости сокращать набор объясняющих переменных.
3.2. Построение регрессионной модели и её интерпретация
Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.
Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.
Итак, приступаем к анализу.
I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
В модель включены все факторные признаки (X1, X2, X3 , X4).
Результаты регрессионного анализа выдаются в следующем виде (в скобках указаны принятые у нас обозначения):
ВЫВОД ИТОГОВ |
|
Регрессионная статистика | |
Множественный R |
0,54296618 |
R-квадрат |
0,294812272 |
Нормированный R-квадрат |
0,232128919 |
Стандартная ошибка |
104,4570545 |
Наблюдения |
50 |
Дисперсионный анализ |
|||||||||||||||
Df (число степеней свободы ν) |
SS(сумма квадратов отклонений Q) |
MS(средний квадрат MS=SS/ν) |
F(Fнабл= MSR/MSост) |
Значимость F | |||||||||||
Регрессия |
4 |
205271,6045(QR) |
51317,9011 |
4,70319878 |
0,002948273 | ||||||||||
Остаток |
45 |
491007,431(Qост) |
10911,2762 |
||||||||||||
Итого |
49 |
696279,0351(Qобщ) |
|||||||||||||
Коэффи-циенты (bi) |
Стандарт-ная ошибка (Ŝbi) |
t-статис-тика (tнабл) |
P-Значение |
Нижние 95% (βimin) |
Верхние 95% (βimax) |
Нижние 98,0% (βimin) |
Верхние 98,0% (βimax) | ||||||||
Y-пересе-чение |
-432,811 |
160,701399 |
-2,69326 |
0,0099058 |
-756,48 |
-109,142 |
-820,441 |
-45,1805 | |||||||
X1 |
-11,346 |
17,6512974 |
-0,64279 |
0,5236234 |
-46,898 |
24,20549 |
-53,923 |
31,23093 | |||||||
X2 |
257,8804 |
101,948974 |
2,529504 |
0,0149943 |
52,5446 |
463,2161 |
11,96762 |
503,7931 | |||||||
X3 |
319,0281 |
123,856529 |
2,575787 |
0,0133562 |
69,5682 |
568,4879 |
20,27175 |
617,7843 | |||||||
X4 |
7,903646 |
7,09745276 |
1,113589 |
0,2713685 |
-6,3914 |
22,19865 |
-9,21623 |
25,02352 |