Автор работы: Пользователь скрыл имя, 28 Октября 2011 в 15:19, курсовая работа
Построить линейную парную регрессию (регрессию вида ỹ= a+bx). Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию в терминах задачи.
Построить корреляционное поле и линию регрессии линейного типа.
Вычислить выборочный коэффициент корреляции и проверить гипотезу о его значимости.
Проверить значимость коэффициентов регрессии, построить для них 95%-е доверительные интервалы.
Используя построенное уравнение, спрогнозировать значение ỹр при хр= (х7+х8)/2.
Построить доверительный интервал для зависимой переменной для хр= (х7+х8)/2 с надежностью γ= 0,95.
Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона.
Вычислить коэффициент детерминации и проверить его значимость.
Оценить прогнозные качества модели.
Задание №1: Парная линейная регрессия……………………………….3
Задание №2: Нелинейная регрессия……………………...…………….11
Задание №3: Множественная регрессия……………………...………..31
σ =
=
= 14,43471
Т.к σ = 14,43471 больше 10%, то модель не приемлема для прогнозирования.
10. Вывод: отсутствие автокорреляции, статистическая значимость коэффициентов корреляции и коэффициентов уравнения, а также значимость коэффициентов детерминации говорят о высоком общем качестве построенного уравнения регрессии.
11. Все расчеты подтвердить в пакете «Анализ данных».
Таблица №5
ВЫВОД ИТОГОВ
Регрессионная статистика | |
Множественный R | 0,779418 |
R-квадрат | 0,607492 |
Нормированный R-квадрат | 0,563881 |
Стандартная ошибка | 33,95265 |
Наблюдения | 11 |
Дисперсионный анализ
df | SS | MS | F | Значимость F | ||||||||||
Регрессия | 1 | 16057,68 | 16057,683 | 13,9295 | 0,004681 | |||||||||
Остаток | 9 | 10375,04 | 1152,7827 | |||||||||||
Итого | 10 | 26432,73 | ||||||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |||||||
Y-пересечение | 124,6 | 24,441 | 5,09875 | 6E-04 | 69,3304 | 179,911 | 69,3304 | 179,9111 | ||||||
Переменная X 1 | 17,26 | 4,6238 | 3,73222 | 0,005 | 6,79728 | 27,7168 | 6,79728 | 27,71681 |
Задание №2: Нелинейная регрессия
1) Построить следующие нелинейные зависимости:
2) Рассчитать все необходимые характеристики для проведения спецификации модели, включая линейную.
3) Выбрать наиболее адекватную модель. Обосновать свой выбор
1. Построить гиперболическую зависимость (регрессию вида Ŷ = a + b/x). Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию в терминах задачи.
Замена: ỹ= a+ bх*, где х*=1/х
В таблице все средние находятся по формуле средней арифметической простой: Хср. = ∑х / N.
Таблица №6
Вспомогательные данные
Количество | X | Y | X* | X*2 | X*Y |
1 | 4,2 | 239 | 0,238095 | 0,056689 | 56,90476 |
2 | 5,5 | 254 | 0,181818 | 0,033058 | 46,18182 |
3 | 6,7 | 262 | 0,149254 | 0,022277 | 39,10448 |
4 | 7,7 | 251 | 0,12987 | 0,016866 | 32,5974 |
5 | 1,2 | 158 | 0,833333 | 0,694444 | 131,6667 |
6 | 2,2 | 101 | 0,454545 | 0,206612 | 45,90909 |
7 | 8,4 | 259 | 0,119048 | 0,014172 | 30,83333 |
8 | 6,4 | 186 | 0,15625 | 0,024414 | 29,0625 |
9 | 4,2 | 204 | 0,238095 | 0,056689 | 48,57143 |
10 | 3,2 | 198 | 0,3125 | 0,097656 | 61,875 |
11 | 3,1 | 170 | 0,322581 | 0,104058 | 54,83871 |
Среднее | 4,8 | 207,4545 | 0,285035 | 0,120631 | 52,50411 |
b = = = -168, 28
a = yср – b*x’ср = 207, 4545 – (-168, 28)*0, 285035 = 255, 4204
ỹ = 255,4204 – 168,28x*
Коэффициент регрессии показывает, что при увеличении выработки литья на одного работающего в среднем уменьшается себестоимость 1т. литья на 168,28.
2. Статистическая значимость коэффициентов регрессии проводится с использованием t-критерия Стьюдента.
Находится расчетное значение критерия:
tрасч=b/Sb ; tрасч=a/Sa ,
где Sa ,Sb – стандартные ошибки
Таблица №7
Вспомогательные данные
Y i - Y ср | X*-X*ср | ỹ | ei | ei-ei-1 | |
31,54545 | -0,04694 | 215,3537 | 23,64635 | ||
46,54545 | -0,10322 | 224,824 | 29,17603 | 5,529682 | |
54,54545 | -0,13578 | 230,3039 | 31,69608 | 2,520046 | |
43,54545 | -0,15517 | 233,5658 | 17,4342 | -14,2619 | |
-49,4545 | 0,548298 | 115,1868 | 42,81317 | 25,37897 | |
-106,455 | 0,16951 | 178,9294 | -77,9294 | -120,743 | |
51,54545 | -0,16599 | 235,387 | 23,61298 | 101,5423 | |
-21,4545 | -0,12879 | 229,1266 | -43,1266 | -66,7396 | |
-3,45455 | -0,04694 | 215,3537 | -11,3537 | 31,77294 | |
-9,45455 | 0,027465 | 202,8328 | -4,8328 | 6,520853 | |
-37,4545 | 0,037545 | 201,1364 | -31,1364 | -26,3036 | |
СУММКВ | 26432,73 | 0,433239 | 14164,15 | 31972,12 |
S2 = = = 1573,794
S2b = = = 3632,621
S2a = S2b * (x’2)ср = 438,2052
tрасч (b) = b/ Sb = (-168, 28)/ 3632,6210.5 = -2,79205
tрасч (a) = a/ Sa = 255, 4204/ 438,20520.5 = 12,2016
tтеор = t ά/2; N-2 = 2,262159
Т.к. [tрасч b] > tтеор b, то коэффициент b статистически значим.
Т.к. [tрасч a] > tтеор a, то коэффициент a статистически значим.
3. При нелинейной зависимости, степень тесноты связи между переменными X и Y определяется с помощью корреляционного отношения:
η = = = 0,681281
Т.к. η недостаточно близко к единице, то связь между X и Y слабая.
4. Определим автокорреляцию остатков
Для этого находим значения ei и определяем значения критерия d, который находится по формуле: d = = = 2,257257
Для критерия d найдены критические границы, позволяющие принять и отвергнуть гипотезу об отсутствии автокорреляции остатков.
По
таблице распределения Дарбина-
Так как d попадает в интервал (d2; 4-d2), то означает, что автокорреляция остатков отсутствует. Отсутствие автокорреляции остатков является одним из подтверждений высокого качества модели.
5. Качество уравнения регрессии оценивается с помощью средней ошибки аппроксимации
Таблица №8
Вспомогательные данные
(yi - ỹ i)/ yi | |( yi - ỹ i)/ yi | | |
0,098939 | 0,098939 | |
0,114866 | 0,114866 | |
0,120977 | 0,120977 | |
0,069459 | 0,069459 | |
0,270969 | 0,270969 | |
-0,77158 | 0,771578 | |
0,09117 | 0,09117 | |
-0,23186 | 0,231863 | |
-0,05566 | 0,055655 | |
-0,02441 | 0,024408 | |
-0,18316 | 0,183155 | |
СУММ | -0,50028 | 2,03304 |
σ = = = 18,48219
Значит,
фактическое значение себестоимости
1т. литья от расчетных по уравнению
регрессии в среднем
6. Все расчеты подтвердить в пакете «Анализ данных».
Таблица №9
ВЫВОД ИТОГОВ
Регрессионная статистика | |
Множественный R | 0,681281 |
R-квадрат | 0,464143 |
Нормированный R-квадрат | 0,404604 |
Стандартная ошибка | 39,67108 |
Наблюдения | 11 |
Дисперсионный анализ
df | SS | MS | F | Значимость F | ||||||||||
Регрессия | 1 | 12268,58 | 12268,58 | 7,795541 | 0,020983 | |||||||||
Остаток | 9 | 14164,15 | 1573,794 | |||||||||||
Итого | 10 | 26432,73 | ||||||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |||||||
Y-пересечение | 255,4204 | 20,93335 | 12,2016 | 6,68E-07 | 208,0658 | 302,7749 | 208,0658 | 302,7749 | ||||||
Переменная X 1 | -168,28 | 60,27123 | -2,79205 | 0,020983 | -304,623 | -31,9372 | -304,623 | -31,9372 |