Автор работы: Пользователь скрыл имя, 28 Октября 2011 в 15:19, курсовая работа
Построить линейную парную регрессию (регрессию вида ỹ= a+bx). Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию в терминах задачи.
Построить корреляционное поле и линию регрессии линейного типа.
Вычислить выборочный коэффициент корреляции и проверить гипотезу о его значимости.
Проверить значимость коэффициентов регрессии, построить для них 95%-е доверительные интервалы.
Используя построенное уравнение, спрогнозировать значение ỹр при хр= (х7+х8)/2.
Построить доверительный интервал для зависимой переменной для хр= (х7+х8)/2 с надежностью γ= 0,95.
Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона.
Вычислить коэффициент детерминации и проверить его значимость.
Оценить прогнозные качества модели.
Задание №1: Парная линейная регрессия……………………………….3
Задание №2: Нелинейная регрессия……………………...…………….11
Задание №3: Множественная регрессия……………………...………..31
b0 = = 87, 63697
b1 = = 36, 347
b2 = = -1, 95578
Таким образом, уравнение регрессии примет вид:
ỹ = 87,63697+36,347x-1,95578x2
Коэффициент
регрессии показывает, что при
увеличении выработки литья на одного
работающего в среднем
2.
Статистическая значимость
Таблица №19
Вспомогательные данные
yi - yср | X-Xср | ỹ i | ei | ei -ei-1 | |
31,54545 | 205,7944 | 205,7944 | 33,2055797 | ||
46,54545 | 228,3832 | 228,3832 | 25,6168491 | -7,58873 | |
54,54545 | 243,367 | 243,367 | 18,6330481 | -6,9838 | |
43,54545 | 251,5507 | 251,5507 | -0,5507404 | -19,1838 | |
-49,4545 | 128,437 | 128,437 | 29,5629598 | 30,1137 | |
-106,455 | 158,1344 | 158,1344 | -57,13439 | -86,6974 | |
51,54545 | 254,952 | 254,952 | 4,04798383 | 61,18237 | |
-21,4545 | 240,1491 | 240,1491 | -54,149062 | -58,197 | |
-3,45455 | 205,7944 | 205,7944 | -1,7944203 | 52,35464 | |
-9,45455 | 183,9202 | 183,9202 | 14,0798164 | 15,87424 | |
-37,4545 | 181,5176 | 181,5176 | -11,517624 | -25,5974 | |
СУММКВ | 26432,73 | 9527,25832 | 19676,05 |
tрасч(bi) =
S2bi = S2 * Cjj
S2 = = = 1190,907
|
X =
|
|
xT=
x*xT =
|
(x*xT)-1
=
= 2538, 52
= 534, 0054
= 5, 373173
tрасч(b0) = = 1,73939
tрасч(b1) = = 1,57288
tрасч(b2) = = -0,84373
tтеор = t ά/2; N-m-1 = 2,776
Т.к. |tрасчb0|<tтеорb0, то коэффициент b0 статистически не значим.
Т.к. |tрасчb1|<tтеорb1,то коэффициент b1 статистически незначим.
Т.к. |tрасчb2|<tтеорb2, то коэффициент b2 статистически не значим.
3.
Определить тесноту связи
η = = = 0,799729
Т.к. η недостаточно близко к единице, то связь между X и Y слабая.
4.
Определим автокорреляцию
Таблица №20
Вспомогательные данные
(yi - ỹ i)/ yi | |( yi - ỹ i)/ yi | | |
0,138935 | 0,138935 | |
0,100854 | 0,100854 | |
0,071119 | 0,071119 | |
-0,00219 | 0,002194 | |
0,187107 | 0,187107 | |
-0,56569 | 0,565687 | |
0,015629 | 0,015629 | |
-0,29112 | 0,291124 | |
-0,0088 | 0,008796 | |
0,07111 | 0,07111 | |
-0,06775 | 0,067751 | |
СУММ | -0,3508 | 1,520307 |
Для этого находим значения ei и определяем значения критерия d, который находится по формуле: d = = = 2,065238
Для критерия d найдены критические границы, позволяющие принять и отвергнуть гипотезу об отсутствии автокорреляции остатков.
По
таблице распределения Дарбина-
Так как d попадает в интервал (d2; 4-d2), то означает, что автокорреляция остатков отсутствует. Отсутствие автокорреляции остатков является одним из подтверждений высокого качества модели.
5. Качество уравнения регрессии оценивается с помощью средней ошибки аппроксимации σ = = = 13,82097
Значит, фактическое значение годового товарооборота отдельного филиала от расчетных по уравнению регрессии в среднем различаются на σ=13,82097. Если ошибка аппроксимации не превышает 10%, полученное уравнение можно оценить как вполне хорошее, степенная модель не приемлема для прогнозирования.
6. Все расчеты подтвердить в пакете «Анализ данных».
Таблица №21
ВЫВОД ИТОГОВ
Регрессионная статистика | |
Множественный R | 0,799729 |
R-квадрат | 0,639566 |
Нормированный R-квадрат | 0,549457 |
Стандартная ошибка | 34,50952 |
Наблюдения | 11 |
Дисперсионный анализ
df | SS | MS | F | Значимость F | |||||||||
Регрессия | 2 | 16905,47 | 8452,734 | 7,097727 | 0,016877 | ||||||||
Остаток | 8 | 9527,258 | 1190,907 | ||||||||||
Итого | 10 | 26432,73 | |||||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||||||
Y-пересечение | 87,63697 | 50,38372 | 1,73939 | 0,120156 | -28,5482 | 203,8221 | -28,5482 | 203,8221 | |||||
Переменная X 1 | 36,347 | 23,10856 | 1,57288 | 0,154392 | -16,9415 | 89,63546 | -16,9415 | 89,63546 | |||||
Переменная X 2 | -1,955778318 | 2,318011 | -0,84373 | 0,423329 | -7,30112 | 3,389564 | -7,30112 | 3,389564 |
2. Выбрать наиболее адекватную модель. Обосновать свой выбор.
Таблица №22
Линейная зависимость | Гиперболическая зависимость | Логарифмическая зависимость | |||
Ŷ=a+b*x | Ŷ=a+b/x | Ŷ=a+b* lnx | |||
Ŷ=124,6207+17,25705X | Ŷ=255,4204-168,28/X | Ŷ=110,0192+67,97196lnX | |||
t расч b | 3,73222 | tрасчa | 12,2016 | tрасчa | 3,91554 |
t расч a | 5,09875 | tрасчb | (-2,79205) | tрасчb | 3,72436 |
t теор | 2,20099 | t теор | 2,26216 | t теор | 2,26216 |
т.к. [tрасч b]>tтеор b, то коэффициент b статистически значим | т.к. |tрасчa|>tтеорa, то коэффициент a статистически значим | т.к. |tрасчa|>tтеорa, то коэффициент a статистически значим | |||
т.к. [tрасч a]>tтеор a, то коэффициент a статистически значим | т.к. |tрасчb|>tтеорb, то коэффициент b статистически значим | т.к. |tрасчb|>tтеорb, то коэффициент b статистически значим | |||
d | 1,43892 | d | 2,2573 | d | 2,0828 |
d1 | 0,927 | d1 | 0,927 | d1 | 0,927 |
d2 | 1,324 | d2 | 1,324 | d2 | 1,324 |
попадет в интервал от d2 до (4-d2),то автокорреляция остатков отсутствует | попадет в интервал от d2 до (4-d2),то автокорреляция остатков отсутствует | попадет в интервал от d2 до (4-d2),то автокорреляция остатков отсутствует | |||
rxy | 0,77941803 | η | 0,681281 | η | 0,778772 |
т.к. η не достаточно близок к единице, то связь между X и Y слабая | т.к. η близко к единице, то связь между X и Y сильная | ||||
т.к. rxy достаточно близок к единице, то связь между x и y сильная | |||||
σ | 12,5534 | σ | 18,482 | σ | 14,832 |
т.к σ больше 10%, то модель не приемлема для прогнозирования | т.к σ больше 10%, то модель не приемлема для прогнозирования | т.к σ больше 10%, то модель не приемлема для прогнозирования | |||