Автор работы: Пользователь скрыл имя, 12 Апреля 2013 в 10:59, лабораторная работа
Задача 6. Имеются данные о величине результативного признака y и факторного признака x по выборке (табл. 40).
Построить линейное уравнение регрессии. Выводы.
Задача 8. По данным задачи 6 рассчитать
1.коэффициент парной линейной корреляции;
2.коэффициент парной линейной детерминации;
3.выводы.
2.2. Сравним абсолютное значение t-критерия и tкр.α
Абсолютное значение
t-критерия не меньше критического t = 6.19153, tкр.α = 1.761, следовательно
экспериментальные данные, с вероятностью
0.9 ( 1 - α ), не противоречат гипотезе о зависимости
случайных величин X и Y.
3. Вычисляем
коэффициенты уравнения
Уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость между случайными величинами X и Y. Если считать, что величина X свободная, а Y зависимая от Х, то уравнение регрессии запишется следующим образом
Y = a + b•X ( 3.1 ),
b = |
Rx,y |
|
= |
Rx,y |
|
( 3.2 ), |
a = My - b•Mx ( 3.3 )
Рассчитанный по формуле ( 3.2 ) коэффициент b называют коэффициентом линейной регрессии. В некоторых источниках a называют постоянным коэффициентом регрессии и b соответственно переменным.
Погрешности предсказания Y по заданному значению X вычисляются по формулам:
σy/x = σy |
|
= Sy |
|
( 3.4 ) |
- абсолютная погрешность, |
δy/x = |
|
100% ( 3.5 ) - |
Величину σy/x (формула 3.4 ) еще называют остаточным средним квадратическим отклонением, оно характеризует уход величины Y от линии регрессии, описываемой уравнением ( 3.1 ), при фиксированном (заданном) значении X.
3.1. Вычислим отношение |
|
. |
Sy2 / Sx2 = 1.25859 / 1.90737 = 0.65986
3.2. Вычислим отношение |
|
. |
Извлечем из последнего
числа квадратный корень - получим: Sy / Sx
= 0.81232
3.3 Вычислим коэффициент b по формуле
( 3.2 )
b = -0.85586 • 0.81232 = -0.69523
3.4 Вычислим коэффициент a по формуле ( 3.3 )
a = 97.26250 - ( -0.69523 • 29.25188) = 117.59924
3.5 Оценим погрешности уравнения регрессии.
3.5.1 Извлечем из Sy2 квадратный корень получим:
Sy = |
|
= 1.12187 ; |
3.5.2 Возведем в квадрат Rx,y получим:
R2x,y = -0.855862 = 0.73249
3.5.3 Вычислим абсолютную погрешность (остаточное среднее квадратическое отклонение) по формуле ( 3.4 )
σy/x = 1.12187 |
|
= 0.58024 |
3.5.4 Вычислим относительную погрешн
δy/x = ( 0.58024 / 97.26250)100% = 0.59657%
Ответ:
Уравнение линейной регрессии имеет вид: Y = 117.59924 -0.69523
X Погрешности уравнения: σy/x = 0.58024 ; δy/x = 0.59657%
4. Строим диаграмму рассеяния (корреляционное поле) и график линии регрессии.
Диаграмма рассеяния — это графическое изображение соответствующих пар (xk , yk ) в виде точек плоскости, в прямоугольных координатах с осями X и Y. Корреляционное поле является одним из графических представлений связанной (парной) выборки. В той же системе координат строится и график линии регрессии. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы диаграмма была максимально наглядной.
4.1. Находим минимальный
и максимальный элемент
4.2. Находим минимальный
и максимальный элемент
4.3. На оси абсцисс выбираем начальную точку чуть левее точки x1 = 27.10000, и такой масштаб, чтобы на оси поместилась точка x16 = 32.23000 и отчетливо различались остальные точки.
4.4. На оси ординат выбираем начальную точку чуть левее точки y15 = 95.60000, и такой масштаб, чтобы на оси поместилась точка y3 = 98.90000 и отчетливо различались остальные точки.
4.5. На оси абсцисс размещаем значения xk, а на оси ординат значения yk.
4.6. Наносим точки (x1, y1 ), (x2, y2 ),…,(x16, y16 ) на координатную плоскость. Получаем диаграмму рассеяния (корреляционное поле), изображенное на рисунке ниже.
4.7. Начертим линию регрессии.
Для этого найдем две различные точки с координатами (xr1 , yr1) и (xr2 , yr2) удовлетворяющие уравнению (3.6), нанесем их на координатную плоскость и проведем через них прямую. В качестве абсциссы первой точки возьмем значение xmin = 27.10000. Подставим значение xmin в уравнение (3.6), получим ординату первой точки. Таким образом имеем точку с координатами ( 27.10000, 98.75854 ). Аналогичным образом получим координаты второй точки, положив в качестве абсциссы значение xmax = 32.23000. Вторая точка будет: ( 32.23000, 95.19202 ).
Линия регрессии показана на рисунке ниже красным цветом
5. Коэффициент детерминации
Квадрат (множественного)
коэффициента корреляции называется коэффициентом
детерминации, который показывает долю
вариации результативного признака,
объясненную вариацией
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= -0.8558582 = 0.732493
т.е. в 73,25 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - невысокая. Остальные 26,75 % изменения Y объясняются факторами, не учтенными в модели.