Автор работы: Пользователь скрыл имя, 17 Декабря 2011 в 20:31, задача
Построить диаграмму рассеивания результата у и фактора х.
Определить точечные и интервальные оценки параметров линейной модели у = а + bx, а также дисперсии ошибок наблюдений σ2.
Оценить статистическую значимость коэффициентов регрессии.
Верифицировать построенную модель, использую
- элементы теории корреляции;
- дисперсионный анализ в регрессии.
Оценка параметра = 0,4302 означает, что увеличение доли численности занятых людей на единицу, приводит к увеличению объема производства в среднем на 0,4302 млн. руб.
Оценка = 3,8834 формально означает среднее значение у, когда х = 0, то есть это средний объем производства при отсутствии численности занятых человек. Следует иметь в виду, что интерпретация оценки сводного члена модели может иметь или не иметь реального смысла в зависимости от конкретной задачи.
Для построения интервальной оценки прогнозируемой величины у0 используем формулу
где t0,95 = 2,365,
в нашем примере
и 29,6954 – 2,365 * 0,35508 < y0 < 29,6954+ 2.365 * 0,35508.
Таким образом, доверительный интервал имеет следующий вид:
25,623298 < y0 < 33,76916.
Если численность занятых работающих будет 60 чел., то мы на 95% уверены в том, что объем производства будет увеличен в пределах от 25,6 до 33,8 млн. рублей.
Задача 2
Аппроксимировать данные задачи 1 нелинейной моделью у = аеbx.
Рассчитать
индекс корреляции, пояснить его смысл.
Охарактеризовать тесноту связи между
численностью рабочих и объемом производства.
Решение. Преобразуем уравнение у = а*еbx в линейное путем логарифмирования lny = lna+bx.
Если обозначить у΄= lny, a΄= lna, то будем иметь линейную по параметрам модель у΄= а΄+bx.
Для
определения оценок
΄ и
используем формулы, приведенные выше.
Необходимые расчеты сведем в табл. 4.
Таблица 4
Результаты наблюдений и необходимые расчеты
для построения
линейной регрессии
№ | хi | yi | yi΄ | (xi΄)2 | (yi΄)2 | xi΄yi΄ |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1 | 32 | 17 | 2,83 | 1024 | 8,03 | 90,66 |
2 | 33 | 14 | 2,64 | 1089 | 6,96 | 87,09 |
3 | 42 | 26 | 3,26 | 1764 | 10,62 | 136,84 |
4 | 51 | 27 | 3,29 | 2601 | 10,86 | 168,09 |
5 | 60 | 27 | 3,29 | 3600 | 10,86 | 197,75 |
6 | 64 | 35 | 3,56 | 4096 | 12,64 | 227,54 |
7 | 35 | 18 | 2,89 | 1225 | 8,35 | 101,16 |
8 | 40 | 22 | 3,09 | 1600 | 9,55 | 123,64 |
9 | 108 | 49 | 3,89 | 11664 | 15,15 | 420,32 |
∑ | 465 | 235 | 28,75 | 28663 | 93,03 | 1553,09 |
Используя данные столбцов 4-7 получим
Так как a΄= lna, то оценкой а будет â = еâ΄ или â = exp(â΄).
В нашем примере â = exp(â΄) = exp(2,441) = 11,4841.
Найденные оценки позволяют записать оцененное уравнение регрессии
ŷ = 11,48412*е0,0146.
В случае нелинейных регрессий степень концентрации наблюдаемых точек вблизи линии регрессии или качество модели определяет индекс корреляции
где
ŷi – рассчитанные по модели значения
переменной у, уi – наблюдаемые значения,
=
- среднее значение у, найденное по
n наблюдениям.
Для расчета сумм квадратов составим вспомогательную таблицу (табл. 5).
Таблица 5
Расчет сумм квадратов
№ | уi | ŷi | yi
- |
|||
1 | 17 | 18,3142 | -9,1111 | 83,0124 | -7,7969 | 60,7912 |
2 | 14 | 18,5833 | -12,1111 | 146,679 | -7,5278 | 56,6678 |
3 | 26 | 21,1899 | -0,1111 | 0,0123 | -4,9212 | 24,2178 |
4 | 27 | 24,1622 | 0,8889 | 0,7901 | -1,9489 | 3,7982 |
5 | 27 | 27,5514 | 0,8889 | 0,7901 | 1,4403 | 2,0745 |
6 | 35 | 29,2066 | 8,8889 | 79,0124 | 3,0954 | 9,5818 |
7 | 18 | 19,1334 | -8,1111 | 65,7901 | -6,9778 | 48,6889 |
8 | 22 | 20,5808 | -4,1111 | 16,9012 | -5,5303 | 30,5846 |
9 | 49 | 55,4857 | 22,8889 | 523,9012 | 29,3746 | 862,8649 |
∑ | 235 | 234,2075 | 0,0000 | 916,8889 | 208,0964 | 1099,27 |
Тогда
Сравнивая индекс корреляции с коэффициентом корреляции в линейной модели (rB = 0,967591), можно сделать следующий вывод: нелинейная модель лучше аппроксимирует данные задачи, чем линейная. Близость индекса корреляции к единице свидетельствует о сильной связи между переменными, т.е. степенная модель в данной задаче является более подходящей, чем линейная.
Задача 3
Имеются данные прибыли от вложенных в акции нескольких лиц в зависимости от риска и суммы вклада.
Прибыль,
тыс. руб. |
Коэффициент риска | Сумма вклада, тыс. руб. | Прибыль, тыс. руб. | Коэффициент риска | Сумма вклада, тыс. руб. |
5 | 3,9 | 10 | 9 | 6 | 210 |
6 | 3,9 | 140 | 11 | 6,4 | 220 |
4 | 3,7 | 150 | 9 | 6,8 | 220 |
8 | 4 | 160 | 11 | 7,2 | 250 |
12 | 3,8 | 170 | 12 | 8 | 280 |
9 | 4,8 | 190 | 12 | 8,2 | 290 |
10 | 5,4 | 190 | 12 | 8,1 | 300 |
5 | 4,4 | 200 | 12 | 8,5 | 310 |
6 | 5,3 | 200 | 14 | 9,6 | 320 |
8 | 6,8 | 200 | 14 | 9 | 360 |
Задание:
Решение:
y = b0 + b1x1 + b2x2,
где b0, b1, b2 – неизвестные параметры, вектор оценок которых находится по методу наименьших квадратов в форме
Здесь Х – матрица величин, стоящих при неизвестных параметрах модели, Y – вектор-столбец наблюдений над зависимой переменной у.
В нашем примере ХТ =
Таким образом, уравнение множественной
регрессии запишется как
ŷ=1,185+0,327х1+0,028х2.
Дадим
интерпретацию коэффициентам
То
есть коэффициенты регрессии дают возможность
раздельно оценить влияние