Автор работы: Пользователь скрыл имя, 06 Мая 2012 в 09:15, контрольная работа
Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз.
Вариант: МУ
Список использованной литературы
6
Оглавление
Вариант: МУ
Список использованной литературы
Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз.
№ | Стоимость основных производственных фондов (X, млн. руб.)
| Среднесуточная производительность (Y, тонн)
|
1 | 14,3 | 28,0 |
2 | 13,5 | 30,6 |
3 | 17,0 | 37,8 |
4 | 16,5 | 40,2 |
5 | 20,3 | 41,5 |
6 | 19,4 | 44,3 |
7 | 21,9 | 50,0 |
8 | 24,5 | 60,2 |
9 | 28,9 | 58,3 |
10 | 30,0 | 64,0 |
1. Исходные данные нанесите на координатную плоскость и сделайте предварительное заключение о наличии связи между факторами X и Y, а также о её виде (прямая или обратная) и форме (линейная или нелинейная).
2. Рассчитайте парный коэффициент корреляции rxy. Используя t-критерий Стьюдента, проверьте значимость полученного коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y.
3. Полагая, что связь между факторами X и Y может быть описана линейной функцией, запишите соответствующее уравнение этой зависимости. Вычислите оценки неизвестных параметров уравнения парной регрессии по методу наименьших квадратов. Дайте интерпретацию полученных результатов.
4. Проверьте значимость всех параметров модели по t-критерию Стьюдента. Для значимых коэффициентов постройте доверительные интервалы. Сформулируйте выводы.
5. Проверьте адекватность модели (уравнения регрессии) в целом с помощью F-критерия. Сформулируйте вывод.
6. Постройте таблицу дисперсионного анализа.
7. Выберите прогнозную точку xП в стороне от основного массива данных. Используя уравнение регрессии, выполните точечный прогноз величины Y в точке xП.
8. Рассчитайте доверительные интервалы для уравнения регрессии и для результативного признака yП при доверительной вероятности .
9. Изобразите в одной системе координат: исходные данные; линию регрессии; точечный прогноз; 95% доверительный интервал.
1. Исходные данные на координатной плоскости.
Связь между признаками прямая линейная.
2. На основе исходных данных для вычисления оценок параметров моделей составляется вспомогательная таблица.
№ | X | Y | X Y | X2 | Y2 |
|
| |
1 | 14,3 | 28,0 | 400,40 | 204,49 | 784,00 | 40,07 | 305,90 | 110,71 |
2 | 13,5 | 30,6 | 413,10 | 182,25 | 936,36 | 50,84 | 221,71 | 106,17 |
3 | 17,0 | 37,8 | 642,60 | 289,00 | 1428,84 | 13,18 | 59,14 | 27,91 |
4 | 16,5 | 40,2 | 663,30 | 272,25 | 1616,04 | 17,06 | 27,98 | 21,85 |
5 | 20,3 | 41,5 | 842,45 | 412,09 | 1722,25 | 0,11 | 15,92 | 1,32 |
6 | 19,4 | 44,3 | 859,42 | 376,36 | 1962,49 | 1,51 | 1,42 | 1,46 |
7 | 21,9 | 50,0 | 1095,00 | 479,61 | 2500,00 | 1,61 | 20,34 | 5,73 |
8 | 24,5 | 60,2 | 1474,90 | 600,25 | 3624,04 | 14,98 | 216,38 | 56,93 |
9 | 28,9 | 58,3 | 1684,87 | 835,21 | 3398,89 | 68,39 | 164,10 | 105,94 |
10 | 30,0 | 64,0 | 1920,00 | 900,00 | 4096,00 | 87,80 | 342,62 | 173,44 |
Сумма | 206,3 | 454,9 | 9996,04 | 4551,51 | 22068,91 | 295,54 | 1375,51 | 611,453 |
Коэффициент корреляции между признаками рассчитаем по формуле:
Оценка значимости rxy определяется по t-критерию Стьюдента. При этом определяется фактическое значение критерия tr:
Табличное значение = 0,05; k= n – 2 = 8; t0,05; 8 = 2,31; tr = 9,572; между признаками существует корреляционная зависимость.
3. Для выражения прямолинейной формы зависимости между X и Y применяется формула:
Для расчёта параметров a и b линейной регрессии решаем систему уравнений:
Для определения параметров уравнения на основе требований метода наименьших квадратов составляется система нормальных уравнений:
Найдём коэффициенты a и b:
Таким образом, уравнение линии регрессии имеет вид:
Построение корреляционного поля, не дает обобщенную количественную оценку адекватности того или иного уравнения связи. Более продуктивно использование критерия минимальной остаточной дисперсии и показателя средней ошибки аппроксимации :
где - теоретические значения.
Подставляя в уравнение регрессии фактические значения X, определим теоретические значения . Все расчеты запишем в таблицу:
Ai | ||||
28,0 | 32,39 | -4,39 | 15,69 | 19,30 |
30,6 | 30,74 | -0,14 | 0,45 | 0,02 |
37,8 | 37,98 | -0,18 | 0,48 | 0,03 |
40,2 | 36,95 | 3,25 | 8,10 | 10,59 |
41,5 | 44,81 | -3,31 | 7,97 | 10,94 |
44,3 | 42,95 | 1,35 | 3,06 | 1,84 |
50,0 | 48,12 | 1,88 | 3,76 | 3,54 |
60,2 | 53,50 | 6,70 | 11,13 | 44,93 |
58,3 | 62,60 | -4,30 | 7,38 | 18,49 |
64,0 | 64,88 | -0,88 | 1,37 | 0,77 |
Сумма | 59,4 | 110,5 |
Средняя ошибка аппроксимации соответственно равна:
В среднем расчётные значения отклоняются от фактических на 5,94%.
4. Проверим значимость коэффициентов a и b по t-критерию Стьюдента.
Если предположить что показатели a= 0 и b=0 , то tтабл. для числа степеней свободы k=n-2=10 -2=8 и α=0,05 составит 2,31
Определим случайные ошибки ma, mb:
Соответственно
; ;
Фактическое значение t-статистики коэффициента а меньше его табличного значения и соответственно не может быть признано статистически значимым в 95% случаев. В свою очередь, фактическое значение t-статистики коэффициента b превосходит табличное значение , поэтому делаем вывод об его статистической значимости.
Рассчитаем доверительный интервал для a и b:
;
Анализируя верхнюю и нижнюю границу доверительных интервалов приводим к выводу о том, что с вероятностью p = 1 - α =0,95 параметры a и b, являются статистически значимыми и отличны от нуля. При этом следует заметить, что нижнюю границу параметра а необходимо определить как 0, поскольку один и тот же параметр не может быть как положительным, так и отрицательным.
5. Проверим адекватность модели и рассчитаем F-критерий:
; =6,61;
Если >, а 91,62> 6,61 то статистическая значимость и надёжность уравнения регрессии признаётся.
6. Строим таблицу дисперсионного анализа.
Вариация результата Y | Число степеней свободы | Сумма квадратов отклонений, S | Дисперсия на одну степень свободы, D | α=0,05 k1=1, k2=8 | |
Общая | n-1=9 | 1375,51 | - | - | - |
Факторная | k1=m=1 | 1265,05 | 1265,05 | 91,62 | 6,61 |
Остаточная | k2=n-m-1=8 | 110,46 | 13,81 | 1 | - |
7. В качестве прогнозной точки возьмем xп =32, тогда прогнозное значение
Ошибка прогноза составит:
8. Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Исходя из этого составим доверительные интервалы прогноза фактора Y для каждой точки (доверительную область), предварительно составив вспомогательную таблицу:
69,01 | 32,39 | 30,74 | 37,98 | 36,95 | 44,81 | 42,95 | 48,12 | 53,5 | 62,6 | 64,88 | |
Стандартная ошибка | 6,28 | 4,16 | 4,47 | 3,26 | 3,4 | 2,71 | 2,78 | 2,78 | 3,33 | 4,93 | 5,4 |
62,73 | 28,23 | 26,27 | 34,72 | 33,54 | 42,09 | 40,17 | 45,33 | 50,17 | 57,67 | 59,48 | |
75,3 | 36,55 | 35,21 | 41,24 | 40,35 | 47,52 | 45,72 | 50,9 | 56,82 | 67,53 | 70,28 |