Автор работы: Пользователь скрыл имя, 28 Марта 2012 в 11:18, задача
Работа содержит решение 2 задач по "Эконометрике"
Задача 1. По территориям региона приводятся данные за 199Х г.
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у |
1 | 74 | 122 |
2 | 81 | 134 |
3 | 90 | 136 |
4 | 79 | 125 |
5 | 89 | 120 |
6 | 87 | 127 |
7 | 77 | 125 |
8 | 93 | 148 |
9 | 70 | 122 |
10 | 93 | 157 |
11 | 87 | 144 |
12 | 121 | 165 |
Требуется:
1. Построить линейное уравнение парной регрессии y по x.
2. Рассчитать линейный коэффициент парной корреляции,
коэффициент детерминации и среднюю ошибку аппроксимации.
3. Оценить
статистическую значимость уравнения регрессии в
целом и отдельных параметров регрессии и корреляции с помощью F-
критерия Фишера и t-критерия Стьюдента.
4. Выполнить прогноз заработной платы y при прогнозном
значении среднедушевого прожиточного минимума x, составляющем
107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его
доверительный интервал.
6. На одном графике отложить исходные данные и теоретическую прямую.
Решение:
1. Для расчета параметров уравнения линейной регрессии строим
расчетную таблицу 2.
Таблица 2
№ | х | у | у * х | х2 | у2 | х | у - х | (у - х)2 | Аi |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
1 | 74 | 122 | 9028 | 5476 | 14884 | 125,17 | - 3,17 | 10,05 | 2,60 |
2 | 81 | 134 | 10854 | 6561 | 17956 | 131,75 | 2,25 | 5,06 | 1,68 |
3 | 90 | 136 | 12240 | 8100 | 18496 | 140,21 | - 4,21 | 17,72 | 3,1 |
4 | 79 | 125 | 9875 | 6241 | 15625 | 129,87 | - 4,87 | 23,72 | 3,90 |
5 | 89 | 120 | 10680 | 7921 | 14400 | 139,27 | - 19,27 | 371,33 | 16,06 |
6 | 87 | 127 | 11049 | 7569 | 16129 | 137,39 | - 10,39 | 107,95 | 8,18 |
7 | 77 | 125 | 9625 | 5929 | 15625 | 127,99 | - 2,99 | 8,94 | 2,39 |
8 | 93 | 148 | 13764 | 8649 | 21904 | 143,03 | 4,97 | 24,70 | 3,36 |
9 | 70 | 122 | 8540 | 4900 | 14884 | 121,41 | 0,59 | 0,32 | 0,48 |
10 | 93 | 157 | 14601 | 8649 | 24649 | 143,03 | 13,97 | 195,16 | 8,90 |
11 | 87 | 144 | 12528 | 7569 | 20736 | 137,39 | 6,61 | 43,69 | 4,59 |
12 | 121 | 165 | 19965 | 14641 | 27225 | 169,35 | - 4,35 | 18,92 | 2,64 |
Итого | 1041 | 1625 | 142749 | 92205 | 222513 | 1645,86 | - 20,86 | 827,56 | 57,88 |
Среднее значение | 86,75 | 135,42 | 11895,75 | 7683,75 | 18542,75 | 137,16 | - | 68,96 | 4,82 |
| 13,14 | 14,96 | - | - | - | - | - |
| - |
2 | 172,57 | 223,72 | - | - | - | - | - |
| - |
По формулам находим параметры регрессии:
b = (11895, 75 – 135, 42 * 86, 75) / 7683, 75 - 86,752 = 148,06 / 158,19 = 0,94;
a = 135, 42 – 0, 92 * 86, 75 = 55, 61.
Получено уравнение регрессии:
у = 55,61 + 0,94 * х.
Параметр регрессии позволяет сделать вывод, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,94 руб. (или 94 коп.). После нахождения уравнения регрессии заполняем столбцы 7–10 таблицы 2.
2. Тесноту линейной связи оценит коэффициент корреляции:
r ху = b (х / у) = 0,94 (13,14 / 14,96) = 0,826
Т.к. значение коэффициента корреляции больше 0,7, то это говорит о наличии весьма тесной линейной связи между признаками.
Коэффициент детерминации:
r ху 2 = 0,682
Это означает, что 68 % вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Ā = 1 /n Ai = 57,88 / 12 = 4,82 %
Качество построенной модели оценивается как хорошее, так как A не превышает 10%.
3. Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия по формуле составит:
Fфакт = r ху 2 / 1 - r ху 2 * (n – 2) = 0,682 / 1 – 0,682 * 10 = 21,45
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1 = 1 и k2 = 12 – 2 = 10 составляет Fтабл = 4,96. Так как Fфакт = 21,45 > Fтабл = 4,96, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии и корреляции проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение t-критерия для числа степеней свободы df= n – 2 = 12 – 2 = 10 и уровня значимости α = 0,05 составит tтабл = 2,23.
Определим стандартные ошибки ma, mb, mr ху (остаточная дисперсия на одну степень свободы) S2ост = 827, 56 / 10 = 82,76
ma = √ 82,76 * (92205 / 122 * 172,57) = √ 82,76 * (92205 / 24850,08) = √ 82,76 * 3,71 = √ 307, 04 = 17,52
mb = √82,76 / 12 * 172,57 = √82,76 / 2070,84 = 0,040
m r ху = √1 – 0,682 / 12 – 2 = √ 0,0318 = 0,178.
Тогда, ta = a / ma = 55,61 / 17,52 = 3,14
tb = b / mb = 0,94 / 0,040 = 23,5
t r ху = r ху / m r ху = 0,826 / 0,178 = 4,64
Фактические значения t-статистики превосходят табличное значение:
ta = 3,14 > tтабл. = 2,3; tb = 23,5 > tтабл. = 2,3; t r ху = 4,64 > tтабл. = 2,3, поэтому параметры а, b, и rху не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя:
∆а = tтабл * ma = 2,23 * 17,52 = 39,07
∆b = tтабл * mb = 2,23 * 0,040= 0,089
Доверительные интервалы
γа = а + ∆а = 55,61 + 39,07 и 16,54 ≤ а* ≤ 94,68
γb = b + ∆b = 0,94+ 0,089 и 0,851 ≤ b* ≤ 1,029
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1- α = 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: х0 = 86,8 * 1,07 = 92,88 руб., тогда индивидуальное прогнозное значение заработной платы составит: ŷ0 = 55,61 + 0,94 * 92,88 = 142,92.
5. Ошибка прогноза составит:
m ŷ0 = √82,76 * (1 + 1/ 12 + (92,88 – 86,8) 2/ 12 *172,57) =√82,76 * 1,08 + 178,52 = 21,92
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
∆у0 = tтабл. * m ŷ0 = 2,23 * 21,92 =48,88
Доверительный интервал прогноза
γ у0 = ŷ0 + ∆у0 = 142,92 + 48,88 и 94,04 ≤ ŷ0 ≤ 191,80
Выполненный прогноз среднемесячной заработной платы является надежным (p = 1 – α = 1 – 0,05 = 0,95) и находится в пределах от 94,04 руб. до 191,80 руб.
6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую:
Задание № 2
По данным о значениях производительности труда - хi и прибыли yi выполните следующие задания:
1. Постройте диаграмму рассеяния признака.
2. Определите параметры уравнения парной линейной регрессии.
3. Рассчитайте линейный коэффициент, коэффициент детерминации, среднюю ошибку аппроксимации.
4. С вероятностью 0,95 (на уровне значимости 0,05) оцените статистическую значимость каждого параметра уравнения регрессии. Найдите доверительные интервалы для их значений.
5. С вероятностью 0,95 оцените статистическую значимость уравнения регрессии в целом.
6. С вероятностью 0, 95 постройте точечный и интервальный прогноз ожидаемого значения результативного признака в предположении, что значение признака фактора увеличится на 5 % относительно своего среднего уровня.
Номер предприятия | Производительность – хi | Прибыль - уi |
1 | 9,4 | 8,8 |
2 | 10,3 | 4 |
3 | 12,3 | 5,7 |
4 | 3,3 | 5,2 |
5 | 5,1 | 5,4 |
6 | 4,2 | 5 |
7 | 7,3 | 5,7 |
8 | 9,8 | 4,3 |
9 | 6,5 | 3,2 |
10 | 8,5 | 4 |
Решение:
1. Построение диаграммы рассеяния признака.
2. Определите параметры уравнения парной линейной регрессии
Для определения неизвестных параметров b0 , b1 уравнения парной линейной регрессии (1) используем стандартную систему нормальных уравнений, которая имеет вид:
(1)
Для решения этой системы вначале необходимо определить значения величин Σ x2 и Σ ху. Эти значения определяем из таблицы исходных данных, дополняя ее соответствующими колонками (табл. 1).
Таблица 1
Данные для определения Σ x2 и Σ ху
|
|
|
|
|
№ п/п | yi | xi | x2i | xi yi |
1 | 8,8 | 9,4 | 88,36 | 82,72 |
2 | 4 | 10,3 | 106,09 | 41,2 |
3 | 5,7 | 12,3 | 151,29 | 70,11 |
4 | 5,2 | 3,3 | 10,89 | 17,16 |
5 | 5,4 | 5,1 | 26,01 | 27,51 |
6 | 5 | 4,2 | 17,64 | 21 |
7 | 5,7 | 7,3 | 53,29 | 41,61 |
8 | 4,3 | 9,8 | 96,04 | 42,14 |
9 | 3,2 | 6,5 | 42,25 | 20,8 |
19 | 4 | 8,5 | 72,25 | 34 |
Итого | 51,3 | 76,7 | 664,11 | 398,25 |