Автор работы: Пользователь скрыл имя, 17 Декабря 2011 в 20:31, задача
Построить диаграмму рассеивания результата у и фактора х.
Определить точечные и интервальные оценки параметров линейной модели у = а + bx, а также дисперсии ошибок наблюдений σ2.
Оценить статистическую значимость коэффициентов регрессии.
Верифицировать построенную модель, использую
- элементы теории корреляции;
- дисперсионный анализ в регрессии.
При увеличении коэффициента риска на 1% от среднего значения увеличивается прибыль на 0,2141% от своего среднего уровня, и при увеличении суммы вклада на 1% от своего среднего значения прибыль растет на 0,6605%.
Проверим гипотезы о незначимости каждого из факторов. Для этого проверим гипотезы
H0i : bi = 0, H1i :b1 ≠ 0, где I = 0,1,2.
Используем статистику: * t(n-k), распределенную по закону Стьюдента с (n-k) степенями свободы, где - несмещенная оценка дисперсии оценки .
где Rmin – остаточная сумма квадратов,
n – число наблюдений, k – число оцененных параметров модели.
Rmin = (Y - )T(Y - ) = 56,888, tкр = (1-0,95;20-3) = 2,1098.
Сравнение полученных значений t – статистик с критической точкой показывает, что нулевые гипотезы о статистической незначимости коэффициентов регрессии должны быть отвергнуты. Соответственно на прибыль предприятия оказывают существенное влияние сумма вклада и коэффициент риска, а также другие, не учтенные в модели факторы.
Таблица 6
Результаты наблюдений и необходимые расчеты
для определения
парной корреляции
i | x1i | x2i | yi | x1i2 | x2i2 | уi2 | x1iyi | x2iyi | x1ix2i |
1 | 3,9 | 100 | 5 | 15,21 | 10000 | 25 | 19,5 | 500 | 390 |
2 | 3,9 | 140 | 6 | 15,21 | 19600 | 36 | 23,4 | 840 | 546 |
3 | 3,7 | 150 | 4 | 13,69 | 22500 | 16 | 14,8 | 600 | 555 |
4 | 4 | 160 | 8 | 16 | 25600 | 64 | 32 | 1280 | 640 |
5 | 3,8 | 170 | 12 | 14,44 | 28900 | 144 | 45,6 | 2040 | 646 |
6 | 4,8 | 190 | 9 | 23,04 | 36100 | 81 | 43,2 | 1710 | 912 |
7 | 5,4 | 190 | 10 | 29,16 | 36100 | 100 | 54 | 1900 | 1026 |
8 | 4,4 | 200 | 5 | 19,36 | 40000 | 25 | 22 | 1000 | 880 |
9 | 5,3 | 200 | 6 | 28,09 | 40000 | 36 | 31,8 | 1200 | 1060 |
10 | 6,8 | 200 | 8 | 46,24 | 40000 | 64 | 54,4 | 1600 | 1360 |
11 | 6 | 210 | 9 | 36 | 44100 | 81 | 54 | 1890 | 1260 |
12 | 6,4 | 220 | 11 | 40,96 | 48400 | 121 | 70,4 | 2420 | 1408 |
13 | 6,8 | 220 | 9 | 46,24 | 48400 | 81 | 61,2 | 1980 | 1496 |
14 | 7,2 | 250 | 11 | 51,84 | 62500 | 121 | 79,2 | 2750 | 1800 |
15 | 8 | 280 | 12 | 64 | 78400 | 144 | 96 | 3360 | 2240 |
16 | 8,2 | 290 | 12 | 67,24 | 84100 | 144 | 98,4 | 3480 | 2378 |
17 | 8,1 | 300 | 12 | 65,61 | 90000 | 144 | 97,2 | 3600 | 2430 |
18 | 8,5 | 310 | 12 | 72,25 | 96100 | 144 | 102 | 3720 | 2635 |
19 | 9,6 | 320 | 14 | 92,16 | 102400 | 196 | 134,4 | 4480 | 3072 |
20 | 9 | 360 | 14 | 81 | 129600 | 196 | 126 | 5040 | 3240 |
∑ | 123,8 | 4460 | 189 | 837,74 | 1082800 | 1963 | 1259,5 | 45390 | 29974 |
Парные коэффициенты корреляции вычислим по формулам:
=0,7970,
=0,821;
=0,94284.
Составим
матрицу парной корреляции:
Парная
корреляция
у | х1 | х2 | |
у | 1 | 0,7970 | 0,821 |
х1 | 0,7970 | 1 | 0,9428 |
х2 | 0,821 | 0,9428 | 1 |
Коэффициенты парной корреляции ryx1 = 0,7970 и ryx2=0,821 говорят о тесной связи прибыли, и с коэффициентом риска, и с суммой вклада.
Межфакторная связь rx1x2 = 0,94 весьма высокая, что свидетельствует о наличии в построенной модели мультиколлинеарности факторов.
Теперь найдем частные коэффициенты корреляции по формулам:
0,1212;
0,3448;
0,3243.
Частная корреляция
у | х1 | х2 | |
у | 1 | 0,1212 | 0,3448 |
х1 | 0,1212 | 1 | 0,3242 |
х2 | 0,3448 | 0,3243 | 1 |
Наиболее тесно связаны у и х1, ryx1/x2 = 0,1212, связь у с х2 также слабые, ryx2/x1 = 0,3448, и межфакторная зависимость слабая и равна rx1x2/y = 0,3243.
Множественный коэффициент корреляции равен:
Этот коэффициент
характеризует тесноту связи
рассматриваемого набора факторов с исследуемым
признаком, или, иначе, оценивает тесноту
совместное влияния факторов на результат.
Для этого построим вначале вспомогательную таблицу для расчета сумм квадратов.
Таблица 7
Расчет
сумм квадратов
i | yi | ŷi | yi – ŷi | (yi – ŷi)2 | ||||
1 | 5 | 5,25854 | -0,2585367 | 0,06684 | -4,45 | 19,8025 | -4,1914633 | 17,5684 |
2 | 6 | 6,37815 | -0,3781518 | 0,143 | -3,45 | 11,9025 | -3,0718482 | 9,43625 |
3 | 4 | 6,59267 | -2,5926717 | 6,72195 | -5,45 | 29,7025 | -2,8573283 | 8,16433 |
4 | 8 | 6,97065 | 1,0293486 | 1,05956 | -1,45 | 2,1025 | -2,4793486 | 6,14717 |
5 | 12 | 7,18517 | 4,8148287 | 23,1826 | 2,55 | 6,5025 | -2,2648287 | 5,12945 |
6 | 9 | 8,0719 | 0,9281012 | 0,86137 | -0,45 | 0,2025 | -1,3781012 | 1,89916 |
7 | 10 | 8,26805 | 1,7319493 | 2,99965 | 0,55 | 0,3025 | -1,1819493 | 1,397 |
8 | 5 | 8,22103 | -3,2210346 | 10,3751 | -4,45 | 19,8025 | -1,2289654 | 1,51036 |
9 | 6 | 8,51526 | -2,5152625 | 6,32655 | -3,45 | 11,9025 | -0,9347375 | 0,87373 |
10 | 8 | 9,00564 | -1,0056424 | 1,01132 | -1,45 | 2,1025 | -0,4443576 | 0,19745 |
11 | 9 | 9,02401 | -0,0240103 | 0,00058 | -0,45 | 0,2025 | -0,4259897 | 0,18147 |
12 | 11 | 9,43468 | 1,565318 | 2,45022 | 1,55 | 2,4025 | -0,015318 | 0,00023 |
13 | 9 | 9,56545 | -0,56545 | 0,31973 | -0,45 | 0,2025 | 0,11545001 | 0,01333 |
14 | 11 | 10,5359 | 0,4640706 | 0,21536 | 1,55 | 2,4025 | 1,08592938 | 1,17924 |
15 | 12 | 11,6372 | 0,3628233 | 0,13164 | 2,55 | 6,5025 | 2,18717671 | 4,78374 |
16 | 12 | 11,9825 | 0,0175355 | 0,00031 | 2,55 | 6,5025 | 2,53246449 | 6,41338 |
17 | 12 | 12,2297 | -0,2296763 | 0,05275 | 2,55 | 6,5025 | 2,7796763 | 7,7266 |
18 | 12 | 12,6403 | -0,6403481 | 0,41005 | 2,55 | 6,5025 | 3,19034807 | 10,1783 |
19 | 14 | 13,2799 | 0,7201362 | 0,5186 | 4,55 | 20,7025 | 3,82986378 | 14,6679 |
20 | 14 | 14,2033 | -0,203327 | 0,04134 | 4,55 | 20,7025 | 4,75332702 | 22,5941 |
∑ | 189 | 189 | 56,8884 | 176,95 | 120,062 |
Здесь - среднее значение у.
Вычисления,
необходимые для дисперсионного
анализа сведем в табл. 8.
Таблица 8
Дисперсионный анализ в регрессии
Источник дисперсии | Число степеней свободы | SS | MS | Критерий Фишера
F |
Критическая точка
Fкр=F(α; k-1,n-k) |
Гипотеза
H0 : b = 0 |
Регрессор х | 3-1 | 120,062 | 60,031 | 17,939 | 3,59153 | H1 : bi ≠ 0 |
Ошибка (остаток) | 20-3 | 56,888 | 3,346 | |||
Общая
дисперсия
(итог) |
20-1 | 176,95 |
Здесь
Используем статистику Фишера
F(0,05,3-1,20-3) = 3,59153.
Наблюдаемое значение F больше критического, следовательно, гипотеза о незначимости коэффициентов регрессии Ho : bi = 0 отвергается. Это означает, что связь между прибылью, коэффициентом риска и суммой вклада возрастает, и результаты наблюдений не противоречат предложению о ее линейности.
Коэффициент детерминации равен
Зависимость
у от х1 и х2 характеризуется
как слабая, в которой 67,85% вариации прибыли
определяется вариацией учтенных в модели
факторов.
Предположим, что на прибыль предприятия может повлиять выручка. Новая переменная отражает качественный признак, поэтому введем в модель следующую фиктивную переменную:
если есть доходность,
если
не имеет.
В этом случае модель примет следующий вид
yi = b0 + b1x1i + b2x2i + cdi + εi.
Коэффициент c в данном случае показывает, на сколько изменится прибыль предприятия, если работодатель будет иметь доходность при прочих равных условиях.
Все коэффициенты, в том числе и с, можно найти с помощью МНК, если собрать статистические данные по эмпирической переменной d (т.е. оследить влияние доходности на прибыль).
Список использованных источников