Парная линейная регрессия

Автор работы: Пользователь скрыл имя, 28 Октября 2011 в 15:19, курсовая работа

Краткое описание

Построить линейную парную регрессию (регрессию вида ỹ= a+bx). Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию в терминах задачи.
Построить корреляционное поле и линию регрессии линейного типа.
Вычислить выборочный коэффициент корреляции и проверить гипотезу о его значимости.
Проверить значимость коэффициентов регрессии, построить для них 95%-е доверительные интервалы.
Используя построенное уравнение, спрогнозировать значение ỹр при хр= (х7+х8)/2.
Построить доверительный интервал для зависимой переменной для хр= (х7+х8)/2 с надежностью γ= 0,95.
Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона.
Вычислить коэффициент детерминации и проверить его значимость.
Оценить прогнозные качества модели.

Содержание работы

Задание №1: Парная линейная регрессия……………………………….3
Задание №2: Нелинейная регрессия……………………...…………….11
Задание №3: Множественная регрессия……………………...………..31

Содержимое работы - 1 файл

курсовая работа по эконометрике.doc

— 1.15 Мб (Скачать файл)
 

      σ = = = 14,43471 

      Т.к σ = 14,43471 больше 10%, то модель не приемлема для прогнозирования.

      10. Вывод: отсутствие автокорреляции, статистическая значимость коэффициентов корреляции и коэффициентов уравнения, а также значимость коэффициентов детерминации говорят о высоком общем качестве построенного уравнения регрессии.

      11. Все расчеты подтвердить в  пакете «Анализ данных».

    Таблица №5

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R 0,779418
R-квадрат 0,607492
Нормированный R-квадрат 0,563881
Стандартная ошибка 33,95265
Наблюдения 11

Дисперсионный анализ

  df SS MS F Значимость F
Регрессия 1 16057,68 16057,683 13,9295 0,004681
Остаток 9 10375,04 1152,7827    
Итого 10 26432,73      
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 124,6 24,441 5,09875 6E-04 69,3304 179,911 69,3304 179,9111
Переменная X 1 17,26 4,6238 3,73222 0,005 6,79728 27,7168 6,79728 27,71681
 

 

Задание №2: Нелинейная регрессия

      1) Построить следующие нелинейные зависимости:

  • Гиперболическую;
  • Логарифмическую;
  • Степенную;
  • Параболическую;

      2) Рассчитать все необходимые характеристики для проведения спецификации модели, включая линейную.

      3) Выбрать наиболее адекватную  модель. Обосновать свой выбор

    1. Гиперболическая зависимость.

      1. Построить гиперболическую зависимость (регрессию вида Ŷ = a + b/x). Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию в терминах задачи.

      Замена: ỹ= a+ bх*, где х*=1/х

      В таблице все средние находятся  по формуле средней арифметической простой: Хср. = ∑х / N.

    Таблица №6

    Вспомогательные данные

Количество X Y X* X*2 X*Y
1 4,2 239 0,238095 0,056689 56,90476
2 5,5 254 0,181818 0,033058 46,18182
3 6,7 262 0,149254 0,022277 39,10448
4 7,7 251 0,12987 0,016866 32,5974
5 1,2 158 0,833333 0,694444 131,6667
6 2,2 101 0,454545 0,206612 45,90909
7 8,4 259 0,119048 0,014172 30,83333
8 6,4 186 0,15625 0,024414 29,0625
9 4,2 204 0,238095 0,056689 48,57143
10 3,2 198 0,3125 0,097656 61,875
11 3,1 170 0,322581 0,104058 54,83871
Среднее 4,8 207,4545 0,285035 0,120631 52,50411

      b = = = -168, 28

      a = yср – b*x’ср = 207, 4545 – (-168, 28)*0, 285035 = 255, 4204

      ỹ = 255,4204 – 168,28x*

      Коэффициент регрессии показывает, что при  увеличении выработки литья на одного работающего в среднем уменьшается себестоимость 1т. литья на 168,28.

      2. Статистическая значимость коэффициентов регрессии проводится с использованием t-критерия Стьюдента.

      Находится расчетное значение критерия:

      tрасч=b/Sb ; tрасч=a/Sa ,

      где Sa ,Sb – стандартные ошибки

    Таблица №7

    Вспомогательные данные

  Y i - Y ср X*-X*ср ei ei-ei-1
  31,54545 -0,04694 215,3537 23,64635  
  46,54545 -0,10322 224,824 29,17603 5,529682
  54,54545 -0,13578 230,3039 31,69608 2,520046
  43,54545 -0,15517 233,5658 17,4342 -14,2619
  -49,4545 0,548298 115,1868 42,81317 25,37897
  -106,455 0,16951 178,9294 -77,9294 -120,743
  51,54545 -0,16599 235,387 23,61298 101,5423
  -21,4545 -0,12879 229,1266 -43,1266 -66,7396
  -3,45455 -0,04694 215,3537 -11,3537 31,77294
  -9,45455 0,027465 202,8328 -4,8328 6,520853
  -37,4545 0,037545 201,1364 -31,1364 -26,3036
СУММКВ 26432,73 0,433239   14164,15 31972,12

      S2 = = 1573,794

      S2b = = = 3632,621

      S2a = S2b * (x’2)ср = 438,2052

      tрасч (b) = b/ Sb = (-168, 28)/ 3632,6210.5 = -2,79205

      tрасч (a) = a/ Sa = 255, 4204/ 438,20520.5 = 12,2016

      tтеор = t ά/2; N-2 = 2,262159

      Т.к. [tрасч b] > tтеор b, то коэффициент b статистически значим.

      Т.к. [tрасч a] > tтеор a, то коэффициент a статистически значим.

      3. При нелинейной зависимости, степень тесноты связи между переменными X и Y определяется с помощью корреляционного отношения:

    η = = = 0,681281

      Т.к. η недостаточно близко к единице, то связь между X и Y слабая.

      4. Определим автокорреляцию остатков

      Для этого находим значения ei и определяем значения критерия d, который находится по формуле: d = = = 2,257257

      Для критерия d найдены критические границы, позволяющие принять и отвергнуть гипотезу об отсутствии автокорреляции остатков.

      По  таблице распределения Дарбина-Уотсона  при заданном уравнении значимость «α»=0,05 в числе «N»=11 и количестве объясняющих переменных «m»=1 определяют критические границы: d1 = 0,927, d2 = 1,324, (4 - d1) = 3, 073, (4 - d2) = 2, 676

      Так как d попадает в интервал (d2; 4-d2), то означает, что автокорреляция остатков отсутствует. Отсутствие автокорреляции остатков является одним из подтверждений высокого качества модели.

      5. Качество уравнения регрессии  оценивается с помощью средней ошибки аппроксимации

      Таблица №8

      Вспомогательные данные

  (yi - ỹ i)/ yi |( yi - ỹ i)/ yi |
  0,098939 0,098939
  0,114866 0,114866
  0,120977 0,120977
  0,069459 0,069459
  0,270969 0,270969
  -0,77158 0,771578
  0,09117 0,09117
  -0,23186 0,231863
  -0,05566 0,055655
  -0,02441 0,024408
  -0,18316 0,183155
СУММ -0,50028 2,03304
 

      σ = = = 18,48219

      Значит, фактическое значение себестоимости 1т. литья от расчетных по уравнению  регрессии в среднем различаются на σ=18,48219. Если ошибка аппроксимации не превышает 10%, полученное уравнение можно оценить как вполне хорошее, в нашем случае аппроксимация превышает 10%, значит модель не приемлема для прогнозирования.

      6. Все расчеты подтвердить в  пакете «Анализ данных».

Таблица №9

    ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R 0,681281
R-квадрат 0,464143
Нормированный R-квадрат 0,404604
Стандартная ошибка 39,67108
Наблюдения 11

    Дисперсионный анализ

  df SS MS F Значимость F
Регрессия 1 12268,58 12268,58 7,795541 0,020983
Остаток 9 14164,15 1573,794    
Итого 10 26432,73      
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 255,4204 20,93335 12,2016 6,68E-07 208,0658 302,7749 208,0658 302,7749
Переменная X 1 -168,28 60,27123 -2,79205 0,020983 -304,623 -31,9372 -304,623 -31,9372

Информация о работе Парная линейная регрессия