Определение параметров нестационарного нелинейного уравнения регрессии

Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 19:41, отчет по практике

Краткое описание

Множественная регрессия широко используется для решения целого ряда вопросов эконометрики.
В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Содержание работы

СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
I. Алгоритм решения. 5
1.1 Приведение исходного нелинейного уравнения регрессии к линейному. Проверка наличия мультиколлениарности между факторами уравнения. 5
1.2 Определение параметров уравнения регрессии. 10
Построение уравнения регрессии. 10
1.3 Анализ полученных результатов. 12
II. ПРОВЕРКА ВЫПОЛНЕНИЯ УСЛОВИЙ АДЕКВАТНОСТИ МОДЕЛИ 15
ІII.ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 18
IV. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА 20
V. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ КОЛЕБАНИЙ ИССЛЕДУЕМОЙ МОДЕЛИ 22
VI. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО ВИДА ЛИНИИ ТРЕНДА. ПРОГНОЗ ПОКАЗАТЕЛЕЙ 24
ЗАКЛЮЧЕНИЕ 26
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ: 28

Содержимое работы - 1 файл

отчет №2.doc

— 320.50 Кб (Скачать файл)

1.2 Определение параметров уравнения регрессии.

Построение уравнения регрессии.

 

   Для нахождения коэффициентов  уравнения регрессии и статистических  критериев, характеризующих значимость  и точность найденного уравнения,  используем табличный редактор  «Ехсеl», применив команды «Сервис» - «Анализ данных» - «Регрессия».

      В диалоговом окне «Регрессия»  в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал X» - вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Устанавливаем «галочки» в окне «Метки», (так как первая строка входного интервала содержит заголовки) и «Уровень надежности». Затем устанавливаем переключатель: «Новый рабочий лист», и ставим «галочки» в окошке «Остатки» (для включения остатков в выходной диапазон). В результате выше перечисленных действий получаем значения коэффициентов регрессии, а также данные для анализа регрессионной модели:

        Регрессионная статистика
        Множественный R 0,975253778
        R-квадрат 0,951119932
        Нормированный R-квадрат 0,941954919
        Стандартная ошибка 0,927866659
        Наблюдения 20
 
Дисперсионный анализ      
  df SS MS F Значимость F
Регрессия 3 268,0369104 89,3456368 103,7772622 0,0000000001
Остаток 16 13,7749846 0,860936537    
Итого 19 281,811895      
 
 
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 19,04135746 1,486961643 12,80554717 0,000000001
z1(t) 12,1553273 5,393197623 2,253825681 0,038584119
z2(t) 1,462012086 0,144268764 10,13394754 0,000000023
T -0,238630408 0,088826609 -2,686474352 0,016214789
 
 
        Нижние 95% Верхние 95%
        15,88913961 22,1935753
        0,72225916 23,58839545
        1,156175971 1,767848202
        -0,426934407 -0,050326409
 
 

Вывод остатков 

Наблюдение Предсказанное y(t) Остатки
1 37,90712468 -0,067124676
2 31,67189051 0,608109485
3 33,11633369 0,353666309
4 32,96211528 -0,302115279
5 30,98798699 0,002013005
6 30,86931047 -0,659310475
7 27,1314351 -0,651435097
8 25,51044464 0,109555364
9 26,32122391 -1,021223914
10 26,65233596 1,297664036
11 25,0924781 -0,322478101
12 26,17507515 -0,745075148
13 26,95583093 2,104169068
14 27,47852343 -0,268523425
15 27,39138039 -0,481380391
16 28,02135597 1,518644029
17 30,18790311 -1,12790311
18 24,43500919 -0,615009187
19 24,40720382 0,452796178
20 22,13503867 -0,185038673
 

Соответственно  искомое уравнение регрессии  имеет вид: 
 

1.3 Анализ полученных результатов.

 

            Для проверки общего качества  уравнения регрессии используются:

R - квадрат (коэффициент множественной детерминации). Он характеризует   долю   вариации   (разброса)   зависимой   переменной (производительности труда), объясненной с помощью данного уравнения, т. е. обусловленной влиянием на нее отобранных, то есть включенных в модель факторов.

     Множественный R – коэффициент множественной корреляции, который служит основным показателем тесноты корреляционной связи. Данный коэффициент изменяется от 0 до 1.Если R=1, то связь между Y с одной стороны и аргументами х1, х3 с другой стороны является функциональной и линейной. Если R=0, то отсутствует линейная корреляционная связь, что не исключает, однако наличие в этом случае нелинейной зависимости. Во всех случаях, то есть 0<R<1, считается, что между У и х1, х3 имеется более или менее сильная корреляционная зависимость.

     Стандартная ошибка - это допустимое отклонение теоретического результатирующего фактора от фактического.

     F-критерий Фишера. Проверяется нулевая гипотеза, смысл которой заключается в том, что все коэффициенты линейной регрессии за исключением свободного члена равны нулю, и, следовательно, фактор хi не оказывает влияния на результат у. Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым. В данной задаче значимость F близка к нулю, т.е. такова вероятность принятия нулевой гипотезы.

     t-статистика Стьюдента. Оценивается  значимость коэффициентов регрессии. Эта оценка проводится путем проверки гипотезы о равенстве нулю k-го коэффициента регрессии (k = 1,2,..., m). Расчетное значение t-критерия с числом степеней свободы (n-m-1) находят путем деления k-го коэффициента регрессии на среднеквадратическое отклонение этого коэффициента, которое в свою очередь вычисляется как квадратная дисперсия остаточной компоненты и k-го диагонального элемента матрицы, обратной матрице системы нормальных уравнений относительно параметров модели. Это расчетное значение сравнивается с табличным значением критерия Стьюдента при заданном уровне значимости, и если оно больше табличного значения, коэффициент регрессии считается значимым. В противном случае соответствующий данному коэффициенту регрессии фактор следует исключить из модели, при этом качество модели не ухудшится.

     Р-значение – это вероятность принятия нулевой гипотезы по каждому коэффициенту.

     Нижние 95% и верхние 95% - это доверительный интервал для нахождения   уравнения   регрессии (границы   нахождения   значений коэффициентов регрессии).

 

II. ПРОВЕРКА ВЫПОЛНЕНИЯ УСЛОВИЙ АДЕКВАТНОСТИ МОДЕЛИ

 

Существует 4 обязательных свойства, которым должны отвечать «Остатки», чтобы найденное уравнение регрессии было адекватным:

  1. Случайность колебаний уровней остаточной последовательности;
  2. Соответствие распределения случайной компоненты нормальному закону  распределения;
  3. Равенство нулю математического ожидания случайной компоненты;
  4. Независимость значений уровней случа йной компоненты.
 

Рассмотрим  способы проверки этих свойств:

1)Для исследования случайности отклонений от уравнения регрессии находят разности ɛi= yi - . В данной задаче используется критерий серий, основанный на медиане выборки. Выборка признается случайной, если для 5% уровня значимости выполняются следующие неравенства : 

Кmax < [3,3lg(n+1)] ;    ν > [1/2 (n+1-1,96√n-1)], 

Где Кmax- общая протяженность самой длинной серии, а ν- общее число серий. В работе вычислены результаты, согласно которым Кmax=3 < 4,

а ν= 13> 6. Отсюда следует, что данная модель отвечает первому свойству. 

2)Проверка второго свойства производится с помощью нахождения показателей асимметрии γ и эксцесса γ2. В качестве оценки асимметрии используются формулы: 

  ,  

, где γ1 и γ2 – выборочные характеристики асимметрии, а σy1 и  σy2 их среднеквадратические ошибки.

В данной работе = 1,0023, =0,326, σy1 =0,47, σy2 =0,76.

Если  одновременно выполняются условия | | < 1,5 σy1 , и

<1,5 σy1  то гипотеза о нормальном распределении принимается.  

    Если  выполняется хотя бы одно из неравенств:

    

      
,

    то  гипотеза о нормальном характере  распределения отвергается, линейная модель уравнения регрессии признается неадекватной.

    Другие  случаи требуют дополнительной проверки при помощи более сложных критериев.

    Проверка  данных неравенств показала, что не все они выполняются, поэтому  нельзя утверждать, что модель является адекватной и мы должны провести дополнительные проверки. 

3)Проверка адекватности осуществляется  на основе t- критерия Стьюдента по формуле ,

где    - среднее арифметическое значение, а Sɛ- стандартное среднеквадратическое отклонение для этой последовательности. Т.к расчетное t = 0,000000000000108 меньше табличного, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается. 

4)Проверка независимости значений уровней случа йной компоненты производится на основе d – критерия Дарбина – Уотсона по формуле:  

     

Далее сравниваем полученное значение с критическими верхним d2 и  нижним d1 . В работе получено значение d = 2, 76. Это значение больше верхнего табличного d2 , а значит гипотеза о независимости уровней остаточной последовательности принимается. 

 

ІII.ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ

 

Точность  модели характеризуется величиной  отклонения выхода модели от реального значения моделируемой переменной. Для показателя , представленного рядом значений, точность определяется как разность между значениями фактического уровня ряда и его оценкой, полученной расчетным путем с использованием моделей. При этом в качестве статистических показателей точности применяют следующие:

1)Среднее  квадратическое отклонение 

Где i = 1…n;

-фактическое значение ряда

-теоретическое значение ряда;

n- количество наблюдений;

p- количество независимых параметров.

Значение  среднего квадратического отклонения в работе = 0,875 

Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии