Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 19:41, отчет по практике
Множественная регрессия широко используется для решения целого ряда вопросов эконометрики.
В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
I. Алгоритм решения. 5
1.1 Приведение исходного нелинейного уравнения регрессии к линейному. Проверка наличия мультиколлениарности между факторами уравнения. 5
1.2 Определение параметров уравнения регрессии. 10
Построение уравнения регрессии. 10
1.3 Анализ полученных результатов. 12
II. ПРОВЕРКА ВЫПОЛНЕНИЯ УСЛОВИЙ АДЕКВАТНОСТИ МОДЕЛИ 15
ІII.ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ 18
IV. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА 20
V. ПРОВЕРКА НАЛИЧИЯ АНОМАЛЬНЫХ КОЛЕБАНИЙ ИССЛЕДУЕМОЙ МОДЕЛИ 22
VI. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО ВИДА ЛИНИИ ТРЕНДА. ПРОГНОЗ ПОКАЗАТЕЛЕЙ 24
ЗАКЛЮЧЕНИЕ 26
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ: 28
Для нахождения коэффициентов
уравнения регрессии и
В диалоговом окне «Регрессия» в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал X» - вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Устанавливаем «галочки» в окне «Метки», (так как первая строка входного интервала содержит заголовки) и «Уровень надежности». Затем устанавливаем переключатель: «Новый рабочий лист», и ставим «галочки» в окошке «Остатки» (для включения остатков в выходной диапазон). В результате выше перечисленных действий получаем значения коэффициентов регрессии, а также данные для анализа регрессионной модели:
Регрессионная статистика | |
Множественный R | 0,975253778 |
R-квадрат | 0,951119932 |
Нормированный R-квадрат | 0,941954919 |
Стандартная ошибка | 0,927866659 |
Наблюдения | 20 |
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 268,0369104 | 89,3456368 | 103,7772622 | 0,0000000001 |
Остаток | 16 | 13,7749846 | 0,860936537 | ||
Итого | 19 | 281,811895 |
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |
Y-пересечение | 19,04135746 | 1,486961643 | 12,80554717 | 0,000000001 |
z1(t) | 12,1553273 | 5,393197623 | 2,253825681 | 0,038584119 |
z2(t) | 1,462012086 | 0,144268764 | 10,13394754 | 0,000000023 |
T | -0,238630408 | 0,088826609 | -2,686474352 | 0,016214789 |
Нижние 95% | Верхние 95% |
15,88913961 | 22,1935753 |
0,72225916 | 23,58839545 |
1,156175971 | 1,767848202 |
-0,426934407 | -0,050326409 |
Вывод
остатков
Наблюдение | Предсказанное y(t) | Остатки |
1 | 37,90712468 | -0,067124676 |
2 | 31,67189051 | 0,608109485 |
3 | 33,11633369 | 0,353666309 |
4 | 32,96211528 | -0,302115279 |
5 | 30,98798699 | 0,002013005 |
6 | 30,86931047 | -0,659310475 |
7 | 27,1314351 | -0,651435097 |
8 | 25,51044464 | 0,109555364 |
9 | 26,32122391 | -1,021223914 |
10 | 26,65233596 | 1,297664036 |
11 | 25,0924781 | -0,322478101 |
12 | 26,17507515 | -0,745075148 |
13 | 26,95583093 | 2,104169068 |
14 | 27,47852343 | -0,268523425 |
15 | 27,39138039 | -0,481380391 |
16 | 28,02135597 | 1,518644029 |
17 | 30,18790311 | -1,12790311 |
18 | 24,43500919 | -0,615009187 |
19 | 24,40720382 | 0,452796178 |
20 | 22,13503867 | -0,185038673 |
Соответственно
искомое уравнение регрессии
имеет вид:
Для проверки общего качества
уравнения регрессии
R - квадрат (коэффициент множественной детерминации). Он характеризует долю вариации (разброса) зависимой переменной (производительности труда), объясненной с помощью данного уравнения, т. е. обусловленной влиянием на нее отобранных, то есть включенных в модель факторов.
Множественный R – коэффициент множественной корреляции, который служит основным показателем тесноты корреляционной связи. Данный коэффициент изменяется от 0 до 1.Если R=1, то связь между Y с одной стороны и аргументами х1, х3 с другой стороны является функциональной и линейной. Если R=0, то отсутствует линейная корреляционная связь, что не исключает, однако наличие в этом случае нелинейной зависимости. Во всех случаях, то есть 0<R<1, считается, что между У и х1, х3 имеется более или менее сильная корреляционная зависимость.
Стандартная ошибка - это допустимое отклонение теоретического результатирующего фактора от фактического.
F-критерий Фишера. Проверяется нулевая гипотеза, смысл которой заключается в том, что все коэффициенты линейной регрессии за исключением свободного члена равны нулю, и, следовательно, фактор хi не оказывает влияния на результат у. Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым. В данной задаче значимость F близка к нулю, т.е. такова вероятность принятия нулевой гипотезы.
t-статистика Стьюдента. Оценивается значимость коэффициентов регрессии. Эта оценка проводится путем проверки гипотезы о равенстве нулю k-го коэффициента регрессии (k = 1,2,..., m). Расчетное значение t-критерия с числом степеней свободы (n-m-1) находят путем деления k-го коэффициента регрессии на среднеквадратическое отклонение этого коэффициента, которое в свою очередь вычисляется как квадратная дисперсия остаточной компоненты и k-го диагонального элемента матрицы, обратной матрице системы нормальных уравнений относительно параметров модели. Это расчетное значение сравнивается с табличным значением критерия Стьюдента при заданном уровне значимости, и если оно больше табличного значения, коэффициент регрессии считается значимым. В противном случае соответствующий данному коэффициенту регрессии фактор следует исключить из модели, при этом качество модели не ухудшится.
Р-значение – это вероятность принятия нулевой гипотезы по каждому коэффициенту.
Нижние 95% и верхние 95% - это доверительный интервал для нахождения уравнения регрессии (границы нахождения значений коэффициентов регрессии).
Существует 4 обязательных свойства, которым должны отвечать «Остатки», чтобы найденное уравнение регрессии было адекватным:
Рассмотрим способы проверки этих свойств:
1)Для
исследования случайности отклонений
от уравнения регрессии находят разности
ɛi= yi -
. В данной задаче используется критерий
серий, основанный на медиане выборки.
Выборка признается случайной, если для
5% уровня значимости выполняются следующие
неравенства :
Кmax
< [3,3lg(n+1)] ; ν > [1/2 (n+1-1,96√n-1)],
Где Кmax- общая протяженность самой длинной серии, а ν- общее число серий. В работе вычислены результаты, согласно которым Кmax=3 < 4,
а ν= 13>
6. Отсюда следует, что данная модель
отвечает первому свойству.
2)Проверка
второго свойства производится с помощью
нахождения показателей асимметрии γ1
и эксцесса γ2.
В качестве оценки асимметрии используются
формулы:
,
,
,
, где γ1 и γ2 – выборочные характеристики асимметрии, а σy1 и σy2 их среднеквадратические ошибки.
В данной работе = 1,0023, =0,326, σy1 =0,47, σy2 =0,76.
Если одновременно выполняются условия | | < 1,5 σy1 , и
<1,5 σy1
то гипотеза о нормальном распределении
принимается.
Если выполняется хотя бы одно из неравенств:
то гипотеза о нормальном характере распределения отвергается, линейная модель уравнения регрессии признается неадекватной.
Другие случаи требуют дополнительной проверки при помощи более сложных критериев.
Проверка
данных неравенств показала, что не
все они выполняются, поэтому
нельзя утверждать, что модель является
адекватной и мы должны провести дополнительные
проверки.
3)Проверка адекватности осуществляется на основе t- критерия Стьюдента по формуле ,
где
- среднее арифметическое значение,
а Sɛ- стандартное среднеквадратическое
отклонение для этой последовательности.
Т.к расчетное t = 0,000000000000108 меньше табличного,
то гипотеза о равенстве нулю математического
ожидания случайной последовательности
принимается.
4)Проверка
независимости значений уровней случа йной
компоненты производится на основе d –
критерия Дарбина – Уотсона по формуле:
Далее
сравниваем полученное значение с критическими
верхним d2 и нижним d1
. В работе получено значение d = 2, 76. Это
значение больше верхнего табличного
d2 , а значит гипотеза о независимости
уровней остаточной последовательности
принимается.
Точность модели характеризуется величиной отклонения выхода модели от реального значения моделируемой переменной. Для показателя , представленного рядом значений, точность определяется как разность между значениями фактического уровня ряда и его оценкой, полученной расчетным путем с использованием моделей. При этом в качестве статистических показателей точности применяют следующие:
1)Среднее квадратическое отклонение
Где i = 1…n;
-фактическое значение ряда
-теоретическое значение ряда;
n- количество наблюдений;
p- количество независимых параметров.
Значение
среднего квадратического отклонения
в работе = 0,875
Информация о работе Определение параметров нестационарного нелинейного уравнения регрессии