Автор работы: Пользователь скрыл имя, 20 Апреля 2012 в 14:24, курсовая работа
Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. Например, агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных футах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома.
СОДЕРЖАНИЕ
Содержание………………………………………………………………………..2
Введение……………………………………...…………………………………...3
Теоретическая часть………………………………………………………..4
Теоретические основы прикладного регрессионного анализа......….
Проверка предпосылок и предположений регрессионного анализа…………………………………………………………….…...8
Проверка случайности ………..............……………………….9
Проверка стационарности……………………………………...12
Обнаружение выбросов в выборке ……….…………….…….…… .14
Мультиколлинеарность переменных………………………………..15
Рекомендации по устранению мультиколлинеарности……...16
Доверительные интервалы для уравнения регрессии ..……...17
Определение доверительного интервала для истинного значения уравнения регрессии………..……………………….18
Свойства доверительных интервалов…………………………19
Адекватность модели…………………………………………….....20
Практическая часть……………………………………………………….21
Вывод……………………………………………………………………………..32
Список литературы……………
Содержание……………………………………………………
Введение……………………………………...……………
Вывод…………………………………………………………………
Список
литературы……………………………………………………
ВВЕДЕНИЕ
Общее
назначение множественной регрессии
(этот термин был впервые использован
в работе Пирсона - Pearson, 1908) состоит
в анализе связи между
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Теоретические
основы прикладного
Регрессионный анализ применяется для построения математических зависимостей объектов, явлений по результатам экспериментальных данных, полученных на основе проведения активного или пассивного экспериментов.
Предполагается,
что математическая зависимость
относится к определенному
,
где - вектор зависимой (выходной) переменной размерностью ;
- матрица независимых (входных) переменных размерностью ;
- вектор неизвестных параметров размерностью ;
- вектор возмещений
- количество независимых
- количество экспериментальных данных;
- класс функциональных
В зависимости – является случайной величиной, значения могут рассматриваться либо как фиксированные, либо как случайные. При этом ожидаемое значение одной случайной переменной соотносится с наблюдаемыми значениями других случайных переменных в виде условной регрессии.
Рассмотрим зависимость между случайными величинами и , представленную в виде некоторой таблицы наблюдений значений и .
Перенося
табличные значения
и
на плоскость
, получаем поле корреляции, приведенное
на рисунке 1.1
Рисунок
1.1 — Экспериментальное уравнение
регрессии
Разобьем диапазон изменения на -равных интервалах . Все точки, попавшие в интервал , отнесем к середине интервала , в результате получаем трансформированное поле корреляции.
Определим частичные средние арифметические для каждого значения :
где - число точек, оказавшихся в интервале , причем , где
- общее число наблюдений.
Соединим
последовательно точки с
а) Получение наилучших точечных и интервальных оценок неизвестных параметров регрессионного анализа;
б) Проверка гипотез относительно этих параметров;
в) Проверка адекватности;
г) Проверка множества предполагаемых предположений.
Исследуемый объект
представлен на рисунке 1.2
Рисуно
Для
корректного использования
Приведем свойства и предпосылки регрессионной ошибки:
а) Свойства регрессионной ошибки:
1)
В каждом опыте
имеет нормальный закон распределения;
2)
В каждом опыте математическое
ожидание
равно нулю;
3)
Во всех опытах дисперсия
постоянна и одинакова;
4)
Во всех опытах ошибки
независимы.
, .
б) предпосылки регрессионной ошибки:
1).
Матрица наблюдений
имеет полный ранг;
2).
Структура модели адекватна
3). Значения случайной ошибки не зависят от значений регрессоров ;
4).
Ошибки регистрации
регрессоров пренебрежимо малы по
сравнению со случайной ошибкой
.
1.2
Проверка предпосылок и
Регрессионный анализ является одним из самых распространённых методов обработки результатов наблюдений. Он служит основой для целого ряда разделов математической статистики и методов обработки данных. Регрессионный анализ базируется на ряде предположений и предпосылок, нарушение которых приводит к некорректному его использованию и ошибочной интерпретации результатов.
Если F-критерий и показал, что подгонка модели в целом является удовлетворительной; целесообразно провести анализ остатков для проверки соблюдений предпосылок и предположений.
В
этом случае исследуется набор отклонений
между экспериментальными и предсказанными
значениями зависимой переменной,
Проверка предпосылок и предположений регрессионного анализа включает в себя следующие задачи:
1) оценка случайности зависимой переменной;
2)
оценка стационарности и
3)
Проверка гипотезы о
4) Обнаружение выбросов;
5)
Проверка постоянства
6)
Оценка коррелированности
7)
Обнаружение
1.2.1 Проверка случайности
Построение
моделей методом множественного
регрессионного анализа требуется
выполнение предположения случайности
и
в нормальной линейной модели вида
где – вектор наблюдений зависимой переменной;
– матрица наблюдений
– вектор неизвестных
– вектор ошибок.
Задача проверки случайности может быть разбита на 2 подзадачи:
1)
проверка случайности
2)
проверка случайности выборки,
то есть допущения об
Первая подзадача решается с использованием критерия серий. Для этой цели последовательность наблюдений величины Y представляют последовательностью нулей и единиц, где единицей обозначают значение, превышающее среднее или медиану, и нулем, собственно, значение меньшее медианы. После обозначения вектор наблюдений преобразуется в последовательность серий где – количество подряд идущих элементов одного вида, i – номер серии.
Доказано,
что при
распределение величины r близится
к нормальному с характеристиками
Тогда с вероятностью 0,954 теоретическое число серий r будет находиться в пределах
Если фактическое значение попадает в указанные пределы, то Y можно считать случайной величиной.
Серией
называется последовательность наблюдаемых
значений, перед которыми и после
которых расположены