Автор работы: Пользователь скрыл имя, 24 Ноября 2011 в 22:07, лекция
Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.
Предположим наличие линейной зависимости между рассматриваемыми признаками.
Система нормальных уравнений для данного примера имеет вид
Отсюда: ; .
Следовательно, . Таким образом, при увеличении числа профессионалов фирмы на одного человека ее совокупная выручка увеличится в среднем на 34 тыс. руб.
На практике часто исследования проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной корреляционной таблице. При этом анализу подвергаются сгруппированные данные и по факторному , и по результативному признакам, т.е. уравнение парной регрессии целесообразно строить на основе сгруппированных данных.
Если значения признаков и заданы в определенных интервалах (а – b), то для каждого интервала сначала определяют середину интервала , а затем уже коррелируют значения и и строят 2 уравнения регрессии между ними.
Пример. Определим зависимость между величиной капитала и объемом вложений в ценные бумаги коммерческих банков РФ на 01.01.2002 г. (табл. 9.3).
Система нормальных уравнений для определения коэффициентов уравнения регрессии примет вид:
(9.3) |
где - число анализируемых коммерческих банков;
; - число банков согласно распределению соответственно по факторному и результативному признакам;
; - значение результативного и факторного признаков по конкретной группе коммерческих банков.
Так, для первой группы:
Таким образом, подставив в систему суммарные значения, получим:
Отсюда: .
Таблица 9.3 | ||||||||
Распределение коммерческих банков РФ по величине капитала и объему вложений в ценные бумаги на 01.01.2002 г. (данные условные) | ||||||||
Группы
коммерческих банков по величине капитала,
млн. руб.,
|
Группы
коммерческих банков по объему вложений
в ценные бумаги, млн. руб., |
Число коммерческих
банков,
|
||||||
|
0-528 | 52,8-105,6 | 105,6-158,4 | 158,4-211,2 | ||||
26,4 | 79,2 | 132,0 | 184,8 | |||||
0,1-91,8 | 45,95 | 5 | 1 | 2 | - | 8 | 367,6 | 21835,44 |
91,8-183,5 | 137,65 | 3 | 5 | 1 | 1 | 10 | 1376,5 | 109018,80 |
183,5-275,2 | 229,35 | - | 3 | 2 | 1 | 6 | 1376,1 | 157425,84 |
275,2 - 366,9 | 321,05 | - | 1 | 2 | 3 | 6 | 1926,3 | 288174,48 |
Число
коммерческих банков, |
- | 8 | 10 | 7 | 5 | 30 | 5046,5 | 576454,56 |
- | 211,2 | 792,0 | 924,0 | 924,0 | 2851,2 | - | - | |
- | 5575,68 | 62726,4 | 121968,0 | 170755,2 | 361025,28 | - | - |
Если связь между признаками и криволинейная и описывается уравнением параболы второго порядка, то
В данном случае задача сводится к определению неизвестных параметров: , , .
Значения величин и представлены двумя рядами данных:
Если бы все значения, полученные по данным наблюдения, лежали строго на кривой, описываемой уравнением параболы, или для каждой из точек было бы справедливо равенство:
то не существовало бы никаких проблем. Однако на практике имеем другое:
где - разность между данными наблюдения и данными, полученными по уравнению связи.
Эта разность как раз и появляется из-за ошибок упрощения, поэтому возникает проблема нахождения таких коэффициентов уравнения (регрессии), при которых ошибка была бы минимальной. Можно минимизировать сумму абсолютных отклонений (ошибок), т.е.
или минимизировать сумму кубических ошибок, и тогда получим метод наименьших кубов:
или, наконец, минимизировать наибольшую абсолютную ошибку:
Однако наиболее оптимальным вариантом является оценка ошибки по методу наименьших квадратов:
Метод
наименьших квадратов обладает тем
замечательным свойством, что делает
число нормальных уравнений равным
числу неизвестных
Следовательно, применяя метод наименьших квадратов, мы получим уравнение:
Для нахождения значений неизвестных коэффициентов , , , при которых функция была бы минимальной, необходимо приравнять частные производные по этим величинам нулю, т.е.
Проделав простейшие преобразования, получим систему нормальных уравнений:
(9.4) |
Решив систему, найдем значения неизвестных коэффициентов , , и получим уравнение регрессии. Вычислим по уравнению регрессии теоретические значения и сравним с данными наблюдения, т.е. рассчитаем так называемую остаточную сумму квадратов (табл. 9.4).
Таблица 9.4 | ||||
Расчет остаточной суммы квадратов | ||||
Номер наблюдения |
Значения по данным | |||
наблюдения | Уравнения регрессии
| |||
1 | ||||
2 | ||||
3 | ||||
. |
Остаточная
сумма квадратов совпадает с
минимальной возможной
Оценка обратной зависимости между и , когда с увеличением (уменьшением) уменьшается (увеличивается) результативный признак , может быть осуществлена на основе уравнения гиперболы:
Систему нормальных уравнений для нахождения параметров гиперболы можно представить следующим образом:
(9.5) |
Применение метода наименьших квадратов объясняется неизбежным наличием случайных ошибок в результатах опыта.
Статистические данные обладают ошибками упрощения, которые возникают как следствие:
Решение
вопроса о возможности
Даже при сравнительно небольшом числе наблюдений применение метода наименьших квадратов позволяет получить достоверные оценки.
Метод наименьших квадратов может быть также использован в анализе косвенных наблюдений, являющихся функциями многих неизвестных.
Обобщенная блок-схема построения уравнения парной регрессии представлена на рис. 9.5.
9.4
МНОЖЕСТВЕННАЯ (МНОГОФАКТОРНАЯ) РЕГРЕССИЯ
Информация о работе Статистическое изучение взаимосвязи социально-экономических явлений