Автор работы: Пользователь скрыл имя, 24 Ноября 2011 в 22:07, лекция
Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.
По направлению связи различают:
Положительную и отрицательную регрессии можно легче понять, если использовать их графическое изображение (рис. 9.2, 9.3).
Для
простой (парной) регрессии в условиях,
когда достаточно полно установлены
причинно-следственные связи, приобретает
практический смысл только последнее
положение; при множественности причинных
связей невозможно четко отграничить
одни причинные явления от других.
9.2
ОСНОВНЫЕ ЗАДАЧИ И ПРЕДПОСЫЛКИ ПРИМЕНЕНИЯ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА
Все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой.
В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью, либо быть независимыми (см. табл. 9.1).
Корреляционная зависимость является частным случаем стохастической зависимости, при которой изменение значений факторных признаков влечет за собой изменение среднего значения результативного признака.
Корреляционная
зависимость исследуется с
Корреляционный анализ изучает взаимосвязи показателей и позволяет оценить:
Основной предпосылкой применения корреляционного анализа является необходимость подчинения совокупности значений всех факторных и результативного ( ) признаков -мерному нормальному закону распределения или близость к нему. Если объем исследуемой совокупности достаточно большой , то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Боярского, Колмогорова, чисел Вастергарда и т.д. Если , то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в расположении точек наблюдается линейная тенденция, то можно предположить, что совокупность исходных данных подчиняется нормальному распределению.
Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака ( ) от факторных .
Основной предпосылкой регрессионного анализа является то, что только результативный признак ( ) подчиняется нормальному закону распределения, а факторные признаки могут иметь произвольный закон распределения. В анализе динамических рядов в качестве факторного признака выступает время . При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным ( ) и факторными признаками.
Уравнение
регрессии, или статистическая модель
связи социально-экономических
является достаточно адекватной реальному моделируемому явлению или процессу, если выполняются следующие требования к их построению:
Соблюдение данных требований позволяет исследователю построить статистическую модель связи, наилучшим образом аппроксимирующую моделируемые социально-экономические явления и процессы.
Теоретическая обоснованность моделей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий.
Отступление от выполнения этих условий и предпосылок приводит к тому, что модель регрессии будет неадекватно отражать реально существующие связи между анализируемыми признаками.
Одной из проблем построения уравнения регрессии является ее размерность, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.
Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, реализуемую быстрее и качественнее. В то же время построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс в единой системе национального счетоводства.
Практика выработала определенный критерий, позволяющий установить оптимальное соотношение между числом факторных признаков, включаемых в модель, и объемом исследуемой совокупности. Согласно данному критерию, число факторных признаков ( ) должно быть в 5-6 раз меньше объема изучаемой совокупности.
Общая блок-схема реализации корреляционного и регрессионного методов анализа представлена на рис. 9.4.
Приведенная последовательность реализации корреляционного и регрессионного методов анализа позволяет достаточно полно охарактеризовать и смоделировать реально существующие взаимосвязи и взаимозависимости между показателями, характеризующими развитие социально-экономических явлений и процессов.
Построение
корреляционно-регрессионных моделей,
какими бы сложными они ни были, само по
себе не вскрывает полностью всех причинно-следственных
связей. Основой их адекватности является
предварительный качественный анализ,
основанный на учете специфики и особенностей
исследуемых социально-экономических
явлений и процессов.
9.3
ПАРНАЯ РЕГРЕССИЯ НА ОСНОВЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И МЕТОДА ГРУППИРОВОК
Парная регрессия характеризует связь между двумя признаками - результативным и факторным. Аналитическая связь между ними описывается следующими уравнениями:
|
- | (9.1) |
|
- | |
|
- и т.д. |
Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативный - значительно быстрее, то используется связь параболическая или степенная.
Оценка параметров уравнений регрессии ( , и в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
Основной принцип метода наименьших квадратов рассмотрим на следующем примере: будем считать, что две величины (два показателя) и взаимосвязаны между собой, причем находится в некоторой зависимости от . Следовательно, будет зависимой, а -независимой величинами.
Сущность метода наименьших квадратов заключается в нахождении параметров модели ( , ), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
Для прямой зависимости:
Рассмотрим в качестве функции параметров и , проведем математические преобразования (дифференцирование) и получим:
Откуда система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов примет следующий вид:
(9.2) |
где - объем исследуемой совокупности (число единиц наблюдений).
В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр (а в уравнении параболы и ) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Пример. Имеются следующие данные о показателях, характеризующих деятельность 10 аудиторско-консультационных фирм Москвы в 2001 г. (табл. 9.2).
Таблица 9.2 | |||||
Расчет сумм для определения параметров парного линейного уравнения регрессии* | |||||
№ п/п | Общая численность
профессионалов, чел. |
Совокупная
выручка, млн. руб. |
|||
1 | 23 | 2,62 | 529 | 60,26 | 2,661 |
2 | 32 | 3,04 | 1024 | 97,28 | 2,967 |
3 | 50 | 3,15 | 2500 | 157,50 | 3,579 |
4 | 53 | 3,83 | 2809 | 202,99 | 3,681 |
5 | 55 | 3,58 | 3025 | 196,90 | 3,749 |
6 | 58 | 4,08 | 3364 | 236,64 | 3,851 |
7 | 59 | 4,09 | 3481 | 241,31 | 3,885 |
8 | 62 | 4,20 | 3844 | 260,40 | 3,987 |
9 | 69 | 4,18 | 4761 | 288,42 | 4,225 |
10 | 75 | 4,24 | 5625 | 318,00 | 4,429 |
Итого | 536 | 37,01 | 30962 | 2 059,7 | 37,010 |
* Данные условные |
Информация о работе Статистическое изучение взаимосвязи социально-экономических явлений