Автор работы: Пользователь скрыл имя, 06 Мая 2012 в 15:32, реферат
Анализ взаимосвязей, присущих изучаемым процессам и явлениям, является важнейшей задачей статистических исследований. В тех случаях, когда речь идет о явлениях и процессах, обладающих сложной структурой и многообразием свойственных им связей, такой анализ представляет собой сложную задачу. Прежде всего, необходимо установить наличие взаимосвязей и их характер. Вслед за этим возникает вопрос о тесноте взаимосвязей и степени воздействия различных факторов (причин) на интересующий исследователя результат. Если черты и свойства изучаемых объектов могут быть измерены и выражены количественно, то анализ взаимосвязей может вестись на основе применения математических методов.
Введение…………………………………………………………………………...3
1. Основные понятия корреляционного и регрессионного анализа………..….4
2. Корреляционно-регрессионный метод анализа………………...………….....7
3. Непараметрические показатели связи……………………………………….13
Заключение…………………………………………………………………….…20Список использованной литературы…………………………………………...22
Пример.
На
основе выборочных данных о деятельности
6 предприятий одной из отраслей
промышленности оценить тесноту
связи между трудоемкостью
Расчетная таблица для определения коэффициента корреляции
№ п/п | Объем произведенной продукции, млн. руб., Y | Затраты на 100 изделий, чел.-час, X | yx | y2 | x2 |
1
2 3 4 5 6 |
221
1070 1001 606 779 789 |
96
77 77 89 82 81 |
21216
82390 77077 53934 63878 63909 |
48841
1144900 1002000 367236 606841 622520 |
9216
5929 5929 7921 6724 6561 |
Сумма | 4466 | 502 | 362404 | 3792338 | 42280 |
Средняя | 744,33 | 83,67 | 60400,67 | 632056,33 | 7046,67 |
Используя формулу получаем:
По формуле значение коэффициента корреляции составило:
Таким образом, результат по всем формулам одинаков и свидетельствует о сильной обратной зависимости между изучаемыми признаками.
В
случае наличия линейной и нелинейной
зависимости между двумя
Эмпирическая (т.е. выборочная) оценка этой характеристики вычисляется по следующим формулам:
Здесь черта сверху означает операцию среднего арифметического:
, а величина
называется ковариацией и обозначается как cov (x,y).
Величину выборочного коэффициента корреляции следует считать достаточной для статистического обоснованного вывода о наличии корреляционной связи между исследуемыми переменными, если будет выполнено условие:
, где - табличное значение квантили распределения Стьюдента с (n - 2)- мя степенями свободы и уровнем значимости, равным a/2.
В альтернативном случае неравенства принимается гипотеза об отсутствии корреляционной связи.
Доверительный интервал для теоретического (т.е. истинного) коэффициента корреляции r заключен в пределах: th z1 < r< th z2 ,
Где ,
- квантиль нормального распределения с уровнем значимости a/2, причем величина находится при заданном по таблицам z-преобразования Фишера (или прямым вычислением).
Пример.
По данным n = 39 предприятий получен коэффициент корреляции =-0,654, характеризующий тесноту связи между себестоимостью продукции (y) и производительностью труда (x). Найти доверительную оценку для r, задавшись 95% - й доверительной вероятностью (или 5% - м уровнем значимости).
Из таблиц z-преобразования Фишера (или прямым вычислением) для =-0,654 находим z = - 0,7823.
Тогда получим
,
.
Далее, по таблицам z-преобразования Фишера, но уже по значениям: функции и находим аргументы и :
=- 0,756, = - 0,420 .
Таким
образом, можно утверждать, что с
доверительной вероятностью P = 95% истинное
значение коэффициента корреляции r между
себестоимостью продукции (y) и производительностью
труда x будет лежать в интервале от –
0,756 до – 0, 420.
Непараметрические
показатели связи
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.
Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.
В качестве грубой количественной оценки корреляции используются коэффициенты корреляции рангов Спирмена и Кендалла, меняющиеся от –1 до +1, и чем ближе они по модулю к 1, тем теснее зависимость.
Ранг – это порядковый номер единицы совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении: либо от меньших значений к большим, либо наоборот.
Идея использования ранговых коэффициентов состоит в следующем: если проранжировать совокупность по двум признакам, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь.
Ранговый коэффициент Спирмена рассчитывается согласно формуле:
,
где - сумма квадратов разностей рангов,
- разность рангов каждой пары значений x и y,
n - общее число вариант, имеющих оба признака (число наблюдений).
Ранговый коэффициент корреляции Кендалла использует несколько другую методику вычислений и определяется согласно формуле:
Здесь – сумма положительных и отрицательных баллов (фактическая сумма рангов), где P – общая сумма числа рангов для каждого значения более высокого порядка (эти баллы учитываются со знаком «плюс»); Q - общая сумма числа рангов следующих для каждого значения , меньших по значению (эти баллы учитываются со знаком «минус»).
Рассмотрим методику вычислений обоих ранговых коэффициентов на примере измерения тесноты связи между объёмом выпуска продукции (y, млн руб.) и стоимостью основных производственных фондов (x, млн руб.) по данным 10 предприятий.
Расчет необходимых показателей (графы 3 – 8) на основе исходных данных (графы 1 и 2) дается в следующей таблице:
X | Y | Подсчет баллов | |||||
+ | - | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1,5
1,8 2,0 2,2 2,3 2,6 3,0 3,1 3,5 3,8 |
3,9
4,4 3,8 3,5 4,8 4,3 7,0 6,5 6,1 8,2 |
1
2 3 4 5 6 7 8 9 10 |
3
5 2 1 6 4 9 8 7 10 |
-2
-3 1 3 -1 2 -2 0 2 0 |
4
9 1 9 1 4 4 0 4 0 |
7
5 6 6 4 4 1 1 1 - |
2
3 1 0 1 0 2 1 0 - |
SD2=36 | P = 35 | Q = -10 |
Коэффициент корреляции рангов Спирмена получается равным
.
Для расчета коэффициента корреляции рангов Кендэлла находим общую сумму баллов (эти баллы даны в графах 7 и 8): S = P + Q = 35 + (-10) = 25. Тогда ранговый коэффициент Кендалла равен
.
Следует заметить, что коэффициент Кендалла всегда меньше, чем коэффициента Спирмена, так как .
Также к непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон, которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.
Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
Признаки | А (да) | А (нет) | Итого |
В (да) | a | b | a + b |
В (нет) | с | d | c + d |
Итого | a + c | b + d | n |
Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков ; n - общая сумма частот.
Коэффициент ассоциации можно расcчитать по формуле
Коэффициент контингенции рассчитывается по формуле
Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.
Если
необходимо оценить тесноту связи
между альтернативными
Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:
Признаки | A | B | C | Итого |
D | m11 | m12 | m13 | ∑m1j |
E | m21 | m22 | m23 | ∑m2j |
F | m31 | m32 | m33 | ∑m3j |
Итого | ∑mj1 | ∑mj2 | ∑mj3 | П |
Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.
Коэффициент взаимной сопряженности Пирсона определяется по формуле
где φ2 - показатель средней квадратической сопряженности:
Коэффициент взаимной сопряженности изменяется от 0 до 1.
Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле
где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.
Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0.
Пример.
По данным о прибыли и объеме кредитных вложений 10 коммерческих банков одного из регионов определить с помощью коэффициента Спирмена зависимость между этими признаками.
Расчет коэффициента Спирмена
№ банка | Кредитные вложения, млн. руб., X | Прибыль, млн.руб., Y | Ранги | Разность рангов di = Rx - Ry | di2 | |
Rx | Ry | |||||
1 | 2 | 3 | 8 | 9 | 10 | 11 |
1
2 3 4 5 6 7 8 9 10 |
2887
1710 3010 2472 2535 1897 2783 1862 1800 2003 |
557
605 628 488 418 397 501 589 269 437 |
9
1 10 6 7 4 8 3 2 5 |
7
9 10 5 3 2 6 8 1 4 |
2
-8 0 1 4 2 2 -5 1 1 |
4
64 0 1 16 4 4 25 1 1 |
Итого | - | - | - | - | - | 120 |