Автор работы: Пользователь скрыл имя, 17 Ноября 2011 в 20:34, курсовая работа
Цель статистики в экономике – это возможность правильно выбрать решения в условиях неопределенности сложившейся ситуации, умение спрогнозировать и предугадать социально-экономические явления, сделать правильные выводы и внести свой вклад в развитие экономической жизни.
Выявление взаимосвязей – одна из важнейших задач применения статистики в экономике.
Введение ………………………………………………………………………...3
1. Корреляционная связь………………………………………………………..5
1.1 Понятие корреляционной связи…………………………………..…….5
1.2 Коэффициенты корреляции………………………………………...…...8
1.3 Коэффициент корреляции Пирсона………………………………...…11
1.4.Корреляционно-регрессионный метод анализа………………...….…13
1.5.Непараметрические показатели связи…………………………...……14
2. Исследование корреляционной зависимости в социально-экономических процессах…………………………………………………………………..…...…17
2.1 Формула Пирсона ..……………………………………...…..……...…17
2.2. Задачи регрессионного анализа………………………………...…..…19
2.3. Выявление закономерности, выраженной в виде корреляционного уравнения……………………………………………………………………..……21
Заключение…………………………………………...…………….…………...…22
Список используемой литературы…
Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости.
В общем виде формула для подсчета коэффициента корреляции такова:
где хi — значения, принимаемые в выборке X,
yi — значения, принимаемые в выборке Y;
— средняя по X, — средняя по Y.
Расчет коэффициента корреляции Пирсона предполагает, что переменные Х и У распределены нормально.
В формуле (1) встречается величина при делении на n (число значений переменной X или Y) она называется ковариацией. Формула предполагает также, что при расчете коэффициентов корреляции число значений переменной Х равно числу значений переменной Y.
Число степеней свободы k=n-2.
Методы регрессионного анализа рассчитаны, главным образом, на случай устойчивого нормального распределения, в котором изменения от опыта к опыту проявляются лишь в виде независимых испытаний.
Выделяются различные формальные задачи регрессионного анализа. Они могут быть простыми или сложными по формулировкам, по математическим средствам и трудоемкости.
Первая задача — выявить факт изменчивости изучаемого явления при определенных, но не всегда четко фиксированных условиях.
Вторая задача — выявить тенденцию как периодическое изменение признака. Сам по себе этот признак может быть зависим или не зависим от переменной-условия (он может зависеть от неизвестных или неконтролируемых исследователем условий).
Проверка гипотез об отсутствии или наличии тенденции может выполняться с использованием критерия Аббе.
Критерий Аббе предназначен для проверки гипотез о равенстве средних значений, установленных для 4<n<60 взаимно независимых нормально распределенных выборок.
Эмпирическое значение критерия Аббе вычисляется по формуле:
где — среднее арифметическое из выборки;
п – число значений в выборке.
Согласно критерию, гипотеза о равенстве средних отклоняется (принимается альтернативная гипотеза), если значение статистики . Табличное (критическое) значение статистики определяется из таблицы для q-критерия Аббе.
В качестве таких величин, для которых применим критерий Аббе, могут выступать выборочные доли или проценты, средние арифметические и другие статистики выборочных распределений, если они близки к нормальному (или предварительно нормализованы). Поэтому критерий Аббе может найти широкое применение в психолого-педагогических исследованиях. Рассмотрим пример выявления тенденции с помощью критерия Аббе.
Третья
задача – это выявление закономерности,
выраженной в виде корреляционного уравнения
(регрессии).
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.
Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.
Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле
где d = Nx - Ny , т.е. разность рангов каждой пары значений х и у; n - число наблюдений.
Ранговый коэффициент корреляции Кендэла ( ) можно определить по формуле
где S = P + Q.
К
непараметрическим методам
Для определения этих коэффициентов создается расчетная таблица (см. Приложение 2.)
Коэффициент ассоциации можно расcчитать по формуле
Коэффициент контингенции рассчитывается по формуле
Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.
Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (КП ).
Таблица 3.
Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:
|
Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.
Коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле
где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.
Коэффициент
Фехнера может изменяться в пределах
-1,0 ≤ Кф ≤ +1,0.
10 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Исследователя интересует вопрос: существует ли взаимосвязь между временем решения этих задач? Переменная X — обозначает среднее время решения наглядно-образных, а переменная Y— среднее время решения вербальных заданий тестов.
Решение.
Представим исходные данные в виде таблицы 2, в которой введены дополнительные столбцы, необходимые для расчета по формуле (1).
Таблица 4
№ испы-туемых | x |
y | хi- | (хi- )2 | yi- | (yi- )2 | |
1 | 19 | 17 | -16,7 | 278,9 | -7,2 | 51,84 | 120,24 |
2 | 32 | 7 | -3,7 | 13,69 | -17,2 | 295,84 | 63,64 |
3 | 33 | 17 | -2,7 | 7,29 | -7,2 | 51,84 | 19,44 |
4 | 44 | 28 | 8,3 | 68,89 | 3,8 | 14,44 | 31,54 |
5 | 28 | 27 | -7,7 | 59,29 | 2,8 | 7,84 | -21,56 |
6 | 35 | 31 | -0,7 | 0,49 | 6,8 | 46,24 | -4,76 |
7 | 39 | 20 | 3,3 | 10,89 | -4,2 | 17,64 | -13,86 |
8 | 39 | 17 | 3,3 | 10,89 | -7,2 | 51,84 | -23,76 |
9 | 44 | 35 | 8,3 | 68,89 | 10,8 | 116,64 | 89,64 |
10 | 44 | 43 | 8,3 | 68,89 | 18,8 | 353,44 | 156,04 |
Сумма | 357 | 242 | 588,1 | 1007,6 | 416,6 | ||
Среднее | 35,7 | 24,2 |
Рассчитываем эмпирическую величину коэффициента корреляции по формуле (1):
При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона число степеней свободы рассчитывается как
k = n – 2 = 8.
ккрит=0,72 > 0,54 , следовательно, гипотеза Н1 отвергается и принимается гипотеза H0, иными словами, связь между временем решения наглядно-образных и вербальных заданий теста не доказана.
В табл. 5 представлена динамика процента студентов IV курса, на «отлично» сдававших экзамены в зимние сессии на протяжении 10 лет работы одного из факультетов университета. Требуется установить, есть ли тенденция к повышению успеваемости.
Таблица 5.
Динамика процента отличников четвертого курса за 10 лет работы факультета
Учебный год | % |
1995-96 | 10,8 |
1996-97 | 16,4 |
1997-98 | 17,4 |
1998-99 | 22,0 |
1999-00 | 23,0 |
2000-01 | 21,5 |
2001-02 | 26,1 |
2002-03 | 17,2 |
2003-04 | 27,5 |
2004-05 | 33,0 |
В качестве нулевой проверяем гипотезу об отсутствии тенденции, т. е. о равенстве процентов.
Усредняем проценты, приведенные в табл. 5, находим, что =21,5. Вычисляем разности между последующими и предыдущими значениями в выборке, возводим их в квадрат и суммируем:
Информация о работе Статистическое исследование корреляционной связи