Корреляционный анализ количественных данных

Автор работы: Пользователь скрыл имя, 28 Декабря 2011 в 18:43, реферат

Краткое описание

Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.
Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы и результативные признаки). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.

Содержание работы

ВВЕДЕНИЕ……………………………………………………………………………..3

1.Корреляционный анализ количественных данных………………………………...4

1.1. Определение формы связи………………………………………………….5

1.2. Выбор формы связи…………………………………………………………5

1.3. Аналитическое выражение связи………………………………………..…6

1.4. Изменение тесноты связи………………………………………………..…9

1.5. Множественная корреляция…………………………………………...….12

1.6. Методы измерения тесноты связи…………………………………….….14

ЗАКЛЮЧЕНИЕ………………………………………………………………………..17

СПИСОК ЛИТЕРАТУРЫ………………………………………………………….…18

Содержимое работы - 1 файл

СТАТИСТИКА.doc

— 114.50 Кб (Скачать файл)

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ  РФ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ  УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО  ОБРАЗОВАНИЯ

«РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ ТУРИЗМА  И СЕРВИСА»

(ФГОУВПО  «РГУТИс»)

ИНСТИТУТ  ТУРИЗМА И ГОСТЕПРИИМСТВА (г. Москва) (филиал) 

Реферат 

по  дисциплине: «Статистика». 

На  тему: «Корреляционный анализ количественных данных». 

Выполнил:                            Куликова А.А. 

Группа:                            СМЗ-3 

Проверил:                                              Силаева И.В. 
 
 
 
 
 
 
 

МОСКВА

2011

ОГЛАВЛЕНИЕ:

ВВЕДЕНИЕ……………………………………………………………………………..3

1.Корреляционный  анализ количественных данных………………………………...4

      1.1. Определение формы связи………………………………………………….5

      1.2. Выбор формы связи…………………………………………………………5

      1.3. Аналитическое выражение связи………………………………………..…6

      1.4. Изменение тесноты связи………………………………………………..…9

      1.5. Множественная корреляция…………………………………………...….12

      1.6. Методы измерения тесноты связи…………………………………….….14

ЗАКЛЮЧЕНИЕ………………………………………………………………………..17

СПИСОК  ЛИТЕРАТУРЫ………………………………………………………….…18 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ВВЕДЕНИЕ.

     Важнейшей целью статистики является изучение объективно существующих связей между  явлениями. В ходе статистического  исследования этих связей необходимо выявить причинно-следственные зависимости  между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.

     Существует  две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы и результативные признаки). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.

     У животных часто имеет место сопряженная (совместная) изменчивость признаков, например, удоя и жирномолочности, яйценоскости и веса яйца и т.д. Совместную изменчивость разных признаков называют корреляция (co-relation -связь, соотношение) и обозначают символом r (понятие корреляция в современном значении появилось в середине XIX века благодаря работам сэра Френсиса Гальтона (двоюродного брата Чарльза Дарвина) и Карла Пирсона). Через 20 лет после того, как Френсис Гальтон впервые приступил к решению проблемы вероятностной взаимосвязи, К.Пирсон обнаружил, что эта задача была решена 50 лет назад французским астрономом А Бравэ в статье об ошибках в определении нахождения точки в пространстве. 
 
 
 
 
 
 
 
 

1.Корреляционный  анализ количественных  данных.

     Корреляционный  анализ - совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. Корреляционный анализ экспериментальных данных заключает в себе следующие основные практические приёмы: 1) построение корреляционного поля и составление корреляционной таблицы; 2) вычисление выборочных коэффициентов корреляции или корреляционного отношения; 3) проверка статистической гипотезы значимости связи.

     Корреляционная  связь является, во-первых, вероятностной - изменение одного признака у ряда особей на определенную величину сопровождается изменениями другого признака на различные (варьирующие) значения; во-вторых, статистической – проявляется лишь в среднем для всей выборки; в отношении отдельных наблюдений она очень неполная и неточная.

       Корреляционную связь следует  отличать от функциональной. При последней изменение одного показателя (аргумента) на определенную величину приводит к изменению другого показателя (функции) тоже на определенную величину (как, например, в формуле площади круга - S =πR2 , здесь R - радиус круга; π = 3,14...).

     Корреляция  не вскрывает причины связи. Она  дает лишь оценку силы, или тесноты  связи между переменными. Однако знать корреляции важно. Так, при  селекции животных никогда не отбирают только по одному признаку. Более того, это невозможно, т.к. секционируются особи. А особь - это десятки признаков, которые необходимо учитывать при отборе. Если бы корреляция между признаками отсутствовала, то селекция была бы проще. Отбор мог бы проводиться независимо и отдельно по каждому признаку. 
 
 
 

    1. Определение формы связи.

Корреляционный  анализ решает две основные задачи:

1.Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь. Это очень важно, так как от правильного выбора формы связи зависит конечный результат изучения взаимосвязи между признаками.

2.Вторая задача состоит в измерении тесноты, т.е. меры связи между признаками с целью установить степень влияния данного фактора на результат. Она решается математически путем определения параметров корреляционного уравнения.

     Затем проводятся оценка и анализ полученных результатов при помощи специальных  показателей корреляционного метода (коэффициентов детерминации, линейной и множественной корреляции и  т.д.), а также проверка существенности связи между изучаемыми признаками.

1.2. Выбор формы связи.

     Определяющая  роль в выборе формы связи между  явлениями принадлежит теоретическому анализу. Так, например, чем больше размер основного капитала предприятия (факторный  признак), тем больше при прочих равных условиях оно выпускает продукции (результативный признак).

С ростом факторного признака здесь, как правило, равномерно растет и результативный, поэтому зависимость между ними может быть выражена уравнением прямой Y=a+b*x, которое называется линейным уравнением регрессии.

Параметр b называется коэффициентом регрессии  и показывает, насколько в среднем  отклоняется величина результативного  признака у при отклонении величины факторного признаках на одну единицу. При x = 0 a = Y. Увеличение количества внесенных удобрений приводит, при прочих равных условиях, к росту урожайности, но чрезмерное внесение их без изменения других элементов к дальнейшему повышению урожайности не приводит, а, наоборот, снижает ее.

Такая зависимость может быть выражена уравнением параболы Y=a+b*x+c*x2.

Параметр c характеризует степень ускорения  или замедления кривизны параболы, и при c>0 парабола имеет минимум, а при c<0 - максимум. Параметр b, характеризует  угол наклона кривой, а параметр a - начало кривой.

Однако  с помощью теоретического анализа не всегда удается установить форму связи. В таких случаях приходится только предполагать о наличии определенной формы связи. Проверить эти предположения можно при помощи графического анализа, который используется для выбора формы связи между явлениями, хотя графический метод изучения связи применяется и самостоятельно. 

1.3. Аналитическое выражение связи.

Применение  методов корреляционного анализа  дает возможность выражать связь  между признаками аналитически - в  виде уравнения - и придавать ей количественное выражение. Рассмотрим применение приемов корреляционного анализа на конкретном примере.

Допустим, что между стоимостью основного  капитала и выпуском продукции существует прямолинейная связь, которая выражается уравнением прямой Y=a+b*x.

Необходимо найти параметры a и b, что позволит определить теоретические значения Y для разных значений x. Причем a и b должны быть такими, чтобы было достигнуто максимальное приближение к первоначальным (эмпирическим) значениям теоретических значений Y. Эта задача решается при помощи способа наименьших квадратов, основное условие которого сводится к определению параметров a и b, таким образом, чтобы

.

Математически доказано, что условие минимума обеспечивается, если параметры a и b, определяются при  помощи системы двух нормальных уравнений, отвечающих требованию метода наименьших квадратов:

     Первое  уравнение есть сумма всех первоначальных уравнений. Второе получается умножением обеих частей уравнения прямой на один и тот же множитель.

     Математически доказано, что условие соблюдается, если в качестве такого множителя принять значение факторного признака, т.е. если уравнение прямой умножить на х. Кроме рассмотренных функций связи в экономическом анализе часто применяются степенная, показательная и гиперболическая функции. Степенная функция имеет вид Y=axb.

     Параметр b степенного уравнения называется показателем эластичности и указывает, на сколько процентов изменится  у при возрастании х на 1 %. При  х = 1 a = Y.

     Для определения параметров степенной  функции вначале ее приводят к линейному виду путем логарифмирования: lg y=lg a+ blg x, а затем строят систему нормальных уравнений:

     Решив систему двух нормальных уравнений, находят логарифмы параметров логарифмической  функции a и b, а затем и сами параметры a и b. При помощи степенной функции определяют, например, зависимость между фондом заработной платы и выпуском продукции, затратами труда и выпуском продукции и т.д.

     Если  факторный признака x растет в арифметической прогрессии, а результативный у - в  геометрической, то такая зависимость выражается показательной функцией Y=a+bx. Для определения параметров показательной функции ее также вначале приводят к линейному виду путем логарифмирования: lg y=lg a+ xlg b, а затем строят систему нормальных уравнений:

     Вычислив  соответствующие данные и решив систему двух нормальных уравнений, находят параметры показательной функции a и b. В ряде случаев обратная связь между факторным и результативным признаками может быть выражена уравнением гиперболы:

Y=a+b/x.

     И здесь задача заключается в нахождении параметров a и b при помощи системы двух нормальных уравнений:

     При помощи гиперболической функции  изучают, например, связь между выпуском продукции и себестоимостью, уровнем  издержек обращения (в процентах  к товарооборот и товарооборотом в торговле, сроками уборки и урожайностью и т.д.).

     Таким образом, применение различных функций  в качестве уравнения связи сводится к определению параметров уравнения  по способу наименьших квадратов  при помощи системы нормальных уравнений.

     В малых совокупностях значение коэффициента регрессии подвержено случайным колебаниям. Поэтому возникает необходимость в определении достоверности коэффициента регрессии. Достоверность коэффициента регрессии определяется так же, как и в выборочном наблюдении, т.е. устанавливаются средняя и предельная ошибки для выборочной средней и доли.

Средняя ошибка коэффициента регрессии определяется по формуле:

Информация о работе Корреляционный анализ количественных данных