Корреляционно-регрессионный анализ

Автор работы: Пользователь скрыл имя, 09 Декабря 2011 в 21:17, курсовая работа

Краткое описание

Цель курсовой работы – изучить некоторые статистические методы: группировка и корреляционный анализ.
Необходимость осуществлять разнообразные группировки обуславливается существованием множества форм развития социально-экономических явлений, а также конкретных целей исследования и неоднородных по содержанию исходных данных. В курсовой работе рассматриваются различные виды группировок и показывается их применение в изучении состава кадров на промышленном предприятии.

Содержание работы

Введение 3
1. Статистический метод группировки 5
1.1. Понятие группировки 5
1.2. Виды статистических группировок 5
1.3. Принципы построения группировки 7
1.4. Применение метода группировки при изучении состава кадров на промышленном предприятии 10
2. Корреляционный анализ 14
2.1. Понятие корреляционной связи 14
2.2. Статистические методы выявления наличия корреляционной связи
между двумя признаками 15
2.3. Множественная корреляция 19
2.4. Применение множественной корреляции к изучению состава кадров на промышленном предприятии 22
2.5. Анализ коэффициентов регрессии 24
Заключение 24
Список литературы 27
Приложение 28

Содержимое работы - 1 файл

Корреляционно-регрессионный анализ.doc

— 206.50 Кб (Скачать файл)

      Данная  корреляционная таблица уже при  общем знакомстве даёт возможность  выдвинуть предположение о наличии  или отсутствии связи, а также  выяснить её направление, Если частоты  расположены по диагонали из верхнего левого угла в правый нижний, то связь между признаками прямая. Если же частоты расположены по диагонали справа налево, - то связь обратная. В данном случае можно предположить наличие прямой связи.

      Корреляционная  зависимость чётко обнаруживается только при рассмотрении средних  значений результативного признака, соответствующих определённым значениям факторного признака, т.к. при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов будет взаимопогашаться, и чётче выступит зависимость результирующего признака от фактора, положенного в основу группировки.  

      Для предварительного выявления наличия  связи и раскрытия её характера, применяют графический метод. Используя  данные об индивидуальных значениях  признака-фактора и соответствующих  ему значениях результативного признака, строится в прямоугольных координатах точечный график, который называют «полем корреляции». Для данного примера поле корреляции имеет следующий вид ( см. рис. 2.1).

 

Рис.2.1. 

      Точки корреляционного поля не лежат на одной линии, они вытянуты определённой полосой слева на право. Нанеся средние значения факторного и результирующего признаков на график и соединяя последовательно отрезками прямых соответствующие им точки, получают эмпирическую линию связи.

      Если эмпирическая линия связи по своему виду приближается к прямой линии, то это свидетельствует о наличии прямолинейной корреляционной связи между признаками. Если же имеется тенденция неравномерного изменения значений результирующего признака, и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием криволинейной корреляционной связи. 

2.3. Множественная  корреляция 

      Проведенный выше анализ статистических совокупностей  позволяет изучить взаимосвязь  только двух переменных.

      На  практике же часто приходится исследовать  зависимость результирующего признака от нескольких факторных признаков. В этом случае статистическая модель может быть представлена уравнением регрессии с несколькими переменными. Такая регрессия называется множественной (множественная корреляция).

      Например, линейная регрессия с m независимыми переменными имеет вид:

                  yi = a0x0 + a1x1 + a2x2 + … + amxm,                                  (2.1)

где    а0, а1, а2, …, аm – параметры уравнения регрессии,   

      m – число независимых  переменных,

      х0, х1, х2, …, хm – значения факторного признака,

      yi – значение результирующего признака.

      При оценке параметров этого уравнения  в каждом i-том наблюдении фиксируют  значения результирующего признака у и факторных признаков хi0…хim.  

      Оценки  параметров уравнения регрессии  находятся с помощью метода наименьших квадратов, который в случае множественной  регрессии удобнее представить  в матричной форме.

      Применяются следующие обозначения:

а = (аj), j = 0,1,…,m – вектор оценок параметров, m – число неизвестных параметров;

у = (уi), i = 1,2,…,n – вектор значений зависимой переменной, n – число наблюдений;

х = (хij) – матрица значений независимых переменных размерностью n(m+1);

е = (ei) – вектор ошибок в уравнении с оцененными параметрами.

      Уравнение регрессии с оцененными параметрами  имеет вид: 

                              у = Ха,                                                         (2.2) 

      Линейная  модель (2.1) в векторном виде имеет  вид: 

                              у = Ха + е.                                                    (2.3) 

      Сумма квадратов отклонений равна: 

Q = åеi2 = eTe = (y-Xa)T(y-Xa) = yTy – aTXTy – yTXa + aTXTXa = 

    = yTy – 2aTXTy + aTXTXa,                                                                           (2.4) 

где    Т – знак операции транспонирования, т.е. строки исходной матрицы в  транспонированной занимают положение столбцов.

      Дифференцированием Q по а получается

                              = -2ХТу + 2(ХТХ)а                                       (2.5) 

      Приравниванием  производной к нулю получается выражение для определения вектора оценки а:

                              ХТу = ХТХа,

                              а = (ХТХ)-1Ту).                                           (2.6)

      Оценку  а, определенную изложенным способом, называют оценкой метода наименьших квадратов. Применительно к уравнению  регрессии (2.1) матрицы коэффициентов имеют вид: 

                        I  x11  x12  … x1m

                        I  x21  x22  … x2m

    X = …  …  …  …  …    ,

                        …  …  …  …  …

                        I  xn1  xn2  … xnm

и, следовательно,

                        n        åxi1       …     åxim

                        åхi1   åxi12         …     åxi1xim

                  XTX=     …       …         …    …             ,

                        …       …         …    …

                        åхim   åxi1xim    …  åxim2 

                        åуi

                        åyixi1

                   ХТу=    :        .

                           :

                        åyixim 

      Суммирование  производится по числу наблюдений n. 

2.4. Применение  множественной корреляции к изучению состава кадров         на промышленном предприятии 

      Рассматривается пример:

Переменная  у (заработная плата) зависит от разряда  х1 и степени выплачивания норм х2 . Принимая линейную модель множественной регрессии в виде 

      y=a0+a1x1=a2x2 

определить  оценки а0, а1, а2 параметров по методу наименьших квадратов.

      Исходные  данные по 30 рабочим приведены в  табл. 2.3.

                                                                       

                                                      Таблица 2.3. 

Сведения  о заработной плате, стажу и степени  выполнения норм по 30 рабочим на промышленном предприятии 

i y, зар.плата x1, разряд x2, степень вып. норм
1 2 3 4
1 1100,1 5 117,4
2 1121,3 5 118,3
3 700,5 3 102,4
4 801,5 5 113,7
5 714,5 4 101,5
6 1500,5 7 127,5
7 1100,9 6 118,4
8 575,8 4 97,4
9 1598,5 7 134,5
10 704,5 4 98,5
11 714,5 4 101,5
12 763,1 4 109,4
13 670,4 2 121,3
14 764,3 4 117,4
15 1307,4 7 129,7
16 800,4 5 118,6
 
 
 
 
 
 

Продолжение табл.2.3. 
 

1 2 3 4
17 619,7 4 103,3
18 1607,4 7 136,7
19 614,1 6 114,9
20 691,8 4 100,3
21 576,4 3 100,9
22 900,7 5 99,6
23 587,3 6 105,4
24 814,4 6 103.7
25 767,5 5 111,1
26 1409.5 7 127,3
27 1499,7 7 129,9
28 904,4 6 117,7
29 871,3 5 105,4
30 860,5 5 103,2
  Итого 152 3386,9
 
 

      Оценки  а0, а1, а2 следует рассчитать по методу наименьших квадратов. 

      1  5  117,4                    1100,1                       1     …    1

Информация о работе Корреляционно-регрессионный анализ