Анализ динамических рядов и построение уравнения многофакторной корреляционной связи

Автор работы: Пользователь скрыл имя, 26 Марта 2012 в 08:34, курсовая работа

Краткое описание

Курсовая работа имеет комплексный характер, ее выполнение включает следующие стадии:
Проведение качественного анализа таблицы исходных динамических рядов.
Выпрямление исходных динамических рядов, при необходимости.
Расчёт показателей вариации динамических рядов. Ранжирование признаков-факторов.
Количественное измерение тесноты связи между динамикой признака-функции и определённого числа признаков-факторов методом парной корреляции.
Построение уравнения многофакторной корреляционной связи признака-функции с наиболее значимыми признаками-факторами.

Содержание работы

Введение
1. Качественный анализ таблицы исходных динамических рядов
1.2. Понятие о динамических рядах.
1.2 Анализ исходных динамических рядов
1.2.1. Исследование исходных динамических рядов на непрерывность
1.2.2. Характеристика динамики исходных динамических рядов
1.2.3. Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами
2. Расчет показателей вариации динамических рядов
2.1. Понятие вариации динамических рядов
2.2. Расчет показателей вариации
3. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции
3.1. Понятие корреляции
3.2. Анализ коэффициентов парной корреляции
4. Построение уравнений многофакторной корреляционной связи
4.1. Понятие множественной регрессии
4.2. Построение уравнения множественной регрессии
Заключение
Список использованной литературы

Содержимое работы - 1 файл

Статистика моя курсовая!.doc

— 609.50 Кб (Скачать файл)

Направленность динамики ряда определяется двояко:

1)      визуально;

2)   расчетным способом.

И в том, и в другом случае расчет выполняется посредством программы «Elvis».

1) Визуальный способ

Визуальная оценка предполагает сопоставление крайних (последнего и начального) уровней ряда.

Определение направленности динамических рядов:

По крайним уровням ряда:

  Направленность 1-го признака растущая.

  Направленность 2-го признака растущая.

  Направленность 3-го признака растущая.

  Направленность 4-го признака растущая.

  Направленность 5-го признака убывающая.

 

2) Расчетный способ

Расчетный  способ сопряжен с расчетом среднегодовых темпов роста () в пределах изучаемого периода. При растущей динамике >1, при убывающей <1. Ряды, сонаправленные с  рядом функционального признака, имеют среднегодовые темпы роста того же знака, что и аналогичные параметры признака-функции.

По цепным темпам роста:

  Средний цепной темп роста по 1-му признаку равен 1.0337

  Динамика растущая.

  Средний цепной темп роста по 2-му признаку равен 1.0332

  Динамика растущая.

  Средний цепной темп роста по 3-му признаку равен 1.0152

  Динамика растущая.

  Средний цепной темп роста по 4-му признаку равен 1.0225

  Динамика растущая.

  Средний цепной темп роста по 5-му признаку равен  .9752

  Динамика убывающая.

 

Все признаки, кроме пятого имеют растущую динамику.

0,975-1,0337=-0,58 =>5.8% меньше 7%,но близко по значению;

Следовательно ≈70% поля регрессии совпадает с полем корреляции.

В данном случае условие сонаправленности можно считать выполненным.

Поскольку динамические ряды признаков - факторов непрерывны, сонаправлены и имеют жесткую динамическую связь с признаком-функцией, исходные динамические ряды можно считать полем регрессии. Если при балансовой связи будет иметь место представительная генеральная совокупность, можно считать, что поле регрессии и поле корреляции совпадают.

1.2.3. Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами

По характеру связи таблицы исходной информации делятся на три вида:

1)      балансовые, когда уровни признака-функции формируются из уровней признаков-факторов;

2)      аналитические, когда уровни признака-функции и уровни отдельных признаков-факторов связаны аналитически;

3)      комбинационные, когда уровни признака-функции связаны аналитически с несколькими признаками-факторами.

Характер связи между признаком-функцией и признаками-факторами определяет содержание и стадии анализа для построения уравнения множественной регрессии.

Мы имеем дело с натуральными (количественными) показателями. Так как суммарный объем глубокого разведочного бурения формируется из объемов глубокого поискового разведочного бурения, бурения на нефть и газ и на природный газ, то по характеру связи таблица исходной информации является балансовой.

Балансовая связь между признаком-функцией и признаками-факторами в исходной таблице может быть полной, представительной и частичной. 1

       Полная балансовая связь имеет место в пределах изучаемой совокупности, и она характеризуется выражением:

                                                        (1.12.)

В практических расчетах допустимая разница между правой и левой частями уравнения (1.12.) не должна превышать 2%.

       Представительная балансовая связь имеет место в пределах поля регрессии, и характеризуется выражением:

                                                                                    (1.13.)

где yt и xt – ежегодные уровни признака-функции и признака-фактора;

       Частичная балансовая связь имеет место в тех случаях, когда объем качества исследуемой части совокупности по изучаемым признакам меньше 60-% уровня признака-функции.

 

Остается выяснить, какой тип балансовой связи имеет место в нашем случае. Для этого составим отношение между суммой ежегодных уровней признака-функции и суммой ежегодных уровней всех признаков-факторов. Получим: . Так как , то можно утверждать о наличии представительной балансовой связи между признаком функцией и признаками факторами в исходной таблице.

Далее представим степень представительности генеральной совокупности по годам, рассчитанные компьютерной программой:

 

Степень представительности генеральной

совокупности по годам:

 

  1 ---------- 118.9% ?

  2 ---------- 106.6% ?

  3 ---------- 111.6% ?

  4 ---------- 120.8% ?

  5 ---------- 115.6% ?

  6 ---------- 113.2% ?

  7 ---------- 114.7% ?

  8 ---------- 107.4% ?

  9 ---------- 110.4% ?

10 ---------- 116.2% ?

11 ---------- 103.7% ?

12 ---------- 104.0% ?

13 ---------- 103.2% ?

14 ---------- 100.9% ?

15 ----------  98.8% +

16 ----------  97.8% +

17 ----------  98.2% +

18 ----------  98.3% +

19 ---------- 100.0% +

20 ---------- 102.5% ?

 

Исходная информация некачественна,

  либо связь между признаками не балансовая.

  Признаки-факторы составляют :105.8%

Как видно из приведенной таблицы, программа выводит информацию о том, что исходные данные некачественны или связь между признаками не балансовая. Но расчет представительности генеральной совокупности по годам, выполненный в пределах программы, неверный, так как в состав самостоятельных признаков-факторов была включена внутренняя сводка. Поэтому рассчитаем степень представительности генеральной совокупности по годам вручную. Для этого необходимо сумму (X1+X3+Х4) по каждому уровню разделить на соответствующее значение Y для данного уровня, что представлено в таблице 4:

Таблица 4

Годы

Y

X1+X3+Х4

Степень представительности генеральной совокупности по годам ((X1+X3+Х4)/Y)

1

273,4

237,8

0,87

2

266,6

212,4

0,80

3

286,6

254,6

0,89

4

325,4

296,3

0,91

5

356,2

333,9

0,94

6

381,3

347,4

0,91

7

385,4

352,9

0,92

8

425,9

360,3

0,85

9

435,7

368,5

0,85

10

432,6

388,1

0,90

11

505,0

414,0

0,82

12

517,8

426,0

0,82

13

527,1

427,3

0,81

14

546,8

432,2

0,79

15

559,3

443,9

0,79

16

569,9

455,0

0,80

17

553,4

444,4

0,80

18

542,4

428,6

0,79

19

528,4

420,3

0,80

20

513,1

409,7

0,80

Итого

8932,2

7453,4

0,83

 

Отсюда следует вывод о том, что исходная информация качественна, связь между признаками балансовая, а признаки-факторы составляют 83%. Таким образом, можно сказать, что представленное информационное поле является полем регрессии. По определению функция f(X) называется функцией регрессии Y по X, если она описывает изменения условного среднего значения результирующей переменной Y в зависимости от изменения значений объясняющей изменение X (иными словами, уровни признака-функции Y формируются из уровней  признаков-факторов X1, X2, X3,Х4).

Динамические ряды очерчивают нам поле регрессии, следовательно, статистические данные подвержены анализу. Этапы анализа, предшествующие этому моменту, ограничивались сопоставлением каждого признака в отдельности. Остальные этапы анализа выполняются в границах поля регрессии, т.е. для тех динамических рядов, которые это поле образуют.

Системный анализ включает в себя1:

1)      Ранжирование признаков-факторов по представительности (по объему признака);

2)      Расчет оценочного показателя вариации и ранжирование признаков-факторов по нему;

3)      Проведение анализа парной корреляции;

4)      Построение уравнения множественной регрессии.

В зависимости от характера связи между подлежащим и сказуемым таблицы исходной информации по-разному определя­ется представительность (значимость) признаков-факторов по их влиянию на динамику признака-функции. При балансовой связи признаки-факторы, сонаправленные с признаком-функцией, ранжи­руются по их представительности, исходя из удельного веса их средней функции.

Рассчитаем представительность каждого признака и учтем при этом, что Х2 –некачественная внутренняя сводка таблицы, не влияющая на выбор признака-фактора для построения уравнения множественной регрессии.

              (14)

              (15)

              (16)

              (17)

Приведем соответствующие относительные величины (доли признаков-факторов в объёме признака-функции) в таблице 5:

Таблица 5

Удельный вес признаков-факторов в составе признака-функции

 

Признак-фактор

Значение признака, м.

Удельный вес признака Xi в Y, %.

X1

5493,7

62

X2

1992,9

22

X3

1804,2

20

X4

155,6

2


 

Таким образом, если произвести ранжирование признаков по представительности, получим:

1)      Объем глубокого разведочного бурения на нефть и природный газ (Х1) – 62%;

2)      Объем глубокого разведочного поискового бурения (Х3) – 20%;

3)      Объем глубокого разведочного бурения на природный газ (Х2) – 22 %;

4)      Объем опорного и параметрического бурения (Х4) – 2%.

Исходя из полученных результатов видно, что наиболее представительными признаками являются X1 и X2.

Вторым критерием отбора признаков для построения уравнения множественной регрессии является вариация. Следовательно, необходимо проверить признаки на вариабельность.

2. Расчет показателей вариации динамических рядов

 

2.1.           Понятие  вариации динамических рядов

Последующий анализ предполагает расчет показателей вариации динамических рядов. Они оценивают устойчивость признака в вариационном ряду распределения, так как индивидуальные значения единиц совокупности подвержены колебаниям.

Вариацией называется различие в численных значениях какого-либо при­знака у разных единиц данной совокупности в один и тот же период или момент времени. Она воз­никает в результате того, что индивидуальные значения при­знака складываются под совокупным влиянием разнообраз­ных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Для измерения вариации важно установить базу (уровень) регистрации отклонения значений признака у единиц совокупности и содержание признака, вариация которого измеряется.2

Первым этапом статистического изучения вариации является построение вариационного ряда – упорядоченного распределения единиц совокупности по возрастающим (чаще) или убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Исследование вариации в статистике имеет большое значе­ние, помогает познать сущность изучаемого явления. Средняя величина дает обобщающую характеристику при­знака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около неё варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина при­знака в двух совокупностях может быть одинаковой, но в од­ном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом — велика, это имеет весьма важное значение для характеристики надежности средней ве­личины.

Информация о работе Анализ динамических рядов и построение уравнения многофакторной корреляционной связи