Часовий ряд і його основні елементи

Автор работы: Пользователь скрыл имя, 15 Марта 2012 в 16:24, реферат

Краткое описание

Часовий ряд-це сукупність значень якого-небудь показника за кілька послідовних моментів або періодів часу. Кожен рівень часового ряду формується під впливом великої кількості факторів, які умовно можна підрозділити на три групи:
· Чинники, що формують тенденцію ряду;
· Чинники, що формують циклічні коливання ряду;
· Випадкові фактори.

Содержимое работы - 1 файл

Аналіз часових рядів.doc

— 162.77 Кб (Скачать файл)


1.1 Часовий ряд і його основні елементи

Часовий ряд-це сукупність значень якого-небудь показника за кілька послідовних моментів або періодів часу. Кожен рівень часового ряду формується під впливом великої кількості факторів, які умовно можна підрозділити на три групи:

· Чинники, що формують тенденцію ряду;
· Чинники, що формують циклічні коливання ряду;
· Випадкові фактори.

При різних поєднаннях в досліджуваному процесі або явищі цих чинників залежність рівнів ряду від часу може приймати різні форми. По-перше, більшість часових рядів економічних показників мають тенденцію, що характеризує довгострокове сукупний вплив безлічі факторів на динаміку показника, що вивчається. Очевидно, що ці фактори, взяті окремо, можуть надавати різноспрямований вплив на досліджуваний показник. Однак у сукупності вони формують його зростаючу або убуваючу тенденцію.

По-друге, досліджуваний показник може бути підданий циклічним коливанням. Ці коливання можуть носити сезонний характер, оскільки діяльність низки галузей економіки і сільського господарства залежить від пори року. При наявності великих масивів даних за тривалі проміжки часу можна виявити циклічні коливання, пов'язані із загальною динамікою часового ряду.
Деякі часові ряди не містять тенденції і циклічної компоненти, а кожен наступний їх рівень утворюється як сума середнього рівня ряду і деякою (позитивної чи негативної) випадкової компоненти.
У більшості випадків фактичний рівень часового ряду можна представити як суму або твір трендової, циклічної та випадкової компонент. Модель, в якій часовий ряд представлений як сума перерахованих компонент, називається адитивною моделлю часового ряду. Модель, в якій тимчасової ряд представлений як добуток перерахованих компонент, називається мультиплікативної моделлю часового ряду. Основне завдання статистичного дослідження окремого часового ряду - виявлення і надання кількісного вираження кожної з перерахованих вище компонент з тим щоб використовувати отриману інформацію для прогнозування майбутніх значень ряду. [5, стор.76]

1.2 автокорреляция рівнів часового ряду і виявлення його структури

При наявності в часовому ряді тенденції і циклічних коливань значення кожного наступного рівня ряду залежать від попередніх. Кореляційну залежність між послідовними рівнями часового ряду називають автокореляцій рівнів ряду.
Кількісно її можна виміряти за допомогою лінійного коефіцієнта кореляції між рівнями вихідного часового ряду і рівнями цього ряду, зсунутими на кілька кроків у часі.
Одна з робочих формул для розрахунку коефіцієнта автокореляції має вигляд: (1.2.1)

В якості змінної х ми розглянемо ряд y 2, y 3, ..., y n; в якості змінної у - ряд y 1, y 2,. . . , Y n - 1. Тоді наведена вище формула прийме вигляд:
(1.2.2)
де

Аналогічно можна визначити коефіцієнти автокореляції другого і більш високих порядків. Так, коефіцієнт автокореляції другого порядку характеризує тісноту зв'язку між рівнями у t і y t - 1 і визначається за формулою
(1.2.3)
де

Число періодів, за якими розраховується коефіцієнт автокореляції, називають лагом. Зі збільшенням лага число пар значень, за якими розраховується коефіцієнт автокореляції, зменшується. Деякі автори вважають за доцільне для забезпечення статистичної достовірності коефіцієнтів автокореляції використовувати правило - максимальний лаг повинен бути не більше (n / 4).
Відзначимо два важливих властивості коефіцієнта автокореляції.
По-перше, він будується за аналогією з лінійним коефіцієнтом кореляції і таким чином характеризує тісноту тільки лінійного зв'язку поточного і попереднього рівнів ряду. Тому за коефіцієнтом автокореляції можна судити про наявність лінійної (чи близькою до лінійної) тенденції. Для деяких часових рядів, що мають сильну нелінійну тенденцію (наприклад, параболу другого порядку чи експоненту), коефіцієнт автокореляції рівнів вихідного ряду може наближатися до нуля.
По-друге, за знаком коефіцієнта автокореляції не можна робити висновок про зростаючу або спадної тенденції в рівнях ряду. Більшість часових рядів економічних даних містить позитивну автокореляції рівнів, однак при цьому можуть мати убуваючу тенденцію.
Послідовність коефіцієнтів автокореляції рівнів першого, другого і т. д. Порядків називають автокорреляционной функцією часового ряду. Графік залежності її значень від величини лага (порядку коефіцієнта кореляції) називається коррелограммой.
Аналіз автокореляційної функції і коррелограмми дозволяє визначити лаг, при якому автокорреляция найбільш висока, а, отже, і лаг, при якому зв'язок між поточним і попередніми рівнями ряду найбільш тісний, тобто за допомогою аналізу автокореляційної функції і коррелограмми можна виявити структуру ряду.
Якщо найбільш високим виявився коефіцієнт автокореляції першого порядку, досліджуваний ряд містить тільки тенденцію. Якщо найбільш високим виявився коефіцієнт автокореляції порядку τ, ряд містить циклічні коливання з періодичністю в τ моментів часу. Якщо жоден з коефіцієнтів автокореляції не є значимим, можна зробити одне з двох припущень щодо структури цього ряду: або ряд не містить тенденції і циклічних коливань, або ряд містить сильну нелінійну тенденцію, для виявлення якої потрібно провести додатковий аналіз. Тому коефіцієнт автокореляції рівнів і автокорреляционную функцію доцільно використовувати для виявлення під часовий ряд наявності або відсутності трендової компоненти та циклічної, сезонної компоненти.

1.3 Моделювання тенденції часового ряду

Одним з найбільш поширених способів моделювання тенденції часового ряду є побудова аналітичної функції, що характеризує залежність рівнів ряду від часу, або тренда. Цей спосіб називають аналітичним вирівнюванням часового ряду.
Нехай є такі фактичні рівні ряду:
у 1, у 2,. . ., У n.
Характер зміни цих рівнів, тобто руху динамічного ряду, може бути різним. Нашим завданням є знаходження такої простої математичної формули, яка давала б можливість обчислити теоретичні рівні. Основна вимога, що пред'являється до цієї формули, полягає в тому, що рівні, обчислені по ній, повинні відтворювати загальну тенденцію фактичних рівнів.
Оскільки залежність від часу може приймати різні форми, для її формалізації можна використовувати різні види функцій. Для побудови трендів найчастіше застосовуються наступні функції:
· Лінійний тренд: y t = a 0 + a 1 t;
· Гіпербола: y t = a 0 + a 1 / t;
· Експонентний тренд: y t = e a + bt ;
· Тренд у формі степеневої функції: y t = at b;
· Парабола другого і більше порядків:
y t = a 0 + a 1 t + a 2 t 2 +. . . + A k t k.
Аналітичне вирівнювання є не що інше, як зручний спосіб опису емпіричних даних.
Загальні міркування при виборі типу лінії, по якій проводиться аналітичне вирівнювання, можуть бути зведені до наступних:
1) Якщо абсолютні прирости рівнів ряду за своєю величиною коливаються близько постійної величини, то математичної функцією, рівняння якої можна прийняти за основу аналітичного вирівнювання, слід вважати пряму лінію:
y t = a 0 + a 1 t,
де y t вважається як у, вирівняний по t.
2) Якщо прирости приростів рівнів, тобто прискорення, коливаються близько постійної величини, то за основу аналітичного вирівнювання, слід прийняти параболу другого порядку:
y t = a 0 + a 1 t + a 2 t 2.
Показники а 0, а 1 і а 2 представляють собою в кожному окремому випадку вирівнювання постійні величини, звані параметрами: а 0-початковий рівень; а 1 - початкова швидкість ряду і а 2 - прискорення або друга швидкість.
3) Якщо рівні змінюються з приблизно постійним відносним приростом, то вирівнювання проводиться за показовою (експонентний функції):
y t = a 0 a 1 t.
У цих же цілях можна використовувати і коефіцієнти автокореляції рівнів ряду. Тип тенденції можна визначити шляхом порівняння коефіцієнтів автокореляції першого порядку, розрахованого по вихідним і перетвореним рівнями ряду. Якщо часовий ряд має лінійну тенденцію, то його сусідні рівні y t і y t -1 тісно корелюють. У цьому випадку коефіцієнт автокореляції першого порядку рівнів вихідного ряду має бути високим. Якщо тимчасової ряд містить нелінійну тенденцію, наприклад, у формі експоненти, то коефіцієнт автокореляції першого порядку по логарифмам рівнів вихідного ряду буде вище, ніж відповідний коефіцієнт, розрахований за рівнями ряду. Чим сильніше виражена нелінійна тенденція в досліджуваному часовому ряді, тим більшою мірою будуть відрізнятися значення зазначених коефіцієнтів.
При обробці інформації на комп'ютері вибір виду рівняння тенденції зазвичай здійснюється експериментальним методом, тобто шляхом порівняння величини залишкової дисперсії D ост, розрахованої при різних моделях. Мають місце відхилення фактичних даних від теоретичних (у - у t). Величина цих відхилень і лежить в основі розрахунку залишкової дисперсії:
(1.3.1)
Чим менше величина залишкової дисперсії, тим краще дане рівняння підходить до вихідних даних.
1.4 Метод найменших квадратів
Для знаходження аналітичного рівняння, за яким здійснюється вирівнювання рівнів часового ряду, застосовують різні способи. Один з таких способів - метод найменших квадратів - заснований на вимозі про те, щоб сума квадратів відхилень фактичних даних від вирівняних була найменшою:
(У 1 - у 1) 2 + (у 2 - у 2) 2 +. . . + (У n - y n) 2 = S.
S має бути найменшим (мінімальним)
Принцип, покладений в основу методу найменших квадратів, може бути записаний у стислому математичному вигляді наступним чином:

Σ (y - y t) 2 = min. (1.4.1)
З курсу математичного аналізу відомо, що при знаходженні мінімуму функції потрібно знайти приватні похідні і прирівняти їх до нуля. Знайдемо мінімум функції, використовуючи рівняння параболи.
Маємо:
Σ (y - y t) 2 = S; (1.4.2)
замінюємо:
y t = a 0 + a 1 t + a 2 t 2
і отримуємо:
Σ (y - a 0 - a 1 t - a 2 t 2) 2 = S.
Знаходимо приватні похідні функції S спочатку по параметру а 0, а потім по а 1 і а 2, і прирівнюємо їх до нуля.
;
; (1.4.3)
.
Перетворюючи, отримуємо:
;
; (1.4.4)
  .
Отримана система називається системою нормальних рівнянь для знаходження параметрів а 0, а 1 і а 2 при вирівнюванні по параболі другого порядку.
При вирівнюванні по показовою функції y t = a 0 a 1 t параметри а 0 і а 1 визначаються за методом найменших квадратів відхилень логарифмів шляхом рішення системи нормальних рівнянь:
; (1.4.5)
  .
1.5 Приведення рівняння тренду до лінійного вигляду
Якщо тренд являє собою нелінійну функцію, то методи лінійного регресійного аналізу для оцінки його параметрів незастосовні. Але до деяких нелінійним функцій ми можемо застосувати такі перетворення, які приведуть нас до лінійного рівняння.
Якщо наш тренд представлений ступеневій лінією регресії, тобто він має вигляд:
y t = a 0 t a 1, (1.5.1)
то Логаріфміруя обидві частини рівності, отримаємо:
ln y t = ln a 0 + a 1 ln t.
Звідси видно, що, запроваджуючи нові змінні
z = ln y t, x = ln t,
ми отримаємо рівняння виду
z = b 0 + a 1 x,
де b 0 = ln a 0. Це звичайне лінійне рівняння.
Якщо лінія тренду - парабола другого порядку
y t = a 0 + a 1 t + a 2 t 2,
то заміною виду:
х 1 = t, x 2 = t 2,
ми отримаємо лінійну функцію двох змінних:
y t = a 0 + a 1 х 1 + a 2 х 2.
Оцінку параметрів такої функції можна провести методами лінійного регресійного аналізу для множинної регресії. [5, c.29]
Далі наведемо основні поняття регресійного аналізу, які використовуються для оцінки параметрів.
1.6 Оцінка параметрів рівняння регресії
Рівняння регресії завжди доповнюється показником тісноти зв'язку. При використанні лінійної регресії в якості такого показника виступає лінійний коефіцієнт кореляції r yt. Існують різні модифікації формули лінійного коефіцієнта кореляції. Деякі з них наведено нижче:
, (1.6.1)
або

 

 

 


. (1.6.2)
Як відомо, лінійний коефіцієнт кореляції знаходиться в межах: -1 ≤ r yt ≤ 1.
Слід мати на увазі, що величина лінійного коефіцієнта кореляції оцінює тісноту зв'язку розглянутих ознак у її лінійної формі. Тому близькість абсолютної величини лінійного коефіцієнта кореляції до нуля ще не означає відсутності зв'язку між ознаками.
Для оцінки якості підбору лінійної функції розраховується квадрат лінійного коефіцієнта кореляції r yt 2, званий коефіцієнтом детермінації. Коефіцієнт детермінації характеризує частку дисперсії результативної ознаки у t, пояснюється регресією, в загальній дисперсії результативної ознаки:
(1.6.3)
де

загальна дисперсія результативної ознаки у;

залишкова дисперсія, яка визначається, виходячи з рівняння регресії
у t = f (t).
Відповідно величина 1 - r 2 характеризує частку дисперсії у, викликану впливом інших, не врахованих у моделі факторів.
Рівняння нелінійної регресії, так само як і в лінійній залежності, доповнюється показником кореляції, а саме індексом кореляції R:
(1.6.4)
Інакше, індекс кореляції можна виразити як

Величина даного показника знаходиться в межах:
0 ≤ R ≤ 1,
чим ближче до одиниці, тим тісніше зв'язок розглянутих ознак, тим надійніше знайдене рівняння регресії.
Парабола другого порядку, як і поліном більш високого порядку, при ліанерізаціі приймає вид рівняння множинної регресії. Якщо ж нелінійне щодо що пояснюється змінної рівняння регресії при лінеаризації приймає форму лінійного рівняння парної регресії, то для оцінки тісноти зв'язку може бути використаний лінійний коефіцієнт кореляції, величина якого в цьому випадку співпаде з індексом кореляції.
Інакше йде справа, коли перетворення рівняння в лінійну форму пов'язані з залежною змінною. У цьому випадку лінійний коефіцієнт кореляції за перетвореним значенням ознак дає лише наближену оцінку тісноти зв'язку і чисельно не збігається з індексом кореляції. Так, для статечної функції у х = ах b після переходу до логарифмічно лінійним рівнянням lny = lna + blnx може бути знайдений лінійний коефіцієнт кореляції не для фактичних значень змінних х і у, а для їх логарифмів, тобто r lnylnx. Відповідно квадрат його значення буде характеризувати ставлення факторної суми квадратів відхилень до загальної, але не для в, а для його логарифмів:
.
Тим часом при розрахунку індексу кореляції використовуються суми квадратів відхилень ознаки у, а не їх логарифмів. З цією метою визначаються теоретичні значення результативної ознаки, тобто , Як антілогаріфм розрахованої за рівнянням величини та залишкова сума квадратів як . Індекс кореляції визначається за формулою

У знаменнику розрахунку R 2 yx бере участь загальна сума квадратів відхилень фактичних значень у від їх середньої величини, а в розрахунку r 2 lnx lny бере участь. Відповідно різняться числители і знаменники розглянутих показників:
- В індексі кореляції та
- В коефіцієнті кореляції.
Внаслідок близькості результатів і простоти розрахунків з використанням комп'ютерних програм для характеристики тісноти зв'язку з нелінійним функцій широко використовується лінійний коефіцієнт кореляції.
Незважаючи на близькість значень R і r або R і r в нелінійних функціях з перетворенням значення ознаки у, слід пам'ятати, що якщо при лінійній залежності ознак один і той же коефіцієнт кореляції характеризує регресію, як слід пам'ятати, що якщо при лінійній залежності ознак один і той же коефіцієнт кореляції характеризує регресію як , Так і , Так як , То при криволінійній залежності для функції y = j (x) не дорівнює для регресії x = f (y).
Оскільки в розрахунку індексу кореляції використовується співвідношення факторної і загальної суми квадратів відхилень, то має той же зміст, як і коефіцієнт детермінації. У спеціальних дослідженнях величину для нелінійних зв'язків називають індексом детермінації.
Оцінка суттєвості індексу кореляції проводиться, так само як і оцінка надійності коефіцієнта кореляції.
Індекс кореляції використовується для перевірки істотності в цілому рівняння нелінійної регресії за F-критерієм Фішера:

де - Індекс детермінації;
n - число спостережень;
m - число параметрів при змінних х.
Величина m характеризує число ступенів свободи для факторної суми квадратів, а (n - m - 1) - число ступенів свободи для залишкової суми квадратів.
Для степеневої функції m = 1 і формула F - критерію прийме той же вигляд, що і при лінійній залежності:

Для параболи другого ступеня y = a 0 + a 1 x + a 2 x 2 + εm = 2 і
(1.6.5)
Розрахунок F-критерію можна вести і в таблиці дисперсійного аналізу результатів регресії, як це було показано для лінійної функції.
Індекс детермінації можна порівнювати з коефіцієнтом детермінації для обгрунтування можливості застосування лінійної функції. Чим більша кривизна лінії регресії, тим величина коефіцієнта детермінації менше індексу детермінації. Близькість цих показників означає, що немає необхідності ускладнювати форму рівняння регресії і можна використовувати лінійну функцію.
Практично, якщо величина різниці між індексом детермінації і коефіцієнтом детермінації не перевищує 0,1, то припущення про лінійної формі зв'язку вважається виправданим. В іншому випадку проводиться оцінка суттєвості відмінності R 2 , Обчислених за одним і тим самим вихідним даними, через t - критерій Стьюдента:
(1.6.6)
m | R - r | - помилка різниці між R 2 і r 2 , Яка визначається за формулою

Якщо t факт> t табл, то відмінності між розглянутими показниками кореляції істотні і заміна нелінійної регресії рівнянням лінійної функції неможлива. Практично, якщо величина t <2, то розходження між R yx і r yx несуттєві, і, отже, можливе застосування лінійної регресії, навіть якщо є припущення про деяку нелінійності розглянутих співвідношень ознак фактора і результату.
1.7 Адитивна та мультиплікативна моделі часового ряду
Існує декілька підходів до аналізу структури часових рядів, що містять сезонні чи циклічні коливання.
Найпростіший підхід-розрахунок значень сезонної компоненти методом ковзної середньої і побудова адитивної або мультиплікативної моделі часового ряду. Загальний вигляд адитивної моделі наступний:
Y = T + S + E.
Ця модель передбачає, що кожен рівень часового ряду може бути представлений як добуток трендової, сезонної і випадкової компонент. Загальний вигляд мультиплікативної моделі виглядає так:
Y = T ∙ S ∙ E.
Ця модель передбачає, що кожен рівень часового ряду може бути представлений як добуток трендової, сезонної і випадкової компонент. Вибір однієї з двох моделей здійснюється на основі аналізу структури сезонних коливань. Якщо амплітуда коливань приблизно постійна, будують адитивну модель часового ряду, в якій значення сезонної компоненти передбачаються постійними для різних циклів. Якщо амплітуда сезонних коливань зростає або зменшується, будують мультипликативную модель часового ряду, яка ставить рівні низки в залежність від значень сезонної компоненти.
Побудова адитивної і мультиплікативної моделей зводиться до розрахунку значень трендової, циклічної та випадкової компонент для кожного рівня ряду.
Процес побудови моделі включає в себе наступні кроки.
1. Вирівнювання вихідного ряду методом ковзної середньої.
2. Розрахунок значень сезонної компоненти.
3. Усунення сезонної компоненти з вихідних рівнів ряду і отримання вирівняних даних у адитивної або мультиплікативної моделі.
4. Аналітичне вирівнювання рівнів і розрахунок значень тренду з використанням отриманого рівняння тренду.
5. Розрахунок отриманих за моделлю значень або
6. Розрахунок абсолютних і відносних помилок.
Якщо отримані значення помилок не містять автокореляції, ними можна замінити вихідні рівні ряду і надалі використовувати часовий ряд помилок для аналізу взаємозв'язку вихідного ряду та інших часових рядів. [5, c. 67]

 

1.8 Стаціонарні часові ряди
Після видалення тенденції (тренду) з часового ряду ми отримаємо стаціонарний часовий ряд. Його можна розглядати як вибірку Т послідовних спостережень через рівні проміжки часу з істотно більш тривалої (генеральної послідовності випадкових величин. При цьому статистичні висновки робляться щодо ймовірнісної структури генеральної послідовності. Таку послідовність зручно вважати тягнеться необмежено в майбутнє і, можливо, у минуле. Послідовність випадкових величин у 1, у 2,... або..., у -1, у 0, у 1,... називається випадковим процесом з дискретним параметром часу .
Незважаючи на повну довільність імовірнісних моделей послідовностей випадкових величин, корисно відрізняти випадкові процеси від безлічі випадкових величин цього процесу, враховуючи поняття часу. Грубо кажучи, у випадковому процесі спостереження, розділені невеликими проміжками часу, близькі за значеннями на відміну від спостережень, далеко віддалених один від одного в часі. Більше того, модель значно спрощується після розширення кінцевої послідовності спостережень до нескінченною.
Одним з таких спрощень є властивість стаціонарності. Будемо вважати, що поведінка безлічі випадкових величин з імовірнісної точки зору не залежить від часу.
Випадковий процес y (t) з безперервним параметром часу можна визначити для 0 ≤ t <∞ або - ∞ <t <∞ та розглядати з залученням ймовірнісної міри на просторі функцій y (t). Вибірка з такого процесу складається з спостережень в кінцевому числі точок часу, або з безперервних спостережень в інтервалі часу.
Спостереження процесу, часто зване реалізацією, є точка у відповідному нескінченновимірних просторі, де визначена імовірнісна міра. Імовірність визначається на деяких множинах, званих вимірними. Цей клас множин включає разом з будь-яким безліччю його доповнення, а також об'єднання і перетин рахункового числа множин цього класу; імовірнісна міра на цьому класі множин визначається таким чином, що ймовірність об'єднання непересічних множин дорівнює сумі ймовірностей окремих множин.
Практично ми цікавимося ймовірностями, які пов'язані з кінцевим числом випадкових величин. Ці ймовірності включають в себе функцію спільного розподілу. [24, c. 88]

 

1.9 Застосування швидкого перетворення Фур'є до стаціонарного часовому ряду

Одне із призначень перетворення Фур'є-виділяти частоти циклічних складових часового ряду, що містить випадкову компоненту.
Нехай число даних N представимо у вигляді N = N 1 N 2. Тоді можна записати
t = t 1 + (t 2 -1) N 1, t 1 = 1,. . ., N 1, t 2 = 1,. . ., N 2;
j = j 1 + j 2 N 2, j 1 = 0,. . ., N 2 - 1, j 2 = 0,. . ., N 1 - 1;
Відзначимо, що a N - j = a j і b N - j = - b j. Шукані коефіцієнти є відповідно дійсною і уявною частинами суми:

(1.9.1)

Для їх відшукання обчислимо спочатку величини


Для кожної пари (j 1, t 1), j 1 = 0,. . ., N 2 - 1 і t 1 = 0,. . ., N 1. Оскільки
і ,
то існує близько N 1 N 2 / 2 = N / 2 таких пар. Після цього знаходяться дійсна і уявна частини суми (1.9.1):


для j = 0,1,. . ., [N / 2]. Число операцій множення наближено дорівнює N 2 N в перших сумах і 2N 1 N у других сумах, так що число операцій множення в цілому складає приблизно N (N 2 + 2N 1). У той же час число творів у визначенні коефіцієнтів a j і b j, j = 0,1,. . ., [N / 2] приблизно дорівнює N 2. [20, c.98], [21, c.78]

 

1.10 автокорреляция залишків. Критерій Дарбіна-Уотсона
Для кожного моменту (періоду) часу t = 1: N значення компоненти e t для адитивної моделі визначається як
,
де - Сума циклічної і трендової компонент, а для мультиплікативної моделі:

де - Твір циклічної і трендової компонент.
Помилки вимірів нам невідомі, а відомі лише емпіричні залишки.
Розглядаючи послідовність залишків як часовий ряд, можна побудувати графік їх залежності від часу. Відповідно до передумовами методу найменших квадратів залишки e t повинні бути випадковими. Однак при моделюванні часових рядів часто зустрічаються ситуація, коли залишки містять тенденцію або циклічні коливання. Це свідчить про те, що кожне наступне значення залишків залежить від попередніх. У цьому випадку говорять про наявність автокореляції залишків.
Автокорреляция залишків може бути викликана наступними причинами, що мають різну природу. По-перше, іноді вона пов'язана з вихідними даними і викликана наявністю помилок вимірювання в значеннях результативного ознаки. По-друге, в ряді випадків причину автокореляції залишків слід шукати у формулюванні моделі. Модель може не включати фактор, істотний вплив на результат, вплив якого відображається у залишках, внаслідок чого останні можуть виявитися автокоррелірованнимі. Дуже часто цим фактором є фактор часу t. Крім того, в якості таких істотних факторів можуть виступати лагові значення змінних, включених у модель.
Або модель не враховує кілька другорядних факторів, сумісний вплив яких на результат істотно на увазі збіги тенденцій їх зміни або фаз циклічних коливань.
Існує два найбільш поширені методи визначення автокореляції залишків. Перший метод - це побудова графіка залежності залишків від часу і візуальне визначення наявності або відсутності автокореляції. Другий метод - використання критерію Дарбіна - Уотсона.
Дж. Дарбина і Г. Уотсон побудували таблиці, що дають нижні і верхні межі порогів значущості. Ці таблиці достатні для більшості конкретних ситуацій. Розглянемо логічні підстави критерію.
Вираз
(1.10.1)
являє собою «ставлення фон Неймана», застосоване до залишків оцінки. Цей критерій має ефективність аналогічну такій для критерію r 1, першого коефіцієнта автокореляції залишків. З попередньої глави відомо, що цей критерій буде особливо потужним, якщо помилки слідують авторегрессінному процесу першого порядку. Таким чином, він, мабуть, добре пристосований для економічних моделей.
Значення d у вибірці залежить одночасно від послідовності z t і від значень e t (для t = 1,2,..., N). Однак Дарбина і Вотсон показали, що для заданих значень e t значення d обов'язково укладено між двома кордонами d U і d L , Що не залежать від значень, прийнятих z t, і які є функціями лише чисел N, саме d L £ d £ d U.
Для деяких значень послідовності z t кордону d U і d L можуть досягатися. Інтервал [d L, d U ] Є, отже, найменшим з можливих, якщо не брати до уваги точні значення z t.
Межі d U і d L представляють випадкові величини, розподіл яких можна визначити за допомогою точних гіпотез щодо розподілу e t.
Для практичного використання таблиці отримане значення d * слід порівняти з d 1 і d 2.
а) Якщо d * <d 1, то ймовірність такого малого значення напевно менше a. Гіпотеза незалежності відкидається.
б) Якщо d *> d 2, то ймовірність такого малого значення напевно більше a. Гіпотеза незалежності не відкидається.
в) Якщо d 1 £ d * £ d 2, то наведені таблиці залишають питання відкритим. Можливо, що гіпотезу незалежності при рівні значимості a слід відкинути. Однак цього не можна дізнатися без вивчення закону розподілу ймовірностей d для послідовності змінних z t. Практично в цьому випадку часто задовольняються вказівкою на те, що значення d * потрапляє в область невизначеності критерію.
В даний час прийнято приводити значення d * разом з регресом для часових рядів і вказувати на розташування цього значення щодо d 1 і d 2.
Є кілька суттєвих обмежень на застосування критерію Дарбіна - Уотсона.
По-перше, він непридатний до моделей, що включає в якості незалежних змінних лагові значення результативної ознаки, тобто до моделей авторегресії. Для тестування на автокореляції залишків моделей авторегресії використовується критерій h Дарбіна.
По-друге, методика розрахунку і використання критерію Дарбіна - Уотсона спрямована тільки на виявлення автокореляції залишків першого порядку. При перевірці залишків на автокореляції більш високих порядків слід застосовувати інші методи.
По-третє, критерій Дарбіна - Уотсона дає достовірні результати тільки для великих вибірок.

Информация о работе Часовий ряд і його основні елементи