Моделирование динамики розничного товарооборота по городу Москве

Автор работы: Пользователь скрыл имя, 13 Мая 2012 в 19:27, курсовая работа

Краткое описание

На практике экономист весьма часто сталкивается с тем, что исходные данные, которыми он располагает для выявления той или иной закономерности, представлены в виде временных (динамических) рядов. Такие ряды описывают изменение некоторой характеристики во времени. Каждый член (уровень) такого ряда связан с соответствующим моментом времени или временным интервалом.

Содержание работы

Глава 1.
1.1Анализ временных рядов……………………………………………….……..3
1.1.1. Цели, методы и этапы анализа временных рядов……………….….…..3
1.1.2. Анализ тенденции развития (тренда) временного ряда………….….…5
1.1.3. Декомпозиция временного ряда. Анализ сезонных колебаний…….…5
1.1.4. Корреляционная зависимость между уровнями различных
рядов динамики……………………………………………….……………...….9
1.2. Методология ARIMA..……………………………………………………..…9
1.2.1. Модель ARIMA……………………………………………………….….11
1.2.2. Идентификация……………………………………………………….…..13
1.2.3. Оценивание параметров………………………………………………….15
1.2.4 Оценивание модели………………………………………………….…….16
Глава 2.
2. Описание экономических понятий, используемых в работе…………………17
2.1. Характеристика исходных данных……………………………………….…..17
3. Моделирование ряда в пакете Gretl………………………………………..…..18
3.1. Анализ исходного временного ряда……………………………………..…..18
3.2. Анализ ряда первых разностей…………………………………………….…19
3.3. Процедура анализа сезонности X-12-ARIMA………………………..….…..22
3.4. Модель Арима…………………………………………………………………24
3.5. Оценивание построенной модели………………………………………….…26
3.5. Прогноз………………………………………………………………………....29
Заключение……………………………………………………………………...........30
Литература…………………………………

Содержимое работы - 1 файл

Курсовая.docx

— 2.91 Мб (Скачать файл)

     Важнейшими  задачами, решаемыми в ходе исследования сезонности, являются следующие:

1) определение  наличия сезонности, численное выражение  проявления сезонных колебаний  и выявление их силы и характера в различных фазах годичного цикла;

2) характеристика  факторов, вызывающих сезонные колебания;

3) оценка  последствий, к которым приводит  наличие сезонных колебаний;

4) математическое  моделирование сезонности.

Для измерения сезонных колебаний статистикой предложены различные методы. Наиболее простые и часто употребляемые из них:

а) метод  абсолютных разностей;

б) метод  относительных разностей;

в) построение индексов сезонности. 
 
 

   1.1.4 Корреляционная зависимость  между уровнями  различных рядов  динамики.

   Применение  методов классической теории корреляции в динамических рядах связано с некоторыми особенностями. Прежде всего это наличие для большинства динамических рядов зависимости последующих уровней от предыдущих.

   Наличие зависимости между последующими и предшествующими уровнями динамического ряда в статистической литературе называют автокорреляцией.

   Коэффициент автокорреляции вычисляется по непосредственным данным рядов динамики, когда фактические уровни одного ряда рассматриваются как значения факторного признака, а уровни этого же ряда со сдвигом на один период принимаются в качестве результативного признака.

Коэффициент автокорреляции рассчитывается на основе формулы коэффициента корреляции для парной зависимости:

,

где yt – фактические уровни ряда, а yt+1 – уровни того же ряда со сдвигом на 1 период. 
 
 
 

   1.2 Методология ARIMA

   Процедуры оценки параметров и прогнозирования, предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные  наблюдения содержат значительную ошибку, тогда как вы хотите не только выделить регулярные компоненты, но также построить  прогноз. Методология ARIMA, разработанная Боксом и Дженкинсом (1976), позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость (Hoff, 1983; Pankratz, 1983; Vandaele, 1983). Однако из-за мощности и гибкости, ARIMA - сложный метод. Его не так просто использовать, и требуется большая практика, чтобы овладеть им. Хотя часто он дает удовлетворительные результаты, они зависят от квалификации пользователя. 

   Процесс авторегрессии. Большинство временных рядов содержат элементы, которые последовательно зависят друг от друга. Такую зависимость можно выразить следующим уравнением:

   xt = c + a1*x(t-1) + a2*x(t-2) + a3*x(t-3) + ... + et

   Здесь: 
  c    - константа (свободный член), 
  a1, a2, a3   - параметры авторегрессии.

   Каждое  наблюдение есть сумма случайной  компоненты (случайное воздействие) и линейной комбинации предыдущих наблюдений.

   Требование  стационарности. Заметим, что процесс авторегрессии будет стационарным, только если его параметры лежат в определенном диапазоне. Например, если имеется только один параметр, то он должен находиться в интервале -1< <+1. В противном случае, предыдущие значения будут накапливаться, и значения последующих xt могут быть неограниченными, следовательно, ряд не будет стационарным. Если имеется несколько параметров авторегрессии, то можно определить аналогичные условия, обеспечивающие стационарность.

   Процесс скользящего среднего. В отличие от процесса авторегрессии, в процессе скользящего среднего каждый элемент ряда подвержен суммарному воздействию предыдущих ошибок. В общем виде это можно записать следующим образом:

   xt = µ + et - b1*e (t-1) - b2*e (t-2) - b3*e (t-3) - ...

   Здесь: 
 µ      - константа, 
 b1, b2, b3  - параметры скользящего среднего.

   Другими словами, текущее наблюдение ряда представляет собой сумму случайной компоненты   (случайное воздействие) в данный момент и линейной комбинации случайных воздействий в предыдущие моменты времени.

   Обратимость. Не вдаваясь в детали, отметим, что существует "двойственность" между процессами скользящего среднего и авторегрессии. Это означает, что приведенное выше уравнение скользящего среднего можно переписать (обратить) в виде уравнения авторегрессии (неограниченного порядка), и наоборот. Это так называемое свойство обратимости. Имеются условия, аналогичные приведенным выше условиям стационарности, обеспечивающие обратимость модели.  
 

   1.2.1 Модель ARIMA

   Модель  авторегрессии и  скользящего среднего. Общая модель, предложенная Боксом и Дженкинсом (1976) включает как параметры авторегрессии, так и параметры скользящего среднего. Именно, имеется три типа параметров модели: параметры авторегрессии (p), порядок разности (d), параметры скользящего среднего (q). В обозначениях Бокса и Дженкинса модель записывается как ARIMA (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авторегрессии (p) и 2 параметра скользящего среднего (q), которые вычисляются для ряда после взятия разности с лагом 1.

   Идентификация. Как отмечено ранее, для модели ARIMA необходимо, чтобы ряд был стационарным, это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. Поэтому обычно необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром d (см. предыдущий раздел). Для того, чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг=1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности (см. ниже). Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов.

   На  этом этапе (который обычно называют идентификацией порядка модели, см. ниже) вы также должны решить, как много параметров авторегрессии (p) и скользящего среднего (q) должно присутствовать в эффективной и экономной модели процесса. (Экономность модели означает, что в ней имеется наименьшее число параметров и наибольшее число степеней свободы среди всех моделей, которые подгоняются к данным). На практике очень редко бывает, что число параметров p или q больше 2.

   Оценивание  и прогноз. Следующий, после идентификации, шаг (Оценивание) состоит в оценивании параметров модели (для чего используются процедуры минимизации функции потерь, см. ниже). Полученные оценки параметров используются на последнем этапе (Прогноз) для того, чтобы вычислить новые значения ряда и построить доверительный интервал для прогноза. Процесс оценивания проводится по преобразованным данным (подвергнутым применению разностного оператора). До построения прогноза нужно выполнить обратную операцию (интегрировать данные). Таким образом, прогноз методологии будет сравниваться с соответствующими исходными данными. На интегрирование данных указывает буква I в общем названии модели (ARIMA = Авторегрессионное Проинтегрированное Скользящее Среднее).

   Константа в моделях ARIMA. Дополнительно модели ARIMA могут содержать константу, интерпретация которой зависит от подгоняемой модели. Именно, если (1) в модели нет параметров авторегрессии, то константа с есть среднее значение ряда, если (2) параметры авторегрессии имеются, то константа представляет собой свободный член. Если бралась разность ряда, то константа представляет собой среднее или свободный член преобразованного ряда. Например, если бралась первая разность (разность первого порядка), а параметров авторегрессии в модели нет, то константа представляет собой среднее значение преобразованного ряда и, следовательно, коэффициент наклона линейного тренда исходного.

   1.2.2 Идентификация

   Число оцениваемых параметров. Конечно, до того, как начать оценивание, вам необходимо решить, какой тип модели будет подбираться к данным, и какое количество параметров присутствует в модели, иными словами, нужно идентифицировать модель ARIMA. Основными инструментами идентификации порядка модели являются графики, автокорреляционная функция (АКФ), частная автокорреляционная функция (ЧАКФ). Это решение не является простым и требуется основательно поэкспериментировать с альтернативными моделями. Тем не менее, большинство встречающихся на практике временных рядов можно с достаточной степенью точности аппроксимировать одной из 5 основных моделей, которые можно идентифицировать по виду автокорреляционной (АКФ) и частной автокорреляционной функции (ЧАКФ). Ниже дается список этих моделей, основанный на рекомендациях Pankratz (1983); дополнительные практические советы даны в Hoff (1983), McCleary and Hay (1980), McDowall, McCleary, Meidinger, and Hay (1980), and Vandaele (1983). Отметим, что число параметров каждого вида невелико (меньше 2), поэтому нетрудно проверить альтернативные модели.

  1. Один параметр (p): АКФ - экспоненциально убывает; ЧАКФ - имеет резко выделяющееся значение для лага 1, нет корреляций на других лагах.
  2. Два параметра авторегрессии (p): АКФ имеет форму синусоиды или экспоненциально убывает; ЧАКФ имеет резко выделяющиеся значения на лагах 1, 2, нет корреляций на других лагах.
  3. Один параметр скользящего среднего (q): АКФ имеет резко выделяющееся значение на лаге 1, нет корреляций на других лагах. ЧАКФ экспоненциально убывает.
  4. Два параметра скользящего среднего (q): АКФ имеет резко выделяющиеся значения на лагах 1, 2, нет корреляций на других лагах. ЧАКФ имеет форму синусоиды или экспоненциально убывает.
  5. Один параметр авторегрессии (p) и один параметр скользящего среднего (q): АКФ экспоненциально убывает с лага 1; ЧАКФ - экспоненциально убывает с лага 1.

   Сезонные  модели. Мультипликативная сезонная ARIMA представляет естественное развитие и обобщение обычной модели ARIMA на ряды, в которых имеется периодическая сезонная компонента. В дополнении к несезонным параметрам, в модель вводятся сезонные параметры для определенного лага (устанавливаемого на этапе идентификации порядка модели). Аналогично параметрам простой модели ARIMA, эти параметры называются: сезонная авторегрессия (ps), сезонная разность (ds) и сезонное скользящее среднее (qs). Таким образом, полная сезонная ARIMA может быть записана как АРПСС (p,d,q)(ps,ds,qs). Например, модель (0,1,2)(0,1,1) включает 0 регулярных параметров авторегрессии, 2 регулярных параметра скользящего среднего и 1 параметр сезонного скользящего среднего. Эти параметры вычисляются для рядов, получаемых после взятия одной разности с лагом 1 и далее сезонной разности. Сезонный лаг, используемый для сезонных параметров, определяется на этапе идентификации порядка модели.

   Общие рекомендации относительно выбора обычных  параметров (с помощью АКФ и  ЧАКФ) полностью применимы к сезонным моделям. Основное отличие состоит  в том, что в сезонных рядах  АКФ и ЧАКФ имеют существенные значения на лагах, кратных сезонному  лагу (в дополнении к характерному поведению этих функций, описывающих  регулярную (несезонную) компоненту ARIMA).

   1.2.3 Оценивание параметров

   Существуют  различные методы оценивания параметров, которые дают очень похожие оценки, но для данной модели одни оценки могут  быть более эффективны, а другие менее эффективны. В общем, во время  оценивания порядка модели используется так называемый квазиньютоновский алгоритм максимизации правдоподобия (вероятности) наблюдения значений ряда по значениям параметров. Практически это требует вычисления (условных) сумм квадратов (SS) остатков модели. Имеются различные способы вычисления суммы квадратов остатков SS; вы можете выбрать: (1) приближенный метод максимального правдоподобия МакЛеода и Сейлза (1983), (2) приближенный метод максимального правдоподобия с итерациями назад, (3)точный метод максимального правдоподобия по Meларду (1984).

   Сравнение методов. В общем, все методы дают очень похожие результаты. Также все методы показали примерно одинаковую эффективность на реальных данных. Однако метод 1 (см. выше) - самый быстрый, и им можно пользоваться для исследования очень длинных рядов (например, содержащих более 30,000 наблюдений). Метод Меларда может оказаться неэффективным, если оцениваются параметры сезонной модели с большим сезонным лагом (например, 365 дней). С другой стороны, вы можете использовать вначале приближенный метод максимального правдоподобия (для того, чтобы найти прикидочные оценки параметров), а затем точный метод; обычно требуется только несколько итераций точного метода, чтобы получить окончательные оценки.

Информация о работе Моделирование динамики розничного товарооборота по городу Москве