Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 4. Модели временных рядов.
1. Основные элементы временного ряда.
Можно построить эконометрическую модель, используя два типа исходных данных:
• данные, характеризующие совокупность различных объектов в определенный момент (период) времени;
• данные, характеризующие один объект за ряд последовательных моментов (периодов) времени.
Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные на основе второго типа данных, называются моделями временных рядов.
Временной ряд - это совокупность значений какого-нибудь показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:
• факторы, формирующие тенденцию ряда;
• факторы, формирующие циклические колебания;
• случайные факторы.
При различных сочетаниях в изучаемом явлении или процессе этих факторов зависимость уровней ряда от времени может принимать различные формы.
Во-первых, большинство временных рядов экономических показателей имеют тенденцию, характеризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. Очевидно, что эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. На рис. 1а показан гипотетический временной ряд, содержащий возрастающую тенденцию.
а б
в
Рис. 1. Основные компоненты временного ряда.
Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей экономики зависит от времени года. При наличии больших массивов данных за длительные промежутки времени можно выявить циклические колебания, связанные с общей динамикой коньюктуры рынка, а также с фазой бизнес-цикла, в которой находится экономика страны. На рис. 1 б представлен гипотетический временной ряд, содержащий только сезонную компоненту.
Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Пример ряда, содержащего только случайную компоненту, приведен на рис. 1 в.
Очевидно, что реальные данные не следуют целиком и полностью из каких-либо описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты.
В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда.
Основная задача эконометрического исследования отдельного временного ряда- выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.
2. Автокорреляция уровней временного ряда и
выявление его структуры.
При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.
Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько периодов (шагов) во времени. Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом.
Коэффициент автокорреляции с лагом k определяется по формуле:
,
где yt- ряд фактических данных;
yt - k - ряд данных сдвинутых на величину лага k;
- среднее значение уровня фактических данных;
- среднее значение уровня сдвинутых данных.
С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые исследователи считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило - максимальный лаг должен быть не больше n/4.
Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.
Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.
Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.
Анализ автокорреляционой функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний и имеет структуру сходную со структурой ряда, изображенного на рис. 1 в , либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты (Т) и циклической (сезонной) компоненты (S).
3. Моделирование тенденции временного ряда.
Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:
• линейный тренд: ;
• гипербола: ;
• экспоненциальный тренд: ;
• тренд в форме степенной функции: ;
• парабола второго и более высоких порядков:
.
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время: t=1, 2, 3, ..., n , а в качестве зависимой переменной - фактические уровни временного ряда уt. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни .. и .. тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации R2 и выбора уравнения тренда с максимальным значением скорректированного коэффициента детерминации.
Параметры выбранного уравнения тренда определяются обычным МНК (системы нормальных уравнений см. в теме 2). Наиболее простую экономическую интерпретацию имеют параметры линейного и экспоненциального трендов.
Параметры линейного тренда можно интерпретировать так: а - начальный уровень временного ряда в момент времени t=0; b - средний за период абсолютный прирост уровней ряда (скорость развития явления во времени). Параметры экспоненциального тренда имеют следующую интерпретацию. Параметр а - это начальный уровень временного ряда в момент времени t=0. Величина b - это средний за единицу времени коэффициент роста уровней ряда.
4. Моделирование сезонных и циклических колебаний.
Аддитивная и мультипликативная модели.
Существует несколько подходов к анализу структуры временных рядов, содержащих сезонные и циклические колебания.
Простейший подход - расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий:
Y=T+S+E.
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (Т), сезонной (S) и случайной (E) компонент.
Общий вид мультипликативной модели выглядит так:
Y=TSE.
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (Т), сезонной (S) и случайной (E) компонент.
Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, а которой значения сезонной компоненты предполагается постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или убывает, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету значений T, S и Е для каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги:
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты S.
3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (Т+Е) в аддитивной или (ТЕ) в мультипликативной модели. Если исследуемый временной ряд состоит из поквартальных данных, то для выравнивания используются скользящие средние с периодом 4, если ряд состоит из данных за месяцы, то — с периодом 12.
4. Аналитическое выравнивание уровней (Т+Е) или (ТЕ) и расчет значений Т с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений (Т+Е) или (ТЕ).
6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержит автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок Е для анализа взаимосвязи исходного ряда и других временных рядов.
Применение фиктивных переменных для моделирования сезонных колебаний.
Рассмотрим еще один метод моделирования временного ряда, содержащего сезонные колебания, - построение модели регрессии с включением фактора времени и фиктивных переменных. Количество фиктивных переменных в такой модели должно быть на единицу меньше числа моментов (периодов) времени внутри одного цикла колебаний. Например, при моделировании поквартальных данных модель должна включать четыре независимые переменные - фактор времени и три фиктивные переменные. Каждая фиктивная переменная отражает сезоннную (циклическую) компоненту временного ряд для какого-либо одного периода. Она равна единице для данного периода и нулю для всех остальных периодов.
Пусть имеется временной ряд, содержащий циклические колебания периодичностью k. Модель регрессии с фиктивными переменными для этого ряда будет иметь вид:
,
где xj - фиктивная переменная;
Например, при моделировании сезонных колебаний на основе поквартальных данных за несколько лет число кварталов внутри одного года k=4, а общий вид модели следующий:
,
где
Уравнение тренда для каждого квартала будет иметь следующий вид:
для I квартала: ;
для II квартала:
для III квартала: ;
для IV квартала: .
Таким образом, фиктивные переменные позволяют дифференцировать величину свободного члена уравнения регресии для каждого квартала. Она составит:
для I квартала: (a+c1);
для II квартала: (a+c2);
для III квартала: (a+c3);
для IV квартала: a.
Параметр b в этой модели характеризует среднее абсолютное изменение уровней ряда по воздействием тенденции. В сущности, модель есть аналог аддитивной модели временного ряда, поскольку фактический уровень временного ряда есть сумма трендовой, сезонной и случайной компонент.
Основной недостаток модели с фиктивными переменными для описания сезонных и циклических колебаний - наличие большого количества переменных. Если, например, строить модель для описания помесячных периодических колебаний за несколько лет, то такая модель будет включать 12 независимых переменных (11 фиктивных переменных и фактор времени). В такой ситуации число степеней свободы невелико, что снижает вероятность получения статистически значимых оценок параметров уравнения регресии.
5. Моделирование тенденции временного ряда
при наличии структурных изменений.
От сезонных и циклических колебаний следует отличать единовременные изменения характера тенденции временного ряда, вызванные структурными изменениями в экономике или иными факторами. В этом случае, начиная с некоторого момента времени t*, происходит изменение характера динамики изучаемого показателя, что приводит к изменению параметров тренда, описывающего эту динамику. Схематично такая ситуация изображена на рис. 2.
Момент (период) времени t* сопровождается значительными изменениями ряда факторов, оказывающих сильное воздействие на изучаемый показатель yt. Чаще всего эти изменения вызваны изменениями в общеэкономической ситуации или факторами (событиями) глобального характера, приведшими к изменению экономики (например, начало крупных экономических реформ, изменение экономического курса, нефтяные кризисы и прочие факторы). Если исследуемый временной ряд включает в себя соответствующий момент (период) времени. то одной из задач его изучения становится выяснение вопроса о том, значимо ли повлияли общие структурные изменения на характер этой тенденции.
Рис. 2. Изменение характера тенденции временного ряда.
Если это влияние значимо, то для моделирования тенденции временного ряда следует использовать кусочно-линейные модели регрессии, т. е. разделить исходную совокупность на две подсовокупности (до момента времени t* и после момента t*) и построить отдельно по каждой подсовокупности уравнения линейной регрессии (на рис. 2 этим уравнениям соответствуют прямые (1) и (2)). Если структурные изменения незначительно повлияли на характер тенденции ряда yt, то ее можно описать с помощью единого для всей совокупности данных уравнения тренда (на рис. 2 этому уравнению соответствует прямая (3)).
Каждый из описанных выше подходов имеет свои положительные и отрицательные стороны. При построении кусочно-линейной модели происходит снижение остаточной суммы квадратов по сравнению с единым для всей совокупности уравнением тренда. Однако разделение исходной совокупности на две части ведет к потере числа наблюдений и, следовательно, к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Построение единого для всей совокупности уравнения тренда, напротив. позволяет сохранить число наблюдений n исходной совокупности, однако остаточная сумма квадратов по этому уравнению будет выше по сравнению с кусочно-линейной моделью. Очевидно, выбор одного из двух моделей (кусочно-линейной или единого уравнения тренда) будет зависеть от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно- линейной модели.
Формальный статистический тест для оценки этого соотношения был предложен Грегори Чоу. Применение этого теста предполагает расчет параметров уравнения трендов, графики которых изображены на рис. 2 прямыми (1), (2) и (3). Введем систему обозначений, приведенную в таблице:
Условные обозначения для алгоритма теста Чоу
№
урав-
нения
Вид
уравнения
Число
наблюдений
в совокупности
Остаточная
сумма
квадратов
Число
параметров
в уравнении
Число степеней свободы остаточной дисперсии
Кусочно-линейная модель
(1)
y(1)=a1+b1t
n1
C1ост
k1
n1 - k1
(2)
y(2)=a2+b2t
n2
C2ост
k2
n2 - k2
Уравнение тренда по всей совокупности
(3)
y(3)=a3+b3t
n3
C3ост
k3
n - k3
k1=k2=k3=2; n= n1+n2
Выдвинем гипотезу Н0 о структурной стабильности тенденции изучаемого временного ряда.
Остаточную сумму квадратов по кусочно-линейной модели Ск-лост можно найти как сумму С1ост и С2ост :
.
Соответствующее ей число степеней свободы составит:
. (*)
Тогда сокращение остаточной дисперсии при переходе от единого уравнения тренда к кусочно-линейной модели можно определить следующим образом:
.
Число степеней свободы, соответствующее с учетом соотношения (*) будет равно:
.
Далее в соответствии с предложенной Г. Чоу методикой определяется фактическое значение F-критерия по следующим дисперсиям на одну степень свободы:
.
Найденное значение Fp сравнивают с табличным, полученным по таблицам распределения Фишера для уровня значимости и числа степеней свободы (k1+k2 - k3) и (n - k1 - k2).
Если Fр > Fтаб , то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику изучаемого показателя признают значимым. В этом случае моделирование тенденции временного ряд следует осуществлять с помощью кусочно-линейной модели. Если Fр < Fтаб , то нет оснований отклонять гипотезу о структурной стабильности тенденции. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда.
Если гипотеза о структурной стабильности тенденции ряда yt отклоняется, то дальнейший анализ может заключатся в исследовании вопроса о причинах этих структурных различий и более детальном изучении характера изменения тенденции. В принятых нами обозначениях эти причины обуславливают различия оценок параметров уравнений (1) и (2).
Возможны следующие сочетания изменения численных оценок параметров этих уравнений :
• изменение численной оценки свободного члена уравнения тренда a2 по сравнению с a1 при условии, что различия между b1 и b2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) параллельны (рис.). В данной ситуации можно говорить о скачкообразном изменении уровней ряда yt в момент времени t* при неизменном среднем абсолютном приросте за период;
• изменение численной оценки параметра b2 по сравнению с b1 при условии, что различия между a1 и a2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) пересекаю ось ординат в одной точке (рис.). В этом случае изменение тенденции связано с изменением среднего абсолютного прироста временного ряда, начиная с момента времени t* . при неизменном начальном уровне ряда в момент времени t=0.
• изменение численных оценок параметров a1 и a2 , а также b1 и b2. Геометрически эта ситуация изображена на рис. Она означает, что изменение характера тенденции сопровождается изменением как начального уровня ряда, так и среднего за период абсолютного прироста.
Один из статистических методов тестирования при применении перечисленных выше ситуаций для характеристики тенденции изучаемого временного ряда был предложен американским экономистом Дамодаром Гуйарати. Этот метод основан на включении в модель регрессии фиктивной переменной Zt, которая принимает значение 1 для всех tt*, принадлежащих промежутку времени после изменения характера тенденции (далее- промежутку (2)). Д. Гуйарати предлагает определять параметры следующего уравнения регрессии:
. (**)
Таким образом, для каждого промежутка времени получим следующие уравнения:
Промежуток (1) : Z=1 ;
Промежуток (2) : Z=0 .
Сопоставив полученные уравнения с уравнениями (1) и (2), нетрудно заметить, что
a1=(a+b); b1=(c+d);
a2=a; b2=c.
Параметр b есть разница между свободными членами уравнений (1) и (2), а параметр d - разница между параметрами b1 и b2 уравнений (1) и (2). Оценка статистической значимости различий a1 и a2 , а также b1 и b2 эквивалентна оценке статистической значимости параметров b и d уравнения (**). Эту оценку можно провести при помощи t-критерия Стьюдента.
Таким образом, если в уравнении (**) b является статистически значимым, а d - нет, то изменение тенденции вызвано только различиями параметров a1 и a2. Если в этом уравнении параметр d статистически значим, а b- незначим, то изменение характера тенденции вызвано различиями параметров b1 и b2. Если оба коэффициента b и d являются статистически значимыми, то на изменение характера тенденции повлияли как различия между a1 и a2 , так и различия между b1 и b2.
Этот метод можно использовать не только в дополнение к тесту Чоу, но и самостоятельно для проверки гипотезы о структурной стабильности тенденции изучаемого временного ряда. Основное его преимущество перед тестом Чоу состоит том, что нужно построить только одно, а не три уравнения тренда.