Три основных задачи исследования временных рядов
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
4. Разложение временных рядов на компоненты
Можно выделить три основных задачи исследования временных рядов:
1. Описание изменения исследуемого признака во времени и выявление свойств исследуемого ряда.
2. Объяснение механизма изменения уровней ряда.
3. Статистическое прогнозирование значений изучаемого признака для будущих моментов времени.
Рассмотрение реальных ситуаций показывает, что типичные временные ряды могут содержать четыре составляющих:
где - тренд (тенденция);
- сезонная составляющая;
- циклическая составляющая;
- случайная (несистематическая) компонента.
Любой ряд можно описать в виде композиции этих составляющих. Однако следует помнить, что операция разложения временного ряда, допустимая с математической точки зрения и часто полезная для моделирования изучаемого явления, может в некоторых случаях ввести в заблуждение. В частности, при таком подходе чрезмерным упрощением может оказаться предположение о независимом влиянии указанных компонент.
Тренд – это устойчивое, систематическое изменение значений временного ряда в течение достаточно долгого периода. Определение тренда не является строгим, поскольку включает понятие «достаточно долгий». Очевидно, что для разных явлений длительность такого периода будет различной, поэтому то, что сейчас воспринимается, как тренд, может на самом деле оказаться частью колебательного процесса с большим периодом колебаний. Об этом следует помнить при построении моделей. В экономике трендом считают ту тенденцию, которая формируется под воздействием следующих факторов:
• технологическое и экономическое развитие;
• рост потребления и изменение его структуры;
• изменение демографических характеристик популяции и т.д.
Сезонная компонента описывает регулярные изменения, обусловленные влиянием на изучаемое явление (наблюдаемое значение показателя) некоторых, внешних по отношению к этому явлению факторов, действующих с заранее известной периодичностью. Типичными примерами сезонного эффекта являются колебание цен на сельхоз продукцию, потребление сезонных товаров, объем продаж перед праздниками и т.д. Основной принцип анализа сезонных компонент заключается в переходе от сравнения всех значений ряда между собой к сравнению значений через определенный период времени, что позволяет снизить оценку вариации временного ряда около его среднего значения (продажи в декабре этого года сравнивают с продажами в декабре прошлого).
Циклическая компонента имеет больший период колебаний, чем сезонная, т.е. изменения временного ряда являются достаточно плавными и заметными для того, чтобы включить их в случайную составляющую, но их нельзя отнести ни к тренду, ни к периодической сезонной компоненте. Примерами могут служить циклы деловой активности, демографические, инвестиционные и другие циклы. В экономических временных рядах редко предоставляется возможность для выявления и анализа циклической компоненты, так как ряды экономических показателей часто оказываются слишком короткими, для таких исследований. Циклические показатели изучались во временных рядах, относящихся к естественным наукам. Например, во многих явлениях установлена цикличность, связанная с солнечной активностью (период – 11 лет).
Если из временного ряда удалить тренд и периодические составляющие, то останется нерегулярная (случайная) компонента. Для ее описания используются методы теории вероятности и математической статистики. Экономисты разделяют факторы, под действием которых формируется случайная компонента, на два вида:
• факторы резкого, внезапного действия;
• текущие факторы.
Факторы первого вида (стихийные бедствия, эпидемии, войны, кризис и т.д.), как правило, вызывают более значительные отклонения. Иногда такие отклонения называют катастрофическими колебаниями. Факторы второго вида вызывают случайные колебания, являющиеся результатом действия большого числа причин, влияние каждой из которых незначительно, но суммарный эффект достаточно ощутим.
Формы разложения (декомпозиции) временного ряда на детерминированную и случайную компоненты могут различаться.
Аддитивной моделью временного ряда называется представление ряда в виде суммы компонент:
Мультипликативной моделью временного ряда называется представление ряда в виде произведения компонент:
Также можно выделить модель смешанного типа:
Следует заметить, что в процессе формирования значений уровней каждого временного ряда не обязательно участвуют одновременно все компоненты. Однако наличие случайной составляющей предполагается во всех случаях.
Решение любой задачи по анализу и прогнозированию временных рядов начинается с построения графика исследуемого показателя. Иногда уже на этом этапе можно определить характер колебаний. Отличительная особенность аддитивной модели заключается в том, что амплитуда сезонных колебаний остается примерно постоянной, неизменной во времени.
Если амплитуда колебаний возрастает или убывает, то имеет место мультипликативная модель.
5. Анализ систематической составляющей (тенденции)
Для определения наличия тренда в исходном временном ряду применяется несколько методов, рассмотрим два из них.
5.1. Метод проверки разности средних уровней
Реализация этого метода состоит из четырех этапов.
1. Временной ряд разбивается на две примерно равные по числу уровней части: в первой части первых уровней временного ряда, во втором - остальных уровней временного ряда ().
2. Для каждой из этих частей вычисляют средние значения и дисперсии:
; ;
; ;
3. Проверяем однородность дисперсий обеих частей ряда с помощью F-критерия Фишера, то есть сравниваем расчетное значение критерия:
с табличным значением критерия Фишера с заданным уровнем значимости α. Величина 1- α называется доверительной вероятностью. Если расчетное значение F меньше табличного , то гипотеза о равенстве дисперсий принимается и переходят к четвертому этапу. Если расчетное значение F больше или равно , то гипотеза о равенстве дисперсий отклоняется и делается вывод, что данный метод для определения наличия тренда ответа не дает.
4. Проверяем гипотезу об отсутствии тренда с использование t-критерия Стьюдента. Для этого определяем расчетное значение критерия Стьюдента по формуле:
где σ – среднеквадратическое отклонение разности средних:
Если расчетное значение t меньше табличного значения статики Стьюдента с заданным уровнем значимости α и числом степеней свободы , то гипотеза принимается, то есть тренда нет, в противном случае тренд есть. Данный метод применим только для временных рядов с монотонной тенденцией.
5.2. Метод Фостера-Стьюарта
Этот метод обладает большими возможностями и дает более надежные результаты. Кроме тренда самого ряда, он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен, если дисперсия увеличивается, то ряд «раскачивается» и т.д.
Реализация метода также содержит четыре этапа.
1. Производим сравнение каждого уровня исходного временного ряда, начиная со второго уровня, со всеми предыдущими, при этом определяю две числовые последовательности:
2. Вычисляем величины s и d:
Величина s, характеризующая изменение временного ряда, принимает значение от –(n-1) (ряд монотонно убывает) до (n-1) (ряд монотонно возрастает). Величина d характеризует изменение дисперсии уровней временного ряда и изменяется от 0 (все уровни ряда равны) до (n-1) (ряд монотонный или с чередованием подъемов и падений уровней).
3. Проверяем гипотезу, можно ли считать случайным:
1. отклонение величины d от величины μ – математического ожидания величины d для ряда, в котором уровни расположены случайным образом;
2. отклонение величины s от 0.
Эта проверка проводится с использованием расчетных значений t-критерия Стьюдента для дисперсии и для средней:
; ;
; .
где μ – математическое ожидание величины d, определенной для ряда, в котором уровни расположены случайным образом;
- среднеквадратическое отклонение для величины d;
- среднеквадратическое отклонение для величины s.
Существуют таблицы, в которых содержится μ, , :
n
10
20
30
40
μ
3,858
5,195
5,990
6,557
1,288
1,677
1,882
2,019
1,964
2,279
2,447
2,561
4. Расчетные значения и сравнивают с табличными значениями критерия Стьюдента с заданным уровнем значимости . Если расчетное значение меньше табличного, то гипотеза об отсутствии соответствующего тренда принимается, в противном случае тренд есть.
Очень часто уровни временных рядов в экономике колеблются, поэтому тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четко выявить тенденцию развития исследуемого процесса производят сглаживание (выравнивание) временных рядов.
Методы сглаживания делят на две основные группы:
• Аналитические методы основаны на представлении временного ряда некоторой известной с точностью до параметров функцией, для оценки которой используются методы регрессионного анализа. При этом моделируется значение уровня временного ряда в зависимости от времени .
• Алгоритмические (механические) методы основаны на усреднении наблюдаемых соседних значений временного ряда.
5.3. Аналитические методы
Основная цель создания трендовых моделей экономической динамики – это прогноз о развитии изучаемого процесса в будущем. Использование метода экстраполяции на основе кривых роста базируется на двух предположениях:
• временной ряд экономического показателя действительно имеет тренд, то есть преобладающую тенденцию;
• общие условия, определяющие развитие показателя в прошлом, не изменяются в течение периода упреждения.
В настоящее время насчитывается большое количество типов кривых роста для экономических процессов.
5.3.1. Полиномиальные кривые роста
В простейшем случае, когда ряд имеет тенденцию равномерного возрастания (убывания), то тренд достаточно хорошо можно описать полиномом первой степени, т.е. линейной функцией. С помощью полинома второй степени (параболы) можно описать тенденцию возрастания и последующего убывания уровней ряда (или наоборот). Посредством полиномов более высоких степеней можно выделить систематическую циклическую составляющую.
В более сложных случаях, подбирая полином соответствующей степени, мы можем получить описание любого конечного ряда с желаемой (необходимой) точностью.
Параметр называют линейным приростом, параметр - ускорением роста, параметр - изменением ускорения роста.
Полиномиальные кривые роста можно использовать для аппроксимации (приближения) и прогнозирования экономических процессов, в которых последующее развитие не зависит от достигнутого уровня.
5.3.2. Экспоненциальные кривые роста
Использование экспоненциальных кривых роста предполагает, что дальнейшее развитие зависит от достигнутого уровня, например, прирост зависит от значения функции. В экономике чаще всего применяют две разновидности экспоненциальных (показательных) кривых:
1. Простая экспонента:
2. Модифицированная экспонента:
5.3.3. S-образные кривые роста
S-образные кривые роста используются для моделирования процессов, которые сначала растут медленно, затем ускоряются, а затем снова замедляют свой рост, стремясь к какому-либо пределу. Выделяют несколько таких кривых, в том числе:
1. Кривая Гомперца:
2. Логистическая кривая или кривая Перла-Рида, может описываться несколькими уравнениями:
, или , или
5.3.4. Гиперболические кривые роста
График гиперболы соответствует процессу насыщения рынка, то есть первоначальный рост со временем замедляется и процесс стабилизируется.
; ;
5.3.5. Логарифмические и обратнологарифмические кривые роста
1. - логарифмическая кривая используется если изучаемый процесс приводит к замедлению роста какого-то показателя, но при этом рост не прекращается, не стремится к какому-либо ограниченному пределу.
2. - обратнологарифмическая кривая роста очень редко используется в практике прогнозирования.
5.4. Алгоритмические методы
В алгоритмических методах большое значение придается последним данным. Это свойство модели называется адаптивностью. Также данные методы обладают свойством рекурсивности, то есть каждое значение определяется исходя из всех или нескольких предыдущих данных.
5.4.1. Модель скользящих средних
Значения модели скользящих средних определяются следующей формулой:
То есть значение уровня временного ряда равно среднему предыдущих значений, число называется порядком скользящего среднего. Обычно является нечетным.
Существует еще один вариант формулы:
, ,
Первый вариант формулы удобнее использовать для построения прогноза. Однако эти модели используют только для краткосрочного прогнозирования.
5.4.2. Метод взвешенных скользящих средних
Общая формула имеет вид:
- это вес, приписываемый уровню ряда, находящемуся на расстоянии от момента . Веса рассчитываются для различных степеней аппроксимирующих полиномов и различных интервалов сглаживания с помощью метода наименьших квадратов. Например, для полиномов 2 и 3-го порядков числовая последовательность весов при интервале сглаживания имеет вид (-3; 12; 17; 12; ‑3).
Модель экспоненциально взвешенных скользящих средних является одной из разновидностей модели взвешенных скользящих средних. Предполагается, что новое значение определяется совокупностью предыдущих значений, влияние которых ослабевает в геометрической прогрессии.
Так как сумма коэффициентов должна давать единицу, то для достаточно больших модель может быть записана в виде:
Чем ближе α к нулю, тем быстрее модель «забывает» прошлые данные и тем больший вес имеет самая последняя информация. С другой стороны, когда α приближается к единице, то веса при распределены более равномерно и, следовательно, график модели будет выглядеть более сглаженным.
Эффект Слуцкого-Юла
Временной ряд, полученный после применения процедуры скользящих средних, также содержит случайную составляющую , однако ее влияние будет сглажено и поэтому выражено не так явно. Очевидно, что уменьшение дисперсии случайных колебаний зависит от интервала сглаживания .
Рассмотрим аддитивную модель исходного временного ряда, в которой случайная компонента удовлетворяет следующим свойствам:
т.е. случайные остатки взаимно некоррелированны и гомоскедастичны.
Пусть длина интервала сглаживания , тогда весовые коэффициенты для каждого активного участка могут быть представлены в виде:
Эти же весовые коэффициенты будут использоваться для определения оценки случайной составляющей в центральной точке активного участка:
Можно записать математическое ожидание и дисперсию сглаженных остатков в виде:
Тогда
Учитывая взаимную некоррелированность исходных случайных остатков, последнее выражение можно представить в виде:
Перейдем к коэффициенту автокорреляции порядка τ (для случайных остатков , отстоящих друг от друга на τ тактов времени):
, где .
Таким образом, коэффициенты автокорреляции для произвольного сглаженного ряда будут отличны от нуля вплоть до порядка , а коэффициенты более высоких порядков будут равны нулю. То есть производные ряды, будучи более гладкими по сравнению с исходными, могут содержать систематические колебания, вызванные лишь усреднением случайных составляющих. Этот вывод получил название эффекта Слуцкого-Юла, по имени ученых, впервые обративших внимание на этот факт.
5.4.3. Метод экспоненциального сглаживания
Особенность этого метода заключается в том, что в процедуре нахождения сглаженного уровня вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня временного ряда.
α – параметр сглаживания.
Модель экспоненциального сглаживания получается из модели экспоненциально взвешенного скользящего среднего путем сдвига исходных данных на единицу времени.
Выбор параметра сглаживания представляет достаточно сложную проблему. В отдельных случаях Браун предлагал определять величину α исходя из длины сглаживаемого ряда:
На практике часто используются значения от 0.1 до 0.3 (необоснованно).
Существует и более строгий подход: поскольку каждая экспоненциальная модель определяется своим значением α, то можно рассматривать всю совокупность экспоненциальных моделей для данного ряда данных. Таким образом, α считается параметром модели и можно найти оптимальное значение α, которое минимизирует сумму квадратов остатков. Однако для такого анализа необходимо использовать программные средства.
Что касается начального значения , то в конкретных задачах его берут или равным значению первого уровня ряда , или равным средней арифметической нескольких первых членов ряда, например:
Такой выбор значения обеспечивает хорошее согласование сглаженного и исходного ряда для первых уровней. При экспоненциальном сглаживании не теряют ни начальные, ни конечные уровни сглаживаемого временного ряда.
Можно определить начальное значение, используя уравнение тренда или воспользоваться методом прогнозирования назад, который использует туже модель, но рекурсивность осуществляется в обратном направлении:
Значения берутся в обратном порядке. Начинаем с и приходим к , это позволяет взять в качестве начального значения сглаженное, определяемое общим ходом процесса, число.
Выделяют также модель двойного экспоненциального сглаживания, которая получается посредством двойного применения модели экспоненциального сглаживания. То есть сначала модель экспоненциального сглаживания применяется к исходным данным, а затем – к смоделированным значениям, полученным на первом этапе. При этом повторном применении модели можно взять другое значение α.
5.4.4. Метод последовательных (переменных) разностей
Этот метод позволяет определить порядок аппроксимирующего полинома.
Если ряд в качестве неслучайной составляющей содержит постоянный член, то ряд, полученный путем вычисления разностей первого порядка , не будет содержать эту неслучайную константу. Чтобы исключить линейный тренд необходимо вычислить последовательные разности второго порядка . В общем случае, если ряд описывается полиномом степени p-1, то ряд составленный из последовательных разностей порядка p: - будет содержать только случайную составляющую.
Последовательность действий следующая: вычисляем последовательные разности первого порядка (p=1) и определяем величину по формуле:
Затем вычисляем разности второго порядка и также определяем величину . Если величины уменьшаются, то повторяем вычисления, увеличив порядок разности на единицу. Продолжая вычисления, на некотором шаге мы обнаружим, что при дальнейшем возрастании порядка разности очередные значения практически не отличаются друг от друга (в пределах ошибок вычисления выборочных оценок). Это указывает на то, что систематическая компонента из анализируемого ряда исключена, а степень полинома на единицу меньше порядка разностей на шаге процедуры, начиная с которого остается постоянной. Значение , полученное на последнем шаге, будет оценкой выборочной дисперсии случайной составляющей первоначального ряда.
6. Анализ периодических колебаний во временных рядах
Если под сглаживанием временного ряда понималось получение оценки (), то под фильтрацией компонент понимается процесс получения оценок . В настоящее время различают четыре основных направления фильтрации компонент временного ряда: статистические, итерационные, спектральные и гармонические.
6.1. Статистические методы фильтрации
Рассмотрим аддитивную модель. Сначала следует оценить тренд, для его выделения следует использовать метод центрированного скользящего среднего. Поскольку теоретическое значение при методе сглаживания скользящими средними определяется для центрального элемента интервала, то длина интервала сглаживания должна быть нечетной. Но период сезонности обычно включает четное число временных интервалов (12 месяцев, 4 квартала). Для выхода из такой ситуации используется метод центрированных скользящих средних: для ежемесячных данных – это среднее с весами:
Крайние месяцы имеют коэффициент 1, а все остальные вес 2.
Алгоритм расчета сезонного индекса можно представить в виде следующих шагов:
1. Исходный ряд сглаживается методом центрированных скользящих средних.
2. Рассчитывается разница между исходными данными и центрированными средними, т.е. считают отклонения, которые и представляют собой эффект сезонности
3. Для определения влияния каждого конкретного периода года на динамику рассчитываются средние (по месяцам)
где p – число целых циклов в году.
Различные пределы суммирования объясняются тем, фактом, что центрированное средне дает первое значение для момента t=7, а последнее – для момента t=12p-6.
4. Сезонный индекс определяется из соотношения
где . При этом . Это соотношение необходимо, чтобы суммарное воздействие индексов сезонности на динамику было нейтральным.
Мультипликативные индексы сезонности используются в том случае, когда по мере повышения среднего уровня динамики увеличиваются абсолютные отклонения, вызванные сезонностью. В отличие от аддитивных индексов сезонности, которые имеют абсолютную величину, мультипликативные отражают относительное отклонение каждого периода сезона от средней величины.
Мультипликативные индексы рассчитывают из соотношения исходных данных к центрированным скользящим средним
Затем определяют среднее соотношение по каждому месяцу с помощью приведенной выше формулы.
В случае мультипликативной сезонности корректировка производится путем умножения на индекс.
,
Этим добиваемся, чтобы сумма сезонных эффектов за год равнялась 12.
6.2. Итерационные методы фильтрации
Итерационные методы фильтрации основаны на многократном применении центрированных скользящих средних и одновременной оценке сезонной компоненты в каждом цикле.
6.2.1. Метод Четверикова
1. Эмпирический ряд сглаживается по методу центрированных скользящих средних. Выпадающие значения либо восстанавливаются экстраполированием выровненного ряда, либо остаются в стороне при последующей стадии работ.
Получаются предварительная оценка тренда и отклонения эмпирического ряда от выровненного: , или , , .
2. Для каждого года i вычисляют - среднеквадратическое отклонение, на которое и делят затем отдельные месячные (квартальные) отклонения соответствующего года:
,
где
3. Из «нормированных» таким путем отклонений вычисляется предварительная средняя сезонная волна:
4. Средняя предварительная сезонная волна умножается на среднеквадратическое отклонение каждого года и вычитается из эмпирического ряда:
5. Получающийся таким образом ряд, лишенный предварительной сезонной волны, вновь сглаживается с помощью скользящих средних (для месячных данных по пяти или семи точкам в зависимости от интенсивности мелких конъюнктурных колебаний и продолжительности более крупных). В результате получается новая оценка тренда .
6. Отклонения эмпирического ряда от ряда , полученного в пункте 5
,
вновь подвергаются аналогичной обработке по пунктам 2 и 3 для выявления окончательной средней сезонной волны.
7. Исключение окончательной сезонной волны проводится после умножения средней сезонной волны на - коэффициент напряженности сезонной волны:
где - выровненные значения ряда, - случайная компонента ().
Описанный метод был разработан Четвериковым в 1928 году и позволяет исключать влияние сезонных волн переменной структуры.
6.2.2. Метод Шискина-Эйзенпресса
В методике Шискина-Эйзенпресса, кроме центрированной скользящей средней, на втором и последующих этапах итерационной процедуры применяются более сложные пятнадцати- и двадцатиодноточечные скользящие Спенсера. Они имеют соответственно следующий вид:
Скользящие средние Спенсера позволяют получать точные оценки тренда, выраженного полиномами до третьей степени включительно.
Рассмотрим теперь собственно метод Шискина-Эйзенпресса.
1. Исходный ряд выравнивается центрированными скользящими средними. Делается это, как и в методе Четверикова, с той целью, чтобы не исказить сезонную компоненту . Если бы мы использовали другую скользящую среднюю, то это могло бы привести к искажению амплитуды и формы сезонной волны.
2. Рассчитывают остаточные значения:
или
Вычисляют средние значения остаточного ряда в целом по ряду и по месяцам (кварталам) :
3. Находится предварительная оценка средней сезонной волны:
и строится новый ряд, относительно свободный от сезонной компоненты:
4. К ряду применяется двадцатиодноточечное сглаживание скользящими средними Спенсера, получаем ряд .
5. Находится улучшенная оценка сезонной компоненты:
6.3. Гармонический анализ
Одним из методов анализа периодичностей является гармонический анализ. Под гармоникой понимается гармоническое колебание, частота которого в целое число раз больше основной частоты данного колебания.
Для описания таких изменений используется периодическая функция Фурье. Сезонная волна представляет собой синусоидальную функцию с периодом один год; разложение таких функций в тригонометрический ряд Фурье носит название гармонического анализа, и аналитической формой сезонной волны служит тригонометрический многочлен вида:
В этом многочлене k – порядковый номер гармоники ряда Фурье; m – число гармоник; t – время, принимающее значения 0, 2π/n, 2·2π/n, …, (n-1)·2π/n (для месячных данных n=12); параметры находятся в соответствии с методом наименьших квадратов и задаются следующими соотношениями:
, ,
На практике при выравнивании данных сезонных процессов по ряду Фурье рассчитывают не более четырех гармоник, а затем определяют, при каком числе гармоник наилучшим образом отражается периодичность изменения уровней ряда. Следует иметь в виду, что увеличение числа гармоник, с одной стороны, увеличивает точность аппроксимации, а с другой – может уменьшить значимость модели в результате увеличения дисперсии
где р – число определяемых параметров аппроксимирующего уравнения (1 гармоника – р=3, 2 гармоники – р=5 и т.д.).
6.4. Спектральный анализ
Это метод непараметрического оценивания структуры временного ряда. Использование это метода позволяет выявить колебания, скрытые в природе экономического развития.
Временной ряд можно разложить на два взаимно некоррелированных процесса:
где - линейно детерминированный процесс; - чисто недетерминированная компонента, которая может быть представлена моделью АР, СС или АРИСС. Компонента в разложении процесса имеет скачки в частотах интервала , если исследуемый ряд содержит гармоники с соответствующим этим частотам периодом.
Вторая составляющая не содержит периодических составляющих, что обеспечивает непрерывность соответствующей спектральной функции , кроме того, эта функция обладает непрерывной производной , что позволяет выразить функцию автоковариации компоненты через :
где - вклад частотной полосы в общую дисперсию ряда. Функция называется спектральной функцией плотности. Если исходный ряд не содержит периодических составляющих, то он есть линейно недетерминированный процесс , а - абсолютно непрерывная функция. При наличии гармоники в , что соответствует , будет иметь пик в частоте, соответствующей данной гармонике. Выражение функции спектральной плотности через последовательность автоковариационных функций выражается следующей формулой:
Это является дискретным аналогом интегрального представления Фурье автоковариационной функции и служит основным соотношением для получения оценок Р спектральной функции . Чтобы эти оценки были состоятельны, эффективны и не смещены, нужно правильно оценить функцию автоковариации . Для состоятельности оценки необходимо и достаточно, чтобы
т.е. зависимость значений ряда должна резко снижаться по мере их удаления друг от друга. Несмещенные оценки автоковариации можно определить по формуле:
где ; .
7. Адаптивные методы прогнозирования
В статистических методах прогнозирования финансовых и экономических показателей обычно выдвигается гипотеза, что основные факторы и тенденции прошлого периода сохранятся на период прогноза или что можно обосновать и учесть направление их изменения в рассматриваемой перспективе. Надежды здесь возлагаются на инерционность экономических и финансовых систем. Между тем в большинстве случаев подвижность этих явлений возрастает, возрастает быстрота реакции фондовых и товарно-сырьевых рынков на правительственные решения или новые социально-политические условия.
Наибольшей инерционностью обладают макроэкономические характеристики, но и они стали весьма подвижными. В настоящее время исследователь часто имеет дело с новыми явлениями с короткими статистическими рядами или со старыми явлениями, претерпевающими коренные изменения. Поэтому при использовании информации для построения моделей встает вопрос о преемственности данных. Устаревшие данные при моделировании часто оказываются бесполезными и даже вредными. К тому же статистическое описание процесса редко может удовлетворить, потому что необходимо знать, не как развивается процесс в среднем, а как будет развиваться его тенденция, существующая в данный момент. Значит надо строить модели, опираясь в основном на малое количество самых свежих данных. В этом случае альтернативой статистическому обоснованию модели может быть наделение ее адаптивными свойствами.
7.1. Сущность адаптивных методов
Цель адаптивных методов заключается в построении самокорректирующихся (самонастраивающихся) моделей, которые способны отражать изменяющиеся во времени условия, учитывать информационную ценность различных членов временной последовательности и давать достаточно точные оценки будущих членов данного ряда. Отличие адаптивных моделей от других прогностических моделей состоит в том, что они отражают текущие свойства ряда и способны непрерывно учитывать эволюцию динамических характеристик изучаемых процессов. Именно поэтому такие модели предназначены, прежде всего, для краткосрочного прогнозирования.
На временной ряд воздействуют в разное время различные факторы. Одни из них по тем или иным причинам ослабляют свое влияние, другие воздействуют активнее. Таким образом, реальный процесс протекает в изменяющихся условиях, составляющих его внешнюю среду, в которой он приспосабливается, адаптируется. А модель в свою очередь, адаптируется к ряду, представляющему этот процесс. Поскольку мы рассматриваем нестационарные ряды, то модель всегда будет находиться в динамике.
Адаптация в таких моделях слагается из небольших дискретных сдвигов. В основе процедуры адаптации лежит метод проб и ошибок. Последовательность процесса адаптации в основном выглядит следующим образом. Пусть модель находится в некотором исходном состоянии (т.е. определены текущие значения ее коэффициентов) и по ней делается прогноз. Выжидаем, пока истечет одна единица времени (шаг моделирования), и анализируем, насколько далек результат, полученный по модели, от фактического значения ряда. Ошибка прогнозирования через обратную связь поступает на вход системы и используется моделью в соответствии с ее логикой для перехода из одного состояния в другое, с целью большего согласования своего поведения с динамикой ряда. На изменения ряда модель должна отвечать «компенсирующими» изменениями. Затем делается прогноз на следующий момент времени, и весь процесс повторяется. Таким образом, адаптация осуществляется рекуррентно с получением каждой новой фактической точки временного ряда.
Быстроту реакции модели на изменения в динамике процесса характеризует так называемый параметр адаптации. Процесс «обучения» модели состоит в выборе наилучшего параметра адаптации на основе проб на ретроспективном материале. При наличии тенденции в стохастическом процессе наилучшей реакцией модели является определенный компромисс между двумя крайними ситуациями, обеспечивающий отражение тенденции и одновременно фильтрацию случайных отклонений от нее. По тому, насколько хорошо модель поддается «обучению», можно судить о ее способности адекватно отражать закономерности данного временного ряда. После выбора параметра адаптации самообучение модели происходит в процессе переработки новых статистических данных.
В силу простоты каждой отдельно взятой модели и ограниченности исходной информации нельзя ожидать, что какая-либо одна адаптивная модель годится для прогнозирования любого ряда, любых вариаций поведения. Адаптивные модели достаточно гибки, однако не являются универсальными. Поэтому при построении и объяснении конкретных моделей необходимо учитывать наиболее вероятные закономерности развития реального процесса, динамические свойства ряда соотносить с возможностями модели.
У истоков адаптивного направления лежит простейшая модель экспоненциального сглаживания. Модификации и обобщения этой модели привели к появлению целого семейства адаптивных моделей. Экспоненциальное сглаживание является простейшим вариантом самообучающейся модели. Вычисления просты и выполняются рекуррентно.
7.2. Адаптивные полиномиальные модели
Если для прогнозирования временного ряда, имеющего ярко выраженную линейную тенденцию, использовать экспоненциальное сглаживание, то модель, как правило, будет давать смещенные прогнозы, т.е. систематическую ошибку. Для таких временных рядов целесообразно использовать модели линейного роста, также применяющие процедуру экспоненциального сглаживания.
В этих моделях прогноз может быть получен с помощью следующего выражения:
где и - текущие оценки коэффициентов;
- время упреждения прогноза.
В таблице представлены три модели данного типа: двухпараметрическая модель Ч. Хольта, однопараметрическая модель Р. Брауна и трехпараметрическая модель Дж. Бокса и Г.Дженкинса, отличающиеся рекуррентными выражениями для пересчета текущих оценок коэффициентов (параметры адаптации или параметры экспоненциального сглаживания ).
Название модели
Оценка коэффициентов
Модель Ч.Хольта
Модель Р.Брауна
Модель Дж. Бокса и Г. Дженкинса
В эконометрических пакетах чаще представлена модель Ч. Хольта с возможностью выбора оптимальных параметров по критерию минимума среднеквадратической ошибки путем перебора по сетке возможных значений. Рекуррентные формулы для оценки коэффициентов по этой модели могут быть преобразованы к следующему виду, явно показывающему зависимость «корректирующего воздействия» от величины ошибки:
где - ошибка прогноза.
Из данного представления видно, что модель Брауна является частным случаем модели Хольта. при этом единственный параметр β играет роль коэффициента дисконтирования наблюдений. Модель Бокса-Дженкинса является развитием модели Хольта и включает разность ошибок, однако практические исследования показали, что оценка коэффициента при разности ошибок в большинстве случаев близка к нулю.
7.3. Адаптивные модели сезонных явлений
Многие экономические временные ряды содержат периодические сезонные колебания. В зависимости от характера этих колебаний их делят на два класса: мультипликативные и аддитивные:
1.
2.
где - характеристика тенденции развития;
- аддитивный сезонный фактор;
- мультипликативный сезонный фактор;
- число фаз в полном сезонном цикле (12 или 4);
- неавтокоррелированный шум с нулевым математическим ожиданием.
Очевидно, что можно составить множество адаптивных сезонных моделей, перебирая различные комбинации типов тенденций в сочетании с сезонными эффектами аддитивного и мультипликативного вида. Выбор той или иной модели будет продиктован характером динамики исследуемого процесса.
Рассмотрим модель с линейным характером тенденции и мультипликативным сезонным эффектом. Эта модель представляет собой объединение двухпараметрической модели линейного роста Хольта и сезонной модели Уинтерса, поэтому ее чаще всего называют моделью Хольта-Уинтерса.
Прогноз по модели Хольта-Уинтерса на τ шагов вперед определяется выражением:
Обновление коэффициентов осуществляется следующим образом:
Здесь - взвешенная сумма текущей оценки , полученной путем очищения от сезонных колебаний фактических данных и суммы предыдущих оценок . В качестве коэффициента сезонности берется его наиболее поздняя оценка, сделанная для аналогичной фазы цикла ().
Затем значение , полученное по первому уравнению, используется для определения новой оценки коэффициента сезонности по второму уравнению. Оценки модифицируются по процедуре, аналогичной экспоненциальному сглаживанию.
Оптимальные значения для П.Уинтерс предлагает находить экспериментальным путем, перебирая возможные комбинации этих параметров на сетке значений. Критерием сравнения при этом выступает средняя квадратическая ошибка.
Примером другого подхода – с аддитивной сезонностью – может служить модель сезонных явлений с линейным ростом, предложенная Г. Тейлом и С. Вейджем. Практическая значимость этой модели объясняется не только тем, что в экономических временных рядах довольно часто можно встретить этот тип динамики развития. Опыт проведения экспериментальных расчетов свидетельствует о том, что динамика многих экономических показателей может быть описана с помощью модели, сочетающей в себе экспоненциальную тенденцию с мультипликативным сезонным эффектом. Прологарифмировав исходный временной ряд, на практике часто преобразуют экспоненциальную тенденцию в линейную и одновременно мультипликативный сезонный эффект в аддитивный. Таким образом, динамику преобразованного показателя можно моделировать и прогнозировать с помощью модели Тейла-Вейджа.
Прогноз по этой модели на τ шагов вперед определяется выражением:
Обновление коэффициентов осуществляется следующим образом:
Прогнозные оценки в этих двух моделях получаются экстраполяцией тенденции линейного роста на основе последних значений коэффициентов и , а также добавлением (в виде сомножителя или слагаемого) самой свежей оценки сезонного эффекта для этой фазы цикла ( или ). Это справедливо для случая, когда время упреждения удовлетворяет условию .
Таким образом, прогнозные оценки есть функция прошлых и текущих уровней временного ряда, параметров адаптации , а также начальных значений коэффициентов ( и ) и сезонного фактора для каждой фазы цикла. В качестве и на практике берут МНК-оценки коэффициентов линейного тренда , определенные по исходному временному ряду или его части. Начальные значения сезонного фактора для аддитивной модели определяются усреднением отклонений фактических уровней от расчетных для каждой фазы цикла (например, для одноименных месяцев или кварталов), для мультипликативной модели – усреднением частного от деления фактических уровней на расчетные для каждой фазы цикла.
8. Модели стационарных и нестационарных временных рядов и их идентификация
После исключения из наблюдаемых значений ряда систематических неслучайных компонент, соответствующих тренду и сезонным колебаниям, остается ряд случайных остатков. Задачей изучения случайных временных рядов является построение моделей таких рядов и их идентификация.
8.1. Стационарные ряды
Пусть - функция совместного распределения любых k последовательных величин ряда.
Считается, что ряд является стационарным в узком смысле (или строго стационарным), если функция распределения F не зависит от момента t при любых целых k>0, т.е. для любых целых k, t, m.
Таким образом, если ряд строго стационарный, то любые k последовательных членов ряда имеют одинаковое совместное распределение независимо от их положения в ряде. Очевидно, что в этом случае отдельные члены ряда также распределены одинаково.
Не зависят от времени и основные статистические характеристики случайных членов стационарного ряда:
• математическое ожидание
• дисперсия ,
• ковариация
Говорят, что временной ряд является стационарным в широком смысле, если постоянны только математическое ожидание и дисперсия членов ряда.
Ковариация между любыми двумя членами одного и того же ряда называется автоковариацией.
Можно также определить автокорреляцию, причем :
Совокупность коэффициентов называется коррелограммой ряда.
8.2. Модели авторегрессии
Модели авторегрессии – это класс моделей временных рядов, в которых текущее значение моделируемой переменной задается функцией от прошлых значений самой этой переменной.
8.2.1. Модель авторегрессии первого порядка
Простейшая модель автокоррелированного стационарного ряда, которая часто используется на практике, имеет вид:
где ε – случайная величина с нулевым средним, величины и некоррелированы между собой при , дисперсия .
Такая модель называется моделью авторегрессии первого порядка (АР(1) или AR(1)).
Свойства данной модели:
Следовательно, коэффициент α можно найти по формуле:
8.2.2. Модель авторегрессии второго порядка (АР(2) или AR(2))
Модель авторегрессии второго порядка записывается в виде:
где относительно последовательности ε сохраняются сделанные ранее предположения.
Система уравнений, связывающая параметра процесса AR(2) со значениями его автокорреляционной функции, называется уравнениями Юла-Уолкера:
Решая эту систему относительно параметров, находим:
Используя формулу , находим оценки коэффициентов.
8.2.3. Модель авторегрессии порядка р (АР(р) или AR(p))
В общем виде модель авторегрессии порядка р описывается уравнением:
или
Система уравнений Юла-Уолкера записывается в виде:
или в векторно-матричной форме:
где , ,
Решение системы существует, если матрица R невырождена, и его можно записать в виде:
Задача оценивания параметров авторегрессии по существу аналогична оцениванию параметров множественной линейной регрессии по методу наименьших квадратов, а значит, свойства оценок будут аналогичны: несмещенность, состоятельность, эффективность.
8.2.4. Выбор порядка авторегрессионной модели
Для того, чтобы адекватно установить порядок авторегрессионной зависимости, необходимо рассчитать характеристики процесса, которые называются частными автокорреляциями (частными автокорреляционными функциями, ЧАКФ).
Частные автокорреляционные функции отражают степень статистической зависимости (корреляции) между наблюдениями и , когда влияние на промежуточных членов ряда устранено.
ЧАКФ, отражающая зависимость членов ряда и при исключении влияния промежуточного значения , определяется по формуле:
Иногда ЧАКФ обозначают , где k – лаг.
Для лага, равного 1, коэффициента автокорреляции и частной автокорреляции совпадают, т.е. .
Для лага, равного 2, частный коэффициент автокорреляции составит:
Свойства:
1. Для любого k
2. Если рассматриваемый стационарный процесс является AR(p) процессом, то все при k>p.
Таким образом, в качестве предварительного порядка модели AR(p) можно рассматривать такое число р, начиная с которого все последующие оценки выборочной частной автокорреляционной функции отклоняются от нуля не более чем на для всех k>p.
Окончательный подбор порядка модели AR(p) процесса связан со статистической значимостью полученных коэффициентов модели и детальным изучением поведения остатков, получаемых вычитанием из исходного ряда значений подобранной AR(p)-модели . Если полученные остатки модели ведут себя как белый шум, то процесс подбора модели можно считать завершенным. В противном случае следует изменить порядок подбираемой модели или перейти к более сложным комбинированным моделям авторегрессии – скользящего среднего.
8.2.5. Прогнозирование в модели AR(p)
В модели AR(1) прогноз на один шаг равен:
Прогноз на два шага будет составлять:
Аналогично на τ шагов:
В модели AR(2) текущее значение зависит от двух предыдущих, поэтому прогноз на один шаг будет равен:
Прогноз на два шага записывается так:
Прогноз на τ шагов получается по следующей рекуррентной формуле:
В общем виде для AR(p) прогноз на τ шагов:
8.3. Модели скользящего среднего
Модели скользящей средней – это класс моделей временных рядов, в которых моделируемая величина задается функцией от прошлых ошибок.
8.3.1. Модель скользящего среднего первого порядка (СС(1) или MA(1))
Модель скользящего среднего первого порядка записывается в виде:
где для удобства второй член взят со знаком минус. Следует оценить параметр β. Автокорреляционная функция процесса первого порядка равна:
Оценивание параметра β сводится к решению квадратного уравнения:
Данное уравнение имеет два корня, причем согласно теореме Виета, произведение этих корней равно единице. В качестве оценки параметра β следует взять корень данного уравнения, по модулю меньший, чем единица. Это связано с условиями стационарности процесса.
8.3.2. Модель скользящего среднего второго порядка (СС(2) или MA(2))
Уравнение модели скользящего среднего второго порядка записывается в виде:
Автокорреляционная функция связана с параметрами модели следующими соотношениями:
8.3.3. Модель скользящего среднего порядка q (СС(q) или MA(q))
Модель скользящего среднего порядка q в общем виде записывается следующим образом:
Для автокорреляции имеет место выражение:
Таким образом, автокорреляции процесса скользящего среднего порядка q эквивалентны нулю для всех j>q. Данный факт учитывается при подборе порядка модели по наблюдаемым данным.
Общая схема построения оценок параметров аналогична той, которая применялась при оценивании моделей авторегрессии, и складывается из следующих шагов:
1. по наблюдениям вычисляем выборочные оценки автокорреляций процесса для всех ;
2. составляем систему q уравнений относительно q неизвестных параметров β, в которой вместо теоретических значений автокорреляций стоят их оценки ;
3. решаем полученную систему уравнений относительно неизвестных параметров и получаем их оценки.
8.3.4. Прогнозирование в модели MA(q)
В модели MA(q) прогноз возможен лишь максимум на q шагов вперед. При прогнозировании в модели MA(q) по конечному числу наблюдений, формула прогнозного значения при произвольном значении q является очень сложной. Однако для случая q=1 точную формулу можно вывести.
8.4. Модели авторегрессии – скользящего среднего
Более полное и точное название моделей, рассмотренных в данном разделе – модели авторегрессии со скользящим средним в качестве ошибок. Данные модели являются естественным обобщением моделей авторегрессии и скользящего среднего.
8.4.1. Модель авторегрессии - скользящего среднего порядков р и q
Такая модель имеет вид:
Отметим основные принципиальные моменты, касающиеся анализа и оценивания моделей АРСС(р,q) или ARMA(p,q):
1. Текущие значения ряда не зависят от будущих значений ошибок.
2. Процесс авторегрессии - скользящего среднего будет стационарным тогда и только тогда, когда стационарным является процесс авторегрессии вида:
,
где .
Для стационарности процесса AR(p) – процесса необходимо и достаточно, чтобы корни его характеристического уравнения
лежали вне единичного круга (по модулю были больше единицы).
3. Процесс авторегрессии - скользящего среднего будет обратимым, если таковым является процесс скользящего среднего вида:
где . Для обратимости MA(q) – процесса необходимо и достаточно, чтобы корни его характеристического уравнения
лежали вне единичного круга (по модулю превышали единицу). Условие обратимости обеспечивает физическую реализацию процесса.
4. Процедура определения оценок параметров ARMA(p,q) – модели носит итерационный характер и включает этап численного решения системы нелинейных уравнений.
8.4.2. Модель авторегрессии - скользящего среднего порядка 1,1
Эта модель достаточно широко используется в практике эконометрических исследований:
Значения коэффициентов автокорреляции модели ARMA(1,1) подчиняются экспоненциальному закону:
, где
Прогнозное значение на τ шагов вперед определяется по формуле:
8.5. Форма функций автокорреляции и частной автокорреляции стандартных процессов
Модель
АКФ
ЧАКФ
«Белый шум», МА(0)
для
для
AR(1),
Экспоненциальное убывание,
, ,
AR(1),
Осциллирующее убывание,
, ,
AR(p)
Убывание к нулю с возможной осцилляцией
Зануление при
MA(1),
Положительный пик при ; зануление при
Осциллирующее убывание;
MA(1),
Отрицательный пик при ; зануление при
Убывание по абсолютной величине; при
MA(q)
Зануление при
Убывание к нулю с возможной осцилляцией
ARMA(1,1),
Экспоненциальное убывание с лага 1; знак совпадает со знаком
Осциллирующее убывание с лага 1;
ARMA(1,1),
Осциллирующее убывание с лага 1; знак совпадает со знаком
Экспоненциальное убывание с лага 1; ; знак совпадает со знаком ,
ARMA(p,q)
Осциллирующее или прямое убывание, начинающееся с лага q
Осциллирующее или прямое убывание, начинающееся с лага p
8.6. Анализ нестационарных временных рядов
Модель нестационарных временных рядов – модель авторегрессии - интегрированного скользящего среднего – также известна как модель Бокса – Дженкинса. Класс ARIMA или АРИСС – моделей предназначен для описания нестационарных процессов, последовательные разности (соответствующего порядка) которых являются стационарными процессами.
Если последовательные разности k-го порядка , полученные из исходного ряда (путем применения к исходному ряду k раз оператора взятия последовательной разности) представляют собой ARMA(p,q) – процесс, то процесс называется процессом авторегрессии – интегрированного скользящего среднего с параметрами p, q, k или сокращенно – ARIMA(p,q,k).
Отличительной особенностью ARIMA – процессов является то, что их, путем взятия последовательных разностей, можно свести к ARMA – процессам.
8.6.1. Основные этапы построения ARIMA – моделей:
1. Преобразование исходного ряда и приведение его к стационарному (предполагается вычисление последовательных разностей и тестирование получающихся рядов из разностей на стационарность). На практике чаще всего анализируемый ряд сводится к стационарному после вычисления последовательных разностей максимум второго порядка.
2. После получения стационарного ряда подбирается соответствующая авторегрессионная или ARMA(p,q) – модель для его описания. При этом следует стремиться к выбору наиболее простой модели с наименьшими значениями параметров p и q.
3. На третьем этапе решается задача оценивания коэффициентов подобранной ARMA – модели.
8.6.2. Прогнозирование нестационарных рядов с использованием ARIMA - моделей
Рассмотрим метод прогнозирования на примере ARIMA(1,0,1) – процесса. Первые разности рассматриваемого ряда подчиняются уравнению:
Запишем равенство:
Далее выразим значения , через , используя уравнение авторегрессии, и подставим получившиеся выражения:
где
Оптимальный в смысле минимума среднеквадратичной ошибки прогноз значения ряда в момент по наблюдениям ряда до момента t определяется по формуле:
при этом ошибка прогноза равна . Дисперсия ошибки рассчитывается по формуле: , откуда видно, что она повышается по мере увеличения τ, что вполне естественно, потому что точность прогноза ухудшается с ростом его горизонта.
9. Проверка адекватности и точности моделей
Независимо от вида и способа построения экономико-математической модели вопрос о возможности ее применения в целях анализа и прогнозирования экономического явления может быть решен только после установления адекватности, то есть соответствия модели исследуемому процессу или объекту. Так как полного соответствия модели реальному процессу или объекту быть не может, адекватность – в какой-то мере условное понятие. При моделировании имеется в виду адекватность не вообще, а по тем свойствам модели, которые считаются существенными для исследования.
9.1. Проверка адекватности модели
Основным предположением модели является то, что остатки модели являются случайной компонентой, то есть случайность колебаний уровней остаточной компоненты, нормальный закон распределения остатков, равенство математического ожидания случайной компоненты нулю, независимость уровней случайной компоненты.
9.1.1. Проверка случайности колебаний уровней остаточной последовательности
Для исследования случайности отклонений рассмотрим набор разностей:
()
Характер этих отклонений изучается с помощью ряда непараметрических критериев. Одним из таких критериев является критерий серий, основанный на медиане выборки. Ряд из величин располагают в порядке возрастания их значений и находят медиану полученного вариационного ряда, то есть срединное значение при нечетном n или среднюю арифметическую из двух серединных значений при n четном. Возвращаясь к исходной последовательности и, сравнивая значения этой последовательности с , будем ставить знак «плюс», если значение превосходит медиану, и знак «минус», если оно меньше медианы; в случае равенства сравниваемых величин соответствующее значение опускается. Таким образом, получается последовательность, состоящая из плюсов и минусов, общее число которых не превосходит n. Последовательность подряд идущих плюсов или минусов называется серией. Для того чтобы последовательность была случайной выборкой, протяженность самой длинной серии не должна быть слишком большой, а общее число серий – слишком малым.
Обозначим протяженность самой длинной серии через , а общее число серий – через . Выборка признается случайной, если выполняются следующие неравенства для 5%-го уровня значимости:
где квадратные скобки обозначают целую часть числа.
Если хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере отклонений уровней временного ряда отвергается, то есть модель будет неадекватной.
Другим критерием для данной проверки может служить критерий пиков (поворотных точек). Уровень последовательности считается максимумом, если он больше двух рядом стоящих уровней, то есть , и минимумом, если он меньше обоих соседних уровней, то есть . В обоих случаях считается поворотной точкой; общее число поворотных точек для остаточной последовательности обозначим через p.
В случайной выборке математическое ожидание числа точек поворота и дисперсия выражаются формулами:
; .
Критерием случайности с 5%-ным уровнем значимости, то есть с доверительной вероятностью 95%, является выполнение неравенства
где квадратные скобки означают целую часть числа. Если неравенство не выполняется, то полученная модель считается неадекватной.
9.1.2. Проверка соответствия распределения остаточной последовательности нормальному закону распределения
Так как временные ряды, как правило, не очень велики, такая проверка может быть проведена лишь приближенно с помощью исследования показателей асимметрии () и эксцесса (). При нормальном распределении показатели асимметрии и эксцесса некоторой генеральной совокупности равны нулю. Предполагается, что остатки представляют собой выборку из генеральной совокупности, поэтому можно определить только выборочные характеристики асимметрии и эксцесса и их ошибки:
,
,
В этих формулах - выборочная характеристика асимметрии; - выборочная характеристика эксцесса; и - соответствующие среднеквадратические ошибки.
Если одновременно выполняются следующие неравенства:
,
то гипотеза о нормальном характере распределения остатков принимается. Если хотя бы одно из неравенств не выполняется, то гипотеза о нормальном распределении отвергается и модель признается неадекватной.
Кроме рассмотренного метода известен ряд других методов проверки нормальности закона распределения случайной величины: метод Вестергарда, RS-критерий и т.д. Рассмотри один из наиболее простых критериев, основанный на RS-критерии. Этот критерий численно равен отношению размаха вариации случайной величины R к стандартному отклонению S:
,
Вычисленное значение RS-критерия сравнивается с табличными (критическими) нижней и верхней границами данного отношения, и если это значение не попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о нормальном распределении отвергается; в противном случае эта гипотеза принимается. При уровне значимости 5% критические границы составляют:
n=10
n=20
n=30
нижняя
3,685
4,49
4,89
верхняя
2,67
3,18
3,47
9.1.3. Проверка равенства математического ожидания остатков нулю
Если остатки распределены по нормальному закону распределения, то проверка равенства нулю математического ожидания осуществляется на основе t-критерия Стьюдента. Расчетное значение этого критерия задается формулой:
где - среднее арифметическое значение уровней остаточной последовательности ;
- стандартное (среднеквадратическое) отклонение остатков.
Если расчетное значение t меньше табличного статистики Стьюдента с заданным уровнем значимости α и числом степеней свободы n-1, то гипотеза о равенстве нулю математического ожидания остатков принимается, в противном случае эта гипотеза отвергается и модель считается неадекватной.
9.1.4. Проверка независимости значений уровней остатков
Проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является критерий Дарбина-Уотсона.
Расчетное значение критерия DW сравнивается с табличными.
Интервал
Вывод
Отрицательная корреляция
Неопределенность
Отсутствие автокорреляции
Отсутствие автокорреляции
Неопределенность
Положительная корреляция
9.2. Оценка точности модели
Для адекватных моделей имеет смысл ставить задачу оценки их точности. Точность модели характеризуется величиной отклонения выхода модели от реального значения моделируемой переменной (экономического показателя). Для показателя, представленного временным рядом, точность определяется как разность между значением фактического уровня временного ряда и его оценкой, полученной расчетным путем с использованием модели, при этом в качестве статистических показателей точности применяются следующие:
• среднеквадратическое отклонение
• среднее абсолютное отклонение, MAD
• средняя относительная ошибка в процентах, MAPE
• коэффициент сходимости
• коэффициент детерминации
• скорректированный коэффициент детерминации
• Байесовский информационный критерий Шварца
• информационный критерий Акайка
• информационный критерий Хеннана-Куинна
• качество прогноза (p – число прогнозов, подтвержденных фактическими данными; q – число прогнозов, не подтвержденных фактическими данными)
в приведенных формулах n – количество уровней ряда, k – число определяемых параметров модели, - оценка уровней ряда по модели, - среднее значение уровней ряда.
Скорректированный коэффициент детерминации, критерий Шварца и информационный критерий Акайка могут применяться для сравнения модели с разным количеством регрессоров.
Данные показатели точности моделей рассчитываются на основе всех уровней временного ряда и поэтому отражают лишь точность аппроксимации.
9.3. Ex post прогноз
Для расчета прогнозных свойств модели целесообразно использовать так называемый ретроспективный прогноз (прогноз ex post).
Следует отметить, что прогнозировать можно не только будущие значения, но и любые величины, не входящие в набор исходных данных. Исходные данные разбиваются на две группы, так чтобы во второй группе находились более поздние данные, составляющие обычно примерно 15% всей информации. Эти данные будут затем использоваться для тестирования. Строится модель для первой группы данных и с ее помощью определяется прогноз на один период. При этом мы сравниваем полученные значения с имеющейся информацией (второй группой данных). С каждым шагом прогнозирования уменьшаем вторую группу и увеличиваем первую на один уровень временного ряда. Таким образом, коэффициенты модели с каждым шагом меняется, поскольку модель определяется полным набором данных. Такой процесс называется рекурсивным ex post прогнозированием, в отличие от нерекурсивного, когда уравнение, полученное по данным первой группы, остается неизменным. Далее изучается стабильность изменения коэффициентов модели.
Для оценки ошибок ex post прогнозов используется коэффициент неравенства Тейла:
где Т – число ex post прогнозов.
В ex ante прогнозе эндогенная переменная находится за пределами расчетного периода и для ее прогноза используется знание независимых переменных, часто неизвестных. На рисунке представлено соотношение двух видов прогнозов, где - настоящий момент времени.
9.4. Интервальный прогноз
Очевидно, что совпадение фактических данных в будущем и прогностических точечных оценок маловероятно. Поэтому точечный прогноз обычно сопровождается интервалом, в котором с достаточной долей уверенности можно ожидать появления прогнозируемой величины. Установление такого интервала называется интервальным прогнозом.
Интервальный прогноз на базе кривых роста осуществляется путем расчета доверительного интервала.
Стандартная (средняя квадратическая) ошибка оценки прогнозируемого показателя определяется по формуле:
,
где - фактическое значение уровня временного ряда для времени t;
- расчетная оценка соответствующего показателя по модели;
n – количество уровней в исходном ряду;
k – число параметров модели.
В случае прямолинейного тренда для расчета доверительного интервала используется следующая формула:
где L – период упреждения;
- точечный прогноз модели на (n+L)-й момент времени;
n – количество наблюдений во временном ряду;
- стандартная ошибка оценки прогнозируемого показателя, рассчитанная для числа параметров модели, равного двум;
- табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2.
Иногда для расчета доверительных интервалов прогноза относительно линейного тренда применяют данную формулу в несколько преобразованном виде:
Здесь t – порядковый номер уровня ряда, - время для которого делается прогноз, - время, соответствующее середине периода наблюдения для исходного ряда. Эту формулу можно упростить, если перенести начало отсчета времени на середину периода наблюдений ().
Формула для расчета доверительных интервалов прогноза относительно тренда, имеющего вид полинома второго или третьего порядка, выглядит следующим образом:
Аналогично вычисляются доверительные интервалы для экспоненциальной кривой роста, а также для кривых роста, имеющих асимптоту, если значение асимптоты известно.
10. Прогнозирование на основе регрессионной модели
Прогнозы на основе регрессионной модели можно разделить на условный и безусловный прогнозы.
10.1. Безусловный прогноз
Безусловный прогноз – это либо ex post, либо ex ante прогнозы с лаговыми переменными. Однако безусловный прогноз может быть результатом не только регрессионной модели на лаговых переменных. Существуют медленно меняющиеся процессы, как, например, параметры половозрастной структуры населения на будущие 6 месяцев. Конечно, целесообразно использовать независимые переменные, которые легко и точно прогнозируются.
Рассмотрим уравнение парной регрессии:
, ,
Постановку задачи в этом случае можно сформулировать следующим образом: каким будет наилучший прогноз при условии, что параметры модели a и b точно оценены, а значение известно.
Тогда прогнозное значение можно вычислить по формуле:
Ошибка прогноза:
Ошибка прогноза обладает двумя свойствами:
1. - это значит, что оценка будет несмещенной.
2. Дисперсия ошибки прогноза , она минимальна среди всех возможных оценок, основанных на линейных уравнениях.
Хотя a и b известны, ошибка прогноза появляется за счет того, что может не лежать на линии регрессии из-за ошибки , которая нормально распределена . Для проверки качества прогноза вводится нормализованная величина:
Тогда можно определить 95%-ный доверительный интервал:
причем берется из таблицы нормального распределения. Границы 95%-ного интервала можно определить как
Следует отметить, что величина доверительного интервала не зависит от величины Х.
Можно получит плохой прогноз по хорошей с точки зрения модели и, наоборот, - хороший прогноз при плохой модели. Первое может быть в случае серьезных структурных изменений, произошедших за этот период. Второй случай может быть результатом слабо изменяющейся динамики объясняемой переменной, т.е. когда эту переменную легко прогнозировать.
Полученные доверительные интервалы дают простой способ оценки качества прогноза: если выходит за пределы интервала, то прогноз плохой и, следовательно, нужно пересмотреть модель.
Обычно параметры регрессии не бывают точно известными, также как дисперсия, которая тоже является случайной. Рассмотрим задачу, когда нужно оценивать не только параметры регрессии, но и дисперсию ошибки прогноза.
Пусть истинная модель имеет вид: .
Оцененная модель:
и
Тогда ошибка прогноза определяется как
Можно говорить о двух источниках ошибок:
1.
2.
так как - несмещенные оценки, - известно.
В представленных выражениях суммирование выполняется по всем значениям от 1 до Т.
Полученное выражение показывает, что дисперсия ошибки прямо зависит от . Кроме того, чем больше длина ряда Т и чем больше дисперсия Х, тем точнее прогноз. С другой стороны, ошибка прогноза уменьшается, если значение близко к , т.е. если объясняющая переменная близка к среднему значению. Чем дальше от привычных значений эта переменная, тем менее точен прогноз.
После оценки стандартной ошибки прогноза можно оценить доверительный интервал с учетом того, что
,
поскольку - неизвестна, вместо нее оценивается выборочная дисперсия:
Оценку дисперсии прогноза можно получить по следующей формуле:
При этом нормированная ошибка будет иметь t-распределение с Т-2 степенями свободы.
Тогда 95%-ные доверительные границы интервального прогноза будут определяться следующим образом:
Можно заметить, что ошибка увеличивается по мере роста удаленности точки прогноза от настоящего времени – чем дальше, тем менее надежен прогноз. Это понижение надежности возникает из-за удаления от .
10.2. Прогноз при автокорреляции остатков
Часто в значениях экономических временных рядов присутствует эффект автокорреляции и это несколько осложняет прогнозирование. Рассмотрим модель парной регрессии, переменные которой содержат автокорреляцию первого порядка.
где ;
;
Информация о наличии автокорреляции остатков дает возможность улучшить прогноз. Раньше полагалось, что математическое ожидание остатков нулевое , а теперь этого полагать нельзя в силу автокорреляции. Можно показать, что в этом случае дисперсия прогноза равна , т.е. ошибка прогноза при учете автоковариации остатков меньше, чем если этот факт не учитывать:
так как .
Для прогноза же рекомендуется использовать уравнение регрессии в обобщенной форме, полученное из исходного заменой переменных:
При большом объеме выборки среднее значение ошибок модели будет стремиться к нулю.
10.3. Условный прогноз
Условный прогноз – это когда независимые переменные точно неизвестны. Интуитивно понятно, что прогноз независимой переменной сделает прогноз зависимой переменной менее надежным.
, ,
где ; , , и - некоррелированы, т.е. нет корреляции между оценками параметров a, b и .
Прогноз:
Ошибка прогноза:
Математическое ожидание ошибки равно нулю.
β – параметр модели .
Последние члены в выражении для увеличивают дисперсию прогноза. Кроме того, очень сложно описать доверительный интервал для условного прогноза. Дело в том, что величина уже не распределена по нормальному закону, так как представляет собой сумму произведений нормально распределенных переменных. Поэтому доверительные интервалы не могут быть рассчитаны аналитически. Предлагается следующая приближенная процедура оценки доверительного интервала:
1. Рассчитывается 95%-ная граница доверительного интервала, связанного с :
2. Определяется доверительный интервал, перекрывающий оба интервала.
С учетом таких особенностей условного прогноза, даже в случае высокого качества регрессионных модели прогноз может быть не очень хорошим.
11.
Литература
1. Айвазян С.А. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. – Т.2: Айвазян С.А. Основы эконометрики. – М.: ЮНИТИ-ДАНА, 2001.
2. Андерсон Т. Статистический анализ временных рядов. Пер. с англ. – М.: Изд-во «МИР», 1976.
3. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. — М.: Финансы и статистика, 2001.
4. Бестужев-Лада И.В., Наместникова Г.А. Социальное прогнозирование. Курс лекций. – М.: Педагогическое общество России, 2002.
5. Бокс, Дж., Дженкинс, Г. Анализ временных рядов. Прогноз и управление. Выпуск 1. Пер. с англ. – М.: Изд-во «МИР», 1974.
6. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows. Основы теории и интенсивная практика на компьютере: Учебн. пособие. –М.: Финансы и статистика, 1995.
7. Домбровский В.В. Эконометрика: учебник. – М.: Новый учебник, 2004.
8. Доугерти К. Введение в эконометрику: Пер. с англ. – М.: ИНФРА-М, 2001.
9. Дуброва Т.А. Статистические методы прогнозирования. – М.: ЮНИТИ-ДАНА, 2003.
10. Лапыгин Ю.Н. Экономическое прогнозирование: учеб. пособие – М.: Эксмо, 2009. – 256 с.
11. Лугачев М.И., Ляпунцов Ю.П. Методы социально-экономического прогнозирования. – М.: Экономический факультет МГУ, ТЕИС, 1999.
12. Луговская Л.В. Эконометрика в вопросах и ответах. – М.: ТК Велби, Изд-во Проспект, 2006.
13. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. – М.: Финансы и статистика, 2003.
14. Лукашин Ю.П. Регрессионные и адаптивные методы прогнозирования. – М.: МЭСИ, 1997.
15. Льюис Х.Д. Методы прогнозирования экономических показателей – М.: Статистика, 1986.
16. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. – М.: Дело, 2000.
17. Мотышина М.С. Методы социально-экономического прогнозирования. – СПб.: Изд-во СПбУЭФ, 1994.
18. Найденков В.И. Прогнозирование и моделирование национальной экономики (конспект лекций). – М.: - «Приор-издат», 2004.
19. Ромашова И.Б. Прогнозирование в системе управления современным предприятием: Монография. – Н.Новгород: Издательство Нижегородского университета, 2000.
20. Салманов О.Н. Эконометрика: учеб. пособие. – М.: Экономистъ, 2006.
21. Слуцкин Л.Н. Курс МВА по прогнозированию в бизнесе. – М.6 АЛЬПИНА Бизнес Букс, 2006.
22. Экономико-математические методы и прикладные модели. Под ред. В.В. Федосеева. – М.:ЮНИТИ-ДАНА, 2005.