Анализ временных рядов

👀 409 просмотров
📌 383 загрузки

Выбери формат для чтения

Конспект лекции по дисциплине «Анализ временных рядов», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Анализ временных рядов», Word формат

1 Анализ временных рядов 1.1 Компоненты временного ряда Под временным рядом (динамическим рядом) понимается ряд значений некоторого показателя, взятых по состоянию на определенные моменты или периоды времени. Количественные значения показателя во временном ряду называются уровнями. Уровни расположены в хронологическом порядке, обычно через равные промежутки времени. Если они агрегированы так, что отражают состояние показателя на некоторые периоды времени, то такой ряд называется интегральным. В качестве таких периодом могут выступать, например, годы , кварталы, месяцы, недели. Моментные временные ряды характеризуют состояние показателя на короткий промежуток времени, например день, час и т.д. Временные ряды отражают динамику социально-экономических явлений. Если уровни временного ряда формируются под влиянием факторов и условий, которые будут незначительно изменяться в будущем, то такой временной ряд можно использовать для прогнозирования. При этом его методологической основой будет экстраполяция, т.е. перенесение в будущее тенденций, которые сформировались в прошлом. Действия факторов, влияющих на величины уровней временного ряда, носят различный временной характер. Влияние одних факторов проявляется постоянно в течении продолжительных промежутков времени, влияние других – периодически, с разной длинной периода. Некоторые факторы проявляют себя случайно и нерегулярно. В этой связи каждый уровень временного ряда можно рассматривать как результат наложения компонент, имеющих разный временной характер действия. Метод анализа временного ряда заключается в выделении этих компонент. Среди компонент временного ряда выделяют: тренд, циклическую компоненту, сезонную компоненту и нерегулярную компоненту (рис.1). Рис. 1.1. Компоненты временного ряда Под трендом понимается долгосрочная составляющая, характеризующая общую тенденцию изменения временного ряда в течение длительного периода времени. Под тенденцией понимается возрастание или убывание уровней временного ряда (рис 1, а). Факторами, порождающими тренд, могут быть, например, изменение состава населения, рост производства, рост цен и т.д. Циклическая компонента характеризует повторяющиеся волнообразные изменения длительностью более 1 года. Она отражает цикл деловой активности, периоды подъема и спада. Длина цикла, т.е. время между соседними максимумами( или соседними минимумами) может колебаться от 1 года до 15 - 25 лет (а иногда до 50 – 70 лет, пример- волны Кондратьева). Циклическая компонента определяется изменением остатков, т.е. разницей между трендом и фактическими значениями уровней ряда вдоль линии тренда (рис. 1, б). Сезонная компонента так же носит циклический характер. Она характеризует изменения, регулярно повторяющиеся и завершаемые в пределах года (рис. 1, в). Например, сезонным фактором являются погодные условия, соответствующие какому-либо времени года, т.к. влияют на продажи потребительских товаров. Нерегулярная компонента отражает быстрые изменения, как правило, малой длительностью (рис. 1, г). Они вызываются непредсказуемыми или редкими событиями: природными катаклизмами, войной, эпидемией, сменой власти и т.д. (типичный пример – цены на акции). Основная задача анализа временных рядов заключается в определении каждой компоненты и исключение её воздействий на уровни временного ряда. Этот процесс называется декомпозицией или разложением временного ряда (его геометрическая интерпретация представлена на рис. 1). Формально модель декомпозиции временного ряда можно представить в виде уравнения : y=TR×C×S×I (1) y- уровень временного ряда; TR-тренд; C-циклическая компонента; S-сезонная компонента; I-нерегулярная компонента. Модель (1) называется моделью с мультипликативной структурой. Она строится на предположении о том, что любой уровень временного ряда является произведением воздействующих компонент. В анализе временных рядов рассматривается также альтернативный подход к агрегированию компонент – каждый уровень представляется как сумма воздействующих компонент: y=TR+C+S+I (2) При допущении модели (2) вклад сезонной компоненты остаётся постоянным с течением времени для данной части года. Для мультипликативной модели (1) абсолютная величина сезонной колеблемости возрастает по мере роста уровней временного ряда. Эта модель чаще используется на практике, её мы и будем рассматривать. 1.2 Анализ тренда Тренд является долгосрочной составляющей временного ряда. При анализе тренда независимой переменной x является время, а зависимой y – уровень временного ряда. Вид тренда можно выявить, если построить график временного ряда, откладывая на оси абсцисс периоды времени, а на оси ординат – значения уровней. Визуальный анализ расположения точек графика помогает сделать вывод о форме сглаживающей линии. Если тренд окажется линейным, то для вычисления параметров уровня применяется метод наименьших квадратов. При нелинейном тренде его также можно использовать, проделав соответствующие преобразования переменных. Пусть рассматривается линейный тренд: (3) где t – время (независимая переменная); – оценка уровня временного ряда (зависимая переменная) Геометрически это означает, что нужно подобрать такую прямую, которая наилучшим образом сглаживала бы точки корреляционного поля. Корреляционным полем называют диаграмму рассеяния, когда на координатной плоскости по оси абсцисс откладывается значение факторного показателя, а по оси ординат – соответствующее значение результативного показателя. Если y – зависимая переменная, а t – независимая, то нахождение зависимости y от t будем называть определением регрессии y на t. Ниже на рис. 1(а) представлена искомая линия регрессии, на которую из каждой точи корреляционного поля опущены отрезки, перпендикулярные оси t. Рис. 1.а. Геометрическая инерпритация метода наименьших квадратов Длины отрезков характеризуют расстояние от точек до прямой регрессии. Пусть критерием наилучшей сглаживающей будет минимизация суммы квадратов рассеяний. min( (4) Прямая, построенная по критерию (4), будет линией регрессии, полученной методом наименьших квадратов. Рассмотрим аналитическую процедуру метода наименьших квадратов. Пусть имеется совокупность из n пар наблюдений: (), (), … (). Найдем для уравнения регрессии в виде линейного тренда параметры и . Для этого запишем сумму квадратов расстояний (S) в виде: S = (5) Будем рассматривать S как функцию двух переменных и ; найдем также их значения, которые минимизируют сумму квадратов расстояний. Для этого продифференцируем выражение (5) отдельно по и и приравняем частные производные к нулю: (6) Из уравнений (6) следует система так называемых нормальных уравнений: (7) (8) Неизвестные значения и находятся как решения системы нормальных уравнений (7) и (8): (9) (10) Пусть тренд строится на основе последовательных годовых данных (например, t = 1990, 1991, 1992, …). Для удобства перенумеруем значения: t = 1, 2, 3 … . Обозначим: – наблюденное значение временного ряда за период t и T – общее число наблюдений во временном ряду (длина временного ряда). Тогда формулы (9) и (10) преобразуются к виду: (11) , (12) где Прогнозный год следует нумеровать по той же системе. Если t = T – последний год в ряду наблюдений, на основе которых было получено уравнение (3), то прогнозируя в году T на k лет вперед, следует в уравнение (3) подставить значение t = T + k: = Пример: Имеются данные за ряд лет численности работников одной компании: Год Численность работников фирмы (тыс. чел) 1986 1,1 1987 2,4 1988 4,6 1989 5,4 1990 5,9 1991 8 19921 9,7 1993 11,2 Рис. 1.2. Временной ряд численности работников компании и сглаживающий линейный тренд На рис.1.2 явно просматривается линейный тренд. Найдем его параметры, используя формулы (11) и (12). Для этого закодируем значения независимой переменной t: t 1 2 = 2,4 3 = 4,6 4 5 = 5,9 6 7 = 9,7 8 Предварительно вычислим: =1+2+…+8 = 36 = ++…+=204 = 1,1 + 2,4 … + 11,2 = 48,3 =4,5 Подставляя эти результаты промежуточных вычислений в формулы (11) и (12), получим: = 1,4036 Отсюда уравнение тренда будет иметь вид: Спрогнозируем численность работников компании на 1994 г., полагая, что он соответствует t = T + 1 = 8 + 1= 9 Аналогичную процедуру перенумерации значений переменной t можно использовать при вычислении нелинейных трендов. Например, пусть требуется провести сглаживание временного ряда по параболе второго порядка: y = + + , В этом случае структура данных для исполнения МНК будет иметь вид: t 1 1 2 4 … … … T Система уравнений в этом случае записывается следующим образом: + Пример. Требуется проанализировать временной ряд потребления электроэнергии в регионе: Годы Потребление электроэнергии (млн.квт) 1984 95 1985 145 1986 174 1987 200 1988 224 1989 245 1990 263 1991 275 1992 283 1993 288 Рис. 1.3. Пример параболической зависимости: потребление электроэнергии в регионе (млн кВт) На основе анализа данных временного ряда и его графика можно сделать предположение о криволинейности тренда: с течением времени потребление электроэнергии растет при убывающем приросте. Так прирост с 1989 до 1990 г. был 18; с 1990 до 1991 – 12 (12<18); с 1991 до 1992 – 8 (8<12); с 1992 до 1993 – 5 (5<8). Убывающий (или возрастающий) во времени прирост свидетельствует о квадратической зависимости: y = + + . Закодируем и преобразуем переменные: t 95 1 1 145 2 4 174 3 9 … … … 288 10 100 На основе преобразованных данных с помощью, нпример, Excell, вычислим уравнение: y = 58,6+44,048t – 2,1212 Сделаем ретроспективный прогноз для t=2 (1985): y = 58,6+44,048*2 – 2,1212*4=138,2 Фактическое потребление электроэнергии в этот год составило 145 млн. квт. 1.3 Измерение циклической компоненты Практически любой временной ряд в бизнесе содержит элемент цикличности. Особенно цикличность присуща экономике, а также другим долговременным явлениям (например активность солнца). Одним из способов описания циклической компоненты является представление ее как доли тренда. Предположим, что рассматривается временной ряд, не содержащий сезонной составляющей. Например, таким будет ряд, основанный на годовых наблюдениях. В этом случае можно предположить, что каждый уровень ряда является произведением компонент: Пусть построена модель тренда , Тогда оценка цикличности компоненты получается делением значения уравнения временного ряда на величину тренда: Если нерегулярная составляющая оказывает незначительное влияние на уровни временного ряда (методы исключения изложены ниже в параграфе 6), то ею можно пренебречь. Отсюда оценкой циклической компоненты будет соотношение: . (13) Если >1, то фактическое значение уровня ряда будет больше, чем оценочное значение тренда. Это означает, что величина циклической компоненты находится где-то над линией тренда. Аналогично, при <1 значения циклической компоненты будет ниже линии тренда. Пример. В предыдущем примере на основе временного ряда численности работников фирмы был вычислен линейный тренд: где t = 1 соответствует 1986 г., t = 2 – 1987 г. и т.д. Определим циклическую компоненту. Для этого вычислим оценки при t = 1, 2, … , 8 и определим отношение (13). Результаты вычислений сведем в нижеследующую таблицу: t 1 1,1 1,125 0,977 2 2,4 2,529 0,949 3 4,6 3,933 1,169 4 5,4 5,337 1,012 5 5,9 6,741 0,875 6 8 8,145 0,982 7 9,7 9,549 1,016 8 11,2 10,953 1,022 Как видно, для первого периода оценка циклической компоненты равна 0,977. Это означает, что фактически значение уровня составляет 97,7% трендового значения. Аналогично для второго периода – 94,9%, для третьего – 116,9% и т.д. Флуктуация циклической компоненты вдоль тренда хорошо видна на рис. 1.4 Рис. 1.4. График циклической компоненты временного ряда численности работников Начало цикла характеризуется значением . Пик цикла приходится на t=3 (1988 г.), минимум – на t=5 (1990 г.) и завершение (когда опять ) – где-то между t=6 (1991 г.) и t=7 (1992 г.) Следует отметить, что на практике прогнозирование циклов является достаточно сложной задачей. Предсказать период цикла, используя данные временного ряда, практически невозможно. Выделение циклической компоненты может помочь при установлении стадий, на которой находится деловая активность. 1.4 Определение сезонной составляющей Сезонная компонента проявляется, когда временной ряд соответствует квартальным или месячным наблюдениям. Рассматриваем уровень ряда только как результирующую сезонности и тренда, т.е. представим его как произведение тренда и сезонной компоненты: (14) Из соотношения (14) видно, что сезонность можно рассматривать как индекс, который умножается на величину тренда. Этот индекс остается постоянным каждый год, для определенной части года. Например, если имеет место квартальная сезонность, то и т.д.; Способом вычисления индекса сезонности является метод отношения к центрированной скользящей средней (ЦСС). Проиллюстрируем его на конкретном примере. Пример. Ниже в таблице 1.1 приведены квартальные данные о продажах фирмы 1990-1993 гг. (в млн долларах), где в скобках указаны обозначения соответствующих уровней временного ряда. Квартальные данные об объемах продаж (млн. долл.) Таблица 1.1 Квартальные данные об объёме продаж (млн. долл.) Год 1 квартал 2 квартал 3 квартал 4 квартал 1990 20 () 12() 47() 60() 1991 40 () 32() 65() 76() 1992 56 () 50() 85() 100() 1993 75 () 70() 101() 123() Будем находить индекс сезонности для каждого квартала в течении года, т.е. вычислим четыре значения индекса. Идея метода отношения к центрированной скользящей средней (ЦСС) в том, что в начале на основе исходного временного ряда определяется новый временной ряд, не содержащий компоненту сезонности. Уровни нового ряда рассчитываются как центрированные скользящие средние. Для вычисления центрированных скользящих средних, определяются так называемые скользящие суммы (СС). Для квартальной сезонности первая скользящая сумма будет включать значения первых четырёх квартальных уровней исходного временного ряда: (1) = Во вторую скользящую сумму входят первые четыре уровня ряда сдвинутого на один квартал вперед: (2) = 12+47+60+40=159 Третья скользящая сумма определяется аналогично при сдвиге уровней на два квартала вперед: (3) = =47+60+40+32=179 Продолжая эту процедуру, получим 13 скользящих сумм, где последняя сумма вычисляется как: (13) = = 369 Таблица 1.2 Вычисление центрированных скользящих средних Год Квартал t Скользящая сумма Центрированная скользящая сумма Отношение к центрированной скользящей сумме 1990 1 1 20 - - - 2 2 12 139 - - 3 3 47 159 37,25 1,26 4 4 60 179 42,25 1,42 1991 1 5 40 197 47,00 0,85 2 6 32 213 51,25 0,62 3 7 65 229 55,25 1,18 4 8 76 247 59,50 1,28 1992 1 9 56 267 64,25 0,87 2 10 50 291 69,75 0,72 3 11 85 310 75,13 1,13 4 12 100 330 80,00 1,25 1993 1 13 75 346 84,50 0,89 2 14 70 369 89,38 0,78 3 15 101 - - - 4 16 123 - Каждая скользящая сумма будет относиться к моменту времени, находящемуся посередине между периодами, на основании которых она была рассчитана. Если на основании каждой скользящей суммы вычислить квартальные средние (т.е. скользящие средние, полученные делением скользящей суммы на 4), то полученные величины будут относиться к моментам между кварталами. Например, первая скользящая средняя соответствует моменту между t=2 и t=3, то есть t=2,5 (конец июня – начало июля 1990 г.). Аналогично вторая скользящая сумма относится к t=3,5 ( конец сентября – начало октября 1990 г.) и так далее. Для того, чтобы скользящая средняя относилась к периоду t (в данном случае к середине квартала t), следует вычислить двухлетние скользящие суммы (последовательно суммируя две соседние четырехквартальные скользящие суммы) и разделить их на 8. Например, вычислим первую скользящую квартальную среднюю, центрированную на середину квартала t=3: (139 + 159)/8 = 37,25 Аналогично для t=4 имеем: (159+179)/8 = 42,25 и т.д. С помощью данной процедуры вычисляются 12 центрированных скользящих средних, приведенных ранее в табл. 1.2. Понятно, что их расчёт для t=1,2 и t=15,16 невозможен. Заметим, что первые два значения из них соответствуют кварталам 1 и 2, а последние два – кварталам 3 и 4. В общем случае, если временной ряд содержит Т наблюдений, то для определения квартальной сезонности можно вычислить Т – 4 центрированных скользящих средних. Скользящая сумма и центрированные скользящие средние определяются суммированием за четыре квартала (сезона). Поэтому они не содержат уже сезонной составляющей. В результате усреднения снижается так же влияние нерегулярной компоненты . Чтобы отметить этот факт, будем нерегулярную компоненту обозначать малой буквой . Тогда можно записать: центрированная скользящая средняя (ЦСС) на момент t: * (15) Процедура получения центрированной скользящей средней, по существу, является сглаживанием временного ряда. Она позволяет установить существование тренда, а так же выявить его форму (прямая или кривая линия). ЦСС, представленные выше в таблице, характеризуют стабильно возрастающий тренд. Ввиду того, что разности между соседними средними почти одинаковы, тренд будет очень близок к линейному. Это можно наблюдать на рис. 1.5, приведённом ниже. Рис. 1.5. Сглаживание временного ряда объёмов продаж (ед.) на основе скользящих средних Для определения четырёх квартальных сезонных индексов следует разделить значение продаж фирмы (ед.) на основе скользящих средних каждого уровня yt на соответствующую центрированную скользящую среднюю. Исходя из (15)эта операция в символической форме будет иметь вид: т (16) Как видно, вычисление соотношения (16) выявляет сезонный эффект в совокупности с нерегулярной составляющей В упомянутой выше таблице 1.2 представлены отношения (16) для периодов t=3,4,5,…,14 Они определились следующим образом: t = 3: 47/37,25 = 1,26 (3 квартал 1990 г.); t = 4: 60/42,25 = 1,42 (4 квартал 1990 г.); t = 14: 70/89,38=0,78 (2 квартал 1993 г.). Сведем все 14 отношений по кварталам и вычислим средние значения по каждому кварталу ( табл. 1.3). Эти средние значения будем рассматривать в качестве соответствующих индексов. Таблица 1.3 Вычисление квартальных индексов сезонности 1 квартал 2 квартал 3 квартал 4 квартал - - 1,26 1,42 0,85 0,62 1,18 1,28 0,87 0,72 1,13 1,25 0,89 0,78 - - Сумма 2,61 2,12 3,57 3,95 Средняя 0,87(2,61/3) 0,707(2,12/3) 1,190(3,57/3) 1,317(3,95/3) Данная процедура позволяет значительно сократить эффект воздействия нерегулярной компоненты и получить практически в чистом виде квартальные индексы сезонности. Они имеют следующую интерпретацию: каждый индекс представляет собой отклонение среднего значения уровня по данному кварталу к общему среднеквартальному уровню временного ряда. Если значения индекса меньше 1, то средний объём продаж в данном квартале меньше ¼ среднегодового объёма продаж за все периоды временного ряда. Если индекс больше 1, то средний объём продаж в данном квартале превышает ¼ среднегодового объёма продаж. В случае, когда индекс равен 1, средний объём продаж по кварталу в точности равен ¼ среднегодового объёма продаж. Очевидно, средняя всех квартальных индексов есть1, иначе сумма средних квартальных объёмов продаж не будет равна среднегодовым продажам. Следовательно, сумма всех полученных квартальных индексов равна 4. Однако, как правило, возможны погрешности, связанные с округлением результатов вычислений. Поэтому следует проверить точность расчетов и скорректировать полученные значения. Для этого определяем корректирующий множитель, который равен отношению 4 к сумме вычисленных индексов. На него умножается значения каждых из четырёх квартальных индексов. Сумма скорректированных индексов должна быть равна 4. Определим сумму квартальных индексов, вычисленных в табл. 1.3: 0,87 + 0,707 + 1,190 + 1,317 = 4,084 Найдем корректирующий множитель: 4/4,084 = 0,9794 Скорректируем квартальные индексы: Квартал Скорректированные индексы сезонности 1 0,87*0,9794=0,852 2 0,707*0,9794=0,692 3 1,190*0,9794=1,166 4 1,317*0,9794=1,290 4 Индексы сезонности часто измеряют в процентах. Например, индекс первого квартала равен 0,852104 и это 85,2%. Это означает, что средний объём продаж в первом квартале на 14,8% меньше ¼ среднегодового объёма продаж. Индекс третьего квартала, равный 116,6% означает, что средний объём продаж по третьему кварталу на 16,6% больше ¼ среднегодового объёма продаж. В рассмотренном примере анализировалась квартальная сезонная компонента. Аналогичные заключения будут верны и для месячной сезонности, когда временной ряд содержит месячные данные. При определении месячных индексов сезонности (их будет 12), вычисляются двенадцатимесячные скользящие суммы и центрированные скользящие средние. Если T - длина временного ряда, то число полученных скользящих средних = T-12. При корректировке вычисленных индексов следует иметь в виду, что их сумма должна быть равна 12. 1.5 Десезонализация данных и сезонное прогнозирование Десезонализация данных временного ряда называется устранение влияния сезонной компоненты на его уровни с целью изучения тренда и долговременных циклических изменений. Десезонализирование данных (определяется как отношение: = /соответствующий сезонный индекс = * * / * (17) Пример. Вычислим десезонализированные объемы продаж для временного ряда, рассмотренного в предыдущем примере, полученные результаты сведем в таблицу 1.4 Таблица 1.4 Вычисление десезонализированных данных Год t yt Индекс сезонности(St) Десезонолизированные данные (dt=yt/St) 1990 1 20 0,852 23,47 2 12 0,692 17,34 3 47 1,166 40,31 4 60 1,290 46,51 1991 5 40 0,852 46,95 6 32 0,692 46,24 7 65 1,166 55,75 8 76 1,290 58,91 1992 9 56 0,852 65,73 10 50 0,692 72,25 11 85 1,166 72,90 12 100 1,290 77,52 1993 13 75 0,852 88,03 14 70 0,692 101,16 15 101 1,166 86,62 16 123 1,290 95,35 Десезонализированные данные в таблице 1.4 содержат тренд, циклическую и нерегулярную составляющие. При сравнении с фактическими значениями уравнений () можно видеть, что тренд более чётко проявляется в десезонализированных данных. Десезонализированные значения могут служить исходной информацией для оценки тренда: . Для получения параметров , следует только подставить в формулы (11) и (12) вместо фактических значений десезонализированные значения (: (18) (19) Зная индексы сезонности, тренд мы можем использовать в прогнозировании. Для этого нужно прогнозный период определить в закодированном виде (т.е продолжить исходный временной ряд до прогнозного периода и подсчитать его номер в общем ряду). Далее, следует подставить полученное значение периода в уравнение тренда и определить десезонолизированный прогноз, который умножается на соответствующий прогнозному периоду индекс сезонности. Пример. Вычислим тренд на основе десезонолизированных данных таблицы 1.4 и спрогнозируем объем продаж на 1 и 2 квартал 1994 года. Используя программное обеспечение, вычислим оценку тренда: Уравнение тренда было построено на основе данных, «очищенных» от влияния сезонности. Коэффициент регрессий b=5,0375 свидетельствует, что продажи возрастают в среднем приблизительно на 5 млн. долл. в квартал. С помощью уравнения тренда и индексов сезонности можно спрогнозировать объём продаж для заданного квартала в конкретном прогнозном году. Например, сделаем прогноз на первый и второй кварталы 1994 г. По таблице 1.4 первому кварталу 1994 г. соответствует t=17, а второму кварталу – t=18. Используя индекс сезонности для первого квартала S1=0,852 для второго квартала – S2=0,692. Вычислим прогнозные оценки: = (19,372+5,0375*17)*0,852=89,5 (млн. долл.) =((19,372+5,0375*18)*0,692=76,2 (млн. долл.) 1.6 Процедура общей декомпозиции временного ряда В предыдущих разделах данной главы мы рассматривали отдельные действия по оценке каждой компоненты временного ряда. Эти действия можно рассматривать как этапы процедуры общей декомпозиции временного ряда. Этап 1. Определение методом отношения к центрированной скользящей средней сезонного индекса для каждой части года. Для квартальных данных вычисления сводятся к нахождению 4-х квартальных индексов . В случае месячных наблюдений определяется 12 индексов () ( для каждого месяца свой индекс). Этап 2. Десезонализация данных. Этот этап заключается в выравнивании эффекта сезонности, т.е. исключение сезонной компоненты. Десезонализация осуществляется делением каждого фактического уровня на соответствующий сезонный индекс: , где - месячные и квартальные данные Этап 3. Определение тренда . Оценка тренда осуществляется по методу наименьших квадратов на основе десезонализированных данных : . Этап 4. Определение циклической компоненты . Эта компонета определяется делением каждой десезонализированной компоненты на соответствующие значения тренда, полученное на этапе 3: . Для исключения нерегулярной компоненты можно вычислять, например, трёхпериодные скользящие средние для величин . В этом случае эффект нерегулярной компоненты значительно сокращается. Выбор именно трёхпериодной скользящей средней был произволен. Он был связан с тем, что в случае нечётного числа слагаемых скользящей суммы скользящие средние не надо центрировать Все этапы композиции подробно рассмотрим на следующем примере. Пример. Ниже в таблице 1.5 представлены месячные данные об объёме розничной торговли сети магазинов за период с января 1989 г. по декабрь 1992 г. (тыс. долл.). Таблица 1.5 Данные об объёме розничной торговли сети магазинов 1989 1990 1991 1992 Январь 123,81 133,29 130,90 142,12 Февраль 120,11 128,03 128,59 143,15 Март 141,37 149,19 149,30 154,74 Апрель 139,78 145,80 148,51 159,07 Май 150,26 155,02 159,84 165,76 Июнь 149,00 154,37 153,91 164,63 Июль 144,55 149,72 154,64 166,01 Август 153,03 158,24 159,91 166,34 Сентябрь 144,08 146,34 146,70 160,61 Октябрь 142,34 151,47 152,11 168,73 Ноябрь 148,83 156,09 155,64 167,18 Декабрь 176,49 179,65 180,98 204,10 Используя данные таблице 1.5 , проведём поэтапную декомпозицию временного ряда. Этап 1. Определим индексы сезонности. Вычислим 12-ти месячные скользящие суммы и центрированные скользящие средние для 48 наблюдений, представленных в таблице 1.5. Все результаты вычислений сведём в таблицу 1.6. Определим первую скользящую сумму: = 123,81+120,11+…+176,49=1733,65 Она будет соответствовать середине промежутка t=6 и t=7, т.е. t=6,5. Вторая скользящая сумма вычисляется так: =120,11+141,37+…+133,39=1743,13. Её величина соответствует моменту t=7,5. Определим первую центрированную скользящую среднюю: (1733,65+1743,13)/24=144,87 Отметим, что произведение делится на 24, так как именно столько месяцев входит в качестве слагаемых в обе суммы. Аналогично вычислим оставшиеся скользящие суммы (колонка 3 таблицы 1.6) Ввиду того, что данные – месячные, центрированные скользящие средние не вычисляются для периодов с t=1 по t=6 и с t=43 по t=48. Колонку 5 таблицы 1.6 оставляют отношения фактических данных к центрированным скользящим средним. Например, первые два отношения вычисляются следующим образом: 144,55/144,87=0,998 153,03/145,59=1,051 и т.д. Таблица 1.6 Скользящие средние и отношения к скользящим средним для месячных данных о розничной торговле сети магазинов Год Месяц t (1) (2) Скользящая сумма (3) Центрированная скользящая сумма (4) Отношение к центрированной скользящей средней (5) 1989 1 1 123,81 2 2 120,11 3 3 141,37 4 4 139,78 5 5 150,26 6 6 149,00 1733,65 7 7 144,55 1743,13 144,87 0,998 8 8 153,03 1751,05 145,59 1,051 9 9 144,08 1758,87 146,25 0,985 10 10 142,34 1764,89 146,82 0,969 11 11 148,83 1769,65 147,27 1,011 12 12 176,49 1775,02 147,69 1,195 1990 1 13 133,29 1780,19 148,13 0,900 2 14 128,03 1787,66 148,57 0,862 3 15 149,19 1796,79 148,88 1,002 4 16 145,80 1804,05 149,35 0,976 5 17 155,02 1807,21 150,03 1,033 6 18 154,37 1804,82 150,47 1,026 7 19 149,72 1804,38 150,50 0,995 8 20 158,24 1805,49 150,42 1,052 9 21 146,34 1805,49 150,45 0,973 10 22 151,47 1808,20 150,57 1,006 11 23 156,09 1812,56 150,88 1,035 12 24 179,65 1817,48 151,07 1,189 1991 1 25 130,90 1819,15 151,25 0,865 2 26 128,59 1819,48 151,53 0,849 3 27 149,30 1820,15 151,61 0,985 4 28 148,51 1819,48 151,65 0,979 5 29 159,84 1820,15 151,66 1,054 6 30 153,91 1819,70 151,70 1,015 7 31 154,64 1821,03 152,22 1,016 8 32 159,91 1832,25 153,29 1,043 9 33 146,70 1846,81 154,13 0,952 10 34 152,11 1852,25 154,79 0,983 11 35 155,64 1862,81 155,48 1,001 12 36 180,98 1868,73 156,17 1,159 1992 1 37 142,12 1879,45 157,09 0,905 2 38 143,15 1890,82 157,84 0,907 3 39 154,74 1897,25 158,68 0,975 4 40 159,07 1911,16 159,96 0,994 5 41 165,76 1927,78 161,13 1,029 6 42 164,63 1939,32 162,57 1,013 7 43 166,01 1962,44 8 44 166,34 9 45 160,61 10 46 168,73 11 47 167,18 12 48 204,10 Сведём отношения в таблицу 1.7, где вычислим значения каждых трёх отношений, соответствующих определённому месяцу. Таблица 1.7 Отношения к центрированным скользящим средним и их средние значения Месяц (период) год 1 2 3 4 5 6 7 8 9 10 11 12 1 - - - - - - 0,998 1,051 0,985 0,969 1,011 1,195 2 0,9 0,862 1,002 0,976 1,033 1,026 0,995 1,052 0,973 1,006 1,035 1,189 3 0,865 0,849 0,985 0,979 1,054 1,015 1,016 1,043 0,952 0,983 1,001 1,159 4 0,905 0,907 0,975 0,994 1,029 1,013 - - - - - - средняя 0,890 0,872 0,987 0,983 1,039 1,018 1,003 1,049 0,970 0,986 1,015 1,181 Определим сумму средних отношений: 0,890+0,872+…+1,181=11,993 Отсюда, корректирующий множитель для индексов сезонности равен: 12/11,993. Вычислим индексы сезонности: Для =0,890*(12/11,993)=0,89 (январь) Для =0,872*(12/11,993)=0,87 (февраль) … Для =1,181*(12/11,993)=1,18 (декабрь). Индексы сезонности по месяцам представлены в таблице 1.8. Таблица 1.8 Индексы сезонности по месяцам Месяц Индекс сезонности Месяц Индекс сезонности Январь 0,89 Июль 1,00 Февраль 0,87 Август 1,05 Март 0,99 Сентябрь 0,97 Апрель 0,98 Октябрь 0,99 Май 1,04 Ноябрь 1,02 Июнь 1,02 Декабрь 1,18 Сумма сезонных индексов (++…+)=12, как видно из таблицы 1.8 наблюдений, индекс относится к декабрю и равняется 1,18. Это означает, что пик розничной торговли приходится на декабрь. В январе и феврале наблюдается спад розничной торговли (самые низкие индексы сезонности). В оставшихся месяцах индекс сезонности незначителен, т.е. индексы близки к единице. Этап 2. Определим десезонализированные данные. Они получаются делением фактического уровня на соответствующие индексы сезонности: Эти данные представлены в таблице 1.9. Таблица 1.9 Десезонализированные месячные данные объёмов розничной торговли сети магазинов Год Месяц t 1989 1 1 123,81 0,89 139,04 2 2 120,11 0,87 137,59 3 3 141,37 0,99 143,10 4 4 139,78 0,98 142,07 5 5 150,26 1,04 144,59 6 6 149,00 1,02 146,32 7 7 144,55 1,00 144,06 8 8 153,03 1,05 145,84 9 9 144,08 0,97 148,47 10 10 142,34 0,99 144,28 11 11 148,83 1,02 146,50 12 12 176,49 1,18 149,36 1990 1 13 133,29 0,89 149,69 2 14 128,03 0,87 146,67 3 15 149,19 0,99 151,02 4 16 145,80 0,98 148,19 5 17 155,02 1,04 149,17 6 18 154,37 1,02 151,60 7 19 149,72 1,00 149,21 8 20 158,24 1,05 150,80 9 21 146,34 0,97 150,80 10 22 151,47 0,99 153,53 11 23 156,09 1,02 153,64 12 24 179,65 1,18 152,03 1991 1 25 130,90 0,89 147,00 2 26 128,59 0,87 147,31 3 27 149,30 0,99 151,13 4 28 148,51 0,98 150,95 5 29 159,84 1,04 153,81 6 30 153,91 1,02 151,15 7 31 154,64 1,00 154,12 8 32 159,91 1,05 152,39 9 33 146,70 0,97 151,17 10 34 152,11 0,99 154,18 11 35 155,64 1,02 153,20 12 36 180,98 1,18 153,16 1992 1 37 142,12 0,89 159,60 2 38 143,15 0,87 163,99 3 39 154,74 0,99 156,64 4 40 159,07 0,98 161,68 5 41 165,76 1,04 159,51 6 42 164,63 1,02 161,67 7 43 166,01 1,00 165,45 8 44 166,34 1,05 158,52 9 45 160,61 0,97 165,50 10 46 168,73 0,99 171,02 11 47 167,18 1,02 164,56 12 48 204,10 1,18 172,72 В изменённых десонализированных данных, мы видим, как вполне отчётливо проявляется тренд. Этап 3. Определим трнед методом наименьших квадратов на имеющихся десезоналированных данных. Для этого воспользуемся формулами (18) и (19). В таблице 1.10 представлены промежуточные вычисления (ясно, что такие расчеты будем выполнять в Excel). Таблица 1.10 Промежуточные вычисления для определения тренда t t* 1 139,04 139,04 1 2 137,59 275,18 4 3 143,10 429,30 9 4 142,07 568,28 16 … … … … 45 165,50 7447,50 2025 46 171,02 7866,92 2116 47 164,56 7734,32 2209 48 172,72 8290,56 2304 1176 73,18,00 183888,34 38024 Подставим результаты промежуточных вычислений из таблицы 1.10 в формулы (18) и (19): Таким образом, уравнение тренда будет иметь вид: 140,23+0,499*t В среднем, без учёта сезонных колебаний объём продаж розничной торговли возрастает на 499 тыс. долл. в месяц. Этап 4. Определим циклическую компоненту. Вычислим значения TR для всех t: … Разделим каждое десезонализорованное значение на соответствующую оценку тренда (): Результирующие величины содержат нерегулярную компоненту . Для её устранения вычислим 3-х месячные скользящие средние для значений и . Результаты вычислений представлены в таблице 1.11. Таблица 1.11 Вычисление циклической компоненты для временного ряда объёмов розничной торговли сети магазинов Год Месяц () 1989 1 139,04 140,73 0,9880 - 2 137,59 141,23 0,9743 0,99 3 143,10 141,73 1,0097 0,99 4 142,07 142,23 0,9989 1,01 5 144,59 142,73 1,0131 1,01 6 146,32 143,23 1,0216 1,01 7 144,06 143,72 1,0023 1,01 8 145,84 144,22 1,0112 1,01 9 148,47 144,72 1,0259 1,01 10 144,28 145,22 0,9935 1,01 11 146,50 145,72 1,0053 1,01 12 149,36 146,22 1,0215 1,02 1990 1 149,69 146,72 1,0202 1,01 2 146,67 147,22 0,9962 1,01 3 151,02 147,72 1,0224 1,01 4 148,19 148,22 0,9998 1,01 5 149,17 148,71 1,0031 1,01 6 151,60 149,21 1,0160 1,01 7 149,21 149,71 0,9967 1,01 8 150,80 150,21 1,0039 1,00 9 150,80 150,71 1,0006 1,01 10 153,53 151,21 1,0153 1,01 11 153,64 151,71 1,0127 1,01 12 152,03 152,21 0,9988 0,99 1991 1 147,00 152,71 0,9626 0,97 2 147,31 153,21 0,9615 0,97 3 151,13 153,71 0,9832 0,97 4 150,95 154,20 0,9789 0,99 5 153,81 154,70 0,9942 0,98 6 151,15 155,20 0,9739 0,99 7 154,12 155,70 0,9898 0,98 8 152,39 156,20 0,9756 0,98 9 151,17 156,70 0,9647 9,97 10 154,18 157,20 0,9808 0,97 11 153,20 157,70 0,9715 0,97 12 153,16 158,20 0,9681 0,98 1992 1 159,60 158,70 1,0057 1,00 2 163,99 159,20 1,0301 1,01 3 156,64 159,69 0,9809 1,01 4 161,68 160,19 1,0093 0,99 5 159,51 160,69 0,9926 1,00 6 161,67 161,19 1,0030 1,01 7 165,45 161,69 1,0232 1,00 8 158,52 162,19 0,9774 1,01 9 165,50 162,69 1,0173 1,01 10 171,02 163,19 1,0480 1,02 11 164,56 163,69 1,0053 1,04 12 172,72 164,19 1,0520 - Для пояснения того, как определились 3-х месячные скользящие средние, вычислим скользящую среднюю, соответствующую периоду t=2: =(0,988+0,9743+1,0097)/3=0,99. Анализ циклической компоненты показывает, что в этой сети наблюдается спад с декабря 1990 г. по декабрь 1991 (<1). Если известны 3 компоненты: тренд, циклическая компонента и сезонная, то можно выразить четвёртую нерегулярную компоненту из следующего соотношения: Определим все компоненты для периода t=9 (сентябрь 1989 г.). Из таблицы 1.11 возьмём значения тренда =144,72. В таблице 1.8 найдём сезонную компоненту =0,97 и в таблице 1.11 – циклическую компоненту =1,01, перемножим эти компоненты: =0,97*144,72*1,01=141,782. Выделим нерегулярную компоненту: =144,08/141,782=1,0162. Таким образом, фактическое значение уровня временного ряда в период t=9 можно представить в виде произведения 4-х компонент: =0,97*144,72*1,01*1,0162=144,079 Если проделать данную процедуру для всех уровней, то мы получим полную декомпозицию временного ряда (таблица 1.12). Таблица 1.12 Компоненты временного ряда объёмов розничной торговли сети магазинов Год Месяц 1989 1 123,81 140,73 0,89 - - 2 120,11 141,23 0,87 0,99 0,98 3 141,37 141,73 0,99 0,99 1,02 4 139,78 142,23 0,98 1,01 0,99 5 150,26 142,73 1,04 1,01 1,00 6 149,00 143,23 1,02 1,01 1,01 7 144,55 143,72 1,00 1,01 0,99 8 153,03 144,22 1,05 1,01 1,00 9 144,08 144,72 0,97 1,01 1,02 10 142,34 145,22 0,99 1,01 0,99 11 148,83 145,72 1,02 1,01 1,00 12 176,49 146,22 1,18 1,02 1,01 1990 1 133,29 146,72 0,89 1,01 1,01 2 128,03 147,22 0,87 1,01 0,98 3 149,19 147,72 0,99 1,01 1,02 4 145,80 148,22 0,98 1,01 0,99 5 155,02 148,71 1,04 1,01 1,00 6 154,37 149,21 1,02 1,01 1,01 7 149,72 149,71 1,00 1,01 0,99 8 158,24 150,21 1,05 1,00 1,00 9 146,34 150,71 0,97 1,01 0,99 10 151,47 151,21 0,99 1,01 1,01 11 156,09 151,71 1,02 1,01 1,00 12 179,65 152,21 1,18 0,99 1,01 1991 1 130,90 152,71 0,89 0,97 0,99 2 128,59 153,21 0,87 0,97 0,99 3 149,30 153,71 0,99 0,97 1,01 4 148,51 154,20 0,98 0,99 0,99 5 159,84 154,70 1,04 0,98 1,01 6 153,91 155,20 1,02 0,99 0,99 7 154,64 155,70 1,00 0,98 1,01 8 159,91 156,20 1,05 0,98 1,00 9 146,70 156,70 0,97 0,97 0,99 10 152,11 157,20 0,99 0,97 1,01 11 155,64 157,70 1,02 0,97 1,00 12 180,98 158,20 1,18 0,98 0,99 1992 1 142,12 158,70 0,89 1,00 1,00 2 143,15 159,20 0,87 1,01 1,02 3 154,74 159,69 0,99 1,01 0,97 4 159,07 160,19 0,98 0,99 1,02 5 165,76 160,69 1,04 1,00 0,99 6 164,63 161,19 1,02 1,01 1,00 7 166,01 161,69 1,00 1,00 1,02 8 166,34 162,19 1,05 1,01 0,97 9 160,61 162,69 0,97 1,01 1,00 10 168,73 163,19 0,99 1,02 1,02 11 167,18 163,69 1,02 1,04 0,97 12 204,10 164,19 1,18 - - Графики построены (рис. 1.6.) для и как функции от t F(t), C(t) и I(t) от времени. Рис. 1.6. Графики компонент временного ряда объёмов розничной торговли сети магазинов 2 Статистические методы и модели в прогнозировании Введение. До сих пор мы использовали регрессивные модели временных рядов. Были также затронуты вопросы использования этих моделей в прогнозировании. При этом отмечалось, что методологической базой процедур прогнозирования является экстраполяция, т.е. перенесение закономерностей, которые проявились в изменении данных за прошлые периоды времени, в будущее. В процессе прогнозирования временная последовательность значений зависимой переменной y всегда делится на две части – прогнозные значения, которые генерируются с помощью вычислительных процедур, и фактические данные, которые наблюдаются (рис.1). Период осуществления прогноза Прошлые периоды t Прогнозные периоды Рис. 1. Временная последовательность значений зависимой переменной y в процессе прогнозирования ( – ближайшее наблюденное значение y; – прогноз на один период) Использование уравнения регрессии в качестве модели прогнозирования предполагает, что изменение зависимой переменной (прогнозируемого показателя) объясняется одной или несколькими независимыми переменными. Основное преимущество данного типа моделей состоит в том, что измеряется эффект от варьирования объясняющих переменных. Кроме того, конечный результат прогнозирования имеет ясную и наглядную интерпретацию для анализа: указываются факторные переменные, которые предположительно влияют на зависимую переменную. Однако использование регрессионных моделей предполагает в свою очередь прогнозирование значений объясняющих переменных. Во многих случаях для факторных переменных существует такая же неопределенность, как и для зависимой переменной. Прогнозирование с помощью методов, анализа временных рядов является чистой экстраполяцией, когда закономерность изменения прогнозируемого показателя за прошлые периоды времени в точности переносятся на будущее. На первый взгляд может показаться, что методы анализа временных рядов значительно проще использовать в прогнозировании, чем регрессионные модели. По крайней мере, не нужно проводить исследования для определения объясняющих переменных и набирать необходимые данные по каждой из них. Однако часто для выявления сложностей структуры взаимозависимых уровней временного ряда требуется построение неординарных прогнозных уровней. В данной главе рассмотрим более подробно различные способы и модели прогнозирования, основанные на методах анализа временных рядов и регрессионного анализа. 2.1 Простейшие модели Наиболее простой («наивный») способ прогнозирования заключается в предположении, что текущее значение является наилучшим предсказателем для будущего. Простейшая модель в этом случае имеет вид: (1) – прогнозное (оценочное) значение y на период t+1, полученное в период t. - фактическое (наблюденное) значение y в момент t. Использование простейшей модели (1) в прогнозировании дает хорошие результаты, если наблюдения соответствует коротким времени (например, дни или недели) и характер их изменений не содержит заметных скачков. В некоторых случаях «наивная» модель может давать более точные результаты, чем сложные прогнозные уравнения. Пример 1. В следующей таблице представлены цены акций некоторой компании за 12-недельный период, которые регистрировались на фондовой бирже в конце каждой недели: Неделя Цена (долл.) Неделя Цена (долл.) Неделя Цена (долл.) 1 60 5 64,5 9 63,5 2 62,25 6 62 10 62,5 3 61,75 7 63,5 11 61 4 63 8 64 12 61,5 Используя данные таблицы и модель (1) спрогнозируем цену на 13 неделю: Оценка точности прогнозирования характеризуется остатками, которые вычисляются для каждого периода прогнозирования t: (2) Чтобы оценить точность некоторой процедуры, используемой для прогнозирования на основе данных конкретного временного ряда, остатки можно вычислить ретроспективно. Очевидно, что чем эффективнее процедура прогнозирования, тем меньше абсолютные величины остатков за все периоды временного ряда. Пример 2. Используя «наивную» модель на основе данных примера 1 вычислим остатки (2) для каждой недели. Возникает проблема, как вычислить остаток , соответствующий периоду t = 1 , поскольку в этом случае , где – цена акции на конец недели, предшествующей начальному периоду наблюденного временного ряда. Если значение неизвестно, то прогнозные оценки строятся, начиная со второй недели (t=2). Вычислим остатки для t = 2, 3, 4: Проведя аналогичные вычисления для оставшихся недель, сведем все результаты в табл.2. 1. Таблица 2.1 Прогнозирование и вычисление остатков с использованием простейшей "наивной" модели Неделя (t) Yt (т.руб.) Y Остаток 1 2 3 4 5 6 7 8 9 10 11 12 60 62,25 61,75 63 64,5 62 63,5 64 63,25 62,5 61 61,5 60 62,25 61,75 63 64,5 62 63,5 64 63,25 62,5 61 2,25 -0,5 1,25 1,5 -2,5 1,5 0,5 -0,75 -0,75 -1,5 0,5 Простейшую модель можно адаптировать к структуре временного ряда. Например, если имеет место тенденция (тренд) возрастания или убывания уровней во времени, то возможна корректировка модели с учетом добавки в виде разности между текущим значением уровня и предыдущим значением: (3) Иногда в качестве коррекции модели на тренд имеет смысл использовать не абсолютную разность, а темп измерения: (4) В случае ярко выраженной сезонности в изменении уровней, простейшая прогнозная модель может быть следующей: (5) где k-промежуток сезонности (например, k=4, если имеет место квартальная сезонность; k=12, если сезонность месячная); Основной недостаток простейших моделей в том, что в них не учитывается влияние изменений за более поздние периоды времени. Для их учета можно комбинировать различные модели, включающие и тренд, и сезонность. Например, одним из таких вариантов модели может быть следующее уравнение: (6) – член, учитывающий сезонность (k – промежуток сезонности), а другое слагаемое, являющееся среднем арифметическим приращений за k предыдущих периодов – член, учитывающий тренд. Пример 3. В таблице 2.2 представлены данные об объемам продаж некоторого продукта в физических единицах за 1988-1994 Таблица 2.2 Временной ряд объёмов продаж продукта в физических единицах за 1988 - 1994 гг. Год Квартал t Продажи (ед.) 1988 1989 1990 1991 1992 1993 1994 1234 1234 1234 1234 1234 1234 1234 1234 5678 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 500 350 250 400 450 350 200 300 350 200 150 400 550 350 250 550 550 400 350 600 750 500 400 650 850 600 450 700 Предположим, что мы находимся в конце четвертого квартала 1993 года и нам необходимо сделать прогноз на 1 квартал 1994 года, который соответствует периоду t=25, сделаем это на основе простейших моделей (1), (3)-(6). Используя модель (1) получим: Определим ошибку прогноза за период t=25: Визуальный анализ временного ряда в таблице 2.2 позволяет сделать вывод о наличии возрастающего тренда. Очевидно, если использовать модель (1) для получения прогнозных оценок на периоды 2-28, то они большей частью будут занижены. Для корректировки этой систематической ошибки используем модель (3), учитывающую тренд: Ошибка прогноза уменьшилась по абсолютной величине: Для иллюстрации использования модели (4) спрогнозируем на ее основе объем продаж на первый квартал 1994года: . Есть основание полагать, что уровни временного ряда в таблице 2.2 содержат сезонную компоненту: продажи в 1 квартале каждого года большей частью выше, чем в остальных кварталах. Поэтом у имеет смысл попробовать использовать модель (5) с квартальной сезонностью (k=4): Наконец, применим модель (6), учитывающую сезонность и тренд одновременно: , Следует отметить, что представленные простейшие («наивные») модели далеко не исчерпывают все возможные варианты, которые можно получить, конструируя различные комбинации подобных моделей. Составление простейших моделей обусловливается в основном структурными характеристиками временного ряда и аналитическими способностями эксперта. 2.2 Методы экспоненциального сглаживания (ЭС) В предыдущей главе рассматривался метод сглаживания временных рядов на основе вычисления последовательности центрированных скользящих средних. Скользящие средние использовались для определения индексов сезонности. Кроме того, они могут служить в качестве уровней “нового временного ряда”, для которых эффект сезонности полностью исключен, а влияние нерегулярной (случайной) компоненты значительно меньше. Временной ряд, составленный из скользящих средних, является более сглаженным по сравнению с исходным рядом. Уже визуальный анализ его графика позволяет выявить какой -либо существующий тренд или циклические изменения (см. рис.1.6 в предыдущей главе). Другой способ сглаживания временных рядов представляет собой экспоненциальное сглаживание. В отличие от скользящих средних его вычислительная процедура включает обработку всех предыдущих наблюдений, при этом учитывается устаревание информации по мере удаления от прогнозного периода. Иначе говоря, чем “старше” наблюдение, тем меньше оно должно влиять на величину прогнозной оценки. Идея экспоненциального сглаживания состоит в том, что по мере “старения” соответствующим наблюдениям придаются убывающие веса. Рассмотрим содержание процедуры экспоненциального сглаживания, а также ее модификации, разработанные с учетом различной структуры временного ряда – наличие тренда и сезонных изменений. 2.2.1 Простое экспоненциальное сглаживание Простое экспоненциальное сглаживание дает хорошие результаты для стационарных временных рядов. Ряд называется стационарным, если его уровни не содержат тренда, а его среднее значение () и дисперсия остаются постоянными с течением времени. График стационарного ряда представлен на рис.2.2. Рис. 2.2. График стационарного временного ряда Сглаженное значение временного ряда на период t вычисляется как взвешенная сумма фактического значения уровня на этот период и сглаженное значение на предыдущий период t-1: (7) t=2,3,4…-временные периоды; -сглаженное значение на период t; -фактическое значение уровня на период t; -сглаженное значение на период (t-1). A-сглаживающая константа (01,27=1,15, это означает, что серийная корреляция ошибок была устранена. Рассмотри процедуру прогнозирования с помощью уравнения (33). Спрогнозируем объём продаж на 1994 г. 1. Пусть прогнозная оценка затрат на НИР 1994 г. Х=1185 2. Вычислим темп прироста х за 1993 г.: (1185-1076,7)/1076,7=0,101 (10,1%). 3. Вычислим темп прироста у за 1993 г.: (-13640)/13640=1,01*0,101=0,10201. 4. Определим прогнозную оценку : =13640*0,10201+13640=15032. Заключительные тезисы к лекциям I. Под временным рядом понимается ряд значений некоторого показателя, взятых по состоянию на определённые моменты или периоды времени. Количественные значения показателя во временном ряду называются уровнями временного ряда. Уровни располагаются в хронологическом порядке, обычно через равные промежутки времени (квидистантные ряды). Каждый уровень можно рассматривать как результат наложения компонент, имеющих разный временной характер действия. Метод анализа временных рядов и заключается в выделении этих компонент. Основными компонентами временного ряда являются: тренд, циклическая, сезонная и нерегулярная компоненты. Под трендом понимается долгосрочная составляющая, характеризующая общую тенденцию изменения временного ряда в течение длительного периода времени. Циклическая компонента характеризует повторяющиеся волнообразные изменения длительностью более 1 года. Сезонная компонента так же носит циклический характер. Она характеризует изменения, регулярно повторяющиеся и завершаемые в пределах года. Нерегулярная компонента отражает быстрые изменения, как правило, малой длительностью. Процесс определения каждой компоненты и исключение её воздействия на уровни временного ряда называется декомпозицией, или разложением временного ряда. Формально модель декомпозиции можно представить двумя способами: как произведение четырёх компонент (мультипликативная модель) или как сумму этих компонент (аддитивная модель). На практике чаще используется мультипликативная модель. При анализе тренда независимой переменной является время, а зависимой – уровень временного ряда. Для оценки тренда используется метод наименьших квадратов. В случае линейного тренда строится парная линейная регрессия уровня ряда на время. При построении нелинейного тренда проводится преобразование временной переменной. Циклическая компонента измеряется как отношение фактического уровня временного ряда к оценке тренда. Сезонная компонента проявляется, когда временной ряд составляют квартальные или месячные наблюдения. Она измеряется в виде индекса сезонности, который умножается на величину тренда. Индекс сезонности остаётся постоянным для определённой части года (месяц, квартал). Способ вычисления индексов сезонности является метод отношения к центрированной скользящей средней. При этом на основе исходного временного ряда определяется новый временной ряд, уже не содержащий компонент сезонности. Его уровни будут центрированные скользящие средние. Для вычисления центрированных скользящих средних определяются скользящие суммы. Слагаемые первой суммы представляют собой первые 4 (для квартальной сезонности) или 12 (для месячной сезонности) уровней временного ряда. Во вторую скользящую сумму входят первые четыре уровня ряда, полученного сдвигом уровней на один квартал (месяц) вперед; в третью сумму – сдвигом на два квартала (месяца) вперед и т.д. Чтобы получить скользящую среднюю, центрированную на середину периода, сумму двух соседних скользящих сумм делят на 8 (для квартальной сезонности). Индекс сезонности вычисляется как отношение фактического уровня временного ряда к соответствующей центрированной скользящей средней. Этим отношения усредняются по каждому отдельному кварталу (месяцу). Если разделить фактические уровни на соответствующие индексы сезонности, то получим десезонализированные данные, которые содержат только тренд, циклическую и нерегулярную компоненты. Десезонализированные значения уровней служат исходной информацией для оценки тренда. Зная индексы сезонности и тренд, можно прогнозировать сезонные значения временного ряда. Общая декомпозиция временного ряда осуществляется по следующей схеме: 1. определение сезонных индексов; 2. десезонализация данных; 3. определение тренда; 4. определение циклической компоненты. При этом для исключения нерегулярной компоненты иногда вычисляются трехпериодные скользящие средние. Если известны три компоненты временного ряда: тренд, сезонная и циклическая, то нерегулярная компоненты измеряется как отношение фактического уровня к произведению трех указанных компонент. II. Если первая глава целиком посвящена проблеме сглаживания временных рядов, то вся вторая глава нацелена на изучение различных способов и моделей прогнозирования, основанных на методах анализа временных рядов и регрессионного анализа. Наиболее простой способ прогнозирования заключается в предположении, что текущие периоды являются лучшими оценкам будущего (см. Екклесиаст” … что было, то и будет…”). Простейшая(“наивная”) модель имеет вид (1). Ее использование в прогнозировании дает хорошие результаты, если наблюдения соответствуют коротким периодам времени (например, дни или недели) и характер их изменений не содержит заметных скачков. Простейшие модели можно адаптировать к структуре временного ряда. Возможны модификации “наивной” модели, учитывающие тренд и сезонность (например, модели (3) ÷ (6)). Одним из способов сглаживания временных рядов является экспоненциальное сглаживание. Вычислительная процедура выключает обработку всех предыдущих наблюдений. При этом учитывается “устаревание” информации по мере удаления от прогнозного периода; чем “старше” наблюдение, тем меньше оно должно влиять на величину прогнозной оценки. Идея простого экспоненциального сглаживания состоит в том, что по мере “старения” соответствующим наблюдениям придаются веса, убывающие по экспоненциальному закону (уравнение (8)). Простое экспоненциальное сглаживание дает хорошие результаты для стационарных временных рядов, имеющих постоянное среднее значение и дисперсию и не содержащих тренда. От характера изменения временного ряда зависит выбор сглаживающей константы А (А ≤ 0,1) следует использовать для сглаживания временных рядов со значительной нерегулярной компонентой. В этом случае происходит максимальная фильтрация случайных отклонений. Для более стабильных временных рядов значение А следует увеличить. Тогда каждый новый прогноз становится чувствительным к текущим изменениям прогнозируемого показателя. Простое экспоненциальное сглаживание временных рядов, содержащих устойчивый тренд, приводит к систематической ошибке, связанной с отставанием сглаженных значений от фактических уровней временного ряда. Для учета тренда в нестационарных рядах используется специальное двухпараметрическое линейное экспоненциальное сглаживание (метод Хольта). Данный метод включает два уравнения: уравнение (12) предназначено для сглаживания наблюдаемых значений и уравнение (13) – для сглаживания тренда. Каждое уравнение содержит отдельную сглаживающую константу, значение которой заключено между 0 и 1 (параметры модели). Первый этап процедуры прогнозирования – оценка начального значения тренда. Предлагаются два способа. При первом способе начальное значение тренда полагается равным нулю. Второй способ (более точный) заключается в вычислении с помощью МНК линейного уравнения регрессии на основе первых нескольких фактических наблюдений. Коэффициент регрессии берется в качестве начального значения тренда. Для временных рядов, содержащих не только тренд, но и значительную сезонность, эффективным является трехпараметрический метод линейного и сезонного экспоненциального сглаживания (метод Винтера). Он включает три уравнения с отдельными сглаживающими константами и является обобщением метода Хольда: к двум уравнениям (16) и (17), сглаживающим прошлые наблюдения и тренд, добавляется уравнение для сглаживания сезонных изменений (18). Как и в случае линейного экспоненциального сглаживания, возможны два способа определения начальных значений. Способ 1 полагает начальные сезонные индексы равными 1, начальное значение тренда – нулю и начальное сглаженное значение временного ряда – значению за последний (или первый) период сезонности первого года. Более точным, но более трудоемким является способ 2. На основе фактических данных за первые несколько лет (например, 2 года) определяются индексы сезонности, которые выбираются в качестве начальных оценок. Далее фактические наблюдения, использованные при вычислении сезонности, десезонализируются (т.е. делятся на соответствующие индексы сезонности). На их основе с помощью МНК вычисляется линейное уравнение тренда. Угловой коэффициент регрессивного уравнения берется в качестве начальной оценки тренда. Начальная сглаженная величина определяется как произведение соответствующего индекса сезонности (за последний или первый период сезонности) и величины, полученной при подстановке в вычисленное ранее уравнение тренда значение t = 0. Эффективность метода прогнозирования определяется точностью полученных на его основе прогнозов. Общая ошибка метода прогнозирования накапливается за счет ошибок, полученных на каждый период прогнозирования. Ошибка (остаток) за какой-либо период прогнозирования определяется как разность между фактическим наблюдением и оценочным (прогнозируемым) значением на этот период. При оценке метода прогнозирования общая ошибка вычисляется ретроспективно при сопоставлении наблюдаемых данных с соответствующими оценками, полученными на основе рассматриваемого метода. Один из способов вычисления общей ошибки заключается в суммировании абсолютных величин остатков. В качестве обобщенного показателя выбирается средняя абсолютная погрешность MAD (mean absolute deviation ) (формула (20)). Показатель MAD наиболее пригоден, если ошибку прогноза требуется измерить в тех же единицах, что и уровни ряда. Альтернативным способом определения общей ошибки является вычисление средней квадратической ошибки MSE (формула (21)). Этот показатель позволяет выявить отдельные большие отклонения от фактических данных, если они существуют. Иногда требуется оценить степень смещенности (т.е. завышенность или заниженность) результатов прогнозирования, полученных данным методом. Для этого используется показатель средней относительной ошибки MPE (формула (23)). Если он близок к нулю, то смещений нет; если отрицательный, то прогнозные оценки завышены и наоборот. Чем меньше показатель общей ошибки, тем точнее метод прогнозирования. Если переменная задаваемая временным рядом, зависит от своих значений за прошедшие периоды времени, то эффективным способом прогнозирования может оказаться авторегрессионная модель. Она получается построением регрессии на переменные которые характеризуются тем же временным рядом, но сдвинутым соответственно на 1, 2, … периодов вперед (т.е. полученные с соответствующей задержкой, или временным лагом, из исходного временного ряда). Переменные называются лагированными переменными. Для определения, с каким лагом включить переменные в модель, можно использовать коэффициенты автокорреляции различных порядков Коэффициент k-го порядка характеризующий корреляцию между и и изменяется от -1 до 1 (формула (25)). Графиком значений коэффициентов автокорреляции является коррелограмма. По ней можно судить, какие лагированные переменные следует включить в авторегрессию. Это будут переменные, для которых соответствующие коэффициенты авторегрессии имеют наибольшие по абсолютной величине значения. С помощью коррелограммы можно также выявить сезонность и нестационарность временных рядов. Если не наблюдается быстрая убываемость до нуля коэффициентов автокорреляции (например, сразу после и ), то рассматриваемый временной ряд будет нестационарным. Перед построением авторегрессии нестационарный временной ряд следует специальным образом трансформировать, сделав его более стационарным, и уже трансформированные данные исследовать на сезонность. Способ преобразования нестационарного ряда заключается в вычислении первых или вторых разностей с последующей заменой на них уровней исходного временного ряда. Если ряд стал стационарным и содержит сезонность, то после быстрого спада коэффициентов автокорреляции будут наблюдаться периодические пиковые значения, соответствующие сезонному эффекту. В прогнозировании временны рядов эффективно используются регрессионные модели с искусственными переменными. Например, при учете сезонности искусственные переменные могут характеризовать определенные сезоны. Для введения искусственных переменных в модель они кодируются по определенной схеме. Так для квартальной сезонности возможна схема (27), а для месячной - (28). Применение искусственных переменных дает хорошие результаты в случае аддитивной сезонности. Проблема, которая часто возникает при использовании множественной линейной регрессии, полученной как регрессия на временные ряды – автокорреляция остатков. Для устранения этого явления можно использовать следующие процедуры: 1. Замена уровней временного ряда первыми разностями. 2. Замена уровней временного ряда темпами прироста. 3. Включение в регрессионную модель лагированных переменных в качестве объясняющих зависимую переменную. 4. Улучшение существующей модели с помощью включения в нее дополнительной независимой переменной, значимо влияющей на вариацию зависимой переменной.

Разместил пособие