Справочник от Автор24
Поделись лекцией за скидку на Автор24

Анализ временных рядов. Статистические методы и модели в прогнозировании.

  • 👀 673 просмотра
  • 📌 636 загрузок
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Анализ временных рядов. Статистические методы и модели в прогнозировании.» pdf
1 Анализ временных рядов 1.1 Компоненты временного ряда Под временным рядом (динамическим рядом) понимается ряд значений некоторого показателя, взятых по состоянию на определенные моменты или периоды времени. Количественные значения показателя во временном ряду называются уровнями. Уровни расположены в хронологическом порядке, обычно через равные промежутки времени. Если они агрегированы так, что отражают состояние показателя на некоторые периоды времени, то такой ряд называется интегральным. В качестве таких периодом могут выступать, например, годы , кварталы, месяцы, недели. Моментные временные ряды характеризуют состояние показателя на короткий промежуток времени, например день, час и т.д. Временные ряды отражают динамику социально-экономических явлений. Если уровни временного ряда формируются под влиянием факторов и условий, которые будут незначительно изменяться в будущем, то такой временной ряд можно использовать для прогнозирования. При этом его методологической основой будет экстраполяция, т.е. перенесение в будущее тенденций, которые сформировались в прошлом. Действия факторов, влияющих на величины уровней временного ряда, носят различный временной характер. Влияние одних факторов проявляется постоянно в течении продолжительных промежутков времени, влияние других – периодически, с разной длинной периода. Некоторые факторы проявляют себя случайно и нерегулярно. В этой связи каждый уровень временного ряда можно рассматривать как результат наложения компонент, имеющих разный временной характер действия. Метод анализа временного ряда заключается в выделении этих компонент. Среди компонент временного ряда выделяют: тренд, циклическую компоненту, сезонную компоненту и нерегулярную компоненту (рис.1). Рис. 1.1. Компоненты временного ряда Под трендом понимается долгосрочная составляющая, характеризующая общую тенденцию изменения временного ряда в течение длительного периода времени. Под тенденцией понимается возрастание или убывание уровней временного ряда (рис 1, а). Факторами, порождающими тренд, могут быть, например, изменение состава населения, рост производства, рост цен и т.д. Циклическая компонента характеризует повторяющиеся волнообразные изменения длительностью более 1 года. Она отражает цикл деловой активности, периоды подъема и спада. Длина цикла, т.е. время между соседними максимумами( или соседними минимумами) может колебаться от 1 года до 15 - 25 лет (а иногда до 50 – 70 лет, пример- волны Кондратьева). Циклическая компонента определяется изменением остатков, т.е. разницей между трендом и фактическими значениями уровней ряда вдоль линии тренда (рис. 1, б). Сезонная компонента так же носит циклический характер. Она характеризует изменения, регулярно повторяющиеся и завершаемые в пределах года (рис. 1, в). Например, сезонным фактором являются погодные условия, соответствующие какому-либо времени года, т.к. влияют на продажи потребительских товаров. Нерегулярная компонента отражает быстрые изменения, как правило, малой длительностью (рис. 1, г). Они вызываются непредсказуемыми или редкими событиями: природными катаклизмами, войной, эпидемией, сменой власти и т.д. (типичный пример – цены на акции). Основная задача анализа временных рядов заключается в определении каждой компоненты и исключение её воздействий на уровни временного ряда. Этот процесс называется декомпозицией или разложением временного ряда (его геометрическая интерпретация представлена на рис. 1). Формально модель декомпозиции временного ряда можно представить в виде уравнения : y=TR×C×S×I (1) y- уровень временного ряда; TR-тренд; C-циклическая компонента; S-сезонная компонента; I-нерегулярная компонента. Модель (1) называется моделью с мультипликативной структурой. Она строится на предположении о том, что любой уровень временного ряда является произведением воздействующих компонент. В анализе временных рядов рассматривается также альтернативный подход к агрегированию компонент – каждый уровень представляется как сумма воздействующих компонент: y=TR+C+S+I (2) При допущении модели (2) вклад сезонной компоненты остаётся постоянным с течением времени для данной части года. Для мультипликативной модели (1) абсолютная величина сезонной колеблемости возрастает по мере роста уровней временного ряда. Эта модель чаще используется на практике, её мы и будем рассматривать. 1.2 Анализ тренда Тренд является долгосрочной составляющей временного ряда. При анализе тренда независимой переменной x является время, а зависимой y – уровень временного ряда. Вид тренда можно выявить, если построить график временного ряда, откладывая на оси абсцисс периоды времени, а на оси ординат – значения уровней. Визуальный анализ расположения точек графика помогает сделать вывод о форме сглаживающей линии. Если тренд окажется линейным, то для вычисления параметров уровня применяется метод наименьших квадратов. При нелинейном тренде его также можно использовать, проделав соответствующие преобразования переменных. Пусть рассматривается линейный тренд: 𝑦̂ = 𝑏0 + 𝑏𝑡 (3) где t – время (независимая переменная); 𝑦̂ – оценка уровня временного ряда (зависимая переменная) Геометрически это означает, что нужно подобрать такую прямую, которая наилучшим образом сглаживала бы точки корреляционного поля. Корреляционным полем называют диаграмму рассеяния, когда на координатной плоскости по оси абсцисс откладывается значение факторного показателя, а по оси ординат – соответствующее значение результативного показателя. Если y – зависимая переменная, а t – независимая, то нахождение зависимости y от t будем называть определением регрессии y на t. Ниже на рис. 1(а) представлена искомая линия регрессии, на которую из каждой точи корреляционного поля опущены отрезки, перпендикулярные оси t. Рис. 1.а. Геометрическая инерпритация метода наименьших квадратов Длины отрезков 𝑑1 , 𝑑2 , … , 𝑑𝑛 характеризуют расстояние от точек до прямой регрессии. Пусть критерием наилучшей сглаживающей будет минимизация суммы квадратов рассеяний. min(𝑑1 2 + 𝑑2 2 + … + 𝑑𝑛 2 ) = min ∑𝑛𝑖=1 𝑑𝑖 2 (4) Прямая, построенная по критерию (4), будет линией регрессии, полученной методом наименьших квадратов. Рассмотрим аналитическую процедуру метода наименьших квадратов. Пусть имеется совокупность из n пар наблюдений: (𝑡1 , 𝑦1 ), (𝑡2 , 𝑦2 ), … (𝑡𝑛 , 𝑦𝑛 ). Найдем для уравнения регрессии в виде линейного тренда параметры 𝑏0 и 𝑏1 . Для этого запишем сумму квадратов расстояний (S) в виде: S = ∑𝑛𝑖=1 𝑑𝑖 2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑡𝑖 )2 (5) Будем рассматривать S как функцию двух переменных 𝑏0 и 𝑏1 ; найдем также их значения, которые минимизируют сумму квадратов расстояний. Для этого продифференцируем выражение (5) отдельно по 𝑏0 и 𝑏1 и приравняем частные производные к нулю: 𝑑𝑆 = −2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑡𝑖 ) = 0 𝑑𝑏 { 𝑑𝑆 0 𝑑𝑏𝑖 = −2 ∑𝑛𝑖=1 𝑡𝑖 (𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑡𝑖 ) = 0 (6) Из уравнений (6) следует система так называемых нормальных уравнений: 𝑏0 ∗ 𝑛 + 𝑏1 ∑𝑛𝑖=1 𝑡𝑖 = ∑𝑛𝑖=1 𝑦𝑖 (7) 𝑏0 ∑𝑛𝑖=1 𝑡𝑖 + 𝑏1 ∑𝑛𝑖=1 𝑡𝑖 2 = ∑𝑛𝑖=1 𝑡𝑖 ∗ 𝑦𝑖 (8) Неизвестные значения 𝑏0 и 𝑏1 находятся как решения системы нормальных уравнений (7) и (8): 𝑏1 = 𝑛 𝑛 ∑𝑛 𝑖=1 𝑡𝑖 𝑦𝑖 −[(∑𝑖=1 𝑡𝑖 )(∑𝑖=1 𝑦𝑖 )]/𝑛 2 𝑛 2 ∑𝑛 𝑖=1 𝑡𝑖 −(∑𝑖=1 𝑡𝑖 ) /𝑛 𝑏0 = ∑𝑛 𝑖=1 𝑦𝑖 𝑛 − 𝑏1 ∑𝑛 𝑖=1 𝑡𝑖 𝑛 = ̅̅ ∑𝑛 𝑖=1 𝑡𝑖 𝑦𝑖 −𝑛𝑡 𝑦 2 ̅2 ∑𝑛 𝑖=1 𝑡𝑖 −𝑛𝑡 = 𝑦̅ − 𝑏 1 𝑡̅ (9) (10) Пусть тренд строится на основе последовательных годовых данных (например, t = 1990, 1991, 1992, …). Для удобства перенумеруем значения: t = 1, 2, 3 … . Обозначим: 𝑦𝑡 – наблюденное значение временного ряда за период t и T – общее число наблюдений во временном ряду (длина временного ряда). Тогда формулы (9) и (10) преобразуются к виду: 𝑏1 = 𝑇 𝑇 ∑𝑇 𝑡=1 𝑡∗𝑦𝑡 −(∑𝑡=1 𝑡 )(∑𝑡=1 𝑦𝑡 )/𝑇 2 𝑇 2 ∑𝑇 𝑖=1 𝑡 −(∑𝑡=1 𝑡) /𝑇 𝑏0 = 𝑦̅ − 𝑏1 ∗ 𝑡̅, где 𝑡̅ = (11) (12) 𝑦̅ − (𝑦1 + 𝑦2 + ⋯ + 𝑦𝑇 )/𝑇 1 + 2 + ⋯+ 𝑇 𝑇 + 1 = 𝑇 2 Прогнозный год следует нумеровать по той же системе. Если t = T – последний год в ряду наблюдений, на основе которых было получено уравнение (3), то прогнозируя в году T на k лет вперед, следует в уравнение (3) подставить значение t = T + k: 𝑦̂𝑇+𝐾 = 𝑏0 + 𝑏1 (𝑇 + 𝐾) Пример: Имеются данные за ряд лет численности работников одной компании: Год 1986 1987 1988 1989 1990 1991 19921 1993 Численность работников фирмы (тыс. чел) 1,1 2,4 4,6 5,4 5,9 8 9,7 11,2 Рис. 1.2. Временной ряд численности работников компании и сглаживающий линейный тренд На рис.1.2 явно просматривается линейный тренд. Найдем его параметры, используя формулы (11) и (12). Для этого закодируем значения независимой переменной t: t 1 𝒚𝒕 𝒚𝟏 = 𝟏, 𝟏 𝒚𝟐 = 2,4 𝒚𝟑 = 4,6 𝒚𝟒 = 𝟓, 𝟒 𝒚𝟓 = 5,9 𝒚𝟔 = 𝟖 𝒚𝟕 = 9,7 𝒚𝟖 = 𝟏𝟏, 𝟐 2 3 4 5 6 7 8 Предварительно вычислим: ∑ 𝒕=1+2+…+8 = 36 ∑ 𝒕𝟐 = 𝟏𝟐 +𝟐𝟐 +…+𝟖𝟐 =204 ∑ 𝒚𝒕 = 1,1 + 2,4 … + 11,2 = 48,3 ∑ 𝒕 ∗ 𝒚𝒕 = 𝟏 ∗ 𝟏, 𝟏 + 𝟐 ∗ 𝟐, 𝟒 + ⋯ + 𝟖 ∗ 𝟏𝟏, 𝟐 = 𝟐𝟕𝟔, 𝟑 𝒕̅ = (𝟖 + 𝟏)/𝟐=4,5 ̅= 𝒚 𝟒𝟖, 𝟑 = 𝟔, 𝟎𝟑𝟕𝟓 𝟖 Подставляя эти результаты промежуточных вычислений в формулы (11) и (12), получим: 𝒃𝟏 = 𝟐𝟕𝟔,𝟑−𝟑𝟔∗𝟒𝟖,𝟑/𝟖 𝟐𝟎𝟒−𝟑𝟔𝟐 /𝟖 = 𝟓𝟖,𝟗𝟓 𝟒𝟐 = 1,4036 𝒃𝟎 = 𝟔, 𝟎𝟑𝟕𝟓 − 𝟏, 𝟒𝟎𝟑𝟔 ∗ 𝟒, 𝟓 = −𝟎, 𝟐𝟕𝟗 Отсюда уравнение тренда будет иметь вид: ̂𝒕 = −𝟎, 𝟐𝟕𝟗𝟑 + 𝟏, 𝟒𝟎𝟒𝒕 𝒚 Спрогнозируем численность работников компании на 1994 г., полагая, что он соответствует t = T + 1 = 8 + 1= 9 ̂𝟗 = −𝟎, 𝟐𝟕𝟗 + 𝟏, 𝟒𝟎𝟒 ∗ 𝟗 = 𝟏𝟐, 𝟑𝟕𝟓 𝒚 Аналогичную процедуру перенумерации значений переменной t можно использовать при вычислении нелинейных трендов. Например, пусть требуется провести сглаживание временного ряда по параболе второго порядка: y = 𝒃𝟎 + 𝒃𝟏 𝒕 + 𝒃𝟐 𝒕𝟐 , В этом случае структура данных для исполнения МНК будет иметь вид: 𝒚𝒕 𝒚𝟏 𝒚𝟐 … 𝒚𝑻 t 1 2 … T 𝒕𝟐 1 4 … 𝑻𝟐 Система уравнений в этом случае записывается следующим образом: 𝒃𝟎 ∗ 𝑻 + 𝒃𝟏 ∗ ∑ 𝒕 + 𝒃𝟐 ∑ 𝒕𝟐 = ∑ 𝒚𝒕 𝒃𝟎 ∑ 𝒕 + 𝒃𝟏 ∑ 𝒕𝟐 + 𝒃𝟐 ∑ 𝒕𝟑 = ∑ 𝒚𝒕 ∗ 𝒕 𝒃𝟎 ∑ 𝒕𝟐 + 𝒃𝟏 ∑ 𝒕𝟑 + 𝒃𝟐 ∑ 𝒕𝟒 = ∑ 𝒚𝒕 ∗ 𝒕𝟐 Пример. Требуется проанализировать временной ряд электроэнергии в регионе: Годы 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 Потребление электроэнергии (млн.квт) 95 145 174 200 224 245 263 275 283 288 потребления Рис. 1.3. Пример параболической зависимости: потребление электроэнергии в регионе (млн кВт) На основе анализа данных временного ряда и его графика можно сделать предположение о криволинейности тренда: с течением времени потребление электроэнергии растет при убывающем приросте. Так прирост с 1989 до 1990 г. был 18; с 1990 до 1991 – 12 (12<18); с 1991 до 1992 – 8 (8<12); с 1992 до 1993 – 5 (5<8). Убывающий (или возрастающий) во времени прирост свидетельствует о квадратической зависимости: y = 𝑏0 + 𝑏1 𝑡 + 𝑏2 𝑡 2 . Закодируем и преобразуем переменные: 𝒚𝒕 95 145 174 … 288 t 𝒕𝟐 1 2 3 … 10 1 4 9 … 100 На основе преобразованных данных с помощью, нпример, Excell, вычислим уравнение: y = 58,6+44,048t – 2,1212 𝒕𝟐 Сделаем ретроспективный прогноз для t=2 (1985): y = 58,6+44,048*2 – 2,1212*4=138,2 Фактическое потребление электроэнергии в этот год составило 145 млн. квт. 1.3 Измерение циклической компоненты Практически любой временной ряд в бизнесе содержит элемент цикличности. Особенно цикличность присуща экономике, а также другим долговременным явлениям (например активность солнца). Одним из способов описания циклической компоненты является представление ее как доли тренда. Предположим, что рассматривается временной ряд, не содержащий сезонной составляющей. Например, таким будет ряд, основанный на годовых наблюдениях. В этом случае можно предположить, что каждый уровень ряда 𝑦 𝑡 является произведением компонент: 𝑦𝑡 = 𝑇𝑅 ∗ 𝐶𝑡 ∗ 𝐼𝑡 Пусть построена модель тренда 𝑦̂𝑡 = 𝑇𝑅𝑡 , Тогда оценка цикличности компоненты получается делением значения уравнения временного ряда на величину тренда: 𝑦𝑡 (𝑇𝑅𝑡 ∗ 𝐶𝑡 ∗ 𝐼𝑡 ) = = 𝐶𝑡 ∗ 𝐼𝑡 𝑦̂𝑡 𝑇𝑅𝑡 Если нерегулярная составляющая 𝐼𝑡 оказывает незначительное влияние на уровни временного ряда (методы исключения 𝐼𝑡 изложены ниже в параграфе 6), то ею можно пренебречь. Отсюда оценкой циклической компоненты будет соотношение: 𝒚 𝑪𝒕 = ̂𝒕 . 𝒚𝒕 (13) Если 𝐶𝑡 >1, то фактическое значение уровня ряда 𝑦𝑡 будет больше, чем оценочное значение тренда. Это означает, что величина циклической компоненты находится где-то над линией тренда. Аналогично, при 𝐶𝑡 <1 значения циклической компоненты будет ниже линии тренда. Пример. В предыдущем примере на основе временного ряда численности работников фирмы был вычислен линейный тренд: ̂𝒕 = −𝟎, 𝟐𝟕𝟗 + 𝟏, 𝟒𝟎𝟒 ∗ 𝐭 𝒚 где t = 1 соответствует 1986 г., t = 2 – 1987 г. и т.д. Определим циклическую компоненту. Для этого вычислим оценки 𝑦𝑡 при t = 1, 2, … , 8 и определим отношение (13). Результаты вычислений сведем в нижеследующую таблицу: t 𝒚𝒕 1 1,1 2 2,4 3 4,6 4 5,4 5 5,9 6 8 7 9,7 8 11,2 Как видно, для первого периода оценка ̂𝒕 ̂𝒕 𝒚 𝑪𝒕 ≈ 𝒚𝒕 /𝒚 1,125 0,977 2,529 0,949 3,933 1,169 5,337 1,012 6,741 0,875 8,145 0,982 9,549 1,016 10,953 1,022 циклической компоненты равна 0,977. Это означает, что фактически значение уровня составляет 97,7% трендового значения. Аналогично для второго периода – 94,9%, для третьего – 116,9% и т.д. Флуктуация циклической компоненты вдоль тренда хорошо видна на рис. 1.4 Рис. 1.4. График циклической компоненты временного ряда численности работников Начало цикла характеризуется значением С𝑡 = 1. Пик цикла приходится на t=3 (1988 г.), минимум – на t=5 (1990 г.) и завершение (когда опять С𝑡 = 1) – где-то между t=6 (1991 г.) и t=7 (1992 г.) Следует отметить, что на практике прогнозирование циклов является достаточно сложной задачей. Предсказать период цикла, используя данные временного ряда, практически невозможно. Выделение циклической компоненты может помочь при установлении стадий, на которой находится деловая активность. 1.4 Определение сезонной составляющей Сезонная компонента проявляется, когда временной ряд соответствует квартальным или месячным наблюдениям. Рассматриваем уровень ряда только как результирующую сезонности и тренда, т.е. представим его как произведение тренда и сезонной компоненты: ̂𝒕 = 𝑻𝑹𝒕 ∗ 𝑺𝒕 𝒚 (14) Из соотношения (14) видно, что сезонность можно рассматривать как индекс, который умножается на величину тренда. Этот индекс остается постоянным каждый год, для определенной части года. Например, если имеет место квартальная сезонность, то 𝑺𝟏 = 𝑺𝟓 = 𝑺𝟗 и т.д.; 𝑺𝟐 = 𝑺𝟔 = 𝑺𝟏𝟎 = ⋯ и т. д. Способом вычисления индекса сезонности является метод отношения к центрированной скользящей средней (ЦСС). Проиллюстрируем его на конкретном примере. Пример. Ниже в таблице 1.1 приведены квартальные данные о продажах фирмы 1990-1993 гг. (в млн долларах), где в скобках указаны обозначения соответствующих уровней временного ряда. Квартальные данные об объемах продаж (млн. долл.) Таблица 1.1 Квартальные данные об объёме продаж (млн. долл.) Год 1990 1991 1992 1993 1 квартал 2 квартал 3 квартал 4 квартал 20 (у𝟐 ) 12(у𝟐 ) 47(у𝟑 ) 60(у𝟒 ) 40 (у𝟓 ) 32(у𝟔 ) 65(у𝟕 ) 76(у𝟖 ) 56 (у𝟗 ) 50(у𝟏𝟎 ) 85(у𝟏𝟏 ) 100(у𝟏𝟐 ) 75 (у𝟏𝟑 ) 70(у𝟏𝟒 ) 101(у𝟏𝟓 ) 123(у𝟏𝟔 ) Будем находить индекс сезонности для каждого квартала в течении года, т.е. вычислим четыре значения индекса. Идея метода отношения к центрированной скользящей средней (ЦСС) в том, что в начале на основе исходного временного ряда определяется новый временной ряд, не содержащий компоненту сезонности. Уровни нового ряда рассчитываются как центрированные скользящие средние. Для вычисления центрированных скользящих средних, определяются так называемые скользящие суммы (СС). Для квартальной сезонности первая скользящая сумма будет включать значения первых четырёх квартальных уровней исходного временного ряда: (1) = 𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑 + 𝒚𝟒 = 𝟐𝟎 + 𝟏𝟐 + 𝟒𝟕 + 𝟔𝟎 = 𝟏𝟑𝟗 Во вторую скользящую сумму входят первые четыре уровня ряда сдвинутого на один квартал вперед: (2) = 𝒚𝟐 + 𝒚𝟑 + 𝒚𝟒 + 𝒚𝟓 = 12+47+60+40=159 Третья скользящая сумма определяется аналогично при сдвиге уровней на два квартала вперед: (3) = 𝒚𝟑 + 𝒚𝟒 + 𝒚𝟓 + 𝒚𝟔 =47+60+40+32=179 Продолжая эту процедуру, получим 13 скользящих сумм, где последняя сумма вычисляется как: (13) = 𝒚𝟏𝟑 + 𝒚𝟏𝟒 + 𝒚𝟏𝟓 + 𝒚𝟏𝟔 = 𝟕𝟓 + 𝟕𝟎 + 𝟏𝟎𝟏 + 𝟏𝟐𝟑 = 369 Таблица 1.2 Вычисление центрированных скользящих средних Год Квартал t 𝑦𝑡 1990 1 1 20 2 2 12 139 - - 3 3 47 159 37,25 1,26 4 4 60 179 42,25 1,42 1 5 40 197 47,00 0,85 2 6 32 213 51,25 0,62 3 7 65 229 55,25 1,18 4 8 76 247 59,50 1,28 1 9 56 267 64,25 0,87 2 10 50 291 69,75 0,72 3 11 85 310 75,13 1,13 4 12 100 330 80,00 1,25 1 13 75 346 84,50 0,89 1991 1992 1993 Скользяща Центрированная Отношение к я сумма скользящая центрированной сумма скользящей сумме - 2 14 70 369 89,38 0,78 3 15 101 - - - 4 16 123 - Каждая скользящая сумма будет относиться к моменту времени, находящемуся посередине между периодами, на основании которых она была рассчитана. Если на основании каждой скользящей суммы вычислить квартальные средние (т.е. скользящие средние, полученные делением скользящей суммы на 4), то полученные величины будут относиться к моментам между кварталами. Например, первая скользящая средняя соответствует моменту между t=2 и t=3, то есть t=2,5 (конец июня – начало июля 1990 г.). Аналогично вторая скользящая сумма относится к t=3,5 ( конец сентября – начало октября 1990 г.) и так далее. Для того, чтобы скользящая средняя относилась к периоду t (в данном случае к середине квартала t), следует вычислить двухлетние скользящие суммы (последовательно суммируя две соседние четырехквартальные скользящие суммы) и разделить их на 8. Например, вычислим первую скользящую квартальную среднюю, центрированную на середину квартала t=3: (139 + 159)/8 = 37,25 Аналогично для t=4 имеем: (159+179)/8 = 42,25 и т.д. С помощью данной процедуры вычисляются 12 центрированных скользящих средних, приведенных ранее в табл. 1.2. Понятно, что их расчёт для t=1,2 и t=15,16 невозможен. Заметим, что первые два значения из них соответствуют кварталам 1 и 2, а последние два – кварталам 3 и 4. В общем случае, если временной ряд содержит Т наблюдений, то для определения квартальной сезонности можно вычислить Т – 4 центрированных скользящих средних. Скользящая сумма и центрированные скользящие средние определяются суммированием за четыре квартала (сезона). Поэтому они не содержат уже сезонной составляющей. В результате усреднения снижается так же влияние нерегулярной компоненты 𝐼𝑡 . Чтобы отметить этот факт, будем нерегулярную компоненту обозначать малой буквой 𝑖𝑡 . Тогда можно записать: центрированная скользящая средняя (ЦСС) на момент t: 𝑇𝑅𝑡 *𝐶𝑡 (15) Процедура получения центрированной скользящей средней, по существу, является сглаживанием временного ряда. Она позволяет установить существование тренда, а так же выявить его форму (прямая или кривая линия). ЦСС, представленные выше в таблице, характеризуют стабильно возрастающий тренд. Ввиду того, что разности между соседними средними почти одинаковы, тренд будет очень близок к линейному. Это можно наблюдать на рис. 1.5, приведённом ниже. Рис. 1.5. Сглаживание временного ряда объёмов продаж (ед.) на основе скользящих средних Для определения четырёх квартальных сезонных индексов следует разделить значение продаж фирмы (ед.) на основе скользящих средних каждого уровня yt на соответствующую центрированную скользящую среднюю. Исходя из (15)эта операция в символической форме будет иметь вид: 𝑦𝑡 𝑇𝑅 ∗ 𝑆 ∗ 𝐶𝑡 ∗ 𝐼𝑡 ⁄𝑇𝑅 ∗ 𝐶 = 𝑆 ∗ 𝐼 т ⁄ЦСС = 𝑡 𝑡 𝑡 𝑡 𝑡 𝑡 (16) Как видно, вычисление соотношения (16) выявляет сезонный эффект в совокупности с нерегулярной составляющей В упомянутой выше таблице 1.2 представлены отношения (16) для периодов t=3,4,5,…,14 Они определились следующим образом: t = 3: 47/37,25 = 1,26 (3 квартал 1990 г.); t = 4: 60/42,25 = 1,42 (4 квартал 1990 г.); t = 14: 70/89,38=0,78 (2 квартал 1993 г.). Сведем все 14 отношений по кварталам и вычислим средние значения по каждому кварталу ( табл. 1.3). Эти средние значения будем рассматривать в качестве соответствующих индексов. Таблица 1.3 Вычисление квартальных индексов сезонности 1 квартал 2 квартал 3 квартал 4 квартал - - 1,26 1,42 0,85 0,62 1,18 1,28 0,87 0,72 1,13 1,25 0,89 0,78 - - Сумма 2,61 2,12 3,57 3,95 Средняя 0,87(2,61/3) 0,707(2,12/3) 1,190(3,57/3) 1,317(3,95/3) Данная процедура позволяет значительно сократить эффект воздействия нерегулярной компоненты и получить практически в чистом виде квартальные индексы сезонности. Они имеют следующую интерпретацию: каждый индекс представляет собой отклонение среднего значения уровня по данному кварталу к общему среднеквартальному уровню временного ряда. Если значения индекса меньше 1, то средний объём продаж в данном квартале меньше ¼ среднегодового объёма продаж за все периоды временного ряда. Если индекс больше 1, то средний объём продаж в данном квартале превышает ¼ среднегодового объёма продаж. В случае, когда индекс равен 1, средний объём продаж по кварталу в точности равен ¼ среднегодового объёма продаж. Очевидно, средняя всех квартальных индексов есть1, иначе сумма средних квартальных объёмов продаж не будет равна среднегодовым продажам. Следовательно, сумма всех полученных квартальных индексов равна 4. Однако, как правило, возможны погрешности, связанные с округлением результатов вычислений. Поэтому следует проверить точность расчетов и скорректировать полученные значения. Для этого определяем корректирующий множитель, который равен отношению 4 к сумме вычисленных индексов. На него умножается значения каждых из четырёх квартальных индексов. Сумма скорректированных индексов должна быть равна 4. Определим сумму квартальных индексов, вычисленных в табл. 1.3: 0,87 + 0,707 + 1,190 + 1,317 = 4,084 Найдем корректирующий множитель: 4/4,084 = 0,9794 Скорректируем квартальные индексы: Квартал 1 2 3 4 Скорректированные индексы сезонности 0,87*0,9794=0,852 0,707*0,9794=0,692 1,190*0,9794=1,166 1,317*0,9794=1,290 4 Индексы сезонности часто измеряют в процентах. Например, индекс первого квартала равен 0,852104 и это 85,2%. Это означает, что средний объём продаж в первом квартале на 14,8% меньше ¼ среднегодового объёма продаж. Индекс третьего квартала, равный 116,6% означает, что средний объём продаж по третьему кварталу на 16,6% больше ¼ среднегодового объёма продаж. В рассмотренном примере анализировалась квартальная сезонная компонента. Аналогичные заключения будут верны и для месячной сезонности, когда временной ряд содержит месячные данные. При определении месячных индексов сезонности (их будет 12), вычисляются двенадцатимесячные скользящие суммы и центрированные скользящие средние. Если T - длина временного ряда, то число полученных скользящих средних = T-12. При корректировке вычисленных индексов следует иметь в виду, что их сумма должна быть равна 12. 1.5 Десезонализация данных и сезонное прогнозирование Десезонализация данных временного ряда называется устранение влияния сезонной компоненты на его уровни с целью изучения тренда и долговременных циклических изменений. Десезонализирование данных (𝑑𝑡 ) определяется как отношение: 𝑑𝑡 = 𝒚𝒕 /соответствующий сезонный индекс 𝑆𝑡 = 𝑇𝑅𝑡 ∗ 𝑆𝑡 * С𝑡 * 𝐼𝑡 /𝑆𝑡 = = 𝑇𝑅𝑡 ∗ С𝑡 * 𝐼𝑡 (17) Пример. Вычислим десезонализированные объемы продаж для временного ряда, рассмотренного в предыдущем примере, полученные результаты сведем в таблицу 1.4 Таблица 1.4 Вычисление десезонализированных данных Год t yt 1990 1 2 3 4 5 6 7 8 9 10 20 12 47 60 40 32 65 76 56 50 1991 1992 Индекс Десезонолизированные сезонности(St) данные (dt=yt/St) 0,852 23,47 0,692 17,34 1,166 40,31 1,290 46,51 0,852 46,95 0,692 46,24 1,166 55,75 1,290 58,91 0,852 65,73 0,692 72,25 11 12 13 14 15 16 1993 85 100 75 70 101 123 Десезонализированные 1,166 1,290 0,852 0,692 1,166 1,290 данные в 72,90 77,52 88,03 101,16 86,62 95,35 таблице 1.4 содержат тренд, циклическую и нерегулярную составляющие. При сравнении с фактическими значениями уравнений (𝒚𝒕 ) можно видеть, что тренд более чётко проявляется в десезонализированных данных. Десезонализированные значения могут служить исходной информацией для оценки тренда: 𝑇𝑅𝑡 = b0 + b1 ∗ t. Для получения параметров 𝑏0 и 𝑏1 , следует только подставить в формулы (11) и (12) вместо фактических значений 𝑦𝑡 десезонализированные значения (𝑑𝑡 ): 𝑏1 = ∑ 𝑡∗𝑑𝑡 −(∑ t)(∑ dt )/T ∑ 𝑡 2 −(∑ 𝑡)2 /𝑇 𝑏0 = 𝑦̅𝑡 − 𝑏1 ∗ 𝑡̅ Зная индексы сезонности, тренд (18) (19) мы можем использовать в прогнозировании. Для этого нужно прогнозный период определить в закодированном виде (т.е продолжить исходный временной ряд до прогнозного периода и подсчитать его номер в общем ряду). Далее, следует подставить полученное значение периода в уравнение тренда и определить десезонолизированный прогноз, который умножается на соответствующий прогнозному периоду индекс сезонности. Пример. Вычислим тренд на основе десезонолизированных данных таблицы 1.4 и спрогнозируем объем продаж на 1 и 2 квартал 1994 года. Используя программное обеспечение, вычислим оценку тренда: 𝑇𝑅𝑡 = 19,372 + 5,0375 ∗ 𝑡 Уравнение тренда было построено на основе данных, «очищенных» от влияния сезонности. Коэффициент регрессий b=5,0375 свидетельствует, что продажи возрастают в среднем приблизительно на 5 млн. долл. в квартал. С помощью уравнения тренда и индексов сезонности можно спрогнозировать объём продаж для заданного квартала в конкретном прогнозном году. Например, сделаем прогноз на первый и второй кварталы 1994 г. По таблице 1.4 первому кварталу 1994 г. соответствует t=17, а второму кварталу – t=18. Используя индекс сезонности для первого квартала S1=0,852 для второго квартала – S2=0,692. Вычислим прогнозные оценки: ŷ 17 = TR 17 ∗ S1 = (19,372+5,0375*17)*0,852=89,5 (млн. долл.) ŷ 18 = TR 18 ∗ S2 =((19,372+5,0375*18)*0,692=76,2 (млн. долл.) 1.6 Процедура общей декомпозиции временного ряда В предыдущих разделах данной главы мы рассматривали отдельные действия по оценке каждой компоненты временного ряда. Эти действия можно рассматривать как этапы процедуры общей декомпозиции временного ряда. Этап 1. Определение методом отношения к центрированной скользящей средней сезонного индекса 𝑆𝑡 для каждой части года. Для квартальных данных вычисления сводятся к нахождению 4-х квартальных индексов 𝑆1 , 𝑆2 , 𝑆3 , 𝑆4 . В случае месячных наблюдений определяется 12 индексов (𝑆1 , 𝑆2 , … , 𝑆12 ) ( для каждого месяца свой индекс). Этап 2. Десезонализация данных. Этот этап заключается в выравнивании эффекта сезонности, т.е. исключение сезонной компоненты. Десезонализация осуществляется делением каждого фактического уровня на соответствующий сезонный индекс: 𝑑𝑡 = 𝑦𝑡 /𝑆𝑡 , где 𝑆𝑡 - месячные и квартальные данные 𝑆 ,𝑆 ,𝑆 ,𝑆 𝑆𝑡 = { 1 2 3 4 } 𝑆1 , 𝑆2 , … , 𝑆12 Этап 3. Определение тренда 𝑇𝑅𝑡 . Оценка тренда осуществляется по методу наименьших квадратов на основе десезонализированных данных 𝑑𝑡 : 𝑑𝑡 = 𝑦𝑡 𝑆𝑡 = 𝑇𝑅𝑡 ∗𝑆𝑡 ∗𝐶𝑡 ∗𝐼𝑡 𝑆𝑡 = 𝑇𝑅𝑡 ∗ 𝐶𝑡 ∗ 𝐼𝑡 . Этап 4. Определение циклической компоненты 𝐶𝑡 . Эта компонета определяется делением каждой десезонализированной компоненты 𝑑𝑡 на соответствующие значения тренда, полученное на этапе 3: 𝑑𝑡 𝑇𝑅𝑡 = 𝑇𝑅𝑡 ∗𝐶𝑡 ∗𝐼𝑡 𝑇𝑅𝑡 = 𝐶𝑡 ∗ 𝐼𝑡 . Для исключения нерегулярной компоненты можно вычислять, например, трёхпериодные скользящие средние для величин 𝐶𝑡 ∗ 𝐼𝑡 . В этом случае эффект нерегулярной компоненты значительно сокращается. Выбор именно трёхпериодной скользящей средней был произволен. Он был связан с тем, что в случае нечётного числа слагаемых скользящей суммы скользящие средние не надо центрировать Все этапы композиции подробно рассмотрим на следующем примере. Пример. Ниже в таблице 1.5 представлены месячные данные об объёме розничной торговли сети магазинов за период с января 1989 г. по декабрь 1992 г. (тыс. долл.). Таблица 1.5 Данные об объёме розничной торговли сети магазинов 1989 1990 1991 1992 Январь 123,81 133,29 130,90 142,12 Февраль 120,11 128,03 128,59 143,15 Март 141,37 149,19 149,30 154,74 Апрель 139,78 145,80 148,51 159,07 Май 150,26 155,02 159,84 165,76 Июнь 149,00 154,37 153,91 164,63 Июль 144,55 149,72 154,64 166,01 Август 153,03 158,24 159,91 166,34 Сентябрь 144,08 146,34 146,70 160,61 Октябрь 142,34 151,47 152,11 168,73 Ноябрь 148,83 156,09 155,64 167,18 Декабрь 176,49 179,65 180,98 204,10 Используя данные таблице 1.5 , проведём поэтапную декомпозицию временного ряда. Этап 1. Определим индексы сезонности. Вычислим 12-ти месячные скользящие суммы и центрированные скользящие средние для 48 наблюдений, представленных в таблице 1.5. Все результаты вычислений сведём в таблицу 1.6. Определим первую скользящую сумму: 𝑦1 + 𝑦2 + ⋯ + 𝑦12 = 123,81+120,11+…+176,49=1733,65 Она будет соответствовать середине промежутка t=6 и t=7, т.е. t=6,5. Вторая скользящая сумма вычисляется так: 𝑦2 + 𝑦3 + ⋯ + 𝑦13 =120,11+141,37+…+133,39=1743,13. Её величина соответствует моменту t=7,5. Определим первую центрированную скользящую среднюю: (1733,65+1743,13)/24=144,87 Отметим, что произведение делится на 24, так как именно столько месяцев входит в качестве слагаемых в обе суммы. Аналогично вычислим оставшиеся скользящие суммы (колонка 3 таблицы 1.6) Ввиду того, что данные – месячные, центрированные скользящие средние не вычисляются для периодов с t=1 по t=6 и с t=43 по t=48. Колонку 5 таблицы 1.6 оставляют отношения фактических данных к центрированным скользящим средним. Например, первые два отношения вычисляются следующим образом: 144,55/144,87=0,998 153,03/145,59=1,051 и т.д. Таблица 1.6 Скользящие средние и отношения к скользящим средним для месячных данных о розничной торговле сети магазинов Год Месяц t (1) 𝑦𝑡 (2) Скользящая Центрированная Отношение к сумма скользящая центрированной (3) сумма (4) скользящей средней (5) 1989 1990 1991 1992 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 123,81 120,11 141,37 139,78 150,26 149,00 144,55 153,03 144,08 142,34 148,83 176,49 133,29 128,03 149,19 145,80 155,02 154,37 149,72 158,24 146,34 151,47 156,09 179,65 130,90 128,59 149,30 148,51 159,84 153,91 154,64 159,91 146,70 152,11 155,64 180,98 142,12 143,15 154,74 159,07 165,76 164,63 166,01 166,34 160,61 168,73 167,18 204,10 1733,65 1743,13 1751,05 1758,87 1764,89 1769,65 1775,02 1780,19 1787,66 1796,79 1804,05 1807,21 1804,82 1804,38 1805,49 1805,49 1808,20 1812,56 1817,48 1819,15 1819,48 1820,15 1819,48 1820,15 1819,70 1821,03 1832,25 1846,81 1852,25 1862,81 1868,73 1879,45 1890,82 1897,25 1911,16 1927,78 1939,32 1962,44 144,87 145,59 146,25 146,82 147,27 147,69 148,13 148,57 148,88 149,35 150,03 150,47 150,50 150,42 150,45 150,57 150,88 151,07 151,25 151,53 151,61 151,65 151,66 151,70 152,22 153,29 154,13 154,79 155,48 156,17 157,09 157,84 158,68 159,96 161,13 162,57 0,998 1,051 0,985 0,969 1,011 1,195 0,900 0,862 1,002 0,976 1,033 1,026 0,995 1,052 0,973 1,006 1,035 1,189 0,865 0,849 0,985 0,979 1,054 1,015 1,016 1,043 0,952 0,983 1,001 1,159 0,905 0,907 0,975 0,994 1,029 1,013 Сведём отношения в таблицу 1.7, где вычислим значения каждых трёх отношений, соответствующих определённому месяцу. Таблица 1.7 Отношения к центрированным скользящим средним и их средние значения Месяц (период) год 1 2 3 4 5 6 7 8 9 10 11 12 1 - - - - - - 0,998 1,051 0,985 0,969 1,011 1,195 2 0,9 0,862 1,002 0,976 1,033 1,026 0,995 1,052 0,973 1,006 1,035 1,189 3 0,865 0,849 0,985 0,979 1,054 1,015 1,016 1,043 0,952 0,983 1,001 1,159 4 0,905 0,907 0,975 0,994 1,029 1,013 - - - - - - средняя 0,890 0,872 0,987 0,983 1,039 1,018 1,003 1,049 0,970 0,986 1,015 1,181 Определим сумму средних отношений: 0,890+0,872+…+1,181=11,993 Отсюда, корректирующий множитель для индексов сезонности равен: 12/11,993. Вычислим индексы сезонности: Для 𝑆1 =0,890*(12/11,993)=0,89 (январь) Для 𝑆2 =0,872*(12/11,993)=0,87 (февраль) … Для 𝑆12 =1,181*(12/11,993)=1,18 (декабрь). Индексы сезонности по месяцам представлены в таблице 1.8. Таблица 1.8 Индексы сезонности по месяцам Месяц Индекс сезонности Месяц Индекс сезонности Январь 0,89 Июль 1,00 Февраль 0,87 Август 1,05 Март 0,99 Сентябрь 0,97 Апрель 0,98 Октябрь 0,99 Май 1,04 Ноябрь 1,02 Июнь 1,02 Декабрь 1,18 Сумма сезонных индексов (𝑆1 +𝑆2 +…+𝑆12 )=12, как видно из таблицы 1.8 наблюдений, индекс относится к декабрю и равняется 1,18. Это означает, что пик розничной торговли приходится на декабрь. В январе и феврале наблюдается спад розничной торговли (самые низкие индексы сезонности). В оставшихся месяцах индекс сезонности незначителен, т.е. индексы близки к единице. Этап 2. Определим десезонализированные данные. Они получаются делением фактического уровня на соответствующие индексы сезонности: 𝑦 𝑑𝑡 = 𝑡⁄𝑠𝑡 Эти данные представлены в таблице 1.9. Таблица 1.9 Десезонализированные месячные данные объёмов розничной торговли сети магазинов Год 1989 1990 1991 Месяц 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 𝒚𝒕 123,81 120,11 141,37 139,78 150,26 149,00 144,55 153,03 144,08 142,34 148,83 176,49 133,29 128,03 149,19 145,80 155,02 154,37 149,72 158,24 146,34 151,47 156,09 179,65 130,90 128,59 149,30 148,51 159,84 153,91 154,64 159,91 𝒔𝒕 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 𝒚 𝒅𝒕 = 𝒕⁄𝒔𝒕 139,04 137,59 143,10 142,07 144,59 146,32 144,06 145,84 148,47 144,28 146,50 149,36 149,69 146,67 151,02 148,19 149,17 151,60 149,21 150,80 150,80 153,53 153,64 152,03 147,00 147,31 151,13 150,95 153,81 151,15 154,12 152,39 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1992 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 146,70 152,11 155,64 180,98 142,12 143,15 154,74 159,07 165,76 164,63 166,01 166,34 160,61 168,73 167,18 204,10 0,97 0,99 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 151,17 154,18 153,20 153,16 159,60 163,99 156,64 161,68 159,51 161,67 165,45 158,52 165,50 171,02 164,56 172,72 В изменённых десонализированных данных, мы видим, как вполне отчётливо проявляется тренд. Этап 3. Определим трнед методом наименьших квадратов на имеющихся десезоналированных данных. Для этого воспользуемся формулами (18) и (19). В таблице 1.10 представлены промежуточные вычисления (ясно, что такие расчеты будем выполнять в Excel). Таблица 1.10 Промежуточные вычисления для определения тренда t 𝒅𝒕 t*𝒅𝒕 𝒕𝟐 1 139,04 139,04 1 2 137,59 275,18 4 3 143,10 429,30 9 4 142,07 568,28 16 … … … … 45 165,50 7447,50 2025 46 171,02 7866,92 2116 47 164,56 7734,32 2209 48 172,72 8290,56 2304 1176 73,18,00 183888,34 38024 Подставим результаты промежуточных вычислений из таблицы 1.10 в формулы (18) и (19): 183888,34 − 1176 ∗ 17318/48 = 0,499 11762 38024 − 48 b0 = 7318⁄48 − 0,499 ∗ 1176⁄48 = 140,23 𝑏1 = Таким образом, уравнение тренда будет иметь вид: ̂𝒕 =140,23+0,499*t 𝑻𝑹 = 𝒅 В среднем, без учёта сезонных колебаний объём продаж розничной торговли возрастает на 499 тыс. долл. в месяц. Этап 4. Определим циклическую компоненту. Вычислим значения TR для всех t: ̂1 = 140,23 + 0,499 ∗ 1 = 140,23 𝑑 ̂2 = 140,23 + 0,499 ∗ 2 = 141,23 𝑑 … 𝑑̂ 48 = 140,23 + 0,499 ∗ 48 = 164,19 Разделим каждое десезонализорованное значение на ̂𝑡 ): соответствующую оценку тренда (𝑑 𝑑𝑡 𝑑𝑡 𝑇𝑅𝑡 ∗ 𝐶𝑡 ∗ 𝐼𝑡 = = ⁄𝑇𝑅 = 𝐶𝑡 ∗ 𝐼𝑡 ̂𝑡 𝑡 𝑇𝑅𝑡 𝑑 Результирующие величины содержат нерегулярную компоненту 𝐼𝑡 . Для её устранения вычислим 3-х месячные скользящие средние для значений 𝐶𝑡 и 𝐼𝑡 . Результаты вычислений представлены в таблице 1.11. Таблица 1.11 Вычисление циклической компоненты для временного ряда объёмов розничной торговли сети магазинов Год Месяц 𝒅𝒕 ̂𝒕 (𝑻𝑹𝒕 ) 𝒅 𝒅𝒕 ⁄̂ = 𝑪𝒕 ∗ 𝑰𝒕 𝒅𝒕 𝑪𝒕 1989 1 2 3 4 5 6 7 8 139,04 137,59 143,10 142,07 144,59 146,32 144,06 145,84 140,73 141,23 141,73 142,23 142,73 143,23 143,72 144,22 0,9880 0,9743 1,0097 0,9989 1,0131 1,0216 1,0023 1,0112 0,99 0,99 1,01 1,01 1,01 1,01 1,01 1990 1991 1992 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 148,47 144,28 146,50 149,36 149,69 146,67 151,02 148,19 149,17 151,60 149,21 150,80 150,80 153,53 153,64 152,03 147,00 147,31 151,13 150,95 153,81 151,15 154,12 152,39 151,17 154,18 153,20 153,16 159,60 163,99 156,64 161,68 159,51 161,67 165,45 158,52 165,50 171,02 164,56 172,72 144,72 145,22 145,72 146,22 146,72 147,22 147,72 148,22 148,71 149,21 149,71 150,21 150,71 151,21 151,71 152,21 152,71 153,21 153,71 154,20 154,70 155,20 155,70 156,20 156,70 157,20 157,70 158,20 158,70 159,20 159,69 160,19 160,69 161,19 161,69 162,19 162,69 163,19 163,69 164,19 1,0259 0,9935 1,0053 1,0215 1,0202 0,9962 1,0224 0,9998 1,0031 1,0160 0,9967 1,0039 1,0006 1,0153 1,0127 0,9988 0,9626 0,9615 0,9832 0,9789 0,9942 0,9739 0,9898 0,9756 0,9647 0,9808 0,9715 0,9681 1,0057 1,0301 0,9809 1,0093 0,9926 1,0030 1,0232 0,9774 1,0173 1,0480 1,0053 1,0520 1,01 1,01 1,01 1,02 1,01 1,01 1,01 1,01 1,01 1,01 1,01 1,00 1,01 1,01 1,01 0,99 0,97 0,97 0,97 0,99 0,98 0,99 0,98 0,98 9,97 0,97 0,97 0,98 1,00 1,01 1,01 0,99 1,00 1,01 1,00 1,01 1,01 1,02 1,04 - Для пояснения того, как определились 3-х месячные скользящие средние, вычислим скользящую среднюю, соответствующую периоду t=2: 𝐶2 =(0,988+0,9743+1,0097)/3=0,99. Анализ циклической компоненты показывает, что в этой сети наблюдается спад с декабря 1990 г. по декабрь 1991 (𝐶𝑡 <1). Если известны 3 компоненты: тренд, циклическая компонента и сезонная, то можно выразить четвёртую нерегулярную компоненту 𝐼𝑡 из следующего соотношения: 𝐼𝑡 = 𝑦𝑡 ⁄𝑇𝑅 ∗ 𝐶 ∗ 𝑆 𝑡 𝑡 𝑡 Определим все компоненты для периода t=9 (сентябрь 1989 г.). Из таблицы 1.11 возьмём значения тренда 𝑇𝑅9 =144,72. В таблице 1.8 найдём сезонную компоненту 𝑆9 =0,97 и в таблице 1.11 – циклическую компоненту 𝐶9 =1,01, перемножим эти компоненты: 𝑆9 ∗ 𝑇𝑅9 ∗ 𝐶9 =0,97*144,72*1,01=141,782. Выделим нерегулярную компоненту: 𝑦 𝐼9 = 9⁄𝑆 ∗ 𝑇𝑅 ∗ 𝐶 =144,08/141,782=1,0162. 9 9 9 Таким образом, фактическое значение уровня временного ряда в период t=9 можно представить в виде произведения 4-х компонент: 𝑦9 = 144,08 = 𝑇𝑅9 ∗ 𝑆9 ∗ 𝐶9 ∗ 𝐼9 =0,97*144,72*1,01*1,0162=144,079 Если проделать данную процедуру для всех уровней, то мы получим полную декомпозицию временного ряда (таблица 1.12). Таблица 1.12 Компоненты временного ряда объёмов розничной торговли сети магазинов Год Месяц 𝒚𝒕 𝑻𝑹𝒕 𝑺𝒕 𝑪𝒕 𝑰𝒕 1989 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 123,81 120,11 141,37 139,78 150,26 149,00 144,55 153,03 144,08 142,34 148,83 176,49 133,29 128,03 149,19 145,80 155,02 154,37 149,72 158,24 146,34 151,47 140,73 141,23 141,73 142,23 142,73 143,23 143,72 144,22 144,72 145,22 145,72 146,22 146,72 147,22 147,72 148,22 148,71 149,21 149,71 150,21 150,71 151,21 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 0,99 0,99 1,01 1,01 1,01 1,01 1,01 1,01 1,01 1,01 1,02 1,01 1,01 1,01 1,01 1,01 1,01 1,01 1,00 1,01 1,01 0,98 1,02 0,99 1,00 1,01 0,99 1,00 1,02 0,99 1,00 1,01 1,01 0,98 1,02 0,99 1,00 1,01 0,99 1,00 0,99 1,01 1990 1991 1992 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 156,09 179,65 130,90 128,59 149,30 148,51 159,84 153,91 154,64 159,91 146,70 152,11 155,64 180,98 142,12 143,15 154,74 159,07 165,76 164,63 166,01 166,34 160,61 168,73 167,18 204,10 151,71 152,21 152,71 153,21 153,71 154,20 154,70 155,20 155,70 156,20 156,70 157,20 157,70 158,20 158,70 159,20 159,69 160,19 160,69 161,19 161,69 162,19 162,69 163,19 163,69 164,19 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 0,89 0,87 0,99 0,98 1,04 1,02 1,00 1,05 0,97 0,99 1,02 1,18 1,01 0,99 0,97 0,97 0,97 0,99 0,98 0,99 0,98 0,98 0,97 0,97 0,97 0,98 1,00 1,01 1,01 0,99 1,00 1,01 1,00 1,01 1,01 1,02 1,04 - 1,00 1,01 0,99 0,99 1,01 0,99 1,01 0,99 1,01 1,00 0,99 1,01 1,00 0,99 1,00 1,02 0,97 1,02 0,99 1,00 1,02 0,97 1,00 1,02 0,97 - Графики построены (рис. 1.6.) для у𝑡 и 𝑇𝑅 𝑡 как функции от t F(t), C(t) и I(t) от времени. Рис. 1.6. Графики компонент временного ряда объёмов розничной торговли сети магазинов 2 Статистические методы и модели в прогнозировании Введение. До сих пор мы использовали регрессивные модели временных рядов. Были также затронуты вопросы использования этих моделей в прогнозировании. При этом отмечалось, что методологической базой процедур прогнозирования является экстраполяция, т.е. перенесение закономерностей, которые проявились в изменении данных за прошлые периоды времени, в будущее. В процессе прогнозирования временная последовательность значений зависимой переменной y всегда делится на две части – прогнозные значения, которые генерируются с помощью вычислительных процедур, и фактические данные, которые наблюдаются (рис.1). Период осуществления прогноза Прошлые периоды t Прогнозные периоды … , 𝑦𝑡−3 , 𝑦𝑡−2 , 𝑦𝑡−1 𝑦𝑡 … , 𝑦𝑡+1 , 𝑦𝑡+2 , 𝑦𝑡+3 Рис. 1. Временная последовательность значений зависимой переменной y в процессе прогнозирования ( 𝑦𝑡 – ближайшее наблюденное значение y; 𝑦𝑡+1 – прогноз на один период) Использование уравнения регрессии в качестве модели прогнозирования предполагает, что изменение зависимой переменной (прогнозируемого показателя) объясняется одной или несколькими независимыми переменными. Основное преимущество данного типа моделей состоит в том, что измеряется эффект от варьирования объясняющих переменных. Кроме того, конечный результат прогнозирования имеет ясную и наглядную интерпретацию для анализа: указываются факторные переменные, которые предположительно влияют на зависимую переменную. Однако использование регрессионных моделей предполагает в свою очередь прогнозирование значений объясняющих переменных. Во многих случаях для факторных переменных существует такая же неопределенность, как и для зависимой переменной. Прогнозирование с помощью методов, анализа временных рядов является чистой экстраполяцией, когда закономерность изменения прогнозируемого показателя за прошлые периоды времени в точности переносятся на будущее. На первый взгляд может показаться, что методы анализа временных рядов значительно проще использовать в прогнозировании, чем регрессионные модели. По крайней мере, не нужно проводить исследования для определения объясняющих переменных и набирать необходимые данные по каждой из них. Однако часто для выявления сложностей структуры взаимозависимых уровней временного ряда требуется построение неординарных прогнозных уровней. В данной главе рассмотрим более подробно различные способы и модели прогнозирования, основанные на методах анализа временных рядов и регрессионного анализа. 2.1 Простейшие модели Наиболее простой («наивный») способ прогнозирования заключается в предположении, что текущее значение является наилучшим предсказателем для будущего. Простейшая модель в этом случае имеет вид: 𝑦̂𝑡+1 = 𝑦𝑡 𝑦̂𝑡+1 (1) – прогнозное (оценочное) значение y на период t+1, полученное в период t. 𝑦𝑡 - фактическое (наблюденное) значение y в момент t. Использование простейшей модели (1) в прогнозировании дает хорошие результаты, если наблюдения соответствует коротким времени (например, дни или недели) и характер их изменений не содержит заметных скачков. В некоторых случаях «наивная» модель может давать более точные результаты, чем сложные прогнозные уравнения. Пример 1. В следующей таблице представлены цены акций некоторой компании за 12-недельный период, которые регистрировались на фондовой бирже в конце каждой недели: Неделя 1 2 3 Цена (долл.) 60 62,25 61,75 Неделя 5 6 7 Цена (долл.) 64,5 62 63,5 Неделя 9 10 11 Цена (долл.) 63,5 62,5 61 4 63 8 64 12 61,5 Используя данные таблицы и модель (1) спрогнозируем цену на 13 неделю: ŷ 13 = y12 = 61,5 Оценка точности прогнозирования характеризуется остатками, которые вычисляются для каждого периода прогнозирования t: 𝑒𝑡 = 𝑦𝑡 − 𝑦̂𝑡 (2) Чтобы оценить точность некоторой процедуры, используемой для прогнозирования на основе данных конкретного временного ряда, остатки можно вычислить ретроспективно. Очевидно, что чем эффективнее процедура прогнозирования, тем меньше абсолютные величины остатков за все периоды временного ряда. Пример 2. Используя «наивную» модель на основе данных примера 1 вычислим остатки (2) для каждой недели. Возникает проблема, как вычислить остаток 𝑒1 = 𝑦1 − 𝑦 ̂, 1 соответствующий периоду t = 1 , поскольку в этом случае ŷ1 = y0 , где y0 – цена акции на конец недели, предшествующей начальному периоду наблюденного временного ряда. Если значение y0 неизвестно, то прогнозные оценки строятся, начиная со второй недели (t=2). Вычислим остатки для t = 2, 3, 4: e2 = y2 − ŷ2 = y2 − y1 = 62,25 − 60 = 2,25; e3 = y3 − ŷ3 = y3 − y2 = 61,75 − 62,25 = −0,5; e4 = y4 − ŷ4 = y4 − y3 = 63 − 61,75 = 1,25. Проведя аналогичные вычисления для оставшихся недель, сведем все результаты в табл.2. 1. Таблица 2.1 Прогнозирование и вычисление остатков с использованием простейшей "наивной" модели Неделя (t) 1 2 Yt (т.руб.) 60 62,25 Y Остаток 60 2,25 3 61,75 62,25 -0,5 4 63 61,75 1,25 5 64,5 63 1,5 6 62 64,5 -2,5 7 63,5 62 1,5 8 64 63,5 0,5 9 63,25 64 -0,75 10 62,5 63,25 -0,75 11 61 62,5 -1,5 12 61,5 61 0,5 Простейшую модель можно адаптировать к структуре временного ряда. Например, если имеет место тенденция (тренд) возрастания или убывания уровней во времени, то возможна корректировка модели с учетом добавки в виде разности между текущим значением уровня и предыдущим значением: ŷt+1 = y𝑡 + (yt − yt−1 ) (3) Иногда в качестве коррекции модели на тренд имеет смысл использовать не абсолютную разность, а темп измерения: y ŷt+1 = у𝑡 ∗ t⁄yt+1 (4) В случае ярко выраженной сезонности в изменении уровней, простейшая прогнозная модель может быть следующей: ŷt+1 = yt−k+1 (5) где k-промежуток сезонности (например, k=4, если имеет место квартальная сезонность; k=12, если сезонность месячная); Основной недостаток простейших моделей в том, что в них не учитывается влияние изменений за более поздние периоды времени. Для их учета можно комбинировать различные модели, включающие и тренд, и сезонность. Например, одним из таких вариантов модели может быть следующее уравнение: ŷt+1 = yt−k+1 + yt−k+1 ((y𝑡 − yt−1 ) + ⋯ + (yt−k+1 − yt−k ))⁄ 𝑘 (6) – член, учитывающий сезонность (k – промежуток сезонности), а другое слагаемое, являющееся среднем арифметическим приращений за k предыдущих периодов – член, учитывающий тренд. Пример 3. В таблице 2.2 представлены данные об объемам продаж некоторого продукта в физических единицах за 1988-1994 Таблица 2.2 Временной ряд объёмов продаж продукта в физических единицах за 1988 - 1994 гг. Год Квартал 1988 1234 1989 1234 1990 1234 1991 1234 1992 1234 1993 1234 1994 1234 Предположим, что мы находимся t Продажи (ед.) 1234 500 350 250 400 5678 450 350 200 300 9 10 11 12 350 200 150 400 13 14 15 16 550 350 250 550 17 18 19 20 550 400 350 600 21 22 23 24 750 500 400 650 25 26 27 28 850 600 450 700 в конце четвертого квартала 1993 года и нам необходимо сделать прогноз на 1 квартал 1994 года, который соответствует периоду t=25, сделаем это на основе простейших моделей (1), (3)-(6). Используя модель (1) получим: ŷ25 = y24 = 650; Определим ошибку прогноза за период t=25: e25 = y25 − ŷ 25 = 850 − 650 = 200; Визуальный анализ временного ряда в таблице 2.2 позволяет сделать вывод о наличии возрастающего тренда. Очевидно, если использовать модель (1) для получения прогнозных оценок на периоды 2-28, то они большей частью будут занижены. Для корректировки этой систематической ошибки используем модель (3), учитывающую тренд: ŷ24+1 = y24 + (y24 − y24−1 ); ŷ25 = y24 + (y24 − y23 ); ŷ25 = 650 + (650 − 400); ŷ25 = 650 + 250; ŷ25 = 900. Ошибка прогноза уменьшилась по абсолютной величине: e25 = y25 − ŷ 25 = 850 − 900 = −50; Для иллюстрации использования модели (4) спрогнозируем на ее основе объем продаж на первый квартал 1994года: y ŷ24+1 = y24 ∗ 24⁄y24−1 y ŷ25 = y24 ∗ 24⁄y23 = 650 ∗ 650⁄400 = 1056. Есть основание полагать, что уровни временного ряда в таблице 2.2 содержат сезонную компоненту: продажи в 1 квартале каждого года большей частью выше, чем в остальных кварталах. Поэтом у имеет смысл попробовать использовать модель (5) с квартальной сезонностью (k=4): ŷ24+1 = y24−3 , ŷ25 = y21 = 750 Наконец, применим модель (6), учитывающую сезонность и тренд одновременно: [(y24 − y24−1 ) + ⋯ + (y24 − y24−4 )] 4 [(y24 − y23 ) + ⋯ + (y24 − y20 )] = y21 + 4 ŷ24+1 = y24−3 + ŷ25 ŷ25 = 750 + [(650 − 400) + (400 − 500) + (500 − 750) + (750 − 600)]/4, ŷ25 = 750 + 12,2 = 762,2 Следует отметить, что представленные простейшие («наивные») модели далеко не исчерпывают все возможные варианты, которые можно получить, конструируя Составление различные простейших моделей комбинации подобных обусловливается в моделей. основном структурными характеристиками временного ряда и аналитическими способностями эксперта. 2.2 Методы экспоненциального сглаживания (ЭС) В предыдущей главе рассматривался метод сглаживания временных рядов на основе вычисления последовательности центрированных скользящих средних. Скользящие средние использовались для определения индексов сезонности. Кроме того, они могут служить в качестве уровней “нового временного ряда”, для которых эффект сезонности полностью исключен, а влияние нерегулярной (случайной) компоненты значительно меньше. Временной ряд, составленный из скользящих средних, является более сглаженным по сравнению с исходным рядом. Уже визуальный анализ его графика позволяет выявить какой -либо существующий тренд или циклические изменения (см. рис.1.6 в предыдущей главе). Другой способ сглаживания временных рядов представляет собой экспоненциальное сглаживание. В отличие от скользящих средних его вычислительная процедура включает обработку всех предыдущих наблюдений, при этом учитывается устаревание информации по мере удаления от прогнозного периода. Иначе говоря, чем “старше” наблюдение, тем меньше оно должно влиять на величину прогнозной оценки. Идея экспоненциального сглаживания состоит в том, что по мере “старения” соответствующим наблюдениям придаются убывающие веса. Рассмотрим содержание процедуры экспоненциального сглаживания, а также ее модификации, разработанные с учетом различной структуры временного ряда – наличие тренда и сезонных изменений. 2.2.1 Простое экспоненциальное сглаживание Простое экспоненциальное сглаживание дает хорошие результаты для стационарных временных рядов. Ряд называется стационарным, если его уровни не содержат тренда, а его среднее значение (𝑦̅t ) и дисперсия остаются постоянными с течением времени. График стационарного ряда представлен на рис.2.2. Рис. 2.2. График стационарного временного ряда Сглаженное значение временного ряда на период t вычисляется как взвешенная сумма фактического значения уровня на этот период и сглаженное значение на предыдущий период t-1: St = A ∗ yt + (1 + A)St−1 (7) t=2,3,4…-временные периоды; St -сглаженное значение на период t; yt -фактическое значение уровня на период t; St−1 -сглаженное значение на период (t-1). A-сглаживающая константа (0 𝒓𝟖 > 𝒓𝟏𝟐 , что типично для четырёхпериодной сезонности. Большое значение 𝒓𝟒 указывает на возможную сезонность, а большие значения 𝒓𝟖 и 𝒓𝟏𝟐 , подтверждающий это предположение. Используя у𝒕−𝟒 в качестве объясняющей переменной, решим уравнение авторегрессии: у̂𝒕 = 𝟏, 𝟒𝟐 + 𝟎, 𝟖𝟕у𝒕−𝟒 Для данной модели показатель ошибки MSE=4025. С целью обоснования эффективности авторегрессионной модели для данного временного ряда следует рассмотреть другие методы прогнозирования и сравнить их по величине MSE. 2.3.2 Выявление и устранение нестационарности временных рядов Метод авторегрессии (как и простое экспоненциальное сглаживание) может быть эффективным, если прогнозируемый процесс является нестационарным. Это означает, что он не содержит тренда и имеет постоянную вариацию вокруг среднего значения 𝑦̅. Один из способов определения нестационарности – коррелограммы. Если нет быстрого убывания до нуля коэффициентов автокорреляции (например, сразу после 𝒓𝟐 или 𝒓𝟑 ), то рассматриваемый временной ряд является нестационарным. Перед построением авторегрессии нестационарный временной ряд требует специальным образом трансформировать, сделать его боле стационарным, и уже трансформированные данные имеет смысл исследовать на сезонность. Способ преобразования нестационарного ряда заключается в вычислении разностей: у′ 𝑡 = 𝑦𝑡 − 𝑦𝑡−1 Заметим уровни исходного ряда 𝑦𝑡 заменяются на значения у, 𝑡 . Выражение вида (26) для различных t называются первыми разностями. Рассмотрим ряд 2, 5, 8, 11, 14,… Данный ряд содержит явный линейный тренд – каждое последующие значение получается из предыдущего прибавления тройки. Первые разновидности определяются так: у′ 2 =5-2=3, у′ 3 =8-5=3, ′4 =11-8=3, у′ 5 =14-11=3 и т.д. Они уже не содержат тренд, т.е. ряд первых разностей будет стационарным. Если вычисление первых разностей приведёт к стационарному ряду, то коррелограмма значений у, 𝑡 будет быстро стремиться к нулю. Если процедура вычислений первых разностей не даёт нужного эффекта, следует вычислить вторые разности: у" 𝑡 = 𝑦 ′ 𝑡 − 𝑦 ′ 𝑡−1 = 𝑦𝑡 − 2𝑦𝑡−1 + 𝑦𝑡−2 Данные процесс можно продолжать до тех пор, пока временной ряд разностей не станет стационарным. Обычно это происходит, когда вычислены разности первого и второго порядка. Если ряд стал стационарным (тренд исключен), но содержит сезонную компоненту, то после быстрого спада до нуля коэффициентов автокорреляции будут наблюдаться периодические пиковые значения, соответствующие сезонному эффекту. Пример 17. В предыдущей главе (пример 14) рассматривались квартальные данные о продажах, содержащие устойчивый линейный тренд и явный сезонный эффект – низкие продажи в первых двух кварталах и высокие в последних двух. Используя, метод разностей, исключим тренд. Вычислим (на компьютере) коэффициенты автокорреляции для исходных данных: 𝒓𝟏 =0,541, 𝒓𝟐 =0,105, 𝒓𝟑 =0,28, 𝒓𝟒 =0,473, 𝒓𝟓 =0,122, 𝒓𝟔 =-0,232, 𝒓𝟕 =-0,087, 𝒓𝟖 =0,063, 𝒓𝟗 =-0,176, 𝒓𝟏𝟎 =-0,422, 𝒓𝟏𝟏 =-0,279, 𝒓𝟏𝟐 =-0,121, 𝒓𝟏𝟑 =-0,234, 𝒓𝟏𝟒 =0,343. Видна явная нестационарность, т.к. коэффициенты не убывают до нуля после двух или трёх периодов. Ввиду сильного влияния тренда, сезонный эффект не наблюдается. Вычислим первые разности: у𝒕 у′ 𝒕 = 𝒚𝒕 − 𝒚𝒕−𝟏 у𝒕 у′ 𝒕 = 𝒚𝒕 − 𝒚𝒕−𝟏 20 - 32 -8 12 -8 . . 47 35 . . 60 13 101 31 40 -20 123 22 Вычислим коэффициенты корреляции для первых разностей: 𝑟1 =0,01, 𝑟2 =-0,821, 𝑟3 =-0,034, 𝑟4 =0,698, 𝑟5 =0,001, 𝑟6 =-0,546, 𝑟7 =-0,024, 𝑟8 =0,431, 𝑟9 =-0,005, 𝑟10 =-0,307, 𝑟11 =-0,019, 𝑟12 =0,148, 𝑟13 =0,01. Теперь сезонный эффект проявляется вполне определённо: 𝑟2 , 𝑟6 и 𝑟10 имеют достаточно большие отрицательные значения, а 𝑟4 , 𝑟8 , 𝑟12 - большие положительные. Остальные коэффициенты близки к нулю (тренд исключён). Отрицательные значения – результат высоких (низких) продаж в период t, который следует за периодом низких (высоких) продаж – два квартала ранее. Аналогично большое значение 𝑟4 указывает на явно квартальный сезонный эффект, а большие значения 𝑟8 и 𝑟12 это подтверждают. Для авторегрессионной модели, построенной на основе первых разностей, наилучшими объясняющими переменными являются 𝑦𝑡−2 и 𝑦𝑡−4 . В этом случае авторегрессионная модель будет иметь вид: 𝑦̂𝑡 = 𝑏0 + 𝑏1 𝑦 ′ 𝑡−2 + 𝑏2 𝑦 ′ 𝑡 2.4 Искусственные переменные в линейной регрессионной модели Включение искусственных переменных в регрессионную модель позволяет учитывать качественные факторы в прогнозировании. Например, если требуется учитывать половой признак, то как искусственную переменную можно рассматривать: 𝟏, если мужчина; 𝒙𝟏 { } 𝟎, если женщина. Заметим, что присвоение значения 1 мужчине или женщине произвольно. Прогнозируемая величина у будет та же самая, независимо от способа кодирования. Искусственные переменные можно эффективно использовать в прогнозировании временных рядов. Например, при учёте сезонного эффекта искусственные переменные будут характеризовать определённые сезоны. Так, в случае квартальной сезонности один из возможных способ кодирования имеет следующее выражение: 𝟏, если квартал 𝟏, 𝑸𝟏 = { } 𝟎, в остальных случаях 𝑸𝟐 = { 𝟏, если квартал 𝟐, } 𝟎, в остальных случаях 𝟏, если квартал 𝟑, 𝑸𝟑 = { } 𝟎, в остальных случаях (27) Заметим, что число искусственных переменных на единицу меньше числа кварталов. При данном способе кодирования нет необходимости вводить переменную 𝑸𝟒 , т.к. кварталу 4 автоматически будут аналогичную схему соответствовать соотношения 𝑸𝟏 =0, 𝑸𝟐 =0, 𝑸𝟑 =0. Для месячной сезонности можно выбрать прогнозирования. Тогда число искусственных переменных равняется 121=11: 𝟏, если январь М𝟏 = { } 𝟎, в остальных случаях 𝟏, если февраль М𝟐 = { } 𝟎, в остальных случаях (28) … 𝟏, если ноябрь М𝟑 = { } 𝟎, в остальных случаях Для учёта эффекта, вызванного декабрём, все 11 искусственных переменных должны принимать нулевые значения. Рассмотрим аддитивную модель анализа временного ряда, учитывающую тренд, сезонность, нерегулярную компоненту: у𝒕 = 𝑻𝑹𝒕 + 𝑺𝒕 + 𝑰𝒕 , Где тренд (𝑻𝑹𝒕 ) может быть выражен в виде прямой (𝑻𝑹𝒕 = 𝜷𝟎 + 𝜷𝟏 𝒕) или кривой (𝑻𝑹𝒕 = 𝜷𝟎 + 𝜷𝟏 𝒕 + 𝜷𝟐 𝒕𝟐 ) линии, 𝑺𝒕 - эффект сезонности, 𝑰𝒕 нерегулярная компонента. Если имеет место тренд и квартальная сезонность, то возможны, например, следующие модели для прогнозных оценок: 𝑦̂𝑡 = 𝑏0 + 𝑏1 𝑡 + 𝑏2 𝑄1 + 𝑏3 𝑄2 + 𝑏4 𝑄3 (29) 𝑦̂𝑡 = 𝑏0 + 𝑏1 𝑡 + 𝑏2 𝑡 2 + 𝑏3 𝑄1 + 𝑏4 𝑄2 + 𝑏5 𝑄3 (30) В моделях (29) и (30) оценки сезонности выражаются соответственно так: ̂𝒕 = 𝒃𝟐 𝑸𝟏 + 𝒃𝟑 𝑸𝟐 + 𝒃𝟒 𝑸𝟑 𝑺 ̂𝒕 = 𝒃𝟑 𝑸𝟏 + 𝒃𝟒 𝑸𝟐 + 𝒃𝟓 𝑸𝟑 𝑺 Пример 18. Рассмотрим временной ряд квартальных продаж, представленный в примере 4 (глава 1) и 17 (глава 2). В примере 4 предлагалось, что наиболее адекватной является мультипликативная модель. Предположим, что были проведены дополнительные исследования полученной модели и характера изменения временного ряда. Возникли сомнения по поводу того, что амплитуда сезонных квартальных сезонных колебаний сильно возрастает вместе с трендом. Поэтому было решено попробовать для прогнозирования аддитивную модель (29) с искусственными переменными, определяемыми соотношениями (27). Входная информация для расчёта величин 𝒃𝟎 , 𝒃𝟏 ,…, 𝒃𝟒 методом наименьших квадратов имеет вид: у𝒕 t 𝑸𝟏 𝑸𝟐 𝑸𝟑 у𝒕 t 𝑸𝟏 𝑸𝟐 𝑸𝟑 20 1 1 56 9 1 12 2 1 50 10 1 47 3 1 85 11 1 60 4 100 12 40 5 1 75 13 1 32 6 1 70 14 1 65 7 1 101 15 1 76 8 123 16 В результате компьютерных расчётов имеем уравнение: у̂𝐭 = 𝟒𝟏, 𝟕𝟓 + 𝟒, 𝟖𝐭 − 𝟐𝟕, 𝟔𝐐𝟏 − 𝟑𝟗, 𝟏𝟓𝐐𝟐 − 𝟏𝟎, 𝟒𝟓𝐐𝟑 (31) Величина коэффициента множественной детерминации 𝑹𝟐 =0,996 свидетельствует о очень высоком уровне сглаживания 16 наблюдений. Сравним модель (31) с мультипликативной моделью, которую определим как произведение тренда на индексы сезонности: 𝐲̂𝐭 = (𝐛𝟎 + 𝐛𝟏 𝐭)𝐒𝐭 Используя исходные данные у𝒕 , методом наименьших квадратов вычислим тренд: 𝑻𝑹𝒕 = 𝟏𝟗, 𝟑𝟕𝟐 + 𝟓, 𝟎𝟑𝟕𝟓𝒕 Индексы сезонности за каждый квартал возьмём из примера 4 (гл. 1). Тогда прогнозная модель имеет вид: 𝐲̂𝐭 = (𝟏𝟗, 𝟑𝟕𝟐 + 𝟓, 𝟎𝟑𝟕𝟓𝒕)𝐒𝐭 (32) Где 𝐒𝟏 =𝐒𝟓 =𝐒𝟗 =…=0,852; 𝐒𝟐 =𝐒𝟔 =𝐒𝟏𝟎 =…=0,692; 𝐒𝟑 =𝐒𝟕 =𝐒𝟏𝟏 =…=1,166; 𝐒𝟒 =𝐒𝟖 =𝐒𝟏𝟐 =…=1,29. Для мультипликативной модели (32) и аддитивной модели (31) вычислим показатель MSE (таблица 2.14 и таблица 2.15): Таблица 2.14 Вычисление среднего квадрата ошибки (MSE) для мультипликативной сезонности t 𝒚𝒕 ̂𝒕 𝒚 ̂𝒕 𝒚𝒕 − 𝒚 1 20 20,80 -0,80 2 12 20,38 -8,38 3 47 40,21 6,79 4 60 50,98 9,02 5 40 37,96 2,04 6 32 34,32 -2,32 7 65 63,70 1,30 8 76 76,98 -0,98 9 56 55,13 0,87 10 50 48,26 1,74 11 85 87,20 -2,20 12 100 102,97 -2,97 13 75 72,30 2,70 14 70 62,21 7,79 15 101 110,69 -9,69 16 123 128,96 -5,96 Таблица 2.15 Вычисление MSE для аддитивной сезонности t 𝒚𝒕 ̂𝒕 𝒚 ̂𝒕 𝒚𝒕 − 𝒚 1 20 18,95 1,05 2 12 12,20 -0,20 3 47 45,70 1,30 4 60 60,95 -0,95 5 40 38,15 1,85 6 32 31,40 0,60 7 65 64,90 0,10 8 76 80,15 -4,15 9 56 57,35 -1,35 10 50 50,60 -0,60 11 85 84,10 0,90 12 100 99,35 0,65 13 75 76,55 -1,55 14 70 69,80 0,20 15 101 103,30 -2,30 16 123 118,55 4,45 В первом случае (табл. 2.14) имеем: ̂𝒕 )𝟐 /16=425,36/16=26,58; MSE=∑(𝒚𝒕 − 𝒚 Во втором случае (табл. 2.15) имеем: ̂𝒕 )𝟐 /16=55,7/16=3,48. MSE=∑(𝒚𝒕 − 𝒚 Как видно модель (31) даёт значительно более точные результаты сглаживания, что свидетельствует о аддитивной сезонности. Из уравнения (31) можно сделать следующие выводы: 1. Продажи возрастают в среднем на 4,8 млн. долл. за квартал. 2. Независимо от эффекта тренда продажи за первый квартал на 27, млн. долл. меньше, чем продажи за квартал 4. 3. Независимо от влияния тренда продажи за квартал 2 на 39,15 млн. долл. меньше, чем за квартал 4. 4. Продажи за квартал 3 на 10,45 млн. долл. меньше, чем за квартал4. Используем аддитивную модель (31) для прогнозирования объёмов продаж на кварталы 1-4 1994 г. Квартал 1-ый: 𝐐𝟏 =1, 𝐐𝟐 = 𝐐𝟑 =0; у̂𝟏𝟕 =41,75+4,8*17-27,6*1-39,15*0-10,45*0=95,75 млн. долл. у̂𝟏𝟖 =41,75+4,8*18-27,6*0-39,15*1-10,45*0=89 млн. долл. Квартал 1-ый: 𝐐𝟏 = 𝐐𝟐 =0, 𝐐𝟑 =1; у̂𝟏𝟗 =41,75+4,8*19-27,6*0-39,15*0-10,45*1=122,5 млн. долл. у̂𝟐𝟎 =41,75+4,8*20-27,6*0-39,15*0-10,45*0=137,75 млн. долл. 2.5 Проблема устранения автокорреляции ошибок Проблема, которая часто возникает при использовании модели множественной линейной регрессии, полученной как регрессия на временной ряд – автокорреляция остатков 𝒆𝒕 . Как известно из эконометрики, в этом случае все проверки гипотез относительно параметров модели, включая t – критерий, могут быть неадекватными. Выявление автокорреляции ошибок (серийной корреляции) производятся по критерию Дарбина – Уотсона: ∑(𝒆𝒕 − 𝒆𝒕−𝟏 )𝟐 𝑫𝑾 = ∑ 𝒆𝒕 𝟐 Для устранения автокорреляции можно использовать ряд процедур. Рассмотрим некоторые из них: 1. Замена 𝒚𝒕 первыми разностями. Новой зависимой переменной в этом случае является: 𝒚′ 𝒕 = 𝒚𝒕 − 𝒚𝒕−𝟏 2. Замена 𝒚𝒕 на темп прироста за период t: 𝒚𝒕 − 𝒚𝒕−𝟏 𝒁𝒕 = [ ] ∗ 𝟏𝟎𝟎 𝒚𝒕−𝟏 3. Включение в регрессионную модель лагированных переменных 𝒚𝒕−𝟏 , 𝒚𝒕−𝟐 ,… в качестве объясняющих зависимую переменную 𝒚𝒕 . 4. Улучшение существующей модели с помощью включения в неё дополнительной автокорреляции переменной, остатков объясняющей может быть связан Эффект 𝒚𝒕 . с отсутствием переменных, значимо влияющих на вариацию 𝒚𝒕 . Пример 19. Руководство некоторой фирмы, выпускающей электронные приборы, хочет спрогнозировать продажи своей продукции. Предполается, что объясняющей переменной исследовательские разработки могут быть (НИР). Для затраты на построения научнолинейной регрессионной модели были собраны данные о продажах и затратах на НИР за 1973 – 1993 гг. (таблица 2.16). Таблица 2.16 Данные о продажах фирмы (у) и затратах на НИР (х) за 1973-1993 гг., темпы прироста у и х Продажи Затраты на НИР У (тыс. долл.) Х (тыс. долл.) 1973 3307 1974 Год Темп прироста за предыдущий период (у𝒕 − у𝒕 )/у𝒕−𝟏 (𝒙𝒕 − 𝒙𝒕−𝟏 )/𝒙𝒕−𝟏 273,4 - - 3556 291,3 7,5 6,5 1975 3601 306,9 1,3 5,4 1976 3721 317,1 3,3 3,3 1977 4036 336,1 8,5 6,0 1978 4134 349,4 2,4 4,0 1979 4268 362,9 3,2 5,7 1980 4578 383,9 7,3 5,8 1981 5093 402,8 11,2 6,3 1982 5716 437,0 12,2 8,5 1983 6357 472,2 11,2 8,1 1984 6769 510,4 6,5 8,1 1985 7296 544,5 7,8 6,7 1986 8178 588,1 12,1 8,0 1987 8844 630,4 8,1 7,2 1988 9251 685,9 4,6 8,8 1989 10006 742,8 8,2 8,3 1990 11200 801,3 11,9 7,9 1991 12500 903,1 11,6 12,7 1992 13101 983,6 4,6 8,9 1993 13640 1076,7 4,0 9,5 Уравнение простой регрессии имеет вид: У=524+14х. Уравнение существенно и 𝑹𝟐 =0,99. Однако значение критерия DW=0,63. По таблице для уравнения значимости 0,1 (см. приложение) определим нижнюю (𝒅𝑳 ) и верхнюю (𝒅𝒏 ) критические границы: 𝒅𝑳 =0,95, 𝒅𝒏 =1,15. Ввиду того, что DW= 0,63<0,95, имеет место положительная серийная корреляция. Следовательно, существенность уравнения регрессии вызывает сомнение. Заменим переменные соответствующими темпами прироста, которые вычисляются следующим образом: Годы (у𝒕 − у𝒕 )/у𝒕−𝟏 (𝒙𝒕 − 𝒙𝒕−𝟏 )/𝒙𝒕−𝟏 1973 - - (3556-3307)/3307= (291,3-273,4)/273,4= 0,075295 (7,5%) 0,065472 (6,5%) (3601-3556)/3556= (306,9-291,3)/291,3= 0,012655 (1,3%) 0,053553 (5,4%) 1974 1975 Округлённые значения темпов прироста (в %) представлены в таблице 2.16. Методом наименьших квадратов вычислим регрессию темпа прироста у на темп прироста х: (у𝒕 − у𝒕 )/у𝒕−𝟏 =1,01 (𝒙𝒕 − 𝒙𝒕−𝟏 )/𝒙𝒕−𝟏 . (33) В уравнении (33) отсутствует свободный член, т.к. в качестве переменных выступают темпы прироста. Значение DW теперь будет равным 1,27. А поскольку DW>1,27=1,15, это означает, что серийная корреляция ошибок была устранена. Рассмотри процедуру прогнозирования с помощью уравнения (33). Спрогнозируем объём продаж на 1994 г. 1. Пусть прогнозная оценка затрат на НИР 1994 г. Х=1185 2. Вычислим темп прироста х за 1993 г.: (1185-1076,7)/1076,7=0,101 (10,1%). 3. Вычислим темп прироста у за 1993 г.: (у̂𝟏𝟗𝟗𝟒 -13640)/13640=1,01*0,101=0,10201. 4. Определим прогнозную оценку у̂𝟏𝟗𝟗𝟒 : у̂𝟏𝟗𝟗𝟒 =13640*0,10201+13640=15032. Заключительные тезисы к лекциям I. Под временным рядом понимается ряд значений некоторого показателя, взятых по состоянию на определённые моменты или периоды времени. Количественные называются уровнями значения временного показателя ряда. во Уровни временном ряду располагаются в хронологическом порядке, обычно через равные промежутки времени (квидистантные ряды). Каждый уровень можно рассматривать как результат наложения компонент, имеющих разный временной характер действия. Метод анализа временных рядов и заключается в выделении этих компонент. Основными компонентами временного ряда являются: тренд, циклическая, сезонная и нерегулярная компоненты. Под трендом понимается долгосрочная составляющая, характеризующая общую тенденцию изменения временного ряда в течение длительного периода времени. Циклическая компонента характеризует повторяющиеся волнообразные изменения длительностью более 1 года. Сезонная компонента так же носит циклический характер. Она характеризует изменения, регулярно повторяющиеся и завершаемые в пределах года. Нерегулярная компонента отражает быстрые изменения, как правило, малой длительностью. Процесс определения каждой компоненты и исключение её воздействия на уровни временного ряда называется декомпозицией, или разложением временного ряда. Формально модель декомпозиции можно представить двумя способами: как произведение четырёх компонент (мультипликативная модель) или как сумму этих компонент (аддитивная модель). На практике чаще используется мультипликативная модель. При анализе тренда независимой переменной является время, а зависимой – уровень временного ряда. Для оценки тренда используется метод наименьших квадратов. В случае линейного тренда строится парная линейная регрессия уровня ряда на время. При построении нелинейного тренда проводится преобразование временной переменной. Циклическая компонента измеряется как отношение фактического уровня временного ряда к оценке тренда. Сезонная компонента проявляется, когда временной ряд составляют квартальные или месячные наблюдения. Она измеряется в виде индекса сезонности, который умножается на величину тренда. Индекс сезонности остаётся постоянным для определённой части года (месяц, квартал). Способ вычисления индексов сезонности является метод отношения к центрированной скользящей средней. При этом на основе исходного временного ряда определяется новый временной ряд, уже не содержащий компонент сезонности. Его уровни будут центрированные скользящие средние. Для вычисления центрированных скользящих средних определяются скользящие суммы. Слагаемые первой суммы представляют собой первые 4 (для квартальной сезонности) или 12 (для месячной сезонности) уровней временного ряда. Во вторую скользящую сумму входят первые четыре уровня ряда, полученного сдвигом уровней на один квартал (месяц) вперед; в третью сумму – сдвигом на два квартала (месяца) вперед и т.д. Чтобы получить скользящую среднюю, центрированную на середину периода, сумму двух соседних скользящих сумм делят на 8 (для квартальной сезонности). Индекс сезонности вычисляется как отношение фактического уровня временного ряда к соответствующей центрированной скользящей средней. Этим отношения усредняются по каждому отдельному кварталу (месяцу). Если разделить фактические уровни на соответствующие индексы сезонности, то получим десезонализированные данные, которые содержат только тренд, циклическую и нерегулярную компоненты. Десезонализированные значения уровней служат исходной информацией для оценки тренда. Зная индексы сезонности и тренд, можно прогнозировать сезонные значения временного ряда. Общая декомпозиция временного ряда осуществляется по следующей схеме: 1. определение сезонных индексов; 2. десезонализация данных; 3. определение тренда; 4. определение циклической компоненты. При этом для исключения нерегулярной компоненты иногда вычисляются трехпериодные скользящие средние. Если известны три компоненты временного ряда: тренд, сезонная и циклическая, то нерегулярная компоненты измеряется как отношение фактического уровня к произведению трех указанных компонент. II. Если первая глава целиком посвящена проблеме сглаживания временных рядов, то вся вторая глава нацелена на изучение различных способов и моделей прогнозирования, основанных на методах анализа временных рядов и регрессионного анализа. Наиболее простой способ прогнозирования заключается в предположении, что текущие периоды являются лучшими оценкам будущего (см. Екклесиаст” … что было, то и будет…”). Простейшая(“наивная”) модель имеет вид (1). Ее использование в прогнозировании дает хорошие результаты, если наблюдения соответствуют коротким периодам времени (например, дни или недели) и характер их изменений не содержит заметных скачков. Простейшие модели можно адаптировать к структуре временного ряда. Возможны модификации “наивной” модели, учитывающие тренд и сезонность (например, модели (3) ÷ (6)). Одним из способов сглаживания временных рядов является экспоненциальное сглаживание. Вычислительная процедура выключает обработку всех предыдущих наблюдений. При этом учитывается “устаревание” информации по мере удаления от прогнозного периода; чем “старше” наблюдение, тем меньше оно должно влиять на величину прогнозной оценки. Идея простого экспоненциального сглаживания состоит в том, что по мере “старения” соответствующим наблюдениям придаются веса, убывающие по экспоненциальному закону (уравнение (8)). Простое экспоненциальное сглаживание дает хорошие результаты для стационарных временных рядов, имеющих постоянное среднее значение и дисперсию и не содержащих тренда. От характера изменения временного ряда зависит выбор сглаживающей константы А (А ≤ 0,1) следует использовать для сглаживания временных рядов со значительной нерегулярной компонентой. В этом случае происходит максимальная фильтрация случайных отклонений. Для более стабильных временных рядов значение А следует увеличить. Тогда каждый новый прогноз становится прогнозируемого показателя. чувствительным к текущим изменениям Простое экспоненциальное сглаживание временных рядов, содержащих устойчивый тренд, приводит к систематической ошибке, связанной с отставанием сглаженных значений от фактических уровней временного ряда. Для учета тренда в нестационарных рядах используется специальное двухпараметрическое линейное экспоненциальное сглаживание (метод Хольта). Данный метод включает два уравнения: уравнение (12) предназначено для сглаживания наблюдаемых значений и уравнение (13) – для сглаживания тренда. Каждое уравнение содержит отдельную сглаживающую константу, значение которой заключено между 0 и 1 (параметры модели). Первый этап процедуры прогнозирования – оценка начального значения тренда. Предлагаются два способа. При первом способе начальное значение тренда полагается равным нулю. Второй способ (более точный) заключается в вычислении с помощью МНК линейного уравнения регрессии на основе первых нескольких фактических наблюдений. Коэффициент регрессии берется в качестве начального значения тренда. Для временных рядов, содержащих не только тренд, но и значительную сезонность, эффективным является трехпараметрический метод линейного и сезонного экспоненциального сглаживания (метод Винтера). Он включает три уравнения с отдельными сглаживающими константами и является обобщением метода Хольда: к двум уравнениям (16) и (17), сглаживающим прошлые наблюдения и тренд, добавляется уравнение для сглаживания сезонных изменений (18). Как и в случае линейного экспоненциального сглаживания, возможны два способа определения начальных значений. Способ 1 полагает начальные сезонные индексы равными 1, начальное значение тренда – нулю и начальное сглаженное значение временного ряда – значению за последний (или первый) период сезонности первого года. Более точным, но более трудоемким является способ 2. На основе фактических данных за первые несколько лет (например, 2 года) определяются индексы сезонности, которые выбираются в качестве начальных оценок. Далее фактические наблюдения, использованные при вычислении сезонности, десезонализируются (т.е. делятся на соответствующие индексы сезонности). На их основе с помощью МНК вычисляется линейное уравнение тренда. Угловой коэффициент регрессивного уравнения берется в качестве начальной оценки тренда. Начальная сглаженная величина определяется как произведение соответствующего индекса сезонности (за последний или первый период сезонности) и величины, полученной при подстановке в вычисленное ранее уравнение тренда значение t = 0. Эффективность полученных на метода его прогнозирования основе прогнозов. определяется Общая точностью ошибка метода прогнозирования накапливается за счет ошибок, полученных на каждый период прогнозирования. прогнозирования Ошибка определяется (остаток) как разность за какой-либо между период фактическим наблюдением и оценочным (прогнозируемым) значением на этот период. При оценке ретроспективно метода прогнозирования при сопоставлении общая ошибка наблюдаемых вычисляется данных с соответствующими оценками, полученными на основе рассматриваемого метода. Один из способов вычисления общей ошибки заключается в суммировании абсолютных величин остатков. В качестве обобщенного показателя выбирается средняя абсолютная погрешность MAD (mean absolute deviation ) (формула (20)). Показатель MAD наиболее пригоден, если ошибку прогноза требуется измерить в тех же единицах, что и уровни ряда. Альтернативным способом определения общей ошибки является вычисление средней квадратической ошибки MSE (формула (21)). Этот показатель позволяет выявить отдельные большие отклонения от фактических данных, если они существуют. Иногда требуется оценить степень смещенности (т.е. завышенность или заниженность) результатов прогнозирования, полученных данным методом. Для этого используется показатель средней относительной ошибки MPE (формула (23)). Если он близок к нулю, то смещений нет; если отрицательный, то прогнозные оценки завышены и наоборот. Чем меньше показатель общей ошибки, тем точнее метод прогнозирования. Если переменная 𝑦𝑡 задаваемая временным рядом, зависит от своих значений за прошедшие периоды времени, то эффективным способом прогнозирования может оказаться авторегрессионная модель. Она получается построением регрессии 𝑦𝑡 на переменные 𝑦𝑡−1 , 𝑦𝑡−2 , …, которые характеризуются тем же временным рядом, но сдвинутым соответственно на 1, 2, … периодов вперед (т.е. полученные с соответствующей задержкой, или временным лагом, из исходного временного ряда). Переменные 𝑦𝑡−1 , 𝑦𝑡−2 , …, называются лагированными переменными. Для определения, с каким лагом включить переменные в модель, можно использовать коэффициенты автокорреляции различных порядков 𝑟𝑘 Коэффициент k-го порядка характеризующий корреляцию между 𝑦𝑡 и 𝑦𝑡−𝑘 и изменяется от -1 до 1 (формула (25)). Графиком значений коэффициентов автокорреляции является коррелограмма. По ней можно судить, какие лагированные переменные следует включить в авторегрессию. Это будут переменные, для которых соответствующие коэффициенты авторегрессии имеют наибольшие по абсолютной величине значения. С помощью коррелограммы можно также выявить сезонность и нестационарность временных рядов. Если не наблюдается быстрая убываемость до нуля коэффициентов автокорреляции (например, сразу после 𝑟2 и 𝑟3 ), то рассматриваемый временной ряд будет нестационарным. Перед построением авторегрессии нестационарный временной ряд следует специальным образом трансформировать, сделав его более стационарным, и уже трансформированные данные исследовать на сезонность. Способ преобразования нестационарного ряда заключается в вычислении первых или вторых разностей с последующей заменой на них уровней исходного временного ряда. Если ряд стал стационарным и содержит сезонность, то после быстрого спада коэффициентов автокорреляции будут наблюдаться периодические пиковые значения, соответствующие сезонному эффекту. В прогнозировании временны рядов эффективно используются регрессионные модели с искусственными переменными. Например, при учете сезонности искусственные переменные могут характеризовать определенные сезоны. Для введения искусственных переменных в модель они кодируются по определенной схеме. Так для квартальной сезонности возможна схема (27), а для месячной - (28). Применение искусственных переменных дает хорошие результаты в случае аддитивной сезонности. Проблема, которая часто возникает при использовании множественной линейной регрессии, полученной как регрессия на временные ряды – автокорреляция остатков. Для устранения этого явления можно использовать следующие процедуры: 1. Замена уровней временного ряда первыми разностями. 2. Замена уровней временного ряда темпами прироста. 3. Включение в регрессионную модель лагированных переменных в качестве объясняющих зависимую переменную. 4. Улучшение существующей модели с помощью включения в нее дополнительной независимой переменной, значимо влияющей на вариацию зависимой переменной.
«Анализ временных рядов. Статистические методы и модели в прогнозировании.» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ

Тебе могут подойти лекции

Смотреть все 270 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot