Модели одномерных временных рядов
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Модели одномерных
временных рядов
ОПРЕДЕЛЕНИЕ, ОБОЗНАЧЕНИЕ И НАЗНАЧЕНИЕ
Временной ряд —набор чисел, привязанный к последовательным,
обычно равноотстоящим моментам времени.
Уровни (или элементы) временного ряда — числа, составляющие
временной ряд и полученные в результате наблюдения за ходом
некоторого процесса.
Временной ряд обычно обозначают Y(t), или yt, где t = 1, …, n.
Две основные цели анализа временных рядов:
• определение природы ряда (выделение детерминированной и
случайной составляющих, оценка их параметров)
• использование полученных оценок для целей прогнозирования.
2
ОСНОВНЫЕ КОМПОНЕНТЫ ВРЕМЕННОГО РЯДА
3
АДДИТИВНАЯ И МУЛЬТИПЛИКАТИВНАЯ МОДЕЛИ
Каждый уровень ряда Y(t) можно представить как функцию :
Y(t) = F(f(t), S(t), U(t), ɛ(t)),
где f(t) — тренд развития; S(t) — сезонная компонента;
U(t) — циклическая компонента; ɛ(t) — остаточная компонента.
Принято выделять две основные составляющие компоненты Y(t):
детерминированную (f(t), S(t), U(t)) и случайную (ɛ(t)).
В зависимости от взаимосвязи между составляющими может быть
построена
либо аддитивная модель
либо мультипликативная модель
Y(t) = f(t) + S(t) + U(t) + ɛ(t) = d(t) + ɛ(t) ,
Y(t) = f(t) • S(t) • U(t) • ɛ(t) = d(t) • ɛ(t)
4
ВЫЯВЛЕНИЕ СТРУКТУРЫ ВРЕМЕННОГО РЯДА
• При наличии во временном ряде тенденции и циклических колебаний
значения каждого последующего уровня ряда зависят от предыдущих.
Корреляционную зависимость между последовательными уровнями
временного ряда называют автокорреляцией уровней ряда.
• Количественно автокорреляцию можно измерить с помощью
линейного коэффициента корреляции между уровнями исходного
временного ряда и уровнями этого ряда, сдвинутыми на несколько
шагов во времени.
• Число периодов, по которым рассчитывается коэффициент
автокорреляции, называют лагом. С увеличением лага число пар
значений уменьшается.
5
П Р И М Е Р 1.
РАСЧЕТ КОЭФФИЦИЕНТОВ АВТОКОРРЕЛЯЦИИ УРОВНЕЙ ДЛЯ
ВРЕМЕННОГО РЯДА РАСХОДОВ НА КОНЕЧНОЕ ПОТРЕБЛЕНИЕ.
Пусть имеются следующие условные данные о средних
расходах на конечное потребление за 8 лет.
6
Расчет коэффициентов автокорреляции ПЕРВОГО ПОРЯДКА для
временного ряда расходов на конечное потребление
7
Коэффициент автокорреляции уровней ряда первого порядка
8
Расчет коэффициентов автокорреляции ВТОРОГО ПОРЯДКА для
временного ряда расходов на конечное потребление, д.е.
9
Коэффициент автокорреляции уровней ряда второго порядка
10
ДВА ВАЖНЫХ СВОЙСТВА КОЭФФИЦИЕНТА АВТОКОРРЕЛЯЦИИ
• Коэффициент характеризует тесноту только линейной связи
текущего и предыдущего уровней ряда. Для некоторых временных
рядов, имеющих сильную нелинейную тенденцию (например,
параболу второго порядка или экспоненту), коэффициент
автокорреляции уровней исходного ряда может приближаться к
нулю.
• По знаку коэффициента автокорреляции нельзя делать вывод о
возрастающей или убывающей тенденции в уровнях ряда.
Большинство временных рядов экономических данных содержит
положительную автокорреляцию уровней, однако при этом могут
иметь убывающую тенденцию.
11
АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ И КОРРЕЛОГРАММА
• Последовательность коэффициентов автокорреляции уровней
первого, второго и т. д. порядков называют автокорреляционной
функцией временного ряда. График зависимости ее значений от
величины лага (порядка коэффициента автокорреляции)
называется коррелограммой.
• Анализ автокорреляционной функции и коррелограммы позволяет
определить лаг, при котором автокорреляция наиболее высокая, а
следовательно, и лаг, при котором связь между текущим и
предыдущими уровнями ряда наиболее тесная. Т. е. при помощи
анализа автокорреляционной функции и коррелограммы можно
выявить структуру ряда.
12
АНАЛИЗ АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ И
КОРРЕЛОГРАММЫ
• Если наиболее высоким оказался коэффициент автокорреляции
первого порядка, исследуемый ряд содержит только тенденцию.
• Если наиболее высоким оказался коэффициент автокорреляции
порядка τ, ряд содержит циклические колебания с
периодичностью в τ моментов времени.
• Если ни один из коэффициентов автокорреляции не является
значимым:
• либо ряд не содержит тенденции и циклических колебаний,
• либо ряд содержит сильную нелинейную тенденцию, для выявления
которой нужно провести дополнительный анализ.
13
ПРИМЕР 2. АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ И ВЫЯВЛЕНИЕ
СТРУКТУРЫ РЯДА.
Пусть имеются условные данные об объемах потребления
электроэнергии жителями региона за 16 кварталов.
14
Автокорреляционная функция и коррелограмма
временного ряда потребления энергии
15
Потребление электроэнергии жителями региона, млн кВт · ч
16
17
ВЫВОДЫ
• Анализ значений автокорреляционной функции
позволяет сделать вывод о наличии в изучаемом
временном ряде:
• линейной тенденции
• сезонных колебаний периодичностью в четыре квартала.
• Данный вывод подтверждается и графическим
анализом структуры ряда.
18
МОДЕЛИРОВАНИЕ ТЕНДЕНЦИИ ВРЕМЕННОГО РЯДА
Аналитическое выравнивание временного ряда ‒ построение
аналитической функции, характеризующей зависимость
уровней ряда от времени.
•
•
•
•
•
линейный тренд: ŷt = a + b·t
гипербола: ŷt = a + b/t
экспоненциальный тренд: ŷt = ea + b·t (или ŷt = a · bt )
степенная функция: ŷt = a · tb
полиномы различных степеней: ŷt = a + b1·t + b2·t2 +… + bk·tk
19
ОПРЕДЕЛЕНИЕ ТИПА ТЕНДЕНЦИИ
• Качественный анализ – построение и визуальный анализ графика
зависимости уровней ряда от времени, расчет некоторых основных
показателей динамики.
• Если временной ряд имеет линейную тенденцию, то его
коэффициент автокорреляции первого порядка должен быть
высоким. Если временной ряд содержит нелинейную тенденцию, то
коэффициент автокорреляции первого порядка по логарифмам
уровней исходного ряда будет выше, чем соответствующий
коэффициент, рассчитанный по уровням ряда.
Выбор наилучшего уравнения можно осуществить путем перебора
основных форм тренда, расчета по каждому уравнению
скорректированного коэффициента детерминации Ȓ2 и выбора
уравнения тренда с максимальным значением.
20
Коэффициент детерминации
R2 1
RSS
1
TSS
2
ˆ
y
y
i i
n
i 1
n
2
y
y
i
i 1
Скорректированный коэффициент детерминации
Rˆ 2 1
n 1
n m 1
2
ˆ
y
y
i i
n
i 1
n
2
y
y
i
i 1
1
n 1
1 R2
n m 1
где m – число параметров (без учета свободного члена),
n – число наблюдений.
21
ПРИМЕР 3. РАСЧЕТ ПАРАМЕТРОВ ТРЕНДА.
Имеются помесячные данные о темпах роста
номинальной заработной платы в РФ за 10 месяцев в
процентах к уровню декабря предыдущего года.
Требуется выбрать наилучший тип тренда и определить
его параметры.
22
Темпы роста номинальной месячной заработной платы за 10
месяцев, % к уровню декабря предыдущего года
23
Уравнения трендов для временного ряда темпов роста
номинальной месячной заработной платы за 10 месяцев
24
Ошибка спецификации при выборе уравнения тренда
25
МОДЕЛИРОВАНИЕ СЕЗОННЫХ И ЦИКЛИЧЕСКИХ КОЛЕБАНИЙ
Простейший подход к анализу структуры временных рядов – расчет
значений сезонной компоненты методом скользящей средней и
построение аддитивной или мультипликативной модели временного
ряда (расчет значений T, S и E для каждого уровня ряда).
Выбор одной из двух моделей осуществляется на основе анализа
структуры сезонных колебаний:
• Если амплитуда колебаний приблизительно постоянна, строят аддитивную
модель, в которой значения сезонной компоненты предполагаются
постоянными для различных циклов.
• Если амплитуда колебаний возрастает или уменьшается, строят
мультипликативную модель, которая ставит уровни ряда в зависимость от
значений сезонной компоненты.
26
Процесс построения модели
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты S.
3. Устранение сезонной компоненты из исходных уровней ряда и
получение выравненных данных (Т + Е) в аддитивной или (Т · Е) в
мультипликативной модели.
4. Аналитическое выравнивание уровней (Т + Е) или (Т · Е) и расчет
значений T с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений (Т + Е) или (Т · Е).
6. Расчет абсолютных и/или относительных ошибок.
27
ПРИМЕР 4. ПОСТРОЕНИЕ АДДИТИВНОЙ МОДЕЛИ
ВРЕМЕННОГО РЯДА.
В примере 2 установили, что временной ряд потребления
электроэнергии жителями района за последние четыре года содержит
сезонные колебания периодичностью 4. Объемы потребления
электроэнергии в осенне-зимний период времени (I и IV кварталы)
выше, чем весной и летом (II и III кварталы).
По графику ряда можно установить наличие приблизительно равной
амплитуды колебаний. Это свидетельствует о возможном
существовании в ряде аддитивной модели. Рассчитаем ее
компоненты и дадим прогноз потребления электроэнергии жителями
района в течение первого полугодия ближайшего следующего года.
28
ПРИМЕР 4. ПОСТРОЕНИЕ АДДИТИВНОЙ МОДЕЛИ
ВРЕМЕННОГО РЯДА.
В примере 2 установили, что временной ряд потребления
электроэнергии жителями района за последние четыре года
содержит сезонные колебания периодичностью 4. Объемы
потребления электроэнергии в осенне-зимний период времени (I и
IV кварталы) выше, чем весной и летом (II и III кварталы).
По графику ряда можно установить наличие приблизительно
равной амплитуды колебаний. Это свидетельствует о возможном
существовании в ряде аддитивной модели. Рассчитаем ее
компоненты и дадим прогноз потребления электроэнергии
жителями района в течение первого полугодия ближайшего
следующего года.
29
ШАГ 1
Проведем выравнивание исходных уровней ряда методом
скользящей средней:
a) просуммируем уровни ряда последовательно за каждые четыре
квартала со сдвигом на один момент времени и определим
условные годовые объемы потребления электроэнергии (гр. 3 табл.
1);
b) разделив полученные суммы на 4, найдем скользящие средние
(гр. 4 табл.1);
c) приведем эти значения в соответствие с фактическими моментами
времени: найдем средние значения из двух последовательных
скользящих средних – центрированные скользящие средние (гр. 5
табл.1).
30
Таблица 1. Расчет оценок сезонной компоненты в аддитивной модели
Потребление
№
квартала, электроэнергии,
t
yt
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
7,0
10,8
Итого за
четыре
квартала
3
–
24,4
25,6
26,0
27,0
28,0
28,8
29,6
30,0
31,0
32,0
33,0
33,6
33,4
–
–
Скользящая
Центрированная
Оценка
средняя за
скользящая
сезонной
четыре квартала
средняя
компоненты
4 (п.3/4)
–
6,10
6,40
6,50
6,75
7,00
7,20
7,40
7,50
7,75
8,00
8,25
8,40
8,35
–
–
5
–
–
6,250
6,450
6,625
6,875
7,100
7,300
7,450
7,625
7,875
8,125
8,325
8,375
–
–
6 (п.1 - п.5)
–
–
-1,250
2,550
0,575
-2,075
-1,100
2,700
0,550
-2,025
-1,475
2,875
0,675
-1,775
–
–
31
ШАГ 2
Найдем оценки сезонной компоненты как разность между
фактическими уровнями ряда и центрированными
скользящими средними (гр. 6 табл. 1).
Используем эти оценки для расчета значений сезонной
компоненты S (табл. 2) ‒ найдем средние за каждый квартал
(по всем годам) оценки сезонной компоненты Si:
0,6 ‒ 1,958 ‒ 1,275 ‒ 2,708 = 0,075
32
ШАГ 2
В моделях с сезонной компонентой обычно предполагается, что
сезонные воздействия за период взаимопогашаются. В аддитивной
модели сумма значений сезонной компоненты по всем кварталам
должна быть равна нулю.
Определим корректирующий коэффициент:
k = 0,075 / 4 = 0,01875
Рассчитаем скорректированные значения сезонной компоненты как
разность между ее средней оценкой и корректирующим
коэффициентом k:
S i S i k , i 1 4.
Проверим условие равенства нулю: 0,581 ‒ 1,977 ‒ 1,294 ‒ 2,690 = 0
33
Таблица 2. Расчет значений сезонной компоненты в
аддитивной модели
Год
Показатели
I
II
2
0,575
-2,075
4
0,675
-1,775
1
3
Итого за i -й квартал (за все
годы)
Средняя оценка сезонной
компоненты для i -го
квартала, Ŝ i
Скорректированная
сезонная компонента для i го квартала, S i
№ квартала, i
–
0,550
III
IV
–
-1,250
2,550
-2,025
-1,475
2,875
-1,100
–
2,700
–
1,800
-5,875
-3,825
8,125
0,600
-1,958
-1,275
2,708
0,581
-1,977
-1,294
2,690
34
ШАГ 3
Элиминируем влияние сезонной компоненты (гр.4 табл.3):
T+E=Y–S
ШАГ 4
Определим компоненту T – проведем аналитическое
выравнивание ряда (T + E) с помощью линейного тренда.
В результате получим уравнение: Т = 5,715 + 0,186 · t
Подставляя в уравнение значения t = 1, …, 16, найдем
уровни Т для каждого момента времени (гр.5 табл.3).
35
Таблица 3. Аналитическое выравнивание ряда (T + E)
Т = 5,715 + 0,186 · t
36
ШАГ 5
Найдем значения уровней ряда, полученные по аддитивной
модели – прибавим к уровням T значения сезонной
компоненты S для соответствующих кварталов (гр.6 табл.3).
ШАГ 6
Выполним расчет абсолютной ошибки (гр.7 табл.3):
E = Y – (T + S)
37
Расчет выравненных значений T и ошибок E в аддитивной модели
38
Потребление электроэнергии
жителями района
Фактические (Y), выравненные (T) и полученные по аддитивной
модели (T+S) значения уровней ряда
Время, квартал
39
Оценка качества построения модели
40
Оценка качества построения модели
E yi Ti Si
2
n
i 1
RSS
R 1
1
TSS
2
2
2
ˆ
yi yi 1,098
n
i 1
2
ˆ
y
y
i i
n
i 1
n
2
y
y
i
i 1
1,098
1
0,984
67,12
Аддитивная модель объясняет 98,4% общей вариации уровней временного
ряда потребления электроэнергии за последние 16 кварталов.
41
Прогнозирование по аддитивной модели F(t) = T(t) + S(t)
1. По уравнению Т = 5,715 + 0,186 · t определим значения трендовых компонент:
Т17 = 5,715 + 0,186 · 17 = 8,877;
Т18 = 5,715 + 0,186 · 18 = 9,063.
2. Значения сезонной компоненты равны:
S1 = 0,581 (I квартал);
S2 = –1,977 (II квартал).
3. Таким образом, детерминированная составляющая временного ряда:
F17 = Т17 + S1 = 8,877 + 0,581 = 9,458;
F18 = Т18 + S2 = 9,063 – 1,977 = 7,086.
4. Прогноз объема потребления электроэнергии на первое полугодие пятого года:
(9,458 + 7,086) = 16,544 млн кВт · ч.
42
ПРИМЕР 5. ПОСТРОЕНИЕ МУЛЬТИПЛИКАТИВНОЙ МОДЕЛИ
ВРЕМЕННОГО РЯДА.
Имеются поквартальные данные о прибыли компании за
последние четыре года
Год
1
2
3
4
I
72
70
62
52
II
100
92
80
60
Квартал
III
90
80
68
50
IV
64
58
48
30
43
График временного ряда
44
Расчет оценок сезонной компоненты в мультипликативной модели
Прибыль
№
квартала, компании,
t
yt
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2
72
100
90
64
70
92
80
58
62
80
68
48
52
60
50
30
Итого за
четыре
квартала
3
–
326
324
316
306
300
292
280
268
258
248
228
210
192
–
–
Скользящая
Центрированная
Оценка
средняя за
скользящая
сезонной
четыре
средняя
компоненты
квартала
4 (ст.3/ 4)
5
6 (ст.2/ ст.5)
–
–
–
81,5
–
–
81,0
81,25
1,108
79,0
80,00
0,800
76,5
77,75
0,900
75,0
75,75
1,215
73,0
74,00
1,081
70,0
71,50
0,811
67,0
68,50
0,905
64,5
65,75
1,217
62,0
63,25
1,075
57,0
59,50
0,807
52,5
54,75
0,950
48,0
50,25
1,194
–
–
–
–
–
–
45
Взаимопогашаемость в мультипликативной модели
Взаимопогашаемость выражается в том, что сумма значений
сезонной компоненты должна быть равна числу периодов в цикле (в
нашем случае оно равно 4 ‒ четыре квартала). Имеем:
0,918 + 1,209 + 1,088 + 0,808 = 4,023
Определим корректирующий коэффициент: k = 4 / 4,023 = 0,9943.
Определим скорректированные значения сезонной компоненты,
умножив ее средние оценки на корректирующий коэффициент k:
Si Si k , i 1 4.
Проверим условие равенства 4: 0,581 ‒ 1,977 ‒ 1,294 ‒ 2,690 = 0
46
Расчет сезонной компоненты в мультипликативной модели
Показатели
Год
1
Средняя оценка
сезонной компоненты
для i -го квартала, Ŝ i
Скорректированная
сезонная компонента
для i -го квартала, S i
–
II
IV
1,108
0,800
1,217
1,075
0,807
0,900
1,215
4
0,950
1,194
0,905
III
–
2
3
Итого за i -й квартал (за
все годы)
I
№ квартала, i
1,081
–
0,811
–
2,755
3,625
3,264
2,418
0,918
1,208
1,088
0,806
0,914
1,202
1,082
0,802
47
Аналитическое выравнивание ряда (T · E)
48
Расчет выравненных значений T и ошибок E в мультипликативной
модели
49
Прибыль компании
Фактические (Y), выравненные (T) и полученные по
мультипликативной модели (T·S) значения уровней ряда
Время, квартал
50
Оценка качества построения модели
E yi Ti Si
2
n
i 1
RSS
R 1
1
TSS
2
2
2
ˆ
yi yi 207,73
n
i 1
2
ˆ
y
y
i i
n
i 1
n
2
y
y
i
i 1
207,73
1
0,959
5 023,00
51
Прогнозирование по мультипликативной модели F(t) = T(t) · S(t)
1. По уравнению Т = 90,57 – 2,773 · t определим значения трендовых компонент:
Т17 = 90,57 – 2,773 · 17 = 43,420;
T18 = 90,57 – 2,773 · 18 = 40,647.
2. Значения сезонной компоненты равны:
S1 = 0,913 (I квартал);
S2 = 1,202 (II квартал).
3. Таким образом, детерминированная составляющая временного ряда:
F17 = T17 · S1 = 43,420 · 0,913 = 39,671;
F18 = T18 · S2 = 40,647 · 1,202 = 48,865.
4. Прогноз ожидаемой прибыли на первое полугодие следующего года:
(39,671 + 48,865) = 88,536 тыс. долл. США.
52