Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Модели, учитывающие сезонность
Airline-модель, часто используемая на практике, имеет вид
, (1)
где s – период сезонности, , , - случайная величина с нулевым средним, величины и некоррелированы между собой при ij, дисперсия .
Такая запись (левая часть уравнения (1)) означает, что исходный ряд подвергается двум преобразованиям:
1. означает, что вычисляются разности первого порядка . Обозначим элементы нового ряда .
2. означает, что далее у нового ряда вычисляются сезонные разности . Если обозначить элементы нового ряда , то окончательный ряд через исходный можно выразить следующим образом:
Seasonal differencing is commonly used in business and finance. For example, in reporting quarterly earnings of a company, news media often compare the earnings with that of the same quarter one year earlier.
(правая часть уравнения (1)) означает, что исходная случайная составляющая подвергается двум преобразованиям:
1. означает, что это обычная модель скользящего среднего 1го порядка с параметром g, т.е. преобразование типа . Обозначим новую случайную составляющую .
2. означает, что также присутствует сезонная модель скользящего среднего 1го порядка с параметром G, т.е. для новой случайной составляющей преобразование типа . Если обозначить последнюю случайную составляющую , то последнюю (и окончательную) случайную составляющую через исходную можно выразить следующим образом:
Таким образом, модель (1) можно записать в виде
(2)
Автокорреляционная функция рядов, описываемых этой моделью, имеет «узнаваемый» вид. Далее выведем автокорреляционную функцию для дважды преобразованного ряда, то есть для . Из модели (2) следует, что
. (3)
А значит, для дважды преобразованного ряда имеют место следующие свойства:
Свойство 1.
Свойство 2.
Свойство 3.
Свойство 4.
Свойство 5.
Свойство 6.
Свойство 7. для любых
Доказательство свойства 1.
Используя (3), имеем, что
Учитывая, что математическое ожидание от алгебраической суммы случайных величин равно такой же сумме математических ожиданий этих величин, получим
Выносим за знак математического ожидания неслучайные величины и
Учитывая, что - случайная величина с нулевым средним, получим
Свойство 1 доказано.
Доказательство свойства 2.
С учетом свойства 1 имеем, что
Учитывая (3), имеем
Раскроем скобки (я раскрывала без использования формул сокращенного умножения, чтобы у вас был образец для доказательства свойств 3 и 4). Учитывая, что математическое ожидание от алгебраической суммы случайных величин равно такой же сумме математических ожиданий этих величин, получим
Выносим за знак математического ожидания неслучайные величины и
Учитывая, что при любых имеем, что почти все слагаемые равны нулю. Следовательно
так как для любого s, то
вынесем за скобки
группируем
выносим общий множитель из второй скобки
теперь выносим квадратную скобку как общий множитель
Свойство 2 доказано.
Задача 1. Докажите свойства 3 и 4.
Задача 2. Найдите все элементы автокорреляционной функции для дважды преобразованного ряда, то есть для .
Таким образом, для того, чтобы проверить подходит ли Airline-модель для описания ряда необходимо построить автокорреляционную функцию для дважды преобразованного ряда . Если у нее значимо отличаться от нуля будут только 5 элементов: , , , , , причем и незначимо отличаются друг от друга, то Airline-модель подходит для описания исходного ряда .
Задача 3.
1. В файле "q-ko-earns8309.txt" находится временные ряды поквартальных прибылей на акцию компании Coca-Cola с I квартала 1983 по III квартал. Постройте диаграмму этого временного ряда.
2. Отметим, что у исходного ряда наблюдается экспоненциальный тренд, кроме того, дисперсия этого ряда растет с течением времени. Преобразуйте исходный ряд, взяв логарифмы его значений. Постройте диаграмму нового временного ряда.
3. Отметим, что у нового ряда наблюдается линейный тренд, кроме того, преобразование позволило стабилизировать дисперсию (у нового ряда дисперсию можно считать постоянной (не зависящей от времени) величиной). Очевидно, что как исходный, так и преобразованный ряд не является стационарным. Перейдите от ряда, полученного в п.2 к ряду, составленному из разностей первого порядка. Постройте диаграмму и график автокорреляционной функции полученного временного ряда.
4. На диаграмме, построенной в п.3 наблюдается ярко выраженная сезонность. Вид автокорреляционной функции является типичным для рядов, содержащих сезонную компоненту: значения автокорреляционной функции велики в точках, кратных периоду сезонности, и затухают медленно. Перейдите от ряда, полученного в п.3 к ряду, составленному из сезонных разностей. Постройте диаграмму и график автокорреляционной функции полученного временного ряда.
Указание. Используйте функцию diff(<имя массива>, <период сезонности>)
5. Можно ли сказать, что у автокорреляционной функции, построенной в п.4, значимо отличаются от нуля только 5 элементов: , , , , , причем и незначимо отличаются друг от друга? Можно ли сказать, что мультипликативная сезонная модель (Airline-модель) подходит для описания ряда, полученного в п.2?
6. Оцените параметры мультипликативной сезонной модели (airline-модели) по данным ряда, полученного в п.2.
Указание. Используйте функцию
arima(<имя массива>, order=c(0,1,1), seasonal=list(order=c(0,1,1), period=<период сезонности>))
Coefficients:
ma1 sma1
-0.4096 -0.8203
s.e. 0.0866 0.0743
7. Являются ли параметры модели значимыми?
t статистики
-4.727045
-11.0389
8. Запишите уравнение модели в виде (1) и в виде (2).
9. Проверьте адекватность модели.
data: m1$residuals
X-squared = 13.303, df = 12, p-value = 0.3474
10. Постройте график остатков модели. Можно ли сказать, что в некоторый момент времени явно наблюдаются выбросы (аномальные значения, большие отклонения реальных значений от модельных значений)? Было ли очевидно по графику исходного ряда, что такие отклонения будут присутствовать?
11. Для построения «реального» прогноза с помощью мультипликативной сезонной модели необходимо, чтобы данные, которые «будут прогнозироваться», не участвовали в оценке параметров модели. Поэтому постройте мультипликативную сезонную модель по первым 100 значениям ряда, полученного в п.2. Проверьте значимость ее параметров и ее адекватность.
Coefficients:
ma1 sma1
-0.4209 -0.8099
s.e. 0.0874 0.0767
t статистики
-4.816664
-10.55678
X-squared = 13.434, df = 12, p-value = 0.3383
12. Постройте прогноз следующих 7 значений ряда (101-107).
Указание. Используйте функцию
predict(<модель>, <количество прогнозных значений>)
которая возвращает:
“pred” – прогнозные значения,
“se” – СКО прогнозных значений.
№
ряд
прогноз
101
-0,40
-0,51
102
0,01
-0,12
103
-0,19
-0,27
104
-0,45
-0,45
105
-0,43
-0,42
106
-0,08
-0,04
107
-0,20
-0,18
13. Постройте доверительные интервалы этих прогнозов для надежности 0.95, в предположении, что значения ряда распределены нормально.
№
левая
правая
101
-0,68
-0,34
102
-0,32
0,07
103
-0,49
-0,05
104
-0,69
-0,21
105
-0,69
-0,15
106
-0,34
0,26
107
-0,50
0,14
14. Нанесите на диаграмму:
• ряд с 80го до 107го значения;
• прогноз 101-107 значений;
• их доверительные интервалы (в виде коридора).
15. Постройте прогноз 101-107 значений исходного ряда.
Указание. Принимайте во внимание следующий теоретический материал:
Таким образом, в предыдущем пункте функция «predict» вернула и (“pred” и “se”) для нормального распределения (для значений ряда из п.2). А нам необходимо теперь найти Е и Var (мат.ожидание и дисперсию) для соответствующего логнормального распределения (для значений исходного ряда) по формулам (1.14). В тексте говорится про simple net return и continuously compounded return (log return) . Напомню, что связь между ними выражается формулой . Обратите внимание на то, что, так как в п.2 мы не добавляли 1 к значениям ряда, то в формуле для не надо отнимать 1.Формула для дисперсии останется прежней (как в (1.14))
№
ряд
прогноз
101
0,67
0,61
102
1,01
0,89
103
0,83
0,77
104
0,64
0,64
105
0,65
0,66
106
0,92
0,97
107
0,82
0,84
16. Постройте доверительные интервалы этих прогнозов (101-107 значений исходного ряда) для надежности 0.95.
Указание. Формулы для пересчета границ доверительных интервалов нет. Их рассчитывают заново. Здесь пригодится дисперсия, вычисленная по формуле (1.14)
№
левая
правая
101
0,50
0,71
102
0,71
1,07
103
0,60
0,94
104
0,48
0,80
105
0,48
0,85
106
0,68
1,27
107
0,57
1,12
17. Нанесите на диаграмму:
• Исходный ряд с 80го до 107го значения;
• прогноз 101-107 значений;
• их доверительные интервалы (в виде коридора).
Сезонные фиктивные переменные
Вспомним, что такое фиктивные переменные вообще. В начальном курсе эконометрики рассказывалось:
Мы будем рассматривать использование сезонных фиктивных переменных. Например, зима/весна/лето/осень или январь/не январь.
Задача 4.
1. В файле "m-deciles08.txt" находятся временные ряды monthly simple returns of the CRSP Decile 1 Index from January 1970 to December 2008. Далее будем работать с временным рядом CAP1RET (второй столбец). Постройте диаграмму этого временного ряда. Судя по графику, является ли этот ряд стационарным в широком смысле? Если мы будем использовать модели ARIMA для описания поведения данного временного ряда, будет ли порядок интегрирования (второй параметр функции ARIMA) отличен от нуля? Наблюдается ли у данного временного ряда ярко выраженная сезонная компонента?
2. Постройте график автокорреляционной функции данного ряда до 40го значения. Какие значения автокорреляционной функции значимо отличаются от нуля? Так как мы имеем дело с ежемесячными данными, то какой период сезонности было бы естественно ожидать в данном случае? Можно ли сказать, что автокорреляционная функция подтверждает наличие сезонности?
3. Оцените параметры модели, учитывающей сезонную составляющую, следующего вида:
Порядок авторегрессии p=1
Порядок интегрирования i=0 (ряд, очевидно, является стационарным в широком смысле)
Порядок скользящего среднего q=0
Порядок сезонной авторегрессии ps=1
Порядок сезонного интегрирования is=0
Порядок сезонного скользящего среднего qs=1
Период сезонности s определите самостоятельно.
Coefficients:
ar1 sar1 sma1 intercept
0.1769 0.9882 -0.9144 0.0118
s.e. 0.0456 0.0093 0.0335 0.0129
4. Какие параметры модели, полученной в предыдущем пункте, являются статистически незначимыми?
t статистики
ar1 3.881852
sar1 106.6654
sma1 -27.27886
intercept 0.9140126
5. Уточните модель, удалив из нее незначимые параметры. Не забудьте выполнить заново оценку параметров новой модели!
Указание. Используйте опцию include.mean = F, если незначим intercept
Coefficients:
ar1 sar1 sma1
0.1787 0.9886 -0.9127
s.e. 0.0456 0.0089 0.0335
6. Запишите уравнение полученной модели в виде (2).
Указание. Чтобы корректно записать уравнение модели, следует повторить рассуждения, приведшие от уравнения (1) (описывающего модель с параметрами p=0, i=1, q=1, ps=0, is=1, qs=1, s=s) к уравнению (2).
7. Так как значения параметров АR и МА у сезонной составляющей близки. Действительно, если записать модель в виде (1), то она имеет вид . В такой форме записи видно, что AR и МА части у сезонной составляющей как бы нейтрализуют друг друга. Это приводит к выводу, что сезонное поведение близко к неслучайному. Чтобы подтвердить это предположение, введем фиктивную переменную для января (сезонную фиктивную переменную):
Оцените параметры модели линейной регрессии вида
где - исходный ряд.
Указание.
◦ Используйте опцию lm.
◦ Предварительно создайте ряд такой же длины, как исходный ряд, состоящий сами догадайтесь из каких значений (см формулу выше).
◦ Для создания ряда удобно использовать функцию
rep(<какую комбинацию повторить>, <сколько раз ее повторить>).
Причем эту функцию придется вложить саму в себя, то есть использовать рекурсивно дважды.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.002864 0.003333 0.859 0.391
jan 0.125251 0.011546 10.848 <2e-16 ***
8. Какие параметры модели, полученной в предыдущем пункте, являются статистически незначимыми? Уточните модель, удалив из нее незначимые параметры. Не забудьте выполнить заново оценку параметров новой модели! Запишите уравнение полученной модели.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
jan 0.12812 0.01105 11.59 <2e-16 ***
9. Преобразуйте исходный ряд, удалив из него эффект января, следующим образом
.
Постройте диаграмму этого временного ряда. Сравните диаграммы исходного и нового ряда. Судя по диаграмме, что дал учёт эффекта января?
10. Постройте автокорреляционную функцию нового ряда. Сравните автокорреляционные функции исходного и нового ряда. Можно ли сказать, что учёт эффекта января позволил избавиться от сезонной компоненты? Можно ли сказать, что сезонность исходного ряда в основном заключалась в эффекте января?
11. Далее с новым рядом следует работать, как с рядом без сезонной составляющей. Мы это делали в прошлом семестре, в данной задаче мы закончим на этом.