Методы построения общей линейной статистической модели (ОЛСМ)
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Факультет прикладной математики и информатики
Кафедра математического моделирования и анализа данных
В. И. МАЛЮГИН
ЭКОНОМЕТРИКА
Конспект лекций
по учебной дисциплине для специальности
«Экономическая кибернетика
(математические методы и компьютерное
моделирование в экономике)»
Минск, 2015
Малюгин В.И. Эконометрика – 1.
Страница 1
Тематический план курса
Название раздела, темы
Раздел I. Методы построения общей линейной статистической модели (ОЛСМ)
Введение. Общая характеристика эконометрического
подхода.
ОЛСМ и ее построение с помощью метода наименьших
квадратов
Построение и анализ ОЛСМ в предположении нормальности распределения ошибок наблюдения
Методы построения ОЛСМ при нарушении традиционных предположений относительно ошибок наблюдений.
Обобщенный метод наименьших квадратов.
Построение и анализ ОЛСМ в условиях мультиколлинеарности факторов.
Раздел II. Эконометрические модели временных рядов и методы их построения
Модели и методы анализа стационарных временных
рядов
Модели и методы анализа нестационарных временных
рядов
Моделирование временных рядов с гетероскедастичными ошибками
Коинтегрированные временные ряды и модель коррекции ошибок
Многомерные эконометрические модели и методы их
построения
Малюгин В.И. Эконометрика – 1.
Страница 2
ЭКОНОМЕТРИКА-1
Методы построения общей линейной
статистической модели (ОЛСМ)
Малюгин В.И. Эконометрика – 1.
Страница 3
ГЛАВА 1
ВЕДЕНИЕ. ОБЩАЯ ХАРАКТЕРИСТИКА
ЭКОНОМЕТРИЧЕСКОГО ПОДХОДА
1.1. ПОНЯТИЕ ЭКОНОМЕТРИКИ
И ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
Анализ эмпирических значений экономических и финансовых переменных свидетельствует о том, что они подвержены нерегулярным
и, на первый взгляд, непредсказуемым, «случайным» изменениям. По
этой причине аналитик может делать лишь некоторые предположения
относительно будущих значений анализируемых характеристик, но
никогда не знает их точно. Традиционных «детерминированных» моделей исследуемых процессов, построенных в рамках экономической
теории, оказывается недостаточно для решения задач анализа и прогнозирования экономических процессов в условиях неопределенности.
Неопределенность и непредсказуемость реальных процессов приводит к необходимости использования для их исследования вероятностного подхода, в рамках которого с помощью статистических
методов осуществляется построение вероят ност но-ст ат ист ических
(или просто ст ат ист ических) моделей исследуемых процессов.
Ст ат ист ической моделью принято называть мат емат ическую
модель реальных явлений ст охаст ической (случайной) природы,
построенную на основе анализа реальных статистических данных.
Статистические модели, описывающие механизм функционирования экономических или финансовых процессов, принято называть
экономет рическими моделями.
Термин «эконометрика» был введен в 1926 г. Рагнаром Фришем
для обозначения количественного подхода к исследованию экономических процессов, который сформировался в результате синтеза трех
научных направлений:
Малюгин В.И. Эконометрика – 1.
Страница 4
– экономической теории,
– статистической теории;
− экономической статистики.
Возможно следующее определение данного понятия.
Эконометрика – это область на стыке экономической и математической науки, в рамках которой на основе установленных экономической теорией зависимостей между экономическими переменными с помощью статистических методов анализа реальных
экономико-статистических данных осуществляется разработка
адекватных статистических (эконометрических) моделей исследуемых экономических процессов.
Очевидно, данное определение не тождественно часто используемой трактовке понятия «эконометрика» как ст ат ист ического анализа
эмпирических экономических данных.
В то же время, данное определение не отражает все особенности и
возможности эконометрики. В связи с чем представляют интерес высказывания известных ученых о назначении и сущности эконометрики: «Эконометрика позволяет проводить количественный анализ реальных экономических явлений» (П. Самуэльсон); «Основная задача
эконометрики − наполнить эмпирическим содержанием априорные
экономические рассуждения» (Л. Клейн); «Наиболее существенная
задача эконометрического исследования – оценка и проверка экономической модели» (Дж. Джонстон), «Цель эконометрики − эмпирический вывод экономических законов» (Э. Маленво); «Исследователь,
пытающийся восполнить недостаток глубоких знаний макроэкономической теории с помощью статистических имитационных экспериментов, скорее построит модель собственного невежества, а не реального
мира» (Т. Нейлор).
Приведенные характеристики указывают на непременное использование в рамках эконометрического подхода к анализу реальных экономических процессов всех образующих ее научных направлений:
экономической теории, статистической теории и экономической статистики. Вклад каждого из направлений состоит в следующем.
Малюгин В.И. Эконометрика – 1.
Страница 5
Экономическая теория позволяет строить экономические модели
(в виде детерминированных уравнений и тождеств), описывающие
взаимосвязи между экономическими переменными. Экономический
анализ используется также для обоснования эконометрической модели
и интерпретации результатов эконометрического моделирования.
Статистическая теория включает статистические модели зависимостей, а также статистические методы (оценивания, проверки гипотез, анализа, прогнозирования, имитации и др.), предназначенные
для построения, анализа адекватности и использования эконометрических моделей.
Экономическая статистика обеспечивает исследователя реальными экономико-статистическими данными (значениями экономических переменных), используемыми для построения эконометрических
моделей.
Эконометрические модели, основываясь на моделях и закономерностях экономической теории, придают им количественную форму
выражения. Это делает их не только доступными для практического
применения, но и позволяет проверять их адекватность.
Эконометрическая модель может использоваться для решения таких основных задач исследования реальных процессов, как:
− анализ причинно-следственных связей между экономическими
переменными;
− прогнозирование значений экономических переменных;
− построение и выбор вариантов (стратегий) экономической политики на основе имитационных экспериментов с моделью.
Развитие вычислительной техники и эконометрического программного обеспечения позволяет применять эконометрические модели и методы практически во всех направлениях экономических исследований, включая следующие:
− макроэкономика (эконометрические модели, как отдельных
макроэкономических показателей, так и национальных экономик в
целом);
− монетарная экономика (эконометрическое моделирование денежно -кредитной системы);
– международная экономика (эконометрические модели региональной и мировой экономики);
Малюгин В.И. Эконометрика – 1.
Страница 6
− финансовые рынки (эконометрические модели курсов и доходностей финансовых активов и их применение для принятия оптимальных инвестиционных решений);
– микроэкономика (эконометрические модели показателей хозяйственной и финансовой деятельности фирмы).
Процесс эконометрического моделирования может быть проиллюстрирован схемой, представленной на рис. 1.1.
Экономическая
теория
Статистическая
теория
П О С Т Р О Е Н И Е
Экономическая
статистика
М О Д Е Л И
ЭКОНОМЕТРИЧЕСКАЯ
МОДЕЛЬ
И С П О Л Ь З О В А Н И Е
АНАЛИЗ
причинноследственных
связей
ПРОГНОЗИРОВАНИЕ
значений
экономических
переменных
М О Д Е Л И
ВЫБОР
вариантов
экономической
политики
Рис. 1.1. Схема процесса эконометрического моделирования
1.2. КЛАССИФИКАЦИЯ ЭКОНОМЕТРИЧЕСКИХ
МОДЕЛЕЙ
1.2.1. ТИПЫ ДАННЫХ
При моделировании различных экономических процессов возможны три основных типа данных:
− пространственные данные (cross-sectional data);
Малюгин В.И. Эконометрика – 1.
Страница 7
−
−
временные ряды (time series data);
панельные данные (panel data) 1.
Пространственные данные − это совокупность значений
x1 , x2 , , xn анализируемой экономической переменной, полученных для некоторой группы из n (n > 1) объектов исследования
в фиксированный момент (период) времени.
Таким образом, пространственные данные образуют значения экономических переменных, соответствующие различным объектам в
один и тот же момент времени, т. е. характеризуют «пространственный срез» исследуемого экономического процесса.
Для анализа пространственных данных используются мет оды
многомерного ст ат ист ического анализа , например методы корреляционного, регрессионного, дисперсионного, факторного, дискриминантного и кластерного анализа [1, 10, 11].
Примеры: показатели финансовой и хозяйственной деятельности
группы предприятий за определенный период времени, например конкретный месяц, квартал или год; данные по курсам покупки и продажи
наличной валюты на некоторый день по обменным пунктам города.
Временным рядом называется ряд значений x1, x2, ... , xT анализируемой экономической переменной, соответствующих T (T > 1)
последовательным моментам (периодам) времени. В отличие от
пространственных данных, временные ряды характеризуют динамику изменения анализируемых переменных во времени.
Значения временного ряда регистрируются с фиксированным инт ервалом наблюдения. По интервалу наблюдения различают такие
основные типы данных, как: годовые, кварт альные, еж емесячные,
еж едневные данные. Им соответствуют годовые, кварт альные и т. д.
экономет рические модели, поскольку для построения конкретной эко-
нометрической модели используются данные с одним и тем же интер-
1
В рамках данного курса модели и методы анализа панельных данных не рассматриваются.
Малюгин В.И. Эконометрика – 1.
Страница 8
валом наблюдения. Для анализа данных типа «временной ряд» используются мет оды ст ат ист ического анализа временных рядов.
Примеры: годовые значения макроэкономических показателей,
например ВВП, объема выпуска промышленной и сельскохозяйственПанельные
данные
−
это
совокупность
значений
x1t , x 2t , , x nt анализируемой экономической переменной, полученных для некоторой группы из n (n > 1) объектов исследования в последовательные моменты (периоды) времени t=1,2,…,T.
ной продукции; квартальные и ежемесячные значения показателей
денежно-кредитной системы, например денежных агрегатов, процентных ставок, кредиторской задолженности, индексов цен; ежедневные
значения обменных курсов валют, а также курсов ценных бумаг.
Таким образом, панельные данные имеют как пространственную,
так и временную структуру, например, показатели финансовой и хозяйственной деятельности группы предприятий за несколько лет.
1.2.2. ОБЩИЙ ВИД, ПРИНЦИПЫ ПОСТРОЕНИЯ
И ИСПОЛЬЗОВАНИЯ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
Всякая модель, как известно, строится при некоторых упрощающих предполож ениях относительно объекта моделирования, которые
позволяют абстрагироваться от несущественных деталей [22].
Для адекватного описания экономических процессов, очевидно,
требуются модели, которые обладают тремя основными свойствами:
1) описывают зависимость между совместно анализируемыми
экономическими переменными;
2) характеризуют динамику изменения экономических переменных;
3) учитывают влияние внешних (экзогенных) факторов на анализируемые «внутренние» (эндогенные) характеристики исследуемых
процессов.
Опишем общий вид эконометрической модели, которая обладает
указанными свойствами, а также перечислим основные принципы ее
построения.
Малюгин В.И. Эконометрика – 1.
Страница 9
Пусть состояние исследуемого экономического процесса в момент
(период) времени t характеризуется некоторой переменной (показателем) yt, называемой эндогенной (внутренней) переменной. Состояние
процесса, а, следовательно, значения переменной yt могут зависеть от
различных факторов, среди которых можно выделить две группы факторов:
1) систематические контролируемые (наблюдаемые) факторы,
представляемые объясняющими переменными zt1, zt2, … , ztK, значения
которых считаются известными к моменту времени t;
2) случайные неконтролируемые факторы, приводящие к случайным отклонениям ξt значений эндогенной переменной yt от ожидаемых значений.
В свою очередь, к объясняющим переменным могут относиться:
− лаговые (предопределенные) переменные yt–1, yt–2, … , yt–L,
(1 ≤ L ≤ K), соответствующие значениям эндогенной переменной в
прошлые моменты времени, отстоящие от текущего момента времени t
на один, два и т. д. шага (лага) назад, при этом ztl ≡ yt–l, l = 1, 2, … , L;
− экзогенные переменные xt1, xt2, … , xtM (1 ≤ M ≤ K), характеризующие воздействия на исследуемый процесс со стороны внешних факторов, при этом zti ≡ xti, i = 1, 2, … , M.
Целью эконометрического моделирования рассматриваемого процесса является построение по эмпирическим данным {yt}, {xti} (t = 1, 2,
… , n) статистической модели зависимости переменной yt от переменных yt–1, yt–2, … , yt–L и x1t, x2t, … , xMt вида:
yt = f(yt–1, yt–2, … , yt–L, xt1, xt2, … , xtM; θ) + ξt,
(1.1)
где f(·; θ) − функция, определенная с точностью до неизвестных параметров θ (θ ∈ Θ ⊂ ℜm, m ≥ 1), аргументами которой могут быть
K (M + L = K ≥ 1) предопределенных и экзогенных переменных; {ξt} −
случайные ошибки наблюдения эндогенной переменной, обусловленные действием неучтенных в модели случайных нерегулярных факторов.
При построении модели вида (1.1) приходится решать следующие
задачи:
1) выбор и экономическое обоснование вида зависимости f(·; θ),
а также предопределенных и экзогенных переменных;
Малюгин В.И. Эконометрика – 1.
Страница 10
2) статистическое оценивание параметров модели θ;
3) статистическая проверка адекватности построенной модели.
Выбор статистических методов решения указанных задач зависит
от модельных предположений, которые делаются относительно случайных ошибок наблюдения {ξt}, факторов {xti}, вида зависимости
f(·;θ), а также свойств самих моделируемых временных рядов yt.
Статистическая адекватность эконометрической модели – необходимое, но не достаточное условие получения содержательных экономических выводов. Другим обязательным качеством адекватной эконометрической модели является возможность экономического обоснования, как самой модели, так и получаемых на ее основе результатов
исследования реальных процессов.
Модель вида (1.1) может использоваться:
− для анализа зависимости эндогенной переменной от включенных в модель экзогенных переменных;
− для прогнозирования значений эндогенной переменной yt по заданным значениям экзогенных переменных xt1, xt2, … , xtM в соответствии с алгоритмом прогнозирования:
yt = f(yt–1, yt–2, … , yt–L , xt1, xt2, … , xtM; θ ),
где θ − статистическая оценка параметров модели;
− для выбора значений xt1, xt2, … , xtM экзогенных переменных,
обеспечивающих достижение заданных значений эндогенной переменной yt*.
Экономически обоснованный набор значений экзогенных переменных, обеспечивающий достижение заданных значений эндогенных переменных, выступающих как целевые экономические
индикаторы, называется вариантом экономической политики.
Таким образом, при использовании эконометрических моделей,
включающих экзогенные переменные в задачах прогнозирования и
выбора вариантов экономической политики, возникает дополнительная проблема задания значений экзогенных переменных.
На практике для адекватного описания экономических процессов
часто требуется осуществлять совместный анализ и моделирование
Малюгин В.И. Эконометрика – 1.
Страница 11
многих взаимосвязанных показателей их функционирования. Это приводит к эконометрическим моделям, включающим не одно, а N (N > 1)
уравнений типа (1.1) − по одному уравнению для каждой эндогенной
переменной. При этом возникают задачи построения и анализа адекватности «многомерных» эконометрических моделей.
В ряде случаев, когда не удается найти адекватного параметрического представления типа (1.1) для модели, описывающей зависимость
между анализируемыми экономическими переменными, могут использоваться непарамет рические модели [54].
1.2.3. ТИПЫ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ
Соотношения типа (1.1) в «одномерном» и «многомерном» случаях описывают достаточно широкое множество эконометрических моделей. В конкретных исследованиях могут потребоваться модели,
представляющие собой различные частные случаи описанной модели.
Перечислим основные классы эконометрических моделей, которые
получаются из указанного множества моделей при классификации по
таким признакам, как: размерность модели; учет фактора времени;
вид функциональной зависимости.
1. Размерность модели. Размерность модели определяется числом N совместно анализируемых эндогенных переменных, т. е.
числом уравнений, входящих в модель. По этому признаку модели делятся на одномерные (N = 1) и многомерные (N > 1).
Различают структурные и неструктурные многомерные эконометрические модели. Структурные модели содержат эндогенные переменные как в левых, так и в правых частях уравнений, образующих
некоторую систему уравнений. Неструктурные модели содержат эндогенные переменные только в левых частях уравнений.
Примеры
Одномерные модели (см. гл. 4, 5):
− регрессионные модели, состоящие из одного уравнения;
− трендовые модели временных рядов;
− одномерные модели временных рядов типа авторегрессии и
скользящего среднего и их обобщения.
Многомерные неструктурные модели:
− модели векторной авторегрессии (см. гл. 6 );
Малюгин В.И. Эконометрика – 1.
Страница 12
− векторные модели коррекции ошибок (см. гл. 6);
− многомерные регрессионные модели типа многомерной линейной регрессии и систем «псевдонезависимых» регрессионных уравнений.
Многомерные структурные модели − это системы одновременных
уравнений (см. гл. 7);
2. Фактор времени. В зависимости от того, учитывается в модели фактор времени или нет, различают статические и динамические модели.
Статические модели включают переменные, относящиеся к одному и тому же моменту времени, т. е. не содержат лаговых переменных.
Как правило, статические модели возникают при анализе пространственных данных. Статические модели могут также использоваться для описания долгосрочных взаимосвязей между экономическими переменными при совместном анализе коинтегрируемых временных рядов.
Динамические модели − это модели временных рядов, включающие лаговые значения анализируемых переменных. Динамические
модели, таким образом, позволяют анализировать динамику изменения эндогенных переменных во времени.
Примеры
Статические модели:
− регрессионные модели на основе пространственных данных;
− коинтеграционные соотношения в моделях временных рядов с
коррекцией ошибками.
Динамические модели:
− модели временных рядов типа авторегрессии и скользящего
среднего и их обобщения;
− модели динамической регрессии, т. е. регрессионные модели,
включающие лаговые значения эндогенных переменных.
3. Вид зависимости. По виду функциональной зависимости
f(·; θ) в соотношении типа (1.1) модели делятся на:
− линейные, внутренне линейные и нелинейные модели по параметрам θ.
Малюгин В.И. Эконометрика – 1.
Страница 13
Для линейных моделей функция f(·;θ) имеет линейный вид относительно θ, а для нелинейных моделей функция f(·;θ) является нелинейной относительно θ.
Внутренне линейными моделями называются нелинейные по параметрам модели, которые можно привести к линейному виду с помощью определенных функциональных преобразований.
Примеры
Линейные модели:
− модель простой, множественной и многомерной линейной регрессии, например модель множественной линейной регрессии с двумя факторами x1t , x2t вида (гл. 4):
yt = β0 + β1x1t + β2x2t + ξt,
где β0, β1, β2 − параметры модели;
− модели временных рядов типа авторегрессии и скользящего
Нелинейная модель
yt′ = exp(β0 + β1x1t + β2x2t +ξt)
может быть приведена к линейному виду относительно параметров β0,
β1, β2 с помощью преобразования логарифмирования:
yt = ln( yt′ ) = β0 + β1x1t + β2x2t + ξt,
т. е. является внутренне линейной.
Модель на основе производст венной функции Кобба-Дугласа с однородными факторами:
Qt = β 0 K tβ1 Lβt 2 e ξt ,
где
Qt – объем выпуска, Kt – затраты капитала, Lt – затраты трудо-
вых ресурсов, β 0 , β1 , β 2 – параметры модели, относительно которых
обычно предполагается: β 0 > 0, β1 + β 2 = 1 .
Данная модель может быть приведена к линейному виду относительно параметров β0, β1, β2 с помощью преобразования логарифмирования:
ln Qt = β 0 + β1 ln( K t ) + β 2 ln( Lt ) + ξ t .
Малюгин В.И. Эконометрика – 1.
Страница 14
После замены переменных получаем традиционное представление
модели, на параметры которой наложены ограничения, обусловленные
экономическим содержанием моделируемого процесса:
yt = β0 + β1x1t + β2x2t + ξt,, β 0 > 0, β1 + β 2 = 1.
Заметим, что параметры β1, β2 в рассматриваемом случае имеют
содержательную экономическую интерпретацию – являются коэффициентами эластичности переменной объема выпуска по отношению к
факторам производства.
Малюгин В.И. Эконометрика – 1.
Страница 15
ГЛАВА 2
ОБЩАЯ ЛИНЕЙНАЯ СТАТИСТИЧЕСКАЯ
МОДЕЛЬ (ОЛСМ) И ЕЕ ПОСТРОЕНИЕ С
ПОМОЩЬЮ МЕТОДА НАИМЕНЬШИХ
КВАДРАТОВ
2.1. ОПРЕДЕЛЕНИЕ ОБЩЕЙ ЛИНЕЙНОЙ
СТАТИСТИЧЕСКОЙ МОДЕЛИ В
ТРАДИЦИОННЫХ ПРЕДПОЛОЖЕНИЯХ
Определение и формы представления модели. Линейные
статистические модели широко используются в эконометрических
исследованиях. Многие из них можно рассматривать как частные
случаи так называемой «общей линейной статистической модели»
или ОЛСМ (General Linear Statistical Model − GLSM), возникающие
при различных модельных предположениях. Изучение методов
построения и использования ОЛСМ удобно начинать с традиционного
набора модельных предположений, приводящих к классической
линейной модели, известной также как модель множественной
линейной регрессии.
Регрессионные модели, как известно, применяются для
исследования зависимости среднего значения анализируемой
зависимой переменной от объясняющих переменных (факторов).
Приведем описание данной модели и сформулируем основные задачи,
решаемые на этапе ее построения.
Пусть для t-го (t = 1, 2, … , T) «эксперимента», связанного с
получением значений экономических переменных: yt − значение
анализируемой эндогенной переменной; ztl − значение l-ой объясняющей
переменной (l = 0, 1, …, m, m ≥ 1).
Под «экспериментом» понимается измерение либо регистрация
значений экономических переменных {yt}, {ztl}. Интерпретация индекса
t при этом зависит от типа модели данных: для «пространственных
(одномоментных) данных» t − это номер объекта наблюдения, для
В.И. Малюгин. Эконометрика –1.
Страница 1
данных типа «временной ряд» индекс t указывает на момент (период)
времени, к которому относятся значения анализируемых переменных.
Общая линейная статистическая модель описывается соотношением:
yt = β0g0(zt0) + β1g1(zt1) +…+ βmgm(ztm) + ξt,
(2.1)
где {βl}(l=0,1,…,m) − параметры модели, {ξt}(t=1,2,…,T) − случайные
«симметричные» ошибки наблюдения с нулевым средним значением,
{gl(.)}(l=0,1,…,m) − известные детерминированные функции.
Модель (2.1) является линейной по параметрам и может быть
нелинейной по объясняющим переменным. Однако при построении
модели (2.1) существенно лишь предположение относительно
линейности по параметрам, поскольку нелинейность по факторам
может быть устранена с помощью замены переменных:
xtl ≡ gl(ztl), l = 0, 1, … , m.
Это позволяет в дальнейшем рассматривать ОЛСМ в виде
yt = β0 xt0 + β1xt1 +…+ βmxtm + ξt =
(2.2)
m
= ∑ β l xtl + ξ t , t = 1, 2, ..., T .
l =0
Заметим также, что в общем случае среди объясняющих
переменных в модели (2.2) могут быть как экзогенные переменные,
описывающие
воздействия
внешних
факторов,
так
и
предопределенные переменные, соответствующие лаговым значениям
эндогенной переменной.
В аналитических исследованиях удобнее использовать векторное
представление модели (2.2). Введем векторно-матричные обозначения:
xt 0
β0
ξ1
y1
xt1
β1
ξ2
y2
T
T
m+1
∈ℜ , xt = ∈ℜm+1,
y = ∈ℜ , ξ = ∈ℜ , β =
...
...
...
ξ
y
x
β
T
T
tm
m
В.И. Малюгин. Эконометрика –1.
Страница 2
x10
x
X = 20
.
x
T0
x11 ... x1m x 1 T
x21 ... x2 m x 2 T
.
xT1
=
,
...
.
... xTm x T T
(2.3)
где y = (yt)∈ℜT − вектор значений эндогенной переменной, β = (βl) ∈
ℜm+1 − вектор параметров модели, ξ = (ξt) ∈ ℜT − вектор случайных
ошибок наблюдений, xt = (xlt) ∈ ℜm+1 − вектор-столбец значений
объясняющих переменных для t-го «эксперимента», Х = (xlt) − матрица
значений объясняющих переменных размерности Т×(m+1)
Тогда модель (2.1) допускает представление в виде
или
yt = x t T β + ξ t ,
t = 1, 2, ..., T ,
y = Xβ + ξ .
(2.4)
(2.5)
Таким образом, регрессионная модель, описываемая соотношениями (2.2), (2.4) или (2.5), является линейной как по параметрам, так
и по объясняющим переменным.
Часто полагают x0t ≡ 1 (t = 1, 2, …, T). При этом получается так
называемая модель со свободным членом. Например, модель (2.2) со
свободным членом принимает вид:
yt = β0 + β1x1t +…+ βmxmt + ξt, t = 1, 2, ..., T,
(2.6)
где β0 − свободный член, β1, … , βm − коэффициенты регрессии (β0,
β1, …, βm − параметры модели); {ξt} − случайные «симметричные»
ошибки наблюдения эндогенной переменной, среднее значение
которых полагается равным нулю, т.е. E(ξt) = 0.
В частном случае, когда используется лишь одна объясняющая
переменная, имеет место модель простой (парной) линейной регрессии
Согласно (2.6), модель простой линейной регрессии со свободным
членом имеет вид:
yt = β0 + β1x1t, t = 1, 2, ..., T.
В.И. Малюгин. Эконометрика –1.
Страница 3
Функция регрессии и прогнозы в виде условного
математического ожидания. Ожидаемое в соответствии с моделью
(2.2) значение эндогенной переменной определяется как условное
математическое ожидание случайной величины yt∈ℜ1 при условии,
что вектор объясняющих переменных принимает некоторое
фиксированное значение xt = (xtl) ∈ ℜm+1:
ft(xt, β ) ≡ E(ytxt) = β0x0t + β1xt1 +…+ βmxtm= xtТ β , t = 1, 2, ..., T, (2.7)
при этом функция ft( β , xt) называется функцией регрессии yt на xt.
Ожидаемое значение вектора y для заданной матрицы X
определяется Т-мерной функцией регрессии
f1 (x1 , β)
F(X, β ) ≡
= E (y X ) = Xβ .
f (x , β)
T T
(2.8)
Таким образом, случайные величины {ξt} − это отклонения
наблюдаемых значений эндогенной переменной от ожидаемых в
соответствии с регрессионной моделью значений, обусловленные
действием неучтенных в модели случайных «нерегулярных»
факторов.
Задачи построения модели. Построение модели по реальным
данным основывается на решении таких основных задач как:
− оценивание неизвестных параметров модели β0, β1,…,βm с
помощью мет одов ст ат ист ического оценивания парамет ров по
эмпирическим данным y, X;
− проверка адекватности модели с помощью методов статистической проверки гипотез;
− выбор модели из числа альтернативных вариантов адекватных
моделей на основе тестовых статистик.
Использование конкретных методов оценивания параметров и
проверки гипотез при этом зависит от дополнительных «модельных»
предположений, которые делаются относительно случайных ошибок
наблюдения и используемых в модели объясняющих переменных.
Традиционные модельные предположения (гипотезы) для
ОЛСМ можно разбить на две следующие группы.
В.И. Малюгин. Эконометрика –1.
Страница 4
• Предполож ения от носит ельно объясняющих переменных:
Х.1. Объясняющие переменные являются детерминированными,
т.е. значения факторов {xtl} (t = 1, 2, ..., T) являются не случайными
(фиксированными) величинами.
Х.2. Матрица значений факторов X является матрицей полного
ранга (rank(X) = m+1), т.е. столбцы матрицы X являются линейно
независимыми векторами и число наблюдений T удовлетворяет
условию T > m+1. В этом случае матрица Х является невырожденной
(Х ≠ 0).
Заметим, что предположение Х.1 упрощает процедуру оценивания
параметров, хотя во многих случаях нарушается. В частности, если
допустить наличие случайных ошибок в значениях объясняющих
переменных, либо если при моделировании временных рядов в
качестве
«регрессоров»
используются
лаговые
эндогенные
переменные. Более подробно данная проблема обсуждается в [11].
Предположение Х.2 обусловлено “проблемой идентифицируемости” модели, которая возникает, если статистические методы
оценивания параметров модели не обеспечивают получения
единственной оценки вектора параметров модели β . Линейная
независимость столбцов матрицы X обеспечивает невырожденность
матрицы XTX и возможность вычисления обратной матрицы (XTX)−1
при нахождении статистических оценок параметров.
от носит ельно
случайных
ошибок
• Предполож ения
наблюдения.
ξ.1. Математическое ожидание ошибок наблюдения равно нулю,
т. е. Е{ξt} = 0 (t = 1, 2, ..., T) или в векторном виде:
Е{ξ} = 0 ∈ ℜT.
ξ.2. Случайные ошибки являются взаимно некоррелированными
случайными величинами:
Сov{ξt, ξτ} = 0 для t ≠ τ (t, τ = 1, 2, ..., T ).
ξ.3. Дисперсия случайных величин {ξt} постоянна для всех t = 1,
2, ..., T:
D{ξt} ≡ σ2 < ∞.
В.И. Малюгин. Эконометрика –1.
Страница 5
Свойство ξ.3. известно как свойство «гомоскедастичности»
(однородности) дисперсии ошибок. Ошибки {ξt}, для которых D(ξt) =
σt2 ≠ const, называются «гетероскедастичными», т.е. не однородными
по дисперсии.
С учетом ξ.1, ξ.2 ковариационная матрица случайного вектора ξ
принимает диагональный вид:
Сov{ξ, ξ} = E{ξξT} = σ2IT,
(2.9)
где I T − единичная (T×T)-матрица.
ξ.4. Случайные ошибки {ξt} являются в совокупности гауссовыми
случайными величинами (имеют нормальное распределение), т.е.
имеют место следующие свойства:
•
•
L(ξt) = N1(0, σ2) (t = 1, 2, ..., T).
L(ξ)=NT(0,σ2I T).
(2.10)
По свойству нормального распределения некоррелированность
гауссовых случайных величин {ξt} (t = 1, 2, ..., T) влечет их взаимную
независимость. Поэтому из свойств ξ.1−ξ.4 следует, что ξ является
гауссовым случайным вектором с независимыми компонентами:
Предположения Х.1, Х.2, и ξ.1.−ξ.4 обычно считаются классическими регрессионными предположениями (classical regression
assumptions) [43], а соответствующая им модель вида (2.4) (или (2.5))
при этом называется классической линейной статистической
моделью (КЛСМ) или моделью множественной линейной регрессии [1,
11].
2.2. ОЦЕНКИ ПАРАМЕТРОВ КЛСМ ПО МЕТОДУ
НАИМЕНЬШИХ КВАДРАТОВ И ИХ СВОЙСТВА
Для нахождения оценок параметров β и σ2 КЛСМ могут
использоваться:
− метод наименьших квадратов – МНК (least square method − LS
method), если предполагают справедливость условий Х.1, Х.2, и
ξ.1.−ξ.3;
В.И. Малюгин. Эконометрика –1.
Страница 6
− метод максимального правдоподобия – ММП (maximum
likelihood method − ML method), если наряду с Х.1, Х.2, и ξ.1.−ξ.3
считается,
что
случайные
ошибки
наблюдения
являются
гауссовскими, т.е. предполагается ξ.4. Опишем принципы построения
МНК- и ММП-оценок параметров β и σ2 в рассматриваемых случаях, и
перечислим основные статистические свойства оценок.
2.2.1. МНК-ОЦЕНКА ВЕКТОРА ПАРАМЕТРОВ КЛСМ
И ЕЕ СВОЙСТВА
МНК-оценка β вектора параметров β находится из условия
минимума суммы квадратов отклонений (sum of squares) SS( β )
наблюдаемых значений эндогенной переменной от ожидаемых
значений, определяемых функцией регрессии вида (2.7) или (2.8):
T
(
SS(β) = ∑ yt − βT xt
t =1
)
2
= ( y − Xβ)T ( y − Xβ) ⇒ min .
(2.11)
Лемма 2.1. Если выполняется предположение Х.2, то МНК
оценка β КЛСМ определяется из условия минимума статистики
SS( β ) вида (2.11):
−
(2.12)
β = (XTX) 1XTy
Доказательство: Необходимое условие экстремума функции
определяется соотношением:
∇βSS( β ) = −2XTy + 2XTX β = 0.
В силу предположения Х.2 матрица XTX является положительно
определенной матрицей полного ранга (как матрица Грама,
образованная из множества линейно независимых векторов) и,
следовательно, существует обратная матрица (XTX)-1. Решая данное
уравнение относительно β , получаем представление вида (2.12).
Очевидно, оценка β определена единственным образом и линейна по
В.И. Малюгин. Эконометрика –1.
Страница 7
y. Матрица вторых производных SS( β ) по β является положительно
определенной, так как
∇ β2 SS (β) = 2X T X > 0 ,
следовательно, оценка β доставляет минимум SS( β ).
Лемма 2.2. Если выполняются предположения Х.1, Х.2 и ξ.1−ξ.3,
то β − несмещенная оценка вектора параметров β модели (2.5), а
матрица вариаций оценки β определяется по формуле:
V{ β } = σ2(XTX)−1.
(2.13)
Доказательство: Докажем несмещенность β . Используя
представление
β − β =(XTX)−1XTy– β =(XTX)−1XT( Xβ + ξ )– β =(XTX)−1XTξ, (2.14)
а также предположение ξ.1, получаем свойство несмещенность оценки:
E{β} = β + ( X T X) −1 X T E{ξ} = β
Найдем матрицу вариаций для случайного вектора β . Используя
представление (2.14), а также формулу (2.19), следующую из свойств
ξ.1, ξ.2 , получаем:
V (β) = E{(β − β)(β − β) T } = ( X T X) −1 X T E{ξξ T }X( X T X) −1 = σ2 ( X T X) −1 .
Следствие. Пусть наряду с условиями леммы 2.2 матрица X
удовлетворяет условию:
Х.3. Существует детерминированная, невырожденная матрица Q с
конечными элементами размерности (m+1)×(m+1), такая что
1 T
X X T
→ Q.
→∞
T
В.И. Малюгин. Эконометрика –1.
(2.15)
Страница 8
Тогда оценка β = ( β l ) ∈ ℜm+1 является состоятельной в среднеквадратическом смысле, т. е.
V{ β } T
→ Оm+1.
→∞
(2.16)
Свойство (2.16) означает, что при увеличении числа наблюдений
Т дисперсии оценок { βl } стремятся к нулю:
D{ β l }→0 при T→∞ (l = 0, 1, ..., m).
Более удобным для проверки, необходимым и достаточным
условием состоятельности оценки β в среднеквадратическом смысле
является условие Эйкера:
λmin(XTX)→∞, T→∞,
где λmin(XTX) − минимальное собственное значение матрицы XTX.
Теорема 2.1 (Гаусса − Маркова). Если относительно модели (2.5)
выполняются предположения Х.1, Х.2 и ξ.1− ξ.3, то оценка β является
эффективной в классе несмещенных линейных по y оценок вектора
параметров β .
Доказательство: Пусть Β - класс линейных по y несмещенных
оценок β , β' ∈ Β , β' = Hy , HX = I , где β ' - произвольная оценка, H –
детерминированная матрица.
E{β' } = E{H ( Xβ + ξ )} = HXβ = β
Используем произвол в выборе матрицы H:
H = ( X T X) −1 X T + C , CX = 0 ,
покажем, что
V{ β ′} − V{ β } ≥ 0.
В.И. Малюгин. Эконометрика –1.
Страница 9
V(β' ) = Ε{(β' − β)(β' − β)Τ } = Ε{(β + Cξ − β)(β + Cξ − β)Τ } =
= Ε{(β − β)(β − β)Τ } − 2Ε{(β − β)ξ Τ C Τ } + CΕ{ξξ Τ }C Τ = V(β) +
+ σ 2 CC Τ + 0,
E{(β − β)ξ T C T } = ( X T X) −1 X T E{ξξ T }C T = σ 2 ( X T X) −1 (CX) T = 0 .
Таким образом,
V (β' ) = V (β) + σ 2 CC T ⇒ V (β' ) − V (β) = σ 2 CC T ≥ 0 ,
причем равенство выполняется только при β' = β .
Таким образом, оценка β является наилучшей линейной
несмещенной оценкой вектора β (Best Linear Unbiased Estimator −
BLUE). Это означает, что среди всех возможных оценок из указанного
класса МНК-оценки { βl } компонент вектора β имеют минимальные
дисперсии, определяемые по формуле:
D βl = σ 2 X T X ll −1 , l = 0, 1, ..., m,
( )
(
)
где (XTX)ll−1 − l-й диагональный элемент матрицы (XTX)-1.
Среднеквадратическое отклонение случайной величины β l ,
определяемое как D βl , называется теоретической стандартной
ошибкой (standard error) оценки β l , l = 0, 1, …, m.
( )
2.2.2. МНК-ОЦЕНКА ДИСПЕРСИИ СЛУЧАЙНЫХ ОШИБОК
КЛСМ И ЕЕ СВОЙСТВА
Подстановкой в модель (2.4) или (2.5) вместо неизвестного
истинного значения вектора параметров его МНК – оценки β = ( β l ) ∈
ℜm+1 вида (2.12) находятся «модельные» значения эндогенной
переменной y = ( yt ) ∈ ℜT , соответствующие заданным значениям
В.И. Малюгин. Эконометрика –1.
Страница 10
объясняющих переменных X = (xtl ) ( l= 0, 1, …, m, t = 1, 2, …, T) в
скалярном или векторном виде соответственно:
m
yt = ∑ βl xtl = xt T β, t = 1, 2, ..., T ,
(2.17)
l =0
или
y = Xβ.
(2.18)
Отклонения наблюдаемых значений эндогенной переменной yt от
«модельных» значений yt (t = 1, 2, …, T) называются остатками.
Будем использовать для остатков модели обозначения:
ξ t ≡ yt − yt = yt − xtT β −
значение остатка, соответствующее t-му эксперименту,
ξ = ( ξt ) = y − X β −
(2.19)
(2.20)
вектор остатков,
T
RSS ≡ ∑ ξ t 2 = ξ T ξ −
(2.21)
t =1
сумма квадратов остатков (residual sum of squares) .
МНК-оценка s2 дисперсии ошибок наблюдения σ2 определяется
как нормированная сумма квадратов остатков (T>m+1):
T
1
ξ Tξ
2
2
(2.22)
s =
∑ ξt = T − m − 1 .
T − m − 1 t =1
Квадратный корень s представляет собой стандартное отклонение
зависимой переменной относительно функции регрессии и называется
стандартной ошибкой регрессии (standard error of the regression −
SER).
В.И. Малюгин. Эконометрика –1.
Страница 11
Лемма
2.3.
Для
вектора
остатков
ξ
вида (2.20) при
использовании в модели (2.5) МНК-оценки β = ( β l )∈ℜm+1 вида (2.12)
справедливо представление
(2.23)
ξ = (IT − Х(ХTХ) −1ХT)y = МХy,
где МХ ≡ (IT − Х(ХTХ)−1ХT) − (Т×Т) - матрица, которая является:
(М.1) симметричной: МХ = M TX ;
(М.2) идемпотентной: МХ × МХ = МХ;
(М.3) ортогональной к матрице Х: МХ Х = О;
(М.4) для ранга симметричной идемпотентной матрицы МХ справедливо соотношение: rank(МХ) = tr(МХ) = T − m − 1.
Свойства матрицы МХ устанавливаются с учетом свойств
симметричных, идемпотентных и взаимно ортогональных матриц.
Доказательство: Докажем формулу (2.23):
ξ = y − y = y − Xβ = y − X( X T X) −1 X T y = M X y .
На основании свойства взаимной ортогональности матриц МХ и Х
справедливы следствия из леммы 2.3
Следствие 1. Матрица значений объясняющих переменных Х и
вектор остатков ξ взаимно ортогональны:
(2.24)
ξ TХ = yTМХ Х = 0.
Следствие 2. Векторы ξ , ξ связаны соотношением:
(2.25)
ξ = МХ(Хβ + ξ) = МХξ.
Доказательство:
ξ = M X y = M X ( Xβ + ξ ) = M X Xβ + M X ξ = M X ξ
Следствие 3. С учетом (2.14), (2.25) случайные векторы β и ξ
являются некоррелированными:
Е{( β -β) ξ Т} = Е{Х(ХTХ) −1ХTξ ξT(IT − Х(ХTХ) −1ХT} =
В.И. Малюгин. Эконометрика –1.
Страница 12
=σ2Е{Х(ХTХ) −1ХT(IT − Х(ХTХ) −1ХT} = О.
Следствие 4. Для статистики s2 вида (2.22) справедливо представление:
s2 =
ξTM X ξ
.
T − m −1
(2.26)
Доказательство:
ξT M X M Xξ ξT M Xξ
ξT ξ
s =
=
=
.
T − m −1
T − m −1
T − m −1
2
Следствие 5. Оценка V = (vkl) ковариационной матрицы (матрицы
вариации) случайного вектора β = ( βl ) вычисляется по формуле:
(2.27)
V = s2(XTX)−1.
Диагональные элементы { vll } матрицы V , являются
выборочными дисперсиями оценок { β l }, а величины
(
)
−1 / 2
vl ≡ vll = s X T X ll > 0,
(2.28)
называются выборочными стандартными ошибками оценок (или
просто стандартной ошибкой в ППП) { β l } (l = 0, 1, … , m).
Теорема 2.2. В условиях теоремы 2.1 статистика s2 вида (2.22)
является несмещенной и строго состоятельной оценкой параметра σ2.
Доказательство.
1. Несмещенность оценки s2, т.е. свойство Е(s2)=σ2, следует из
(2.26), (2.9), М.4 с учетом свойства следа матрицы:
Е{ξTМХξ} = tr(Е{ξξT}МХ) = σ2(T–m–1).
В.И. Малюгин. Эконометрика –1.
Страница 13
2. Можно показать 1 также, что s2 является строго состоятельной и
эффективной оценкой в классе несмещенных оценок σ2:
s2 =
−
1
T − m −1
1
ξ T (I − X( X T X) −1 X T )ξ =
(X ξ) (
T
T − m −1
1
T
T
T − m −1
T − m −1
1
−1
X X) (
1
T − m −1
ξT ξ −
.
X ξ ) = sT − sT
T
(1)
( 2)
Исследуем асимптотические свойства этих компонент:
sT(1) =
T
1 T
T
( ∑ ξ t2 ) →
σ 2 T
→ σ 2 .
→∞
T − m − 1 T t =1
T − m −1
Покажем, что
sT( 2) T
→ 0 .
→∞
Пусть
HT =
1
T − m −1
X T X; ηT =
1
T − m −1
X T ξ ⇒ sT( 2) = ηTT H T−1 ηT , sT( 2) ≥ 0
Применим к последовательности {sT } неравенство Чебышева:
( 2)
P{ηTT H T−1 ηT > δ } ≤
E{ηTT H T−1 ηT }
δ2
, ∀δ > 0
E{ηTT H T−1 ηT } = E{tr ( ηTT H T−1 ηT )} = tr (E{ηTT ηT }H T−1 ) =
=
.
σ
m+1
tr (H T H −T1 ) = σ 2
→ 0 ⇒ sT( 2) → 0
T − m −1
T − m − 1 T →∞
2
Таким образом, s2 является строго состоятельной оценкой σ2 .
1
Rao С. R. Linear Statistical Inference and Its Applications (2nd ed.). N.Y. Wiley, 1973, p.
319.
В.И. Малюгин. Эконометрика –1.
Страница 14
2.2. АНАЛИЗ ВАРИАЦИИ ЗАВИСИМОЙ
ПЕРЕМЕННОЙ ОЛСМ. КОЭФФИЦИЕНТ
ДЕТЕРМИНАЦИИ МОДЕЛИ
Будем рассматривать ОЛСМ со свободным членом вида (2.6).
Анализ вариации оценки yt зависимой переменной yt предполагает ее
вычисление и декомпозицию относительно ожидаемого значения y –
оценки этой переменной в случае «тривиальной» модели, не
содержащей объясняющих переменных (факторов).
Отметим, что y представляет собой тривиальный прогноз yt,
который строится на основе МНК в случае «тривиальной» модели,
когда в (2.6) не включаются какие-либо факторы, т.е.
y t = β 0 = y .
Для тривиальной модели вся вариация оценки yt объясняется
только случайной ошибкой наблюдения и, следовательно, может быть
оценена на основании суммы квадратов остатков для построенной
модели
Если в модель включены факторы, оказывающие значимое
влияние на yt, то они должны также вносить свой вклад в вариацию
оценки зависимой переменной yt, т.е. какая-то доля вариация оценки
y t должна «объясняться» включенными в модель объясняющими
переменными.
Введем обозначения для статистик типа «суммы квадратов»:
Полной суммой квадратов (Total Sum of Squares – TSS) называется
статистика
T
TSS = ∑ ( yt − y) 2 .
t =1
Объясненной суммой квадратов(Explained Sum of Squares – ESS)
называется статистика
В.И. Малюгин. Эконометрика –1.
Страница 15
T
ESS = ∑ ( y t − y) 2 ,
t =1
где
y t - МНК-оценка у.
Суммой квадратов остатков (Residual Sum of Squares – RSS)
называется статистика
T
RSS = ∑ ( yt − y t ) 2 .
t =1
С каждой сумой квадратов связана характеристика, называемая
числом степеней свободы: для TSS – ν T , для ESS – ν E , для RSS – ν R .
Определение. Число степеней свободы – число независимых
элементов
информации,
участвующих
в
образовании
соответствующей суммы квадратов:
ν T = T − 1,ν E = m,ν R = T − m − 1 .
Теорема 2.4. Для ОЛСМ со свободным членом (2.6) имеют место
следующие соотношения:
TSS=ESS+RSS, ν T = ν E + ν R
ESS при этом допускает следующее представление:
m
T
ESS = ∑ β l2 ∑ ( xtl − xl ) 2 , xl =
l =1
t =1
Без доказательства.
Таким образом, ESS
следовательно, чем больше
тем
больше,
1
T
∑ xtl .
T t
(2.29)
=1
чем
больше
βl ,
β l , тем большее влияние оказывает на
независимую переменную yt соответствующий фактор.
В.И. Малюгин. Эконометрика –1.
Страница 16
На основе суммы квадратов вычисляется коэффициент
2
детерминации модели R (R-squared) и определяется по следующей
формуле:
R2 =
ESS
TSS
Определение. Коэффициент детерминации – это доля
объясненной вариации оценки зависимой переменной с помощью
включенных в модель факторов.
Очевидно, 0 ≤ R ≤ 1. Значения R близкие к 1 могут
свидетельствовать об адекватности модели и, наоборот, при
2
стремлении R к нулю следует, что модель неадекватна.
На основании теоремы 2.4 справедливо представление
2
2
R2 = 1 −
RSS
,
TSS
(2.30)
которое используется в ППП для вычисления этого коэффициента.
2
Следует иметь ввиду, что R – лишь одна из количественных
характеристик качества построенной модели, однако нельзя
2
принимать решение только на основании статистики R в силу
следующих ее недостатков.
2
Недостатки R :
2
1) R возрастает при увеличении числа факторов независимо от
того, оказывают факторы влияние на yt или нет.
2
2) R m
→1 , а в случае m = T имеем R 2 =1.
→T
3)
R 2 не может служить мерой адекватности при построении
модели по нестационарным временным рядам, содержащим
тренды.
В.И. Малюгин. Эконометрика –1.
Страница 17
4)
R 2 имеет содержательную интерпретацию только для модели со
свободным членом. Если он необоснованно исключен из модели
то
5)
R 2 может принимать отрицательные значения.
R 2 нельзя использовать для сравнения альтернативных моделей,
зависимые
переменные
преобразованием.
которых
связаны
линейным
При сравнении альтернативных моделей, отличающихся числом
2
факторов, следует использовать не R , а скорректированный
2
2
R (adjusted R ), который вычисляется по формуле:
2
= 1−
Radj
RSS
T − m −1 .
TSS
T −1
(2.31)
Часто используются следующие обозначения:
s2
TSS 2 ESS 2
RSS
2
sT =
⇒ Radj = 1 − 2 .
, sE =
,s =
T −1
m
T − m −1
sT
2
s E2 - оценка доли вариации, которая объясняется включенными
2
2
факторами. Коэффициент Radj < R ≤ 1 , но может быть и
отрицательным.
2.3. О ТОЧНОСТИ ПРОГНОЗИРОВАНИЯ НА
ОСНОВЕ ОЛСМ
Понятие прогнозов в виде условного математического
ожидания. С помощью ОЛСМ для заданных значений вектора
m+1
могут быть значения эндогенных переменных:
факторов xt ∈ ℜ
yt = xtT β + ξ t , t = 1,2,...T
В.И. Малюгин. Эконометрика –1.
(2.32)
Страница 18
В эконометрике используются прогнозы «в виде условного
математического ожидания». Это означает, что ожидаемые значения
эндогенной переменной вычисляется как условные математические
ожидания зависимой переменной при заданных значениях
объясняющих переменных (факторов) на основании так называемой
называемом функции регрессии.
Анализ точности прогнозов. Прогнозные значения получаются
подстановкой в функцию регрессии оценок параметров модели:
y t = xtT β , t = 1,2,...
где
(2.33)
β - МНК – оценка вектора β ∈ ℜ m+1 .
Существует два типа прогнозирования:
1. Ретроспективный (ex post forecasts) – по
{xt }, { yt } (t=1,…T ) за период оценивания модели;
значениям
2. t=T+1,…,T+h, где 1 ≤ h < ∞ – горизонт прогнозирования для
будущих периодов (ex ante forecasts).
Прогнозы первого типа { yt }, t = 1,...T , используются на этапе
анализа адекватности ОЛСМ.
Исследуем
регрессионных
прогнозов.
Пусть
заданное
значение
вектора
факторов.
В
xτ ∈ ℜ ,τ = T + 1,...T + h
соответствии с ОЛСМ истинное значение эндогенной переменной
имеет вид:
m+1
точность
yτ = xτT β + ξ τ
yτ = xτT β
В.И. Малюгин. Эконометрика –1.
(2.34)
(2.35)
Страница 19
Лемма 2.4. Пусть имеют место условия Х.1, Х.2 и ξ.1−ξ.3, β МНК – оценка вектора β ∈ ℜ m+1 , тогда
yτ является несмещенным,
1)
прогноз
2)
вариация прогноза
yτ определяется соотношением:
V ( yτ ) = σ 2 + xτT ( X T X) −1 xτ σ 2 ≥ σ 2 ,
т.е. вариация (дисперсия) прогноза
случайной ошибки наблюдения.
(2.36)
yτ не меньше дисперсии
Доказательство: Докажем несмещенность:
E{ yτ − yτ } = E{xτT (β − β) + ξ τ } = xτT E{β − β} + E{ξ τ } = 0
С учетом (2.34), (2.35) вариация прогноза имеет вид:
V ( yτ ) = E{( yτ − yτ ) 2 } = E{xτT (β − β)(β − β) T xτ } + 2 xτT E{(β − β)ξ τ } +
+ E{ξ τ2 } = xτT E{(β − β)(β − β) T }xτ + σ 2 = σ 2 xτT ( X T X) −1 xτ + σ 2
При получении данного выражения использовали следующие
соотношения:
V (β) = σ 2 ( X T X) −1 , E{ξ τ2 } = D{ξ τ } = σ 2 , E{(β − β)ξ τ } =
ξ1
= ( X X) X E{ξξ τ }, ξ = ...
ξ
T
T
−1
T
Следствие. Если в условиях леммы выполняется Х.3, т.е.
lim (
T →∞
1
T
X T X) → Q ,
где Q – детерминированная невырожденная матрица с конечными
элементами, то
В.И. Малюгин. Эконометрика –1.
Страница 20
V ( yτ ) T
→ σ 2
→∞
(2.37)
Но выражение (2.36) возможно лишь при специальном
планировании экспериментов, связанных с получением эмпирических
данных. Такая возможность обычно отсутствует.
В.И. Малюгин. Эконометрика –1.
Страница 21
ГЛАВА 3
МЕТОДЫ ПОСТРОЕНИЯ И АНЛИЗА ОЛСМ
В ПРЕДПОЛОЖЕНИИ НОРМАЛЬНОСТИ
СЛУЧАЙНЫХ ОШИБОК НАБЛЮДЕНИЯ
При построении МНК-оценок β , σ и исследовании их свойств
ранее не использовалось предположение о нормальности
распределения случайных ошибок.
Это предположение существенно при решении следующих задач:
1. Построение статистических тестов для проверки адекватности
ОЛСМ.
2. Построение интервальных оценок.
3. Вычисление оценок параметров ОЛСМ (КЛСМ) по ММП
2
3.1. ПОСТРОЕНИЕ ММП – ОЦЕНОК
ПАРАМЕТРОВ КЛСМ
Если относительно ОЛСМ (2.5) выполняются предположения
Х.1, Х.2 и ξ.1−ξ.4, то имеет место классическая модель, обозначаемая
КЛСМ.
Теорема 3.1. [1, 11] Пусть относительно ОЛСМ (2.5)
выполняются предположения Х.1, Х.2 и ξ.1−ξ.4 (т.е. имеет место
КЛСМ), тогда оценка вектора параметров модели β ∈ ℜm+1 по
методу максимального правдоподобия (ММП-оценка) имеет вид
(3.1)
β = (XTX)-1XTy.
и совпадает с МНК-оценкой вектора β . ММП-оценка σ 2 параметра
σ2 определяется выражением
(
)(
)
T
RSS m + 1 2
1 T
σ 2 = ∑ y - Xβ y − Xβ =
= 1 −
⋅s
T t =1
T
T
и является асимптотически не смещенной.
В.И. Малюгин. Эконометрика – 1. Страница 1
(3.2)
Доказательство.
1. Запишем функцию правдоподобия по эмпирическим данным у,
Х. В качестве выборки используем выборку регрессионных
наблюдений { yt } , соответствующих {xt }, t = 1, T . Т.к. { yt } являются
независимыми случайными величинами и имеют нормальный закон
распределения, то функция правдоподобия имеет вид плотности Тмерного нормального распределения, т.е.
L (β, σ 2 ; y, X) = (2π ) −T / 2 σ 2 I
= (2π ) −T / 2 (σ 2 ) −T / 2 exp{−
−1 / 2
1
1
exp{− (y − Xβ) T (σ 2 I ) −1 (y − Xβ)} =
2
SS (β)}, SS (β) = (y − Xβ) T (y − Xβ)
2σ
l (β, σ ; y, X) = ln(L(β, σ 2 ; y, X)) =
T
T
1
= − ln 2π − ln σ 2 −
SS (β) → max
2
2
β ,σ 2
2σ 2
2
2
(3.3)
Задача максимизации функции (3.3) по β эквивалентна задаче
построения МНК-оценки:
SS (β) → min
(3.4)
β
2. Получим ММП-оценку
σ , для чего решим задачу
максимизации непрерывной функции:
(3.5)
l1 (β, σ 2 ; y, X) → max
2
∂l1 (β, σ 2 ; y, X)
∂σ
что совпадает с (3.2).
σ2
=−
T
+
1
SS (β) = 0
2σ
2σ
1
1
σ 2 = SS (β) = RSS ,
2
T
2
4
T
В.И. Малюгин. Эконометрика – 1. Страница 2
∂ 2 l1 (β, σ 2 ; y, X)
<0
∂σ 2
следовательно, σ 2 является ММП – оценкой искомого параметра.
Покажем смещенность:
T −1 2
1 T −1
1
RSS ) =
s = (1 − ) s 2
(
T
T T −1
T
T
2
≠ σ ,T < ∞
1
1
,
E{σ 2 } = (1 − )E{s 2 } = (1 − )σ 2 ~
2
T
T
→ σ , T → ∞
т.е. ММП оценка σ 2 является смещенной, но асимптотически
несмещенной.
σ 2 =
1
RSS =
3.2. ВСПОМОГАТЕЛЬНЫЕ РЕЗУЛЬТАТЫ
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
3.2.1. МОДЕЛЬНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ХИКВАДРАТ, СТЬЮДЕНТА, ФИШЕРА
Приведем краткое описание некоторых модельных законов
распределения, используемых при построении и анализе адекватности
эконометрических моделей. Случайные величины с описываемыми
ниже
законами
распределения
получаются
в
результате
соответствующих функциональных преобразований стандартных
гауссовских случайных величин.
Хи-квадрат распределение ( χ 2 -распределение). Пусть
ξ 1 , ξ 2 ,...ξν (ν > 1)
–
независимые
одинаково
распределенные
случайные величины, причем ξ i ~ N1 (0,1) - стандартная гауссова
случайная величина, тогда случайная величина
ν
ζ = ∑ ξ i2
i =1
имеет центральное хи-квадрат распределение с ν степенями свободы,
обозначается χν2 . Моменты распределения равны:
В.И. Малюгин. Эконометрика – 1. Страница 3
E{ζ } = ν , D{ζ } = 2ν .
Распределение Стьюдента (t-распределение). Пусть ξ , η независимые случайные величины, причем ξ ~ N1 (0,1), η ~ χν2 , тогда
случайная величина
ζ =
имеет
распределение
ξ
η /ν
Стьюдента
с
ν степенями
свободы,
обозначается tν . Моменты tν определяются соотношениями:
E{ζ } = 0, D{ζ } = ν /(ν − 2),ν > 2.
Распределение Фишера (F-распределение). Пусть ξ , η независимые случайные величины, каждая из которых имеет хиквадрат распределение с ν 1 ,ν 2 степенями свободы соответственно,
тогда случайная величина
ξ /ν 1
ξ=
η /ν 2
распределена по закону Фишера с ν 1 ,ν 2 степенями свободы и
обозначается Fν 1 ,ν 2 . Моменты данного распределения вычисляются
по формулам:
E{ζ } = ν 2 /(ν 2 − 2), D{ζ } = 2ν 22 (ν 1 + ν 2 − 2) / ν 1 (ν 2 − 2) 2 (ν 2 − 4),ν 2 > 4.
Связь F-распределения с другими распределениями:
1. если ζ 12 ~ F1,ν 2 ⇒ ζ 1 ~ tν 2 ;
2. если ν 2 → ∞ ⇒ Fν1 ,ν 2 → χν21 .
3.2.2. СВОЙСТВА ГАУССОВСКОГО СЛУЧАЙНОГО
ВЕКТОРА
Пусть z ∈ ℜ M ~ N M ( µ , Σ), µ ∈ ℜ M , Σ - ковариационная матрица.
В.И. Малюгин. Эконометрика – 1. Страница 4
Лемма 3.1. (о
случайного
вектора)
матрица, тогда
линейном преобразовании гауссовского
Пусть
a ∈ ℜ r , C − r × M -фиксированная
y = Cz + a , L{y} = N r (C µ + a , CΣΣ T )
Свойства гауссовского случайного вектора:
1. В силу положительной определенности матрицы Σ матрица Σ −1
положительно определена; Σ −1 = Σ −1 / 2 Σ −1 / 2 . Если
u = Σ −1 / 2 (z − µ ) ,
(3.6)
т.е. является результатом стандартизации гауссовского случайного
вектора, то L{u} = N M (0, I M ) .
2
2. Если u ∈ ℜ M ~ (3.6) ⇒ ξ = u T u = (z − μ) T Σ −1 (z − μ) ~ χ M
3. Если А, В – симметричные взаимоортогональные матрицы,
ξ = u T Au , η = u T Bu , u ~ (3.6) ,
то ξ, η - взаимонезависимы, т.е.
E{ξ ⋅ η} = E{ξ} ⋅ E{η} .
4. Если A − ( M × M ), rankA = r < M ; u ~ (3.6) ⇒ u T Au ~ χ r2 .
3.3. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ММПОЦЕНОК ПАРАМЕТРОВ ОЛСМ И СВЯЗАННЫХ С
НИМИ СТАТИСТИК
Лемма 3.2. Пусть относительно ОЛСМ (2.5) выполняются
предположения Х.1, Х.2 и ξ.1−ξ.4, β, σ 2 - ММП-оценки параметров
ОЛСМ, тогда справедливы следующие утверждения:
1. L{β} = N m+1 (β, σ 2 ( X T X) −1 ) ;
В.И. Малюгин. Эконометрика – 1. Страница 5
2.
3.
4.
(β − β) T X T X(β − β)
~ χ m2 +1 ;
2
σ
RSS
} = χ T2 − m−1 ;
σ2
β, σ 2 независимы.
L{
3.4. ПОСТРОЕНИЕ И АНАЛИЗ ОЛСМ С
ЛИНЕЙНЫМИ ОГРАНИЧЕНИЯМИ НА
ПАРАМЕТРЫ
3.4.1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ ОЛСМ С
ЛИНЕЙНЫМИ ОГРАНИЧЕНИЯМИ НА ПАРАМЕТРЫ
ОЛСМ с линейными ограничениями на параметры описывается
соотношениями:
y = Xβ + ξ,
Aβ = α,
(3.7)
где А − заданная r×(m+1)-матрица полного ранга (rank(A) = r, 1 ≤ r ≤
m+1), α ∈ ℜr − заданный вектор.
Таким образом, тождество
Aβ = α
(3.8)
определяет систему из r ограничений на параметры β T = (β0, β1, …,
βm) ∈ ℜm+1 модели в (3.7).
В данном случае имеют место две задачи анализа ОЛСМ:
1) Статистическое оценивание параметров β , σ 2 .
2) Статистическая
проверка
существования
линейных
ограничений.
Линейные ограничения ОЛСМ могут быть обусловлены
требованиями экономической теории, а также накладываться в
процессе анализа статистической адекватности построенной модели.
В.И. Малюгин. Эконометрика – 1. Страница 6
Примеры.
1. Моделирование объема выпуска компании на основании
производственной функции Кобба-Дугласа с однородными
факторами:
β β
Q = αK 1 L 2
β1 + β 2 = 1, α > 0, ,
β 0 = ln(α),
2. Проверка
структурных
изменений
(скачкообразного
изменения параметров) в ОЛСМ.
3. Проверка статистической значимости параметров ОЛСМ.
4. Статистическая проверка
теоретических предположений
относительно значений параметров ОЛСМ.
Приведем примеры матрицы А и вектора α при некоторых
типовых ограничениях на параметры ОЛСМ, возникающих как при
учете экономических особенностей моделируемого объекта, так и при
проверке статистической адекватности регрессионной модели вида
yt = β0 + β1x1t +…+ βmxmt + ξt, t = 1, 2, ..., T.
(3.8*)
Примеры.
Одно линейное ограничение, r = 1
А.1. Значение одного из коэффициентов регрессии задано, например, β1 = β10, m = 4, тогда в (3.8*) следует положить:
А = (0 1 0 0 0) ∈ ℜ5, α = β10,
В частности ри анализе значимости коэффициентов регрессии полагают βl0 = 0, l = 1, 2, …, m .
А.2. Два равных коэффициента регрессии, например, β1−β3=0,
m=4:
А = (0 1 0 –1 0) ) ∈ ℜ5, α = 0.
А.3. Сумма 2 ≤ q≤ m коэффициентов регрессии равна константе,
например, β1 + β2 = 1, q = 2, m = 4:
А = (0 1 1 0 0) ∈ ℜ5, α = 1.
В.И. Малюгин. Эконометрика – 1. Страница 7
Несколько линейных ограничений, r > 1
А.4. Несколько коэффициентов регрессии одновременно равны
нулю, например, β1 = β2 = β3 = β4 = 0, r = m = 4:
0
0
А=
0
1
1
1
0
0
= (0 I m ) , α =
0
1
0
0
0 .
0
А.5. Различные коэффициенты регрессии удовлетворяют различным линейным ограничениям, например, β1 + β2 = 1, β3 = β4, r = 2:
1 1 0 0
1
, α = .
A =
0 0 1 − 1
0
А.6. Структурная неоднородность модели.
β (1)
Пусть β = (2 ) ∈ ℜ 2(m +1) , где β (k ) ∈ ℜ m +1 (k = 1, 2) − вектор
β
параметров соответствующий k-му типу экономических условий
(например, k-му периоду времени). Отсутствие структурной
неоднородности модели означает, что для различных типов условий
параметры модели принимают одни и те же значения, т. е.
β (1) − β (2 ) = 0 ∈ ℜ m +1 . В этом случае имеем:
А = (I m +1 − I m +1 ), α = 0m+1∈ ℜm+1, r = m +1.
3.4.2. УЧЕТ ЛИНЕЙНЫХ ОГРАНИЧЕНИЙ НА ПАРАМЕТРЫ
МОДЕЛИ ПРИ ИСПОЛЬЗОВАНИИ МЕТОДА НАИМЕНЬШИХ
КВАДРАТОВ
Заметим, что часто можно построить регрессионную модель с
учетом заданных линейных ограничений на параметры с помощью
стандартных процедур, реализующих обычный метод наименьших
квадратов после соответствующего преобразования модели и замены
В.И. Малюгин. Эконометрика – 1. Страница 8
переменных. Для иллюстрации такой возможности воспользуемся
ранее описанными примерами типовых линейных ограничений.
Примеры.
А.1. (Продолжение). Пусть β1 = β10, m=4, и рассматривается
~ ~ ~
модель со свободным членом, т.е. xt0 = 1 ∀t. Тогда оценки β0 , β2 , β3 ,
~
β4 параметров с учетом указанных линейных ограничений могут
быть найдены в результате применения обычного МНК для
оценивания параметров модели регрессии
yt′ = β0 + β2xt2 + β3xt3 + β4xt4 + ξt, где yt′ ≡ yt − β10xt1.
В частности, значение β10=0 означает, что объясняющая переменная xt1 не включается в модель.
А.5. (Продолжение). Если r = 2, причем: β1 + β2 = 1, β3 = β4 и xt0 =
1 ∀t, тогда соответствующая регрессионная модель принимает вид:
yt′ =β0 + β1zt1 + β3zt2 + ξt, где yt′ ≡ yt − xt2. zt1 ≡ xt1 − xt2, zt2 ≡ xt3 + xt4.
~ ~
~
При этом находятся только оценки β0 , β1 и β3 ,
а оценки
~
~
остальных параметров находятся с учетом ограничений: β2 = 1− β1 ,
~
~
β4 = β3 .
3.4.3. ПОСТРОЕНИЕ ММП-ОЦЕНОК ПАРАМЕТРОВ
Теорема 3.2. Пусть для ОЛСМ с линейными ограничениями на
параметры вида (3.7) выполняются предположения Х.1, Х.2 и ξ.1.−ξ.4,
тогда:
~
~
1. ММП-оценка β = ( βl ) ∈ ℜm+1 вектора параметров модели β ,
учитывающая заданные ограничения, совпадает с МНК-оценкой и
имеет вид
~
β = β + (XTX)−1АТ(А(XTX)−1АT)−1(α−А β ),
(3.9)
где
В.И. Малюгин. Эконометрика – 1. Страница 9
β = (XTX)−1XTy −
оценка вектора β , построенная без учета ограничений.
2. ММП-оценка для дисперсии ошибок наблюдения σ2 имеет вид:
1 T
1
2
2
=
σ
( yt − xtT β )=
(y − Xβ )T (y − Xβ ).
∑
Т t =1
Т
Доказательство. Задачу нахождения ММП-оценок с учетом
Aβ = α можно записать в виде:
T
T
1
2
2
SS (β) → max
l (β, σ ; y, X) = − ln 2π − ln σ −
2
2
(3.10)
2σ 2
β,σ 2
Aβ = a
Задача (3.10) – задача максимизации с ограничениями типа
равенство. Ограничение касается только β и не касается σ2,
следовательно, оценка σ2 имеет тот же вид, что и обычная ММПоценка в (3.10):
SS (β)
(3.11)
σ 2 = σ 2 (β) =
С учетом (3.11) (3.10) имеет вид:
T
SS (β)
T
T SS (β) T
− → max
; y, X) = − ln 2π − ln
l (β,
(3.12)
2
2
2
T
T
β
Aβ = a
Задача (3.12) – задача максимизации непрерывной по параметрам
функции с ограничениями типа равенство и может быть решена
методом неопределенных множ ит елей Лагранж а :
L (β, λ ) = −
T
T
T
ln 2π − (ln SS (β) − ln T ) − + λT ( Aβ − a ) → max (3.13)
2
2
2
β,λ
∇ β L (β, λ ) = 0
.
∇ λ L (β, λ ) = 0
Упростим (3.13):
T
T
L (β, λ ) = − (ln 2π − ln T + 1) − (ln SS (β) + λT ( Aβ − a )) .
2
2
В.И. Малюгин. Эконометрика – 1. Страница 10
(3.14)
∇ β l (β,
SS (β)
T
X T (y − Xβ) − A T λ = 0 .
; y, X) =
T
SS (β)
X T y − X T Xβ = A T (σ 2 λ )
(3.15)
(3.16)
Умножим (3.16) на A( X T X) −1 :
A( X T X) −1 X T y − A( X T X) −1 X T Xβ = A( X T X) −1 A T (σ 2 λ )
(3.17)
Aβ − Aβ = A( X T X) −1 A T (σ 2 λ )
(3.18)
Учтем ограничения Aβ = α в (3.18) и получим выражение для
вектора неопределенного множителя Лагранжа:
σ 2 λ = ( A( X T X) −1 A T ) −1 ( Aβ − a )
(3.19)
Подставляя (3.19) в (3.17) , получаем:
Aβ − Aβ = A( X T X) −1 A T ( A( X T X) −1 A T ) −1 ( Aβ − a )
~
β = β + ( X T X) −1 A T ( A( X T X) −1 A T ) −1 (a − Aβ)
(3.20)
Найденное решение ~
β доставляет максимум целевой функции.
L (β, σ 2 ; y, X) с учетом
ограничений Aβ = α достигается при найденных ~
β , σ~ 2 = SS (~
β) / T и
равно:
~, σ~ 2 ; y, X) = ( 2πe ) −T / 2 ( SS (β
~ )) −T / 2
L (β
(3.21).
Максимальное значение функции
T
3.4.4. СТАТИСТИЧЕСКИЕ СВОЙСТВА ММП-ОЦЕНОК
Лемма 3.3. Оценка β допускает представление
~
β = β + GX T ξ ,
В.И. Малюгин. Эконометрика – 1. Страница 11
G = (XTX)−1 − (XTX)−1АТ(А(XTX)−1АТ)−1А(XTX)−1.
Доказательство провести самостоятельно.
Теорема 3.3. В условиях теоремы 3.2 справедливы следующие
~
~
утверждения относительно оценки вектора параметров β = ( βl ) ∈
ℜm+1:
~
1) оценка β является несмещенной;
~
2) случайный вектор β имеет нормальное распределение:
~
L( β ) = Nm+1( β , σ2G),
где
G = (XTX)−1 − (XTX)−1АТ(А(XTX)−1АТ)−1А(XTX)−1;
~
3) оценка β является эффективной по отношению к оценке β ,
~
не учитывающей ограничения на параметры, т.е. V( β ) − V( β ) ≥ 0
(неотрицательно определенная матрица для β ≠ β );
~
4) если дополнительно выполняется условие Х.3, то оценка β
является состоятельной в среднеквадратическом смысле.
~
Доказательство. С учетом (3.9) β можно рассматривать как
случайный вектор, получаемый в результате преобразования
гауссовского случайного вектора β , поэтому в соответствии с
~
леммой 3.1 имеем L( β ) = Nm+1( β , σ2G).
Найдем параметры этого закона распределения:
(3.22)
β = β + ( X T X) −1 X T ξ
a − Aβ = a − Aβ − A( X T X) −1 X T ξ = − A( X T X) −1 X T ξ
(3.23)
Подставим (3.22), (3.23) в (3.9):
~=β
β
+ (( X T X) −1 − ( X T X) −1 A T ( A( X T X) −1 A T ) −1 A( X T X) −1 ) X T ξ (3.24)
В.И. Малюгин. Эконометрика – 1. Страница 12
~= +
β β GX T ξ
(3.25)
Из (3.25) получаем:
E{~
β} = β + GX T Ε{ξ} = β ,
~
т.е. оценка β является несмещенной.
~
~ − β) T (β
~ − β)} = GX T E{ξξ T }XG = σ 2 GX T XG = σ 2 G .
V{β} = E{(β
Таким образом, доказаны первые два утверждения. Докажем
~
оставшиеся утверждения. Установим связь между V( β ) и V( β ):
~
VT = V{β} − V{β} = σ 2 ( X T X) −1 − σ 2 G = σ 2 (( X T X) −1 − ( X T X) −1 +
+ ( X T X) −1 A T ( A( X T X) −1 A T ) −1 A( X T X) −1 )
VT = σ 2 ( X T X) −1 A T ( A( X T X) −1 A T ) −1 A( X T X) −1 > 0 ,
~
следовательно, β является более эффективной оценкой, чем β , так
~
как V{β} T
→ 0, V{β} − V{β} = VT > 0, ∀T , то
→∞
V{~
β} T
→ 0 ,
→∞
т.е. выполняются утверждения 3 и 4.
3.5. ПОСТРОЕНИЕ СТАТИСТИЧЕСКОГО
КРИТЕРИЯ ПРОВЕРКИ ОБЩИХ ЛИНЕЙНЫХ
ОГРАНИЧЕНИЙ НА ПАРАМЕТРЫ ОЛСМ
При анализе ОЛСМ (3.7) возникает необходимость в проверке
ограничений относительно параметров модели β ∈ ℜm+1, которые
представляют собой различные частные случаи общих линейных
ограничений вида Aβ = α и продиктованы как экономическим
содержанием модели, так и требованием ее статистической
адекватности. Некоторые примеры подобных ограничений были
описаны в п. 3.4.1. Проверить те или иные ограничения на параметры
В.И. Малюгин. Эконометрика – 1. Страница 13
модели можно на основе статистических данных с помощью методов
статистической проверки гипотез.
В терминах теории статистической проверки гипотез данная
задача формулируется следующим образом:
• проверить гипотезу Н0 о том, что «имеют место заданные
линейные ограничения на параметры», при альтернативе Н1,
означающей, что «эти ограничения на параметры
отсутствуют», по эмпирическим данным у, Х на заданном
уровне значимости ε.
Гипотезы Н0, Н1, формально записываются в виде:
Н0: Aβ = α ,
(3.26)
Н1: Aβ ≠ α .
Опишем вначале общий вид статистического критерия
обобщенного отношения правдоподобия для проверки линейных
ограничений вида (3.26) относительно параметров ОЛСМ. Далее этот
критерий применим для решения ряда конкретных задач проверки
гипотез.
Ведем обозначения:
~
β − оценка вектора параметров β вида (3.9), учитывающая
ограничения (constrained LS estimator), а RSS0 − соответствующая ей
сумма квадратов остатков
β − МНК-оценка вектора β , построенная без учета ограничений
(unconstrained LS estimator);
∑ (yt − x tT β )
T
RSS0 =
~
2
∑ (yt − x tT β )
T
, RSS1 =
t =1
2
−
(3.27)
t =1
суммы квадратов остатков, полученные при использовании оценок
~
β и β соответственно;
s2 =
RSS1
−
T − m −1
В.И. Малюгин. Эконометрика – 1. Страница 14
(3.28)
оценка дисперсии σ2, построенная без учета ограничений на
параметры модели.
Лемма 3.3. Если имеют место ограничения, определяемые
гипотезой H0 вида (3.26), то распределение случайного вектора Аβ
определяется выражением:
(3.29)
L( Аβ ) = Nr(α, σ2A(XTX)−1AT).
Доказательство. Справедливость леммы следует из (3.1) и
свойства линейного преобразования гауссовского случайного
вектора.
Теорема 3.4. [41]. В условиях теоремы 3.2 статистический
критерий для проверки гипотезы Н0 при альтернативе Н1 вида (3.26)
по эмпирическим данным у, Х на уровне значимости ε
формулируется следующим образом:
не отклоняется, если γ T < Δ,
гипотеза Н0
отклоняется, если γ T ≥ Δ ,
где, ∆ = ∆(ε) − порог критерия (критическое
статистики γ T ), γ T = (y, X) − зависящая от
критерия (тестовая статистика), допускающая
формы представления:
– форма, основанная на использовании
(критерий Вальда – Wald test):
(3.30)
значение тестовой
у, Х статистика
две эквивалентные
одной оценки
(α − Aβ )T A(X T X )−1 A T (α − Aβ )
β
−1
γT =
s2r
;
(3.31)
~
– форма, основанная на использовании двух оценок β , β
(критерий отношения правдоподобия – LR test):
γT =
RSS0 − RSS1 T − m − 1
.
×
RSS1
r
В.И. Малюгин. Эконометрика – 1. Страница 15
(3.32)
Порог ∆ критерия определяется как квантиль уровня 1-ε для
F-распределения Фишера с r и Т − m − 1 степенями свободы
(обозначается Fr , T−m−1):
∆ = Fr−,T1 − m −1 (1 − ε ) .
(3.34)
Доказательство. В соответствии с традиционной схемой
построения отношения правдоподобия определим два пространства
параметров:
Ω = {β, σ 2 , β ∈ ℜ m+1 , σ 2 > 0}
– пространство всех возможных параметров,
Ω 0 = {β, σ 2 , β ∈ ℜ m+1 , Aβ = a , σ 2 > 0} – пространство значений параметров, ограниченных Н0.
Составим статистику отношения правдоподобия:
λ=
max L (β, σ 2 , y , X)
β,σ 2 ∈Ω 0
max
L (β, σ , y , X)
2
2
β,σ ∈Ω
=
L0
∈ [0,1], Ω 0 ⊆ Ω
L
(3.35)
Критерий для проверки линейных ограничений, основанный на
статистике λ , может быть представлен в виде:
не отклоняется, если λ < Δ,
гипотеза Н0
отклоняется, если λ ≥ Δ ,
(3.36)
Найдем явный вид для λ :
L (β, σ 2 ; y, X) = (2π ) −T / 2 (σ 2 ) −T / 2 exp{−
В.И. Малюгин. Эконометрика – 1. Страница 16
1
2σ 2
SS (β)}
(3.37)
Максимальное значение данной функции на Ω достигается для
ММП-оценок параметров и равно:
L 1 = (2πe / T ) −T / 2 ( SS (β)) −T / 2 ,
(3.38)
SS (β) = RSS1 = ξ T ξ
– сумма квадратов остатков ОЛСМ с
использованием обычных оценок β, σ 2 .
Аналогично,
где
~
L 0 = (2πe / T ) −T / 2 ( SS (β)) −T / 2 ,
(3.39)
~ ~
где SS (~
β) = RSS0 = ξ T ξ – сумма квадратов отклонений для ОЛСМ,
используя оценки, построенные с учетом ограничений. Тогда,
согласно (3.35), статистика отношения правдоподобия имеет вид
RSS0
λ =
RSS1
Удобно
λ' = (λ ) -2/T
перейти
от
−T / 2
статистики
λ
к
статистике
RSS1
, где λ 0 – пороговое значение.
=
RSS0
Таким образом, критерий для проверки линейных ограничений,
основанный на статистике λ' , имеет вид:
не отклоняется, если λ ' ≥ λ'0 ,
гипотеза Н0
отклоняется, если λ ' < λ'0 .
(3.40)
Для нахождения распределения тестовой статистики при верной
нулевой гипотезе перейдем от λ' к итоговой статистике
T − m −1
, тогда критерий (3.40) принимает вид:
γ T = (λ '−1)
r
В.И. Малюгин. Эконометрика – 1. Страница 17
не отклоняется, если γ T < Δ,
гипотеза Н0
отклоняется, если γ T ≥ Δ ,
где γ T =
(3.41)
RSS 0 − RSS1 T − m − 1
.
×
RSS1
r
Для определения ∆ необходимо знать распределение статистики
критерия L{γ T | H 0 } . Будем использовать свойства сумм квадратов
из леммы 3.2. Для нахождения искомого распределения рассмотрим
два случая.
1. Распределение нормированной суммы квадратов при
использовании обычного МНК (линейные ограничения не
учитываются):
T
ξT
RSS1 ξ T ξ ξ T
M X = u T M X u ~ χ T2 − m−1 ,
=
=
σ
σ2
σ 2 σ
u ~ N(0, I T ), M X = I − X( X T X) −1 X T , rank(M X ) = T − m − 1 .
2. Распределение нормированной суммы квадратов
использовании МНК с учетом линейных ограничений:
~
~
ξ = y − Xβ = y − Xβ − X( X T X) −1 A T ( A( X T X) −1 A T ) −1 (a − Aβ)
a − Aβ = − A( X T X) −1 X T ξ ⇒
ξ + D X T ξ
~
ξ = ξ + X( X T X) −1 A T ( A( X T X) −1 A T ) −1 A( X T X) −1 X T ξ = 1
ξ + Dξ
RSS0 = ~ξ T ~ξ = (ξ + Dξ ) T (ξ + Dξ ) = ξ T ξ + 2ξ T Dξ + ξ T Dξ ,
В.И. Малюгин. Эконометрика – 1. Страница 18
при
т.к. D = D T = D; rank(D) = r ; Dξ = D1 X T ξ = 0 , таким образом,
RSS0 = RSS1 + ξ T Dξ
L{
(3.42)
RSS0 − RSS1
ξ T Dξ
L
=
H
|
}
{
} = L{u T Du} = χ r2 ,
2
2
σ
σ
(3.43)
где u = (ξ / σ ) ~ N T (0, I ), rank(D) = r .
ζ=
RSS0 − RSS1
RSS1
= u T M X u ,η =
= u T Du .
2
σ
σ2
Случайные вектора ζ, η взаимно независимы, т.к. матрицы МХ и
D взаимно ортогональны M X D = 0 , поэтому
ζ /r
| H 0 } = F r ,T − m−1 .
η /T − m −1
L{γ T | H 0 } = L{
Порог критерия ∆ найдем из ограничения на вероятность
ошибки первого рода, т.е. P1 = P{H 1 | H 0 } = ε :
P{H 1 | H 0 } = P{γ T ≥ ∆ | H 0 } = 1 − P{γ T < ∆ | H 0 } = 1 − Fγ T |H 0 (∆) = ε .
∆ = Fγ−T1| H 0 (1 − ε ) -
(3.44)
квантиль уровня (1 − ε ) для Fγ T | H 0 = F r ,T − m−1 .
Получим представление тестовой статистики в форме Вальда.
γT =
RSS 0 − RSS1 T − m − 1 ξ T Dξ
×
=
=
RSS1
r
rs 2
=
ξ T X( X T X) −1 A T ( A( X T X) −1 A T ) −1 A( X T X) −1 X T ξ
=
(a − Aβ) T ( A( X T X) −1 A T ) −1 (a − Aβ)
rs 2
rs 2
В.И. Малюгин. Эконометрика – 1. Страница 19
=.
Статистику γ T в виде (3.32) удобно использовать, если линейные
ограничения учитываются при построении регрессионной модели с
помощью обычного метода наименьших квадратов, как это было
показано на примерах А.1 и А.5 в п. 3.4.2. Представление (3.31) для
γ T -статистики применяется для получения частных случаев
описанного критерия для конкретных задач проверки гипотез
относительно параметров ОЛСМ. В частности, такие задачи
возникают при анализе адекватности ОЛСМ и рассматриваются ниже.
Предполагается также использование эквивалентной формы
представления статистических критериев, в которых вместо
сравнения γ T и ∆ осуществляется сравнение ε и Р-значения (Pvalue):
не отклоняется, если ε < P,
гипотеза Н0
(3.45)
отклоняется, если ε ≥ P .
3.6. ПРИМЕНЕНИЕ ТЕСТА ПРОВЕРКИ ОБЩИХ
ЛИНЕЙНЫХ ОГРАНИЧЕНИЙ НА ПАРАМЕТРЫ
ОЛСМ
3.6.1. ПРОВЕРКА ГИПОТЕЗЫ О ЗНАЧЕНИЯХ ПАРАМЕТРОВ
МОДЕЛИ
Предположим, что для ОЛСМ вида
yt = β0 + β1xt1 +...+ βmxtm + ξt, t = 1, 2, ... , T,
(3.46)
выполняются предположения Х.1, Х.2 и ξ.1−ξ.3, а также ξ.4 о нормальном распределении случайных ошибок наблюдения.
Требуется проверить предположение о том, что истинное
значение коэффициента регрессии βl равно некоторому заданному
значению βl0 , l ∈ {1, 2, ... , m}.
В терминах теории статистической проверки гипотез данная
задача формулируется следующим образом: по эмпирическим
данным {yt}, {xtl} (t = 1, 2, ... , T) на заданном уровне значимости ε (0
< ε < 0.5) проверить гипотезу
В.И. Малюгин. Эконометрика – 1. Страница 20
H0: βl = βl0 , l ∈ {1, 2, ... , m}
(3.47)
H1: βl ≠ βl0 .
(3.48)
при альтернативе
Данную задачу можно рассматривать как частный случай задачи
проверки гипотез о линейных ограничениях на параметры вида
Аβ = α (β = (β0, β1, … , βm)T), если (см. пример А.1 из п. 3.4.1)
положить:
А = (0 0…0 1l 0 … 0) ∈ ℜm+1, α = βl0, r = 1,
(3.49)
где 1l означает, что l-я компонента вектора А равна 1 . С учетом (3.49)
−1
и (3.31) получаем: A(XTX)−1AT = X T X ll > 0, Aβ − α = βl0 − βl , а,
следовательно
−1
(Aβ − α)T A X T X −1 A T (Aβ − α) / r β − β 0 2
l
,
= l
γT =
2
−1
2
T
s
s X X ll
1
(
(
)
)
(
)
(
(
)
)
причем L( γ T H0) = F1,T–m–1.
Учитывая взаимосвязь F-распределения и t-распределения, для
проверки гипотезы H0 получаем двухсторонний статистический
крит ерий от ношения правдоподобия вида:
не отклоняется, если γ T' < ∆,
гипотеза H0
'
отклоняется, если γ T ≥ ∆,
где
(3.49′)
βl − βl0
−
(3.50)
γT=
vl
статистика критерия, известная как «t-ст ат ист ика » или «t
от ношение» (t-ratio); vl − выборочная стандартная ошибка оценки
'
1
Предполагается, что нумерация компонент вектора А ∈ ℜm+1 начинается с нуля.
В.И. Малюгин. Эконометрика – 1. Страница 21
βl , определяемая по формуле (2.28); ∆ − критическое значение
статистики tT .
Если гипотеза H0 верна, то статистика γ T' имеет t-распределение
Ст ьюдент а с T− m −1 ст епенями свободы и функцией распределения
tT−m−1(u), u ∈ ℜ1. Порог ∆ критерия (3.49′) зависит от заданного
уровня значимости ε и определяется как квант иль уровня 1−ε/2
соответствующего t-распределения:
ε
∆ = ∆(ε) = t−1T–m–1 1 − .
2
(3.51)
Также используется эквивалентная форма критерия. Укажем
способ нахождения Р-значения: из (3.49′) следует, что если верна
гипотеза H0 , то γ T' < t T−1− m−1 (1 − ε / 2); t T − m−1 ( γ T' ) < 1 − ε / 2;
ε < 2(1 − t T − m−1 ( γ T' )) = Р (Р-значени).
3.6.2. ПОСТРОЕНИЕ ИНТЕРВАЛЬНЫХ ОЦЕНОК ДЛЯ
ПАРАМЕТРОВ МОДЕЛИ
Наряду с точечными оценками (МНК, ММП-оценки)
используются интервальные оценки. Рассмотрим тест проверки
гипотезы о значении параметров ОЛСМ.
Интервальной оценкой параметра β l по эмпирическим данным
у, Х и доверительным интервалом с доверительной вероятностью
(1 − ε ) называют случайный интервал J = [βl − δ ε ,T , βl + δ ε ,T ] ,
который с вероятностью
параметра
βl0
(1 − ε )
покрывает истинное значение
, т.е.
P( βl0 ∈ J ε ,T ) = 1 − ε
Если верна гипотеза H0, то
В.И. Малюгин. Эконометрика – 1. Страница 22
(3.52)
βl − βl0
T
−1
s ( X X) ll
следовательно,
< t T−1− m−1 (1 − ε / 2) ,
ε
δ ε ,T = vl t T−1− m−1 1 − ,
2
(3.53)
где ν l = s ( X T X) ll−1 - стандартная ошибка оценки β l .
Таким
образом,
величина
доверительного
интервала,
определенного в соответствии с (3.53) зависит от уровня значимости
ε и объема данных Т: чем меньше ε , тем больше интервал; с
увеличением Т интервал сужается.
3.6.3. ПРОВЕРКА ГИПОТЕЗЫ О СТАТИСТИЧЕСКОЙ
ЗНАЧИМОСТИ ПАРАМЕТРОВ МОДЕЛИ
В частном случае, когда
принимают вид:
βl0
= 0, гипотезы (3.47)−(3.48)
H0: βl = 0, H1: βl ≠ 0, l ∈ {1, 2, ... , m},
(3.54)
и известны как гипотезы о значимост и коэффициент ов регрессии.
Если l = 0, то имеет место задача проверки гипотезы о
значимости свободного члена. Если l ∈ {1,..., m} , то (3.54) описывает
гипотезу статистической значимости коэффициентов регрессии.
Для проверки H0 будем использовать построенной выше tкритерий. С учетом βl0 = 0 γ T' -статистика вида (3.50) принимает вид
β
γ T' = l , L{γ T' | H 0 } = t T − m−1 (1 − ε / 2) .
(3.55)
vl
Если гипотеза H0 не отклоняется, то значение оценки βl
уровне ε незначимо отличается от нуля и, следовательно,
объясняющая переменная не оказывает существенного влияния
зависимую переменную. Это может быть основанием для
исключения из модели.
В.И. Малюгин. Эконометрика – 1. Страница 23
на
l-я
на
ее
Отклонение гипотезы H0 в пользу H1, наоборот, означает наличие
статистически значимой линейной зависимости между анализируемыми переменными.
3.6.4. ПРОВЕРКА ГИПОТЕЗЫ ОБ АДЕКВАТНОСТИ МОДЕЛИ
В ЦЕЛОМ
Для модели (3.46) рассмотрим задачу проверки гипотез вида
(гипотезы о групповой незначимости оценок коэффициентов
регрессии):
H0: β1 = β2 = ... = βm = 0, H1: H 0
(3.56)
по эмпирическим данным {yt}, {xtl} (t = 1, 2, ... , T) на заданном уровне
значимости ε. Здесь и далее H 0 – альтернативное утверждение по
отношению к H0 (отрицание H0).
Данную задачу можно рассматривать как частный случай задачи
проверки общих гипотез о линейных ограничениях на параметры
вида Аβ = α (β = (β0, β1, … , βm)T), если (см. пример А.4 из п. 3.4.1)
положить:
А = (0 I m ) , α = 0 ∈ ℜm, r = m.
(3.57)
Если гипотеза H0 не отклоняется, т. е. ограничения на параметры
имеют место, то ни одна из объясняющих переменных, включенных в
модель, не оказывает значимого влияния на эндогенную переменную,
т.е. модель в целом являет ся не адекват ной. В этом случае модель
(3.46) принимает вид «модели сдвига»:
yt = β0 + ξt, t = 1, 2, ... , T.
(3.58)
В модели (3.58) свободный член β0 выступает как парамет р
сдвига : Е(yt) = β0. МНК-оценкой параметра β0 служит выборочное
среднее значение y , рассчитанное по выборке {yt} (t = 1, 2, ... , T).
Выборочное среднее значение
является лучшим (в
y
среднеквадратическом смысле) прогнозом для значений зависимой
переменной на основании модели (3.58), т.е. ~
yt = y (t = 1, 2, ... , T), а
сумма квадратов остатков при учете ограничений на параметры равна
В.И. Малюгин. Эконометрика – 1. Страница 24
T
T
t =1
t =1
RSS0 = ∑ ( yt − ~
y )2 = ∑ ( yt − y )2 = TSS .
Отклонение гипотезы H0 означает, что среди объясняющих переменных, включенных в модель, есть, по меньшей мере, одна переменная, оказывающая значимое влияние на зависимую переменную.
Незначимые объясняющие переменные при этом могут быть
исключены из модели. Сумма квадратов остатков без учета
ограничений на параметры равна
T
RSS1 = ∑ ( yt − y )2 = RSS = TSS − ESS.
t =1
Для модели, включающей экзогенные переменные (факторы),
вычислим статистику R2:
ESS
.
R2 =
TSS
Коэффициент детерминации модели R2 характеризует степень
линейной статистической зависимости между эндогенной и
экзогенными переменными, причем при R 2 ≈ 0 эта зависимость
может оказаться статистически не значимой, а при R 2 ≈ 1 между
переменными имеет место линейная статистическая зависимость.
Построим статистический критерий для проверки гипотез (3.56).
Теорема 3.5. Статистический критерий для проверки гипотез
(3.56) по эмпирическим данным у, Х на уровне значимости ε имеет
вид:
не отклоняется, если γ T < Δ,
гипотеза H0
γ T ≥ Δ,
отклоняется, если
(3.59)
где статистика критерия определяется по формуле
γT =
R2 T − m − 1
,
m
1 − R2
(3.60)
и при истинной гипотезе H0 имеет F-распределение Фишера с m и T −
m −1 степенями свободы.
Порог критерия определяется как квантиль данного
распределения уровня 1−ε:
В.И. Малюгин. Эконометрика – 1. Страница 25
∆ = ∆(ε) = F−1m,T−m−1 (1 − ε ) .
(3.61)
Доказательство. Используем для построения теста результат для
проверки общих гипотез относительно параметров ОЛСМ: Aβ = a . В
данном случае
A = (0, I m ), a = 0 ∈ ℜ m ,
γT =
RSS0 − RSS1 T − m − 1 .
⋅
RSS1
m
(3.62)
Подставим RSS1 и RSS0 в (3.62):
T − m −1
TSS − TSS + ESS T − m − 1
ESS
⋅
=
⋅
=
TSS − ESS
m
TSS − ESS
m
.
R2 T − m − 1
=
⋅
⇒ L{γ T | H 0 } = F m,T − m−1
m
1 − R2
γT =
3.7. АНАЛИЗ СТРУКТУРНЫХ ИЗМЕНЕНИЙ В
ОЛСМ
Определение. Под структурными изменениями (structure breaks)
модели понимаются скачкообразные изменения значений ее
параметров, обусловленные изменением условий протекания
моделируемого экономического процесса или внешними «шоковыми»
воздействиями.
Задача тестирования структурных изменений ОЛСМ может
рассматриваться как частный случай задачи проверки гипотез о
линейных ограничениях на параметры модели. Поэтому для ее
решения может использоваться модификация теста, приведенного в п.
3.5. Приведем описание данного теста.
\
В.И. Малюгин. Эконометрика – 1. Страница 26
3.7.1. ТЕСТ СТРУКТУРНЫХ ИЗМЕНЕНИЙ
Пусть имеются два типа условий протекания моделируемого
экономического процесса и предполагается, что смена условий может
являться причиной структурного изменения модели.
Для k-го (k = 1, 2) типа условий обозначим:
Tk − количество значений используемых в модели переменных, т.
е. объем выборки для пространственных данных или длина для
временного ряда, Т1 + Т2 = Т;
y(k) − вектор значений эндогенной переменной размерности Tk;
X(k) − матрица значений факторов размерности Tk × (m +1);
β (k ) ∈ ℜm+1 − вектор параметров модели;
ξ (k ) − вектор случайных ошибок наблюдений размерности Tk с
нулевым средним значением, некоррелированными компонентами
(имеющими
постоянную
дисперсию
σ2)
и
нормальным
распределением:
( )
(
)
L ξ (k ) = NTk 0, σ 2I .
Задача тестирования структурного изменения модели состоит в
проверке гипотез вида:
H 0 : β (1) = β (2 ) ,
(3.63)
H1 : β (1) ≠ β (2 ) ,
по эмпирическим данным y(k), X(k) (k = 1, 2) на заданном уровне
значимости ε.
Определяемое гипотезой Н0 ограничение означает отсутствие
структурных изменений модели. Если данное ограничение не
учитывается, т.е. полагается β (1) ≠ β (2 ) , то ОЛСМ допускает
представление:
y = Xβ + ξ ,
где
ξ (1)
y (1)
y = (2 ) , ξ = (2 ) − составные векторы размерности Т = Т1 +Т2,
ξ
y
В.И. Малюгин. Эконометрика – 1. Страница 27
X (1)
X =
O
O
− блочная матрица размерности (Т1+Т2) × 2 (m + 1),
X (2 )
β (1)
β = (2 ) − составной вектор параметров размерности 2(m + 1).
β
Задача проверки гипотез (3.63) является частным случаем задачи
проверки гипотезы о линейных ограничениях общего вида Aβ = α на
параметры ОЛСМ (см. пример А.6 из п. 3.4.1). Поэтому искомый
критерий получим, как частный случай указанного критерия. Будем
строить
критерий
в
форме
отношения
правдоподобия,
предполагающий использование МНК-оценок параметров с учетом и
без учета ограничений, а также соответствующих сумм квадратов
остатков. Получим выражения для сумм квадратов остатков и их
распределений в обоих случаях.
1. Ограничения на параметры не учитываются.
β (1)
(1)
(2 )
Полагаем, что β ≠ β . Для МНК-оценки β = (2 ) вектора β ,
β
вычисленной без учета ограничений, будем использовать
обозначения:
y (1)
• y = (2 ) = Xβ − вектор прогнозных значений эндогенной
y
переменной;
T
• RSS1(k ) = y (k ) − y (k ) y (k ) − y (k ) − сумма квадратов остатков
(k )
для оценки β (k = 1, 2).
Тогда сумма квадратов остатков для ОЛСМ без учета
ограничений определяется по формуле:
T
(3.64)
RSS1 = y − Xβ y − Xβ = RSS1(1) + RSS1(2 ) .
)(
(
(
)(
)
)
Воспользуемся свойством хи-квадрат распределения: если – две
независимые
случайные
величины,
имеющие
хи-квадрат
В.И. Малюгин. Эконометрика – 1. Страница 28
распределение с числом степеней свободы ν1 , ν 2 соответственно, то
справедливо:
L{ξ1 ± ξ 2 } = χν21 ±ν2 .
(3.65)
С учетом леммы 3.2 и свойства (3.65) статистика RSS1 имеет хиквадрат распределение с Т−2(m + 1) числом степеней свободы т.е.
L{
RSS1(1) + RSS1( 2)
RSS1
L
=
}
{
} = χ T2 − 2( m+1) .
σ2
σ2
2. Ограничения на параметры учитываются
Если ограничения, накладываемые гипотезой Н0, учитываются,
т.е. β (1) = β (2 ) = b ∈ ℜ m +1 , то ОЛСМ принимает вид:
y = Zb + ξ ,
(1)
X
где Z = (2 ) − матрица размерности Т × (m + 1), y ∈ ℜT , ξ ∈ ℜT .
X
~
Для МНК-оценки b вектора b, построенной с учетом
ограничений, сумма квадратов остатков RSS0 будет иметь Т − (m + 1)
число степеней свободы и определяться по формуле:
T
RSS 0 = (y − Xb~ ) (y − Xb~ ) = ξM Z ξ ,
(3.66)
где
M Z = I T − Z (Z T Z ) −1 Z T , rank(M Z ) = tr (M Z ) = tr (I T ) −
− tr (Z T Z (Z T Z ) −1 ) = T − tr (I m+1 ) = T − (m + 1)
поэтому L{
,
RSS0
| H 0 } = χ T2 −( m+1) .
2
σ
Так как согласно свойству хи-квадрат распределения (3.65)
имеем
L{
RSS0 − RSS1
σ
2
| H 0 } = χ m2 +1 ⇒ L{γ T | H 0 } = F m+1,T − 2( m+1) .
В.И. Малюгин. Эконометрика – 1. Страница 29
Статистический критерий структурных изменений
В результате на основании теоремы 3.4 искомый статистический
критерий проверки гипотез (3.63) имеет вид:
не отклоняется, если γ T < Δ,
гипотеза Н0
отклоняется, если γ T ≥ Δ ,
RSS0 − RSS1 T1 + T2 − 2(m + 1)
, ∆ = Fm−1+1,T1 +T2 − 2(m +1) (1 − ε ) ,
×
m +1
RSS1
где RSS1, RSS0 определяются по формулам (3.64), (3.66).
γT=
3.7.2. УЧЕТ СТРУКТУРНЫХ ИЗМЕНЕНИЙ С ПОМОЩЬЮ
ФИКТИВНЫХ ПЕРЕМЕННЫХ
Определение. Фиктивные переменные (dummy variables) – это
переменные, которые не имеют содержательной экономической
интерпретации и используются в модели для учета таких
особенностей, как структурные и сезонные изменения, аномальные
(резко выделяющиеся) наблюдения. Обычно фиктивные переменные
принимают значения на множестве {0, 1}, т.е. являются бинарными.
вид:
Предположим, что ОЛСМ строится по временным рядам и имеет
yt = β0 + β1xt1 +...+ βmxtm + ξt, t = 1, 2, ... , T,
(3.67)
В модели (3.67) могут быть структурные изменения параметров
β 0 и {β l } . Считаем, что имеет место одно структурное изменение в
известный момент времени 1 < τ < T .
Для учета
Предположим, что ОЛСМ , тогда фиктивные переменные,
учитывающие возможность структурных изменений определяются
следующим образом:
В.И. Малюгин. Эконометрика – 1. Страница 30
0,1 ≤ t ≤ τ − 1
– для учета изменений β 0 ,
1, τ ≤ t ≤ T
d 0 ,t =
0,1 ≤ t ≤ τ − 1
, l = 1,..., m , – для учета изменений {β l } .
1, τ ≤ t ≤ T
Модель ОЛСМ со структурными изменениями с помощью
фиктивных переменных имеет вид:
d l ,t =
m
m
yt = β 0(1) + ∑ β l(1) xtl + θ 0 d 0,t + ∑ θ l d l ,t xtl + ξ t , t = 1,..., T ,(3.67)
l =1
β 0( 2)
β 0(1) ;θ l
l =1
где θ 0 =
−
= β l − β l , l = 1,..., m .
Тестирование
статистической
значимости
структурных
изменений эквивалентна проверке гипотез о статистической
значимости оценок коэффициентов при соответствующих фиктивных
переменных.
Для тестирования структурного изменения в свободном члене
β 0 проверятся гипотеза
( 2)
(1)
H 0 : θ 0 = 0, H 1 : θ 0 ≠ 0 ;
При структурных изменениях в коэффициентах регрессии {β l } :
проверяются гипотезы H 0 : θ l = 0, H 1 : θ l ≠ 0, l = 1, m .
Для проверки указанных гипотез используется тест
статистической значимости параметров ОЛСМ, основанный на tстатистике.
Упражнение. Записать уравнения ОЛСМ для модели простой
линейной регрессии с линейным трендом и структурными
изменениями следующего типа:
1) в свободном члене;
2) в коэффициенте при линейном тренде;
3) в свободном члене и в коэффициенте при линейном
тренде.
Привести графические интерпретации временных рядов и
структурных изменений в трех случаях.
В.И. Малюгин. Эконометрика – 1. Страница 31
ГЛАВА 4
МЕТОДЫ ПОСТРОЕНИЯ И АНАЛИЗА
ОЛСМ С ГЕТЕРОСКЕДАСТИЧНЫМИ И
АВТОКОРРЕЛИРОВАННЫМИ
ОШИБКАМИ НАБЛЮДЕНИЯ
4.1. ОБОБЩЕННАЯ ЛИНЕЙНАЯ
СТАТИСТИЧЕСКАЯ МОДЕЛЬ. СВОЙСТВА
ОБЫЧНЫХ МНК -ОЦЕНОК ПАРАМЕТРОВ
ОБОБЩЕННОЙ МОДЕЛИ
4.1.1.
ОПРЕДЕЛЕНИЕ МОДЕЛИ
Рассмотрим ОЛСМ вида:
yt = xtT β + ξ t , t = 1,..., T ,
(4.1)
причем относительно {ξ t } предполагаем выполнение условий ξ.1−ξ.4.
В данном разделе исследуем нарушение условий ξ.2, ξ.3, т.е.
считаем, что случайные ошибки могут быть:
• гетероскедастичными, т.е.
D{ξ t } = σ t2 , t = 1,..., T ;
• автокоррелированными:
cov(ξ t , ξ τ ) = σ tτ ≠ 0, t ≠ τ , t , τ = 1,..., T .
На практике могут быть оба нарушения, но поскольку их учет
может осуществляться независимо друг от друга, то рассмотрим
модель ОЛСМ для одного из типов нарушений:
1. ОЛСМ с гетероскедастичными, но некоррелированными
ошибками:
Малюгин В.И. Эконометрика – 1.
Страница 1
D{ξ t } = σ t2 , cov(ξ t , ξ τ ) = 0, t ≠ τ ;
2. ОЛСМ с коррелированными, но гомоскедастичными
ошибками:
D{ξ t } = σ 2 , ∀t = 1,..., T , cov(ξ t , ξ τ ) = σ tτ ≠ 0, t ≠ τ .
Учет обоих типов нарушений можно осуществить в рамках
обобщенной линейной статистической модели (Generalized LSM):
y = Xβ + ξ ,
(4.2)
cov(ξ, ξ ) = σ 2 Ψ ,
(4.3)
где Ψ = Ψ > 0, σ – известная фиксированная матрица и неизвестный
параметр модели.
T
2
Для частных случаев модели 1 и 2 уточним вид матрицы Ψ :
ψ 2 O
, D{ξ t } = σ t2 = σ 2ψ t2 , t = 1,..., T ;
1. Ψ = 1
2
0 ψT
Ψ = (ψ tτ ),ψ tτ = ρtτ = corr (ξt , ξτ ) = 0, ∀t ,τ = 1,..., T
1
ρ 21
2. Ψ =
...
ρ
T1
ρ12
1
...
ρT 2
... ρ1T
... ρ 2T
, cov(ξt , ξτ ) = σ 2 ρtτ , ∀t ,τ
... ...
... 1
4.1.2. СВОЙСТВА ОБЫЧНЫХ МНК-ОЦЕНОК
ПАРАМЕТРОВ ОБОБЩЕННОЙ МОДЕЛИ
Исследуем свойства обычных МНК-оценок параметров
обобщенной линейной статистической модели (обобщенной ЛСМ).
Малюгин В.И. Эконометрика – 1.
Страница 2
Как известно, оценки имеют следующий вид:
β = ( X T X) −1 X T y ,
1
s2 =
(y − Xβ) T (y − Xβ) .
T − m −1
Для доказательства основного утверждения будем использовать
следующие свойства собственных значений матриц:
1
1. λ max ( A −1 ) =
, ∀A = A T > 0;
λ min ( A)
2.
∀A n×n , B n×m ⇒ λ max (B T AB) ≤ λ max (B T B)λ max ( A) ;
3.
∀A n×n , B n×m ⇒ λ min (B T AB) ≥ λ min (B T B)λ min ( A) ;
4.
∀C = (c kl ) ⇒ max c kl ≤ λ max (C ) .
k ,l
Теорема 4.1.
Если обобщенная ЛСМ вида
удовлетворяет следующим условиям:
1.
λ min ( X T X) T
→ ∞ (условие Эйкера);
→∞
(4.2)–(4.3)
2.
λ max (Ψ) ≤ d < ∞, ∀T ,
то имеют место утверждения:
1) оценка β является несмещенной и состоятельной в среднеквадратическом смысле;
2) оценка s 2 является смещенной.
Доказательство: 1. Докажем несмещенность β . Поскольку
β = β + ( X T X) −1 X T ξ,
(4.4)
то E{β} = β .
Докажем состоятельность:
cov(β, β) = V (β) = E{(β − β)(β − β) T } = ( X T X) −1 X T E{ξξ T } ×
(4.5)
× X( X T X) −1 = σ 2 ( X T X) −1 X T ΨX ( X T X) −1 = σ 2 B T AB.
С учетом введенных в (4.5) обозначений для матриц В и А,
найдем оценку сверху для C = (c kl ) = V (β) ):
Малюгин В.И. Эконометрика – 1.
Страница 3
≤ λmax (C) ≤ σ 2λmax (( XT X) −1 )λmax (Ψ) ≤
max c
kl
k ,l
≤
σ 2d
λmin (( X X))
T
T
→ 0 ⇒ V (β) T
→ 0.
→∞
→∞
Докажем смещенность оценки s 2 :
ξT M Xξ
ξT ξ
, M X = M TX = M 2X ; rank(M X ) = T − m − 1;
s2 =
=
T − m −1 T − m −1
tr (E{ξξ T }M X ) σ 2 tr (ΨM X )
=
≠σ 2,
E{s 2 } =
T − m −1
T − m −1
равенство выполняется только при tr (ΨM X ) = T − m − 1 ⇔ Ψ = I T ×T ,
но в нашем случае Ψ ≠ I T , следовательно, оценка s 2 является
смещенной.
Выводы:
• поскольку оценка β является несмещенной и состоятельной,
то ОЛСМ, используя данную оценку в предположении
адекватности, может служить для прогнозирования.
• так как оценка s 2 является смещенной оценкой, то все
связанные с ней тестовые статистики в рассматриваемых
условиях имеют распределение, отличное от стандартных
распределений,
поэтому
данные
тесты
не
могут
использоваться для проверки адекватности построенной
модели.
• Поскольку проверить адекватность построенной модели в
рассматриваемых условиях не удается, то использование
данной модели также не обосновано.
Описанные проблемы требуют применения специальных методов
оценивания
параметров
ОЛСМ
при
нарушении
свойств
гомоскедастичности и некоррелированности. Таким специальным
методом является обобщенный МНК.
Малюгин В.И. Эконометрика – 1.
Страница 4
4.2. ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ
КВАДРАТОВ (ОМНК). ПОСТРОЕНИЕ И
СВОЙСТВА ОМНК- ОЦЕНОК
Рассмотрим модель вида:
(4.6)
y = Xβ + ξ ,
где относительно матрицы Х выполняются условия Х.1-Х.2, т.е. она
фиксированная и rank ( X) = m + 1, T > m + 1;
(4.7)
cov(ξ, ξ ) = σ 2 Ψ, Ψ = Ψ T > 0, Ψ ≠ I .
Общая сема метода. Обобщенные МНК – оценки параметров β,
σ 2 для (4.6), (4.7) строятся в 2 этапа.
1. Осуществляется переход от модели (4.6), (4.7) к ОЛСМ со
сферическими ошибками, т.е. к ОЛСМ, для которой выполняются
традиционные предположения относительно ξ .
2. Для преобразованной модели находятся обычные МНК-оценки
параметров, именно они рассматриваются как обобщенные МНК –
оценки параметров β, σ 2 .
Покажем, что теоретически возможен переход от модели (4.6),
(4.7) к обычной ОЛСМ:
Лемма 4.1. Если для модели (4.6), (4.7) :
Φ = (ϕ 0 ...ϕ m ) − T × (m + 1)
– матрица ортонормированных
собственных векторов;
Λ = diag{λ l }, l = 0,..., m – матрица собственных значений для
матрицы Ψ , т.е. справедливы утверждения:
Φ T ΨΦ = Λ ; Φ T Φ = I m+1 ⇒ Φ T = Φ −1 ;
T = ΦΛ 1 / 2 , Λ 1 / 2 = diag{ λ l } ,
(4.8)
v = Zβ + η ,
(4.9)
то ОЛСМ вида:
где
−1
−1
−1
v = T y; Z = T X; η = T ξ ,
Малюгин В.И. Эконометрика – 1.
(4.10)
Страница 5
являющаяся результатом линейного преобразования модели (4.6),
(4.7), удовлетворяет традиционным предположениям относительно
Z, η , т.е. rank(Z ) = m + 1; cov(η, η) = σ 2 I T , E{η} = 0.
Доказательство.
1. Установим свойства матрицы Z. Очевидно Z – фиксированная
матрица,
поскольку
Z = T −1X; rank (Z) = min{rankT −1 , rankX} = min{m + 1, m + 1} = m + 1.
2. Установим свойства вектора случайных ошибок η :
E{η} = T −1E{ξ} = 0 T ⇒ cov(η, η) = E{ ηηT } = T −1E{ξξ T }(T −1 ) T =
= σ 2 T −1Ψ(T −1 ) T = σ 2 Λ −1 / 2 Φ T ΨΦΛ −1 / 2 = σ 2 I T .
Следствие: МНК – оценка β для модели (4.9) определяется как:
(4.11)
βG = ( X T Ψ −1 X) −1 X T Ψ −1 y
Доказательство:
βG = (Z T Z ) −1 Z T v = ((T −1 X) T (T −1 X)) −1 (T −1 X) T (T −1 y ) =
= ( X T (T −1 ) T T −1 X) −1 ( X T (T −1 ) T T −1 y ) = [(T −1 ) T T −1 = ( Λ −1 / 2 Φ T ) T ×
× Λ −1 / 2 Φ T = ΦΛ −1 / 2 Λ −1 / 2 Φ T = ΦΛ 1Φ T = Φ(Φ T ΨΦ) −1 Φ T =
= Φ((ΨΦ) −1 (Φ T ) −1 Φ T = Φ(Φ T Ψ −1Φ) −1 Φ T = Ψ −1 ] = ( X T Ψ −1 X) −1 ×
× X T Ψ −1 y.
Определение. Статистика βG , определяемая формулой (4.11)
называется обобщенной МНК-оценкой вектора β для модели (4.6),
(4.7), а матрицу Ψ – весовой матрицей.
Лемма 4.2. Обобщенная МНК – оценка βG минимизирует
взвешенную сумму квадратов:
SS X ( β) = (y − Xβ) T Ψ −1 (y − Xβ) → min
β∈ℜ m +1
Доказательство. Очевидно оценка βG минимизирует
Малюгин В.И. Эконометрика – 1.
Страница 6
SS Z (β) = ( v − Zβ) T ( v − Zβ) = SS X (β) ,
а, следовательно, и SS X (β) :
SS Z ( β) = (T −1 (y − Xβ)) T T −1 (y − Xβ) = (y − Xβ) T ( T −1 ) T T −1 (y − Xβ) =
= (y − Xβ) T Ψ −1 (y − Xβ) = SS X ( β).
Теорема 4.2. В условиях теоремы 4.1. обобщенная МНК-оценка
βG , определяемая формулой (4.11), является:
1) несмещенной;
2) состоятельной в среднеквадратическом смысле;
3) несмещенной оценкой параметра σ 2 является статистика:
1
σ G2 =
(y − XβG ) T Ψ −1 (y − XβG ) .
(4.12)
T − m −1
Доказательство. 1. Докажем несмещенность оценки βG :
βG = (Z T Z ) −1 Z T v = β + (Z T Z ) −1 Z T η , следовательно, E{βG } = β;
V (βG ) = cov(βG , βG ) = (Z T Z ) −1 Z T E{ηηT }Z (Z T Z ) −1 = σ 2 (Z T Z ) −1 (4.13)
(Z T Z ) −1 = ((T −1 X) T (T −1 X)) −1 = ( X T (T −1 ) T T −1 X) −1 = ( X T Ψ −1 X) −1 ,
таким образом, из (4.13) получаем:
V (βG ) = σ 2 ( X T Ψ −1 X) −1 .
2. Докажем состоятельность оценки βG в среднеквадратическом,
т.е. покажем, что V (βG ) T
→ 0 .
→∞
Пусть C = (c kl ) = V (βG ) .
≤ λ max (C ) ≤ σ 2 λ max (( X T Ψ −1 X) −1 ) ≤
max c kl
k ,l
≤
≤
σ2
λ min ( X T Ψ −1 X)
σ 2d
λ min ( X X)
T
≤
σ 2 λ max (Ψ)
σ2
=
≤
λ min ( X T X)λ min (Ψ −1 ) λ min ( X T X)
T
→ 0 ⇒ V (βG ) T
→ 0.
→∞
→∞
Малюгин В.И. Эконометрика – 1.
Страница 7
3. Поскольку модель (4.9) удовлетворяет традиционным
предположениям относительно η , то МНК-оценкой параметра σ 2
для модели (4.9) может быть статистика:
1
1
Tη
,
(4.14)
σ G2 =
η
( v − Z βG ) T ( v − Z βG ) =
T − m −1
T − m −1
= v − Zβ
где η
G - вектор остатков.
Формулы (4.12) и (4.14) эквивалентны для σ 2 , действительно,
G
σ G2 =
1
(T (y − XβG )) −T (T −1 (y − XβG )) ⇒ (4.12) .
−1
T − m −1
Покажем, что σ G2 является несмещенной оценкой. Так как
σ G2 =
1
T − m −1
Tη
=
η
1
T − m −1
ηT M Z η,
где rank(M Z ) = T − m − 1; cov(η, η) = σ 2I , то
1
1
E{σ G2 } =
E{ηT M Z η} =
tr {E{ηT η}M Z } =
T − m −1
T − m −1
=
σ2
σ2
tr {M Z } =
rank{M Z } = σ 2 .
T − m −1
T − m −1
Теорема 4.3. (обобщенная теорема Гаусса – Маркова).
Обобщенная МНК-оценка βG является эффективной в классе
несмещенных оценок вектора параметров β, линейных по у, т.е. βG
является более эффективной по сравнению с β .
Доказательство: βG является эффективной оценкой β в классе
несмещенных и линейных по v оценок модели (4.9); v = T −1 y , т.е.
существует линейная зависимость от у, поэтому оценка βG является
эффективной и в классе линейных по у оценок.
Малюгин В.И. Эконометрика – 1.
Страница 8
4.3. ПРОВЕРКА ГИПОТЕЗ О ПАРАМЕТРАХ
ОБОБЩЕННОЙ ЛИНЕЙНОЙ СТАТИСТИЧЕСКОЙ
МОДЕЛИ
Для обобщенной линейной статистической модели (4.6), (4.7)
рассмотрим задачу проверки общих линейных ограничений на
параметры вида:
(4.15)
Aβ = a ,
где A ~ r × (m + 1); a ∈ ℜ r ; r – число ограничений.
В случае обычной линейной статистической модели был построен
критерий обобщенного отношения правдоподобия, для частных
случаев были получены его частные представления. Для построения
теста используем распределение оценок параметров и связанных с
ними статистик.
Лемма 4.3. В условиях обобщенной линейной статистической
модели (4.6), (4.7) справедливы следующие утверждения:
1. L{βG } = N m+1 (β, σ 2 ( X T Ψ −1 X) −1 );
s 2
L G2 = χ T2 − m−1 ;
σ
3. оценки s G2 и βG независимы;
4. МНК и ММП – оценки βG совпадают.
Теорема 4.4. Утверждения теоремы 3.4 относительно теста
проверки общих линейных ограничений на параметры ОЛСМ вида
Aβ = a остаются в силе и для обобщенной линейной статистической
~
модели, если вместо обычных МНК-оценок β , β , учитывающих и не
учитывающих
линейные
ограничения
на
параметры
в
соответствующих формулах используются обобщенные МНК-оценки
~
βG , βG .
2.
Малюгин В.И. Эконометрика – 1.
Страница 9
4.4. О ВЫБОРЕ ВЕСОВОЙ МАТРИЦЫ
В ОМНК- ОЦЕНКЕ
В формуле (4.11) весовая матрица Ψ неизвестна, таким образом,
возникает
проблема
ее
задания.
Разумно
использование
статистических оценок Ψ по эмпирическим данным у, Х, но
непосредственное оценивание Ψ невозможно по имеющимся данным,
т.к. Ψ T ×T содержит Т(Т+1)/2 неизвестных элементов, для оценивания
которых можно использовать выборку (временной ряд) длиной Т.
Очевидно, величина Т(Т+1)/2 превосходит Т.
Используем
параметрическое
представление
для
q
Ψ = Ψ(θ), θ ∈ Θ ⊂ ℜ , q < T , Ψ(⋅) – заданная непрерывная функция, θ
- вектор параметров. Такое представление выбирается на основании
предварительного анализа данных и априорных предположений
относительно модели автокорреляции или гетероскедастичности.
Алгоритм построения оценки β:
1. По эмпирическим данным у, Х находим θ ; Ψ = Ψ(θ).
2. Ψ подставляем в представление для βG , получаем:
βG = ( X T Ψ −1 X) −1 X T Ψ −1 y.
Основанием такого подхода является теорема непрерывности,
которая утверждает, что, если θ T
→ θ 0 , то непрерывная функция
→∞
ϕ (θ) T
→ ϕ (θ 0 ) .
→∞
4.5. ПОСТРОЕНИЕ И АНАЛИЗ ОЛСМ С
ГЕТЕРОСКЕДАСТИЧНЫМИ ОШИБКАМИ
Рассмотрим ОЛСМ с гетероскедастичными ошибками вида:
y = Xβ + ξ,
где E{ξ} = 0, cov(ξ, ξ ) = σ 2 Ψ, Ψ = diag{ψ t2 }, t = 1,..., T.
Различные
модели
гетероскедастичности
можно
классифицировать по уровню априорной информации относительно
гетероскедастичности ошибок.
Малюгин В.И. Эконометрика – 1.
Страница 10
4.5.1. МОДЕЛИ ГЕТЕРОСКЕДАСТИЧНОСТИ
1. Модель межгрупповой гетероскедастичности.
В рамках данной модели предполагается существование
нескольких интервалов постоянства дисперсии g, g ≥ 2, и некоторым
образом определено разбиение всей совокупности данных, т.е. у, Х на
подвыборки, соответствующие интервалам постоянства значений
параметров: {y (l ) }, {X (l ) }, l = 1,..., g.
Гетероскедастичность в данном случае обусловлена различными
условиями функционирования для данных типа временные ряды
(например, вследствие структурных изменений) либо совместным
анализом различных типов объектов в случае пространственных
данных (например, анализ хозяйственной деятельности компаний
различного размера).
Для одного типа условий ОЛСМ может иметь вид:
y (l ) = X (l ) β + ξ (l ) , l = 1,..., g ,
где ξ (l ) = (ξ t(l ) ), t = 1,..., T (l ) , D{ξ t(l ) } = σ l2 .
Тестируемая гипотеза имеет вид:
H 0 : σ 12 = ... = σ g2
и означает отсутствие межгрупповой гетероскедастичности; гипотеза
H 1 : H 0 указывает на наличие межгрупповой гетероскедастичности.
Данные гипотезы являются гипотезами однородности данных по
дисперсии, для их проверки традиционно используются тесты
однородности дисперсий в нескольких выборках, например тес
Бартлетта.
2.
Модель
гетероскедастичности
с
различными
предположениями относительно {ψ t } .
В данном случае интервалы постоянства дисперсии неизвестны, в
течение всего периода наблюдения (для всего объема данных)
возможно 2 интервала, для которых дисперсии могут отличаться, при
этом модель гетероскедастичности полностью определяется матрицей
Ψ = diag{ψ t2 }, т.е.
σ t2 = σ 2ψ t2 , t = 1,..., T.
Малюгин В.И. Эконометрика – 1.
(4.16)
Страница 11
Различные предположения относительно {ψ t } приводят к
различным вариантам модели гетероскедастичности:
1. ψ t = t ⇒ σ t2 = σ 2 t 2 ~ σ t = σ ⋅ t , т.е. дисперсия случайных ошибок
наблюдения зависит от порядкового номера.
2. ψ t = xtl , l ∈ {1,..., m} , т.е. ψ t совпадает с одной из объясняемых
переменных: σ t2 = σ 2 xtl2 ~ σ t = σ ⋅ xtl , т.е. дисперсия случайных
ошибок наблюдения зависит от некоторой объясняемой
переменной.
Для установления гетероскедастичности первого и второго вида
используется тест Голдфелда – Куандта.
3. σ t2 = γ 0 + γ T zt , где zt = ( zt1 ,..., ztg ) T ∈ ℜ q - вектор объясняющих
параметров, γ 0 , γ ∈ ℜ q - неизвестные параметры, т.е. дисперсия
случайных ошибок линейно зависит от нескольких объясняющих
переменных.
Для
установления
гетероскедастичности
третьего
вида
используется тест Бреуша–Пагана.
3. Модель гетероскедастичности, не использующая конкретную
априорную информацию.
Наличие гетероскедастичности здесь обусловлено включением в
модель объясняющих переменных, но модель гетероскедастичности
имеет сложный вид:
σ t2 = f ( xt1 ,..., xtm )
и этот вид неизвестен. Для выявления гетероскедастичности
используется тест Уайта.
4.5.2. ТЕСТ МЕЖГРУППОВОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
Теорема 4.5.
Асимптотический (при T → ∞ ) критерий
отношения правдоподобия проверки гипотез об отсутствии
межгрупповой гетероскедастичности по эмпирическим данным
{y (l ) }, {X (l ) }, l = 1,..., g. на уровне значимости ε имеет вид:
Малюгин В.И. Эконометрика – 1.
Страница 12
не отклоняется, если γ T < Δ,
гипотеза H 0
отклоняется, если γ T ≥ Δ ,
где
g
γ T = T ln(σ~ 2 ) − ∑ Tl ln(σ l2 ) ≥ 0, ∆ = ∆(ε ) = χ g−1−1 (1 − ε ) ,
l =1
σ~ 2 = RSS0 / T =
(y − Xβ) T (y − Xβ)
T
– ММП-оценка, учитывающая ограничения;
σˆ = RSS
2
l
(l )
1
(y (l ) − X(l )β (l ) )T (y (l ) − X(l )β (l ) )
–
/ Tl =
Tl
ММП – оценка параметра σ 2 без учета ограничений;
β(l ) = ( X (l )T X (l ) ) −1 X (l )T y (l ) , l = 1,..., g , – МНК – оценка для l-го
интервала постоянства дисперсии.
Доказательство основано на реализации традиционной схемы
построения критерия обобщенного отношения правдоподобия (см.
теорему 3.4.).
4.5.3. ТЕСТ ГОЛДФЕЛДА – КУАНДТА
Рассматриваем модель гетероскедастичности
σ t2 = σ 2 xtl , l ∈ {1...m} .
Алгоритм тестирования включает следующие этапы:
1. Формирование
на
основе
исходных
{xtl } вариационного ряда {x(t ),l } : x(1),l ≤ x( 2),l ≤ ... ≤ x(t ),l .
данных
2. Вариационный ряд {x(t ),l } разбивается на 3 отрезка:
A (1) = {x(1),l ,..., x(T1 − p ),l }, A (1) = T1 − p ;
A ( 2) = {x(T1 + p ),l ,..., x(T ),l }, A ( 2) = T − (T1 + p) = T2 ;
A (3) = {x(T1 − p +1),l ,..., x(T1 + p −1),l }, A (3) = 2 p, T1 + T2 + 2 p = T .
Малюгин В.И. Эконометрика – 1.
Страница 13
В соответствии с разбиением
формируются
A (1) , A ( 2)
соответствующие им значения эндогенных переменных и матрицы
значений факторов: y (l ) ∈ ℜ Tl , X (l ) ~ Tl × (m + 1), l = 1,2 .
Для каждого подмножества эмпирических данных может быть
построена ОЛСМ в виде:
y (l ) = X (l ) β(l ) + ξ (l ) , l = 1,2 ,
причем cov(ξ (l ) , ξ (l ) ) = σ (2l ) I T( l ) , т.е. внутри каждого подмножества
ошибки являются гомоскедастичными.
H 0 : σ (21) = σ (22) ; H 1 : H 0 .
Гипотеза H 0 накладывает ограничения на дисперсию ошибок,
гипотеза H 1 дает общее предположение.
3. Оцениваются параметры {β(l ) } с помощью МНК (без учета
ограничений); вычисляются случайные вектора остатков:
ξ l = y (l ) − X (l ) β(l ) , l = 1,2 ,
RSS1(l ) = ξ Tl ξ l , l = 1,2 ;
находится
сумма
квадратов
остатков
вычисляется тестовая статистика:
υ1 = T − p − m − 1;
ζ /υ
γ T = 1 1 , где ζ l = RSS1(l ) ,
ζ 2 /υ2
υ 2 = T − (T1 + p) − m − 1
– числа степеней свободы для соответствующих сумм квадратов
остатков.
В предположении, что ζ 1 , ζ 2 являются независимыми и имеют
закон распределения χ υ21 , χ υ22 соответственно,
L{γ T | H 0 } = Fυ1 ,υ 2 , T → ∞ ,
поэтому тест проверки гипотез имеет вид:
не отклоняется, если γ T < Δ,
гипотеза H 0
,
отклоняется, если γ T ≥ Δ ,
где ∆ = ∆(ε ) = Fυ−11,υ 2 (1 − ε ) .
Зависимость ζ 1 , ζ 2 ослабевает при p → ∞, T → ∞ .
Малюгин В.И. Эконометрика – 1.
Страница 14
4.5.3. ТЕСТ УАЙТА И КОРРЕКЦИЯ СТАНДАРТНЫХ
ОШИБОК
Тест Уайта. Тест Уайта может использоваться как для
пространственных данных, так и для временных рядов, а также не
требует
априорной
информации
о
структуре
модели
гетероскедастичности.
Предполагается
лишь,
что
гетероскедастичность
обусловлена
включенными
в
модель
экзогенными переменными, а также их взаимодействием. Если
гипотеза Н0 отклоняется, то результаты тестирования не несут
полезной для применения обобщенного МНК информации о виде
модели гетероскедастичности, однако в этом случае может быть
осуществлена коррекция стандартных ошибок { vl } в форме Уайта
(см., например [11]).
Рассматриваем модель:
y = Xβ + ξ,
m
yt = β 0 + ∑ β l xtl + ξ t
(4.17)
l =1
σ 12
0
, σ t2 = f ( xt1 ,..., xtm ) .
cov(ξ, ξ ) =
σ T2
0
Тест Уайта реализуется следующим образом:
1.
Для модели (4.17) находим с помощью МНК оценки
β = (βl ) ∈ ℜ m+1 , ξ = (ξ t ), ξ = y − Xβ .
2. Описывается модель зависимости σ t2 от {xtl }, l = 1,..., m .
Предполагаем, что σ t2 =ξ 2t и строится модель для квадратов остатков,
которые рассматриваются как оценки дисперсий ошибок:
2
ξ t2 = α1xt1 + … + αmxtm + αm+ 1 xt21 + … + α2m xtm
+
+ α2m+ 1xt1xt2 + …+ αqxtm-1xtm + ηt, t = 1, 2, ... , T ,
(4.18)
где предполагается, что:
{ ηt } − последовательность некоррелированных случайных
величин с нулевым средним значением и постоянной дисперсией;
Малюгин В.И. Эконометрика – 1.
Страница 15
q = m(m+3)/2 − общее количество регрессоров, в число которых
входят используемые в ОЛСМ экзогенные переменные {xtl} (l = 1, 2,
… , m), их квадраты, а также попарные произведения.
3. Оценивается (4.18) с помощью МНК, незначимые факторы
исключаются из модели. Вычисляется статистика теста множителей
Лагранжа вида
γ T = TR 2 ,
2
где R − коэффициент детерминации модели (4.18).
Известно, что
L{γ T | H 0 } T
→ χ Q2 −1 ,
→∞
где Q – общее число параметров модели (4.18).
4. Принимаем решение относительно гипотезы H 0 на уровне ε :
не отклоняется, если γ T < Δ,
гипотеза Н0
отклоняется, если γ T ≥ Δ ,
где пороговое значение полагается равным Δ = Δ(ε ) = χQ−1−1 (1 − ε ).
Коррекция стандартных ошибок по Вайту. Тест Уайта
позволяет лишь установить факт гетероскедастичности, но не дает
информации относительно весовой матрицы Ψ = diag{ψ t2 } , поэтому
нельзя построить обобщенные МНК – оценки.
Уайт предложил процедуру коррекции стандартных ошибок для
{β(l ) } , которая позволяет устранить смещение оценки дисперсии
случайных ошибок в ОЛСМ в случае их гетероскедастичности и
корректно вычислять t-статистику при проверки гипотез о значениях
коэффициентов регрессии..
Известно, что смещенность оценки параметра, которая имеет
место в условиях гетероскедастичности ошибок, σ 2 является
причиной нарушения стандартных распределений тестовых статистик,
использующих данную оценку и применяемых при анализе
адекватности ОЛСМ.
Малюгин В.И. Эконометрика – 1.
Страница 16
В тесте статистической значимости используется статистика
βl
γ T = ,ν l = s ( X T X) l−1 = D{ βl }, l = 1,..., m.
νl
Стандартные ошибки {ν l } могут быть найдены из оценки
ковариационной матрицы β = ( βl ) :
V = (ν ) = cov(β, β),ν = ν , l = 1,..., m .
ll
l
ll
Найдем общий вид ковариационной матрицы:
β = β + ( X T X) −1 X T ξ ,
(4.19)
cov(β, β) = E{(β − β)(β − β) T } = ( X T X) −1 X T E{ξξ T }X( X T X) −1 (4.20)
E{ξξ T } = cov(ξ, ξ ) = diag{σ t2 } ,
x1T
где X = ... , xtT = ( xt 0 ,..., xtm ) ∈ ℜ m+1 – вектор значений факторов в
xTT
t-ом эксперименте.
Для квадратичной формы в (4.20) справедливо выражение
T
X T E{ξξ T }X = ∑ σ t2 ⋅ xt ⋅ xtT .
(4.21)
t =1
Подставляя (4.21) в (4.20), получаем:
T
V = cov(β, β) = ( X T X) −1 ∑ σ t2 xt xtT ( X T X) −1
(4.22)
t =1
Подставляя в (4.22) вместо {σ t2 } их оценки {ξ t2 } , получаем
скорректированную по Уайту оценку:
T
(4.23)
V = ( X T X) −1 ∑ ξ t2 xt xtT ( X T X) −1 .
t =1
Диагональные элементы матрицы V используются в качестве
скорректированных по Уайту стандартных ошибок оценок
коэффициентов регрессии, т.е.
ν l = νll , l = 1,..., m .
Малюгин В.И. Эконометрика – 1.
Страница 17
Уайт доказал, что оценка ковариационной матрицы V ,
определяемая формулой (4.23), является несмещенной.
4.5.4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ОЛСМ С
ГЕТЕРОСКЕДАСТИЧНЫМИ ОШИБКАМИ
Если установлено присутствие гетероскедастичности и вид
весовой матрицы Ψ = diag{ψ t2 } , то для оценивания параметров ОЛСМ
используется формула:
T
T
β = ( XT Ψ −1X) −1 XT Ψ −1y = (∑ψ t− 2 xt xtT ) −1 ∑ψ t− 2 xt ytT . (4.24)
t =1
t =1
Оценка (4.24) часто называется взвешенной МНК-оценкой.
Для нахождения обобщенной МНК – оценки βG используется
следующая процедура:
Из (4.24) следует, что если осуществить преобразование
переменных в исходной ОЛСМ вида:
vt =
yt
x
, zt = t ,
ψt
ψt
то получается модель, случайные ошибки для которой являются
гомоскедастичными:
m
yt
x
ξ
= ∑ β l tl + t , t = 1,..., T ,
ψ t l =1 ψ t ψ t
(4.25)
ξ σ 2ψ t2
D t =
= σ 2 , ∀t .
2
ψ
ψt
t
Практические рекомендации при построении ОЛСМ в условиях
гетероскедастичности:
1. При обнаружении эффекта гетероскедастичности осуществляется
ее тестирование и в случае известных весовых функций
{ψ t } происходит переход к модели взвешенной регрессии, т.е.
осуществляется замена переменных.
Малюгин В.И. Эконометрика – 1.
Страница 18
2. Используется обычный МНК для оценивания параметров новой
модели и традиционный набор тестовых статистик.
4.6. ПОСТРОЕНИЕ ОЛСМ С
АВТОКОРРЕЛИРОВАННЫМИ ОШИБКАМИ
4.6.1. ПРОБЛЕМА АВТОКОРРЕЛЯЦИИ ОШИБОК
вида
При построении ОЛСМ по экономическим временным рядам
yt = β T xt + ξ t , t = 1,..., T ,
(4.26)
часто не выполняется предположение о некоррелированности, где
ошибки
{ξ t } оказываются коррелированными. В этом случае
обычный МНК приводит к построению оценок β , которые хотя и
являются несмещенными и состоятельными, но перестают быть
эффективными. Кроме того, оценка дисперсии s 2 оказывается
смещенной. В таком случае используются обобщенные МНК- оценки.
Опишем методы анализа ОЛСМ и построения оценок параметров
ОЛСМ для простейшего случая коррелированности ошибок первого
порядка, т.е. рассмотрим ОЛСМ (4.26), где
(4.27)
ξ t = ρξ t −1 + η t ,
здесь ξ 0 – заданное начальное значение; ρ , ρ < 1 – коэффициент
авторегрессии; {η t } – независимые одинаково распределенные
случайные ошибки наблюдения,
E{η t } = 0, D{η t } = σ η2 ; cov(η t , η t −1 ) = 0; cov(η t , ξ t −1 ) = 0, ∀t .
Формула (4.27) описывает модель авторегрессии первого порядка
AR(1), которая обладает следующими свойствами:
1. E{ξ t } = 0;
σ η2
2.
D{ξ t } =
3.
cov(ξ t , ξ t −τ ) = ρ τ σ 2 ; где τ ≥ 1 – величина лага,
1− ρ2
;
Малюгин В.И. Эконометрика – 1.
Страница 19
1
... ρ T −1
ρ
ρ
1
... ρ T − 2
2
4. cov(ξ, ξ ) = σ Ψ , где Ψ = Ψ( ρ ) =
.
.
.
.
T −1 ρ T − 2 ...
1
ρ
– весовая матрица, таким образом, ОЛСМ с автокоррелированными
ошибками (4.26), (4.27) является частным случаем обобщенной
линейной статистической модели, т.е. ОЛСМ с несферическими
ошибками.
Общая схема ОМНК
Обобщенные МНК – оценки βG , s G2 находят в соответствии с
общей схемой построения таких оценок, которая включает 2 этапа:
1. Переход от модели (4.26), (4.27) с гетероскедастичными ошибками
к классической ОЛСМ с гомоскедастичными ошибками.
2. Применение обычного МНК для преобразования модели;
полученные
в
результате
МНК-оценки
параметров
рассматриваются как обобщенные МНК-оценки для исходной
модели.
Автокорреляция случайных ошибок ОЛСМ не имеет
содержательной интерпретации при построении ОЛСМ по
пространственным данным. По этой причине автокорреляция остатков
построенной по пространственным данным ОЛСМ может лишь
служить признаком неудовлетворительной спецификации модели.
Задача построения ОЛСМ с автокоррелированными ошибками не
имеет смысла.
4.6.2. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ОЛСМ С
АВТОКОРРЕЛИРОВАННЫМИ ОШИБКАМИ С ПОМОЩЬЮ
ПРОЦЕДУРЫ КОХРЕЙНА – ОРКАТТА
В соответствии с общей схемой построения обобщенных МНКоценок приведем более подробное описание алгоритма построения
обобщенных МНК-оценок модели (4.26), (4.27).
Малюгин В.И. Эконометрика – 1.
Страница 20
Этап 1. Переход к модели с некоррелированными ошибками.
Покажем возможность такого перехода:
yt = β T xt + ξ t , t = 1,..., T ,
yt −1 = β T xt −1 + ξ t −1 ,
(4.28)
Вычтем из (4.26) выражение (4.28), умноженное на ρ , получим:
yt − ρyt −1 = β T ( xt − ρxt −1 ) + ξ t − ρξ t −1 ,
вводя обозначения
vt = yt − ρyt −1 ; zt = xt − ρxt −1 ;η t = ξ t − ρξ t −1 ,
Получаем преобразованную модель
vt = β T zt + η t , t = 1,..., T ,
(4.29)
где относительно η t выполняются традиционные предположения 1–4.
Формула
(4.29)
описывает
классическую
ОЛСМ
с
некоррелированными ошибками, это доказывает возможность
перехода от исходной модели к классической ОЛСМ.
Запишем выражения для t=1:
где
v1 = β T z1 + η1 ,
v1 = y1 − ρy0 ; z1 = x1 − ρx0 ; y0 ∈ ℜ1 , x0 ∈ ℜ m+1 .
(4.30*)
Из (4.30*) следует, что при вычислении первого значения временного
ряда возникает проблема задания начальных значений y0 , x0 .
Во всех статистических пакетах эта проблема решается за счет
сокращения длины временных рядов { yt }, {xt } , используемых для
построения оценок; в качестве y0 , x0 выбирают первые значений
соответствующих переменных, таким образом, используется Т-1
значений для оценивания параметров.
{ yt }, {xt }, t = 1,..., T → { yt' }, {xt' }, t = 2,..., T
y0' = y1 ; x0' = x1 ; yt' = yt +1 ; xt' = xt +1 , t = 1,..., T − 1 .
Малюгин В.И. Эконометрика – 1.
Страница 21
Специальное задание начальных значений, что позволяет
сохранить данные в полном объеме. Это важно, когда используются
короткие временные ряды.
Если v1 = 1 − ρ 2 y1 ; z1 = 1 − ρ 2 x1 , то ξ 1* в модели
v1 = β T z1 + ξ 1* ,
(4.30)
обладает теми же свойствами, что и η t , т.е.
η1 = ξ
*
1 .
Такой выбор
исключает проблему выбора начальных значений y0 , x0 .
Этап 2. Оценивание преобразованной модели. Применение
МНК, который в соответствии с общей схемой должен использоваться
для нахождения параметров, невозможно, т.к. vt и zt зависят от
неизвестного параметра ρ , поэтому для нахождения обобщенных
МНК- оценок используются специальные процедуры:
Процедура Кохрейна – Оркатта. Для ОЛСМ вида (4.26), (4.27)
находятся обычные МНК – оценки
β = ( X T X) −1 X T y; ξ = (ξ t ) = y − y .
Рассматривается модель авторегрессии первого порядка:
(4.31)
ξ t = ρξ t −1 + η t , t = 1,..., T ,
с помощью МНК находим:
T
ρ =
∑ ξˆ ξˆ
t =1
T
t t −1
∑ ξˆt2
,
t =1
подставляем данную оценку в формулы (4.30*), по которым находим
vt , zt .
Для модели (4.29) находим оценку
повторяем, пока не получим:
ρ ( k ) − ρ ( k −1) ≤ α ,
β, {ξ t2 } , этот процесс
где k – номер итерации.
Оценка βG находится после завершения работы процедуры.
Малюгин В.И. Эконометрика – 1.
Страница 22
4.6.3. АНАЛИЗ АВТОКОРРЕЛЯЦИИ ОСТАТКОВ НА ОСНОВЕ
ТЕСТА ДАРБИНА - УОТСОНА
Актуальной является задача анализа автокорреляции ошибок на
основе исследования остатков модели. Тест Дарбина − Уотсона
используется для выявления автокорреляции первого порядка в
анализируемой последовательности остатков { ξ t } (t = 1, 2, ... , T ).
Таким образом, альтернативой гипотезе Н0 о некоррелированности
остатков считается предположение Н1 о том, что остатки являются
коррелированными и описываются моделью авторегрессии первого
порядка 1:
ξt = ρξt −1 + ηt , t = 1, 2, ..., T ,
где { ηt } − последовательность некоррелированных случайных
величин с нулевым средним значением и постоянной дисперсией,
ρ = Cov{ ξ t , ξ t −1 }/D{ ξ t } (ρ < 1) −
коэффициент корреляции случайных величин ξ t , ξ t −1 .
Статистика теста, известная как статистика Дарбина − Уотсона
(DW-статистика), вычисляется по формуле:
T
DW =
∑ (ξ
t =2
t
2
− ξt −1 )
T
∑ ξˆt2
.
t =1
МНК-оценка ρ параметра ρ в модели для ξ t определяется
выражением:
T
ξ t ξ t −1
∑
.
(4.32)
ρ = t = 2T
2
∑ ξt
t =1
1
Предполагается, что свободный член включен в исходную ОЛСМ. Более подробное
описание данной модели приводится в § 5.1.
Малюгин В.И. Эконометрика – 1.
Страница 23
Поэтому при достаточно большом числе наблюдений Т,
справедливо следующее приближенное соотношение DW ≈ 2(1 − ρ) , из
которого следует, что
0, если ρ = 1,
DW ≈ 2, если ρ = 0,
(4.33)
4, если ρ = -1.
Тест Дарбина − Уотсона. Из свойств (4.33) следует, что значения
DW-статистики близкие к 0 и 4 могут свидетельствовать
соответственно в пользу положительной и отрицательной
автокорреляции остатков. Значения DW-статистики близкие к 2 могут
означать отсутствие статистически значимой автокорреляции
остатков. Тест Дарбина − Уотсона основан на DW-статистике и
позволяет принимать решения на некотором заданном уровне
значимости ε. Для этого используются пороговые значения d−, d+ (0 <
d− < d+ < 2), вычисленные 1 для некоторых фиксированных значений
числа наблюдений T, количества экзогенных переменных в исходной
модели m и уровня значимости ε.
В соответствии с тестом Дарбина − Уотсона принимаются
следующие решения:
− гипотеза Н0 отклоняется (ρ < 0), если 4 − d− < DW < 4;
− гипотеза Н0 отклоняется (ρ > 0), если 0 < DW < d−;
− гипотеза Н0 не отклоняется, если d+ < DW < 4 − d+;
− гипотеза Н0 не может быть ни принята, ни отклонена, если 4 − d+ <
DW < 4 − d− либо d− < DW < d+ .
При нахождении d−, d+ использовалось предположение о
некоррелированности Х и ξ. Это предположение, в частности, не
выполняется, если ОЛСМ строится по временным рядам и включает
лаговые значения эндогенной переменной. Поэтому DW-статистику и
основанный на ней тест нельзя применять в указанном случае.
Следует также иметь в виду, что отсутствие автокорреляции первого
порядка не исключает возможность автокорреляции более высокого
порядка. По этим причинам для анализа автокоррелированности
1
См. Durbin J., Watson G.S. Testing for serial Correlation in Least Square regression.
Biometrica, v. 38, p. 159−177.
Малюгин В.И. Эконометрика – 1.
Страница 24
остатков ОЛСМ по временным рядам целесообразно использовать
анализ автокорреляционной и частной автокорреляционной функций
остатков, а также анализ статистики Льюнга − Бокса. Целью данного
анализа является проверка гипотезы о том, что остатки описываются
случайным процессом белого шума.
Малюгин В.И. Эконометрика – 1.
Страница 25
ГЛАВА 5
МЕТОДЫ ПОСТРОЕНИЯ ОЛСМ В
УСЛОВИЯХ МУЛЬТИКОЛЛИНЕАРНОСТИ
ФАКТОРОВ
5.1. МУЛЬТИКОЛЛИНЕАРНОСТИ ФАКТОРОВ И МЕТОДЫ ЕЕ
УЧЕТА
Определение. Говорят, что в ОЛСМ имеет место строгая
мультиколлинеарность факторов, если факторы (предопределенные
переменные), включаемые в модель, связаны функциональной
линейной зависимостью.
В случае строгой мультиколлинеарности факторов нарушается
предположение Х.2 и матрица X является вырожденной (X=0),
поэтому матрица (XTX)−1 необратима в обычном смысле, что
порождает проблему идентифицируемости модели. В данном случае
оценки вектора параметров модели β по методу наименьших
квадратов (МНК-оценки) определяются не единственным образом.
На практике зависимость факторов может не существовать
линейной зависимости факторов, к тому же, погрешности, связанные с
вычислением экономических показателей, а также ошибки округления
вычислительных процедур приводят к «смягчению» эффектов строгой
мультиколлинеарности, в результате чего определитель матрицы X
отличается от нуля, но принимает близкие к нулю значения:X ≈ 0.
В этом случае матрица X является плохо обусловленной.
Определение. Имеет место нестрогая мультиколлинеарность
(или просто – мультиколлинеарность) факторов в ОЛСМ, если
факторы, включаемые в модель связаны зависимостью, близкой к
линейной.
Плохая обусловленность матрицы X является причиной больших
вычислительных погрешностей при нахождении МНК-оценок { β l },
т.е. больших значений стандартных ошибок { vl } этих оценок, что
часто затрудняет анализ их статистической значимости.
Малюгин В.И. Эконометрика – 1.
Страница 26
Мультиколлинеарность можно устранить посредством
исключения одного из существенно коррелированных
(сопряженных) факторов или смягчить за счет увеличения
объема данных.
Однако это не всегда возможно на практике. Поэтому
приходится
использовать
специальные
методы
оценивания
параметров, например:
• мет оды псевдообращения мат риц (например, метод Мура –
Пенроуза);
• мет од
пост роения
«гребневых»
(ридж -оценок)
коэффициент ов регрессии, которые являются смещенными, но
минимизируют суммарную дисперсию оценок коэффициентов регрессии;
• мет од главных компонент , позволяющий получить меньшее
число взаимно независимых (ортогональных) факторов и др.
5.2. ПРИЧИНЫ И УСЛОВИЕ МУЛЬТИКОЛЛИНЕАРНОСТИ
ФАКТОРОВ
Причиной мультиколлинеарности факторов реально часто
являются грубые ошибки в спецификации модели:
1) включение в модель экзогенной переменной (фактора),
представляющей собой линейную комбинацию других факторов,
например суммарного показателя наряду с составляющими его
компонентами.
2) использование для моделирования сезонных эффектов
фиктивных переменных, число которых равно периоду сезонности
вместе со свободным членом;
3) включение в модель большого числа лаговых значений
экзогенных переменных.
Условие мультиколлинеарности второго порядка. На практике
часто приходится сталкиваться с мультиколлинеарностью второго
порядка, которая возникает при включении в модель факторов, парные
коэффициенты корреляции для которых принимают близкие к
единице значения.
Условие мультиколлинеарности второго порядка:
Малюгин В.И. Эконометрика – 1.
Страница 27
max{rk,l} ≥ R (k ≠ l, k, l = 1, 2, … , m),
где {rk,l}− выборочные парные коэффициенты корреляции факторов
(элементы корреляционной матрицы вектора экзогенных переменных),
R − арифметический корень из коэффициента детерминации модели
(выборочный множественный коэффициент корреляции).
Помимо
проблемы
идентифицируемости
и
больших
вычислительных погрешностей мультиколлинеарность факторов часто
приводит к противоречивым результатам, получаемым при
тестировании адекватности ОЛСМ на основе t- и F-тестов, т.е.
порождает проблему установления адекватности модели.
Малюгин В.И. Эконометрика – 1.
Страница 28
ЭКОНОМЕТРИКА-2
Эконометрические модели временных
рядов и методы их построения
В.И. Малюгин. Эконометрика – 2.
Страница 1
ГЛАВА 6
МОДЕЛИ И МЕТОДЫ АНАЛИЗА
СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ
6.1. СТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ И ИХ
ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
Как известно, временным рядом называется ряд значений
анализируемой
экономической
x1....xT (=
xt ( xti ) ∈ℜ N , N ≥ 1)
переменной или переменных, соответствующих T последовательным
моментам (периодам) времени. Используя терминологии теории
случайных процессов, временной ряд {xt } можно определить как
случайный процесс с дискрет ным временем t (t = 1,..., T ).
Далее в этой главе полагается, что N=1, т.е. рассматриваются
только одномерные модели временных рядов. Многомерным моделям
в случае N>1 посвящены последние главы курса.
динамику
изменения
Временные
ряды
характеризуют
анализируемых переменных во времени. При этом его важной
инт ервал
наблюдения.
Для
характеристикой
является
макроэкономических показателей основные интервалы: месяц,
квартал, год; для финансовых показателей: неделя, день, минута и
более мелкие временные интервалы. В зависимости от интервала
наблюдения различают месячные, квартальные, годовые и т.д.
эконометрические модели, поскольку для построения модели
используются данные с одним интервалом наблюдения.
Временные ряды в отличие от модели пространственных данных
типа «случайная выборка» отличаются двумя особенностями, которые
имеют место в общем случае:
В.И. Малюгин. Эконометрика – 2.
Страница 2
1. Значения временного ряда x1 ,..., xT не являются независимыми в
совокупности; исключение составляет модель временного ряда,
описываемая случайным процессом «белого шума».
2. Значения временного ряда x1 ,..., xT не являются одинаково
распределенными.
Наиболее общей моделью временного ряда является совместная
функция распределения этих случайных величин x1....xT :
F x1 ... xT ( z1 ,..., zT ) = F x1 ( z1 )F x1 | x2 ( z1 | z2 ) × ... × F xT | x1 ... xT −1 ( zT | z1 ...zT −1 ) , (6.1)
где F x1 ( z1 ) – частная (маргинальная) функция распределения x1 , все
остальные
функции
распределения
–
условные
функции
распределения.
Это модель, однако, является слишком сложной для
практического применения, поскольку используемые в ней
распределения не известны и не могут быть оценены по реализации
временного ряда длиной Т.
Более простым является подход, в рамках которого для
вероятностного описания случайных величин x1 ,..., xT используются
лишь некоторые моменты их совместного распределения, а именно:
E{xt }, D{xt }, cov( xt , xτ ), t ≠ τ ; t , τ = 1,..., T . Но даже такое упрощение
модели не позволяет ее построить по реализации временного ряда, т.к.
число оцениваемых характеристик T + T + T (T − 1) / 2 – величина
порядка Ο(T ) , тогда как длина временного ряда x1 ,..., xT равна T.
Для преодоления возникающей проблемы статистического оценивания
неизвестных характеристик используется специальный класс
ст ационарных случайных процессов, который является основой и для
построения более сложных моделей.
Различают стационарные процессы в узком и широком смысле.
2
Определение. Случайный процесс называется ст ационарным в
узком смысле (ст рого ст ационарным), если распределение любого
подмножества его значений xt1 ,..., xt m для любого множества
моментов времени
t1 ...t m , ∀m
является неизменным, т.е. если
В.И. Малюгин. Эконометрика – 2.
Страница 3
совместная функция распределения xt1 ,..., xt m совпадает с совместной
функцией распределения xt1 + k ,..., xt m + k для ∀t1 ...t m , m, k .
Если m = 1, то из строгой стационарности случайного процесса
следует, что любое его значение xt , определяемое функцией
распределения
F xt ( zt ) ,
не
зависит
от
времени,
т.е.
F xt ( zt ) = F ( z), zt , z ∈ ℜ1 , ∀t , а, следовательно, не зависят от времени и
моменты данного распределения:
E{xt } = µ x
(6.2)
– математическое ожидание, характеризующее средний уровень,
относительно которого совершают колебания значения временного
ряда;
(6.3)
D{xt } = σ x2
– дисперсия, характеризующая степень изменчивости (или
волатильность) значений временного ряда относительно ожидаемого
среднего значения.
Если m = 2, то из строгой стационарности случайного процесса
следует, что любые двумерные распределения его значений типа
( xt1 , xt 2 ), ( x0 , xt 2 −t1 ), ( xk , xt 2 −t1 − k ) не изменяются для ∀t1 , t 2 , k . К
свойствам постоянства дисперсии и математического ожидания (6.2),
(6.3) добавляется свойство независимости от момента отсчета для
ковариаций значений временного ряда разделенных временным лагом:
cov( xt1 , xt 2 ) = E{( xt1 − µ x )( xt 2 − µ x )} = ϕ k ,
(6.4)
где k = t 2 − t1 – лаг между анализируемыми моментами времени.
Из формулы (6.4) следует, что ковариация между значениями
рассматриваемого процесса зависит лишь от лага, на который отстоят
друг от друга рассматриваемые моменты, но не зависит от самих
моментов времени.
В.И. Малюгин. Эконометрика – 2.
Страница 4
Определение. Если случайный процесс {xt }, t = 1,..., T обладает
свойствами (6.2)–(6.4), то данный процесс называет ся ст ационарным
в широком смысле. Если хотя бы одно из условий (6.2)–(6.4)
нарушается, то случайный процесс (временной ряд) является
нест ационарным в соответствующем смысле.
Большая часть экономических и финансовых временных рядов
является нестационарными.
Если случайные величины x1 ,..., xT имеют нормальное
распределение, то ответствующий случайный процесс называется
гауссовским. В этом случае первый начальный и второй центральный
моменты полностью описывают модель временного ряда,
2
определяемую нормальным законом распределение N N (µ X , σ X ) ,
Однако, на практике случайные процессы, как правило, не являются
гауссовскими.
Для описания зависимости значений стационарных случайных
авт оковариационная
или
процессов
используются
авт окорреляционная
функция.
функции
Авт оковариационная
функция
Автоковариационная
и
част ная
авт окорреляционная
и
автокорреляционная функции.
ϕ k = cov( xt , xt − k ) характеризует
степень линейной зависимости значений случайного процесса,
отстоящих друг от друга на лаг k. При k = 0 получаем ϕ 0 = D{xt } .
В практических исследованиях используется авт окорреляционная
функция (АКФ) (нормированная автоковариационная функция: для
фиксированного значения лага – коэффициент корреляции
соответствующих значений временного ряда):
cov( xt , xt − k )
.
ρk =
D{xt }D{xt − k }
Для стационарного в широком смысле процесса D{xt } = D{xt − k } ,
поэтому:
cov( xt , xt − k ) ϕ k
(6.5)
ρk =
=
, k ≥ 1.
D{xt }
ϕ0
В.И. Малюгин. Эконометрика – 2.
Страница 5
Функция,
определяемая
формулой
(6.5)
характеризует
зависимость корреляции значений временного ряда от лага k;
ρ 0 = 1; ρ k = ρ − k .
Частная
АКФ
(ЧАКФ) является аналогом частного
коэффициента корреляции:
rk = corr ( xt , xt − k | xt −1 ...xt − k −1 ) ,
xt −1 ...xt − k −1 фиксированы; таким образом, ЧАКФ характеризует
степень линейной зависимости между xt , xt − k в предположении, что
где
промежуточные значения данного случайного процесса не оказывают
влияния на это корреляцию.
На практике истинные значения этих функций не известны,
поэтому используются выборочные оценки (ВАКФ и ВЧАКФ), в
частности:
ϕ
1 T
1 T
rk , ρ k = k , k ≥ 1; ϕ k = ∑ ( xt − x)( xt − k − x) , где x = ∑ xt .
ϕ
T
T
Графические
t = k +1
представления
коррелограммами.
t =1
данных
функций
называются
6.2. МОДЕЛИ АВТОРЕГРЕССИИ
6.2.1. ПРОЦЕСС БЕЛОГО ШУМА И ВОСПИТАТЕЛЬНЫ Е
ОПЕРАТОРЫ
Для описания стационарных в широком смысле временных рядов
используются модели авт орегрессии и скользящего среднего
(autoregressive and moving average models).
Источником случайности (инновационным процессом) в
указанных моделях является случайный процесс «белого шума».
Определение.
Последовательность
некоррелированных
(независимых), одинаково распределенных случайных величин {η t } ,
для которых E{η t } = 0, D{η t } = σ η2 < ∞ называется процессом белого
шума.
В.И. Малюгин. Эконометрика – 2.
Страница 6
Если {η t } ~ N 1 (0, σ η2 ) , то белый шум называется гауссовским, и
из некоррелированности случайных величин {η t } следует их
независимость, т.е.
cov(η t , ητ ) = E{η tητ } = 0, ∀t , τ = 1,..., T , t ≠ τ .
В общем случае, для негауссовских случайных величин, это свойство
не выполняется
Для компактной записи моделей временных рядов {xt} будем
пользоваться следующими операт орами.
•
Операт ор сдвига на один шаг назад L:
Lxt = xt–1.
Свойства оператора:
Ldxt = xt–d, d ≥ 1;
Lc = c; L(cxt) = cLxt; L(xt+yt) = Lxt+Lyt; (c1L+c2L)xt = c1Lxt +c2Lxt;
(6.6)
(1–cL)−1 = (1+cL+c2L2+...).
• Операт ор вычисления прост ых разност ей первого порядка ∆:
∆xt = xt−xt–1.
Разности порядка d ≥ 1 определяются рекуррентным образом с
помощью мет ода последоват ельного вычисления разност ей.
Очевидно, между операторами L и ∆ имеет место связь:
∆xt = (1−L)xt, ∆dxt = (1−L)dxt.
6.2.2. ОПРЕДЕЛЕНИЕ И УСЛОВИЯ СТАЦИОНАРНОСТИ
МОДЕЛИ АВТОРЕГРЕССИИ
Определение. Временной ряд {xt }, t = 1,..., T , описывается
моделью авт орегрессии порядка p≥1 (обозначается AR(p)), если
удовлетворяет стохастическому разностному уравнению вида:
В.И. Малюгин. Эконометрика – 2.
Страница 7
xt = α 0 + α 1 xt −1 + ... + α p xt − p + η t , t = 1,..., T ,
(6.7)
где {α l }, l = 0,..., p , – параметры модели, α 0 – свободный член,
{α l }, l = 1,..., p , – коэффициенты авторегрессии, x1− p ...x0 – начальные
значения временного ряда, {η t } – случайные ошибки наблюдений,
описываемые процессом белого шума.
Здесь p – порядок авторегрессии, который указывает на глубину
зависимости текущих значений временного ряда от его прошлых
значений.
Формула (6.7) допускает более компактное представление:
xt − α 1 xt −1 − ... − α p xt − p = α 0 + η t , t = 1,..., T ;
(1 − α 1 L − ... − α p LP ) xt = α 0 + η t ;
α( L) = 1 − α1 L − ... − α p Lp ,
(6.9)
α ( L) xt = α 0 + η t , t = 1,..., T .
(6.10)
Условие стационарности модели AR. Формулы (6.7) и (6.10) не
всегда описывают стационарные временные ряды, поэтому
формулируется условие стационарности моделей AR. Для его
определения используются т.н. характ ерист ические уравнения.
Существует
две
эквивалентные
формы
представления
характеристических уравнений.
Форма 1. Характеристическое уравнение
(6.11)
λ p − α 1λ p −1 − ... − α p −1λ − α p = 0 .
Уравнение степени p имеет p корней {λ l }, l = 1,..., p .
Условие ст ационарност и имеет вид:
(6.12)
λ l < 1, l = 1,..., p ,
т.е. характеристические корни уравнения (6.11) лежат внутри
единичного комплексного круга.
Форма 2. Характеристическое уравнение
1 − α 1 z − α 2 z 2 − ... − α p z p = 0 ,
В.И. Малюгин. Эконометрика – 2.
(6.13)
Страница 8
{zl }, l = 1,..., p
–
корни
характеристического
уравнения
(6.13),
zl = 1 / λ l .
Условие ст ационарност и имеет вид:
zl > 1, l = 1,..., p ,
т.е. характеристические корни уравнения (6.13) лежат вне единичного
комплексного круга.
Если эти условия нарушаются, то временной ряд не является
стационарным.
Можно показать, что если временной ряд {xt } ~ AR( p)
удовлетворяет условию стационарности, то имеет место следующее
выражение:
(6.14)
1 − α 1 − α 2 − ... − α p > 0 .
Теорема 6.1. Если временной ряд {xt } ~ AR( p) удовлетворяет
условиям стационарности, то для его характеристик справедливы
представления:
α0
= µx ;
1.
E{xt } =
2.
D{xt } = α 1ϕ 1 + α 2ϕ 2 + ... + α p ϕ p + σ η2 = σ x2 ;
1 − α 1 − ... − α p
3. автоковариационная функция имеет вид:
ϕ k = α 1ϕ t −1 + ... + α p ϕ k − p , k ≥ 1 .
Доказательство: Из формулы (6.10) следует, что
xt = α −1 ( L)α 0 + α −1 ( L)η t =
т.е. E{xt } =
α0
1 − α 1 − ... − α p
α0
1 − α 1 ( L) − ... − α p (l )
+ α −1 ( L)η t ,
.
Для вычисления дисперсии и ковариации используем
определение, предположим, что µ x = 0 , т.е. в (6.7) α 0 = 0 ;
ϕ k = cov( xt , xt − k ) = E{xt xt − k } = E{(α 1 xt −1 + ... + α p xt − p + η t ) xt − k } =
= α 1 E{xt −1 xt − k } + ... + α p E{xt − p xt − k } + E{η t xt − k } = α 1ϕ t −1−t + k + ... + ,
+ α p ϕ t − p −t + k + E{η t xt − k }
В.И. Малюгин. Эконометрика – 2.
Страница 9
таким образом,
α 1ϕ k −1 + ... + α p ϕ k − p , k ≥ 1, (т .к.E{η t xt − k } = 0)
ϕk =
2
2 .
α 1ϕ 1 + ... + α p ϕ p + σ η , k = 0, (т .к.E{η t xt } = σ η )
Все характеристики исследуемого временного ряда не зависят от
t, что является признаком стационарного процесса.
Следствие: ρ k =
ϕ0
, где ϕ 0 , ϕ k определены условиями теоремы.
ϕk
6.2.2. МОДЕЛЬ AR(1) И ЕЕ СВОЙСТВА
Модель AR(1) часто используется на практике.
{xt }, t = 1,..., T
описывается
моделью
Временной
ряд
авт орегрессии
порядка
1
(AR(1)),
если
удовлетворяет
стохастическому разностному уравнению вида:
xt = α 0 + α 1 xt −1 + η t , t = 1,..., T ,
(6.15)
где α 0 – свободный член, α 1 – коэффициент авторегрессии, x0 –
начальное значение временного ряда, {η t } – случайные ошибки типа
белого шума; xt − α 1 xt −1 = α 0 + η t ,
(1 − α 1 L) xt = α 0 + η t .
(6.16)
Условие ст ационарност и имеет вид: λ1 = α 1 < 1 .
(6.17)
Лемма 6.1. Если временной ряд {xt } ~ AR(1) удовлетворяет
условиям стационарности, то формула (6.15) имеет вид:
xt =
∞
α0
+ ∑ α 1iη t −i .
1 − α 1 i =0
(6.18)
Доказательство: Из формулы (6.16) следует:
α0
α0
+ (1 − α 1 L) −1η t =
+ (1 + α 1 L + α 1 L2 + ...)η t .
1 − α1
1 − α1
Теорема 6.2: Если временной ряд {xt } ~ AR(1) удовлетворяет
xt =
условиям стационарности, то имеют место характеристики:
1.
E{xt } =
α0
1 − α1
= µx ;
В.И. Малюгин. Эконометрика – 2.
Страница 10
2.
D{xt } = σ η2 /(1 − α 12 ) = σ x2 ;
3.
ϕ k = α 1k σ x2 , k ≥ 1 .
Доказательство: Выражение для математического ожидания
следует из леммы;
∞
D{xt } = σ η2 ∑ α 12i = σ η2 /(1 − α 12 ) = σ x2 ;
i =0
ϕ k = cov( xt , xt − k ) = E{( xt − µ x )( xt − k − µ x )} = E{η t + α 1η t −1 + ... +
+ η t − k + α 1η t − k −1 + α 12η t − k − 2 + ...} = E{(η t + α 1η t −1 + ... +
+ α 1k −1η t − k +1 ) + α 1kη t − k + α 1k +1η t − k −1 + ...)(η t − k + α 1η t − k −1 +
.
+ α 12η t − k − 2 + ...)} = α 1k σ η2 + α 1k + 2σ η2 + α 1k + 4σ η2 + ... = α 1k σ η2 ×
1.
× (1 + α 12 + ...)
Свойства АКФ, ЧАКФ для AR(1):
ρ k = α 1k , k = 1,2,...
Если 0 < α 1 < 1 , то при k → ∞ ⇒ ρ k → 0 , т.е автокорреляция с
увеличением лага убывает, причем убывание экспоненциально
быстрое.
Если −1 < α 1 < 0 , то при k → ∞ ⇒ ρ k → 0 , но это знакопеременное
убывание.
ρ , k = 1
2. rk = k
.
0, k > 1
В частном случае, когда имеет место процесс белого шума,
ρ k = 0, ∀k .
Указанные
свойства
используются
для
идентификации
случайного процесса.
В.И. Малюгин. Эконометрика – 2.
Страница 11
6.3. ОПРЕДЕЛЕНИЕ И УСЛОВИЯ ОБРАТИМОСТИ
МОДЕЛИ СКОЛЬЗЯЩЕГО СРЕДНЕГО MA(Q)
Определение. Временной ряд {xt }, t = 1,..., T , описывается
моделью скользящего среднего порядка q ≥ 1 (MA(q)), если его
значения получаются на основе случайного процесса белого шума по
формуле:
(6.19)
xt = µ + η t − γ 1η t −1 − ... − γ qη t − q , t = 1,..., T ,
где µ = E{xt } – среднее значение временного ряда, {γ l }, l = 1,..., q –
коэффициенты
скользящего
среднего,
η1− q ,..., η 0
начальные
–
значения процесса белого шума {η t } .
xt = µ + (1 − γ 1 L − ... − γ q Lq )η t = µ + γ ( L)η t , t = 1,..., T
(6.20)
Модель MA(q) для любых значений {γ l }, l = 1,..., q , описывает
стационарный процесс, т.е. не требуется дополнительных условий
стационарности. Однако, для нее вводятся условия обратимости,
которые позволяют получить ее представление в виде стационарной
AR-модели. Эти же условия необходимы для экономической
целесообразности модели. В то же время, любая модель AR(p) при
выполнении условий стационарности допускает представление в виде
∞
MA(∞): xt = µ + ∑ α 1iη t −i .
i =0
Свойство обратимости модели MA определяется аналогично
условию стационарности для AR-моделей.
Форма 1. Характеристическое уравнение
λ q − γ 1λ q −1 − ... − γ q −1λ − γ q = 0 .
(6.21)
Условие обрат имост и имеет вид:
λ l < 1, l = 1,..., q ,
(6.22)
т.е. характеристические корни уравнения (6.21) лежат внутри
единичного комплексного круга.
Форма 2. Характеристическое уравнение
(6.23)
1 − γ 1 z − γ 2 z 2 − ... − γ q z q = 0 ,
В.И. Малюгин. Эконометрика – 2.
Страница 12
Условие обрат имост и имеет вид:
zl > 1, l = 1,..., q ,
т.е. характеристические корни уравнения (6.23) лежат вне единичного
комплексного круга.
Теорема 6.3: Если временной ряд {xt } ~ MA(q) удовлетворяет
условиям обратимости, то его вероятностные характеристики
определяются соотношениями:
1. E{xt } = µ ;
2.
D{xt } = (1 + γ 12 + ... + γ q2 )σ η2 ;
(−γ k + γ 1γ k +1 + ... + γ q − k γ q )σ η2 , k ≤ q
.
0, k > q
Доказательство:1. Из формулы (6.19) следует выражение для
математического ожидания с учетом того, что E{η t } = 0, ∀t ;
3.
ϕk =
D{xt } = (1 + γ 12 + ... + γ q2 )σ η2 ;
ϕ k = cov( xt , xt − k ) = E{( xt − µ )( xt − k − µ )}; xt − µ = η t − γ 1η t −1 − ... − γ qη t − q ;
xt − k − µ = η t − k − γ 1η t − k −1 − ... − γ qη t − k − q ;
1.
Пусть k > q,
I 1 = {t − q − k,..., t − k}; I 2 = {t − q,..., t}, I 1 ∩ I 2 = ∅ ⇒ ϕ k = 0 .
I 1 ∩ I 2 ≠ ∅ ;выделим непересекающиеся
2. Пусть k ≤ q,
подмножества:
(6.24)
Подставим (6.24) в выражение для ковариации:
ϕ k = cov( xt , xt − k ) = −γ k E{η t2− k } + γ 1γ k +1 E{η t2− k −1 } + ... + γ q − k γ q E{η t2− q } =
= (−γ 1 + γ 1γ k +1 + ... + γ q − k γ q )σ η2 .
Следствие: Для модели MA(q)
− γ k + γ 1γ k +1 + ... + γ q − k γ q
,k ≤ q
;
ρk =
1 + γ 12 + ... + γ q2− k
0, k > q
В.И. Малюгин. Эконометрика – 2.
(6.25)
Страница 13
ρk =
ϕk
,где ϕ 0 = D{xt }.
ϕ0
Из формулы (6.25) следует , что автокорреляционная функция для
лагов, превышающих порядок модели, равна 0; коэффициент rk при
k → ∞ убывает монотонно или знакопеременно, достаточно быстро.
6.4. МОДЕЛЬ MA(1) И ЕЕ СВОЙСТВА
Временной ряд {xt }, t = 1,..., T описывается моделью скользящего
среднего порядка q = 1 (MA(1)), если его значения получаются на
основе белого шума по формуле:
(6.26)
xt = µ + η t − γ 1η t −1 , t = 1,..., T ,
∞
Лемма 6.2. xt = µ (1 + γ 1 + γ 12 + ...) − ∑ γ 1k xt − k + η t
(6.27)
Доказательство: Представим (6.26) в виде:
η t = − µ + xt + γ 1η t −1 , t = 1,..., T ,
(6.28)
k =1
вместо η t −1 подставим представление вида (6.28) и т.д., таким
образом, получаем:
η t = − µ + xt + γ 1 (− µ + xt −1 + γ 1 (− µ + xt − 2 + ...)) = − µ (1 + γ 1 + γ 12 + ...) +
+ xt + γ 1 xt −1 + γ 12 xt − 2 + ...
Записывая данную формулу относительно xt , получаем (6.27).
Следствие: Если модель MA(1) удовлетворяет условиям
обратимости, то xt =
∞
µ
− ∑ γ 1k xt − k + η t
1 − γ 1 k =1
(6.29)
Формула (6.29) описывает модель авторегрессии бесконечного
порядка, т.е. MA(1) ~ AR(∞).
Если предположить, что γ 1 ≥ 1 , то бесконечный ряд в (6.29)
расходится. С другой стороны, значения временного ряда, отстоящие
от текущего на больший временной интервал (лаг), будут оказывать
В.И. Малюгин. Эконометрика – 2.
Страница 14
большее влияние на текущие значения временного ряда, что
противоречит экономической целесообразности.
Теорема 6.4. Если временной ряд {xt } ~ MA(1) удовлетворяет
условиям обратимости, то имеют место характеристики:
1. E{xt } = µ ;
2.
D{xt } = (1 + γ 12 )σ η2 ;
3.
ϕk =
4.
−γ1
,k =1
.
ρ k = 1 + γ 12
0, k > 1
− γ k σ η2 , k = 1
0, k > 1
;
6.5. МОДЕЛЬ АВТОРЕГРЕССИИ СКОЛЬЗЯЩЕГО
СРЕДНЕГО ARMA (P,Q)
6.5.1. УСЛОВИЯ СТАЦИОНАРНОСТИ И ОБРАТИМОСТИ
Определение. Временной ряд {xt }, t = 1,..., T , описывается
моделью авт орегрессии скользящего среднего порядка p и q; p, q ≥ 1
(ARMA(p, q)), если
xt−α1xt–1−α2xt–2−...−αpxt–p=α0+ηt−γ1ηt–1−γ2ηt–2−...−γqηt–q, t = 1, 2, ... , (6.30)
или:
α(L)xt = α0+γ(L)ηt,
(6.31)
В соотношении (6.31) полагается:
α(L) ≡ (1 −α1L −α2L2 −...−αpLp), γ(L) ≡ (1 −γ1L −γ2L2 −...−γqLq), (6.32)
где: {αl}(l = 1, 2, ... , p), {γk} (k = 1, 2, ... , q) − параметры модели; x1–p,
x2–p, ... , x0, η1–q, η2–q, ... , η0 − начальные условия.
Модель ARMA(p, q) получается как комбинация двух моделей
временных рядов: модели авторегрессии AR(p) (q = 0) и модели
В.И. Малюгин. Эконометрика – 2.
Страница 15
скользящего среднего MA(q) (p = 0). Условиями стационарности и
обратимости модели ARMA(p, q) являются соответствующие условия
для ассоциированных с ней моделей AR(p) и MA(q). Таким образом,
модель АRМA(p, q) описывает ст ационарный случайный процесс и
является обрат имой, если выполняются следующие условия.
Условие ст ационарност и: все корни {λl} (l = 1, 2, ... , p)
характеристического уравнения
λp−α1λp–1 − ... −αp–1λ−αp = 0
(6.33)
лежат внутри единичного круга, т. е.
λl<1, l = 1, 2, ... , p.
(6.34)
Условие обрат имост и: все корни {λl} характеристического
уравнения
λq−γ1λq–1 − ... −γq–1λ−γq = 0
(6.35)
лежат внутри единичного круга, т. е. λk< 1 для всех k = 1, 2, ... , q.
6.5.2.
МОДЕЛЬ ARMA(1,1) И ЕЕ СВОЙСТВА
На практике часто p, q ∈{0, 1, 2}. В частном случае, при p = q =1,
из (6.30) получаем представление для модели ARMA(1, 1):
xt −α1xt–1 = α0 + ηt −γ1ηt–1, t = 1, 2, ... .
вид:
(6.36)
α ( L) = 1 − α 1 ( L); γ ( L) = 1 − γ 1 ( L) , тогда формула (6.36) принимает
(1 − α 1 ( L)) xt = α 0 + (1 − γ 1 ( L))η t .
(6.37)
Условие ст ационарност и модели ARMA(1,1) имеет вид: | α 1 |< 1 ;
условие обрат имост и: | γ 1 |< 1 .
Теорема 6.5: Если для модели ARMA(1,1) выполняются условия
стационарности и обратимости, то данная модель допускает
представление в виде MA(∞):
xt =
∞
α0
+ (α 1 − γ 1 ) ∑ α 1k −1η t − k + η t
1 − α1
k =1
(6.38)
xt =
∞
α0
+ (α 1 − γ 1 ) ∑ γ 1k −1 xt − k + η t .
1−γ1
k =1
(6.39)
и в виде AR(∞):
Доказательство:1. Докажем (6.38):
В.И. Малюгин. Эконометрика – 2.
Страница 16
α0
α0
+ (1 − α 1 L) −1 (1 − γ 1 L)η t =
+ (1 + α 1 L + α 12 L2 + ...) ×
1 − α1
1 − α1
∞
∞
α0
α0
× (η t − γ 1η t −1 ) =
+ ∑ α 1k Lkη t − ∑ γ 1α 1k Lkη t −1 =
+
1 − α 1 k =0
1 − α1
k =0
.
∞
∞
∞
∞
α0
k
k
k
k
+ ∑ α 1 η t − k − γ 1 ∑ α 1 η t − k −1 =
+ ∑ α1 ηt −k − γ 1 ∑ α1 ηt −k + ηt =
1 − α 1 k =1
k =0
k =0
k =1
∞
α0
=
+ (α 1 − γ 1 ) ∑ α 1k −1η t − k + η t
1 − α1
k =1
xt =
Теорема 6.6: В условиях теоремы 6.5.
{xt }, t = 1,..., T имеет следующие характеристики:
1.
E{xt } =
2.
D{xt } =
3.
ρ1 =
временной
ряд
α0
;
1 − α1
(1 − 2α 1γ 1 + γ 12 )
1 − α 12
σ η2 ;
(α 1 − γ 1 )(1 − 2α 1γ 1 )
2α 1γ 1 + γ 12
; ρ k = ρ k −1 ⋅ α 1 = α 1k ρ 1 .
1−
Доказательство: Формулы для математического ожидания и
дисперсии следуют из (6.38):
∞
∞
D{xt } = (α 1 − γ 1 ) 2 ∑ α 12( k −1)σ η2 + σ η2 = (α 1 − γ 1 ) 2 ( ∑ α 12 k + 1)σ η2 =
k =1
(
(α 1 − γ 1 )
2
+ 1)σ η2 = (
k =0
α 12
−
2α 1γ 1 + γ 12
1 − α 12
+ 1 − α 12
)σ η2 =
(1 − 2α 1γ 1 + γ 12 )
σ η2 .
1 − α 12
1 − α 12
Докажем утверждение относительно коэффициента корреляции:
ϕ k = cov( xt , xt − k ) = E{(α 1 xt −1 + α 0 + η t − γ 1η t −1 ) xt −1 } = α 1 D{xt } +
(6.40)
+ α 0 E{xt −1 } − γ 1E{η t −1 xt −1 }.
Считаем,
что
в
(6.40)
E{xt } = 0, α 0 = 0, E{η t xt −1 } = 0 ,
xt −1 = α 1 xt − 2 + α 0 + η t −1 − γ 1η t − 2 .Аналогично E{η t −1 xt −1 } =
где
E{η t2−1 } = σ η2 ,
тогда из (6.40) следует, что ϕ 1 = α 1ϕ 0 − γ 1σ η2 ; ϕ 0 = D{xt } ;
В.И. Малюгин. Эконометрика – 2.
Страница 17
ϕ k = α 1ϕ k −1= α 1k ϕ k −1 .
Следствие:
Автокорреляционная
функция
ARMA(1,1) допускает представление:
ARMA
= ϕ 1AR + ϕ 1MA
ϕ 1
.
ϕ k = α 1k ϕ 1 , k ≥ 1
для
модели
АКФ для модели ARMA(1,1) принимает фиксированное значение
ρ1 для первого лага ; при k → ∞ ⇒ ρ k → 0; | α 1 |< 1 . Характер
убывания данной функции зависит от знака α 1 : при α 1 < 1
монотонное убывание, при α 1 > 1 знакопеременное убывание.
ЧАКФ для модели ARMA(1,1) убывает от r1 = ρ 1 , k → ∞ , причем
характер убывания противоположен характеру убывания АКФ.
6.6 ПОСТРОЕНИЕ МОДЕЛЕЙ АВТОРЕГРЕССИИ И
СКОЛЬЗЯЩЕГО СРЕДНЕГО
Методология построения моделей типа ARMA(p, q) известна как
методология Бокса – Дженкинса [4] и предусматривает выполнение
следующих трех этапов: идентификация модели, оценивание
параметров, тестирование адекватности. Перечислим основные
типы исследований, проводимые на каждом из указанных этапов.
Тестирование адекватности основано на анализе тестовых
статистик и статистической проверке гипотез относительно
параметров тестируемой модели. Адекватная модель должна обладать
следующими свойствами.
1. Оценки параметров модели должны быть статистически
значимыми, т. е. соответствующие Р–значения t–статистик должны
быть меньше выбранного порогового значения.
2. Остатки построенной модели должны быть «белым шумом»,
т. е. быть некоррелированными. При этом сумма квадратов остатков
(sum of squared residuals − RSS) может служить одним из критериев
выбора модели.
Для установления второго свойства может использоваться:
− визуальный анализ графиков остатков, а также ВАКФ и
ВЧАКФ;
В.И. Малюгин. Эконометрика – 2.
Страница 18
− асимптотический тест значимости значений АКФ, основанный
на нормальном приближении тестовой статистики: значения АКФ
считаются статистически значимыми на уровне значимости ε = 0,05,
если выходят за границы соответствующего доверительного
интервала;
− тест для проверки гипотезы об отсутствии автокорреляции
значений временного ряда {xt} на заданном лаговом диапазоне,
включающем K > 1 лагов, с помощью Q–статистики Льюнга −
Бокса 1, рассчитываемой на основании значений ВАКФ {ρ k } по
формуле:
K
Q = T (T + 2)∑ ρ 2k / (T − k ) .
k =1
Распределение Q–статистики (при условии, что верна нулевая
гипотеза об отсутствии автокорреляции значений временного ряда, на
заданном лаговом диапазоне) асимптотически при Т→∞ приближается
к хи–квадрат распределению с ν = K − q степенями свободы, где q −
число AR– и МА–компонентов в построенной модели временного
ряда.
Таким образом, если Q ≥ ∆(ε) (где ∆(ε) − критическое значение
статистки, равное квантили уровня 1–ε хи–квадрат распределения с ν
степенями свободы), то нулевая гипотеза об отсутствии
автокорреляции отклоняется.
3. Распределение остатков должно быть нормальным, т. е.
остатки должны быть гауссовским белым шумом. Заметим, что
данное свойство важно при тестировании моделей по коротким
временным рядам. Для проверки гипотезы Н0 о нормальном
распределении остатков могут использоваться различные тесты,
например критерий согласия Пирсона, тест Жака − Бера
(Jarque−Bera’s − JB test) [39].
JB–тест основан на проверке статистической значимости
расхождения фактических значений коэффициентов асимметрии и
эксцесса и ожидаемых для нормального распределения значений
данных характеристик.
1
Liung G., Box G. On a measure of lack of fit in time series models// Biometrica. № 65. 1978.
P. 297−303.
В.И. Малюгин. Эконометрика – 2.
Страница 19
Тестовая статистика вычисляется по формуле:
JB =
T −m 2
S + K2 /4 ,
6
(
)
где S и K − соответственно коэффициенты асимметрии и эксцесса для
ряда остатков, m − число оцениваемых параметров в тестируемой
модели временного ряда. Если гипотеза Н0 верна, то статистика JB
имеет хи–квадрат распределение с двумя степенями свободы.
4. Модель «долж на быт ь наиболее прост ой из возмож ных
альт ернат ивных моделей». Это требование основано на «принципе
экономност и» (principle of parsimony): из двух моделей, признанных
по результатам тестирования на одном и том же наборе данных
адекватными, лучшей считается модель с меньшим числом
параметров, т. е. с меньшими значениями p и q. Для выбора наиболее
«экономичной» модели могут использоваться AIC–статистика Акаике
(Akaike information criterion) и SC–статистика Шварца (Schwartz
criterion), определяемые по формулам [47]:
RSS 2m
AIC = ln
,
+
T T
RSS m
SC = ln
+ ln (T ),
T T
где RSS − сумма квадратов остатков (sum of squared residuals), m −
число оцениваемых параметров, включая свободный член, т.е. m = p +
q + δ (δ = 1, если используется модель со свободным членом, δ = 0 в
противном случае). В соответствии с данными критериями следует
выбирать модели с меньшими значениями статистик AIC и SC.
Наличие автокорреляции остатков может быть следствием как
неадекватности модели (например, вследствие ошибок в определении
параметров p и q) так и сезонных изменений временного ряда. В
последнем случае возникает потребность в построении сезонной
ARMA–модели.
В.И. Малюгин. Эконометрика – 2.
Страница 20
Практические рекомендации
Приведем некоторые практические рекомендации по проблемам,
возникающим при построении моделей ARMA. Более подробное
изложение данных проблем приводится в других разделах учебного
пособия.
1. При обнаружении признаков «безусловной» гетероскедастичности
целесообразно
осуществить
соответствующее
функциональное преобразование временного ряда. Например, при
относительно
монотонном
увеличении
дисперсии
остатков
необходимо
осуществить
логарифмическое
преобразование
временного ряда.
2. Если временной ряд остатков включает периоды с относительно
высокой и относительно малой дисперсией, то следует рассмотреть
возможность построения модели ARMA с остатками в виде ARCH или
GARCH.
3. Если построенная модель ARMA(p, q) не является «экономной»
вследствие того, что p, q принимают неоправданно большие значения,
то это может быть причиной мультиколлинеарности и
чувствительности модели к исключению отдельных AR– или МА–
компонент модели.
В.И. Малюгин. Эконометрика – 2.
Страница 21
ГЛАВА 7
МОДЕЛИ И МЕТОДЫ АНАЛИЗА
НЕСТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ
7.2. ТИПОВАЯ СТРУКТУРА МОДЕЛИ
ЭКОНОМИЧЕСКОГО ВРЕМЕННОГО РЯДА
Общая структура модели экономического временного ряда xt≡x(t)
(t=1,2,…,Т), учитывающая основные типовые признаки, может быть
представлена в виде [2, 5]:
x(t) = f(t)+c(t)+s(t)+b(t)+ζ(t).
(1)
Компоненты (составляющие) модели временного ряда (1)
отражают различные особенности изменения его основных
характеристик и имеют следующую интерпретацию: f(t) − трендовая
составляющая, описывающая долгосрочную тенденцию изменения
основных характеристик временного ряда; c(t) − циклическая
составляющая,
отражающая
долгосрочные
и
относительно
нерегулярные циклические изменения; s(t) − сезонная составляющая,
описывающая сезонные изменения характеристик временного ряда в
течение года; b(t) – компонента модели, позволяющая учесть
структурные изменения, обусловленные шоковыми воздействиями
или изменением экономических условий; ζ(t) − случайная (остаточная)
составляющая, обусловленная нерегулярными случайными изменениями.
Компоненты f(t), c(t), s(t), b(t) модели временного ряда
обуславливают изменения его среднего значения и (или) дисперсии.
Поэтому классифицируются как «нестационарные составляющие
модели».
Циклическая составляющая c(t), не может быть идентифицирована
по коротким временным рядам, описывающим переходные процессы.
Ее присутствие, однако, отражается на форме трендовой
составляющей.
В.И. Малюгин. Эконометрика – 2.
Страница 1
Сезонные эффекты могут быть выявлены и учтены на этапе
идентификации остаточной составляющей модели, получаемой после
исключения трендовой составляющей.
Если построенная модель временного ряда адекватно учитывает
все присущие ей «типовые признаки» (тренд, циклические, сезонные и
структурные изменения), то «остаточная» случайная составляющая
модели ζ(t) должна описываться моделью стационарного временного
ряда ARMA. Учет автокорреляции в такой модели с помощью
введения лаговых переменных либо оценивания модели с добавлением
компонент AR и MA. Для адекватной модели остатки в итоги должны
быть гауссовским белым шумом. В противном случае модель не
может быть признана адекватной.
Детерминированные и стохастические тренды. Возможность
учета с помощью трендовой составляющей характера изменений
среднего значения временного ряда зависит от типа тренда.
Можно рассматривать два альтернативных варианта типов
трендов:
• детерминированный тренд f(t)≡fD(t);
• стохастический тренд f(t)≡fR(t).
Предположение о наличии детерминированных трендов в
макроэкономических временных рядах часто формально используется
в практических исследованиях. Однако предположение о том, что
тренд не меняется с течением времени, может быть оправдано лишь
при выполнении, по крайней мере, двух редко встречающихся на
практике условий:
•
воздействия различной силы на экономические процессы не
вызывают каких-либо долгосрочных эффектов, имеют место
только временные эффекты, которые приводят к частым
симметричным
случайным
отклонениям
от
тренда,
описываемым стационарным процессом.
Как показывают специально проведенные исследования [4],
модель с детерминированным трендом не годится для описания
многих макроэкономических и финансовых показателей, поскольку
для них характерно свойство «сохранения эффекта после устранения
причины», т.е. высокая степень инерционности или «длинная память».
В.И. Малюгин. Эконометрика – 2.
Страница 2
Проблема установления типа тренда решается с помощью
статистических методов, однако, не является чисто статистической.
Последствия неправильной идентификации типа нестационарности
порождает серьезные концептуальные проблемы на этапе исследования и интерпретации зависимостей между экономическими
переменными на основе регрессионных моделей, моделей векторной
авторегрессии и систем одновременных уравнений [5]. Другой тип
ошибок связан с попытками интерпретировать стохастические тренды
как возрастающие или убывающие детерминированные тренды.
7.2. КЛАССИФИКАЦИЯ МОДЕЛЕЙ
НЕСТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ
Значительная часть экономических и финансовых временных
рядов является нестационарными (см. рис. 7.1), т.е. их характеристики
зависят от времени. Различают два класса нестационарных временных
рядов: нестационарные по среднему значению и по дисперсии.
Временной ряд {xt } нестационарный по среднему значению, если
E{xt } = µ x ,t , т.е. зависит от времени, изменяется в соответствии с
некоторым детерминированным и вероятностным законом, что
приводит к двум разновидностям нестационарных временных рядов: с
детерминированным и со стохастическим трендом.
Временной ряд {xt } – нестационарный по дисперсии, если его
дисперсия зависит от времени, т.е.
D{xt } = σ x2,t ,
(7.1)
В этом случае говорят, что имеет место безусловная
гетероскедастичность.
Наряду с безусловной гетероскедастичностью может иметь место
условная гетероскедастичность. При этом временной ряд является
стационарным по среднему значению, а его безусловная дисперсия не
зависит
от
времени,
т.е.
имеет
место
безусловная
гетероскедастичность. Для описания стационарных временных рядов
В.И. Малюгин. Эконометрика – 2.
Страница 3
с условной гетероскедастичностью используются модели ARCH,
GARCH и их модификации.
Модели временных рядов, нестационарных по среднему
значению и содержащих стохастический тренд называют моделями
единичного корня (unit root models). Широкий класс подобных моделей
известен как модели ARIMA.
Модели временных рядов
Модели стационарных
временных рядов
ARMA
Модели нестационарных
временных рядов
Модели с
детерминированным
трендом
ARCH,
GARCH
Модели со
стохастическим
трендом
UR
Линейные
детерминирован
ные тренды
Нелине
йные
тренды
Внутрилинейные
детерминированны
е тренды
ARIMA
Модели
коинтегрирован
ных временных
рядов
Рис. 7.1. Типы моделей временных рядов
В.И. Малюгин. Эконометрика – 2.
Страница 4
7.3. МЕТОДЫ ПОСТРОЕНИЯ МОДЕЛЕЙ
ВРЕМЕННЫХ РЯДОВ С
ДЕТЕРМИНИРОВАННЫМИ ТРЕНДАМИ
Временной ряд {xt } описывается моделью с детерминированным
трендом, если
xt = f (t , β ) + ηt , t = 1,..., T ,
где
{ηt }
–
случайный
процесс
ошибок
(7.2)
наблюдения,
E{η t } = 0, D{η t } = σ η2 = const , {ηt } – стационарный процесс, f (t , β ) –
заданная с точность до параметра β ∈ ℜ m , m ≥ 1 детерминированная
функция времени, которая называется функцией тренда, она
описывает монотонные изменение среднего значения E{xt } = f (t , β )
во времени.
Частный случай модели (7.2) – модель с полиномиальным
трендом:
m
) β0 + ∑ βl t l ,
f (t , β=
(7.3)
l =1
С учетом (7.3) формула (7.2) принимает вид
m
xt = ∑ β l t l + η t , t = 1,..., T .
l =1
Производя замену переменных ztl = t l , l = 1,..., m , получаем ОЛСМ
m
xt = β 0 + ∑ β l ztl + ηt .
(7.4)
l =1
Модель (7.4) описывает общую линейную статистическую модель
с m факторами. Если временной ряд на самом деле описывается
моделью с детерминированным трендом, то остатки построенной
модели являются стационарным временным рядом.
В.И. Малюгин. Эконометрика – 2.
Страница 5
Построение модели с детерминированным трендом состоит из
трех этапов:
1)
спецификация параметрической функции тренда и оценивание
ее параметров (например, параметров регрессионного
представления (7.4)) и вычисление временного ряда остатков;
2)
тестирование статистической значимости оценок параметров
на основе t-теста значимости и F-теста адекватности модели в
целом;
3)
анализ остатков построенной модели, используются: анализ и
тестирование ВАКФ, ВЧАКФ, критерии согласия (хи- квадрат
Пирсона и Жака–Бера и др.).
Если остатки проявляют свойство коррелированности, то в
модель могут быть включены AR и MA компоненты.
Результирующие остатки должны быть белым шумом. Если этого
не удается достигнуть, то можно:
1) изменить спецификацию функции тренда;
2) добавить AR и MA компоненты;
3) ввести фиктивные переменные для описания сезонных и
структурных изменений.
Определение. Временные ряды, описываемые моделями с
детерминированным
трендами
называются
стационарными
относительно детерминированного тренда (trend stationary models),
используется обозначение – TS-модели.
7.4. ПОСТРОЕНИЕ И АНАЛИЗ МОДЕЛИ
АВТОРЕГРЕССИИ ИНТЕГРИРОВАННОГО
СКОЛЬЗЯЩЕГО СРЕДНЕГО ARIMA
Существует альтернативный тип нестационарных временных
рядов. которые можно привести к стационарному виду с помощью
операции «дифференцирования», т.е. путем взятия конечных
разностей определенного порядка.
В.И. Малюгин. Эконометрика – 2.
Страница 6
Определение. Временных рядов, которые можно привести к
стационарному виду с помощью операции взятия конечных разностей
определенного порядка d называются «стационарными относительно
взятия разностей» (difference stationary time series – DS models), или
интегрированными временными рядами (integrated time series I(d)).
Широкий класс моделей интегрированных временных рядов
известен как класс моделей авторегрессии интегрированного
скользящего среднего (autoregressive integrated moving average models
− ARIMA model), предложенный Дж. Боксом и Дж. Дженкинсом.
Дадим краткую характеристику свойств и методов построения
моделей данного типа.
Определение. Нестационарный случайный процесс {xt}
называется интегрированным порядка d ≥ 1 (integrated of order d), если
случайный процесс разностей ∆dxt – стационарный, т. е. если операция
вычисления разностей порядка d приводит нестационарный
случайный процесс xt к стационарному виду впервые при данном
значении порядка разностей. Для интегрированного порядка d
случайного процесса будем использовать обозначение I(d).
Через I(0) будем обозначать стационарный случайный процесс,
который
в
результате
однократного
«суммирования»
(«интегрирования») превращается в процесс типа I(1).
На использовании понятия «интегрированный случайный процесс»
основывается определение модели ARIMA.
Определение. Говорят, что нестационарный временной ряд {xt}
описывается моделью авторегрессии интегрированного скользящего
среднего ARIMA(p, d, q), если временной ряд {xt} является
интегрированным порядка d ≥ 1, а случайный процесс ∆dxt является
стационарным и описывается моделью ARMA(p, q).
Таким образом, с учетом обозначения (5.6) модель ARIMA(p, d, q)
может быть представлена в виде:
α (L)∆dxt = θ0+γ(L)ηt,
В.И. Малюгин. Эконометрика – 2.
(7.5)
Страница 7
где {ηt} − процесс «белого шума». Вводя обозначение wt ≡ ∆dxt, из (7.5)
получаем более удобное для вычисления прогнозов представление
модели ARIMA(p, d, q):
wt = α1wt–1 + α2wt–2+ ... +αpwt–p + θ0 +
+ ηt − γ1ηt–1−γ2ηt–2− ... −γqηt–q, t = 1, 2, ... .
(7.6)
Пример. Модель ARIMA(0, 1, 1).
Рассмотрим процесс ARMA(1, 1) вида
xt − α1xt–1 = α0 + ηt − γ1ηt–1, t = 1, 2, ... .
(7.7)
Если в (7.6) положить, что α1→1, то в пределе имеет место процесс
{wt} вида:
wt ≡ ∆xt = α0 + ηt −γ1ηt–1.
(7.8)
Согласно (7.8) случайный процесс {wt} первых разностей временного
ряда {xt} описывается моделью MA(1), т. е. является стационарным.
Предельный процесс {xt} описывается моделью ARIMA(0, 1, 1) и
является результатом применения операции «интегрирования», или
«суммирования» (обратной к операции взятия разностей), процесса
скользящего среднего {wt}, что дает основание говорить о нем как о
процессе «интегрированного скользящего среднего».
Заметим, что характеристическое уравнение модели содержит
единичный корень (λ1 = α1 = 1), т. е. данный процесс относится к
классу «процессов единичного корня».
Построение модели ARIMA
Процесс построения модели ARIMA включает два этапа:
1) определения порядка d интегрируемости нестационарного
временного ряда {xt} и получения временного ряда разностей wt = ∆dxt;
2) подбор наилучшей модели для стационарного временного ряда
разностей {wt} в классе моделей типа ARMA.
На первом этапе для проверки стационарности временного ряда и
определения порядка d интегрируемости для нестационарного
временного ряда используются тесты «единичного корня». На втором
В.И. Малюгин. Эконометрика – 2.
Страница 8
этапе для построения и выбора модели ARMA используется
методология Бокса – Дженкинса.
7.5. ОСОБЕННОСТИ ПОСТРОЕНИЯ СЕЗОННОЙ
МОДЕЛИ ARIMA
Многие экономические временные ряды подвержены сезонным
колебаниям, т. е. содержат регулярную сезонную составляющую,
отражающую сезонные изменения (сезонный рост или сезонное
снижение) анализируемого показателя. Период сезонности s обычно
считается известным. Так, s = 4 для квартальных и s = 12 − для
месячных временных рядов. В случае сезонных временных рядов
методология Бокса – Дженкинса в целом остается без изменений.
Однако включает дополнительный этап, целью которого является
обнаружение и исключение сезонных эффектов, т. е. приведение
временного ряда к виду, пригодному для построения модели в виде
ARMA.
Для исключения «сильной» сезонности (strong seasonality), т. е. ярко
выраженной и достаточно регулярной сезонности с периодом
сезонности s используется процедура взятия сезонной разности
(seasonal difference) порядка s, которая для временного ряда xt
определяется следующим образом:
(1–Bs)xt = xt – xt–s.
Реальные экономические ряды часто представляют собой комбинации
сезонных и трендовых компонент. Приведение подобных временных
рядов к стационарному виду требует исключения тренда. Как
известно, у нестационарных интегрированных временных рядов I(d)
тренд исключается с помощью взятия простых разностей порядка d.
Результат исключения сезонности с периодом s после взятия простой
разности порядка d (d ≥ 1) по отношению к временному ряду {xt}
определяется соотношением:
yt ≡ (1–Bs)(1–B)dxt .
Для d=1 имеем:
В.И. Малюгин. Эконометрика – 2.
Страница 9
yt = (1–Bs)(xt – xt–1) = xt – xt–1 – xt–s – xt–s–1.
Если порядки сезонной и простой разности определены правильно, то
есть основание предполагать, что результирующий временной ряд {yt}
описывается
моделью
ARMA(p,q),
построение
которой
осуществляется в соответствии с методологией Бокса – Дженкинса.
Исходный временной ряд {xt} при этом удовлетворяет сезонной
модели ARIMA(p, d, q).
Учет сезонности путем взятия сезонных разностей не всегда позволяет
исключить все сезонные эффекты. Для их описания в ARMA-модели
результирующего временного ряда {yt} могут использоваться два типа
моделей сезонностей:
− аддитивная сезонность;
− мультипликативная сезонность.
Тип модели устанавливается при помощи анализа ВАКФ и ВЧАКФ.
На практике обычно рассматриваются альтернативные варианты
моделей. Выбор лучшего из них осуществляется в соответствии с
принципом экономности модели на основе методологии Бокса –
Дженкинса.
В рамках модели аддитивной сезонности в ARMA-модель для {yt}
добавляются AR- и MA-компоненты с соответствующими лагами.
Модель мультипликативной сезонности принимает во внимание
взаимодействие ARMA-модели и сезонных эффектов.
Приведем примеры ARMA-модели с сезонными эффектами. Пусть
{yt} − стационарный временной ряд, для описания которого без учета
сезонных эффектов может быть принята модель ARMA(1, 1),
определяемая соотношением:
(1 – α1B)yt = (1 – γ1B)ηt.
В тоже время анализ ВАКФ и ВЧАКФ говорит о наличии сезонных
эффектов для некоторых лагов. Опишем некоторые возможные
варианты моделей временного ряда для различных типов моделей
сезонностей.
В.И. Малюгин. Эконометрика – 2.
Страница 10
Модели
аддитивной
сезонности.
Если
единственным
статистически значимым значением АКФ или ЧАКФ является
значение, соответствующее лагу r или s, то целесообразно добавить в
модель сезонный МА-компонент порядка r или сезонный ARкомпонент порядка s соответственно. Результатом таких модификаций
будут следующие модели:
AS.1. Добавление отдельного AR-компонента для лага s:
(1 − α1B)yt = αsyt–s + (1 − γ1B)ηt;
AS.2. Добавление отдельного MA-компонента для лага r:
(1 − α1B)yt = (1 − γ1B)ηt − γrηt–r. 1
Модели мультипликативной сезонности. Наличие сезонных
эффектов, проявляющееся в статистически значимых значениях АКФ
или ЧАКФ, кратных соответственно r или s, может быть учтено при
использовании сезонного скользящего среднего порядка r (модель
MS.1) или сезонной авторегрессии порядка s (модель MS.2):
MS.1
(1 − α1B)yt = (1 − γ1B)(1 − γrBr)ηt;
MS.2
(1 − α1B)(1 − αsBs)yt = (1 − γ1B)ηt.
Использование мультипликативной сезонности предпочтительнее в
смысле принципа экономности модели. Так, например, сравним две
альтернативные модели: модель мультипликативной сезонности MS.1
и модель АS.2′, которая учитывает тот же сезонный эффект путем
добавления МА-компонент для лагов r и r+1:
MS.1
yt = α1yt–1 + ηt − γ1ηt–1 − γrηt–r + γ1γrηt–r–1;
АS.2′
yt = α1yt–1 + ηt − γ1ηt–1 − γrηt–r − γr+1ηt–r–1.
В случае модели MS.1 достаточно оценить три коэффициента (α1, γ1,
γr), поскольку γr+1=γ1γr, в то время как построение модели АS.2′
требует оценивания четырех коэффициентов (α1, γ1, γr и γr+1).
1
Знак «−» перед коэффициентом скользящего среднего γr используется для сохранения
принятого в учебном пособии представления для моделей скользящего среднего.
В.И. Малюгин. Эконометрика – 2.
Страница 11
7.6. ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ НА
ОСНОВЕ МОДЕЛИ ARIMA
Одной из целей разработки эконометрических моделей является
прогнозирование значений экономических переменных. Опишем
процесс построения прогнозов.
Пусть временной ряд {xt } описывается моделью ARIMA (p,d,q);
α ( L)∆d xt = α 0 + γ ( L)ηt , t = 1,..., T .
(7.9)
Рассмотрим задачу прогнозирования значения временного ряда
{xt } для будущих моментов времени T+1,T+2,… на основе
информации имеющейся к моменту времени T: FT = {xT , xT −1 ,...} .
Будем
использовать
прогнозы
в
виде
условного
математического ожидания для будущих значений временного ряда
при условии, что имеется информация FT . Прогнозные значения
будем обозначать fT ,h , h = 1,..., H , где H – горизонт прогнозирования.
Тогда
=
fT + h E{xT + h | FT }, H ≥ 1.
(7.10)
Если h = 1, то имеют место одношаговые прогнозы, при h > 1 –
многошаговые прогнозы.
Известно, что прогнозы в виде условного математического
ожидания минимизируют среднеквадратическую ошибку прогноза
(mean square error – MSE):
MSE =
E{( fτ − xτ ) 2 | FT }, ∀τ .
Получим представление для прогнозной функции с учетом вида
модели (7.9). Введем вспомогательный полином:
δ ( L) = α ( L)∆ d = (1 − α1 L − α 2 L2 − ... − α p Lp )(1 − L) d =
=1 − δ1 L − δ 2 L2 − ... − δ p + d Lp + d .
(7.11)
С учетом (7.11) на основании (7.9) получаем
В.И. Малюгин. Эконометрика – 2.
Страница 12
δ ( L) xT +h = α 0 + γ ( L)ηT +h ,
где
δ1 xT + h −1 + δ 2 xT + h − 2 + ... + δ p + d xT + h − p − d + α 0 + ηT + h −
x=
T +h
−γ 1ηT + h −1 − ... − γ qηT + h − q , h =
1,..., H .
(7.12)
Для построения прогнозной функции воспользуемся формулой
fT + h = E{xT + h | FT } .
Используя (7.12), получаем формулы:
xT + j , j ≤ 0
η , j ≤ 0
.
=
E{xT + j | FT } =
, E{ηT + j | FT } T + j
>
f
j
,
0, j > 0
T+ j
(7.13)
Формулы (7.12), (7.13) используются для построения прогнозных
значений.
Пример1. Пусть временной ряд {xt } описывается моделью AR(2),
тогда
(1 − α1 L − α 2 L2 ) xT +h = α 0 + ηT +h , h = 1,..., H ,
xT + h = α1 xT + h−1 + α 2 xT + h−2 + ηT +h , h = 1,..., H .
Рассмотрим 2 случая:
1. Одношаговый прогноз: h = 1
E{xT +1 | FT } =
fT +1 =
α 0 + α1E{xT | FT } + α 2 E{xT −1 | FT } + E{ηT +1 | FT } =
=
α1 xT + α 2 xT −1 + α 0 .
2. h = 2
fT + 2 = α1 fT +1 + α 2 xT + α 0 ,
fT + h =α1 fT + h −1 + α 2 fT + h − 2 + α 0
В.И. Малюгин. Эконометрика – 2.
Страница 13
α
Если h → ∞ , то fT + h → E{xt } =0
.
1 − α2 − α2
Пример2. Пусть временной ряд {xt } описывается моделью
ARIMA(0,1,1), тогда
xT +h = xT +h−1 + α 2 xT +h−2 + ηT +h − γ 1ηT +h−1 , h = 1,..., H .
Для h = 1
| FT } E{xT | FT } + α 0 + E{ηT +1 | FT } − γ 1E{ηT=
| FT }
fT +1 E{xT +1=
=
.
= xT + α 0 − γ 1ηT
Для h = 2
=
fT + 2 E{xT =
E{xT +1 | FT } + α 0 + E{ηT + 2 | FT } − γ 1E{ηT=
+ 2 | FT }
+1 | FT }
= fT ,1 + α 0
fT ,h = fT ,h−1 + α 0 = xT + α 0 h − γ 1ηT .
7.7. НЕСТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ СО
СТОХАСТИЧЕСКИМИ ЭКСПОНЕНЦИАЛЬНЫМИ
ТРЕНДАМИ
К альтернативному способу описания нестационарных
временных рядов по сравнению с моделями «стационарными
относительно тренда» и «стационарными относительно взятия
разностей» приводят ARMA-модели при нарушении условия их
стационарности. В качестве примера рассмотрим временной ряд {xt},
описываемый моделью типа авторегрессии первого порядка AR(1),
которую можно рассматривать как модель ARMA(1, 0):
xt =α1xt–1 +ηt, t = 1, 2, ... ,
(7.14)
при условии, что α1 > 1, а {ηt} − процесс «белого шума». Если η0, x0 −
заданные начальные значения, то разностное уравнение (7.14) имеет
следующее решение:
xt = x0α1t +
В.И. Малюгин. Эконометрика – 2.
t
∑ α1 η t − i .
i
(7.15)
i =0
Страница 14
Модель (7.14) при α1 > 1 также интерпретируется как модель
временного ряда со стохастическим трендом. Интерпретация
основывается на представлении (7.15). Представление модели в виде
(7.15) содержит два типа трендов − детерминированный и
стохастический.
Детерминированный
тренд
в
виде
экспоненциально
возрастающей функции времени x0α1t можно рассматривать как
условное математическое ожидание xt в начальный момент времени:
Е{xtx0} = x0α1t.
Стохастический
тренд
представляет
собой
условное
математическое ожидание xt для моментов времени 1, 2, ... , t−1.
Условные математические ожидания xt являются случайными
величинами, так как зависят от случайных инноваций η0, η1, ... , ηt−1
(ηi = xi−α1xi−1 ). Дисперсия xt с учетом (7.15) и формулы для суммы
геометрической прогрессии определяется выражением:
D{xt} =
α12(t +1) − 1
2
α1
−1
ση2,
из которого следует, что при t→∞ дисперсия xt неограниченно
возрастает: D{xt} → ∞. Таким образом, временной ряд {xt}
нестационарный как по среднему значению, так и по дисперсии,
причем рост xt имеет экспоненциальный или «взрывной» характер
(explosive behavior).
Подобный тип нестационарности характерен для курсов
некоторых финансовых активов, например, обменных курсов валют
или курсов акций, которые принято называть спекулятивными или
рациональными пузырями (speculative or rational bubbles). Рост курсов
таких активов объясняется не экономическими, а спекулятивными
факторами. Для их описания не применимы традиционные подходы. В
частности, имеющий место в данном случае стохастический тренд не
может быть исключен ни с помощью взятия разностей, ни с помощью
выделения детерминированного тренда, и поэтому для построения
модели результирующего временного ряда остатков нельзя
использовать подход Бокса – Дженкинса.
В.И. Малюгин. Эконометрика – 2.
Страница 15
ГЛАВА 8
МОДЕЛИ ПРОЦЕССОВ ЕДИНИЧНОГО
КОРНЯ
8.1. МОДЕЛЬ СЛУЧАЙНОГО БЛУЖДАНИЯ И ЕЕ
СВОЙСТВА
Рассмотрим вначале простейшую, но часто встречаемую в
практических исследованиях модель данного класса. Пусть имеет
место модель AR(1) со свободным членом и «белым шумом» в
качестве ошибок наблюдения {ηt}:
xt = α0 + α1xt–1 + ηt, t = 1, 2, ... .
(8.1)
Временной ряд {xt} является стационарным при 0 < α1 < 1 1 и
нестационарным, имеет экспоненциальный характер роста, при α1 > 1.
Рассмотрим промежуточный случай, когда α1 = 1. При данном
предположении модель (8.1) принимает вид:
xt = α0 + xt–1 + ηt, t = 1, 2, ... ,
(8.2)
и известна как модель случайного блуждания с дискретным временем.
Соотношение (8.2) описывает модель случайного блуждания «со
сносом», если α0 ≠ 0, и «без сноса», если α0 = 0.
Теорема 8.1. Временной ряд {xt}, описываемый моделью (8.2)
является нестационарным как по среднему значению, так и по
дисперсии, причем его характеристики определяются по формулам:
µx,t = Е{xt} = x0 +α0t, σ2х,t = D{xt} = ση2t, ϕk,t = (t − k)ση2,
ρk,t =
t−k
t−k
k
=
= 1 − (t ≥ k ≥ 1).
t
t
t (t − k )
Доказательство: Если x0 − заданное начальное значение, то
решение разностного уравнения (8.2) имеет вид:
1
При моделировании экономических временных рядов уместно полагать, что α1 > 0.
Малюгин В.И. Эконометрика – 2.
Страница 1
t −1
xt = x0 + α0t +
∑η
i =1
i
+ ηt . ,
(8.3)
откуда следуют выражения для математического ожидания и
дисперсии. Учитывая, что
t −k
xt − k = x0 + α (t − k ) + ∑ηi ,
i =1
получаем выражение для автоковариационной функции:
ϕ x ,k =cov( xt , xt − k ) =E{( xt − µ x ,t )( xt − k − µ x ,t − k )} =
t
t −k
= E{∑ηi ∑η j }=
=i 1 =j 1
t −k
∑ E{η
=i 1
2
i
}= (t − k )σ η2 .
Тогда для АКФ имеем:
ρt , k =
ϕt , k
D{xt }D{xt − k }
=
(t − k )σ η2
tσ η (t − k )σ η
2
2
=
t−k
k
= 1 − .■
t
t
Следствия.
1. Временной ряд {xt}, описываемый моделью (8.2), содержит как
детерминированный, так и стохастический тренд, т.к.
xt = x0 + α0t +
t −1
∑η
i =1
i
+ ηt , ,
где E{xt } = x0 + α 0t соответствует детерминированному тренду, а
t −1
∑η
i =1
i
– стохастический тренд.
Стохастический тренд определяет условное математическое
ожидание временного ряда
t −1
E{xt | x0 , x1 ,..., xt −1} = x0 + α 0t + ∑ηi ,
i =1
Малюгин В.И. Эконометрика – 2.
Страница 2
используемое для вычисления прогнозов в предположении, что к
моменту t инновации {ηi }, i = 1,..., t − 1 , известны и равны ηi = xi − xi −1.
2. Если рассматривается модель случайного блуждания «без
сноса», т.е. α0 = 0, то величина E{xt} = x0 может интерпретироваться
как «долгосрочное среднее значение» временного ряда {xt}.
Заметим, однако, что наличие стохастического тренда является
причиной нарушения обычного для стационарных по среднему
значению процессов «свойства регулярного возврата к долгосрочному
среднему значению».
Процесс
случайного
блуждания
является
примером
интегрированного процесса I(1). Действительно, модель (8.2) может
быть представлена в виде:
∆xt = α0 + ηt, t = 1, 2, ... .
Поскольку «белый шум» является стационарным процессом, то и
процесс ∆xt является также стационарным, т.е. вычисление разностей
первого порядка для временного ряда {xt} приводит к стационарному
процессу.
Характеристическое уравнение принимает для модели (8.2) вид:
λ − α1 = 0.
Поэтому
условие
α1=1
означает,
что
единственный
характеристический корень этого уравнения равен 1. По этой причине
процессы I(1) типа (8.2) часто называют процессами единичного корня
(unit root process).
В общем случае модель интегрированного временного ряда I(d)
(d ≥ 1) содержит d единичных корней. Такой ряд может быть приведен
к стационарному виду ∆dxt путем d-кратного взятия разностей. Таким
образом, модель ARIMA(p, d, q) описывает процессы единичного
корня, содержащие d единичных корней.
Малюгин В.И. Эконометрика – 2.
Страница 3
8.2. ТЕСТЫ ЕДИНИЧНОГО КОРНЯ
Величина параметра α1 в модели (8.3) критическим образом
влияет на тип модели временного ряда. На практике актуальной
является проблема выбора между двумя следующими случаями:
1) α1 = 1, т. е. временной ряд {xt} является нестационарным и
описывается моделью единичного корня (случайного блуждания);
2) α1 < 1, т. е. временной ряд {xt} является стационарным и
описывается моделью AR(1).
Установление того, какой из указанных случаев имеет место на
самом деле, важно с практической точки зрения, поскольку в первом
случае
будущие
значения
анализируемых
характеристик
непредсказуемы, а во втором случае возникает возможность их
прогнозирования.
Используемый в рамках методологии Бокса – Дженкинса анализ
ВАКФ позволяет сделать предварительные выводы относительно
нестационарности временного ряда. Однако такой анализ не позволяет
установить тип нестационарности, поскольку медленное убывание
ВАКФ при увеличении значения лага может быть обусловлено
различными причинами:
– наличием единичных корней;
– наличием детерминированного временного тренда;
– близкими к 1 значениями характеристических корней.
Таким образом, подобный анализ не позволяет установить тип
нестационарности, т.е. отличить стохастический тренд от детерминированного. Кроме того, в последнем случае временной ряд является
стационарным, и поэтому при анализе ВАКФ возникает опасность
принять стационарный процесс «почти единичного корня» (near unit
root process) за нестационарный процесс.
Малюгин В.И. Эконометрика – 2.
Страница 4
По этой причине для установления типа нестационарности и
определения порядка интегрированности для интегрированных
нестационарных временных рядов были разработаны статистические
«тесты единичного корня» (unit root tests).
Наиболее известными являются следующие тесты из данного
класса:
− тест Дики – Фуллера (Dickey-Fuller test − DF test) при
отсутствии сезонных изменений и некоррелированности случайных
ошибок наблюдения в тестируемой модели;
− расширенный тест Дики – Фуллера (augmented Dickey-Fuller test
− ADF test), допускающий автокорреляцию случайных ошибок
наблюдения в тестируемой модели;
− тест Филлипса – Перрона (Philips-Perron test) при нарушении
гипотезы о некоррелированности и гомоскедастичности ошибок
наблюдения в тестируемой модели;
− тест Перрона (Perron additive outlier integration test) при
наличии
резко
выделяющихся
наблюдений
(«выбросов»),
учитываемых посредством включения в тестируемую модель
фиктивных переменных (dummy variables);
− сезонный тест Дики – Гасжа – Фуллера (Dickey-Hasza-Fuller
seasonal integration test − DHF test) при наличии сезонных эффектов в
квартальных и месячных данных;
− сезонный HEGY-тест для квартальных данных (HEGY seasonal
integration test for quarterly data) и др.
Перечисленные тесты единичного корня достаточно эффективно
решают задачи установления типа нестационарности и определения
порядка интегрированности временного ряда, однако имеют малую
мощность при различении стационарных процессов «почти
единичного корня» и процессов единичного корня. В подобных
случаях они часто выносят ошибочные решения о наличии единичных
корней, т.е. о нестационарности временных рядов типа DS. Проблема
еще больше усугубляется в условиях коротких временных рядов, а
также структурных изменений. При анализе коротких временных
рядов могут возникнуть проблемы с различением процессов
единичного корня и процессов, стационарных относительно
детерминированного тренда.
Малюгин В.И. Эконометрика – 2.
Страница 5
Приведем краткое описание одного наиболее важного семейства
тестов единичного корня − тестов Дики – Фуллера (DF- и ADF-теста).
Тест Дики–Фуллера (Dickey–Fuller test – DF-тест). В терминах
теории статистической проверки гипотез задача выбора из указанных
альтернатив может рассматриваться как задача проверки гипотезы Н0
о том, что тестируемый временной ряд является нестационарным при
конкурирующем предположении Н1 о стационарности временного
ряда. Таким образом, проверяются гипотезы
Н0 : α1 = 1, Н1: α1 < 1,
(8.4)
по реализации временного ряда {xt} (t = 1, 2, ... , T) на некотором
заданном уровне значимости ε.
Статистический критерий для проверки гипотезы Н0 был
предложен в работах Д. Дики и У. Фуллера. 1 Формальная проверка
гипотезы Н0 вида (8.4) о значении параметра α1 модели (8.3) на основе
стандартной t-статистики некорректна, поскольку временные ряды в
обеих частях соотношения (8.3) являются нестационарными. Это
является причиной того, что тестовая статистика, известная как «tотношение» или «t-статистика», имеет распределение, отличное от
стандартного t-распределения Стьюдента.
Поэтому осуществляется переход от модели (8.3) к модели со
стационарным временным рядом в левой части. Пороговые значения
для тестовой статистики в данном случае хотя и отличаются от
квантилей стандартного t-распределения, однако могут быть получены
с помощью метода Монте–Карло. Тестируемая модель при этом
допускает следующие расширения:
− дополнительное включение константы (свободного члена) γ0;
− дополнительное включение константы γ0 и линейного
детерминированного тренда γ2t.
Таким образом, возможны три варианта тестируемой с помощью
DF-теста модели (t = 1, 2, ... , Т):
(8.5)
∆xt = γ1xt–1 + ηt,
∆xt = γ0 + γ1xt–1 + ηt,
1
(8.6)
Dickey D. A., Fuller W. A. Distribution of the Estimators for Autoregressive Time Series
with a Unit Root // Journal of the American Statistical Association, №74, 1979. Р. 427−431.
Малюгин В.И. Эконометрика – 2.
Страница 6
∆xt = γ0 + γ1xt–1 + γ2t + ηt,
(8.7)
где γ1 = α1−1, {ηt}− процесс «белого шума».
Очевидно, задача проверки
тестированию гипотез вида:
гипотез
(8.4)
Н0: γ1 = 0, Н1: γ1 < 0.
эквивалентна
(8.8)
Процедура тестирования включает два этапа: оценивание параметров
моделей (8.5)−(8.7) с помощью МНК и проверку гипотез о значимости
коэффициентов регрессии и свободного члена с помощью критерия,
основанного на «t-статистики» Дики – Фуллера:
не отклоняется, если tT > ∆,
гипотеза Н0
отклоняется, если tT ≤ ∆,
где ∆=∆(ε)<0 – пороговое значение, зависящее от уровня значимости ε,
tT = γ1 / v – статистика Дики – Фуллера, в которой v – стандартная
ошибка оценки γ1 .
Различным вариантам моделей соответствуют различные
пороговые значения «t-статистики» Дики – Фуллера относительно
коэффициента γ1, которые вычислены и представлены в виде таблиц
для трех различных уровней значимости: ε ∈ {0.01, 0.05, 0.1} и
различных значений длины ряда Т .
Расширенный тест Дики – Фуллера (ADF-тест). Описанный
DF-тест предполагает независимость случайных ошибок наблюдения
{ηt} в тестируемой модели. В случае, когда допускается
автокорреляция случайных ошибок в тестируемой модели,
используется ADF-тест. В данном случае вместо моделей (8.5)−(8.7)
используются модели с лагами по ∆xt вида:
∆xt = γ1xt–1 +
p
∑ βi ∆xt −i +1 + ηt,
(8.9)
i =2
p
∆xt = γ0 + γ1xt–1 + ∑ βi ∆xt −i +1 + ηt,
(8.10)
i =2
Малюгин В.И. Эконометрика – 2.
Страница 7
p
∆xt = γ0 + γ1xt–1 + γ2t + ∑ βi ∆xt −i +1 + ηt.
(8.11)
i =2
В случае ADF-теста критические значения тестовых статистик
при проверке гипотезы Н0 вида (8.8) остаются такими же, как и в
случае DF-теста для соответствующих моделей. Однако возникает
дополнительная задача выбора значения порядка авторегрессии р.
Обычно она решается путем последовательного тестирования
моделей, соответствующих различным значениям данного параметра
(р = р*–1, р*–2, …), начиная с некоторого достаточно большого значения р*. Руководствуясь «принципом экономности» (principle of
parsimony), среди адекватных моделей предпочтение отдается модели
с меньшим значением p. При этом используются критерии Акаике и
Шварца. Согласно этим критериям, «лучшей модели» соответствуют
меньшие значения соответствующих статистик.
Определение порядка взятия разностей. При использовании
ADF-теста возникает еще одна проблема − «проблема кратных
корней» (multiple roots problem). Поскольку процессу AR(p)
соответствует р корней, то соответствующий процесс единичного
корня может иметь d ≤ p единичных корней. Это означает, что данный
процесс является интегрированным порядка d, т.е. I(d)-процессом, и,
следовательно, для приведения его к стационарному виду требуется dкратное взятие разностей.
Для определения порядка интегрирования d используется
следующая процедура.
1. Если для первых разностей гипотеза H0 отклоняется, то ряд {xt}
считается стационарным, т.е. xt ∼ I(0). Принятие гипотезы H0 означает,
что рассматриваемый временной ряд является нестационарным, т.е. xt
∼ I(d), d ≥ 1 .
2. Для определения значения d процедура тестирования
повторяется для разностей более высокого порядка. Однако в
большинстве практических случаев d ≤ 2 .
Эффекты излишнего взятия разностей. Если временной ряд не
интегрированный, либо тест отвергает верную гипотезу о порядке
Малюгин В.И. Эконометрика – 2.
Страница 8
интегрируемости, то может наблюдаться эффект излишнего взятия
разностей (over differencing):
• скачкообразное увеличение значения «t-статистики» Дики –
Фуллера (вместо ожидаемого ее уменьшения);
• коэффициент детерминации для построенной модели
регрессии скачкообразно растет и принимает значения,
близкие к единице.
8.3. ДРУГИЕ ПРИМЕРЫ ПРОЦЕССОВ
ЕДИНИЧНОГО КОРНЯ
1. Модель «случайное блуждание плюс белый шум». Данная
модель принимает вид:
xt = µt + ηt,
(8.12)
µt = µt–1 + ζt, t = 1, 2, ... ,
(8.12′)
где {ηt}, {ζt} − процессы «белого шума» (E{ζt} = E{ηt–l} = 0, D{ζt} =
σ ζ2 <∞, D{ηt–l} = σ η2 < ∞), причем ζt и ηt–l взаимно независимы, т. е.
Е{ζtηt–l} = 0 для всех t и l ≥ 1. Формула (8.12′) описывает процесс
случайного блуждания без сноса µt с начальным значением µ0 .
Решение стохастического разностного уравнения (8.12′) имеет вид:
t
µt = µ0 +
∑ ζi .
i =1
Подставляя данное представление для µt в (8.12) и учитывая, что x0 =
µ0 + η0, а µ0 = x0 −η0, получаем
xt = µ0 +
Укажем на
(8.12)−(8.12′).
t
t
i =1
i =1
∑ ζ i + ηt = x0 −η0 + ∑ ζ i + ηt,
некоторые
свойства
Малюгин В.И. Эконометрика – 2.
t = 1, 2, ... .
(8.13)
рассматриваемой
модели
Страница 9
Теорема 8.2: Временной ряд {xt}, описываемый моделью
(8.12)−(8.12′), является нестационарным по дисперсии, содержит
стохастический тренд, причем
+WN
µx,t = x0 −η0, D{xt} = σ ζ2 t + σ η2 , ρ tRW
=
,k
(t − k ) σ ξ2
.
(tσ ζ2 + ση2 )((t − k ) σ ζ2 + ση2 )
Следствия:1. Безусловное среднее значение E{xt}= x0 −η0
отличается от среднего значения стационарного временного ряда тем,
что в случае рассматриваемой модели, как и в случае модели
случайного блуждания, отсутствует возврат к среднему значению,
поскольку модель (8.13) включает стохастический тренд
t
∑ ζi
i =1
2. Рассматриваемая модель описывает временной ряд, который
является менее сглаженным, чем временной ряд, описываемый
обычной моделью случайного блуждания, т.к.
ρ t,RWk +WN < ρt,RWk ,
t −1
xt-l = x0 + η0 + ∑ ζ i + ηt-l, t ≥ 1,
i =1
∆xt = xt − xt −1 = ηt − ηt −1 + ζ t .
(8.14)
3. С учетом формулы (8.14) временной ряд {xt} является
интегрируемым первого порядка, так как случайный процесс
ξ t = ηt − ηt −1 + ζ t – линейная комбинация процессов типа белый шум,
т.е. стационарный процесс.
2. Модель случайного блуждания с дрейфом плюс белый шум.
Вместо модели случайного блуждания без сноса (8.12′) наряду с
соотношением (8.12) рассмотрим модель случайного блуждания со
сносом вида:
µt = µt–1 + α0 + ζt,
Малюгин В.И. Эконометрика – 2.
Страница 10
где α0 − константа, соответствующая параметру сноса. Полагая, что
µ0 − заданное начальное значение, получаем решение данного
разностного уравнения:
t
µt = µ0 + α0 t + ∑ ζ i .
i =1
Используя в (8.12) в качестве случайных воздействий произвольный
стационарный случайный процесс α(B)ηt, получаем модель вида:
t
µt = µ0 + α0 t + ∑ ζ i + α(B)η.
i =1
Данная модель содержит тренд, который представляет собой
комбинацию детерминированного тренда α0t и стохастического тренда
t
∑ ζi ,
i =1
а также случайную составляющую в виде стационарного
процесса α(B)η.
Для рассматриваемой модели справедливы следующие свойства:
+WN
+WN
.
µ x, t = x0 − η 0 + α 0t , D{xt} = σ ζ2 t + σ η2 , ρtRWD
= ρ tRW
,k
,k
3. Модель случайного блуждания с дрейфом плюс ARMA.
В данном случае достаточно предположить, что ηt ~ ARMA( p, q) .
Рассматриваемая модель содержит детерминированный тренд
x0 − η 0 + α 0t , стохастический тренд
t
∑ ζ i и нерегулируемый шумовой
i =1
тренд ηt ~ ARMA( p, q) .
8.4. ОБЩАЯ СТРУКТУРНАЯ МОДЕЛЬ
ПРОЦЕССОВ ЕДИНИЧНОГО КОРНЯ
Данная модель принимает вид:
xt = µt + ηt ,
Малюгин В.И. Эконометрика – 2.
(8.15)
Страница 11
µt = µt −1 + vt + ξ t ,
(8.16)
vt = vt −1 + ζ t ,
(8.17)
где µ 0 , v0
– заданные начальные значения, {ηt }, {ξ t }, {ζ t } –
некоррелированные процессы белого шума с дисперсиями
соответственно σ η2 , σ ξ2 , σ ζ2 < ∞ .
Формула (8.16) описывает модель случайного блуждания с
изменяющимся параметром сноса, который порождает стохастический
тренд в {xt}. Сам процесс µt не наблюдается; ηt искажает
ненаблюдаемый компонент µt ; ζ t – процесс инноваций, который
приводит к случайным изменениям параметра сноса.
Достоинство модели заключается в том, что она является
достаточно общей, т.е. включает многие ранее изученные модели.
Модель (8.15)–(8.17) записана в пространстве состояний. Для
оценивания параметров таких моделей используется фильтр Калмана.
8.4. ПРОГНОЗИРОВАНИЕ ПРОЦЕССОВ
ЕДИНИЧНОГО КОРНЯ
Пусть есть реализация некоторого временного ряда {xt}, найдены
оценки параметров модели. Требуется построить прогнозные значения
временного ряда fT , h для будущих значений временного ряда
xT + h , h = 1,..., H , где H ≥1 – заданный горизонт прогнозирования.
Модель случайного блуждания:
t
xt = µ 0 + xt −1 + ηt , xt = x0 + µ 0t + ∑ηi ,
i =1
xT + h = x0 + µ 0 (T + h) +
T +h
∑η i ,
i =1
fT ,h = ET {xT +h } = E{xT +h | FT } .
h
Если t = T, то xT + h = xt + µ 0 h + ∑ηT + i , следовательно,
i =1
Малюгин В.И. Эконометрика – 2.
Страница 12
fT ,h = ET {xT +h } = xT + µ 0 h .
Модель случайного блуждания с дрейфом плюс белый шум:
t
xt = x0 − η 0 + α 0T + ∑ ζ i + ηT ,
i =1
xT +h = x0 − η 0 + α 0 (T + h) +
T +h
h
i =1
i =1
∑ ζ i + ηT +h = xT − ηT + α 0 h + ∑ ζ T +i + ηT +h ,
fT , h = ET {xT + h } = xT − ηT + α 0 h .
Малюгин В.И. Эконометрика – 2.
Страница 13
ГЛАВА 9
ПОСТРОЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ
РЯДОВ В УСЛОВИЯХ
ГЕТЕРОСКЕДАСТИЧНОСТИ
9.1. ПОСТРОЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ
РЯДОВ С БЕЗУСЛОВНОЙ
ГЕТЕРОСКЕДАСТИЧНОСТЬЮ
Пусть модель временного ряда {x t } допускает представление:
где:
x t = µ t + ξ t , t ≥ 1,
µ t = E{х t }, D{х t } = D{ξ t } ≡ ψ2(t, µ t )σ2.
(9.1)
Таким образом, временной ряд {x t } в общем случае является
нестационарным как по среднему значению (содержит детерминированный тренд), так и по дисперсии.
Формула для дисперсии временного ряда в (9.1) описывает
модель безусловной гетероскедастичности, которая определяется
известной функцией ψ(·) и неизвестным параметром σ2 > 0.
Общий подход к построению моделей временных рядов с
безусловной гетероскедастичностью типа (9.1) предусматривает
выполнение двух этапов:
1) преобразование временного ряда {x t } с помощью некоторой
непрерывной монотонной функции g(·) с целью перехода к модели
временного ряда {y t } с гомоскедастичными ошибками:
D{y t } = D{g(x t )} = σ2, t ≥ 1;
2) использование традиционных методов
построения модели временного ряда {y t }.
Малюгин В.И. Эконометрика – 2.
для
анализа
и
Страница 1
Таким образом, ключевой проблемой при построении моделей
временных рядов с безусловной гетероскедастичностью является
установление вида модели гетероскедастичности и нахождение
соответствующего функционального преобразования. Иными словами,
задача заключается в установлении вида функции ψ(·) и нахождении
для заданной функции ψ(·) преобразования g(·).
Метод решения проблемы. Опишем общий метод решения
данной проблемы при условии, что функция ψ(·) определена на этапе
предварительного анализа временного ряда. Запишем для функции
g(x t ) формулу Тейлора первого порядка в окрестности среднего
значения временного ряда µ t :
g(x t ) ≈ g(µ t )+ g′ (µ t )( x t – µ t ).
Тогда для дисперсии временного ряда справедливо приближение:
D{g(x t )} ≈ D{g(µ t )+ g′ (µ t )( x t – µ t )} = (g′(µ t ))2 D{x t }
= (g′ (µ t ))2ψ2(t, µ t )σ2= σ2.
(9.1*)
Откуда следует, что искомая функция g(·) является решением
дифференциального уравнения
g′ (µ t ) =
1
.
ψ(t , µ t )
Примеры преобразований. Приведем примеры функций g(x t ),
соответствующие типовым моделям безусловной гетероскедастичности:
1) ψ (=
µt σ ;
t , µt ) µ=
t , σt
т.е., если среднеквадратическое отклонение временного
монотонно зависит от среднего значения временного ряда, то
ряда
g(x t )= ln(x t ).
2) ψ ( t=
, µt ) t ,=
σ t tσ , т.е., если среднеквадратическое
отклонение временного ряда монотонно зависит от времени t, тогда
g(x t )=1/t,
Малюгин В.И. Эконометрика – 2.
Страница 2
3) g(x t )=2(x t )1/2, если дисперсия временного ряда монотонно
зависит от среднего значения временного ряда:
D{х t } = µ t σ2, т. е. ψ(t, µ t ) = (µ t )1/2;
9.2. МОДЕЛИ УСЛОВНОЙ
ГЕТЕРОСКЕДАСТИЧНОСТИ И ИХ ПОСТРОЕНИЕ
9.2.1. ПРИЗНАКИ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ В
ЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДАХ
При построении эконометрических моделей индексов цен и
других финансовых переменных часто приходится иметь дело с
неоднородностью условных дисперсий анализируемых временных
рядов, т.е. так называемой условной гетероскедастичностью. Процесс
построения моделей условной гетероскедастичности не требует
специального представления либо преобразования анализируемого
временного ряда, и в то же время позволяет одновременно
моделировать как условное математическое ожидание, так и условную
дисперсию данного временного ряда.
Пусть временной ряд {x t } допускает представление в виде:
(9.2)
x t+1 = E{x t+1 F t }+ξ t+1 , t ≥ 0,
где F t − информация, доступная к моменту времени t (например,
значения временного ряда x 1 , x 2 , … , x t–1 за предшествующие моменты
времени); E t {x t+1 }≡E{x t+1 F t } − прогноз в виде условного
математического ожидания значения временного ряда в будущий
момент времени t+1, построенный на основании информации F t ,
доступной в текущий момент времени t; {ξ t } − последовательность
некоррелированных случайных величин (ошибок прогноза), для
которых имеет место свойство:
E{ξ t+1 F t } = 0.
(9.3)
В частности, если случайный процесс {x t } является мартингалом
относительно некоторого потока информации {F t }, то соотношение
(9.2) принимает вид:
x t+1 = x t + ξ t+1 , t ≥ 0,
Малюгин В.И. Эконометрика – 2.
(9.4)
Страница 3
и формально оно аналогично представлению (8.2) модели случайного
блуждания.
Однако
модель
(9.4)
предполагает
лишь
некоррелированность случайных величин {ξ t }, в то время как модель
(8.2) устанавливает более жесткое требование независимости
«инноваций». Как известно, эти свойства эквивалентны лишь в случае
предположения о нормальном распределении случайных величин.
Заметим, что прогнозы в виде условного математического
ожидания являются несмещенными и обладают минимальной
среднеквадратической ошибкой, т. е. превосходят по точности
безусловные прогнозы. Проиллюстрируем это на примере.
Пусть временной ряд {x t } стационарный и описывается моделью
AR(1) вида:
x t+1 = α 0 +α 1 x t + ξ t+1 , t ≥ 0.
Тогда прогноз в виде условного математического ожидания равен
E t {x t+1 } = α 0 +α 1 x t .
(9.5)
Несмещенность прогноза (9.5) следует из соотношения
E t {x t+1 − E t {x t+1 }} = E t {ξ t+1 } = 0.
Дисперсия ошибки прогноза (9.5) равна
E t {(x t+1 − E t {x t+1 })2} = E t {ξ2 t+1 } ≡ σ2.
Если используется безусловный прогноз, то для стационарного
временного ряда он всегда совпадает со средним значением данного
ряда. В частности, в рассматриваемом случае имеем:
Е{x t } =
α0
1
, D{x t } =
σ2.
1 − α1
1 − α12
Так как 1/(1–α 1 2) > 1, то безусловный прогноз имеет большую
вариацию, чем условный.
Требование некоррелированности {ξ t } допускает положительную
корреляцию {ξ t 2} (или {ξ t }). Коррелированность отклонений {ξ t 2}
может быть следствием их условной гетероскедастичности (или
неоднородности), т. е. непостоянства условной дисперсии:
D{ξ t F t–1 } = E{ξ2 t F t–1 } ≡ σ t 2 ≠ const, t ≥ 1.
Малюгин В.И. Эконометрика – 2.
Страница 4
Учет подобной корреляции в модели случайных величин {ξ t }
позволяет
объяснить
особенности
поведения
некоторых
макроэкономических показателей, например, индексов цен, а также
процентных ставок и рыночных курсов финансовых активов, которые
не поддаются описанию в рамках модели ARIMA. Примерами таких
«особенностей» могут служить: «эффект кластерности», который
состоит в том, что большие и малые значения {ξ t } образуют серии
или кластеры (скопления) больших либо малых значений;
«островершинность» и «тяжелые хвосты» функции плотности
распределения {ξ t }.
Отправной точкой для построения широкого класса моделей
указанного типа является модель авторегрессионной условной
гетероскедастичности (autoregressive conditional heteroskedastic−
ARCH-model), предложенная Р. Энглем в 1982 г. Приведем описание
данной модели, а также основной ее модификации, известной как
модель GARСН (Generalized ARCH model), разработанной Т. Боллерслевом в 1986 г.
9.2.2. МОДЕЛЬ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
ARCH
Говорят, что случайный процесс {ξ t } описывается моделью ARCH
порядка q≥1, обозначается ARCH(q), если распределение вероятностей
случайных величин ξ t (t = 1, 2, ...) является условно-гауссовским, т. е.
L{ξ t F t–1 } = N(µ t , σ t 2),
где F t–1 − доступная к моменту времени и относящаяся к делу
информация, включающая все прошлые значения отклонений ξ 1 , ξ 2 , ...
, ξ t–1 для t ≥ 1 (ξ 0 − заданное начальное значение), и с вероятностью
единица (почти наверное) справедливы утверждения:
− условное математическое ожидание ξ t при том, что имеется
информация F t–1 , равно нулю:
µ t ≡ E{ξ t F t–1 } = 0;
− условная дисперсия ξ t с вероятностью единица подчиняется модели
вида:
Малюгин В.И. Эконометрика – 2.
Страница 5
q
σ t 2 = E{ξ t 2F t–1 } = α 0 + ∑ αi ξ2t −i , t = 1, 2, ... ,
(9.6)
i =1
где ξ 1–q , ... , ξ 0 − начальные значения, которые обычно полагаются
константами; {α i ≥ 0} (i = 0, 1, ... , q) − параметры модели,
удовлетворяющие условиям:
α 0 > 0, α i ≥ 0, i = 1, 2, ... , q,
(9.7)
которые обеспечивают неотрицательность значений {σ t 2}.
Случайную последовательность {ξ t } можно рассматривать как
последовательность, порождаемую стандартным гауссовским «белым
шумом» {η t } по формуле:
(9.7′)
ξt ≡ σtηt,
где {η t } (t = 1, 2, ... ) − последовательность независимых случайных
величин, распределенных по стандартному нормальному закону
N 1 (0, 1).
Из (9.6) следует, что условные дисперсии (волатильности) σ t 2
могут быть предсказаны по прошлым значениям ξ2 t–1 , ... , ξ2 t–q . При
этом большие (малые) значения ξ2 t–i приводят к большим (малым)
значениям σ t 2. Появление больших значений ξ2 t вслед за некоторой
серией малых значений обусловлено появлением малого значения η t и
наоборот. Таким образом, ARCH-модели позволяют объяснить
«эффект кластерности». Полагая, что
w t ≡ ξ t 2–σ t 2,
(9.7″)
получаем представление модели (9.6) в виде:
q
ξ t 2 = α 0 + ∑ α i ξ 2t − i + w t ,
(9.8)
E{w t F t–1 } = E{ξ t 2F t–1 } − σ t 2 = 0.
(9.9)
i =1
где
В силу (9.8), (9.9) модель ARCH(q) может рассматриваться как
авторегрессионая модель AR(q) для квадратов ошибок {ξ t 2}. Поэтому
условием стационарности (в широком смысле) случайного процесса
Малюгин В.И. Эконометрика – 2.
Страница 6
{ξ t 2} является условие стационарности AR(q)-модели. Однако в
отличие от «обычной» авторегрессионной модели «ошибки» {w t } для
модели (9.8) гетероскедастичны. Действительно, согласно (9.7′),
(9.7″), w t = ξ t 2–σ t 2=σ t 2(η t −1), а условная дисперсия случайных величин
w t зависит от времени: D{w t F t–1 } = σ t 4.
Воспользуемся обозначением
α(B) = (1 − α 1 B − α 2 B2 − ... − α p Bq)
(9.10)
для полинома степени q относительно оператора сдвига B и
представим (9.8) в виде:
(1 − α 1 B − α 2 B2 − ... − α p Bq)ξ t 2 = α 0 + w t .
(9.11)
Если процесс {ξ t 2} является стационарным, т. е. α 1 +α 2 +...+α q < 1,
то, с учетом (9.5) и (9.9)−(9.11) безусловное математическое ожидание
и безусловная дисперсия ξ t определяются по формулам:
E{ξ t } = 0,
D{ξ t } = E{ξ t 2} =
α0
, t ≥ 0.
1 − (α1 + ... + α q )
(9.12)
(9.13)
Свойство (9.13) означает безусловную гомоскедастичность
случайных величин {ξ t }.
Другие свойства ARCH-модели можно установить на основе
анализа основных характеристик случайного процесса {ξ t 2}. В
качестве иллюстрации приведем характеристики модели ARCH(1).
Согласно (9.8), при q = 1 имеем:
ξ t2 = α 0 +α 1 ξt2−1 + w t ,
(9.13′)
Если выполняется условия стационарности и не отрицательности
, т. е. 0 < α 1 < 1, а также 3α 1 2 < 1, то имеют место следующие
соотношения для характеристик случайного процесса {ξ t 2}:
ξt2
− математическое ожидание
E{ξ t 2} =
α0
α0
, t ≥ 1, ξ 0 2 ≡
;
1 − α1
1 − α1
Малюгин В.И. Эконометрика – 2.
Страница 7
− дисперсия
D{ξ t 2} =
2
α0
, t ≥ 0;
2
1 − 3α1 1 − α1
2
− автокорреляционная функция для лага 1 ≤ k < t:
− коэффициент эксцесса:
k2 =
ρ k = α 1 k;
(9.14)
)−3=
(9.15)
(
3 1 − α12
1 − 3α12
6α12
> 0.
1 − 3α12
Согласно (9.14) случайные процессы ARCH(1) и AR(1) имеют,
как и следовало ожидать, одинаковую автокорреляционную функцию.
Из (9.15) и условия 3α 1 2 < 1 следует положительность коэффициента
эксцесса k 2 , причем его величина тем больше, чем больше α 1 , т. е. чем
сильнее корреляция между ξ t и ξ t–1 . Учитывая, что для нормального
распределения k 2 = 0, положительные значения k 2 > 0 означают, что
кривая плотности распределения {ξ t } имеет более «острую» и «высокую» вершину, а также более «тяжелые хвосты», чем кривая плотности нормального распределения. Это свойство ARCH-модели еще одно
ее достоинство при моделировании финансовых индексов, поскольку
для многих из них коэффициент эксцесса является положительным .
Модель ARCH вида (9.6), (9.7) позволяет предсказывать
величины ξT2 + l или ξ T+l на l ≥ 1 шагов вперед, т. е. строить
прогнозы ξT2 + l в виде условного математического ожидания
ξT2 + l = Е{ ξT2 + l F T },
(где F T включает значения ξ t2 для прошлых моментов времени t = 1,
2, … , T). В частности, для ARCH(1) имеет место следующая
прогнозная функция:
1 − α1l −1
ξT2 + l = α 0 (1 + α1 + α12 + ... + α1l −1 ) + α1l ξT2 = α 0
+ α1l ξT2 ,
1 − α1
Малюгин В.И. Эконометрика – 2.
Страница 8
где предполагается, что α 0 , α 1 − статистические оценки
соответствующих параметров по реализации анализируемого
временного ряда длиной Т. Однако модель ARCH не дает ответа на
вопрос, в каком направлении будут изменяться моделируемый
показатель, поскольку знак величины ξ t+l остается неизвестным.
9.2.3. МОДЕЛЬ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
GARCH
При построении ARCH(q) по реальным данным часто
применяются достаточно большие значения порядка модели q, что
может приводить к нарушению условия (9.7) положительности σ t 2
некоторыми из оценок параметров {α i }(i = 1, 2, ... , q). Этой проблемы
удается избежать при использовании обобщенной ARCH-модели или
модели GARСН(p, q) порядка p ≥ 1 и q ≥ 1.
Модель условной гетероскедастичности GARСН(p,q) для
случайного процесса {ξ t } вида (9.7′) определяется соотношением:
q
p
i =1
j =1
σ t 2 = E{ξ t 2F t–1 } = α 0 + ∑ α i ξ 2 t − i + ∑ βi σ 2 t − j =α 0 +α(B)ξ t 2+β(B)σ t 2,
(9.16)
где ξ 1–q , ... , ξ 0 , σ 1–p , ... , σ 0 − заданные начальные значения; α 0 , {α i } (i
= 1, 2, ... , q), {β j } (j = 1, 2, ... , p) − параметры модели,
удовлетворяющие условиям положительности σ t 2 > 0 (t = 1, 2, ...):
α 0 > 0, α i ≥ 0, β j ≥ 0 (i = 1, 2, ... , q, j = 1, 2, ... , p).
Согласно (9.16), условные дисперсии σ t 2 зависят от предыдущих
значений инноваций {ξ2 t–i }, (i = 1, 2, ... , q) и дисперсий {σ2 t–j } (j = 1,
2, ... , p).
Обозначим w t ≡ ξ t 2–σ t 2. Сделав в (9.16) замену σ t 2 = ξ t 2–w t ,
получаем представление модели GARСН(p, q) в виде модели
ARMA(m, p):
(9.17)
ξ t 2 = α 0 +(α(B) + β(B))ξ 2 t–1 + w t −β(B) w t–1 ,
где m = max{p, q}.
Малюгин В.И. Эконометрика – 2.
Страница 9
Случайный ARMA-процесс {ξ t 2} является стационарным, если
все корни характеристического уравнения, соответствующего α(B) +
β(B), лежат вне единичного круга. На практике приходится иметь дело
с частным случаем данной модели при p = q = 1. На основании (9.16)
для модели GARСН(1, 1) справедливо:
σ t 2 = α 0 +α 1 ξt2−1 +β 1 σ2 t–1 , t = 1, 2, ... .
(9.18)
Таким образом, модель GARСН(1, 1) зависит от трех параметров:
α 0 > 0, α 1 ≥ 0 и β 1 ≥ 0. Представление типа (9.17) для данной модели
принимает вид:
ξ t 2 = α 0 +(α 1 + β 1 ) ξt2−1 + w t −β 1 w t–1 ,
откуда следует условие стационарности GARСН(1, 1): α 1 +β 1 < 1.
9.2.4. ТЕСТИРОВАНИЕ И ПОСТРОЕНИЕ МОДЕЛЕЙ
УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
Процесс построения моделей ARCH и GARCH для временного
ряда {x t } (t = 1, 2, …) состоит из двух следующих основных этапов.
Этап 1. Выявление эффектов условной гетероскедастичности.
Если на данном этапе устанавливаются эффекты условной
гетероскедастичности, то переходят к следующему этапу.
Этап 2. Построение модели с условной гетероскедастичностью
Целью данного этапа является построение модели (т. е. оценивание параметров и тестирование адекватности), которая наиболее
адекватно описывает выявленные эффекты условной гетероскедастичности. В качестве альтернативных вариантов могут использоваться
модели типа ARCH, GARCH и другие модели с условной
гетероскедастичностью.
На первом этапе выполняются следующие шаги.
1. Строится наилучшая модель для временного ряда {x t } в классе
моделей ARIMA или в классе регрессионных моделей, и вычисляются
остатки ξ t для построенной модели.
2. Проводится анализ ВАКФ, ВЧАКФ и Q-статистики Льюнга –
Бокса для остатков ξ t и квадратов остатков ξt2 . Говорят, что
{ }
{ }
Малюгин В.И. Эконометрика – 2.
{ }
Страница 10
имеют место эффекты условной гетероскедастичности типа ARCH или
GARCH, если временной ряд остатков ξ t оказывается «белым
шумом», а временной ряд квадратов остатков ξt2 , отличным от
«белого шума» стационарным процессом.
3. Используется тест множителей Лагранжа для ARCH-моделей
(Lagrange multiplier test for ARCH − ARCH LM test), который
реализуется следующим образом.
Для временного ряда квадратов остатков ξt2 строится модель в виде
AR(q):
(9.19)
ξt2 = α 0 + α1ξt2−1 + α 2 ξt2− 2 + ... + α q ξt2− q + ζ t .
{ }
{ }
{ }
В пользу условной гетероскедастичности свидетельствуют:
1) статистическая адекватность построенной модели, т.е. наличие
статистически значимых коэффициентов регрессии {α l } (l = 1, 2, … ,
q) в модели (9.19);
2) выполнение условия ТR2 ≥ ∆(ε) (где R2 − коэффициент
детерминации построенной модели (9.19), ∆(ε) − квантиль уровня 1–ε
распределение хи-квадрат с q степенями свободы, T − длина
временного ряда остатков).
Известно, что статистика ARCH LM теста ТR2 имеет
асимптотическое при Т → ∞ распределение хи-квадрат с q степенями
свободы.
Для оценивания параметров ARCH и GARCH используется
метод максимального правдоподобия для моделей с условной
гетероскедастичностью.
Малюгин В.И. Эконометрика – 2.
Страница 11
Малюгин В.И. Эконометрика – 2.
Страница 12
ГЛАВА 9
ПОСТРОЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ
РЯДОВ В УСЛОВИЯХ
ГЕТЕРОСКЕДАСТИЧНОСТИ
9.1. ПОСТРОЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ
РЯДОВ С БЕЗУСЛОВНОЙ
ГЕТЕРОСКЕДАСТИЧНОСТЬЮ
Пусть модель временного ряда {xt} допускает представление:
где:
xt = µt + ξt, t ≥ 1,
µt = E{хt}, D{хt} = D{ξt} ≡ ψ2(t, µt)σ2.
(9.1)
Таким образом, временной ряд {xt} в общем случае является
нестационарным как по среднему значению (содержит детерминированный тренд), так и по дисперсии.
Формула для дисперсии временного ряда в (9.1) описывает
модель безусловной гетероскедастичности, которая определяется
известной функцией ψ(·) и неизвестным параметром σ2 > 0.
Общий подход к построению моделей временных рядов с
безусловной гетероскедастичностью типа (9.1) предусматривает
выполнение двух этапов:
1) преобразование временного ряда {xt} с помощью некоторой непрерывной монотонной функции g(·) с целью перехода к модели
временного ряда {yt} с гомоскедастичными ошибками:
D{yt} = D{g(xt)} = σ2, t ≥ 1;
2) использование традиционных методов
построения модели временного ряда {yt}.
Малюгин В.И. Эконометрика – 2.
для
анализа
и
Страница 1
Таким образом, ключевой проблемой при построении моделей
временных рядов с безусловной гетероскедастичностью является
установление вида модели гетероскедастичности и нахождение
соответствующего функционального преобразования. Иными словами,
задача заключается в установлении вида функции ψ(·) и нахождении
для заданной функции ψ(·) преобразования g(·).
Метод решения проблемы. Опишем общий метод решения
данной проблемы при условии, что функция ψ(·) определена на этапе
предварительного анализа временного ряда. Запишем для функции
g(xt) формулу Тейлора первого порядка в окрестности среднего
значения временного ряда µt:
g(xt) ≈ g(µt)+ g′ (µt)( xt – µt).
Тогда для дисперсии временного ряда справедливо приближение:
D{g(xt)} ≈ D{g(µt)+ g′ (µt)( xt – µt)} = (g′(µt))2 D{xt}
= (g′ (µt))2ψ2(t, µt)σ2= σ2.
(9.1*)
Откуда следует, что искомая функция g(·) является решением
дифференциального уравнения
g′ (µt) =
1
.
ψ(t , µ t )
Примеры преобразований. Приведем примеры функций g(xt),
соответствующие типовым моделям безусловной гетероскедастичности:
1) ψ (=
µt σ ;
t , µt ) µ=
t , σt
т.е., если среднеквадратическое отклонение временного
монотонно зависит от среднего значения временного ряда, то
ряда
g(xt)= ln(xt).
2) ψ ( t=
, µt ) t ,=
σ t tσ , т.е., если среднеквадратическое
отклонение временного ряда монотонно зависит от времени t, тогда
g(xt)=1/t,
Малюгин В.И. Эконометрика – 2.
Страница 2
3) g(xt)=2(xt)1/2, если дисперсия временного ряда монотонно
зависит от среднего значения временного ряда:
D{хt} = µtσ2, т. е. ψ(t, µt) = (µt)1/2;
9.2. МОДЕЛИ УСЛОВНОЙ
ГЕТЕРОСКЕДАСТИЧНОСТИ И ИХ ПОСТРОЕНИЕ
9.2.1. ПРИЗНАКИ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ В
ЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДАХ
При построении эконометрических моделей индексов цен и
других финансовых переменных часто приходится иметь дело с
неоднородностью условных дисперсий анализируемых временных
рядов, т.е. так называемой условной гетероскедастичностью. Процесс
построения моделей условной гетероскедастичности не требует
специального представления либо преобразования анализируемого
временного ряда, и в то же время позволяет одновременно
моделировать как условное математическое ожидание, так и условную
дисперсию данного временного ряда.
Пусть временной ряд {xt} допускает представление в виде:
(9.2)
xt+1 = E{xt+1Ft}+ξt+1, t ≥ 0,
где Ft − информация, доступная к моменту времени t (например,
значения временного ряда x1, x2, … , xt–1 за предшествующие моменты
времени); Et{xt+1}≡E{xt+1Ft} − прогноз в виде условного
математического ожидания значения временного ряда в будущий
момент времени t+1, построенный на основании информации Ft,
доступной в текущий момент времени t; {ξt} − последовательность
некоррелированных случайных величин (ошибок прогноза), для
которых имеет место свойство:
E{ξt+1F t} = 0.
(9.3)
В частности, если случайный процесс {xt} является мартингалом
относительно некоторого потока информации {Ft}, то соотношение
(9.2) принимает вид:
xt+1 = xt + ξt+1, t ≥ 0,
Малюгин В.И. Эконометрика – 2.
(9.4)
Страница 3
и формально оно аналогично представлению (8.2) модели случайного
блуждания.
Однако
модель
(9.4)
предполагает
лишь
некоррелированность случайных величин {ξt}, в то время как модель
(8.2) устанавливает более жесткое требование независимости
«инноваций». Как известно, эти свойства эквивалентны лишь в случае
предположения о нормальном распределении случайных величин.
Заметим, что прогнозы в виде условного математического
ожидания являются несмещенными и обладают минимальной
среднеквадратической ошибкой, т. е. превосходят по точности
безусловные прогнозы. Проиллюстрируем это на примере.
Пусть временной ряд {xt} стационарный и описывается моделью
AR(1) вида:
xt+1 = α0+α1xt + ξt+1, t ≥ 0.
Тогда прогноз в виде условного математического ожидания равен
Et{xt+1} = α0+α1xt.
(9.5)
Несмещенность прогноза (9.5) следует из соотношения
Et{xt+1 − Et{xt+1}} = Et{ξt+1} = 0.
Дисперсия ошибки прогноза (9.5) равна
Et{(xt+1 − Et{xt+1})2} = Et{ξ2t+1} ≡ σ2.
Если используется безусловный прогноз, то для стационарного
временного ряда он всегда совпадает со средним значением данного
ряда. В частности, в рассматриваемом случае имеем:
Е{xt} =
α0
1
, D{xt} =
σ2.
1 − α1
1 − α12
Так как 1/(1–α12) > 1, то безусловный прогноз имеет большую
вариацию, чем условный.
Требование некоррелированности {ξt} допускает положительную
корреляцию {ξt2} (или {ξt}). Коррелированность отклонений {ξt2}
может быть следствием их условной гетероскедастичности (или
неоднородности), т. е. непостоянства условной дисперсии:
D{ξtF t–1} = E{ξ2tF t–1} ≡ σ t2 ≠ const, t ≥ 1.
Малюгин В.И. Эконометрика – 2.
Страница 4
Учет подобной корреляции в модели случайных величин {ξt}
позволяет
объяснить
особенности
поведения
некоторых
макроэкономических показателей, например, индексов цен, а также
процентных ставок и рыночных курсов финансовых активов, которые
не поддаются описанию в рамках модели ARIMA. Примерами таких
«особенностей» могут служить: «эффект кластерности», который
состоит в том, что большие и малые значения {ξt} образуют серии
или кластеры (скопления) больших либо малых значений;
«островершинность» и «тяжелые хвосты» функции плотности
распределения {ξt}.
Отправной точкой для построения широкого класса моделей
указанного типа является модель авторегрессионной условной
гетероскедастичности (autoregressive conditional heteroskedastic−
ARCH-model), предложенная Р. Энглем в 1982 г. Приведем описание
данной модели, а также основной ее модификации, известной как
модель GARСН (Generalized ARCH model), разработанной Т. Боллерслевом в 1986 г.
9.2.2. МОДЕЛЬ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
ARCH
Говорят, что случайный процесс {ξt} описывается моделью ARCH
порядка q≥1, обозначается ARCH(q), если распределение вероятностей
случайных величин ξt (t = 1, 2, ...) является условно-гауссовским, т. е.
L{ξt Ft–1} = N(µt, σt2),
где Ft–1 − доступная к моменту времени и относящаяся к делу
информация, включающая все прошлые значения отклонений ξ1, ξ2, ...
, ξt–1 для t ≥ 1 (ξ0 − заданное начальное значение), и с вероятностью
единица (почти наверное) справедливы утверждения:
− условное математическое ожидание ξt при том, что имеется
информация Ft–1, равно нулю:
µt ≡ E{ξtFt–1} = 0;
− условная дисперсия ξt с вероятностью единица подчиняется модели
вида:
Малюгин В.И. Эконометрика – 2.
Страница 5
q
σt2 = E{ξt2Ft–1} = α0+ ∑ αi ξ2t −i , t = 1, 2, ... ,
(9.6)
i =1
где ξ1–q, ... , ξ0 − начальные значения, которые обычно полагаются
константами; {αi ≥ 0} (i = 0, 1, ... , q) − параметры модели,
удовлетворяющие условиям:
α0 > 0, αi ≥ 0, i = 1, 2, ... , q,
(9.7)
которые обеспечивают неотрицательность значений {σt2}.
Случайную последовательность {ξt} можно рассматривать как
последовательность, порождаемую стандартным гауссовским «белым
шумом» {ηt} по формуле:
(9.7′)
ξt ≡ σtηt,
где {ηt} (t = 1, 2, ... ) − последовательность независимых случайных
величин, распределенных по стандартному нормальному закону
N1(0, 1).
Из (9.6) следует, что условные дисперсии (волатильности) σt2
могут быть предсказаны по прошлым значениям ξ2t–1, ... , ξ2t–q. При
этом большие (малые) значения ξ2t–i приводят к большим (малым)
значениям σt2. Появление больших значений ξ2t вслед за некоторой
серией малых значений обусловлено появлением малого значения ηt и
наоборот. Таким образом, ARCH-модели позволяют объяснить
«эффект кластерности». Полагая, что
wt ≡ ξt2–σt2,
(9.7″)
получаем представление модели (9.6) в виде:
q
ξt2 = α0+ ∑ αi ξ2t −i + wt,
(9.8)
E{wtFt–1} = E{ξt2Ft–1} − σt2 = 0.
(9.9)
i =1
где
В силу (9.8), (9.9) модель ARCH(q) может рассматриваться как
авторегрессионая модель AR(q) для квадратов ошибок {ξt2}. Поэтому
условием стационарности (в широком смысле) случайного процесса
Малюгин В.И. Эконометрика – 2.
Страница 6
{ξt2} является условие стационарности AR(q)-модели. Однако в
отличие от «обычной» авторегрессионной модели «ошибки» {wt} для
модели (9.8) гетероскедастичны. Действительно, согласно (9.7′),
(9.7″), wt = ξt2–σt2=σt2(ηt−1), а условная дисперсия случайных величин
wt зависит от времени: D{wtF t–1} = σt4.
Воспользуемся обозначением
α(B) = (1 − α1B − α2B2 − ... − αpBq)
(9.10)
для полинома степени q относительно оператора сдвига B и
представим (9.8) в виде:
(1 − α1B − α2B2 − ... − αpBq)ξt2 = α0 + wt.
(9.11)
Если процесс {ξt2} является стационарным, т. е. α1+α2+...+αq < 1,
то, с учетом (9.5) и (9.9)−(9.11) безусловное математическое ожидание
и безусловная дисперсия ξt определяются по формулам:
E{ξt} = 0,
D{ξt} = E{ξt2} =
α0
, t ≥ 0.
1 − (α1 + ... + α q )
(9.12)
(9.13)
Свойство (9.13) означает безусловную гомоскедастичность
случайных величин {ξt}.
Другие свойства ARCH-модели можно установить на основе
анализа основных характеристик случайного процесса {ξt2}. В
качестве иллюстрации приведем характеристики модели ARCH(1).
Согласно (9.8), при q = 1 имеем:
ξ t2 = α0+α1 ξt2−1 + wt,
(9.13′)
Если выполняется условия стационарности и не отрицательности
, т. е. 0 < α1 < 1, а также 3α12 < 1, то имеют место следующие
соотношения для характеристик случайного процесса {ξt2}:
ξt2
− математическое ожидание
E{ξt2} =
α0
α0
, t ≥ 1, ξ02 ≡
;
1 − α1
1 − α1
Малюгин В.И. Эконометрика – 2.
Страница 7
− дисперсия
D{ξt2} =
2
α0
, t ≥ 0;
2
1 − 3α1 1 − α1
2
− автокорреляционная функция для лага 1 ≤ k < t:
− коэффициент эксцесса:
k2 =
ρk = α1k;
(9.14)
)−3=
(9.15)
(
3 1 − α12
1 − 3α12
6α12
> 0.
1 − 3α12
Согласно (9.14) случайные процессы ARCH(1) и AR(1) имеют,
как и следовало ожидать, одинаковую автокорреляционную функцию.
Из (9.15) и условия 3α12 < 1 следует положительность коэффициента
эксцесса k2, причем его величина тем больше, чем больше α1, т. е. чем
сильнее корреляция между ξt и ξt–1. Учитывая, что для нормального
распределения k2 = 0, положительные значения k2 > 0 означают, что
кривая плотности распределения {ξt} имеет более «острую» и «высокую» вершину, а также более «тяжелые хвосты», чем кривая плотности нормального распределения. Это свойство ARCH-модели еще одно
ее достоинство при моделировании финансовых индексов, поскольку
для многих из них коэффициент эксцесса является положительным .
Модель ARCH вида (9.6), (9.7) позволяет предсказывать
величины ξT2 + l или ξT+l на l ≥ 1 шагов вперед, т. е. строить
прогнозы ξT2 + l в виде условного математического ожидания
ξT2 + l = Е{ ξT2 + l FT},
(где FT включает значения ξ t2 для прошлых моментов времени t = 1, 2,
… , T). В частности, для ARCH(1) имеет место следующая прогнозная
функция:
1 − α1l −1
ξT2 + l = α 0 (1 + α1 + α12 + ... + α1l −1 ) + α1l ξT2 = α 0
+ α1l ξT2 ,
1 − α1
Малюгин В.И. Эконометрика – 2.
Страница 8
где предполагается, что α0, α1 − статистические оценки
соответствующих параметров по реализации анализируемого
временного ряда длиной Т. Однако модель ARCH не дает ответа на
вопрос, в каком направлении будут изменяться моделируемый
показатель, поскольку знак величины ξt+l остается неизвестным.
9.2.3. МОДЕЛЬ УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
GARCH
При построении ARCH(q) по реальным данным часто
применяются достаточно большие значения порядка модели q, что
может приводить к нарушению условия (9.7) положительности σt2
некоторыми из оценок параметров {αi}(i = 1, 2, ... , q). Этой проблемы
удается избежать при использовании обобщенной ARCH-модели или
модели GARСН(p, q) порядка p ≥ 1 и q ≥ 1.
Модель условной гетероскедастичности GARСН(p,q) для
случайного процесса {ξt} вида (9.7′) определяется соотношением:
q
p
i =1
j =1
σt2 = E{ξt2Ft–1} = α0+ ∑ α i ξ 2 t − i + ∑ βi σ 2 t − j =α0+α(B)ξt2+β(B)σt2, (9.16)
где ξ1–q, ... , ξ0, σ1–p, ... , σ0 − заданные начальные значения; α0, {αi} (i =
1, 2, ... , q), {βj} (j = 1, 2, ... , p) − параметры модели, удовлетворяющие
условиям положительности σt2 > 0 (t = 1, 2, ...):
α0 > 0, αi ≥ 0, βj ≥ 0 (i = 1, 2, ... , q, j = 1, 2, ... , p).
Согласно (9.16), условные дисперсии σt2 зависят от предыдущих
значений инноваций {ξ2t–i}, (i = 1, 2, ... , q) и дисперсий {σ2t–j} (j = 1,
2, ... , p).
Обозначим wt ≡ ξt2–σt2. Сделав в (9.16) замену σt2 = ξt2–wt,
получаем представление модели GARСН(p, q) в виде модели
ARMA(m, p):
(9.17)
ξt2 = α0+(α(B) + β(B))ξ 2t–1+ wt −β(B) wt–1,
где m = max{p, q}.
Случайный ARMA-процесс {ξt2} является стационарным, если
все корни характеристического уравнения, соответствующего α(B) +
Малюгин В.И. Эконометрика – 2.
Страница 9
β(B), лежат вне единичного круга. На практике приходится иметь дело
с частным случаем данной модели при p = q = 1. На основании (9.16)
для модели GARСН(1, 1) справедливо:
σt2 = α0+α1 ξt2−1 +β1σ2t–1, t = 1, 2, ... .
(9.18)
Таким образом, модель GARСН(1, 1) зависит от трех параметров:
α0 > 0, α1 ≥ 0 и β1 ≥ 0. Представление типа (9.17) для данной модели
принимает вид:
ξt2 = α0+(α1 + β1) ξt2−1 + wt −β1wt–1,
откуда следует условие стационарности GARСН(1, 1): α1+β1 < 1.
9.2.4. ТЕСТИРОВАНИЕ И ПОСТРОЕНИЕ МОДЕЛЕЙ
УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТИ
Процесс построения моделей ARCH и GARCH для временного
ряда {xt} (t = 1, 2, …) состоит из двух следующих основных этапов.
Этап 1. Выявление эффектов условной гетероскедастичности.
Если на данном этапе устанавливаются эффекты условной
гетероскедастичности, то переходят к следующему этапу.
Этап 2. Построение модели с условной гетероскедастичностью
Целью данного этапа является построение модели (т. е. оценивание параметров и тестирование адекватности), которая наиболее
адекватно описывает выявленные эффекты условной гетероскедастичности. В качестве альтернативных вариантов могут использоваться
модели типа ARCH, GARCH и другие модели с условной
гетероскедастичностью.
На первом этапе выполняются следующие шаги.
1. Строится наилучшая модель для временного ряда {xt} в классе
моделей ARIMA или в классе регрессионных моделей, и вычисляются
остатки ξ t для построенной модели.
2. Проводится анализ ВАКФ, ВЧАКФ и Q-статистики Льюнга –
Бокса для остатков ξ t и квадратов остатков ξt2 . Говорят, что
имеют место эффекты условной гетероскедастичности типа ARCH или
GARCH, если временной ряд остатков ξ t оказывается «белым
{ }
{ }
{ }
{ }
Малюгин В.И. Эконометрика – 2.
Страница 10
{ }
шумом», а временной ряд квадратов остатков ξt2 , отличным от
«белого шума» стационарным процессом.
3. Используется тест множителей Лагранжа для ARCH-моделей
(Lagrange multiplier test for ARCH − ARCH LM test), который
реализуется следующим образом.
Для временного ряда квадратов остатков ξt2 строится модель в виде
AR(q):
(9.19)
ξt2 = α 0 + α1ξt2−1 + α 2 ξt2− 2 + ... + α q ξt2− q + ζ t .
{ }
В пользу условной гетероскедастичности свидетельствуют:
1) статистическая адекватность построенной модели, т.е. наличие
статистически значимых коэффициентов регрессии {αl} (l = 1, 2, … , q)
в модели (9.19);
2) выполнение условия ТR2 ≥ ∆(ε) (где R2 − коэффициент
детерминации построенной модели (9.19), ∆(ε) − квантиль уровня 1–ε
распределение хи-квадрат с q степенями свободы, T − длина
временного ряда остатков).
Известно, что статистика ARCH LM теста ТR2 имеет
асимптотическое при Т → ∞ распределение хи-квадрат с q степенями
свободы.
Для оценивания параметров ARCH и GARCH используется
метод максимального правдоподобия для моделей с условной
гетероскедастичностью.
Малюгин В.И. Эконометрика – 2.
Страница 11
Малюгин В.И. Эконометрика – 2.
Страница 12
ГЛАВА 10
ПОСТРОЕНИЕ РЕГРЕССИОННЫХ
МОДЕЛЕЙ ПО ЭКОНОМИЧЕСКИМ
ВРЕМЕННЫМ РЯДАМ
10.1. ОСОБЕННОСТИ ПОСТРОЕНИЯ
РЕГРЕССИОННЫХ МОДЕЛЕЙ В СЛУЧАЕ
СЛУЧАЙНЫХ ПРЕДОПРЕДЕЛЕННЫХ
ПЕРЕМЕННЫХ
Широкий класс моделей регрессионного типа может быть
представлен с помощью ОЛСМ. ОЛСМ описывается соотношением
вида:
y = Xβ + ξ ,
где
y = ( y t ) ∈ ℜT
(10.1)
– вектор значений эндогенной переменной,
x1T
– матрица значений экзогенных переменных,
X = ( xtl ) = ...
T
xT T ×m×1
β0
1,=
t 1,..., T , то β 0 –
β = ... ∈ ℜ m+1 – вектор параметров (если xt=
β
m
свободный член, β l (l = 1,..., m) – коэффициенты регрессии);
ξ = (ξ t ) ∈ ℜT – вектор случайных ошибок наблюдения.
Различные предположения относительно X, ξ , различные
ограничения на β приводят к различным вариантам ОЛСМ. Мы
рассматривали методы построения ОЛСМ в традиционных
предположениях ( X – фиксированная матрица полного ранга,
rank ( X) = m + 1 , ξ ~ N T (0, σ 2 I ) ). В этом случае МНК (ММП) – оценка
Малюгин В.И. Эконометрика – 2.
Страница 1
β
является несмещенной, состоятельной и эффективной, а
L{β} = N N (β, σ 2 ( XT X) −1 ) .
Когда имеют место автокоррелированные и гетероскедастичные
обладает
выше
ошибки,
обобщенная
МНК-оценка
βG
перечисленными
свойствами
и
L{βG } = N M +1 (β, σ 2G ) ;
ξ ~ N T (0, σ 2 Ψ ) .
Но на практике при построении моделей ОЛСМ по
экономических данным предположение о детерминированности
экзогенных переменных ( X – фиксированная матрица) часто
нарушается. В этом случае надо учитывать, что матрица X и
элементы {xtl } являются случайными. Причины случайности могут
быть различными, например:
1. при использовании пространственных данных причиной могут
быть погрешности при вычислении.
2. при использовании временных рядов лаговые значения
эндогенной переменной являются случайными величинами.
Возникает вопросы:
1) можно ли использовать ранее описанную методологию
построения и тестирования регрессионных моделей, основанную на
использовании таких методов статистического оценивания как ММП,
МНК, методов статистической проверки гипотез, если матрица X
предполагается случайной;
2) как влияют свойства временных рядов (стационарность или
нестационарность) на результаты применения традиционных методов.
В предположении, что X является случайной матрицей, можно
выделить несколько вариантов условий, при которых традиционная
технология построения регрессионных моделей остается применимой.
Укажем два варианта условий.
Теорема 10.1. Если в модели (10.1) матрица X является
случайной и выполняются условия:
1. X – матрица полного ранга с вероятностью 1;
Малюгин В.И. Эконометрика – 2.
Страница 2
2. p lim(
1
T
T
→ 0 ;
∑ xtlξ t ) T→∞
t =1
1 T
∑ xt xtT ) T→∞ → Q , где Q
T t =1
определенная матрица с конечными элементами;
3.
4.
p lim(
1
T
–
положительно
T
D
N m+1 (0, σ 2Q) ,
∑ xtlξ t →
t =1
β является асимптотически
тогда МНК (ММП) – оценка
несмещенной, состоятельной, эффективной и асимптотически
1
D
нормальной, т.е.
(β − β) →
N m+1 (β, σ 2Q −1 ) .
T
Указанные свойства делают возможным использование МНК для
построения оценки β , а асимптотическая нормальность этой оценки
при T → ∞ делает возможным использование традиционных тестов,
статистики
которых
имеют
асимптотически
стандартные
распределения. При этом объем данных должен быть достаточно
большим, чтобы выводы были достаточно точными.
Второй
набор
условий
является
развитием
первого.
Сформулируем его для модели (10.1) со случайной матрицей X .
Предположим, что X такова, что модель (10.1) включает p лаговых
значений эндогенной переменной, p < m и m – p экзогенных
переменных, m – p ≥ 1:
yt = α 0 + α1 yt −1 + ... + α p yt − p + γ T zt + ξ t ,
(10.2)
т.е. в (10.1) xtl = yt −l , l = 1,..., p; xt , p+ j = ztj , j = 1,..., M , M = m − p , таким
образом, β = (α 0 ,..., α p , γ 1 ,..., γ M )T .
Теорема 10.2. Если модель (10.2) удовлетворяет условиям:
Малюгин В.И. Эконометрика – 2.
Страница 3
1. p lim(
1
T
T
∑ zt ztT ) T→∞ → Q ;
t =1
2. {ξ t } – независимые одинаково распределенные случайные
величины, E{ξ t } = 0, D(ξ t ) = σ 2 < ∞, ∃E{ξ tn }, n = 1,2,... ;
3. cov( zt , ξ t ) = 0, cov( yt −l , ξ t ) = 0, t = 1,..., T , l = 1,..., p ;
4. выполняется условие стационарности для авторегрессионной
компоненты модели: все корни характеристического уравнения (10.3):
λ p − α1λ p−1 − ... − α p−1λ − α p = 0
(10.3)
лежат внутри единичного круга: λl < 1, l = 1,..., p ;
5. zt является M-мерным стационарным процессом,
тогда МНК – оценка β является асимптотически несмещенной,
состоятельной, эффективной и асимптотически нормальной, т.е.
D
T (β − β) →
N m+1 (β, σ 2G ) .
Таким образом, традиционный подход к построению
регрессионных моделей остается в силе и при использовании
временных рядов, если данные временных рядов являются
стационарными, а длина временного ряда T достаточно большая.
Но предположение о стационарности часто нарушается,
возможны различные типы нестационарности. Возникает вопрос, как
эти нарушения традиционных предположений отражаются на качестве
регрессионных моделей.
10.2. ЭФФЕКТЫ ПОСТРОЕНИЯ РЕГРЕССИОННЫХ
МОДЕЛЕЙ ПО НЕСТАЦИОНАРНЫМ
ВРЕМЕННЫМ РЯДАМ
Как отмечалось, многие экономические временные ряды
являются нестационарными, т.е. их вероятностные характеристики
Малюгин В.И. Эконометрика – 2.
Страница 4
(математическое ожидание и дисперсия) изменяются с течением
времени. Исследования типа нестационарности временных рядов
макроэкономических и финансовых показателей свидетельствуют о
том, что они, как правило, содержат стохастические тренды, т.е. могут
быть отнесены к классу интегрированных временных рядов I(d), d ≥ 1.
Как отмечалось ранее, построение регрессионных моделей по
нестационарным временным рядам может быть причиной
установления так называемых ложных регрессионных зависимостей
(spurious regressions) между соответствующими экономическими
переменными. Проиллюстрируем это на примере.
Пусть временные ряды {xt}, {yt} (t = 1, 2, ... , Т) описываются
моделью случайного блуждания без сноса:
xt = xt–1 + ηx, t, yt = yt–1 + ηy, t,
(10.4)
где x0, y0 − заданные начальные значения, {ηx,t}, {ηy,t} − взаимно
независимые реализации процесса белого шума, причем
E{ηx,t} = E{ηy,t} = 0, D{ζt} = ση2 ,x < ∞, D{ηy,t}= ση2 ,x < ∞.
Очевидно, в этом случае {xt}, {yt} − взаимно независимые
нестационарные интегрированные временные ряды с порядком
интегрирования, равным 1, т.е. {xt}, {yt} ∼ I(1).
Запишем уравнение линейной регрессии yt на xt:
yt = β0 + β1xt + ξt (t = 1, 2, ... , Т),
(10.5)
где β0, β1 − параметры, а ξt − случайные ошибки наблюдения.
Поскольку {xt}, {yt} − взаимно независимые по определению, то
β1 должно быть равно нулю.
Исследуем свойства случайного процесса {ξt}. Найдем
представление для ξt, подставив решения стохастических разностных
уравнений (10.4) вида:
t
xt = x0 +
∑ η x ,i ,
t
yt = y0 +
i =1
∑ η y ,i ,
i =1
в регрессионное уравнение (10.5). Получим:
Малюгин В.И. Эконометрика – 2.
Страница 5
ξt = ξ0 +
t
t
i =1
i =1
∑ η y ,i − β1 ∑ ηx,i , t = 1, 2, ... , Т,
(10.6)
где ξ0 = y0 − β0 − β1x0 − некоторое фиксированное начальное значение.
Согласно (10.6), дисперсия ξt обладает следующим свойством: ∀ β1
D{ξt} = t ( σ η2 , y + β12 σ η2 , x ) t
→ ∞ ,
→∞
т.е. случайный процесс {ξt} нестационарный по дисперсии независимо
от того, является регрессия yt на xt статистически значимой (β1 ≠ 0) или
нет (β1 = 0). Таким образом, в рассматриваемом случае нарушаются
условия корректного применения МНК, а именно − условия
постоянства и ограниченности дисперсии ошибок.
Очевидно, подобного свойства следует ожидать и от дисперсии
остатков
ξ t = yt − β 0 − β1 xt
регрессионной модели вида (10.4), построенной с помощью обычного
МНК. В этих условиях МНК-оценки β0 , β1 параметров β0, β1
оказываются смещенными и несостоятельными.
Кроме того, нестационарность ξ t является причиной больших
значений тестовых статистик R2, t и F, что увеличивает вероятность
ошибочного отклонения гипотез о статистической незначимости
параметра β1 и неадекватности модели в целом. Это в конечном итоге
приводит к установлению «ложных» регрессионных зависимостей
(spurious regressions), не имеющих на самом деле содержательной
экономической интерпретации.
{ }
На практике интегрированные временные ряды, применяемые для
построения регрессионных моделей, могут иметь различный порядок
интегрирования. Кроме того, экономические временные ряды могут
различаться типом нестационарности, т.е. помимо интегрированных
(стационарных относительно взятия разностей) могут иметь место
временные ряды, стационарные относительно детерминированного
тренда. Использование различных вариантов нестационарных
Малюгин В.И. Эконометрика – 2.
Страница 6
временных рядов при построении моделей линейной регрессии
(ОЛСМ) может приводить в итоге к различным свойствам
построенных моделей.
Возможные варианты условия моделирования на примере
модели (10.5).
1. Временные ряды {xt}, {yt} являются стационарными. В
данном случае корректно применение традиционных методов
построения ОЛСМ. Признаком адекватной модели являются остатки
ξ t , описываемые процессом «белого шума».
{ }
2. Временные ряды {xt}, {yt} являются интегрированными с
одним и тем же порядком интегрирования, т. е. {xt}, {yt} ∼ I(d) (d ≥
1), а ряд остатков ξ t является нестационарным (содержит
стохастический тренд). В рассматриваемой ситуации имеет место
ложная регрессионная зависимость.
{ }
Для исключения возможности построения ложной регрессии
целесообразно перейти к временным рядам разностей порядка d.
Например, пусть {xt}, {yt} ∼ I(1), т.е. d = 1. В этом случае следует
рассмотреть модель регрессии для первых разностей
∆yt = β1∆xt + ∆ξt, (t = 1, 2, ... , Т),
в которой временные ряды разностей являются стационарными, т. е.
∆yt, ∆xt, ∆ξt ∼ I(0). К полученной модели корректно применение
традиционных методов построения ОЛСМ.
3. Временные ряды {xt}, {yt} имеют различный тип
нестационарности. Например, {xt} является интегрированным
временным рядом I(1), а {yt} содержит детерминированный линейный
тренд. В этом случае возможно установление ложной регрессионной
зависимости при использовании обычного МНК.
4. Временные ряды {xt}, {yt} имеют различный порядок
интегрирования, т.е. {xt} ∼ I(b), {yt} ∼ I(d), d ≠ b, d, b ≥ 0.
Использование временных рядов {xt}, {yt} приводит к установлению
ложной регрессионной зависимости.
Малюгин В.И. Эконометрика – 2.
Страница 7
5. Временные ряды
{xt}, {yt} являются интегрированными с
одним и тем же порядком интегрирования, т.е. {xt}, {yt} ∼ I(d) (d ≥ 1),
а ряд остатков ξ t стационарный, т.е. ξ t ∼ I(0).
{ }
{ }
В этом случае некоторая линейная комбинация временных рядов
{xt}, {yt} является стационарным временным рядом I(0), т. е. ∃ β0 и β1
≠ 0 такие, что
ξt = yt − β0 − β1xt ∼ I(0).
(10.7)
Такие временные ряды yt на xt содержат общие стохастические тренды
и называются «коинтегрированными».
Пример. Предположим, что временные ряды {xt}, {yt}.
порождаются моделью «случайного блуждания плюс белый шум»:
xt = µt + ηx,t, yt = β0 + µt + ηy,t, µt = µt–1 + ηµ,t,
(10.8)
где β0 − некоторая константа, {ηx,t}, {ηy,t}, {ηµ,,t} − независимые
− процесс случайного
реализации процесса белого шума, µt
блуждания
Очевидно, {xt}, {yt} − нестационарные интегрированные
временные ряды с порядком интегрирования, равным 1, т. е. {xt}, {yt}
∼ I(1).
Из (10.8) следует, что существует линейная комбинация yt и xt :
yt − xt = β0 + ηx,t − ηy,t = β0 + ξt,
(10.9)
где ξt ≡ ηx,t − ηy,t ∼ I(0), причем Е{ξt} = E{ηx,t − ηy,t} = 0, D{ξt} = ση2 ,x +
σ η2 , y < ∞. Линейную комбинацию (10.9) можно рассматривать как
модель линейной регрессии yt на xt, в которой β1 = 1.
Малюгин В.И. Эконометрика – 2.
Страница 8
10.3. КОИНТЕГРИРОВАННЫЕ ВРЕМЕННЫЕ РЯДЫ
И МЕХАНИЗМ КОРРЕКЦИИ ОШИБОК
В экономической теории значительное место занимает понятие
равновесия (equilibrium), которое можно определить как «состояние
экономической системы, при котором воздействия разнонаправленных
сил взаимно погашаются таким образом, что наблюдаемые свойства
системы остаются неизменными» 1.
На понятии равновесия основана экономическая интерпретация
свойства коинтегрированности (co-integration) нестационарных
интегрированных временных рядов, а также «механизма коррекции
ошибок» (error correction mechanism). Дадим краткое изложение
подобной интерпретации.
Пусть имеется N-мерный случайный вектор
xt ,1
xt = ∈ ℜ N , t = 1, 2, ... ,
x
t ,N
компонентами которого являются нестационарные временные ряды
xt,1, … , xt,N, соответствующие экономическим переменным x1* , … , x *N
которые характеризуют состояние некоторой экономической системы.
Если экономические переменные x1* ,…, x *N тесно взаимосвязаны,
то их изменения во времени должны быть некоторым образом
согласованы, т. е. траектории временных рядов xt,1, … , xt,N, не должны
далеко друг от друга отдаляться. Если для экономической системы
существует состояние равновесия, то, очевидно, переменные x1* ,…,
x *N в равновесном состоянии должны удовлетворять определенным
ограничениям. В эконометрической теории при интерпретации
понятий «коинтегрированные временные ряды» и «механизм
1
Лопатников Л. И. Экономико-математический словарь. М.: Издательство “АBF», 1996.
С. 440.
Малюгин В.И. Эконометрика – 2.
Страница 9
коррекции ошибок» предполагается, что эти ограничения являются
линейными и принимают вид тождества:
βТx* = 0,
(10.10)
где x* = ( x1* , … , x *N )Т − вектор экономических переменных, βТ = (β1,
β2, … , βN) − вектор параметров.
Предполагается, что тождество (10.10) описывает зависимость
между экономическими переменными x1* , … , x *N , которая имеет
место в долгосрочной перспективе в состоянии равновесия. Заметим,
что все переменные в (10.10) относятся к одному и тому же моменту
времени, т.е. «долгосрочная равновесная зависимость» (long-run
equilibrium) (10.10) является статической.
В каждый конкретный момент времени, однако, имеется
некоторое случайное отклонение от равновесного состояния системы,
которое приводит к тому, что соотношение (10.10) выполняется лишь
приближенно. Это означает, что для момента времени t имеет место
долгосрочная зависимость (long-run relationship) вида:
βТxt = ξt, t = 1, 2, ... ,
(10.11)
где ξt − случайная величина, которая представляет собой отклонение
экономической системы от состояния равновесия, обусловленное
действием в момент времени t краткосрочных факторов. Данная
случайная величина интерпретируется как «неравновесная ошибка»
(disequilibrium error).
Относительно случайных ошибок {ξt} делаются следующие
очевидные предположения:
• E{ξt} = 0, т.е. отклонения от состояния равновесия являются
симметричными;
• D{ξt} << ∞, т.е. отклонения от состояния равновесия должны
быть «скорее малыми, нежели большими».
Примером зависимости вида (10.11) может служить полученное
ранее соотношение (10.9) между интегрированными временными
{yt}.
Данные
временные
ряды
являются
рядами
{xt},
интегрированными I(1), а их линейная комбинация {ξt} – это
Малюгин В.И. Эконометрика – 2.
Страница 10
стационарный временной ряд типа I(0), т. е. имеет меньший порядок
интегрированности.
Данное свойство интегрированных временных рядов позволяет
выделить среди них особое подмножество, известное как
коинтегрированные временные ряды.
Определение (Грейнджер – Энгл). Говорят, что компоненты
вектора
xt ,1
xt = ∈ ℜ N , t = 1, 2, ... ,
xt , N
являются коинтегрированными порядка d, b, обозначается CI(d, b),
если
(а) все компоненты xt являются интегрированными порядка d;
(б) существует вектор β (β ≠ 0) такой, что
ξt = βТxt ∼ I(d − b), b > 0.
Вектор β называется коинтегрирующим вектором, или вектором
коинтеграции (cointegrating vector).
Понятие механизма коррекции ошибок. Сущность
механизма коррекции ошибок проиллюстрируем на примере
эконометрического моделирования процентных ставок на финансовом
рынке.
Пусть переменная x* соответствует краткосрочной процентной
ставке (short term rate), а переменная y* − долгосрочной процентной
ставке (long term rate). Различные теории временной структуры
процентных ставок (term structure of interest rate) предполагают, что
между краткосрочными и долгосрочными процентными ставками в
долгосрочной перспективе имеет место состояние равновесия, т. е.
существует долгосрочная зависимость вида
y* − βx* = 0,
(10.12)
где β (β ≥ 1) − некоторый коэффициент пропорциональности.
В каждый конкретный момент времени t может иметь место
отклонение от равновесного состояния, определяемое соотношением
Малюгин В.И. Эконометрика – 2.
Страница 11
yt − βxt = ξt, t = 1, 2, ... ,
(10.13)
где yt, xt − значения ставок в момент времени t.
Относительно случайных ошибок {ξt} делаются предположения о
равенстве нулю математического ожидания и малости дисперсии.
Отклонения {ξt} обусловлены изменением разрыва (gap) между
краткосрочными и долгосрочными ставками. Однако существование
зависимости (10.12) приводит к тому, что этот разрыв не может
принимать произвольные значения. Другими словами, краткосрочные
и долгосрочные ставки изменяются некоторым согласованным
образом, так, что их изменения направлены на восстановление
равновесия (10.12), путем соответствующей «коррекции ошибок» {ξt}
в соотношении (10.13).
Так,
например,
в
соответствии
с
закономерностями
функционирования финансового рынка возможны следующие
варианты «реакции», краткосрочных и долгосрочных ставок на
увеличение разрыва между ними:
1) краткосрочные ставки растут, а долгосрочные ставки
снижаются либо остаются неизменными;
2) и те, и другие ставки растут, однако краткосрочные ставки
растут быстрее;
3) и те, и другие ставки снижаются, однако краткосрочные ставки
снижаются медленнее.
Модель процентных ставок, очевидно, должна учитывать
существующий «механизм коррекции ошибок» в краткосрочных
(однопериодных) изменениях процентных ставок. В соответствии с
этим «механизмом» величина и направления изменений процентных
ставок в периоде t должны определяться величиной и знаком ошибки
(отклонения от равновесного состояния) ξt–1 = yt–1−βxt–1, имевшей
место в предыдущем периоде t-1.
В
предположении,
что
временные
ряды
являются
интегрированными I(1), простейшая модель коррекции ошибок (error
correction model), реализующая описанный механизм коррекции
ошибок, для рассматриваемого случая может быть представлена в
виде:
(10.14)
∆xt = αx (yt–1 − βxt–1) + ηx,t, αx > 0,
∆yt = −αy (yt–1 − βxt–1) + ηy,t, αy > 0,
Малюгин В.И. Эконометрика – 2.
(10.15)
Страница 12
где ∆xt, ∆yt − краткосрочные (однопериодные) изменения процентных
ставок; ηx,t, ηy,t − процессы «белого шума» (возможно, взаимно
коррелированные), описывающие случайные воздействия на
процентные ставки в периоде t; αx, αy, β − параметры модели.
Соотношения (10.14), (10.15) моделируют однопериодные
приращения ∆xt, ∆yt временных рядов, т.е. описывают краткосрочные
зависимости (short-run relationships) между анализируемыми
экономическими переменными.
В соответствии с моделью (10.14), (10.15), если yt–1 − βxt–1 > 0, т. е.
в предыдущем периоде наблюдался опережающий рост долгосрочных
ставок, то в следующем периоде краткосрочные ставки должны
возрасти, а долгосрочные ставки понизиться и наоборот. Случай yt–1 −
βxt–1 = 0 означает, что в предыдущем периоде краткосрочные и
долгосрочные ставки находились в состоянии равновесия. В этой
ситуации «коррекции ошибок» нет, а изменения процентных ставок
∆xt, ∆yt обусловлены лишь краткосрочными «шоками» ηx,t, ηy,t.
Параметры модели αx, αy характеризуют скорость корректировки
(speed of adjustment): чем больше αx, αy, тем большая доля отклонения
от равновесия за прошедший период корректируется в следующем
периоде, т. е. тем значительнее изменение процентных ставок в
следующем периоде, обусловленное коррекцией ошибок.
Очевидно, для того чтобы механизм коррекции ошибок имел
место, необходимо, чтобы хотя бы один из коэффициентов αx, αy был
отличен от нуля. Это условие выполняется, если между переменными
x*, y* существует так называемая «причинная зависимость по
Грэйнджеру» (Granger causality). Если αx ≠ 0, а αy = 0, то x* не влияет
«по Грэйнджеру» на y* («x* не является причиной y*»), в то время как
y* оказывает влияние на x*. Если наоборот αy ≠ 0, а αx = 0, то также
имеет место лишь одностороннее влияние «по Грэйнджеру» со
стороны x* на y*. Если αx = αy = 0, то между переменными x*, y*
отсутствует «причинная зависимость», и модель (10.14), (10.15) не
является моделью коррекции ошибок. В данном случае, не существует
состояние равновесия, а временные ряды не коинтегрированные.
Малюгин В.И. Эконометрика – 2.
Страница 13
Заметим, что между свойством коинтегрированности временных
рядов и моделью коррекции существует тесная взаимосвязь.
Теорема о представлении (The Granger Representation Theorem)
Для любой совокупности коинтегрированных CI(1, 1) временных
рядов может быть получено представление в виде модели коррекции
ошибок и наоборот.
Это означает, что представление приращений ∆xt, ∆yt временных
рядов {xt}, {yt} ∼ I(1) в виде модели коррекции ошибок (10.14), (10.15)
{yt}
являются
возможно,
если
временные
ряды
{xt},
коинтегрированными и наоборот.
Действительно, по определению имеем: ηx,t, ηy,t, ∆xt, ∆yt ∼ I(0).
Таким образом, левые части соотношений (10.14), (10.15) – это
стационарные временные ряды. Для того чтобы соотношения (10.14),
(10.15) имели смысл, необходимо, чтобы и правые части
соответствовали стационарным временным рядам. Так как ηx,t, ηy,t −
стационарные I(0), то и временные ряды отклонений yt–1 − βxt–1, yt–1 −
βxt–1 должны быть стационарными I(0). Это может иметь место, если
временные ряды {xt}, {yt} являются коинтегрированными CI(1, 1) с
коинтегрирующим вектором βТ = (1, −β) (x* = ( y*, x*)Т).
Предположим, что ηx,t, ηy,t − процессы «белого шума» требует
отсутствия автокорреляции для временных рядов «остатков» в модели
(10.14), (10.15). Часто на практике этого удается достигнуть
включением в модели регрессионного типа лаговых переменных. В
связи с этим представляет интерес обобщение модели (10.14), (10.15)
вида:
p
p
i =1
i =1
∆xt = γ10 + αx (yt–1 − βxt–1) + ∑ γ11 (i )∆xt −i + ∑ γ12 (i )∆yt − i + (10.16)
+ ηx,t, αx > 0,
p
p
i =1
i =1
∆yt = γ20 −αy (yt–1 − βxt–1) + ∑ γ 21 (i )∆xt − i + ∑ γ 22 (i )∆yt −i + (10.17)
+ ηy,t, αy > 0,
Малюгин В.И. Эконометрика – 2.
Страница 14
где αx, αy, β, γ10, γ20, {γkl(i)} − параметры модели; ∆xt, ∆yt, yt–1−βxt–1,
{∆xt–i}, {∆yt–i} (k, l = 1, 2, i = 1, 2, … , p) − стационарные случайные
процессы, ηx,t, ηy,t − процессы белого шума.
Модель (10.16), (10.17) является моделью векторной
авторегрессии VAR(p) для первых разностей ∆xt, ∆yt. Она состоит из
двух уравнений, включающих общую экзогенную переменную ξt = yt–1
− βxt–1. Для построения подобных «почти» VAR-моделей (near VAR
models) могут использоваться методы построения обычных моделей
векторной авторегрессии.
Авторегрессионые уравнения, входящие в модель (10.16), (10.17),
включают дополнительно компоненты αx(yt–1−βxt–1) и −αy(yt–1−βxt–1),
обеспечивающие коррекцию ошибок. Такие модели принято называть
векторными моделями коррекции ошибок (vector error correction
models − VECM). Соотношение между моделью коррекции ошибок и
свойством коинтегрированности временных рядов было впервые
установлено К. Грэйнджером. Им же впоследствии была доказана
теорема Грэйнджера о представлении (The Granger Representation
Theorem.
10.4. ПОСТРОЕНИЕ МОДЕЛИ КОРРЕКЦИИ
ОШИБОК НА ОСНОВЕ ПОДХОДА ЭНГЛАГРЕЙНДЖЕРА
Существует несколько подходов к построению моделей
коррекции ошибок по коинтегрированным временным рядам:
− подход Энгла − Грэйнджера (Engle − Granger aproach);
− подход Стока − Ватсона (Stock − Watson aproach);
− подход Йохансена (Johansen aproach).
Подход Энгла − Грэйнджера является наиболее простым для
реализации, однако имеет ограниченные возможности. Он может
использоваться в некоторых случаях для построения моделей
Малюгин В.И. Эконометрика – 2.
Страница 15
коррекции ошибок по нескольким переменным. Два других подхода
более универсальны.
В данном параграфе на примере модели вида (10.16)−(10.17)
опишем процесс построения модели коррекции ошибок (error
correction model − ECM) на основе подхода Энгла − Грэйнджера,
включающий следующие шаги.
1. Предварительный анализ временных рядов.
Цель этапа – исследование стационарности и определение порядка
интегрированности для интегрированных нестационарных временных
рядов, используемых для построения ЕСМ. Для тестирования
временных рядов (в рассматриваемом примере − это {xt}, {yt} (t = 1, 2,
… , T)) применяются тесты единичного корня, например ADF-тест.
Возможны следующие результаты тестирования временных
рядов: 1) xt , yt − стационарные временные ряды; 2) xt , yt −
интегрированные временные ряды с различными порядками
интегрирования;
3) xt , yt − интегрированные временные ряды с
одинаковым порядком интегрирования d = 1.
Очевидно, в первом случае целесообразно использовать
традиционные методы построения регрессионных моделей. Во втором
случае построение ЕСМ невозможно, поскольку временные ряды
xt , yt не могут быть коинтегрированными. В третьем случае
построение ЕСМ возможно, если xt , yt являются коинтегрированными
временными рядами СI(1, 1). Проверка данного свойства
осуществляется на следующем этапе.
2. Тестирование коинтегрированности временных рядов и оценивание
долгосрочной зависимости
В
рамках
данного
подхода
для
тестирования
коинтегрированности временных рядов используются тесты
коинтегрированности, основанные на анализе остатков (residualbased tests for cointegration) регрессионной модели, соответствующей
предполагаемой долгосрочной зависимости.
Малюгин В.И. Эконометрика – 2.
Страница 16
В рассматриваемом примере модель долгосрочной зависимости −
это модель линейной регрессии yt на xt:
yt = β0 + β1xt + ξt, t = 1, 2, ... , Т,
(10.18)
где β0, β1 − параметры, а ξt − случайные ошибки наблюдения.
С помощью обычного МНК находятся оценки β 0 ,β1 параметров
модели, и вычисляется ряд остатков
(10.19)
ξ t = yt − β 0 − β1 xt .
На предыдущем этапе было установлено, что {xt}, {yt} ∼ I(1).
Поэтому, если временной ряд остатков ξ t нестационарный (т. е.
содержит стохастический тренд), то это означает, что временные ряды
{xt}, {yt} не являются коинтегрированными и наоборот, если ξ t ∼
I(0), то {xt}, {yt} − коинтегрированные временные ряды. Таким
образом, задача тестирования коинтегрированности {xt}, {yt}
эквивалентна задаче тестирования стационарности остатков ξ t
модели (10.18).
{ }
{ }
{ }
Для тестирования стационарности временных рядов могут
использоваться тесты единичного корня, в том числе DF- и ADFтесты. Эти же тесты, однако с другими критическими значениями,
могут применяться и для тестирования остатков регрессионной
модели по коинтегрированным временным рядам. Опишем данный
способ тестирования на примере АDF-теста. Тестируемая модель при
этом имеет вид:
∆ ξ t = δ ξ t −1 +
m
∑ α i ∆ξt −i + ηt,
i =1
t = 1, 2, ... , Т,
т. е. не включает константу и временной тренд, поскольку исходная
регрессионная модель (10.18) содержит свободный член, а
тестируемые временные ряды содержат тренды.
Относительно параметра δ проверяется гипотеза Н0: δ = 0 при
альтернативе Н1: δ < 0. Принятие нулевой гипотезы на заданном
уровне значимости ε означает нестационарность временного ряда
Малюгин В.И. Эконометрика – 2.
Страница 17
{ }
остатков ξ t , а, следовательно, некоинтегрированность временных
рядов {xt}, {yt}. Если гипотеза Н0 отклоняется, то ряд остатков следует
признать стационарным, а тестируемые временные ряды
коинтегрированными CI(1, 1). В этом случае остатки ξ t вида (10.19)
можно интерпретировать как оценки отклонений от долгосрочной
зависимости и использовать на третьем этапе при статистическом
оценивании параметров ЕСМ.
{ }
Таким образом, в процедуре тестирования коинтегрированности в
рамках подхода Энгла – Грэйнджера можно выделить два этапа: этап
получения временного ряда оценок отклонений от долгосрочной
зависимости и этап тестирования его стационарности. Такая
двухэтапная процедура тестирования имеет существенные недостатки,
о которых будет говориться ниже.
Необходимость использования «специальных» критических
значений обусловлена тем, что объектом тестирования является не сам
регрессионной модели,
ξt
временной ряд {ξt}, а остатки
построенной с помощью метода наименьших квадратов. Дисперсия
временного ряда ξ t в силу особенностей МНК, основанного на
минимизации суммы квадратов отклонений, оказывается меньше, чем
дисперсия {ξt}. Это может быть причиной ошибочного признания
остатков ξ t стационарным временным рядом. Данная проблема не
возникает, если параметры β0, β1 априорно известны, что, однако,
редко бывает на практике.
{ }
{ }
{ }
Заметим также, что если тестируемые временные ряды являются
коинтегрированными,
то
МНК-оценки
параметров
β 0 ,β1
регрессионной модели являются «супер-состоятельными» (superconsistent). Это означает, что скорость сходимости данных оценок при
Т → ∞ к истинным значениям параметров выше, чем у оценок,
построенных при обычном предположении о стационарности
временных рядов.
3. Оценивание параметров и тестирование адекватности модели
коррекции ошибок.
Малюгин В.И. Эконометрика – 2.
Страница 18
На данном этапе находятся оценки параметров модели вида
(10.16)−(10.17) в предположении, что в оцениваемых зависимостях
вместо неизвестных истинных значений отклонений ξt = yt–1 − βxt–1
используются их оценки ξ t , найденные на втором этапе. Таким
образом, оцениваемая модель принимает вид:
{ }
p
p
i =1
i =1
p
p
i =1
i =1
∆xt = γ10 + αx ξ t −1 +
∑ γ11 (i )∆xt −i + ∑ γ12 (i )∆yt −i + ηx,t,
∆yt = γ20 + αy ξ t −1 +
∑ γ 21 (i )∆xt −i + ∑ γ 22 (i )∆yt −i + ηy,t,
(10.20)
(10.21)
где αx, αy, γ10, γ20, {γkl(i)} − оцениваемые параметры модели; ηx,t, ηy,t −
случайные ошибки, относительно которых предполагается, что они
являются белым шумом.
Поскольку все временные ряды ∆xt, ∆yt, ξ t −1 , {∆xt–i}, {∆yt–i} (k, l =
1, 2, i = 1, 2, … , p) являются стационарными, а уравнения
(10.20)−(10.21) включают только общую экзогенную переменную, то
для оценивания параметров модели (10.20)−(10.21) могут
использоваться методы (МНК, ММП), применяемые для оценивания
параметров обычных VAR-моделей.
Тестирование адекватности модели (10.20)−(10.21) предполагает
проведение следующих исследований:
1) анализ остатков {η x,t }, η y,t уравнений (5.77)−(5.78): при
{ }
правильно выбранном порядке авторегрессии р остатки должны быть
белым шумом;
2) проверка гипотезы о статистической значимости свободных членов
γ10, γ20, а также коэффициентов авторегрессии {γkl(i)} на основе t- и Fстатистик;
3) проверка на основе t-статистики гипотезы о статистической
значимости регрессионных коэффициентов ax, ay, характеризующих
скорость коррекции ошибок: по крайней мере, один из них должен
быть статистически значимым, чтобы осуществлялась коррекция
Малюгин В.И. Эконометрика – 2.
Страница 19
ошибок. Если статистически значимыми являются оба коэффициента
ax, ay, то для рассматриваемого примера они должны быть
противоположного знака: αx > 0, αy < 0.
Перечислим проблемы, ограничивающие применение данного
подхода.
1. Процедура тестирования коинтегрированности не инвариантна
относительно выбора эндогенной переменной в уравнении
долгосрочной зависимости.
Этот недостаток может быть причиной противоположных
выводов относительно коинтегрированности тестируемых временных
рядов, получаемых для различных вариантов выбора эндогенной
переменной. Данная проблема усугубляется при увеличении
размерности N вектора анализируемых переменных. В описанном
выше примере x*=(y*, x*)Т − двухмерный вектор (N = 2), а в качестве
эндогенной использовалась переменная y*.
2. Отсутствие обоснованного алгоритма выбора коинтегрирующего
вектора при N ≥ 3.
Если N ≥ 3, то возможно существование N − 1 коинтегрирующих
векторов, каждому из которых соответствует свое представление
долгосрочной зависимости.
3. Существование двух этапов в процедуре тестирования коинтегрированности.
Данный недостаток проявляется в том, что погрешности оценок
отклонений ξt , получаемые на первом этапе процедуры, могут
существенно повлиять на результаты тестирования коинтегрированности, осуществляемого на втором этапе.
{ }
В рамках подходов Стока − Ватсона и Йохансена используются
совместные процедуры оценивания и тестирования для произвольного
значения N, позволяющие избежать указанных проблем.
Малюгин В.И. Эконометрика – 2.
Страница 20
10.5. ОСОБЕННОСТИ ПРЕДСТАВЛЕНИЯ И
СПЕЦИФИКАЦИИ ВЕКТОРНОЙ МОДЕЛИ
КОРРЕКЦИИ ОШИБОК (VECM)
Рассмотрим векторный временной ряд yt = ( ytl ) ∈ ℜ N , N ≥ 1 .
Простейшая форма модели VAR(p) для данного временного ряда
имеет вид:
yt = A1 yt −1 + ... + At yt − p + ξ t ,
(10.22)
где { Al }, l = 1,..., p - матрица параметров модели, ξ t - векторный
процесс белого шума, E{ξ t } = 0 ∈ ℜ N , cov(ξ t , ξτ ) = σ tτ Σ, Σ = ΣT > 0,
cov(ξ ti , ξ tj ) ≠ 0, i ≠ j , cov(ξ ti , ξτj ) = 0, t ≠ τ , ∀i, j; y1− p ,..., y0
- начальные
условия. Аналогично случаю N = 1 могут быть определены условия
стационарности: E{ yt } = µ = const , cov( yt , yt −τ ) = R y (τ ), ∀t ,τ .
Корни характеристического уравнения:
λ p I N − λ p−1A1 − ... − λA p−1 − A p = 0
лежат внутри единичного корня λl < 1, l = 1,..., N p .
Могут использоваться и более общие случаи, например, VAR со
свободным членом, свободным членом и линейным трендом, с
экзогенными переменными.
Пусть
A( L) = I − A1L − ... − A p Lp ,
(10.23)
A( L) yt = ξ t ,
(10.24)
A( L) yt = β 0 + β1t + ξ t ,
(10.25)
где β 0 - вектор констант, β1 определяет коэффициент при t.
Структурная VAR имеет вид:
A( L) yt = Bzt + ξ t ,
Малюгин В.И. Эконометрика – 2.
(10.26)
Страница 21
где zt = ( ztl ) ∈ ℜ m , m ≥ 1, {ztl } - стационарный временной ряд, B –
матрица параметров (коэффициентов регрессии вектора yt на вектор
zt ). В частном случае, когда p = 0, т.е. не включаются лаговые
значения y, имеем:
y t = Bz t + ξ t -
(10.27)
модель многомерной регрессии yt на zt (обобщение одномерной
ОЛСМ). Данная модель допускает обобщение, когда наборы
экзогенных переменных отличаются для различных компонент ytl .
Если VAR(p) удовлетворяет условиям стационарности, то можем
использовать традиционные методы оценивания параметров (МНК,
ММП и т.д.) и стандартный набор тестов (значимости коэффициентов
регрессии, адекватности модели в целом и т.д.).
При построении модели возникает проблема оценивания порядка
р. Для выбора оптимального значения параметра используется
принцип экономичности, который предполагает сочетание тестов
значимости коэффициентов и анализ информационных статистик
(AIC, SC).
Лемма 10.1. Модель
VAR(p) вида
представление в форме коррекции ошибок:
(10.22)
допускает
p −1
∆yt = Πyt −1 + ∑ Γl ∆yt −l + ξ t , t = 1,..., T ,
(10.28)
l =1
где матрица
p
Π = ∑ Al − I N ,
(10.29)
l =1
p
Γl = − ∑ Ai , l = 1,..., p − 1 .
(10.30)
i =l +1
Доказательство: Используем метод математической индукции:
1. р = 1, тогда
yt = Ayt −1 + ξ t ,
Малюгин В.И. Эконометрика – 2.
Страница 22
∆yt = ( A − I ) yt −1 + ξ t , Π = A1 − I .
2. р = 2, тогда
yt = A1 yt −1 + A 2 yt −2 + ξ t ,
∆yt = (A1 − I ) yt −1 + A 2 yt −1 − A 2 yt −1 + A 2 yt −2 + ξ t = (A1 + A 2 − I ) yt −1 −
− A 2 ( yt −1 - yt −2 ) + ξ t .
Аналогично для р = 3,4,…■
При построении VAR по коинтегрированным временным рядам
нужно учитывать возникающие вследствие коинтегрированности
временных рядов yt1 ,..., ytN ограничения на параметры модели { Al } ,
таким образом, приходят к модели VAR с ограничениями на
параметры (Restricted VAR). RVAR в форме коррекции ошибок
допускает представление, которое называют VECM.
В форме (10.28) критическим для свойств временного ряда { yt }
является свойство матрицы Π , в частности можно выделить три
случая:
1. rank (Π ) = n , т.е. Π - матрица полного ранга, тогда все собственные
значения
{λi }, i = 1,..., N p
лежат внутри единичного круга, т.е.
временной ряд { ytl }, l = 1,..., N является стационарным и допустимо
использование традиционных методов оценивания и тестирования
VAR. При этом процесс построения VAR в формах (10.22) и (10.28)
приводит к идентичным результатам.
2. rank (Π ) = 0 ⇒ Π = 0, т.е.
p
∑ Al
l =1
= I N . Из формулы (10.28) следует,
что имеет место обычная модель VAR(p) для ∆ytl , l = 1,..., N , поэтому,
если ∆ytl ~ I (0) , т.е. { ytl } ~ I (1) , то можно использовать традиционные
методы построения VAR и временные ряды { ytl } удовлетворяют
только необходимым условиям коинтегрированности, но не являются
коинтегрированными, поэтому механизм коррекции ошибок не
работает.
Малюгин В.И. Эконометрика – 2.
Страница 23
3. rank (Π ) = r ,1 ≤ r ≤ N − 1 , т.е. Π - матрица неполного ранга, тогда
среди характеристических корней {λi }, i = 1,..., N p имеется N – r
единичных корней, остальные r корней меньше 1. В этом случае
матрица Π допускает факторизацию:
Π = α ⋅ βT ,
(10.31)
где α, β ~ ( N × r ), rank (α ) = rank (β) = r .
С учетом (10.31) и на основании (10.28)
редуцированную форму представления VECM вида:
получаем
p −1
∆yt = αβT yt −1 + ∑ Γl ∆yt − l + ξ t .
(10.32)
l =1
Матрица β при этом является матрицей коинтегрирующих
векторов:
β1T
βT = ... , β lT = ( β l1 ,..., β lN ) T
βr
l- ый коинтегрирующий вектор, r - ранг коинтеграции,
определяющий количество коинтеграционных соотношений:
βT yt −1 = ζ t −1 ,
(10.33)
где ζ t −1 = (ζ t −1, i ) ∈ ℜ r - вектор отклонений от долгосрочных
равновесных зависимостей в момент времени t - 1, α - матрица
коэффициентов, характеризующих скорость коррекции ошибок в
VECM.
Малюгин В.И. Эконометрика – 2.
Страница 24
10.6. ПОСТРОЕНИЕ VECM С ПОМОЩЬЮ
ПОДХОДА ЙОХАНСЕНА
Процедура построения
следующих основных задач:
модели
(10.32)
включает
решение
1. Оценка ранга коинтеграции r, если { ytl } ~ I (1) ; тестирование
свойств коинтегрированности, определение количества
коинтеграционных соотношений;
2. Оценивание матрицы β , получение временного ряда остатков
{ζ t }, t = 1,..., T .
3. Оценивание матрицы α и других параметров. В расширенных
спецификациях нужно оценивать дополнительные параметры.
В рамках подхода Энгла – Грейнджера этапы 2 - 3
осуществляются последовательно, а в рамках процедуры Йохансена
задачи 2 и 3 решаются одновременно. При тестировании
коинтегрируемости в рамках подхода Энгла – Грейнджера и при
использовании процедуры Йохансена может использоваться различная
спецификация тестируемой модели. В частности, в модель yt , т.е. в
VAR могут включаться константа и линейный тренд; в
коинтеграционное соотношение для ζ t - также константа и линейный
тренд.
Включение дополнительных компонент осуществляется при
спецификации соответствующих уравнений, при этом модель для
∆yt может также содержать константу и линейный тренд. Значимость
соответствующих
коэффициентов
тестируется
традиционным
образом.
Пример 1. Рассмотрим модель VAR(1), N = 2;
yt a11 a12 yt −1 ξ t , y
.
=
+
xt a21 a22 xt −1 ξ t , x
Получим представление в форме коррекции ошибок:
Малюгин В.И. Эконометрика – 2.
Страница 25
yt = a11 yt −1 + a12 xt −1 + ξ t , y
xt = a21 yt −1 + a22 xt −1 + ξ t , x
;
(10.34)
∆yt = (a11 − 1) yt −1 + a12 xt −1 + ξ t , y
∆xt = a21 yt −1 + (a22 − 1) xt −1 + ξ t , x
∆yt = (a11 − 1)( yt −1 −
a12
xt −1 ) + ξ t , y
1 − a11
1 − a22
∆xt = a21 ( yt −1 −
xt −1 ) + ξ t , x
a21
∆yt = α y ( yt −1 − βxt −1 ) + ξ t , y
∆xt = α x ( yt −1 − βxt −1 ) + ξ t , x
где
;
(10.35)
;
(10.36)
,
a12
1 − a22
a a
=
= β ; α y = 1 − a11 = − 12 21 ; α x = a21 .
1 − a11
a21
1 − a22
Если временные ряды { yt }, {xt } удовлетворяют необходимым
условиям коинтегрированности, то накладываем дополнительные
ограничения: исключаем условие α x = α y = 0 и необходимо, чтобы
выполнялось условие: α x > 0, α y > 0 .
Малюгин В.И. Эконометрика – 2.
Страница 26
Примеры.
1. Модели исходных временных рядов (регрессоров):
yt = βxt + ξ t , y
xt = xt −1 + ξ t , x
•
.
Представление в форме коррекции ошибок:
yt = βxt −1 + βξ t , x + ξ t , y ,
∆yt = −( yt −1 − βxt −1 ) + ut
∆xt = ξ t , x
•
,
Коинтеграционное уравнение и коэффициенты «альфа»:
ζ t = yt −1 − βxt −1 ; α y = −1; α x = 0 ,
т.е. коррекция ошибок происходит только для у.
5. Модели исходных временных рядов (регрессоров):
yt = βxt + β 0 + β1t + ξ t , y
xt = xt −1 + γ 0 + γ 1t + ξ t , x
•
,
Представление в форме коррекции ошибок:
yt = βxt −1 + β 0 + β1t + βγ 0 + βγ 1t + βξ t , x + ξ t , y ,
∆yt = −( yt −1 − βxt −1 − β 0 − β1t ) + βγ 0 + βγ 1t + ut
∆xt = γ 0 + γ 1t + ξ t , x
•
,
коинтеграционное уравнение и коэффициенты «альфа»:
ζ t = yt −1 − βxt −1 − β 0 − β1t; α y = −1; α x = 0 .
Малюгин В.И. Эконометрика – 2.
Страница 27
ГЛАВА 10. Приложение
Векторная модель коррекции
ошибок VECM. Методы оценивания
параметров и тестирования
адекватности VECM в рамках
подхода Йохансена
1.
Коинтегрированные временные ряды и
модель коррекции ошибок
2.
Модель коррекции ошибок с одним
коинтеграционным соотношением
3.
Векторная модель коррекции ошибок VECМ
4.
Подход Йохансена: общая характеристика
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
1
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
2
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
3
2. Модель коррекции ошибок с одним
коинтеграционным соотношением
Авторегрессионная форма модели
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
4
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
5
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
6
Теорема о представлении Грейнджера
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
7
Регрессионная (треугольная) форма
модели коррекции ошибок
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
8
Примеры попарно коинтегрированных
временных рядов
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
9
Тесты коинтеграции для одного уравнения
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
10
Варианты спецификаций CE и RE
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
11
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
12
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
13
Пример тестирования коинтеграции
J1
2.6
2.4
2.2
2.0
1.8
1.6
1.4
10
20
30
40
50
60
70
80
90
100
60
70
80
90
100
J2
.4
.2
.0
-.2
-.4
10
13.04.2016 12:15
20
30
40
50
В.И. Малюгин. Прикладная
эконометрика - 2
14
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
15
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
16
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
17
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
18
D2
.3
.2
.1
.0
-.1
-.2
10
20
30
40
50
60
70
80
90
100
60
70
80
90
100
D1
120
100
80
60
40
20
10
13.04.2016 12:15
20
30
40
50
В.И. Малюгин. Прикладная
эконометрика - 2
19
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
20
3. Векторная модель коррекции ошибок
VECM
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
21
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
22
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
23
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
24
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
25
4. Подхода Йохансена:
общая характеристика подхода
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
26
Лекция 6.
Выбор спецификации модели VECM и
тестирование ранга коинтеграции в
рамках подхода Йохансена
1.
Спецификации модели VECM в рамках
подхода Йохансена
2.
Тестирование ранга коинтеграции
3.
Построение VECM в EViews
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
27
1.Спецификации модели VECM в
рамках подхода Йохансена
Цель тестирования: определение ранга коинтеграции r.
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
28
Возможные варианты:
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
29
Предположения, используемые при выборе
спецификации VECM
Исходные временные ряды (data) могут:
1) не включать детерминированные тренды;
2) включать детерминированные линейные
тренды;
3) включать детерминированные квадратичные
тренды.
В коинтеграционные уравнения (долгосрочные
зависимости - СЕ) могут включаться константа,
константа и линейный тренд;
В VAR (краткосрочные зависимости) может
включаться константа.
Спецификации 1 и 2
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
30
Возможны 5 вариантов спецификации модели:
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
31
Варианты 1 и 2
Варианты 3 и 4
Вариант 5
В вариантах 3 и 5 в VAR включается константа.
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
32
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
33
2. Тестирование ранга
коинтеграции
Тест максимального собственного значения
(Maximum Eigenvalue Test)
(тестирование начинается с=
r * 0, r ∈ {0,1,..., N })
не отклоняется, если P > ε,
гипотеза H 0
если P ≤ ε,
отклоняется,
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
34
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
35
Трейс-тест (тест «следа матрицы»)
(Trace test)
(тестирование начинается с=
r * 0, r ∈ {0,1,..., N })
не отклоняется, если P > ε,
гипотеза H 0
если P ≤ ε,
отклоняется,
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
36
не отклоняется, если P > ε,
гипотеза H 0
если P ≤ ε,
отклоняется,
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
37
Примеры использования тестов
D2
.3
.2
.1
.0
-.1
-.2
10
20
30
40
50
60
70
80
90
100
60
70
80
90
100
D1
120
100
80
60
40
20
10
13.04.2016 12:15
20
В.И. Малюгин. Прикладная
эконометрика - 2
30
40
50
38
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
39
не отклоняется, если P > ε,
гипотеза H 0
если P ≤ ε,
отклоняется,
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
40
Анализ влияния выбора спецификации
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
41
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
42
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
43
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
44
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
45
Анализ влияния выбора порядка авторегрессии
Тесты ранга коинтеграции, р=0
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
46
COINTEQ03
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
10
13.04.2016 12:15
20
30
40
50
60
В.И. Малюгин. Прикладная
эконометрика - 2
70
80
90
100
47
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
48
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
49
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
50
Тесты ранга коинтеграции, р=1
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
51
Тесты ранга коинтеграции, р=2
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
52
Тесты ранга коинтеграции, р=4
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
53
Тесты ранга коинтеграции, р=5
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
54
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
55
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
56
Анализ коинтеграционных остатков
(неравновесных ошибок)
Differenced E1
E1
60
.60
50
.56
40
.52
30
.48
20
.44
10
10
20
30
40
50
60
70
80
90
.40
100
10
20
30
I1
40
50
60
70
80
90
100
70
80
90
100
Differenced I1
60
.54
50
.53
.52
40
.51
30
.50
20
.49
10
.48
10
20
30
40
13.04.2016 12:15
50
60
70
80
90
.47
100
10
20
В.И. Малюгин. Прикладная
эконометрика - 2
30
40
50
60
57
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
58
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
59
COINTEQ01
36.55
36.50
36.45
36.40
36.35
36.30
36.25
36.20
36.15
10
13.04.2016 12:15
20
30
40
50
60
70
В.И. Малюгин. Прикладная
эконометрика - 2
80
90
100
60
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
61
Оценивание параметров и
тестирование адекватности
VECM
U1
600
500
400
300
200
100
10
20
30
40
50
60
70
80
90
100
60
70
80
90
100
U2
.6
.4
.2
.0
-.2
-.4
10
13.04.2016 12:15
20
30
40
50
В.И. Малюгин. Прикладная
эконометрика - 2
62
Оценивание VAR
D1 Residuals
60
40
20
-20
-40
-60
10
20
30
40
50
60
70
80
90
100
70
80
90
100
D2 Residuals
.16
.12
.08
.04
.00
-.04
-.08
-.12
-.16
10
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
20
30
40
50
60
63
Тестирование ранга коинтеграции
p=1
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
64
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
65
Тестирование ранга коинтеграции
p=0
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
66
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
67
Оценивание VECM
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
68
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
69
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
70
Неравновесные ошибки
(Cointegration relation)
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
71
Остатки для краткосрочных
зависимостей
RESID03
.2
.1
.0
-.1
-.2
-.3
10
20
30
40
50
60
70
80
90
100
70
80
90
100
RESID04
.08
.04
.00
-.04
-.08
10
13.04.2016 12:15
20
30
40
50
60
В.И. Малюгин. Прикладная
эконометрика - 2
72
Корреляционный анализ
Autocorrelations with 2 Std.Err. Bounds
Cor(D1,D1(-i))
Cor(D1,D2(-i))
.3
.3
.2
.2
.1
.1
.0
.0
.1
-.1
.2
-.2
.3
-.3
1
2
3
4
5
6
7
8
9
10
11
1
12
2
3
4
Cor(D2,D1(-i))
5
6
7
8
9
10
11
12
9
10
11
12
Cor(D2,D2(-i))
.3
.3
.2
.2
.1
.1
.0
.0
.1
-.1
.2
-.2
.3
-.3
1
2
3
4
5
6
13.04.2016 12:15
7
8
9
10
11
12
1
2
В.И. Малюгин. Прикладная
эконометрика - 2
3
4
5
6
7
8
73
Анализ нормальности
распределения остатков
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
74
Прогнозирование на основе
VECM
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
75
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
76
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
77
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
78
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
79
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
80
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
81
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
82
250
200
150
100
50
-50
-100
-150
74
13.04.2016 12:15
76
78
80
82
84
86
В.И. Малюгин. Прикладная
P_T
S_T
эконометрика
- 2 PSTAR_T
88
83
Долгосрочная равновесная зависимость
Pt_t –Pstar_t – S_t =0
Z_T
50
40
30
20
10
-10
-20
-30
74
76
78
80
82
84
86
88
Отклонения от равновесной зависимости
Z_T=Pt_t –Pstar_t – S_t
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
84
Указание:
использовать предлагаемую спецификацию
теста Энгла - Грейнджера
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
85
13.04.2016 12:15
В.И. Малюгин. Прикладная
эконометрика - 2
86
Литература
Основная
1. Айвазян, С.А. Прикладная статистика. Основы эконометрики. / С.А.
Айвазян − Москва: ЮНИТИ, 2002. − Т. 2.
2. Вербик, М. Путеводитель по современной эконометрике. / М. Вербик.
− М.: Научная книга, 2008.
3. Харин, Ю.С. Эконометрическое моделирование. / Ю.С. Харин, В.И.
Малюгин, А.Ю. Харин − Минск: БГУ, 2003.
4. Доугерти, К. Введение в эконометрику. – Москва: Дело, 2008.
5. Магнус, Я.Р. Эконометрика. Начальный курс. / Я.Р. Магнус, П.К.
Катышев, А.А. Пересецкий − Москва: Дело, 2008.
6. Носко, В.П. Эконометрика. Книги 1, 2. / В.П. Носко. − Москва: Дело,
2011.
7. Русилко, Т.В. Эконометрика / Т. В. Русилко, Г. А. Хацкевич. – Гродно:
ГрГУ им. Я. Купалы, 2014.
8. Dougherty, С. Introduction to Econometrics. 3 Ed. / C. Dougherty, Oxford
Academ, 2011.
9. Greene, W. Econometric Analysis. / W. Greene − Macmillan Publishing
Company, N.Y., 2007.
10. Hamilton, J. D. Time series analysis. / J. D. Hamilton. − Princeton
University Press, 1994.
11. Lutkepohl, H. New introduction to multiple time series analysis. / H.
Lutkepohl − Druckhaus Beltz, Hemsbac, 2006.
1.
2.
3.
4.
5.
6.
Дополнительная
Елисеева, И.И. Эконометрика. / И.И Елисеева − Москва: Финансы и
статистка, 2004.
Малюгин, В.И. Рынок ценных бумаг: количественные методы анализа. /
В.И. Малюгин − Москва: Дело, 2003.
Малюгин, В.И. Методы анализа многомерных эконометрических
моделей с неоднородной структурой. – Минск: БГУ, 2014.
Харин, Ю.С. Математические и компьютерные основы статистического
моделирования и анализа данных. / Ю.С. Харин, В.И. Малюгин, М.С.
Абрамович − Минск: БГУ, 2013.
Johnston, J., DiNardo, J. Econometric methods. / J. Johnston, J. DiNardo −
New York: John Wiley and Sons, 1997.
Johansen, S. Likelihood-Based Inference in Cointegrated Vector
Autoregressive Models / S. Johansen − 2nd ed. Oxford University Press,
1996.