Корреляция по времени
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Корреляция по времени
Корреляция по времени
Модели второго класса обобщенных регрессионных моделей с корреляцией по
времени, как правило, используются при анализе данных, имеющих характер
временных рядов. В этих случаях часто приходится принимать во внимание то
обстоятельство, что наблюдения в разные моменты времени статистически
зависимы (типичный пример – ежедневный обменный курс доллара по отношению к
рублю). Следовательно, ошибки, относящиеся к разным наблюдениям (разным
моментам времени), могут быть коррелированы, и ковариационная матрица вектора
ошибок не является диагональной. Формально проблему оценивания неизвестных
параметров решает обобщенный метод наименьших квадратов. Однако его
применение требует знания матрицы ковариаций Ω вектора ошибок, что бывает
крайне редко.
Авторегрессионный процесс первого порядка
При анализе временных рядов часто приходится учитывать статистическую
зависимость наблюдений в разные моменты времени. Иными словами, для многих
временных рядов предположение о некоррелированности ошибок не выполняется.
Рассмотрим наиболее простую модель, в которой ошибки образуют так называемый
авторегрессионный процесс первого порядка. Применение обычного метода
наименьших квадратов к этой системе дает несмещенные и состоятельные оценки
параметров, однако можно показать, что получаемая при этом оценка дисперсии
оказывается смещенной вниз, что может отрицательно сказаться при проверке
гипотез о значимости коэффициентов. Образно говоря, МНК рисует более
оптимистичную картину регрессии, чем есть на самом деле.
Рассмотрим модель
y = Xβ + ε ,
(1)
где t -я компонента вектора у представляет значение зависимой переменной в
момент времени t , t = 1,..., n . Будем для определенности считать, что первым
регрессором в X является константа. Запишем подробнее уравнение для наблюдения
в момент времени
Эконометрическое моделирование Лекция № 7
1
Корреляция по времени
yt = β1 + β 2 xt 2 + ... + β k xtk + ε t = xt′β + ε t ,
(2)
где xt′ = (1, xt 2 ,..., xtk ) − t -я строка матрицы X.
Один из наиболее простых способов учета коррелированности ошибок (в
разные
моменты
времени)
состоит
{ε t , t = 1,..., n}
последовательность
в
предположении,
что
случайная
образует авторегрессионный процесс первого
порядка. Это означает, что ошибки удовлетворяют рекуррентному соотношению
ε t = ρε t −1 + vt ,
где
{vt , t = 1,..., n} − последовательность
(3)
независимых нормально распределенных
случайных величин с нулевым средним и постоянной дисперсией σ v2 , а
ρ − некоторый параметр, называемый коэффициентом авторегрессии (| ρ | < 1).
Строго говоря, для полного описания модели надо определить ε 0 . Будем считать,
что ε 0 – нормальная случайная величина с нулевым средним и дисперсией
σ ε2 = σ v2 /(1 − ρ 2 ) , не зависящая от {vt , t = 1,..., n}. Взяв математическое ожидание от
обеих частей (3), получим Eε t = Eρε t −1 , откуда следует, что Eε t = 0 , t = 1,..., n .
Поскольку ε t −1 выражается через v1 ,..., vt −1 (3), то ε t −1 и vt независимы. Поэтому
( )
( ) ( )
( )
E ε t2 = E (ρε t −1 + vt ) = ρ 2 E ε t2−1 + E vt2 = ρ 2 E ε t2−1 + σ v2 ,
2
( )
(4)
Легко проверяется, что если E ε 02 = σ v2 /(1 − ρ 2 ) , то
σ ε2 = E (ε t2 ) = V (ε t ) = σ v2 /(1 − ρ 2 ) , t = 1,..., n
(5)
Умножая (4) на ε t −1 и вновь пользуясь независимостью ε t −1 и vt получим
(
(
)
(
)
E ε t ε t −1 = cov ε t ε t −1 = ρV (ε t −1 ) = ρσ ε2 .
)
(6)
Аналогично cov ε t ε t − 2 = ρ 2σ ε2 и вообще
(
)
cov ε t ε t − m = ρ mσ ε2 .
(7)
Таким образом, последовательность { ε t } образует стационарный случайный
процесс. Именно этим обстоятельством диктовался выбор параметров начальной
величины ε 0 На самом деле, с течением времени зависимость от ε 0 быстро
уменьшается, поэтому в большинстве книг по эконометрике проблему начальных
Эконометрическое моделирование Лекция № 7
2
Корреляция по времени
условий для { ε t } просто не рассматривают, неявно подразумевая, что процесс (3)
при любом начальном значении быстро сходится к стационарному. Отметим также,
что условие ρ < 1 является необходимым для стационарности.
Из (6) следует, что
(
ρ = cov(ε t ε t −1 )/ σ ε2 = cov(ε t ε t −1 )/ V (ε t
) V (ε )
1/ 2
1/ 2
t −1
),
(8)
т.е. ρ есть в точности коэффициент корреляции между двумя соседними ошибками.
Пользуясь (7), можно выписать ковариационную матрицу случайного вектора ε :
1
ρ
2
σv 2
Ω=
ρ
1− ρ2
...
ρ n −1
ρ
1
ρ
ρ2
ρ
...
1
...
ρ n−2
ρ n −3
... ρ n −1
... ρ n − 2
... ρ n − 3 .
... ...
...
1
(9)
Оценивание в модели с авторегрессией
Проблему оценивания системы (1) рассмотрим отдельно для случая, когда
коэффициент ρ известен, и отдельно – когда неизвестен.
1. Значение ρ известно.
В этом случае для оценивания системы (1) можно применить обобщенный
метод наименьших квадратов. В данном случае нетрудно найти матрицу Р, для
которой Р'Р = Ω . Здесь весьма просто догадаться, какое линейное преобразование
исходной системы (1) надо провести, чтобы получить классическую модель.
Напишем (2) для момента времени t − 1 ( t ≥ 2 )
yt −1 = xt′−1β + ε t −1
(10)
умножим обе части на ρ и вычтем почленно из (2). Тогда с учетом (3) получим
yt − ρyt −1 = ( xt − ρxt −1 )′β + vt .
(11)
При t = 1 достаточно обе части уравнения (2) умножить на 1 − ρ 2 :
1 − ρ 2 y1 = 1 − ρ 2 x1′β + 1 − ρ 2 ε1 .
Эконометрическое моделирование Лекция № 7
(12)
3
Корреляция по времени
В системе (11), (12) ошибки удовлетворяют условиям уже обычной
регрессионной модели. Действительно, в (11) случайные величины {vt , t = 1,..., n}
независимы и имеют постоянную дисперсию σ v2 , а в (12) ошибка
1 − ρ 2 ε1 не
зависит от {vt , t = 2,..., n} и, согласно (5), также имеет дисперсию σ v2 .
На практике часто опускают преобразование (12), игнорируя тем самым первое
наблюдение. С одной стороны, благодаря этому, преобразование исходной модели
(1) становится единообразным. В частности, для получения оценки параметра β1
достаточно оценку свободного члена в (11) разделить на (1- ρ ). С другой стороны,
отбрасывание первого наблюдения может привести к потере важной информации,
особенно в выборках небольшого размера.
2. Значение р неизвестно.
Ситуации, когда параметр авторегрессии р известен, встречаются крайне редко.
Поэтому, возникает необходимость в процедурах оценивания при неизвестном ρ .
Как
правило,
они
имеют
итеративный
характер.
Опишем
три
наиболее
употребительные. Мы не будем устанавливать сходимость этих процедур, практика
их применения показала, что они достаточно эффективны.
Процедура Кохрейна-Оркатта.
Начальным шагом этой процедуры является применение обычного метода
наименьших квадратов к исходной системе (1) и получение соответствующих
остатков е = ( e1 ,..., en )'. Далее,
1) в качестве приближенного значения ρ берется его МНК-оценка r в
регрессии et = ρet −1 + vt ;
2) проводится преобразование (11) (или (11), (12)) при ρ = r , и находятся VYR)
оценки β вектора параметров β ;
)
3) строится новый вектор остатков e = y − Xβ ;
4) процедура повторяется, начиная с п.1).
Процесс обычно заканчивается, когда очередное приближение ρ
мало
отличается от предыдущего. Иногда просто фиксируют количество итераций.
Эконометрическое моделирование Лекция № 7
4
Корреляция по времени
Процедура Кохрейна-Оркатта реализована в большинстве эконометрических
компьютерных программ.
Процедура Хилдрета-Лу.
Суть процедуры достаточно проста. Из интервала (-1, 1) возможного изменения
коэффициента ρ берутся последовательно некоторые значения (например, числа с
постоянным шагом 0,1 или 0,05) и для каждого из них проводится оценивание
преобразованной системы (11). Определяется то значение этого параметра, для
которого сумма квадратов отклонений в (11) минимальна. Затем в некоторой
окрестности этого значения устраивается более мелкая сетка и процесс повторяется.
Итерации заканчиваются, когда будет достигнута желаемая точность. Время работы
процедуры, очевидно, сокращается, если есть априорная информация об области
изменения параметра ρ .
Процедура Дарбина.
Преобразованная система (11) переписывается в следующем виде:
yt = β1 (1 − ρ ) + ρyt −1 + β 2 xt 2 − ρβ 2 x(t −1) 2 + ... + β k xtk − ρβ k x(t −1) k + vt .
(13)
т.е. yt −1 включается в число регрессоров, а ρ − в число оцениваемых параметров.
)
Для этой системы строятся обычные МНК-оценки r и θ j параметров ρ и ρβ j
)
)
соответственно. В качестве оценки β j берут θ j / r . Можно улучшить качество
)
оценок β , подставив полученное значение r в систему (11), и найти новые МНКоценки параметров β .
Тест Дарбина-Уотсона на наличие или отсутствие корреляции по времени
Большинство тестов на наличие корреляции по времени в ошибках системы (1)
используют следующую идею: если корреляция есть у ошибок ε , то она
присутствует и в остатках е, получаемых после применения к (1) обычного метода
наименьших квадратов. Здесь мы рассмотрим только одну реализацию этого
подхода.
Эконометрическое моделирование Лекция № 7
5
Корреляция по времени
Пусть нулевая гипотеза состоит в отсутствии корреляции, т. е. H 0 : ρ = 0 . В
качестве альтернативной может выступать либо просто H1 : «не H 0 », либо
односторонняя гипотеза, например, H1 : ρ > 0.
Наиболее широко используется тест Дарбина-Уотсона. Он основан на
статистике
n
∑ (et − et −1 )
DW =
2
t =2
.
n
∑
t =1
(14)
et2
Будем считать, что постоянный член включен в число регрессоров. Тогда
нетрудно
проверить,
что
эта
статистика
тесно
связала
с
выборочным
коэффициентом корреляции между et и et −1 . Действительно, проводя элементарные
выкладки, имеем
n
DW =
∑ (et − et −1 )
2
t =2
n
∑
t =1
n
=
∑
t =1
et2
=
n
n
t =2
t =2
t =2
n
∑
et2
t =1
n
− e1 + ∑
n
∑ et2 + ∑ et2−1 − 2 ∑ et et −1
t =2
et2
n
− en − 2 ∑ et et −1
t =2
n
∑ et2
t =1
=
et2
n
∑ et et −1 e 2 + e 2
− 1n n
= 21 − t = 2n
∑ et2 ∑ et2
t =1
t =1
.
(15)
Предполагая число наблюдений достаточно большим, можно считать, что
приближенно
выполнены
следующие
1 n
∑ et = −e1 /(n − 1) ≈ 0
n − 1 t =2
равенства:
и
n
1 n
∑ et −1 = −en /(n − 1) ≈ 0 (поскольку выполнено точное равенство ∑ et = 0 в силу
n − 1 t =2
t =1
наличия постоянного регрессора). Поэтому выборочный коэффициент корреляции r
между et и et −1 можно приближенно представить в виде
n
r≈
∑ et et −1
t =2
n
n −1
t =2
t =1
∑ ∑
Эконометрическое моделирование Лекция № 7
et2
et2
n
≈
∑ et et −1
t =2
n
∑
t =1
.
et2
(16)
6
Корреляция по времени
Наконец, пренебрегая в (15) слагаемыми e12 и en2 по сравнению с общей суммой
n
∑ et2 окончательно получим
t =1
DW ≈ 2(1 − r ) .
(17)
Понятен и содержательный смысл статистики DW: если между et и et −1 имеется
достаточно высокая положительная корреляция, то в определенном смысле et и et −1
близки друг к другу и величина статистики DW мала. Это согласуется с (17): если
коэффициент r близок к единице, то величина DW близка к нулю. Отсутствие
корреляции означает, что DW близка к 2.
Таким образом, если бы распределение статистики DW было известно, то для
проверки гипотезы H 0 : ρ = 0 против альтернативы H1 : ρ > 0 можно было бы для
заданного уровня значимости (например, для 5%-ного уровня) найти такое
критическое значение d*, что если DW>d*, то гипотеза H 0 не отвергается, в
противном случае она отвергается в пользу H1 . Проблема, однако, состоит в том,
что распределение DW зависит не только от числа наблюдений n и количества
регрессоров k, но и от всей матрицы X, и, значит, практическое применение этой
процедуры невозможно, поскольку нельзя же составить таблицу критических
значений d* для всех матриц X.
Тем не менее, Дарбин и Уотсон доказали, что существуют две границы, обычно
обозначаемые du и dl , du > dl , которые зависят лишь от n, k и уровня значимости α
следовательно, могут быть затабулированы) и обладают следующим свойством:
если DW > d u , то DW > d * , значит, гипотеза H 0 не отвергается, а если DW < dl , то
DW < d * , и гипотеза H 0 отвергается в пользу H1 . В случае d l < DW < d u ситуация
неопределенна, т.е. нельзя высказаться в пользу той или иной гипотезы. Если
альтернативной является гипотеза об отрицательной корреляции H1 : ρ < 0, то
соответствующими верхними и нижними границами будут 4– dl
и 4– du .
Целесообразно представить эти результаты в виде таблицы (см. таблицу 1).
Эконометрическое моделирование Лекция № 7
7
Корреляция по времени
Наличие
зоны
неопределенности,
конечно,
представляет
определенные
трудности при использовании теста Дарбина-Уотсона. Ее ширина может быть
довольно значительной.
Таблица 1
Значение статистики
DW
Вывод
Гипотеза H 0 отвергается,
есть отрицательная корреляция
Неопределенность
4- dl
Тебе могут подойти лекции
А давай сэкономим
твое время?
твое время?
Дарим 500 рублей на первый заказ,
а ты выбери эксперта и расслабься
Включи камеру на своем телефоне и наведи на Qr-код.
Кампус Хаб бот откроется на устройстве
Не ищи – спроси
у ChatGPT!
у ChatGPT!
Боты в Telegram ответят на учебные вопросы, решат задачу или найдут литературу
Попробовать в Telegram
Оставляя свои контактные данные и нажимая «Попробовать в Telegram», я соглашаюсь пройти процедуру
регистрации на Платформе, принимаю условия
Пользовательского соглашения
и
Политики конфиденциальности
в целях заключения соглашения.
Пишешь реферат?
Попробуй нейросеть, напиши уникальный реферат
с реальными источниками за 5 минут
с реальными источниками за 5 минут
Корреляция по времени
Хочу потратить еще 2 дня на работу и мне нужен только скопированный текст,
пришлите в ТГ