Эконометрика. Парная регрессия и корреляция в эконометрических исследованиях.
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ТЕМА 1. ПРЕДМЕТ И МЕТОД ЭКОНОМЕТРИКИ
Эконометрика — быстроразвивающаяся отрасль науки, цель которой состоит в том, чтобы придать количественные меры экономическим отношениям.
Эконометрика — это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Предмет исследования эконометрики – экономические явления.
К основным задачам эконометрики можно отнести следующее:
• Построение эконометрических моделей, т.е. представление экономических моделей в математической форме, удобной для проведения эмпирического анализа. Данную проблему принято называть проблемной спецификации. Отметим, что зачастую она может быть решена несколькими способами.
• Оценка параметров построенной модели, делающих выбранную модель наиболее адекватной реальным данным. Это так называемый этап параметризации.
• Проверка качества найденных параметров модели и самой модели в целом. Иногда этот этап анализа называют этапом верификации.
• Использование построенных моделей для объяснения поведения исследуемых экономических показателей, прогнозирования и предсказания, а также для осмысленного проведения экономической политики.
TЕМА 2. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ.
1. Спецификация модели.
Любое эконометрическое исследование начинается со спецификации модели, т. е. с формулировки вида модели, исходя из соответствующей теории связи между переменными. Практически в каждом отдельном случае величина y складывается из двух слагаемых:
где yj — фактическое значение результативного признака;
ŷxj. - теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и x, т. е. из уравнения регрессии;
εj — случайная величина (возмущение), характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии. Ее присутствие в модели порождено тремя источниками: спецификацией модели ( а) неправильный выбор той или иной математической функции, б) недоучет в уравнении регрессии какого-либо существенного фактора), выборочным характером исходных данных (если совокупность неоднородна, то уравнение регрессии не имеет практического смысла), особенностями измерения переменных (например, статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов).
В парной регрессии выбор вида математической функции может быть осуществлен тремя методами:
• графическим;
• аналитическим, т. е. исходя из теории изучаемой взаимосвязи;
• экспериментальным.
Значительный интерес представляет аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков.
2. Линейная регрессия и корреляция.
Линейная регрессия находит широкое применение в эконометрике в виде четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида
Построение линейной регрессии сводится к оценке ее параметров - а и b. Оценки параметров линейной регрессии могут быть найдены разными методами.
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). То есть, получим следующую систему нормальных уравнений для оценки параметров а и b:
Решая систему нормальных уравнений либо методом последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров а и b. Можно воспользоваться следующими готовыми формулами:
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Формально а — значение у при x = 0.
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют разные модификации формулы линейного коэффициента корреляции:
Как известно, линейный коэффициент корреляции находится в границах:
Если коэффициент регрессии b > 0, то , и, наоборот, при b < 0,
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции r2xy, называемый коэффициентом детерминации.
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера.
Расчетное значение критерия можно получить, используя формулу:
Расчетное значение сравнивается с табличным по таблицам распределения Фишера Для уровня значимости 0,05 и числа степеней свободы k1=1 и k2=n-2. Если расчетное значение больше табличного, уравнение регрессии признается значимым.
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: тb и та.
Стандартная ошибка коэффициента регрессии определяется по формуле
где S2 — остаточная дисперсия на одну степень свободы.
Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдента: , которое затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n - 2).
Стандартная ошибка параметра а определяется по формуле:
Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии; вычисляется t-критерий: ta = a/ma, его величина сравнивается с табличным значением при df = n - 2 степенях свободы.
В прогнозных расчетах по уравнению регрессии определяется предсказываемое (ур) значение как точечный прогнозпри хр =хк, т. е. путем подстановки в уравнение регрессии соответствующего значения х. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом интегральной ошибки прогноза ЕY, которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии - и ошибки прогноза положения регрессии .
Интегральная ошибка прогноза составит:
Предельная ошибка прогноза (при уровне значимости 0,05) составит:
Табличное значение определили по таблице распределения Стьюдента с учетом значимости 0,05 и числом степеней свободы v = n-2.
Фактическая реализация прогноза будет находиться в доверительном интервале: . Относительная величина различий значений верхней и нижней границ характеризует точность выполненного прогноза.
3. Нелинейная регрессия.
Различают два класса нелинейных регрессий:
• регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. К этому классу относятся полиномы различных степеней, равносторонняя гипербола. Параметры определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам.
• регрессии, нелинейные по оцениваемым параметрам. К этому классу относятся следующие функции: степенная, показательная, экспоненциальная и др.
Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции (R):
Величина данного показателя находится в границах: 0 ≤ R ≤ 1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.
Поскольку в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.
Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции.
Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера:
где R2 - индекс детерминации;
n - число наблюдений;
т — число параметров при переменных х.
Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую.
Ошибка аппроксимации в пределах 5—7 % свидетельствует о хорошем подборе модели к исходным данным.
ТЕМА 3. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ.
1. Спецификация модели.
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости: районы могут быть проранжированы).
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
3. Включаемые факторы не должны коррелировать друг с другом. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т. е. имеет место совокупное воздействие факторов друг на друга. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др.
При отборе факторов рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия.
Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально экономическими явлениями можно описать используя пять типов моделей:
1) Линейная:
2) Степенная
3) Показательная
4) Параболическая
5) Гиперболическая
Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений.
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации. В линейной множественной регрессии параметры при x называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.
Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии.
Уравнение множественной регрессии можно построить в естественном и стандартизированном виде.
А) Построение уравнения в естественном виде. Так, для уравнения у = а + b1 · х1 + b2 · х2 + ··· + bр · хр + ε система нормальных уравнений составит:
Ее решение может быть осуществлено методом определителей:
где Δ — определитель системы;
Δа, Δb1,..., Δbp — частные определители.
Б) Возможен и иной подход к определению параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе:
где — стандартизованные переменные:
для которых среднее значение равно нулю:
а среднее квадратическое отклонение равно единице:
β -стандартизованные коэффициенты регрессии.
Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, после соответствующих преобразований получим систему нормальных уравнений вида
Решая ее методом определителей, найдем параметры — стандартизованные коэффициенты регрессии (β-коэффициенты).
Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор xj, изменится на одну сигму при неизменном среднем уровне других факторов. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат.
От уравнения в стандартизированном виде можно перейти к уравнению в естественной форме. Так, переход для двухфакторного уравнения множественной регрессии можно записать следующим образом:
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата - коэффициента детерминации.
Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:
где σ2у — общая дисперсия результативного признака;
σ2ост - остаточная дисперсия для уравнения y =f(x1 , x2,..., xp).
Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:
При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:
где βxi - стандартизованные коэффициенты регрессии;
rуxi - парные коэффициенты корреляции результата с каждым фактором.
Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы:
где т - число параметров при переменных х;
n - число наблюдений.
Поскольку, то величину скорректированного индекса детерминации можно представить в виде
Чем больше величина m, тем сильнее различияи R2.
Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных(без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретации аналогичны линейному коэффициенту корреляции в случае однофакторной связи.
Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т.д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.
Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле
где r – парные коэффициенты корреляции между соответствующими признаками.
Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так по уравнению
возможно исчисление трех частных коэффициентов корреляции второго порядка:
каждый из которых определяется по рекуррентной формуле. Например, при i = 1 имеем формулу для расчета ryx1*x2x3 , а именно
В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов.
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:
где Dфакт - факторная сумма квадратов на одну степень свободы;
Dост - остаточная сумма квадратов на одну степень свободы;
R2- коэффициент (индекс) множественной детерминации;
т - число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов);
n - число наблюдений.
Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F-критерий, т. е. Fxj.
Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. Предположим, что оцениваем значимость влияния x1 как дополнительно включенного в модель фактора. Используем следующую формулу:
где R2yx1x2...xp - коэффициент множественной детерминации для модели с полным набором факторов;
R2yx2....xp ~ тот же показатель, но без включения в модель фактора x1;
n - число наблюдений;
т - число параметров в модели (без свободного члена).
Фактическое значение частного F-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы: 1 и n — т — 1. Если фактическое значение Fxj. превышает, то дополнительное включение фактора xj в модель статистически оправданно и коэффициент чистой регрессии bi при факторе xi- статистически значим. Если же фактическое значение Fxj меньше табличного, то дополнительное включение в модель фактора х, не увеличивает существенно долю объясненной вариации признака у, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.
С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xi- вводился в уравнение множественной регрессии последним.
ТЕМА 4. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ
1. Понятие и виды систем уравнений.
Система уравнений в эконометрических исследованиях может быть построена по-разному.
Возможна система независимых уравнений, когда каждая зависимая переменная (у) рассматривается как функция одного и того же набора факторов (x).Набор факторов xi в каждом уравнении может варьировать.
Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно. Для нахождения его параметров используется метод наименьших квадратов.
Однако если зависимая переменная y одного уравнения выступает в виде фактора x в другом уравнении, то исследователь может строить модель в виде системы рекурсивных уравнений. В данной системе зависимая переменная у включает в каждое последующее уравнение в качестве факторов все зависимые переменные предшествующих уравнений наряду с набором собственно факторов х. Как и в предыдущей системе, каждое уравнение может рассматриваться самостоятельно, и его параметры определяются методом наименьших квадратов (МНК).
Наибольшее распространение в эконометрических исследованиях получила система взаимозависимых уравнений (система совместных, одновременных уравнений, структурная форма модели – СФМ). В ней одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других уравнениях - в правую часть системы. Каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК неприменим. С этой целью используются специальные приемы оценивания.
2. Структурная и приведенная формы модели.
Система совместных, одновременных уравнений (или структурная форма модели) обычно содержит эндогенные и экзогенные переменные.
Эндогенные переменные обозначены в приведенной ранее системе одновременных уравнений как у. Это зависимые переменные, число которых равно числу уравнений в системе.
Экзогенные переменные обозначаются обычно как х. Это предопределенные переменные, влияющие на эндогенные переменные, но не зависящие от них.
Простейшая структурная форма модели имеет вид:
где у - эндогенные переменные;
x — экзогенные переменные.
Структурная форма модели в правой части содержит при эндогенных и экзогенных переменных коэффициенты bi и аj (bi -коэффициент при эндогенной переменной, аj — коэффициент при экзогенной переменной), которые называются структурными коэффициентами модели. Все переменные в модели выражены в отклонениях от среднего уровня, т. е. под x подразумевается x —а под у — соответственно у -. Поэтому свободный член в каждом уравнении системы отсутствует.
Использование МНК для оценивания структурных коэффициентов модели дает, как принято считать в теории, смещенные и несостоятельные оценки. Поэтому обычно для определения структурных коэффициентов модели структурная форма модели преобразуется в приведенную форму модели.
Приведенная форма модели (ПФМ) представляет собой систему линейных функций эндогенных переменных от экзогенных.
Коэффициенты приведенной формы модели представляют собой нелинейные функции коэффициентов структурной формы модели.
Для структурной модели вида
приведенная форма модели имеет вид
3. Идентификация систем уравнений.
При переходе от приведенной формы модели к структурной исследователь сталкивается с проблемой идентификации. Идентификация — это единственность соответствия между приведенной и структурной формами модели.
С позиции идентифицируемости структурные модели можно подразделить на три вида:
• Идентифицируемые (структурные коэффициенты СФМ определяются однозначно, единственным образом по коэффициентам ПФМ, т. е. если число параметров СФМ равно числу параметров ПФМ);
• Неидентифицируемые (число коэффициентов ПФМ меньше числа структурных коэффициентов СФМ, и в результате структурные коэффициенты не могут быть оценены через коэффициенты приведенной формы модели);
• Сверхидентифицируемые (число коэффициентов ПФМ больше числа структурных коэффициентов СФМ. В этом случае на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента).
Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически решаема, но требует для этого специальных методов исчисления параметров.
Модель считается идентифицируемой, если каждое уравнение системы идентифицируемо. Если хотя бы одно из уравнений системы неидентифицируемо, то и вся модель считается неидентифицируемой. Сверхидентифицируемая модель содержит хотя бы одно сверхидентифицируемое уравнение.
Выполнение условия идентифицируемости модели проверяется для каждого уравнения системы. Чтобы уравнение было идентифицируемо, необходимо, чтобы число предопределенных переменных, отсутствующих в данном уравнении, но присутствующих в системе (D), было равно числу эндогенных переменных в данном уравнении (H) без одного.
D + 1 = H— уравнение идентифицируемо;
D + 1 < H — уравнение неидентифицируемо;
D + 1 > H— уравнение сверхидентифицируемо.
Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели. Уравнение идентифицируемо, если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного.
ТЕМА 5. МОДЕЛИРОВАНИЕ ОДНОМЕРНЫХ ВРЕМЕННЫХ РЯДОВ
Процесс развития, движения социально-экономических явлений во времени в статистике принято называть динамикой. Для отображения динамики строят временные ряды, которые представляют собой ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке. В нем процесс экономического развития изображается в виде совокупности перерывов непрерывного позволяющих детально проанализировать особенности развития при помощи характеристик, отражающих изменения параметров экономической системы во времени.
Составными элементами ряда динамики являются показатели уровней ряда и периоды времени(годы, кварталы, месяцы, сутки) или моменты(даты) времени.
Уровни ряда обычно обозначаются через «у», моменты или периоды времени, к которым относятся уровни, - через «t».
Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:
• факторы, формирующие тенденцию ряда;
• факторы, формирующие циклические колебания ряда;
• случайные факторы.
Очевидно, что реальные данные не следуют целиком и полностью из каких-либо описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты.
В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования от дельного временного ряда — выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.
Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.
Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.
Одна из рабочих формул для расчета коэффициента корреляции имеет вид:
В качестве переменной x мы рассмотрим ряд у2, у3 ,..., y8; в качестве переменной у - ряд у1 у2 ..., у7. Тогда приведенная выше формула примет вид
где
Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда t и t - 1, т. е. при лаге 1.
Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями уt и yt-1 и определяется по формуле
где
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило — максимальный лаг должен быть не больше (n/4).
Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.
Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.
Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.
Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка τ, ряд содержит циклические колебания с периодичностью в τ моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний и имеет структуру, сходную со структурой ряда, изображенного на рис. 5.1 в), либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты (T) и циклической (сезонной) компоненты (S).
Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:
• линейный тоекд:
• гипербола:= a + b/t;,
• экспоненциальный тренд:= еа + bt1;
• тренд в форме степенной функции
• парабола второго и более высоких порядков
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t=1,2,..., n, а в качестве зависимой переменной - фактические уровни временного ряда yt . Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Моделирование сезонных и циклических колебаний
Существует несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Простейший подход — расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий:
Y = T + S + E
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (7), сезонной (S) и случайной (E) компонент. Общий вид мультипликативной модели выглядит так:
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (7), сезонной (S) и случайной (Е) компонент. Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету значений T, S и Ε для каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги.
1. Выравнивание исходного ряда методом скользящей средней. Для этого:
a) просуммируем уровни ряда последовательно за каждые четыре периода со сдвигом на один момент времени и определим условные показатели;
b) разделив полученные суммы на 4, найдем скользящие
c) приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних — центрированные скользящие средние.
2. Расчет значений сезонной компоненты S.
3. Устранение сезонной компоненты из исходных уровней ряда и получение выравненных данных (Т+ Е) в аддитивной или (ТЕ) в мультипликативной модели.
4. Аналитическое выравнивание уровней (Т+ Е) или (Τ· Ε) и расчет значений Τ с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений (Т + S) или (Т· S).
6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок Ε для анализа взаимосвязи исходного ряда и других временных рядов.
7. Прогнозирование. Прогнозное значение Ft уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент.
Прогнозное значение Ft уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент.
ТЕМА 6. ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ ПО ВРЕМЕННЫМ РЯДАМ
1. Метод отклонений от тренда
Пусть имеются два временных ряда xt и уt каждый из которых содержит трендовую компоненту Τ и случайную компоненту ε. Проведение аналитического выравнивания по каждому из этих рядов позволяет найти параметры соответствующих уравнений трендов и определить расчетные по тренду уровниисоответственно. Эти расчетные значения можно принять за оценку трендовой компоненты T каждого ряда. Поэтому влияние тенденции можно устранить путем вычитания расчетных значений уровней ряда из фактических. Эту процедуру проделывают для каждого временного ряда в модели. Дальнейший анализ взаимосвязи рядов проводят с использованием не исходных уровней, а отклонений от трендаипри условии, что последние не содержат тенденции.
Содержательная интерпретация параметров полученной модели затруднительна, однако ее можно использовать для прогнозирования. Для этого необходимо определить трендовое значение факторного признакаи с помощью одного из методов оценить величину предполагаемого отклонения фактического значения от трендового. Далее по уравнению тренда для результативного признака определяют трендовое значение, а по уравнению регрессии по отклонениям от трендов находят величину отклонения . Затем находят точечный прогноз фактического значения yt по формуле
2. Метод последовательных разностей
В ряде случаев вместо аналитического выравнивания временного ряда с целью устранения тенденции можно применить более простой метод — метод последовательных разностей.
Если временной ряд содержит ярко выраженную линейную тенденцию, ее можно устранить путем замены исходных уровней ряда цепными абсолютными приростами (первыми разностями).
Если временной ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные уровни ряда на вторые разности.
При всей своей простоте метод последовательных разностей имеет два существенных недостатка. Во-первых, его применение связано с сокращением числа пар наблюдений, по которым строится уравнение регрессии, и, следовательно, с потерей числа степеней свободы. Во-вторых, использование вместо исходных уровней временных рядов их приростов или ускорений приводит к потере информации, содержащейся в исходных данных.
3. Включение в модель регрессии фактора времени
В корреляционно-регрессионном анализе устранить воздействие какого-либо фактора можно, если зафиксировать воздействие этого фактора на результат и другие включенные в модель факторы. Этот прием широко используется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной.
Модель вида
относится к группе моделей, включающих фактор времени. Очевидно, что число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только текущие, но и лаговые значения независимой переменной, а также лаговые значения результативной переменной.
Преимущество данной модели по сравнению с методами отклонений от трендов и последовательных разностей в том, что она позволяет учесть всю информацию, содержащуюся в исходных данных, поскольку значения yt и xt есть уровни исходных временных рядов. Кроме того, модель строится по всей совокупности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа наблюдений. Параметры а и b модели с включением фактора времени определяются обычным МНК. Расчет и интерпретацию параметров покажем на примере.
Автокорреляция в остатках.
Рассматривая последовательность остатков как временной ряд, можно построить график их зависимости от времени. В соответствии с предпосылками МНК остатки εt должны быть случайными (рис. 1 а). Однако при моделировании временных рядов нередко встречается ситуация, когда остатки содержат тенденцию (рис. 1 б) и в)) или циклические колебания (рис.1 г)). Это свидетельствует о том, что каждое следующее значение остатков зависит от предшествующих. В этом случае говорят о наличии автокорреляции остатков.
Рис. 1. Модели зависимости остатков от времени
а— случайные остатки; б — возрастающая тенденция в остатках;
в - убывающая тенденция в остатках;
г - циклические колебания в остатках
Существуют два наиболее распространенных метода определения автокорреляции остатков. Первый метод - это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод — использование критерия Дарбина — Уотсона и расчет величины
Соотношение между критерием Дарбина — Уотсона и коэффициентом автокорреляции остатков первого порядка:
Таким образом, если в остатках существует полная положительная автокорреляция и= 1, то d = 0. Если в остатках полная отрицательная автокорреляция, то= -1 и, следовательно, d = 4. Если автокорреляция остатков отсутствует, то= 0 и d = 2. Следовательно,
0 ≤ d ≤ 4.
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина - Уотсона следующий. Выдвигается гипотеза H0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н1 и H*1 состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам (см. приложение) определяются критические значения критерия Дарбина - Уотсона dL и dU для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости α. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1 — α) рассматривается на рис. 2.
Рис. 2. Механизм проверки гипотезы о наличии автокорреляции остатков
Если фактическое значение критерия Дарбина — Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H0.
Есть несколько существенных ограничений на применение критерия Дарбина — Уотсона.
Во-первых, он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака, т. е. к моделям авторегрессии. Для тестирования на автокорреляцию остатков моделей авторегрессии используется критерий h Дарбина.
Во-вторых, методика расчета и использования критерия Дарбина — Уотсона направлена только на выявление автокорреляции остатков первого порядка. При проверке остатков на автокорреляцию более высоких порядков следует применять другие методы, рассмотрение которых выходит за рамки данного учебника.
В-третьих, критерий Дарбина — Уотсона дает достоверные результаты только для больших выборок. В этом смысле результаты примера 6.4 нельзя считать достоверными ввиду чрезвычайно малого числа наблюдений n = 7, по которым построена модель регрессии.
ТЕМА 7. ДИНАМИЧЕСКИЕ ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ
Можно выделить два основных типа динамических эконометрических моделей. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых значения переменной за прошлые периоды времени (лаговые переменные) непосредственно включены в модель. Модели второго типа учитывают динамическую информацию в неявном виде. В эти модели включены переменные, характеризующие ожидаемый или желаемый уровень результата, или одного из факторов в момент времени t. Этот уровень считается неизвестным и определяется экономическими единицами с учетом информации, которой они располагают в момент (t — 1).
Величину l, характеризующую запаздывание в воздействии фактора на результат, называют в эконометрике лагом, а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, — лаговыми переменными.
Интерпретация моделей с распределенным лагом
Эконометрическое моделирование охарактеризованных выше процессов осуществляется с применением моделей, содержащих не только текущие, но и лаговые значения факторных переменных. Эти модели называются моделями с распределенным лагом. Модель вида является примером модели с распределенным лагом.
Эта модель говорит о том, что если в некоторый момент времени t происходит изменение независимой переменной xt то это изменение будет влиять на значения переменной у в течение l следующих моментов времени.
Коэффициент регрессии b0 при переменной xt характеризует среднее абсолютное изменение yt при изменении xt на 1 ед. своего измерения в некоторый фиксированный момент времени t, без учета воздействия лаговых значений фактора х. Этот коэффициент называют краткосрочным мультипликатором.
В момент (t + 1) совокупное воздействие факторной переменной xt на результату, составит (bо + b1) усл. ед., в момент (t+2) это воздействие можно охарактеризовать суммой (bо + b1 + b2) и т. д. Полученные таким образом суммы называют промежуточными мультипликаторами.
С учетом конечной величины лага можно сказать, что изменение переменной xt в момент t на 1 усл. ед. приведет к общему изменению результата через / моментов времени на (bо + b1 +...+bl) абсолютных единиц.
Введем следующее обозначение:
bо + b1+...+ bl = b
Величину b называют долгосрочным мультипликатором. Он показывает абсолютное изменение в долгосрочном периоде t + l результата у под влиянием изменения на 1 ед. фактора х.
Предположим
βj = bj/b,j = O:l.)
Назовем полученные величины относительными коэффициентами модели с распределенным лагом. Если все коэффициенты bj имеют одинаковые знаки, то для любого j
О < βj; < 1 и
В этом случае относительные коэффициенты βj являются весами для соответствующих коэффициентов bj. Каждый из них измеряет долю общего изменения результативного признака в момент времени (t+j).
Зная величины βj, с помощью стандартных формул можно определить еще две важные характеристики модели множественной регрессии: величину среднего лага и медианного лага. Средний лаг определяется по формуле средней арифметической взвешенной:
и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t. Небольшая величина среднего лага свидетельствует об относительно быстром реагировании результата на изменение фактора, тогда как высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени. Медианный лаг — это величина лага, для которого
Это тот период времени, в течение которого с момента времени t будет реализована половина общего воздействия фактора на результат.
Интерпретация моделей авторегрессии
Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Например, потребление в момент времени t формируется под воздействием дохода текущего и предыдущего периодов, а также объема потребления прошлых периодов, например потребления в период (t — 1). Эти процессы обычно описывают с помощью моделей регрессии, содержащих в качестве факторов лаговые значения зависимой переменной, которые называются моделями авторегрессии.
Пусть имеется следующая модель:
Как и в модели с распределенным лагом, b0 в этой модели характеризует краткосрочное изменение yt под воздействием изменения хt на 1 ед. Однако промежуточные и долгосрочный мультипликаторы в моделях авторегрессии несколько иные. К моменту времени (t + 1) результатизменился под воздействием изменения изучаемого фактора в момент времени t наед., апод воздействием своего изменения в непосредственно предшествующий момент времени — на с1 ед. Таким образом, общее абсолютное изменение результата в момент (t + 1) составитед. Аналогично в момент времени (t + 2) абсолютное изменение результата составитед. и т. д. Следовательно, долгосрочный мультипликатор в модели авторегрессии можно рассчитать как сумму краткосрочного и промежуточных мультипликаторов:
Учитывая, что практически во все модели авторегрессии вводится так называемое условие стабильности, состоящее в том, что коэффициент регрессии при переменнойпо абсолютной величине меньше единицы(|c1| < 1), соотношение (7.8) можно преобразовать следующим образом:
где
Отметим, что такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на предпосылке о наличии бесконечного лага в воздействии текущего значения зависимой переменной на ее будущие значения