Справочник от Автор24
Поделись лекцией за скидку на Автор24

Эконометрика. Парная регрессия и корреляция в эконометрических исследованиях.

  • 👀 712 просмотров
  • 📌 668 загрузок
Выбери формат для чтения
Статья: Эконометрика. Парная регрессия и корреляция в эконометрических исследованиях.
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Эконометрика. Парная регрессия и корреляция в эконометрических исследованиях.» doc
ТЕМА 1. ПРЕДМЕТ И МЕТОД ЭКОНОМЕТРИКИ Эконометрика — быстроразвивающаяся отрасль науки, цель которой состоит в том, чтобы придать количественные меры эко­номическим отношениям. Эконометрика — это наука, которая дает ко­личественное выражение взаимосвязей экономических явлений и процессов. Предмет исследования эконометрики – экономические явления. К основным задачам эконометрики можно отнести следующее: • Построение эконометрических моделей, т.е. представление экономических моделей в математической форме, удобной для проведения эмпирического анализа. Данную проблему принято называть проблемной спецификации. Отметим, что зачастую она может быть решена несколькими способами. • Оценка параметров построенной модели, делающих выбранную модель наиболее адекватной реальным данным. Это так называемый этап параметризации. • Проверка качества найденных параметров модели и самой модели в целом. Иногда этот этап анализа называют этапом верификации. • Использование построенных моделей для объяснения поведения исследуемых экономических показателей, прогнозирования и предсказания, а также для осмысленного проведения экономической политики. TЕМА 2. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ. 1. Спецификация модели. Любое эконометрическое исследование начинается со специ­фикации модели, т. е. с формулировки вида модели, исходя из со­ответствующей теории связи между переменными. Практически в каж­дом отдельном случае величина y складывается из двух слага­емых: где yj — фактическое значение результативного признака; ŷxj. - теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и x, т. е. из уравнения регрессии; εj — случайная величина (возмущение), характеризующая отклонения реального значения результативного признака от теоретического, найден­ного по уравнению регрессии. Ее присутствие в модели по­рождено тремя источниками: спецификацией модели ( а) непра­вильный выбор той или иной математической функции, б) недоучет в уравнении регрессии какого-либо существенного фактора), выбороч­ным характером исходных данных (если совокупность неоднородна, то уравнение регрессии не имеет практического смысла), особенностями измерения переменных (например, статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов). В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: • графическим; • аналитическим, т. е. исходя из теории изучаемой взаимосвязи; • экспериментальным. Значительный интерес представляет аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков. 2. Линейная регрессия и корреляция. Линейная регрессия находит широкое применение в экономет­рике в виде четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида Построение линейной регрессии сводится к оценке ее пара­метров - а и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). То есть, получим следующую систему нор­мальных уравнений для оценки параметров а и b: Решая систему нормальных уравнений либо методом последовательного исключения переменных, либо методом оп­ределителей, найдем искомые оценки параметров а и b. Можно воспользоваться следующими готовыми формулами: Параметр b называется коэффициентом регрессии. Его вели­чина показывает среднее изменение результата с изменением фактора на одну единицу. Формально а — значение у при x = 0. Уравнение регрессии всегда дополняется показателем тесно­ты связи. При использовании линейной регрессии в качестве та­кого показателя выступает линейный коэффициент корреляции rxy. Существуют разные модификации формулы линейного коэф­фициента корреляции: Как известно, линейный коэффициент корреляции находит­ся в границах: Если коэффициент регрессии b > 0, то , и, наоборот, при b < 0, Для оценки качества подбора линейной функции рассчиты­вается квадрат линейного коэффициента корреляции r2xy, назы­ваемый коэффициентом детерминации. После того как найдено уравнение линейной регрессии, про­водится оценка значимости как уравнения в целом, так и отдель­ных его параметров. Оценка значимости уравнения регрессии в целом дается с по­мощью F-критерия Фишера. Расчетное значение критерия можно получить, используя формулу: Расчетное значение сравнивается с табличным по таблицам распределения Фишера Для уровня значимости 0,05 и числа степеней свободы k1=1 и k2=n-2. Если расчетное значение больше табличного, уравнение регрессии признается значимым. В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: тb и та. Стандартная ошибка коэффициента регрессии определяется по формуле где S2 — остаточная дисперсия на одну степень свободы. Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдента: , которое затем сравнивается с табличным значением при определен­ном уровне значимости α и числе степеней свободы (n - 2). Стандартная ошибка параметра а определяется по формуле: Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрес­сии; вычисляется t-критерий: ta = a/ma, его величина сравнивается с табличным значением при df = n - 2 степенях свободы. В прогнозных расчетах по уравнению регрессии определяется предсказываемое (ур) значение как точечный прогнозпри хр =хк, т. е. путем подстановки в уравнение регрессии соответствующего значения х. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом интегральной ошибки прогноза ЕY, которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии - и ошибки прогноза положения регрессии . Интегральная ошибка прогноза составит: Предельная ошибка прогноза (при уровне значимости 0,05) составит: Табличное значение определили по таблице распределения Стьюдента с учетом значимости 0,05 и числом степеней свободы v = n-2. Фактическая реализация прогноза будет находиться в доверительном интервале: . Относительная величина различий значений верхней и нижней границ характеризует точность выполненного прогноза. 3. Нелинейная регрессия. Различают два класса нелинейных регрессий: • регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. К этому классу относятся полиномы различных степеней, равносторонняя гипербола. Параметры определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. • регрессии, нелинейные по оцениваемым параметрам. К этому классу относятся следующие функции: степенная, показательная, экспоненциальная и др. Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции (R): Величина данного показателя находится в границах: 0 ≤ R ≤ 1, чем ближе к единице, тем теснее связь рассматриваемых призна­ков, тем более надежно найденное уравнение регрессии. Поскольку в расчете индекса корреляции используется соот­ношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специ­альных исследованиях величину R2 для нелинейных связей назы­вают индексом детерминации. Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции. Индекс детерминации используется для проверки существен­ности в целом уравнения нелинейной регрессии по F-критерию Фишера: где R2 - индекс детерминации; n - число наблюдений; т — число параметров при переменных х. Чтобы иметь об­щее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппрок­симации как среднюю арифметическую простую. Ошибка аппроксимации в пределах 5—7 % свидетельствует о хорошем подборе модели к исходным данным. ТЕМА 3. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ. 1. Спецификация модели. Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор фак­торов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию, должны отвечать следующим требова­ниям. 1. Они должны быть количественно измеримы. Если необхо­димо включить в модель качественный фактор, не имеющий ко­личественного измерения, то ему нужно придать количествен­ную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов не­движимости учитывается место нахождения недвижимости: рай­оны могут быть проранжированы). 2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. 3. Включаемые факторы не должны коррелировать друг с другом. Наибольшие труд­ности в использовании аппарата множественной регрессии воз­никают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимос­тью, т. е. имеет место совокупное воздействие факторов друг на друга. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др. При отборе факторов рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия. Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально экономическими явлениями можно описать используя пять типов моделей: 1) Линейная: 2) Степенная 3) Показательная 4) Параболическая 5) Гиперболическая Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации. В линейной мно­жественной регрессии парамет­ры при x называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соот­ветствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне. Параметры уравнения множественной регрессии оценивают­ся, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки пара­метров регрессии. Уравнение множественной регрессии можно построить в естественном и стандартизированном виде. А) Построение уравнения в естественном виде. Так, для уравнения у = а + b1 · х1 + b2 · х2 + ··· + bр · хр + ε сис­тема нормальных уравнений составит: Ее решение может быть осуществлено методом определителей: где Δ — определитель системы; Δа, Δb1,..., Δbp — частные определители. Б) Возможен и иной подход к определению параметров множе­ственной регрессии, когда на основе матрицы парных коэффи­циентов корреляции строится уравнение регрессии в стандарти­зованном масштабе: где — стандартизованные переменные: для которых среднее значение равно нулю: а среднее квадратическое отклонение равно единице: β -стандартизованные коэффициенты регрессии. Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, после соответствующих преобра­зований получим систему нормальных уравнений вида Решая ее методом определителей, найдем параметры — стан­дартизованные коэффициенты регрессии (β-коэффициенты). Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответст­вующий фактор xj, изменится на одну сигму при неизменном среднем уровне других факторов. Сравнивая их друг с другом, можно ранжировать факторы по си­ле их воздействия на результат. От уравнения в стандартизированном виде можно перейти к уравнению в естественной форме. Так, переход для двухфакторного уравнения множественной регрессии можно записать следующим образом: Практическая значимость уравнения множественной регрес­сии оценивается с помощью показателя множественной корре­ляции и его квадрата - коэффициента детерминации. Показатель множественной корреляции характеризует тесно­ту связи рассматриваемого набора факторов с исследуемым при­знаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной кор­реляции может быть найден как индекс множественной корре­ляции: где σ2у — общая дисперсия результативного признака; σ2ост - остаточная дисперсия для уравнения y =f(x1 , x2,..., xp). Расчет индекса множественной корреляции предполагает оп­ределение уравнения множественной регрессии и на его основе остаточной дисперсии: При линейной зависимости признаков формула индекса кор­реляции может быть представлена следующим выражением: где βxi - стандартизованные коэффициенты регрессии; rуxi - парные коэффициенты корреляции результата с каждым фактором. Скорректированный индекс множественной корреляции со­держит поправку на число степеней свободы: где т - число параметров при переменных х; n - число наблюдений. Поскольку, то величину скорректированного индекса детерминации можно представить в виде Чем больше величина m, тем сильнее различияи R2. Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных(без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретации аналогичны линейному коэффициенту корреляции в случае однофакторной связи. Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т.д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту. Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле где r – парные коэффициенты корреляции между соответствующими признаками. Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так по уравнению возможно исчисление трех частных коэффициентов корреляции второго порядка: каждый из которых определяется по рекуррентной формуле. Например, при i = 1 имеем формулу для расчета ryx1*x2x3 , а именно В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов. Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-кри­терия Фишера: где Dфакт - факторная сумма квадратов на одну степень свободы; Dост - остаточная сумма квадратов на одну степень свободы; R2- коэффициент (индекс) множественной детерминации; т - число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов); n - число наблюдений. Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фак­тор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть раз­ной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F-критерий, т. е. Fxj. Частный F-критерий построен на сравнении прироста фак­торной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. Предположим, что оцениваем значимость влияния x1 как дополнительно включен­ного в модель фактора. Используем следующую формулу: где R2yx1x2...xp - коэффициент множественной детерминации для модели с полным набором факторов; R2yx2....xp ~ тот же показатель, но без включения в модель фактора x1; n - число наблюдений; т - число параметров в модели (без свободного члена). Фактическое значение частного F-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы: 1 и n — т — 1. Если фактическое значение Fxj. превышает, то дополнительное включение фактора xj в модель статистически оправданно и коэффициент чис­той регрессии bi при факторе xi- статистически значим. Если же фактическое значение Fxj меньше табличного, то дополнитель­ное включение в модель фактора х, не увеличивает существенно долю объясненной вариации признака у, следовательно, нецеле­сообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим. С помощью частного F-критерия можно проверить значи­мость всех коэффициентов регрессии в предположении, что каж­дый соответствующий фактор xi- вводился в уравнение множест­венной регрессии последним. ТЕМА 4. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ 1. Понятие и виды систем уравнений. Система уравнений в эконометрических исследованиях мо­жет быть построена по-разному. Возможна система независимых уравнений, когда каждая зави­симая переменная (у) рассматривается как функция одного и то­го же набора факторов (x).Набор факторов xi в каждом уравнении может варьировать. Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно. Для нахождения его парамет­ров используется метод наименьших квадратов. Однако если зависимая переменная y одного уравнения вы­ступает в виде фактора x в другом уравнении, то исследователь может строить модель в виде системы рекурсивных уравнений. В данной системе зависимая переменная у включает в каждое последующее уравнение в качестве факторов все зависимые пе­ременные предшествующих уравнений наряду с набором собст­венно факторов х. Как и в предыдущей системе, каждое уравнение может рас­сматриваться самостоятельно, и его параметры определяются ме­тодом наименьших квадратов (МНК). Наибольшее распространение в эконометрических исследо­ваниях получила система взаимозависимых уравнений (система совместных, одновременных уравнений, структурная форма модели – СФМ). В ней одни и те же зависимые переменные в одних уравнениях входят в ле­вую часть, а в других уравнениях - в правую часть системы. Каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для на­хождения его параметров традиционный МНК неприменим. С этой целью используются специальные приемы оценивания. 2. Структурная и приведенная формы модели. Система совместных, одновременных уравнений (или струк­турная форма модели) обычно содержит эндогенные и экзоген­ные переменные. Эндогенные переменные обозначены в приведенной ранее системе одновременных уравнений как у. Это зависимые пере­менные, число которых равно числу уравнений в системе. Экзогенные переменные обозначаются обычно как х. Это пре­допределенные переменные, влияющие на эндогенные перемен­ные, но не зависящие от них. Простейшая структурная форма модели имеет вид: где у - эндогенные переменные; x — экзогенные переменные. Структурная форма модели в правой части содержит при эн­догенных и экзогенных переменных коэффициенты bi и аj (bi -коэффициент при эндогенной переменной, аj — коэффициент при экзогенной переменной), которые называются структурными коэффициентами модели. Все переменные в модели выражены в отклонениях от среднего уровня, т. е. под x подразумевается x —а под у — соответственно у -. Поэтому свободный член в каждом уравнении системы отсутствует. Использование МНК для оценивания структурных коэффи­циентов модели дает, как принято считать в теории, смещенные и несостоятельные оценки. Поэтому обычно для определения структурных коэффициентов модели структурная форма модели преобразуется в приведенную форму модели. Приведенная форма модели (ПФМ) представляет собой систему ли­нейных функций эндогенных переменных от экзогенных. Коэффициенты приведенной формы модели представляют собой нелинейные функции коэффициентов структурной формы мо­дели. Для структурной модели вида приведенная форма модели имеет вид 3. Идентификация систем уравнений. При переходе от приведенной формы модели к структурной исследователь сталкивается с проблемой идентификации. Иден­тификация — это единственность соответствия между приведен­ной и структурной формами модели. С позиции идентифицируемости структурные модели можно подразделить на три вида: • Идентифицируемые (структурные коэффици­енты СФМ определяются однозначно, единственным образом по коэф­фициентам ПФМ, т. е. если число парамет­ров СФМ равно числу параметров ПФМ); • Неидентифицируемые (число коэф­фициентов ПФМ меньше числа структурных коэффициентов СФМ, и в ре­зультате структурные коэффициенты не могут быть оценены че­рез коэффициенты приведенной формы модели); • Сверхидентифицируемые (число ко­эффициентов ПФМ больше числа структурных коэффициентов СФМ. В этом случае на основе коэффициентов приведенной формы можно по­лучить два или более значений одного структурного коэффици­ента). Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически решаема, но требует для этого специальных методов исчисления параметров. Модель считается идентифицируемой, если каж­дое уравнение системы идентифицируемо. Если хотя бы одно из уравнений системы неидентифицируемо, то и вся модель счита­ется неидентифицируемой. Сверхидентифицируемая модель со­держит хотя бы одно сверхидентифицируемое уравнение. Выполнение условия идентифицируемости модели проверя­ется для каждого уравнения системы. Чтобы уравнение было идентифицируемо, необходимо, чтобы число предопределенных переменных, отсутствующих в данном уравнении, но присутству­ющих в системе (D), было равно числу эндогенных переменных в данном уравнении (H) без одного. D + 1 = H— уравнение идентифицируемо; D + 1 < H — уравнение неидентифицируемо; D + 1 > H— уравнение сверхидентифицируемо. Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели. Уравнение идентифицируемо, если по отсутствующим в нем пе­ременным (эндогенным и экзогенным) можно из коэффициен­тов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного. ТЕМА 5. МОДЕЛИРОВАНИЕ ОДНОМЕРНЫХ ВРЕМЕННЫХ РЯДОВ Процесс развития, движения социально-экономических явлений во времени в статистике принято называть динамикой. Для отображения динамики строят временные ряды, которые представляют собой ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке. В нем процесс экономического развития изображается в виде совокупности перерывов непрерывного позволяющих детально проанализировать особенности развития при помощи характеристик, отражающих изменения параметров экономической системы во времени. Составными элементами ряда динамики являются показатели уровней ряда и периоды времени(годы, кварталы, месяцы, сутки) или моменты(даты) времени. Уровни ряда обычно обозначаются через «у», моменты или периоды времени, к которым относятся уровни, - через «t». Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы: • факторы, формирующие тенденцию ряда; • факторы, формирующие циклические колебания ряда; • случайные факторы. Очевидно, что реальные данные не следуют целиком и полно­стью из каких-либо описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты. В большинстве случаев фактический уровень временного ря­да можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой вре­менной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в ко­торой временной ряд представлен как произведение перечислен­ных компонент, называется мультипликативной моделью времен­ного ряда. Основная задача эконометрического исследования от дельного временного ряда — выявление и придание количествен­ного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогно­зирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов. Корреляционную зависимость между последова­тельными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного ко­эффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Одна из рабочих формул для расчета коэффициента корреля­ции имеет вид: В качестве переменной x мы рассмотрим ряд у2, у3 ,..., y8; в ка­честве переменной у - ряд у1 у2 ..., у7. Тогда приведенная выше формула примет вид где Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда t и t - 1, т. е. при лаге 1. Аналогично можно определить коэффициенты автокорреля­ции второго и более высоких порядков. Так, коэффициент авто­корреляции второго порядка характеризует тесноту связи между уровнями уt и yt-1 и определяется по формуле где Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорре­ляции, уменьшается. Некоторые авторы считают целесообраз­ным для обеспечения статистической достоверности коэффици­ентов автокорреляции использовать правило — максимальный лаг должен быть не больше (n/4). Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по ко­эффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, па­раболу второго порядка или экспоненту), коэффициент автокор­реляции уровней исходного ряда может приближаться к нулю. Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уров­нях ряда. Большинство временных рядов экономических данных содержит положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию. Последовательность коэффициентов автокорреляции уров­ней первого, второго и т. д. порядков называют автокорреляцион­ной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) на­зывается коррелограммой. Анализ автокорреляционной функции и коррелограммы поз­воляет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между теку­щим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограм­мы можно выявить структуру ряда. Если наиболее высоким оказался коэффициент автокорреля­ции первого порядка, исследуемый ряд содержит только тенден­цию. Если наиболее высоким оказался коэффициент автокорре­ляции порядка τ, ряд содержит циклические колебания с перио­дичностью в τ моментов времени. Если ни один из коэффициен­тов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний и имеет структуру, сходную со структурой ряда, изображенного на рис. 5.1 в), либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреля­ционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компонен­ты (T) и циклической (сезонной) компоненты (S). Одним из наиболее распространенных способов моделирова­ния тенденции временного ряда является построение аналитиче­ской функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим вы­равниванием временного ряда. Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные ви­ды функций. Для построения трендов чаще всего применяются следующие функции: • линейный тоекд: • гипербола:= a + b/t;, • экспоненциальный тренд:= еа + bt1; • тренд в форме степенной функции • парабола второго и более высоких порядков Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t=1,2,..., n, а в качестве зависимой перемен­ной - фактические уровни временного ряда yt . Для нелинейных трендов предварительно проводят стандартную процедуру их ли­неаризации. Моделирование сезонных и циклических колебаний Существует несколько подходов к анализу структуры времен­ных рядов, содержащих сезонные или циклические колебания. Простейший подход — расчет значений сезонной компонен­ты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид адди­тивной модели следующий: Y = T + S + E Эта модель предполагает, что каждый уровень временного ря­да может быть представлен как сумма трендовой (7), сезонной (S) и случайной (E) компонент. Общий вид мультипликативной мо­дели выглядит так: Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (7), сезонной (S) и случайной (Е) компонент. Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоян­на, строят аддитивную модель временного ряда, в которой значе­ния сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрас­тает или уменьшается, строят мультипликативную модель вре­менного ряда, которая ставит уровни ряда в зависимость от зна­чений сезонной компоненты. Построение аддитивной и мультипликативной моделей сво­дится к расчету значений T, S и Ε для каждого уровня ряда. Процесс построения модели включает в себя следующие шаги. 1. Выравнивание исходного ряда методом скользящей средней. Для этого: a) просуммируем уровни ряда последовательно за каждые четыре периода со сдвигом на один момент времени и определим условные показатели; b) разделив полученные суммы на 4, найдем скользящие c) приведем эти значения в соответствие с фактическими момен­тами времени, для чего найдем средние значения из двух последовательных скользящих средних — центрированные скользящие средние. 2. Расчет значений сезонной компоненты S. 3. Устранение сезонной компоненты из исходных уровней ряда и получение выравненных данных (Т+ Е) в аддитивной или (ТЕ) в мультипликативной модели. 4. Аналитическое выравнивание уровней (Т+ Е) или (Τ· Ε) и расчет значений Τ с использованием полученного уравнения тренда. 5. Расчет полученных по модели значений (Т + S) или (Т· S). 6. Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреля­ции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок Ε для анализа взаимосвязи исходного ряда и других временных рядов. 7. Прогнозирование. Прогнозное значение Ft уровня временного ряда в аддитив­ной модели есть сумма трендовой и сезонной компонент. Прогнозное значение Ft уровня временного ряда в мульти­пликативной модели есть произведение трендовой и сезонной компонент. ТЕМА 6. ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ ПО ВРЕМЕННЫМ РЯДАМ 1. Метод отклонений от тренда Пусть имеются два временных ряда xt и уt каждый из которых содержит трендовую компоненту Τ и случайную компоненту ε. Проведение аналитического выравнивания по каждому из этих рядов позволяет найти параметры соответствующих уравнений трендов и определить расчетные по тренду уровниисоответственно. Эти расчетные значения можно принять за оценку трендовой компоненты T каждого ряда. Поэтому влияние тенденции можно устранить путем вычитания расчетных значений уровней ряда из фактических. Эту процедуру проделывают для каждого временного ряда в модели. Дальнейший анализ взаимосвязи ря­дов проводят с использованием не исходных уровней, а отклоне­ний от трендаипри условии, что последние не со­держат тенденции. Содержательная интерпретация параметров полученной модели за­труднительна, однако ее можно использовать для прогнозирова­ния. Для этого необходимо определить трендовое значение фак­торного признакаи с помощью одного из методов оценить ве­личину предполагаемого отклонения фактического значения от трендового. Далее по уравнению тренда для результативного при­знака определяют трендовое значение, а по уравнению регрес­сии по отклонениям от трендов находят величину отклонения . Затем находят точечный прогноз фактического значения yt по формуле 2. Метод последовательных разностей В ряде случаев вместо аналитического выравнивания времен­ного ряда с целью устранения тенденции можно применить более простой метод — метод последовательных разностей. Если временной ряд содержит ярко выраженную линейную тенденцию, ее можно устранить путем замены исходных уровней ряда цепными абсолютными приростами (первыми разностями). Если временной ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные уровни ряда на вторые разности. При всей своей простоте метод последовательных разностей имеет два су­щественных недостатка. Во-первых, его применение связано с со­кращением числа пар наблюдений, по которым строится уравне­ние регрессии, и, следовательно, с потерей числа степеней свобо­ды. Во-вторых, использование вместо исходных уровней времен­ных рядов их приростов или ускорений приводит к потере ин­формации, содержащейся в исходных данных. 3. Включение в модель регрессии фактора времени В корреляционно-регрессионном анализе устранить воздей­ствие какого-либо фактора можно, если зафиксировать воздейст­вие этого фактора на результат и другие включенные в модель факторы. Этот прием широко используется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной. Модель вида относится к группе моделей, включающих фактор времени. Оче­видно, что число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только те­кущие, но и лаговые значения независимой переменной, а также лаговые значения результативной переменной. Преимущество данной модели по сравнению с методами от­клонений от трендов и последовательных разностей в том, что она позволяет учесть всю информацию, содержащуюся в исход­ных данных, поскольку значения yt и xt есть уровни исходных временных рядов. Кроме того, модель строится по всей совокуп­ности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа наблюдений. Параметры а и b модели с включением фактора вре­мени определяются обычным МНК. Расчет и интерпретацию па­раметров покажем на примере. Автокорреляция в остатках. Рассматривая последовательность остатков как временной ряд, можно построить график их зависимости от времени. В со­ответствии с предпосылками МНК остатки εt должны быть слу­чайными (рис. 1 а). Однако при моделировании временных ря­дов нередко встречается ситуация, когда остатки содержат тен­денцию (рис. 1 б) и в)) или циклические колебания (рис.1 г)). Это свидетельствует о том, что каждое следующее значение ос­татков зависит от предшествующих. В этом случае говорят о на­личии автокорреляции остатков. Рис. 1. Модели зависимости остатков от времени а— случайные остатки; б — возрастающая тенденция в остатках; в - убывающая тенденция в остатках; г - циклические колебания в остатках Существуют два наиболее распространенных метода опреде­ления автокорреляции остатков. Первый метод - это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод — использо­вание критерия Дарбина — Уотсона и расчет величины Соотношение между критерием Дарбина — Уотсона и коэф­фициентом автокорреляции остатков первого порядка: Таким образом, если в остатках существует полная положи­тельная автокорреляция и= 1, то d = 0. Если в остатках полная отрицательная автокорреляция, то= -1 и, следовательно, d = 4. Если автокорреляция остатков отсутствует, то= 0 и d = 2. Следовательно, 0 ≤ d ≤ 4. Алгоритм выявления автокорреляции остатков на основе критерия Дарбина - Уотсона следующий. Выдвигается гипотеза H0 об отсутствии автокорреляции остатков. Альтернативные ги­потезы Н1 и H*1 состоят, соответственно, в наличии положитель­ной или отрицательной автокорреляции в остатках. Далее по спе­циальным таблицам (см. приложение) определяются критичес­кие значения критерия Дарбина - Уотсона dL и dU для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости α. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каж­дой из гипотез с вероятностью (1 — α) рассматривается на рис. 2. Рис. 2. Механизм проверки гипотезы о наличии автокорреляции остатков Если фактическое значение критерия Дарбина — Уотсона по­падает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H0. Есть несколько существенных ограничений на применение критерия Дарбина — Уотсона. Во-первых, он неприменим к моделям, включающим в качест­ве независимых переменных лаговые значения результативного признака, т. е. к моделям авторегрессии. Для тестирования на ав­токорреляцию остатков моделей авторегрессии используется критерий h Дарбина. Во-вторых, методика расчета и использования критерия Дар­бина — Уотсона направлена только на выявление автокорреляции остатков первого порядка. При проверке остатков на автокорре­ляцию более высоких порядков следует применять другие методы, рассмотрение которых выходит за рамки данного учебника. В-третьих, критерий Дарбина — Уотсона дает достоверные результаты только для больших выборок. В этом смысле резуль­таты примера 6.4 нельзя считать достоверными ввиду чрезвычай­но малого числа наблюдений n = 7, по которым построена модель регрессии. ТЕМА 7. ДИНАМИЧЕСКИЕ ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ Можно выделить два основных типа динамических эконометрических моделей. К моделям первого типа относятся модели ав­торегрессии и модели с распределенным лагом, в которых значе­ния переменной за прошлые периоды времени (лаговые пере­менные) непосредственно включены в модель. Модели второго типа учитывают динамическую информацию в неявном виде. В эти модели включены переменные, характеризующие ожидае­мый или желаемый уровень результата, или одного из факторов в момент времени t. Этот уровень считается неизвестным и опреде­ляется экономическими единицами с учетом информации, кото­рой они располагают в момент (t — 1). Величину l, характеризующую запаздывание в воздействии фактора на результат, называют в эконометрике лагом, а времен­ные ряды самих факторных переменных, сдвинутые на один или более моментов времени, — лаговыми переменными. Интерпретация моделей с распределенным лагом Эконометрическое моделирование охарактеризованных вы­ше процессов осуществляется с применением моделей, содержа­щих не только текущие, но и лаговые значения факторных пере­менных. Эти модели называются моделями с распределенным лагом. Модель вида является примером модели с распределенным лагом. Эта модель говорит о том, что если в некоторый момент вре­мени t происходит изменение независимой переменной xt то это изменение будет влиять на значения переменной у в течение l следующих моментов времени. Коэффициент регрессии b0 при переменной xt характеризует среднее абсолютное изменение yt при изменении xt на 1 ед. свое­го измерения в некоторый фиксированный момент времени t, без учета воздействия лаговых значений фактора х. Этот коэффици­ент называют краткосрочным мультипликатором. В момент (t + 1) совокупное воздействие факторной перемен­ной xt на результату, составит (bо + b1) усл. ед., в момент (t+2) это воздействие можно охарактеризовать суммой (bо + b1 + b2) и т. д. Полученные таким образом суммы называют промежуточными мультипликаторами. С учетом конечной величины лага можно сказать, что изме­нение переменной xt в момент t на 1 усл. ед. приведет к общему изменению результата через / моментов времени на (bо + b1 +...+bl) абсолютных единиц. Введем следующее обозначение: bо + b1+...+ bl = b Величину b называют долгосрочным мультипликатором. Он по­казывает абсолютное изменение в долгосрочном периоде t + l ре­зультата у под влиянием изменения на 1 ед. фактора х. Предположим βj = bj/b,j = O:l.) Назовем полученные величины относительными коэффициен­тами модели с распределенным лагом. Если все коэффициенты bj имеют одинаковые знаки, то для любого j О < βj; < 1 и В этом случае относительные коэффициенты βj являются ве­сами для соответствующих коэффициентов bj. Каждый из них из­меряет долю общего изменения результативного признака в мо­мент времени (t+j). Зная величины βj, с помощью стандартных формул можно определить еще две важные характеристики модели множествен­ной регрессии: величину среднего лага и медианного лага. Сред­ний лаг определяется по формуле средней арифметической взве­шенной: и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t. Небольшая величина среднего лага свидетельствует об относительно быстром реагировании резуль­тата на изменение фактора, тогда как высокое его значение гово­рит о том, что воздействие фактора на результат будет сказывать­ся в течение длительного периода времени. Медианный лаг — это величина лага, для которого Это тот период времени, в течение которого с момента време­ни t будет реализована половина общего воздействия фактора на результат. Интерпретация моделей авторегрессии Наряду с лаговыми значениями независимых, или фактор­ных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые момен­ты или периоды времени. Например, потребление в момент вре­мени t формируется под воздействием дохода текущего и преды­дущего периодов, а также объема потребления прошлых перио­дов, например потребления в период (t — 1). Эти процессы обыч­но описывают с помощью моделей регрессии, содержащих в ка­честве факторов лаговые значения зависимой переменной, кото­рые называются моделями авторегрессии. Пусть имеется следующая модель: Как и в модели с распределенным лагом, b0 в этой модели ха­рактеризует краткосрочное изменение yt под воздействием изме­нения хt на 1 ед. Однако промежуточные и долгосрочный мульти­пликаторы в моделях авторегрессии несколько иные. К моменту времени (t + 1) результатизменился под воздействием измене­ния изучаемого фактора в момент времени t наед., апод воздействием своего изменения в непосредственно предшеству­ющий момент времени — на с1 ед. Таким образом, общее абсо­лютное изменение результата в момент (t + 1) составитед. Аналогично в момент времени (t + 2) абсолютное изменение ре­зультата составитед. и т. д. Следовательно, долгосрочный мультипликатор в модели авторегрессии можно рассчитать как сумму краткосрочного и промежуточных мультипликаторов: Учитывая, что практически во все модели авторегрессии вво­дится так называемое условие стабильности, состоящее в том, что коэффициент регрессии при переменнойпо абсолютной ве­личине меньше единицы(|c1| < 1), соотношение (7.8) можно преоб­разовать следующим образом: где Отметим, что такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основа­ны на предпосылке о наличии бесконечного лага в воздействии текущего значения зависимой переменной на ее будущие зна­чения
«Эконометрика. Парная регрессия и корреляция в эконометрических исследованиях.» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 207 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot