Спецификация переменных в уравнениях регрессии

⌛ 2009 год
👀 1169 просмотров
📌 1099 загрузок
🏢️ ТвГТУ

Выбери формат для чтения

Конспект лекции по дисциплине «Спецификация переменных в уравнениях регрессии», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Спецификация переменных в уравнениях регрессии», Word формат

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ТВЕРСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ КАФЕДРА «БУХГАЛТЕРСКИЙ УЧЕТ, АНАЛИЗ И АУДИТ» Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Тверь 2009 ________________________________________________________________________________ Раздел 4. Спецификация переменных в уравнениях регрессии Тематические вопросы: Эконометрические модели: общая характеристика, различия статистического и эконометрического подхода к моделированию. Спецификация переменных в уравнениях регрессии. Ошибки спецификации. Обобщенная линейная модель множественной регрессии. Обобщенный метод наименьших квадратов. Проблема гетероскедастичности. Автокорреляция. Анализ линейной модели множественной регрессии при гетероскедастичности и автокорреляции. Фиктивные переменные: общий случай. Множественные совокупности фиктивных переменных. Фиктивные переменные для коэффициентов наклона. Тест Чоу. Моделирование: влияние отсутствия переменной, которая должна быть включена; влияние включения в модель переменной, которая не должна быть включена. Замещающие переменные. Минимум содержания в соответствии с ГОС: линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками; регрессионные модели с переменной структурой (фиктивные переменные). 4.1.Выбор формы модели регрессии: проблемы спецификации, основные регрессионные модели..........................................................................2 4.2.Ошибки спецификации: виды, обнаружение, корректировка...............5 4.3.Проблема автокорреляции остатков в моделях регрессии....................6 4.4.Проблема гетероскедастичности остатков в моделях регрессии............................................................................12 4.5.Обобщенный метод наименьших квадратов......................................18 4.6.Фиктивные переменные в регрессионных моделях............................18 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ 4.1.Выбор формы модели регрессии: проблемы спецификации, основные регрессионные модели Многообразие и сложность экономических процессов предопределяет многообразие моделей, используемых для эконометрического анализа. С другой стороны, это существенно усложняет процесс нахождения максимально адекватной формулы зависимости. Для случая парной регрессии подбор модели обычно осуществляется по виду расположения наблюдаемых точек на корреляционном поле. Однако нередки ситуации, когда расположение точек приблизительно соответствует нескольким функциям и необходимо из них выявить наилучшую. Например, криволинейные зависимости могут аппроксимироваться полиномиальной, показательной, степенной, логарифмической функциями. Еще более неоднозначна ситуация для множествен-нои регрессии, так как наглядное представление статистических данных в этом случае невозможно. ◊Эконометрическая модель – экономико-математическая модель, параметры которой оцениваются с помощью методов математической статистики; выступает в качестве средства анализа и прогнозирования конкретных экономических процессов как на макро-, так и на микроэкономическом уровне на основе реальной статистической информации. ◊Экономико-статистическая модель – вид экономикоматематической модели; описывает зависимости, носящие вероятностный (стохастический) характер и возникающие под воздействием множества причин и следствий в массовых, повторяющихся явлениях; предназначена прежде всего для выявления тенденций и закономерностей, которые были в прошлом, чтобы с их помощью оценивать будущее Стандартная схема эконометрического исследования осуществлении ряда последовательных процедур: состоит в • Подбор начальной модели: осуществляется на экономической теории, предыдущих знаний об исследования, опыта исследователя и его интуиции. • Оценка параметров статистических данных. • Осуществление тестов проверки качества модели (обычно используются t-статистики для коэффициентов регрессии, Fстатистика для коэффициента детерминации и ряд других тестов). • При наличии хотя бы одного неудовлетворительного ответа по какому-либо тесту модель совершенствуется с целью устранения выявленного недостатка. • При положительных ответах по всем проведенным тестам модель считается качественной. Она используется для анализа и модели 2 на основе основе объекте имеющихся Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ прогноза объясняемой переменной. Основные проблемы спецификации модели регрессии: • Качественная модель является подгонкой спецификации модели под имеющийся набор данных. Поэтому вполне реальна картина, когда исследователи, обладающие разными наборами данных, строят разные модели для объяснения одной и той же переменной. • Использование модели для прогнозирования значений объясняемой переменной. Иногда хорошие с точки зрения диагностических тестов модели обладают весьма низкими прогнозными качествами. Признаки «хорошей» модели: • Скупость (простота): модель должна быть максимально простой, т.е. из двух моделей, приблизительно одинаково отражающих реальность, предпочтение отдается модели, содержащей меньшее число объясняющих переменных. • Единственность: для любого набора статистических данных определяемые коэффициенты регрессии должны вычисляться однозначно. • Максимальное соответствие: уравнение тем лучше, чем большую часть разброса зависимой переменной оно может объяснить, т.е. с максимально возможным скорректированным коэффициентом детерминации. • Согласованность с теорией: модель обязательно должна опираться на теоретический фундамент, т.к. в противном случае результат использования регрессионного уравнения может быть неадекватным. • Прогнозные качества: модель может быть признана качественной, если: полученные на ее основе прогнозы подтверждаются реальностью; модель имеет малое значение относительной ошибки прогноза ( V = S y ) при отсутствии автокорреляции остатков. Основные регрессионные модели: ◊Коэффициент эластичности переменной Y по переменной Х (Э) как относительное изменение Y вследствие единичного относительного изменения X, часто на практике, как процентное изменение Y для однопроцентного изменения X. 3 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Функционал ьная форма Уравнение Линейная модель Y = β 0+ β 1 X 1 + β 2 X 2 + Двойная логарифм ическая модель ln Y = β 0 + β 1 ln X 1 + Логлинейная модель ln Y = β 0 + β 1 X 1 + Линейнологарифм ическая модель Y = β 0 + β 1 ln X 1 + Обратная модель Степенная модель + ... + β m X m + ε + β 2 ln X 2 + ... + + β m ln X m + ε + β 2 X 2 + ... + + β mXm + ε + β 2 ln X 2 + ... + + β m ln X m + ε Y = β0 + β1 1 + X1 + β2 1 + ... + X2 + βm 1 + ε Xm Интерпретация коэффициента (ов) регрессии предельный эффект независимого фактора, т.е. прирост зависимой переменной при изменении независимого фактора на единицу процентное изменение зависимой переменной вследствие единичного относительного прироста (напр., однопроцентного) независимого фактора темп прироста зависимой переменной по объясняющей переменной, т.е. процентное изменение зависимой переменной при изменении независимого фактора на единицу (при интерпретации коэффициент следует умножать на 100%) изменение зависимой переменной вследствие единичного относительного прироста (напр., однопроцентного) независимого фактора (при интерпретации коэффициент следует делить на 100%) скорость асимптотического приближения зависимой переменной к некоторому пределу (напр., β0 ) при увеличении объясняющей переменной Y = β 0 + β 1 X + β 2 X 2 + аналогично + ... + β m X m + ε (после линейной X = X1, X 2 = X 2 , ..., X m = X m Показател ьная модель Y = β 0aβ X eε модели замены: Э= β X Y Э= β , эластичность постоянна Э = βX, эластичность растет с ростом Y Э= β 1 , Y эластичность убывает с ростом Y 1   Э = β−   XY  аналогично линейной модели ) аналогично лог-линейной модели (после логарифмирования) 4 Коэффициент эластичности, Э аналогично лог-линейной модели Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ 4.2.Ошибки спецификации: виды, обнаружение, корректировка ◊Ошибка спецификации как неправильный выбор функциональной формы или набора объясняющих переменных в регрессионной модели. Основные типы ошибок спецификации: • Отбрасывание значимой переменной: в результате оценки, полученные с помощью МНК по уравнению, являются смещенными и несостоятельными, следовательно, интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными. • Добавление незначимой переменной: в результате оценки коэффициентов, найденные с помощью МНК для модели, остаются, как правило, несмещенными и состоятельными; однако их точность уменьшится, увеличивая при этом стандартные ошибки, т.е. оценки становятся неэффективными, что отразится на их устойчивости; увеличение дисперсии оценок может привести к ошибочным результатам проверки гипотез относительно значений коэффициентов регрессии, расширению интервальных оценок. • Выбор неправильной функциональной формы: в результате оценки коэффициентов, найденные с помощью МНК для модели, как правило, являются смещенными, либо ухудшаются статистические свойства оценок коэффициентов регрессии и других показателей качества уравнения; прогнозные качества модели в этом случае очень низки. • Проблемы в использовании переменных: невозможно получение данных по переменной, невозможно измерить количественно переменную; такие ситуации характерны для переменных социально-экономического характера (напр., качество образования). Обнаружение и корректировка ошибок спецификации: Примеры обнаружения ошибок спецификации Примерная корректировка ошибок спецификации Если в уравнении регрессии В дальнейшем эту переменную имеется одна несущественная следует исключить из переменная, то она обнаружит рассмотрения себя по низкой t-статистике Если в уравнении несколько статистически незначимых объясняющих переменных, обнаруженных по низкой tстатистике Следует построить другое уравнение регрессии без незначимых переменных и провести анализ качества с помощью F-статистики. 5 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Проверить наличие мультиколлинеарности и провести соответствующие меры. Невозможность получения Подбор переменной данных (количественных) по заместителя: ◊Замещающие переменной. переменные переменные, которые вводятся в эконометрические модели вместо тех переменных, которые не поддаются измерению. Замещающая переменная должна коррелировать с переменной, которую она замещает. Существует ряд тестов обнаружения ошибок спецификации, среди которых можно выделить: • Тест Рамсея RESET • Тест (критерий) максимального правдоподобия • Тест Валда • Тест множителя Лагранжа • Тест Хаусмана • Box-Сох преобразование Суть данных тестов состоит либо в осуществлении преобразований случайных отклонений, либо масштаба зависимой переменной с тем, чтобы можно было сравнить начальное и преобразованное уравнения регрессии на основе известного критерия. Подробное описание данных тестов выходит за рамки данного курса и может быть найдено в дополнительной литературе. 4.3.Проблема автокорреляции остатков в моделях регрессии Автокорреляция остатков в моделях регрессии как нарушение важной предпосылки построения качественной регрессионной модели по МНК (одного из условий Гаусса-Маркова): «Случайные отклонения являются независимыми друг от друга: cov(εi,εj)=0, i‡j, cov(εi,εj)=σ2, i=j». ◊Автокорреляция (последовательная корреляция) остатков определяется как корреляция между остатками (отклонениями), 6 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные): cov(εt-1,εt)<>0. Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов. При использовании перекрестных данных наличие автокорреляции (пространственной корреляции) крайне редко. В экономических задачах значительно чаще встречается так называемая положительная автокорреляция (cov(εt-1,εt) > 0), чем отрицательная автокорреляция (cov(εt-1,εt)< 0). Примечание: Порядок автокорреляции определяется периодом (p) прошлых значений случайного члена εt-p, относительно периода (t) значения случайного члена εt , между которыми обнаружена корреляция: cov(εtНапример, автокорреляция первого порядка формализуется p,εt)<>0. следующим образом: εt=ρεt-1+ ut, где ρ – коэффициент автокорреляции первого порядка (-1;1). Основные причины, вызывающие появление автокорреляции: • Ошибки спецификации: неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может привести к автокорреляции. • Инерция: многие экономические показатели (например, инфляция, безработица, ВНП и т.п.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. • Эффект паутины: во многих сферах экономики экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом), в связи с чем неадекватно предполагать случайность отклонений друг от друга. 7 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ • Сглаживание данных: зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам, что может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода. Последствия автокорреляции: • Истинная автокорреляция не приводит к смещению оценок коэффициентов регрессии. Оценки параметров, оставаясь линейными и несмещенными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок (BLUE-оценок). • Дисперсии оценок являются смещенными. Зачастую дисперсии, вычисляемые по стандартным формулам, являются заниженными, что приводит к увеличению t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые в действительности таковыми могут и не являться. • Оценка дисперсии регрессии S2 является смещенной оценкой истинного значения, во многих случаях заниженной, что вызывает занижение оценок стандартных ошибок коэффициентов. • В силу вышесказанного выводы по t- и F-статистикам, определяющим значимость коэффициентов регрессии и коэффициента детерминации, возможно, будут неверными. Вследствие этого ухудшаются прогнозные качества модели. Методы обнаружения автокорреляции: • Графический метод: 1) последовательно-временные графики, увязывающие отклонения с моментами их получения, т.е. по оси абсцисс обычно откладываются либо момент получения статистических данных, либо порядковый номер наблюдения, а по оси ординат отклонения (оценки отклонений); 2) наложение на график реальных колебаний зависимой переменной графика колебаний переменной по уравнению регрессии и сопоставление: если эти графики пересекаются редко, то можно предположить наличие положительной автокорреляции остатков, и др. варианты. • Метод рядов: последовательно определяются знаки отклонений, причем ряд определяется как непрерывная последовательность одинаковых знаков, количество знаков в ряду называется длиной ряда. Визуальное распределение знаков свидетельствует о характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений, то 8 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция. Для более детального анализа имеются формализованные процедуры. • Критерий Дарбина-Уотсона: суть состоит в вычислении статистики Дарбина-Уотсона (в случае неприменимости – статистики Дарбина) и на основе ее величины осуществлении выводов об автокорреляции. ◊Статистика Дарбина-Уотсона предназначена для обнаружения автокорреляции первого порядка, основана на изучении остатков уравнения регрессии: T DW = ∑ (e t=2 − et − 1 ) t T ∑ 2 ≈ 2(1 − ret ,et − 1 ) , 2 t e t=1 где T – число наблюдений (обычно временных периодов), et – остатки уравнения регрессии, ret ,et − 1 – выборочный коэффициент автокорреляции T первого порядка: ret ,et − 1 = ∑ t=1 T ∑ t=1 et et − 1 2 t e T ∑ t=1 . 2 t−1 e Ограничения использования статистики Дарбина-Уотсона: • Критерий DW применяется лишь для тех моделей, которые содержат свободный член. • Предполагается, что случайные отклонения определяются по следующей итерационной схеме: εt=ρ εt-1+ ut, называемой авторегрессионной схемой первого порядка AR(1), где ut - случайный член. • Статистические данные должны иметь одинаковую периодичность (т. е. не должно быть пропусков в наблюдениях). • Критерий Дарбина-Уотсона не применим для регрессионных моделей, содержащих в составе объясняющих переменных зависимую переменную с временным лагом в один период, т. е. для так называемых авторегрессионных моделей вида: y t = β 0 + β 1 x t1 + ... + β m x tm + γ y t − 1 + ε t . 9 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Общая схема использования статистики Дарбина-Уотсона: • По построенному эмпирическому уравнению регрессии ˆt = b0 + b1 x t1 + ... + bm x tm определяются значения отклонений y ˆt для каждого наблюдения t=1,2…T. et = y t − y • Рассчитывается статистика DW: T DW = ∑ (e t=2 t − et − 1 ) T ∑ t=1 • 2 et2 По таблице критических точек Дарбина-Уотсона определяются границы приемлемости (dl,du) и осуществляются выводы по правилу: dl < DW < du вывод о наличии автокорреляции не определен du < DW < 4 - du автокорреляция отсутствует 4 - du < DW < 4 — dl вывод о наличии автокорреляции не определен 4 — dl < DW < 4 существует автокорреляция отрицательная Или применяется грубое правило: «автокорреляция остатков отсутствует, если 1,5 < DW < 2,5». ◊Статистика Дарбина используется для обнаружения автокорреляции в авторегрессионных моделях вида y t = β 0 + β 1 x t1 + ... + β m x tm + γ y t − 1 + ε t : h = ρˆ n n ≈ ( 1 − , 5 DW ) 1 − nSy2t − 1 1 − nSy2t − 1 , 2 где ρˆ - оценка автокорреляции первого порядка, Syt − 1 - выборочная дисперсия коэффициента при лаговой переменной yt-1 , n -число наблюдений. При большом объеме выборки n и ρ=0 статистика h имеет стандартизированное нормальное распределение (h~N(0,1)). Ограничения использования статистики Дарбина: только одна лаговая переменная, только автокорреляция первого порядка, невозможность 2 вычисления при nS yt − 1 = 1 . 10 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Общая схема использования статистики Дарбина: • По построенному эмпирическому уравнению регрессии y t = β 0 + β 1 x t1 + ... + β m x tm + γ y t − 1 + ε t определяются значения для расчета h-статистики. • Рассчитывается h-статистика: h = (1 − 0,5DW ) • n 1 − nSy2t − 1 По таблицам критических точек стандартизированного нормального распределения (функции Лапласа) по заданному уровню значимости α определяется критическая точка uα/2 из условия Ф(uα/2) = (1-α)/2 и сравнивается h с uα/2: если h < uα/2, то делается вывод об отсутствии автокорреляции, в противном случае – гипотеза об отсутствии автокорреляции должна быть отклонена. Устранение автокорреляции: • При установлении автокорреляции необходимо в первую очередь проанализировать правильность спецификации модели. Если после ряда возможных усовершенствований регрессии (уточнения состава объясняющих переменных либо изменения формы зависимости) автокорреляция по-прежнему имеет место, то, возможно, это связано с внутренними свойствами ряда отклонений. • В случае, если наличие автокорреляции связано с внутренними свойствами ряда отклонений, возможны определенные преобразования, устраняющие автокорреляцию. Среди них выделяется авторегрессионная схема первого порядка AR(1), которая, в принципе, может быть обобщена в AR(p), p = 2, 3, ... • Для применения указанных схем необходимо оценить коэффициент корреляции между отклонениями. Это может быть сделано различными методами: на основе статистики ДарбинаУотсона, Кохрана-Оркатта, Хилдрета-Лу и др. • В случае наличия среди объясняющих переменных лаговой зависимой переменной наличие автокорреляции устанавливается с помощью h-статистики Дарбина. А для ее устранения в этом случае предпочтителен метод Хилдрета-Лу. 11 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Авторегрессионная схема первого порядка AR(1): • Оценивается регрессия Y = b0 + b1 X + e и находятся остатки et , тогда наблюдениям t и (t-1) соответствуют формулам: y t = b0 + b1 x t + et , y t − 1 = b0 + b1 x t − 1 + et − 1 . • По остаткам, подверженным воздействию авторегрессии первого порядка εt=ρ εt-1+ ut, находится оценка коэффициента автокорреляции первого порядка: напр., на основе статистики Дарбина-Уотсона ρˆ ≈ ret , et − 1 = 1 − 0,5DW . • Оценка автокорреляции используется для пересчета данных для * * * уравнения регрессии: y t = b0 + b1 x t + v t , y t* = y t − ρˆy t − 1 , x t* = x t − ρˆx t − 1 , b0* = b0 (1 − ρˆ) , где v t = et − ρˆet − 1 ; причем для первого наблюдения выборки обычно используется y1* = • поправка Прайса-Винстена: x1* = 1 − ρˆ2 ⋅ x1 , 1 − ρˆ2 ⋅ y1 . Цикл повторяется (процесс останавливается, как только обеспечивается достаточная сходимость, т.е. результаты перестают существенно улучшаться). 4.4.Проблема гетероскедастичности остатков в моделях регрессии Гетероскедастичность остатков в моделях регрессии как нарушение важной предпосылки построения качественной регрессионной модели по МНК (одного из условий Гаусса-Маркова): «Дисперсия случайных отклонений εi постоянна для всех наблюдений: D(εi)=D(εj)=σ2». Выполнимость данной предпосылки называется гомоскедастичностъю (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностъю (непостоянством дисперсий отклонений). ◊Гетероскедастичность остатков определяется как различные вероятностные распределения случайных отклонений при различных наблюдениях, что основывается на априорной причине, вызывающей большую ошибку (отклонение) при одних наблюдениях и меньшую - при других. Проблема гетероскедастичности в большей степени характерна для перекрестных данных и довольно редко встречается при рассмотрении временных рядов. 12 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Виды гетероскедастичности: • истинная (вызывается непостоянством дисперсии случайного члена, ее зависимостью от различных факторов), • ложная (вызывается ошибочной спецификацией модели). Последствия гетероскедастичности: • Истинная гетероскедастичность не приводит к смещению оценок коэффициентов регрессии. Оценки коэффициентов по-прежнему остаются несмещенными и линейными. • Оценки не будут эффективными (т.е. они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра). Они не будут даже асимптотически эффективными. Увеличение дисперсии оценок снижает вероятность получения максимально точных оценок. • Дисперсии оценок будут рассчитываться со смещением. Смещенность появляется вследствие того, что необъясненная уравнением регрессии дисперсия, которая используется при вычислении оценок дисперсий всех коэффициентов, не является более несмещенной. Как правило, гетероскедастичность увеличивает дисперсию распределения оценок коэффициентов. • Гетероскедастичность вызывает тенденцию к недооценке стандартных ошибок коэффициентов. Вполне вероятно, что стандартные ошибки коэффициентов будут занижены, а следовательно, t-статистики будут завышены. Это может привести к признанию статистически значимыми коэффициентов, таковыми на самом деле не являющимися. • Вследствие вышесказанного все выводы, получаемые на основе соответствующих t- и F-статистик, а также интервальные оценки будут ненадежными. Следовательно, статистические выводы, получаемые при стандартных проверках качества оценок, могут быть ошибочными и приводить к неверным заключениям по построенной модели. Обнаружение гетероскедастичности. В ряде случаев на базе знаний характера данных появление проблемы гетероскедастичности можно предвидеть и попытаться устранить этот недостаток еще на этапе спецификации. Однако значительно чаще эту проблему приходится решать после построения уравнения регрессии. В последнем случае наиболее популярные и наглядные методы: графический анализ отклонений, тест ранговой корреляции Спирмена, тест Парка, тест Глейзера, тест Голдфелда-Квандта. Графический анализ остатков: в этом случае по оси абсцисс откладывается объясняющая переменная X (либо линейная комбинация 13 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ объясняющих переменных Ŷ, в случае множественной регрессии), а по оси ординат либо отклонения (остатки) et, либо их квадраты e2t; на основе визуального анализа формируются суждения: напр., если наблюдаются некоторые систематические изменения в соотношениях между значениями переменной и квадратами отклонений, то можно с большой вероятностью предполагать наличие гетероскедастичности остатков. Тест ранговой корреляции Спирмена: при использовании данного теста предполагается, что дисперсия отклонения будет либо увеличиваться, либо уменьшаться с увеличением значения X; поэтому для регрессии, построенной по МНК, абсолютные величины отклонений (остатков) и значения переменной X будут коррелированны. Схема теста ранговой корреляции Спирмена (проверка осуществляется по каждой объясняющей переменной отдельно): • Выборка упорядочивается по фактору X, при этом определяются ранги (порядковый номер) pXi, i=1,…,n. • Оценивается уравнение регрессии и вычисляются остатки ei, i=1, …,n. • Выборка упорядочивается по величине остатков ei, при этом определяются ранги (порядковый номер) pei, i=1,…,n. • Рассчитывается коэффициент ранговой корреляции Спирмена между рангами фактора и остатков: n rx , e = 1 − 6 • ∑ d i=1 2 n(n − 1) = 1− 6 ∑ i=1 ( p Xi − pei )2 rx , e n − 2 1 − rx2, e . 2 n(n − 1) Рассчитывается t-статистика, имеющая Стьюдента с числом степеней свободы (n-2): t = • n 2 i распределение . Формируется суждение по правилу: если наблюдаемое значение t α / 2, n − 2 t-статистики превышает критическое значение (определяемое по таблице критических точек распределения Стьюдента), то необходимо отклонить гипотезу о равенстве нулю коэффициента корреляции, а следовательно, и об отсутствии гетероскедастичности. В противном случае гипотеза об отсутствии гетероскедастичности принимается. Тест Парка: дополняет графический метод некоторыми формальными зависимостями; может приводить к необоснованным 14 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ выводам, поэтому дополняется другими тестами; включает следующие этапы: • Строится уравнение регрессии y i = b0 + b1 x i + ei . • ˆi )2 . Для каждого наблюдения определяются ln ei2 = ln(y i − y • ln ei2 = α + β ln x i + υ i ; Строится регрессия: в случае множественной регрессии зависимость строится для каждой объясняющей переменной. • Проверяется статистическая значимость коэффициента β β уравнения на основе t-статистики t = . Если коэффициент Sβ статистически значим, то это означает гетероскедастичности в статистических данных. наличие Тест Глейзера: по своей сути аналогичен тесту Парка и дополняет его анализом других (возможно, более подходящих) зависимостей между k дисперсиями отклонений И значениями переменной: ei = α + β x i + υ i , где k=…,-1,-0.5,0.5,1,… Так же, как и в тесте Парка, в тесте Глейзера для отклонений υ i может нарушаться условие гомоскедастичности. Однако во многих случаях предложенные модели являются достаточно хорошими для определения гетероскедастичности. Тест Голдфелда-Квандта: предполагается, что СКО отклонения пропорционально значению переменной X в i-наблюдении, отклонение имеют нормальное распределение и отсутствует автокорреляция остатков в i-наблюдении; состоит в следующем: • Все n наблюдений упорядочиваются по величине X. • Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k, (n – 2k), k соответственно. Для парной регрессии предлагаются следующие пропорции: n=30 и k=11, n=60 и k=22; для множественной регрессии k>(m+1). • Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке S1 = k ∑ ei2 будет существенно i=1 меньше S3 = • дисперсии n ∑ регрессии по третьей подвыборке ei2 . i = n− k + 1 Для сравнения соответствующих дисперсий строится следующая F-статистика: 15 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ S3 S (k − m − 1) F = = 3, S1 S1 (k − m − 1) где (k-m-1) - число степеней свободы соответствующих выборочных дисперсий (m- количество объясняющих переменных в уравнении регрессии). При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1= v2 = k-m-1. • S3 > Fα , k − m − 1, k − m − 1 , то S1 гетероскедастичности отклоняется значимости α. Если F = гипотеза при об отсутствии выбранном уровне Для множественной регрессии данный тест обычно проводится для той объясняющей переменной, которая в наибольшей степени связана с СКО отклонения. Если нет уверенности относительно выбора переменной, то данный тест может осуществляться для каждой из объясняющих переменных. Этот же тест может быть использован при предположении об обратной пропорциональности между СКО отклонения и значениями объясняющей переменной; при этом статистика Фишера примет вид: F = S1/S3. Устранение проблемы гетероскедастичности. В случае установления наличия гетероскедастичности ее корректировка представляет довольно серьезную проблему. Одним из возможных решений является метод взвешенных наименьших квадратов (при этом необходима определенная информация либо обоснованные предположения о величинах дисперсий отклонений). На практике имеет смысл попробовать несколько методов определения гетероскедастичности и способов ее корректировки (преобразований, стабилизирующих дисперсию). Во многих случаях дисперсии отклонений зависят не от включенных в уравнение регрессии объясняющих переменных, а от тех, которые не включены в модель, но играют существенную роль в исследуемой зависимости, в этом случае они должны быть включены в модель. В ряде случаев для устранения гетероскедастичности необходимо изменить спецификацию модели (например, линейную на лог-линейную, мультипликативную на аддитивную и т. п.). Метод взвешенных наименьших квадратов (ВНК): применяется при 2 известных для каждого наблюдения значениях дисперсии отклонения σ i ; в этом случае можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение дисперсии. 16 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ Схема метода взвешенных наименьших квадратов: • • • Каждую из пар наблюдений (хi, yi) делят на известную величину СКО отклонения σ i в i-наблюдении. Тем самым наблюдениям с наименьшими дисперсиями придаются наибольшие "веса", а с максимальными дисперсиями – наименьшие "веса"; так, наблюдения с меньшими дисперсиями отклонений будут более значимыми при оценке коэффициентов регрессии, чем наблюдения с большими дисперсиями, что увеличивает вероятность получения более точных оценок.  1 xi yi   строится , , По МНК для преобразованных значений  σ σ σ i i   i уравнение регрессии без свободного члена с гарантированными y i* = y i y i* = β 0 z i + β 1 x i* + υ i , где качествами оценок: σi, z = 1 , υi = εi x i* = x i σi σi , i σi. После определения по МНК оценок коэффициентов β0 и β1 для преобразованного уравнения возвращаются к исходному уравнению регрессии y i = β 0 + β 1 x i + ε i . Для применения ВНК необходимо знать фактические значения дисперсий отклонений. На практике такие значения известны крайне редко. Следовательно, чтобы применить ВНК, необходимо сделать реалистические 2 предположения о значениях σ i : • дисперсии отклонений пропорциональны значениям 2 2 2 объясняющей переменной: σ i = σ x i , где σ - коэффициент пропорциональности, тогда уравнение преобразуется по схеме  1 x y   , i , i  . Если в уравнении регрессии присутствует  x xi x i  i  несколько объясняющих переменных, можно поступить  1 x y  , i , i  , где ŷ - исходное следующим образом:   y ˆi ˆi  y y  ˆi уравнение множественной регрессии как комбинация объясняющих переменных. • дисперсии отклонений пропорциональны квадрату значений σ i2 = σ 2 x i2 , объясняющей переменной: тогда уравнение  1 xi y i , , преобразуется по схеме   xi xi xi 17   .  Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ 4.5.Обобщенный метод наименьших квадратов Невозможность или нецелесообразность использования традиционного МНК по причине проявляющихся в той или иной степени проблем автокорреляции или гетероскедастичности обуславливает использование обобщенного метода наименьших квадратов (ОМНК), при котором корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии. Обобщенный МНК в чистом виде практически не применяется: • Подход к реализации ОМНК в виде авторегрессионных преобразований является целесообразным при наличии проблем автокорреляции остатков. • Подход к реализации ОМНК в виде взвешенного МНК является достаточно практичным при наличии проблем гетероскедастичности; иногда его называют доступный обобщенный МНК. Суть обобщенного МНК: Пусть ковариационная матрица ошибок имеет T следующий вид: E (ε ε ) = λ W , где W-известная матрица (симметричная и положительно определенная), представленная в виде W = АT А , матрица А – квадратная невырожденная матрица (напр., разложение Холецкого). Коэффициенты β в этом случае можно оценить по формуле: βˆ = ( X T W − 1 X )− 1 X TW − 1Y . Обобщенный МНК эквивалентен следующей ~ ~ ~ ~ вспомогательной регрессии: Y = Xβ + ~ ε , где Y = ( A − 1 )T Y , X = ( A − 1 )T X , ~ ε = ( A − 1 )T ε . Геометрически задача состоит в том, чтобы найти такой ~ ~ , чтобы расстояние было минимальным: Y − Y → min . вектор Y При этом следует учитывать, что коэффициент детерминации не может служить удовлетворительной мерой качества подгонки при использовании ОМНК. На практике достаточную общность имеет критерий стандартных отклонений (стандартных ошибок) регрессии. 4.6.Фиктивные переменные в регрессионных моделях ◊Фиктивная переменная формализует в регрессионных моделях влияние качественного фактора, отражая два противоположных состояния фактора: "фактор действует" - "фактор не действует". Как правило, фиктивная переменная выражается в двоичной форме:  0, фактор не действует D =  .  1, фактор действует Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного 18 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ анализа): Y = β 0 + γ D + ε , где γ указывает величину, на которую отличаются средние значения зависимой переменной Y при отсутствии или наличии фактора, выраженного переменной D: M(Y | D = 0) = β 0 , M(Y | D = 1) = β 0 + γ . Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-моделями (моделями ковариационного анализа): • Правило формализации качественного фактора: «Если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k-1) фиктивных переменных»; если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеарности или так называемую ловушку фиктивной переменной. • Значение фиктивной переменной, для которого принимается D=0, называется базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным. • При наличии у фиктивной переменной двух альтернатив: Y = β 0 + β 1X + γ D + ε , M(Y | x , D = 0) = β 0 + β 1 x , M(Y | x, D = 1) = (β 0 + γ ) + β 1 x ; где коэффициент γ называется дифференциальным коэффициентом свободного члена, т. к. он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равном единице, от свободного члена модели при базовом значении фиктивной переменной. • При наличии у фиктивной переменной более двух альтернатив: Y = β 0 + β 1 X + γ 1D1 + γ 2 D2 + ε , M(Y | x, D1 = 0, D2 = 0) = β 0 + β 1 x , M(Y | x , D1 = 1, D2 = 0) = (β 0 + γ 1 ) + β 1 x , M(Y | x , D1 = 1, D2 = 1) = (β 0 + γ 1 + γ 2 ) + β 1 x , где коэффициент γ 1 , γ 2 - дифференциальные коэффициенты свободного члена. • Модель регрессии с одной количественной и двумя качественными Y = β 0 + β 1 X + γ 1D1 + γ 2 D2 + ε , переменными: M(Y | x, D1 = 0, D2 = 0) = β 0 + β 1 x , M(Y | x, D1 = 0, D2 = 1) = (β 0 + γ 2 ) + β 1 x , M(Y | x , D1 = 1, D2 = 0) = (β 0 + γ 1 ) + β 1 x , M(Y | x , D1 = 1, D2 = 1) = (β 0 + γ 1 + γ 2 ) + β 1 x , где коэффициент γ 1 , γ 2 - дифференциальные коэффициенты свободного члена. 19 Конспект лекций по дисциплине «Эконометрика» для студентов специальности «Бухгалтерский учет, анализ и аудит» Составитель: Коновалова А.С. Раздел 4. Спецификация переменных в уравнениях регрессии ________________________________________________________________________________ • Модель регрессии, где изменение качественного фактора может привести как к изменению свободного члена уравнения, так и Y = β 0 + β 1 X + γ 1D1 + γ 2 D1 X + ε , наклона прямой регрессии: M(Y | x, D1 = 0) = β 0 + β 1 x , M(Y | x, D1 = 1) = (β 0 + γ 1 ) + (β 1 + γ 2 )x , где γ 1 - дифференциальный коэффициент свободного члена, γ 2 дифференциальный угловой коэффициентом соответственно. Представленные выше схемы могут быть распространены на ситуации с произвольным числом количественных и качественных факторов. Модели, в которых фиктивная зависимая переменная: • Y = β 0 + β 1X + ε , Линейные вероятностные модели (LPM): M(Y | x ) = P (Y = 1 | x ) = β 0 + β 1 x , применимость МНК к которым имеет определенные ограничения: случайные отклонения в данных моделях не являются нормальными случайными величинами, а скорее всего, имеют биноминальное распределение; случайные отклонения не обладают свойством постоянства дисперсии (гомоскедастичности); нарушается неравенство 0 ≤ P(Y =1| х) ≤ 1; применение модели проблематично с содержательной точки зрения; так непосредственное использование МНК в модели LPM приводит к серьезным погрешностям и необоснованным выводам. Использование обыкновенного МНК в данном случае нецелесообразно. • Logit модель для преодоления недостатков модели LPM: такие модели, в которых не нарушается неравенство 0 ≤ P(Y=1|х) ≤ 1, и зависимость между P(Y=1|х) и х не имеет линейный характер pi = z i = β 0 + β 1 x i , где (закон убывающей эффективности): ln 1 − pi условная pi = M(Y = 1 | x i ) = вероятность 1 . 1+ e Использование обыкновенного МНК в данном случае нецелесообразно в силу проблемы гетероскедастичности. Поэтому при расчетах коэффициентов обычно используется взвешенный МНК, устраняющий указанный недостаток. 20 − ( β 0 + β 1xi )

ЭКОНОМЕТРИКА

#Лекция

Спецификация переменных в уравнениях регрессии

Тебе могут подойти лекции

Эконометрика.Математическое моделирование экономических процессов

Спецификация уравнения множественной регрессии

Эконометрика

Эконометрика. Задачи и модели.

Парный регрессионный анализ

Эконометрика

Отбор факторов и выбор формы уравнения множественной регрессии

Парная линейная регрессия

Эконометрика. Статистическая оценка достоверности выборочных показателей связи.Системы эконометрических уравнений

Парная регрессия и корреляция

Спецификация переменных в уравнениях регрессии

Тебе могут подойти лекции

Другие экономические предметы

Помощь с написанием учебных работ