Анализ качества модели регрессии
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
4. Анализ качества модели регрессии
При анализе качества модели регрессии выполняют:
• проверку значимости модели в целом,
• проверку значимости параметров функции регрессии,
• проверку предпосылок метода наименьших квадратов.
На каждом этапе используют статистические критерии, выводы делают с определенной надежностью (вероятностью), или с определенным уровнем значимости. Приемлемыми являются: надежность не менее 95% и уровень значимости не более 5%.
4.1Оценка значимости модели регрессии в целом
Проверка значимости модели регрессии в целом, выполняется на основе дисперсионного анализа с помощью критерия Фишера (F- критерия). При этом вычисляются следующие величины:
На основе данных величин определяются:
где
п - количество вариантов значений показателей, т - количество параметров при факторах.
Используя дисперсии, вычисляют F – статистику
Она сравнивается с критическими значениями ,
Где ,
Критические значения имеются в таблицах приложений учебников по эконометрике и статистике, либо их можно взять в EXEL в статистических функциях.
Согласно F - критерию модель регрессии значима в целом с уровнем значимости «α» при выполнении условия:
.
Дополнительной характеристикой качества модели в целом служит коэффициент (индекс) детерминации:
Чем ближе значение к единице, тем меньше оснований сразу отклонить предлагаемую модель, как неудачную, с точки зрения статистических критериев. Принято с помощью величины коэффициента (индекса) детерминации, указанной в процентах, говорить о том «на сколько процентов предлагаемая модель объясняет поведение моделируемого количественного показателя».
Если модель регрессии значима в целом с приемлемым уровнем значимости (не более 5%), то можно перейти к следующему этапу оценки качества модели. В противном случае, анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя.
4.2 Оценка значимости параметров функции регрессии
Важно уметь оценивать не только значимость модели в целом, но и отдельных параметров, а вместе с ними и факторов, включаемых в функцию регрессии. Оценить значимость параметров регрессии можно с помощью критерия Стьюдента (t- критерия).
Согласно критерию Стьюдента, вычисляются t- статистики, равные отношению самих параметров и их стандартных ошибок, которые сравниваются с критическими значениями
Критические значения имеются в таблицах приложений учебников по эконометрике и статистике, либо их можно взять в EXEL в статистических функциях.
Согласно критерию, предположение о незначимости параметра регрессии отклоняется с уровнем значимости «α» при выполнении условия:
,
Если предположение о несущественности для всех параметров отклоняется с приемлемым уровнем значимости (не более 5%), то мо:кт о перейти к следующему этапу оценки качества модели. В противном случае, анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя.
4.3 Проверка предпосылок метода наименьших квадратов
Проверка существенности параметров функции регрессии, полученных с помощью МНК, и значимости модели регрессии в целом выполняется с помощью критериев Стьюдента и Фишера. При работе с этими критериями, согласно теореме Гаусса Маркова, используются следующие предположения (предпосылки МНК) относительно необходимых свойств у модели:
• случайность остатков,
• математическое ожидание остатков равно нулю,
• равноизменчивость (гомоскедастичность) остатков,
• отсутствие автокорреляции остатков,
• нормальный закон распределения остатков.
Согласно предпосылке МНК о случайности остатков требуется, чтобы график остатков (в прямоугольной системе координат, где ось абсцисс - номер наблюдения, а ось ординат - остатки) располагался в горизонтальной полосе, симметричной относительно оси абсцисс, имел много локальных экстремумов.
При проверке предпосылки МНК о математическом ожидании остатков полезно знать то, что несмещенной и состоятельной оценкой математического ожидания случайной величины является ее среднее значение, т.е. . Таким образом, косвенным подтверждением этой предпосылки может являться расчёт среднего значения остатков
Согласно предпосылке МНК о равноизменчивости остатков требуется, чтобы дисперсия остатков была гомоскедастичной, т.е. для всех наблюдений остатки имели одинаковую дисперсию. В противном случае имеет место гетероскедастичность остатков. Для оценивания гомоскедастичности остатков модели регрессии можно применить, разработанный в 1965 г метод Голъдфельда - Квандта, который включает следующие операции:
• Упорядочить наблюдения по возрастанию фактора.
• Исключить из рассмотрения С центральных наблюдений. При этом желательно, чтобы выполнялось условие: где - количество вариантов значений показателей, количество параметров при факторах.
• Разделить наблюдений на две равные группы (соответственно с малыми и большими значениями фактора) и получить по каждой группе модели регрессии того же вида.
• Определить остаточные суммы квадратов для обеих моделей регрессии , вычислить отношение .
Если , где , то с уровнем значимости «α» нарушена предпосылка о гомоскедастичности остатков.
Согласно предпосылке МНК требуется отсутствие автокорреляции остатков. Как правило, если автокорреляция имеется, то она сильнее между соседними остатками. Отсутствие корреляции между ними служит основанием к тому, чтобы считать, что автокорреляция остатков отсутствует в целом.
Наличие автокорреляции между соседними остатками может быть проверено с помощью критерия Дарбина - Уотсона ( критерия). Согласно критерию вычисляется :
.
Она сравнивается с критическими значениями . Критические значения статистики Дарбина-Уотсона обычно приводятся в таблицах приложений учебников по эконометрике. от числа наблюдений n, количества факторов m и уровня значимости α. Таблица для определения критических значений статистики Дарбина-Уотсона я привожу в приложении к данной лекции.
Возможные выводы:
• Если то есть положительная автокорреляция, гипотеза об отсутствии автокорреляции остатков отклоняется с принятым уровнем значимости;
• Если то нет оснований для того, чтобы отклонить гипотезу об отсутствии автокорреляции остатков с принятым уровнем значимости;
• Если то нельзя сделать вывод по гипотезе об отсутствии автокорреляции остатков с принятым уровнем значимости;
• Если, то есть отрицательная автокорреляция, гипотеза об отсутствии автокорреляции остатков отклоняется с принятым уровнем значимости.
Недостатком - критерия является наличие областей неопределенности вывода по критерию. Тем не менее, критерий Дарбина - Уотсона является наиболее часто используемым.
Согласно предпосылке МНК требуется наличие нормального закона распределения у остатков. Имеются различные статистические критерии, которые позволяют выполнить данный анализ. Одним из наиболее простых и доступных приемов служит проверка выполнения неравенств:
)
Если они выполняются, то с вероятностью не менее 0,95 не нарушена предпосылка о наличии нормального закона распределения остатков.
Если, хотя бы одна из предпосылок МНК нарушена, то анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя.
Прогнозы количественного показателя экономики
Если модель регрессии значима в целом, предположение о незначимости отклоняется по всем параметрам функции регрессии, не нарушены предпосылки МНК, причем все выводы сформулированы с приемлемой надежностью, то модель может быть использована для анализа и прогнозов количественного показателя экономики. Условно «лучшей» моделью для анализа и прогнозов исследуемого показателя можно считать ту, для которой:
• показатель детерминации выше,
• стандартная ошибка меньше,
• доверительный интервал прогноза уже.
Различают точечный и доверительный (интервальный) прогнозы моделируемого показателя (у). Точечный прогноз получают путем подстановки в функцию регрессии значений факторов. Такой прогноз имеет нулевую вероятность. Интервальный прогноз показателя (у), с заданной доверительной вероятностью имеет вид:
.
Где - максимальное отклонение от точечного прогноза,
статистика Стьюдента,
стандартная ошибка модели регрессии,
п - количество вариантов значений показателей,
т - количество параметров функции регрессии при факторах.