Анализ качества модели регрессии

👀 1109 просмотров
📌 1071 загрузка

Выбери формат для чтения

Конспект лекции по дисциплине «Анализ качества модели регрессии», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Анализ качества модели регрессии», Word формат

4. Анализ качества модели регрессии При анализе качества модели регрессии выполняют: • проверку значимости модели в целом, • проверку значимости параметров функции регрессии, • проверку предпосылок метода наименьших квадратов. На каждом этапе используют статистические критерии, выводы делают с определенной надежностью (вероятностью), или с определенным уровнем значимости. Приемлемыми являются: надежность не менее 95% и уровень значимости не более 5%. 4.1Оценка значимости модели регрессии в целом Проверка значимости модели регрессии в целом, выполняется на основе дисперсионного анализа с помощью критерия Фишера (F- критерия). При этом вычисляются следующие величины: На основе данных величин определяются: где п - количество вариантов значений показателей, т - количество параметров при факторах. Используя дисперсии, вычисляют F – статистику Она сравнивается с критическими значениями , Где , Критические значения имеются в таблицах приложений учебников по эконометрике и статистике, либо их можно взять в EXEL в статистических функциях. Согласно F - критерию модель регрессии значима в целом с уровнем значимости «α» при выполнении условия: . Дополнительной характеристикой качества модели в целом служит коэффициент (индекс) детерминации: Чем ближе значение к единице, тем меньше оснований сразу отклонить предлагаемую модель, как неудачную, с точки зрения статистических критериев. Принято с помощью величины коэффициента (индекса) детерминации, указанной в процентах, говорить о том «на сколько процентов предлагаемая модель объясняет поведение моделируемого количественного показателя». Если модель регрессии значима в целом с приемлемым уровнем значимости (не более 5%), то можно перейти к следующему этапу оценки качества модели. В противном случае, анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя. 4.2 Оценка значимости параметров функции регрессии Важно уметь оценивать не только значимость модели в целом, но и отдельных параметров, а вместе с ними и факторов, включаемых в функцию регрессии. Оценить значимость параметров регрессии можно с помощью критерия Стьюдента (t- критерия). Согласно критерию Стьюдента, вычисляются t- статистики, равные отношению самих параметров и их стандартных ошибок, которые сравниваются с критическими значениями Критические значения имеются в таблицах приложений учебников по эконометрике и статистике, либо их можно взять в EXEL в статистических функциях. Согласно критерию, предположение о незначимости параметра регрессии отклоняется с уровнем значимости «α» при выполнении условия: , Если предположение о несущественности для всех параметров отклоняется с приемлемым уровнем значимости (не более 5%), то мо:кт о перейти к следующему этапу оценки качества модели. В противном случае, анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя. 4.3 Проверка предпосылок метода наименьших квадратов Проверка существенности параметров функции регрессии, полученных с помощью МНК, и значимости модели регрессии в целом выполняется с помощью критериев Стьюдента и Фишера. При работе с этими критериями, согласно теореме Гаусса Маркова, используются следующие предположения (предпосылки МНК) относительно необходимых свойств у модели: • случайность остатков, • математическое ожидание остатков равно нулю, • равноизменчивость (гомоскедастичность) остатков, • отсутствие автокорреляции остатков, • нормальный закон распределения остатков. Согласно предпосылке МНК о случайности остатков требуется, чтобы график остатков (в прямоугольной системе координат, где ось абсцисс - номер наблюдения, а ось ординат - остатки) располагался в горизонтальной полосе, симметричной относительно оси абсцисс, имел много локальных экстремумов. При проверке предпосылки МНК о математическом ожидании остатков полезно знать то, что несмещенной и состоятельной оценкой математического ожидания случайной величины является ее среднее значение, т.е. . Таким образом, косвенным подтверждением этой предпосылки может являться расчёт среднего значения остатков Согласно предпосылке МНК о равноизменчивости остатков требуется, чтобы дисперсия остатков была гомоскедастичной, т.е. для всех наблюдений остатки имели одинаковую дисперсию. В противном случае имеет место гетероскедастичность остатков. Для оценивания гомоскедастичности остатков модели регрессии можно применить, разработанный в 1965 г метод Голъдфельда - Квандта, который включает следующие операции: • Упорядочить наблюдения по возрастанию фактора. • Исключить из рассмотрения С центральных наблюдений. При этом желательно, чтобы выполнялось условие: где - количество вариантов значений показателей, количество параметров при факторах. • Разделить наблюдений на две равные группы (соответственно с малыми и большими значениями фактора) и получить по каждой группе модели регрессии того же вида. • Определить остаточные суммы квадратов для обеих моделей регрессии , вычислить отношение . Если , где , то с уровнем значимости «α» нарушена предпосылка о гомоскедастичности остатков. Согласно предпосылке МНК требуется отсутствие автокорреляции остатков. Как правило, если автокорреляция имеется, то она сильнее между соседними остатками. Отсутствие корреляции между ними служит основанием к тому, чтобы считать, что автокорреляция остатков отсутствует в целом. Наличие автокорреляции между соседними остатками может быть проверено с помощью критерия Дарбина - Уотсона ( критерия). Согласно критерию вычисляется : . Она сравнивается с критическими значениями . Критические значения статистики Дарбина-Уотсона обычно приводятся в таблицах приложений учебников по эконометрике. от числа наблюдений n, количества факторов m и уровня значимости α. Таблица для определения критических значений статистики Дарбина-Уотсона я привожу в приложении к данной лекции. Возможные выводы: • Если то есть положительная автокорреляция, гипотеза об отсутствии автокорреляции остатков отклоняется с принятым уровнем значимости; • Если то нет оснований для того, чтобы отклонить гипотезу об отсутствии автокорреляции остатков с принятым уровнем значимости; • Если то нельзя сделать вывод по гипотезе об отсутствии автокорреляции остатков с принятым уровнем значимости; • Если, то есть отрицательная автокорреляция, гипотеза об отсутствии автокорреляции остатков отклоняется с принятым уровнем значимости. Недостатком - критерия является наличие областей неопределенности вывода по критерию. Тем не менее, критерий Дарбина - Уотсона является наиболее часто используемым. Согласно предпосылке МНК требуется наличие нормального закона распределения у остатков. Имеются различные статистические критерии, которые позволяют выполнить данный анализ. Одним из наиболее простых и доступных приемов служит проверка выполнения неравенств: ) Если они выполняются, то с вероятностью не менее 0,95 не нарушена предпосылка о наличии нормального закона распределения остатков. Если, хотя бы одна из предпосылок МНК нарушена, то анализ функции регрессии прекращается, модель отклоняется, как неудачная, и не используется для описания и прогнозов моделируемого показателя. Прогнозы количественного показателя экономики Если модель регрессии значима в целом, предположение о незначимости отклоняется по всем параметрам функции регрессии, не нарушены предпосылки МНК, причем все выводы сформулированы с приемлемой надежностью, то модель может быть использована для анализа и прогнозов количественного показателя экономики. Условно «лучшей» моделью для анализа и прогнозов исследуемого показателя можно считать ту, для которой: • показатель детерминации выше, • стандартная ошибка меньше, • доверительный интервал прогноза уже. Различают точечный и доверительный (интервальный) прогнозы моделируемого показателя (у). Точечный прогноз получают путем подстановки в функцию регрессии значений факторов. Такой прогноз имеет нулевую вероятность. Интервальный прогноз показателя (у), с заданной доверительной вероятностью имеет вид: . Где - максимальное отклонение от точечного прогноза, статистика Стьюдента, стандартная ошибка модели регрессии, п - количество вариантов значений показателей, т - количество параметров функции регрессии при факторах.