Понятие и сущность мультиколлинеарности (частичной коллинеарности)
Множественная регрессия представляет собой эконометрическую модель, которая оформлена в виде уравнения, включающего одну эндогенную (зависимую, результативную) переменную и несколько экзогенных (независимых, факторных, объясняющих) переменных.
Как правило, модель множественной регрессии выстраивают на основе метода наименьших квадратов. Однако его применение зачастую оборачивается для исследователей столкновением с достаточно серьёзной проблемой. Эта проблема проявляется в мультиколлинеарности.
Мультиколлинеарность модели множественной регрессии представляет собой наличие высокой взаимной статистической зависимости между факторными переменными.
Вообще в эконометрике выделяют две основные разновидности коллинеарности:
- полная коллинеарность, которая заключается в наличие между факторами функциональной (тождественной) линейной зависимости (наибольшей корреляции);
- частичная коллинеарность (или мультиколлинеарность), которая заключается в наличии между факторами сильной (но не полной) корреляции.
Отрицательные последствия коллинеарности факторов проявляются в том, что параметры в модели множественной регрессии (независимо от методов оценки) оказываются неопределёнными или неустойчивыми. Неопределённость значений параметров регрессионной модели характерна для полной коллинеарности.
Неустойчивость оценок параметров регрессионной модели характерна для частичной коллинеарности (мультиколлинеарности). Это находит выражение в увеличении дисперсии оценок, что означает сильное различие конкретных результатов оценок при однородных выборках. В связи с этим усложняется задача по интерпретации влияния тех или иных факторов на изучаемый объект.
В то же время регрессионная модель, в которой существует мультиколлинеарность, может признаваться статистически значимой. То есть качество множественной регрессии будет считаться высоким даже тогда, когда все коэффициенты являются незначимыми. В этом случае дальнейшая стратегия проведения эконометрического исследования зависит от его основной цели.
Мультиколлинеарность в модели множественной регрессии может быть обнаружена, если в её отношении будет определено, что:
- стандартные ошибки оценок параметров модели имеют большие значения;
- t-статистики имеют маленькие значения, что говорит о незначимости коэффициентов;
- у оценок параметров неправильные знаки, несмотря на статистическую значимость всей модели;
- в условиях достаточно однородной выборки оценки параметров сильно изменяются в результате добавления (или удаления) выборочных данных.
О наличии мультиколлинеарности в регрессионной модели свидетельствуют слишком высокие значения показателя VIF = 1 / (1 – R^2), где R^2 – это коэффициенты детерминации регрессий факторов на остальные факторы.
Если моделирование было нацелено на прогнозирование будущих значений зависимой переменной, то наличие мультиколлинеарности при условии достаточно большого коэффициента детерминации (то есть R^2 больше или равно 0,85) не окажет какого-нибудь значимого влияния на качество прогноза.
Методы устранения (уменьшения) мультиколлинеарсти модели множественной регрессии
Мультиколлинеарность необходимо устранить в случае проведения исследования в целях определения степени воздействия каждого из факторов на итоговый результат, поскольку зависимость между переменными будет представлена в значительно искаженном виде. Тогда исследователю необходимо воспользоваться специально выведенным и практически обработанным методом устранения или уменьшения мультиколлинеарсти.
На нынешний момент в эконометрической науке ещё нет общепринятого мнения насчёт того, каким образом действовать в подобной ситуации. Каждый исследователь сам выбирает способ нивелирования взаимозависимости факторных переменных. Наибольшей популярностью сейчас пользуются следующие методы:
- метод преобразования переменных модели, или метод главных компонент – он заключается в переходе от исходных переменных, связанных тесной корреляционной связью, к новым (ортогональным) переменным, которые между собой слабо коррелированны или вообще не коррелированны;
- метод регуляризации, или метод вычисления смещенных оценок – он заключается в том, что исходная система эконометрических уравнений множественной регрессии заменяется на «регуляризированную» систему, в которую введён параметр регуляризации, чей отбор требует априорной информации о точности задания вектора зависимой переменной;
- метод отбора наиболее информативных объясняющих переменных модели и несвязанных при этом друг с другом – будет эффективен, если первоначальный отбор был проведен не тщательно и не были выявлены все существующие переменные.
Таким образом, в процессе моделирования сложных экономических объектов и явлений, которые могут быть описаны только системами уравнений множественной регрессии, может возникнуть мультиколлинеарность, то есть взаимная зависимость факторных показателей. Она может как осложнить процесс исследования (тогда приходится использовать специальные методы), так и не оказать существенного влияния на итоговые результаты. Это определяется целю проведения эконометрического исследования.