Понятие коэффициента детерминации
Коэффициент детерминации – это мера разброса зависимой переменной, уточненной рассматриваемой моделью зависимости.
Разброс зависимой в эконометрике называется дисперсией. Дисперсия представляет собой разброс или отклонения показателя случайной величины от математически ожидаемой. Дисперсия в статистике применяется возведенной в квадрат. Извлечение квадрата из показателя дисперсии показывает размер стандартного отклонения или разброса. Стандартное отклонение легко сопоставить с исследуемой величиной, так как оно измеряется в тех же единицах. А дисперсия показывается в квадрате этой единицы.
Коэффициент детерминации принято обозначать R2. Он используется в качестве показателя, характеризующего зависимость одной величины от множества других величин.
Недостатки коэффициента детерминации
Главная проблема использования коэффициента детерминации заключается в том, что если в расчетную формулу добавлять новые переменные, то его значение будет только увеличиваться. Причем эта тенденция будет сохраняться даже в том случае, если эти переменные не будут прямым образом влиять на исследуемую величину. Именно поэтому, применение коэффициента детерминации для сравнения моделей, подверженных различным факторам, является некорректным и не показательным. В этом случае применяют скорректированные показатели.
Скорректированный коэффициент детерминации
Для того, чтобы сравнивать модели, подверженные разному числу внешних факторов, применяется скорректированный коэффициент детерминации. Он строится на несмещенных оценках дисперсии, что не сказывается на статистике коэффициента детерминации.
Скорректированный показатель как бы штрафует за каждый дополнительно включенный в расчет фактор. Этот показатель всегда меньше единицы, но в теоретических расчетах он может быть меньше нуля. Последнее происходит, если количество факторов растет, а показатель коэффициента ничтожно мал.
Стоит уточнить, что высокие значения коэффициента детерминации еще не говорят о причинно-следственной связи между переменными, что напоминает случай с использованием коэффициента корреляции. В случае, если объясняемая переменная и факторы имеют динамику к возрастанию, то будет увеличиваться и коэффициент детерминации. Поэтому при его использовании очень важно соблюдать логику и смысловую адекватность рассматриваемой модели.