Линейная регрессия – это модель, применяемая в статистике для отслеживания зависимости изменения одной переменной от изменения другой переменной или их группы.
Место статистики в экономике
Статистика – это научная дисциплина, которое осуществляет изучение больших массивов данных, исследует количественную сторону массовых явлений в обществе.
Использование инструментов статистического анализа широко применяется в теоретической и практической экономике. Статистические данные наиболее точно способны описать процессы и явления в хозяйственной структуре страны с учетом динамики их изменения и воздействия внешних и внутренних факторов. Информация, полученная с помощью статистических вычислений, широко применяется для принятия управленческих решений и осуществления процесса экономического регулирования на государственном уровне.
Главным предметом изучения статистики являются массовые явления в обществе, оцениваемые с качественной стороны. Для исследования подобных явлений статистика пользуется следующими инструментами:
- Статистической совокупностью, описывающей исследуемое множество объектов. По своей структуре она может быть однородной и неоднородной.
- Статистическим признаком, определяющим характеристики объектов. Признаки могут быть дискретными, непрерывными, атрибутивными, альтернативными.
- Статистическими показателями, дающими количественную оценку исследуемым явлениям.
Экономическая статистика призвана решать определенный набор задач. Прежде всего, она обеспечивает сбор и предоставление информации государственным органам управления. С ее помощью принимаются решения, влияющие на рост экономических показателей и экономическое развитие страны в целом. Экономическая статистика позволяет оценить результативность принятых управленческих решений.
Линейная регрессия
Экономическая среда характеризуется своей многофакторностью. Достаточно часто возникает потребность в оценке изменения поведения объекта под влиянием множества факторов. Для этого случая пользуются методом линейной регрессии.
Линейная регрессия – это модель, которую применяют в статистике для отслеживания зависимости изменения одной переменной от другой или группы других переменных. Эта модель достаточно часто применяется в эконометрике. Она является наиболее изученной с точки зрения возникновения ошибок, а также вероятности воздействия различных факторов. Оценки нелинейных регрессий так же производятся на основе линейных. Более важное значение при линейности играют параметры, а не факторы модели.
Регрессионная модель включает в себя параметры самой модели, вероятную ошибку, количество влияющих факторов. Коэффициенты функции показывают влияние изменения одной переменной или совокупности переменных на исследуемую величину под влиянием одного фактора и неизменности других факторов.
Линейная регрессия может содержать константы, либо рассматриваться без них. В этом случае фактор влияния приравнивается к единице, либо рассматривается в качестве обычного фактора. В классическом виде линейная регрессия предполагает дисперсия постоянна или одинакова, а автокорреляция ошибок полностью отсутствует. Под автокорреляцией понимается взаимосвязь некоторого количества статистических величин от них же со сдвигом на один шаг.
Уравнение множественной линейной регрессии
Уравнение множественной линейной регрессии применяется в случае, если необходимо проанализировать две и более независимых переменных. Ее уравнение имеет следующий вид:
$Y = b_0 + b_1 x_1 + b_2 x _2 + ⋯ + b_n x_n$
Вычисление $b_n$ осуществляется с помощью метода наименьших квадратов, который предполагает экспериментальный подход при вычислении параметров моделей, содержащих случайные ошибки. В отличие от простой линейной регрессии, множественная использует гиперплоскость. Из-за того, что в модели множественной регрессии используется несколько входных величин, увеличивается диапазон объясненной дисперсии. То есть, устойчивость модели растет при добавлении новых параметров для исследования.
Однако, множественная линейная регрессия имеет ряд проблем:
- Вероятность возникновения мультиколлениарности, которая повышает диапазон ошибок, даже при небольших изменениях входных данных.
- Важно правильно подобрать анализируемое множество, в противном случае, будет достаточно сложно объяснить дисперсию зависимой.
Уравнение множественной линейной регрессии может использоваться для выражения зависимости между достаточно сложными показателями. Это возможно потому, что даже сложные зависимости можно приблизить к линейным.