Разместить заказ
Вы будете перенаправлены на Автор24

Корреляционный и регрессионный анализ

8-800-775-03-30 support@author24.ru
Все предметы / Эконометрика / Корреляционный и регрессионный анализ

Исследование явлений и процессов экономического характера во многом базируется на изучении характеризующих их статистических связей между переменными. Чаще всего, исследователи в данном случае обращаются к методам корреляционного и регрессионного анализа.

Сущность корреляционного анализа и особенности его проведения

Корреляционный анализ позволяет дать оценку силе статической связи. То есть с помощью этого метода можно установить существование связи между изучаемыми экономическими явлениями или её отсутствие, а также определить её силу. Если один признак изменяется в соответствии с изменением другого признака, то говорят о существовании между ними корреляционной связи (то есть согласованного изменения признаков).

Замечание 1

Корреляция бывает парной, когда изучается взаимосвязь между двумя признаками, и множественной, когда изучается взаимосвязь между тремя или большим числом признаков.

Готовые работы на аналогичную тему

Математической мерой корреляции изучаемых величин служит коэффициент корреляции или корреляционное отношение. Чаще всего в корреляционном анализе используют коэффициент корреляции, который представляет собой количественную оценку направления и тесноты связи величин, являющихся объектами экономического исследования.

Коэффициент корреляции изменяется в пределах от -1 до 1. Если он равен нулю, то какая-либо связь отсутствует. Положительное значение связи говорит о наличии прямой связи, отрицательное – обратной связи. Чем связь сильнее, тем значение коэффициента ближе к единице. Обычно высокой степени взаимосвязи (тесной связи) соответствует значение коэффициента, превышающее 0,7.

Наибольшее распространение в статистике и экономике нашёл линейный коэффициент корреляции (или коэффициент корреляции Пирсона). Конкретное значение этого коэффициента представляет собой отношение ковариации изучаемых величин к произведению их средних квадратичных отклонений. Хотя также может использовать прием ранжирования, который имеет место быть в коэффициентах ранговой корреляции Кендалла и Спирмена.

Регрессионный анализ и особенности его проведения

Использование регрессионного анализа позволяет определить характер взаимосвязи между изучаемыми явлениями. В процессе построения математической (регрессионной) модели определяется форма зависимости между случайными величинами, которая затем подвергается исследованию.

Определение 1

Регрессионный анализ – это раздел математической статистики, в рамках которого изучается связь между зависимой переменной и одной или несколькими независимыми переменными.

Проведение регрессионного анализа ориентировано на достижение следующих целей:

  • установление степени детерминированности вариации зависимой (критериальной) переменной от независимых переменных (предикторов);
  • предсказание значения зависимой переменной при конкретных значениях независимых переменных;
  • определение того, какой вклад отдельные независимые переменные вносят в вариацию зависимой переменной.

В общем случае регрессионная модель имеет вид y = f (x, b0, b1, b2 … bk), где x – независимая переменная, y – зависимая переменная, а параметры b0, b1, b2 … bk называются коэффициентами регрессии. Оценка последних является одной из главных задач регрессионного анализа. Для этого используют метод наименьших квадратов. Он заключается в подборе таких параметров, при которых сумма квадратов отклонений наблюдаемых значений от рассчитанных по регрессионной модели приобретает минимальное значение.

Наиболее часто используется регрессионная модель, в рамках которой связь (зависимость) между переменными принимается в линейном виде. Это означает, что формула приобретает вид y = b0 + b1 ⋅ x + e, где b0 и b1 – это коэффициенты линейной регрессии. Значения этих коэффициентов определяются в результате решения следующей системы уравнений:

b0 • a + b1 ⋅ Σx = Σy

b0 • Σx + b1 ⋅ Σ(x^2) = Σ(x ⋅ y)

где а – это количество пар значений изучаемых переменных.

Коэффициент b1 показывает то, насколько изменится переменная y при изменении показателя x на единицу. Коэффициент b0 считается независимой частью переменной y, то есть при отсутствии какого-либо действия всех других факторов переменная у будет равна b0.

Стоит также обратить внимание на то, что в формуле линейной регрессии имеет место такое слагаемое, как е. Им обозначается та часть переменной у, которая определяется не переменной х, а другими факторами. Значение данного параметра может быть получено в результате вычитания из значения рассчитанной переменной у (по формуле y = b0 + b1 ⋅ x) фактического значения переменной у при данном значении переменной х.

Интерпретированное подобным образом значение е может быть также рассмотрено как отклонение, или абсолютная ошибка аппроксимации. Для того, чтобы избежать отрицательных или нулевых значений это отклонение возводят в модуль. Если данное отклонение поделить на фактическое значение у и умножить на 100%, то будет получена относительная ошибка аппроксимации.

Сумма этих относительных ошибок, деленная на количество изучаемых явлений, представляет собой среднюю ошибку аппроксимации. Она позволяет оценить то, насколько хорошо сформированная регрессионная модель характеризует взаимосвязь явлений. Как правило, допустимый предел значения средней ошибки аппроксимации находится на уровне 10%.

Статья предоставлена специалистами сервиса Автор24
Автор24 - это сообщество учителей и преподавателей, к которым можно обратиться за помощью с выполнением учебных работ.
как работает сервис