Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Нелинейная регрессия
Многие экономические процессы наилучшим образом описываются нелинейными соотношениями, например, нелинейными функциями спроса и
производственными функциями. Здесь мы рассмотрим нелинейные модели,
которые с помощью преобразования переменных, сводятся к линейным, и
потому для их построения могут использоваться описанные выше приемы.
В случае простого регрессионного анализа (линейного однофакторного)
речь идет об уравнениях вида
(1)
y a bx ,
состоящих из постоянной величины (которая может и отсутствовать), независимой переменной, умноженной на некоторый коэффициент, и случайной
составляющей (ошибки), которой мы можем временно пренебречь. В общем
случае линейное уравнение выглядит так
y a b1 x1 b2 x2 .
(2)
Уравнения вида
b
ya ,
(3)
x
y ax b
(4)
являются нелинейными. Их графические изображения для выбранных значений a и b будут представлены кривыми.
Зависимости (3) и (4) считаются приемлемыми для описания кривых Энгеля, характеризующих соотношение между спросом на определенный товар
( y ) и общей суммой дохода ( x ). Как можно определить параметры a и b в
каждом уравнении, зная значения y и x ?
Заметим, что уравнение (3) является линейным по неизвестным параметрам a и b и нелинейным по переменной x . Поэтому оценки параметров мо1
гут быть найдены по формулам (1) (с заменой zi ). Уравнение (3) примет
xi
вид y a bz .
Нелинейность по переменным всегда можно обойти путем использования
соответствующих определений. Например, для модели вида
y a b1 x12 b2 x2
можно определить z1 x12 , z 2 x2 и т. д., тогда модель или соотношение
примет вид
y a b1 z1 b2 z2
и теперь оно является линейным как по переменным, так и по параметрам.
Такой тип преобразований является лишь косметическим, он не меняет
свойств оценок, полученных для линейных моделей, и обычно уравнения ре-
грессии записываются с нелинейными выражениями относительно переменных. Это позволяет избежать лишних обозначений.
Уравнение (4) является нелинейным как по параметрам, так и по переменной x . Такое соотношение может быть преобразовано в линейное уравнение путем логарифмирования:
(5)
ln y ln a b ln x .
Если обозначить y ln y , z ln x и a ln a , то уравнение (5) можно переписать в следующем виде
(6)
y a bz .
Процедура оценивания регрессии теперь будет следующей. Сначала вычислим y и z для каждого наблюдения путем взятия логарифмов от исходных значений. Затем оценим регрессионную зависимость y от z . Коэффициент при z будет представлять собой непосредственно оценку b̂ . Постоянный
член является оценкой aˆ , т. е. ln̂ a . Для получения оценки a необходимо
взять антилогарифм, т. е. вычислить expa .
Функции вида (4) часто встречаются в эконометрическом моделировании. Для таких функций эластичность y по x равна b . Действительно, если
соотношение между y и x имеет вид (4), то эластичность
x
x
E f x abxb 1 b b .
y
ax
Оценка этого коэффициента по результатам наблюдений будет показывать, на сколько процентов в среднем изменится значение y при изменении
x на 1% от своего среднего значения. Например, если имеется кривая Энгеля
вида y 0,01x 0,3 ( y – спрос, а x – доход), то это означает, что эластичность
спроса по доходу равна 0,3, т. е. изменение x на 1% от среднего уровня x
вызывает изменение y на 0,3% от среднего уровня y .
Функция вида (4) может также применяться к кривым спроса, где y –
спрос на товар, x – цена товара, а b – эластичность спроса по цене. (На практике обычно такая функция спроса объединяется с кривой Энгеля, в результате чего получается зависимость спроса одновременно от дохода и цены.)
При моделировании процессов в экономике могут использоваться и показательные (или экспоненциальные) функции вида
y ae bx .
(7)
Наиболее общим их приложением является случай, когда предполагается,
что переменная y имеет постоянный темп прироста во времени, в этом случае вместо x обычно используется время ( t ), а вместо b – постоянный темп
прироста ( r ):
y ae rt .
(8)
Если зависимость y от t задана уравнением (9.32), то абсолютный при dy
рост y за единицу времени определяется как
dt
dy
rae rt ry .
dt
Следовательно, относительный прирост y за единицу времени можно записать так
dy dt ry
r.
y
y
Следует помнить, что оценка r̂ , которую мы получаем при оценивании
регрессии (8), представляет собой оценку темпа прироста в абсолютном выражении. Обычно говорят о процентных темпах прироста, это значит, что
полученную оценку нужно умножить на 100. Следовательно, если оценка составляет 0,053, это означает, что темп прироста в процентах будет 5,3% за
период.
Как же найти оценки неизвестных параметров модели (8)? Если имеются
значения y для нескольких временных периодов 1,,T , то параметры a и
r можно оценить, если прологарифмировать (по основанию e ) обе части
уравнения:
(9)
ln y ln a rt .
Если определить y ln y и a ln a , то из соотношения (9) получим:
y a rt .
Таким образом, оценивая регрессию между ln y и t , мы непосредственно
получаем по формулам (9.5) оценку темпа прироста r̂ и aˆ . Обычно оценка
параметра a имеет второстепенное значение, но если она представляет интерес, то можно получить â , потенцируя aˆ .
Пример 1. Предположим, что по результатам наблюдений за расходами
на питание в США за период с 1959 по 1983 г. была построена кривая Энгеля
в виде соотношения (9.28). Преобразованное в результате логарифмирования
и оцененное выражение имело вид:
ln̂ y 1,20 0,55ln x .
Выполнив обратные преобразования, получим
yˆ e1, 20 x 0,55 3,32 x 0,55 .
Решение. Если уравнение представляет собой правильную формулу зависимости, т. е. модель адекватна, то полученный результат предполагает, что
эластичность спроса на продукты питания по доходу составляет 0,55, что
означает, что увеличение личного располагаемого дохода на 1% от среднего
уровня x приведет к увеличению расходов на питание на 0,55% от среднего
уровня y . Коэффициент 3,32 не имеет простого толкования. Он помогает
прогнозировать значения y при заданных значениях x , приводя их к единому масштабу.
Те же данные о расходах на питание были использованы для оценивания
экспоненциального временного тренда типа (9.32), также приведенного к линейному виду путем логарифмирования [см. уравнение (9.33)]. Оцененная
зависимость имеет вид:
ln̂ y 4,58 0,02t .
Выполнив обратные преобразования, получим:
y e 4,58 e 0,02 t 97,5e 0,02 t .
Уравнение показывает, что расходы на продукты питания в течение выборочного периода росли с темпом 2% в год. В этом случае постоянный
множитель имеет интерпретацию, так как он «прогнозирует», что в момент
t 0 , т. е. в 1958 г. общие расходы на питание составили 97,5 млрд. долл. Такой прогноз, безусловно, не имеет важного значения, так как легко можно
найти в справочниках действительные расходы на питание в 1958 г.
До сих пор мы ничего не говорили о том, как осуществленные преобразования модели (например, логарифмирование) повлияют на случайную составляющую . Основное требование здесь состоит в том, чтобы случайная
составляющая в преобразованном уравнении присутствовала в виде слагаемого и удовлетворяла условиям 3а – 3с. В противном случае коэффициенты
регрессии, полученные по методу наименьших квадратов, не будут обладать
обычными свойствами и проводимые для них выводы на основе проверки
гипотез окажутся недостоверными.
В случае нелинейных регрессий степень концентрации распределения
наблюдаемых точек вблизи линии регрессии показывает корреляционное отношение или индекс корреляции
n
yˆ i y
i 1
n
2
yi y
,
(10)
2
i 1
где ŷi – рассчитанные по модели значения переменной y , yi – фактические
1 n
или наблюдаемые значения этой переменной, y yi – среднее значение
n i 1
y , найденное по n наблюдениям, i 1,, n .
Из определения индекса корреляции следует, что 0 1. Если 1,
имеет место функциональная зависимость (все точки сосредоточены на кривой регрессии), если 0 , оцененная модель непригодна.
В отличие от линейного коэффициента корреляции индекс корреляции
характеризует тесноту нелинейной связи между переменными в соответствии
с той функциональной зависимостью, по которой рассчитаны значения ŷi .
Он не характеризует направление связи. Очевидно, что если значения ŷi рассчитаны по уравнению парной линейной регрессии, значения индекса корреляции и линейного коэффициента корреляции по абсолютной величине совпадут.
Здесь также определяется коэффициент детерминации R 2 2 , интерпретация которого дается в процентах. Как и в случае линейной регрессии,
коэффициент детерминации показывает ту долю вариации переменной y ,
которая объяснена вариацией фактора x , включенного в уравнение регрессии.