Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Курс лекций по дисциплине
«Эконометрика»
подготовлен доцентом каф. ПМиК
Щеголевой Л. В.
Петрозаводск 2009
Содержание
Тема 1: Введение 4
Тема 2: Корреляционный анализ 8
§ 1 Коэффициент корреляции 8
§ 2 Корреляционное отношение 9
§ 3 Ранговые коэффициенты корреляции 10
§ 3.1 Ранговый коэффициент корреляции Спирмэна 10
§ 3.2 Ранговый коэффициент корреляции Кендалла 10
§ 4 Корреляционный анализ категориальных переменных 11
Тема 3: Парная регрессия 13
§ 1 Введение 13
§ 2 Метод наименьших квадратов 13
§ 3 Качество линейной регрессии 14
§ 4 Интервальная оценка коэффициента регрессии 14
§ 5 Интервал прогноза 15
§ 6 Пример 15
§ 7 Метод максимального правдоподобия 17
Тема 4: Нелинейная регрессия 18
§ 1 Введение 18
§ 2 Модели 18
§ 3 Коэффициент эластичности 19
§ 4 Оценки коэффициентов регрессии 20
Тема 5: Множественная регрессия 22
§ 1 Постановка задачи 22
§ 2 Исследование линейной зависимости результирующей переменной от нескольких объясняющих переменных 22
§ 3 Частные коэффициенты корреляции 23
§ 4 Модель множественной регрессии 23
§ 4.1 Метод наименьших квадратов 24
§ 5 Уравнение регрессии в стандартизованном масштабе 25
§ 6 Частные уравнения регрессии 26
§ 7 Мультиколлинеарность 27
§ 7.1 Метод главных компонент 27
§ 7.2 Отбор наиболее существенных объясняющих переменных 27
§ 7.2.1 Метод всех возможных регрессий 27
§ 7.2.2 Метод пошагового отбора переменных 27
§ 8 Обобщенная линейная модель множественной регрессии 30
§ 8.1 Линейная модель с гетероскедастичными остатками 31
§ 8.2 Точечный прогноз 32
§ 9 Неоднородные регрессионные данные 32
§ 9.1 Фиктивные переменные 33
§ 9.2 Взаимодействие сопутствующих переменных 34
§ 9.3 Проверка однородности – критерий Чоу 35
§ 9.4 Обнаружение сопутствующих переменных 35
Тема 6: Анализ временных рядов 37
§ 1 Определение и характеристики 37
§ 1.1 Автокорреляция 37
§ 2 Моделирование сезонных колебаний 38
§ 2.1 Аддитивная модель 38
§ 2.2 Мультипликативная модель 41
§ 2.3 Построение прогноза 42
§ 3 Применение фиктивных переменных для моделирования сезонных колебаний 43
§ 4 Взаимосвязь двух временных рядов 43
§ 4.1 Автокорреляция в остатках 43
§ 5 Динамические модели 44
§ 5.1 Модели с распределенным лагом 45
Тема 7: Системы эконометрических уравнений 47
§ 1 Введение 47
§ 2 Структурная и приведенная формы модели 47
§ 3 Косвенный метод наименьших квадратов 49
§ 4 Двухшаговый метод наименьших квадратов 50
§ 5 Примеры систем эконометрических уравнений 51
§ 5.1 Статистическая модель Кейнса 51
§ 5.2 Вторая статистическая модель Кейнса 51
§ 5.3 Динамическая модель Клейна 51
§ 5.4 Модель спроса и предложения 52
Список литературы
1. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс. – М.: Дело, 1998.
2. Эконометрика: Учебник / Под ред. И. И. Елисеевой. – М.: Финансы и статистика, 2003. – 344 с.
3. Практикум по эконометрике: Учебное пособие / И. И. Елисеева, С. В. Курышева, Н. М. Гордеенко и др; Под ред. И. И. Елесеевой. – М.: Финансы и статистика, 2003. – 192 с.
Тема 1: Введение
Первоначальные попытки количественных исследований в экономике относятся к XVII веку. Исследователям в экономике хотелось достичь того же, что достиг И. Ньютон в физике. Одним из первых таких «законов» был «закон Кинга» о соотношении урожая зерновых и цен на зерно.
Еще одним известным законом является «Закон заработной платы», предложенный американским ученым Г. Муром (1911 год).
Проводились исследования по выделению бизнес-циклов, была установлена цикличность обновления оборотных средств (3–5 лет), цикл в строительстве (15–20 лет).
Значительной вехой в формировании эконометрики явилось построение экономических барометров, прежде всего так называемого гарвардского барометра. Гарвардский барометр был создан под руководством У. Персона и У. Митчелла. В течение 1903–1914 гг. он состоял из 5 групп показателей, которые были сведены в три отдельные кривые: кривая А – характеризовала фондовый рынок, кривая В – товарный рынок, кривая С – денежный рынок. В основу прогноза барометра было положено свойство каждой отдельной кривой повторять движения остальных в определенной последовательности и с определенным отставанием. Поворотные пункты кривой А предшествовали поворотным пунктам кривой В на 6–10 месяцев (в среднем – на 8 месяцев), поворотные пункты кривой В обгоняли аналогичные пункты кривой С на 2–8 месяцев (в среднем на 4 месяца), наконец, колебания кривой С предшествовали колебаниям кривой А следующего цикла на 6–12 месяцев.
Естественно, что изменение средних биржевых курсов и показателей фондового рынка (индекс спекуляции А) означало изменение спроса на товары, что влекло за собой, в свою очередь, изменение в том же направлении индекса оптовых цен, объема производства и товарооборота (индекс В). Возрастание объема производства вызывало напряжение на денежном рынке, рост учетной ставки и падение курса ценных бумаг с фиксированным доходом (кривая С). Поэтому максимум кривой А обычно должен совпадать с минимумом кривой С.
Успех гарвардского барометра породил эпидемию таких построений. Через несколько лет после первой мировой войны он потерял чувствительность и сошел со сцены.
29 декабря 1930 года на заседании Американской ассоциации развития науки (США, Кливленд, штат Огайо) было создано эконометрическое сообщество, на котором норвежский ученый Рагнар Фриш ( норвежский экономист и статистик) дал новой науке название – «Эконометрика» (получил Нобелевскую премию в 1969 году).
В 1941 году вышел первый учебник по эконометрике Я. Тинбергена.
Эконометрика – это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того, чтобы на базе экономической теории, экономической статистики, математико-статистического инструментария придавать конкретное количественное выражение общим (качественным) закономерностям, обусловленным экономической теорией. Эконометрика – это наука об измерении и анализе экономических явлений.
Экономика + Метрика
Методы эконометрики:
• Регрессионный анализ
• Анализ временных рядов
• Системы взаимозависимых (совместных, одновременных) уравнений
• Статистические методы классификации и снижения размерности
Пример – модель ценообразования на основной капитал
У инвестора есть капитал, который можно вложить в ценные бумаги. Основная цель – получение прибыли от капиталовложений.
До принятия решения о капиталовложениях объем прибыли является величиной неопределенной.
Норму прибыли можно вычислить по следующей формуле:
,
r – ожидаемая норма прибыли;
p0 – цена капитала в начале временного периода;
p1 – цена акции в конце временного периода;
d – дивиденды, выплаченные за временной период.
Вложение капитала связано с риском, который описывается дисперсией распределения возможной прибыли. Инвесторы пойдут на риск только в том случае, если ожидается более высокая прибыль. Но какова должна быть премия для инвесторов, которые пойдут на больший риск? Прибыль можно сравнить с прибылью ценных бумаг, имеющих нулевой риск. Такая прибыль называется свободной от риска нормой прибыли rf. В США такими ценными бумагами являются 30-дневные казначейские билеты США.
Из модели Гарри Марковица:
Если инвестор составляет портфель из двух ценных бумаг, то прибыль от портфеля будет равна
wj – доля общего капитала, вложенная в ценную бумагу j.
Общая дисперсия портфеля ценных бумаг вычисляется, как
Предположим, что одной из ценных бумаг является свободная от риска ценная бумага. Тогда, ее риск равен нулю, и свободная от риска ценная бумага некоррелированна с другой рисковой ценной бумагой, следовательно, ковариация равна нулю.
Тогда
Выразим из последнего соотношения wa и подставим в первое, после приведения получим следующую линейную зависимость между риском и прибылью:
rp – прибыль;
rf – свободная от риска норма прибыли (с нулевым риском);
ra – прибыль от портфеля ценных бумаг;
σa – дисперсия прибыли;
σp – риск портфеля ценных бумаг.
Таким образом, получилась линейная зависимость.
Соотношение можно переписать следующим образом:
Это линейное соотношение между премией за риск ценной бумаги a и премии за риск портфеля p.
Если портфель p включает все ценные бумаги рынка ценных бумаг (общий рыночный портфель), то это соотношение показывает зависимость премии за риск для одной ценной бумаги (i) от премии за риск всего рынка (рыночной прибыли).
В общем виде эту зависимость можно записать так:
Исходные данные для определения коэффициентов функции (из центра изучения цен на ценные бумаги (CRSP) на основе сделок на Нью-Йоркской и Американской фондовых биржах за десятилетний период времени):
Месяц
Прибыль всего рынка, rm
Прибыль 30-дневных казначейских билетов США, rf
Прибыль компании Motorola, ri
январь – 78
-0,045
0,00487
-0,014
февраль
0,010
0,00494
-0,031
март
0,050
0,00526
0,121
апрель
0,063
0,00491
0,147
май
0,067
0,00513
0,034
июнь
0,007
0,00527
0,000
июль
0,071
0,00528
0,087
август
0,079
0,00607
-0,025
сентябрь
0,002
0,00645
-0,074
октябрь
-0,189
0,00685
-0,061
…
…
…
…
Получается уравнение:
В этой функции коэффициент βi имеет экономическое значение и называется бета-значение ценной бумаги. Это критерий чувствительности прибыли от i-ой ценной бумаги к изменениям в прибыли от портфеля ценных бумаг (общего рыночного портфеля ценных бумаг). Если значение равно 2, то такие бумаги относительно рискованные, акции «голубых фишек» (первоклассные акции, риск снижения доходов по которым минимален) не так чувствительны к изменениям на рынке и имеют бета-значение около 0,5.
Считается, что покупка ценных бумаг с бета-значением выше 1 называется «агрессивной позицией», в то время как сохранение ценных бумаг с бета-значением меньше 1 называется «защитной позицией». Бета-значение для некоторых ценных бумаг может быть даже отрицательным – это относится к так называемым «сверхзащитным» ценным бумагам.
Бета-значение равно 0,538. Если прибыль общего рыночного портфеля ценных бумаг увеличится на 1%, то прибыль компании Motorola может увеличиться на 0,538%.
Что означает коэффициент αi? Согласно модели значения αi должны быть близки к нулю. Но некоторые эксперты придают этому коэффициенту следующий смысл: если рынок ничего не заработает, т.е. (rm – rf) = 0, то инвесторы ожидают положительный темп роста цены. Годовой темп роста цены равняется произведению 12·αi = 0,116%.
Другие примеры
• Производственная функция показывает максимально возможный выпуск продукции:
Производственная функция Кобба-Дугласа:
где A, α1, α2– неизвестные параметры,
x1 – объем приложенного труда,
x2 – объем капитала.
• Функция потребления зависит от дохода того же периода и от дохода предшествующего периода. Коэффициенты b0 – краткосрочная предельная склонность к потреблению, а b=b0+b1 – долгосрочная склонность к потреблению.
• Спрос на товар зависит от цены (кривая).
• Сумма сбережений зависит от изменения доходов (линейная).
• Затраты, связанные с изготовлением продукции (себестоимость), зависят от объема производства.
• В модели ценообразования на основной капитал (ЦОК) прибыль от портфеля ценных бумаг зависит от риска портфеля (линейная модель).
• Объем продаж конкретного продукта в торговой точке зависит от дня года, от времени суток.
• Цена квартиры зависит от количества комнат, района, площади, наличия балкона, этажа, т.д.
Задача
• Постановка проблемы
• Спецификация модели
• Получение статистических данных
• Оценка параметров модели (найти количественные значения коэффициентов: a0, a1, a2,…)
• Верификация модели
• Интерпретация результатов.
Модель
– модель, описывающая экономическое явление
Переменные (факторы) в модели
y – эндогенная (объясняемая, зависимая, результирующая) переменная (внутренняя),
x – экзогенная (объясняющая, независимая) переменная (внешняя),
ε – латентная (случайная) отражает влияние неучтенных факторов, а также ошибки измерений.
Примеры моделей:
Модель динамики цены и заработной платы:
y1 – темп изменения месячной заработной платы
y2 – темп изменения цен
x1 –процент безработных
x2 –темп изменения постоянного капитала
x3 –темп изменения цен на импорт сырья
Типы переменных
• Количественные
• Порядковые (ординальные) – оценка (неудовлетворительно, удовлетворительно, хорошо, отлично), сорт товара (II, I, высший)
• Категориальные (классификационные, номинальные, качественные) – пол (женский, мужской), цвет (синий, красный, зеленый, белый), семейное положение (холост, женат, разведен, вдовец)
Тема 2: Корреляционный анализ
Прежде чем определять вид зависимости и ее коэффициенты, следует проверить наличие зависимости между эндогенной и экзогенными переменными.
Рассмотрим случай одной экзогенной переменной.
Исходные данные – пары наблюдений над величинами x и y:
x
y
x1
y1
x2
y2
x3
y3
x4
y4
x5
y5
…
…
xn-1
yn-1
xn
yn
Задача: определить наличие зависимости между переменными x и y.
Задача решается по-разному в зависимости от типа переменных.
• Для количественных переменных – коэффициент корреляции и корреляционное отношение.
• Для порядковых переменных – коэффициент Спирмэна и Кендалла.
• Для номинальных переменных – коэффициент X2 и коэффициент Крамера.
§ 1 Коэффициент корреляции
Степень тесноты линейной связи между двумя переменными показывает коэффициент корреляции.
, ,
Свойства коэффициента корреляции
1. –1 ≤ r ≤ 1
2.
a). | r | ≤ 0,5 – слабая связь
b). 0,5 < | r | < 0,8 – средняя связь
c). 0,8 ≤ | r | – сильная связь
Проверка значимости коэффициента корреляции
H0: основная гипотеза говорит о незначимости линейной связи, т. е. r=0
Если , то гипотеза H0 отвергается.
где – α/2 % точка распределения Стьюдента с (n–2) степенями свободы:
или ; , ,
Обычно α = 0,05; 0,1.
α – Ошибка 1-го рода – вероятность отвергнуть верную основную гипотезу.
H0
Верна
Неверна
Отвергается
α – Ошибка 1-го рода
Правильно
Принимается
Правильно
β – Ошибка 2-го рода
Пример
Потребление мяса
кг/чел. в год
Потребление рыбы
кг/чел. в год
Интервал
x
y
69
16
3
60
12
2
69
12
3
57
10
2
55
9
1
51
9
1
50
8
1
65
15
3
61
10
2
53
9
1
59
11
2
n = 11
,
, при α=0,02
, при α=0,05
, при α=0,1
H0:
Основная гипотеза о незначимости коэффициента корреляции отвергается на уровне значимости 0,02, следовательно, между потреблением мяса и потреблением рыбы существует сильная линейная статистическая зависимость.
§ 2 Корреляционное отношение
Корреляционное отношение измеряет степень тесноты нелинейной связи между двумя переменными.
Строится по сгруппированным данным.
Отрезок, включающий значения экзогенной переменной x, разбиваем на несколько отрезков Δj, j=1,s.
νj – количество значений xi, попавших в интервал Δj.
Свойства корреляционного отношения
1. Не симметрично
2.
3.
4. – мера отклонения регрессионной зависимости от линейного вида
Проверка значимости корреляционного отношения
H0: основная гипотеза говорит о незначимости связи, т. е. ρyx2=0
Если , то гипотеза H0 отвергается.
Где vα – α % точка распределения Фишера с (s–1, n–s) степенями свободы.
Пример
Пусть s=3
Δ1 = [50, 56,3] ν1 = 4 y1 =1/4 (9+9+8+9) = 8,75
Δ2 = (56,3, 62,6] ν2 = 4 y2 =1/4 (12+10+10+11) = 10,75
Δ3 = (62,6, 69] ν3 = 3 y3 =1/3 (16+12+15) = 14,3
H0:
Гипотеза отвергается на уровне значимости 0,05.
Тема 3: Парная регрессия
§ 1 Введение
Шведские статистики пытались установить и описать стохастическую связь между отклонением от среднего уровня в росте отца и отклонением от среднего уровня в росте взрослого сына этого отца. Была подмечена тенденция регрессии (отступления, возврата) в росте сыновей к среднему уровню. Поэтому все зависимости стали называть регрессии.
После выявления наличия линейной связи между количественными переменными необходимо построить функцию, количественно выражающую эту зависимость.
Шаги
1. Построение корреляционного поля – предварительный анализ геометрической структуры исходных данных
2. Корреляционный анализ
3. Построение оценок коэффициентов регрессии
4. Проверка значимости регрессии
Модель
Модель парной линейной регрессии:
y = a0 + a1 · x + ε
M (ε) = 0
D (ε) = σε2
Задача
Исходные данные:
x
y
x1
y1
x2
y2
x3
y3
x4
y4
x5
y5
…
…
xn-1
yn-1
xn
yn
Найти: a0, a1, σε2
Метод
1. Метод наименьших квадратов
2. Метод максимального правдоподобия
3. другие методы
§ 2 Метод наименьших квадратов
Метод наименьших квадратов заключается в нахождении минимума следующего функционала:
Чтобы найти экстремум функции необходимо:
Решив систему уравнений, получим:
Оценки параметров регрессии
– смещенная оценка дисперсии остатков
– несмещенная оценка дисперсии остатков
§ 3 Качество линейной регрессии
Для оценки качества регрессии используется коэффициент детерминации.
Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией.
– общая сумма квадратов отклонений (Total).
– сумма квадратов отклонений, объясняемая регрессией (Explained).
– остаточная сумма квадратов отклонений (не объясняемая регрессией – Residue).
TSS = ESS + RSS
Коэффициент детерминации
Соотношение коэффициента корреляции и коэффициента детерминации
Для парной линейной регрессии: D= r2
Проверка состоятельности регрессии
F-тест Фишера
H0: основная гипотеза говорит о незначимости коэффициента детерминации D = 0 (или a1 = 0)
Если , то гипотеза H0 отвергается.
Где vα – α % точка распределения Фишера с (1, n–2) степенями свободы.
Средняя относительная ошибка аппроксимации
Для проверки качества модели рассчитывают среднюю абсолютную ошибку прогноза и среднюю относительную ошибку в процентах:
Если ошибка СООП составляет 5-7(8)%, то модель хорошо описывает исходные данные. Если СООП не превышает 12%, то модель приемлемая. Если значение выше 12%, то на усмотрение исследователя.
§ 4 Интервальная оценка коэффициента регрессии
Стандартная ошибка коэффициента a1:
Стандартная ошибка коэффициента a0:
Доверительный интервал для коэффициента a1:
Проверка значимости коэффициентов регрессии
H0: основная гипотеза говорит о незначимости коэффициента a1 = 0
Если , то гипотеза H0 отвергается.
Где – α % точка распределения Стьюдента с (n–2) степенями свободы.
H0: основная гипотеза говорит о незначимости коэффициента a0 = 0
Если , то гипотеза H0 отвергается.
Где – α % точка распределения Стьюдента с (n–2) степенями свободы.
§ 5 Интервал прогноза
§ 6 Пример
Исходные данные
Потребление мяса
кг/чел. в год
Потребление рыбы
кг/чел. в год
x
y
69
16
60
12
69
12
57
10
55
9
51
9
50
8
65
15
61
10
53
9
59
11
Корреляционное поле
Статистика
Решение:
a1 = 0,334842
a0 = –8,75566
y = –8,75566 + 0,334842 · x + ε
σε2 = 1,494858
sε2 = 1,827049
Проверка состоятельности регрессии
F-тест Фишера
TSS = σy2 = 6
ESS = 4,505142
RSS = σ2 = 1,494858
D = 0,750859
H0: основная гипотеза говорит о незначимости коэффициента детерминации D = 0 (или a1 = 0)
, следовательно, гипотеза H0 отвергается.
Вывод: Модель адекватно описывает исходные данные.
Интервальные оценки
Стандартная ошибка коэффициента a1 = 0,064293
Стандартная ошибка коэффициента a0 = 3,8151196
tα(n-2) = t0,05(9) = 2,26
Доверительный интервал для коэффициента a1: (0,1894, 0,48)
Рассмотрим точку: x = 65; y = 13,00905
Тема 4: Нелинейная регрессия
§ 1 Введение
В широко известной статье 1958 года, посвященной соотношению между безработицей и приростом заработной платы в денежном выражении в Великобритании У. Филлипс изложил следующую теоретическую модель: «Когда спрос на товар или услугу превышает предложение, мы ожидаем рост цен, причем, чем больше неудовлетворенный спрос, тем больше рост цен. Наоборот, когда спрос меньше предложения, то мы ожидаем падение цен, и чем больше превышение предложения спроса над предложением, тем больше падение. Вполне вероятно, что этот принцип должен действовать как один из факторов, определяющих скорость изменения заработной платы в денежном выражении».
Используя эти рассуждения Филлипс постулировал, что зависимость между уровнем безработицы u (отношение числа безработных к сумме занятых и безработных) и скоростью изменения заработной платы в денежном выражении ẇ/w будет нелинейной.
Изобразив точки на координатной плоскости, Филлипс обнаружил, что при более высоких уровнях безработицы график идет горизонтально. Тогда он выбрал следующую кривую:
Методом графической подгонки были получены оценки коэффициентов, которые были проверены для 1861–1913 гг. (1862 и 1863 гг. были исключены):
Это уравнение было проверено для 1913–1948 гг. и 1948–1957 гг.
К. Гилберт в 1976 г. используя данные Филипса и метод максимального правдоподобия, получил следующие коэффициенты:
Из полученного уравнения можно сделать следующий вывод: Уровень зарплаты стабилизируется, если уровень безработицы составляет 5%.
Шаги
1. Построение корреляционного поля – предварительный анализ геометрической структуры исходных данных
2. Корреляционный анализ: оценка корреляционного отношения
3. Выбор моделей регрессионной зависимости
4. Построение оценок коэффициентов регрессии
5. Проверка значимости регрессии
6. Выбор адекватной модели
§ 2 Модели
Два класса регрессий
• Линейные по оцениваемым параметрам
◦ Замена переменных для приведения к линейной регрессии
• Нелинейные по оцениваемым параметрам
◦ Преобразование и замена переменных для приведения к линейной зависимости
◦ Итеративные процедуры
Кривая Филлипса
– зависимость процента прироста заработной платы от уровня безработицы
В 50-х гг. XX века была построена следующая зависимость: , что означало, что темп прироста зарплаты стремится к нулю.
Решение: замена
Кривая Э́́́́нгеля
– зависимость доли расходов на непродовольственные товары от дохода. В отличие от предыдущего случая (a1 < 0).
a0 – граница величины дохода, не приводящая к росту доли расхода на непродовольственные товары.
Решение: замена
Кривая Уоркинга
– зависимость доли расходов на непродовольственные товары от дохода.
Решение: замена
Изменение направления связи
При (a2 < 0) и (a1 > 0)
• зависимость заработной платы работников физического труда от возраста;
• зависимость урожайности от количества удобрений
• зависимость потребления товара от уровня дохода
При (a2 > 0) и (a1 < 0) – зависимость затрат на производство от объема выпуска
Решение: замена , получается линейная множественная регрессия –
– точка экстремума функции.
Логистическая функция
Преобразования: ► ►
Замена: ,
z = b1 – a2x + ε
Другие функции
Относятся к типу нелинейных по параметрам функций. Для оценки коэффициентов регрессии используют итеративные процедуры.
Степенная функция
– зависимость спроса от цены.
Решение: замена , ,
u = b0 + a1 z + ln ε
§ 3 Коэффициент эластичности
Рассмотрим зависимость спроса от цены. Спрос эластичен, т.е. изменение спроса больше изменения цены, если коэффициент эластичности по модулю больше единицы. Для большинства товаров коэффициент эластичности меньше нуля. Спрос на товар падает при увеличении цены на него. Спрос эластичен для предметов роскоши, мебели, мяса. Спрос неэластичен для лекарств, хлеба, товаров первой необходимости.
Коэффициент эластичности выручки равен единица минус модуль коэффициента эластичности спроса. Если спрос эластичен, то изменение цены вызывает изменение общей выручки в противоположном направлении.
Эластичность спроса на бензин в США в 80-е годы составляла (–0,2). Был введен 6% налог на бензин в штате Вашингтон. При этом падение спроса прогнозировалось на 1,2%. А получилось на 33% (что составляет эластичность (–5,5)), так как бензин стали закупать в соседних штатах Мэриленд и Виргиния. Через 2 месяца налог был отменен.
Если эластичность спроса на водку равна (–0,2), то при повышении акцизов на водку на 10% следует ожидать снижение спроса на 0,2*10=2% и доходы государства повысятся на 8%.
Эластичность – наклон кривых: изменение одного показателя по отношению к изменению другого показателя.
Коэффициент эластичности показывает, на сколько процентов в среднем изменится эндогенная переменная, если экзогенная переменная изменится на 1 %.
Для степенной функции: Э = a1 – константа. Для других функций Э – зависит от экзогенной переменной.
Для линейной функции:
Также рассматривают средний показатель эластичности
Если для рассматриваемых признаков бессмысленно определение изменения значений в процентах, то расчет коэффициента эластичности смысла не имеет. Например, вряд ли кто будет определять, на сколько процентов может измениться заработная плата с ростом стажа работы на 1%.
Тема 5: Множественная регрессия
§ 1 Постановка задачи
Значения результирующей переменной y зависят от значений нескольких объясняющих переменных x(1), x(2), …, x(p). Пусть количество объясняющих переменных равно p.
Имеются n наблюдений над переменной y и n наблюдений над каждой переменной x(j).
§ 2 Исследование линейной зависимости результирующей переменной от нескольких объясняющих переменных
В качестве меры тесноты связи между результирующей переменной и набором объясняющих переменных используется множественный коэффициент корреляции.
Для построения множественного коэффициента корреляции необходимо построить корреляционную матрицу R.
1. Элементами корреляционной матрицы являются парные коэффициенты корреляции между переменной y и каждой переменной x(j) (это первый столбец и первая строка матрицы), а также между каждой парой переменных x(j).
2. Так как парный коэффициент корреляции между переменной x(j) и x(j) равен 1 (rii=1), то по диагонали матрицы стоят 1.
3. Так как парный коэффициент корреляции симметричен относительно переменных rij=rji, то корреляционная матрица будет симметричной
Множественный коэффициент корреляции рассчитывается следующим образом
Множественный коэффициент корреляции
R00 – алгебраическое дополнение элемента 00 корреляционной матрицы R. , где Ash – минор матрицы R, который равен определителю матрицы, полученной из матрицы R вычеркиванием из нее строки s и столбца h.
Проверка значимости
H0: основная гипотеза говорит о незначимости связи Ryx=0
Если , то гипотеза отвергается.
Где vα – α % точка распределения Фишера с (p, n–p–1) степенями свободы.
§ 3 Частные коэффициенты корреляции
Парный коэффициент корреляции учитывает опосредованное влияние на тесноту связи других объясняющих переменных.
Частный коэффициент корреляции является мерой статистической связи, которая «очищена» от опосредованного влияния других переменных, дает оценку степени тесноты связи между переменными x(i) и x(j) при условии, что значения остальных переменных зафиксированы на среднем уровне.
Частный коэффициент корреляции
Для решаемой задачи интерес представляют частные коэффициенты корреляции: r’0j, выражающие зависимость между переменной y и переменной x(j).
Проверка значимости
H0: основная гипотеза говорит о незначимости частного коэффициента корреляции r’ij=0.
Если , то гипотеза отвергается.
Где – α/2 % точка распределения Стьюдента с (n–p–3) степенями свободы.
Пример
Исследуем зависимость тиража газеты y от
x(1) – доход от распродажи,
x(2) – количество персонала редакции,
x(3) – рейтинг среди других газет.
§ 4 Модель множественной регрессии
Постановка задачи
Значения результирующей переменной y линейно зависят от значений объясняющих переменных x(1), x(2), …, x(p). Имеются n наблюдений над переменной y и n наблюдений над каждой переменной x(j).
Необходимо найти коэффициенты a1, a2, … , ap функции регрессии:
y = a0 + a1·x(1) + a2·x(2) + … + ap·x(p) + ε
Классическая линейная модель множественной регрессии
1. Система из n уравнений с (p+1) неизвестными.
2. Все остатки имеют нулевое математическое ожидание.
3. Все остатки имеют одинаковую дисперсию – гомоскедастичность. Все остатки независимы.
4. Неравенство (p+1)0,8; i,j≠0).
2. Определитель матрицы (XTX) близок к нулю.
3. Большинство полученных коэффициентов регрессии (aj) при проверке гипотезы оказались незначимы, в то время как они имеют отличные от нуля значения, и сама регрессия является значимой.
4. Некоторые коэффициенты регрессии (aj) имеют неправильные с точки зрения экономической теории знаки или неоправданно большие по абсолютной величине значения.
5. Небольшое изменение исходных статистических данных приводит к существенному изменению коэффициентов регрессии (aj) вплоть до изменения знака.
Методы устранения мультиколлинеарности:
• Метод главных компонент
• Отбор наиболее существенных объясняющих переменных
◦ Метод всех возможных регрессий
◦ Метод пошагового отбора переменных
§ 7.1 Метод главных компонент
Суть метода заключается в переходе к другим объясняющим переменным, являющимся линейными комбинациями исходных объясняющих переменных. Между новыми объясняющими переменными корреляции малы или вообще отсутствуют.
Строим центрированные матрицы Хц и Yц.
Находим собственные числа и собственные вектора матрицы (XцTXц).
Строим вектор главных компонент Z=LXц. Где L – матрица из собственных векторов.
Находим коэффициенты регрессии для переменных Z.
Оставляем только те переменные z, для которых отвергнута гипотеза о незначимости.
Даем интерпретацию отобранным переменным z.
§ 7.2 Отбор наиболее существенных объясняющих переменных
§ 7.2.1 Метод всех возможных регрессий
Для заданного значения k{1, 2, …, p-1} путем полного перебора всех возможных комбинаций из k объясняющих переменных, отобранных из набора x(1), x(2), … , x(p) определить переменные, для которых коэффициент детерминации будет максимальным.
На первом шаге k=1 рассмотрим парные регрессии, их будет p штук.
На втором шаге k=2 рассмотрим регрессии для пар объясняющих переменных, их будет Cn2 штук.
И так далее.
Для каждой регрессии вычисляем коэффициент детерминации. Выбираем ту регрессию, у которой коэффициент детерминации максимален. Эти переменные и оставляем.
§ 7.2.2 Метод пошагового отбора переменных
Отличается от метода всех возможных регрессий тем, что на каждом следующем шаге остаются все отобранные переменные и к ним присоединяется только одна новая переменная.
Возникает вопрос: на каком шаге остановиться?
Для этого на каждом шаге рассчитываются исправленный и минимальный коэффициенты детерминации:
Исправленный коэффициент детерминации не убывает. Минимальный коэффициент сначала возрастает, а затем убывает. Остановка в вычислениях выполняется на том шаге, когда минимальный коэффициент детерминации начнет убывать. В качестве объясняющих переменных оставляем те переменные, которые были получены на шаге, когда минимальный коэффициент детерминации имел максимальное значение.
Пример
Исследуем зависимость урожайности зерновых культур y от
x(1) – количество тракторов на 100 га,
x(2) – количество зерноуборочных комбайнов на 100 га,
x(3) – количество орудий поверхностной обработки почвы на 100 га,
x(4) – количество удобрений на 1 га (т/га),
x(5) – количество химических средств защиты растений (ц/га).
p=5, n=20
a0 = 0,515 s0 = 5,41
a1 = – 0,006 s1 = 0,6
a2 = 15,542 s2 = 21,59
a3 = 0,11 s3 = 0,85
a4 = 4,475 s4 = 1,54
a5 = – 2,932 s5 = 3,09
t0,025(14) = 2,145
Гипотеза о незначимости коэффициентов регрессии отвергается только для x(4), сама регрессия является значимой (D = 0,517). Следовательно, есть признаки наличия явления коллинеарности.
Рассмотрим корреляционную матрицу.
Парные коэффициенты корреляции r21, r31, r32 имеют большие по модулю значения.
Шаг 1:
Множественный коэффициент корреляции (коэффициент детерминации) равен квадрату парного коэффициента корреляции.
x
r
R2yx=r2
x(1)
0,43
0,1849
x(2)
0,37
0,1369
x(3)
0,40
0,1600
x(4)
0,58
0,3364
x(5)
0,33
0,1089
Максимальное значение имеет множественный коэффициент корреляции для переменной x(4).
R2yx = 0,3364
D* = 0,299533
Dmin = 0,208075
Переменную x(4) включаем в модель.
Шаг 2:
Рассматриваем пары переменных (x(4), x(1)), (x(4), x(2)), (x(4), x(3)), (x(4), x(5)).
det(R1) = 1*1*1 + 0,58*0,11*0,43 + 0,58*0,11*0,43 – 0,43*1*0,43 – 0,58*0,58*1 – 0,11*0,11*1 = 0,5214
det(R1 00) = 1*1 – 0,11*0,11 = 0,9879
R2yx = 0,472145
det(R2) = 1*1*1 + 0,58*0,03*0,37 + 0,58*0,03*0,37 – 0,37*1*0,37 – 0,58*0,58*1 – 0,03*0,03*1 = 0,5386
det(R2 00) = 1*1 – 0,03*0,03 = 0,9991
R2yx = 0,460839
det(R3) = 1*1*1 + 0,58*0,03*0,4 + 0,58*0,03*0,4 – 0,4*1*0,4 – 0,58*0,58*1 – 0,03*0,03*1 = 0,51662
det(R3 00) = 1*1 – 0,03*0,03 = 0,9991
R2yx = 0,482915
det(R5) = 1*1*1 + 0,58*0,57*0,33 + 0,58*0,57*0,33 – 0,33*1*0,33 – 0,58*0,58*1 – 0,57*0,57*1 = 0,4479
det(R5 00) = 1*1 – 0,11*0,11 = 0,6751
R2yx = 0,336401
Максимальным является множественный коэффициент корреляции для пары (x(4), x(3)).
R2yx = 0,482915
D* = 0,422081
Dmin = 0,324136
Шаг 3:
Рассматриваем тройки переменных (x(4), x(3), x(1)), (x(4), x(3), x(2)), (x(4), x(3), x(5)).
Рассмотрим тройку (x(4), x(3), x(1)).
det(R1) = 0,017
det(R1 00) = 0,033
R2yx = 0,484763
Рассмотрим тройку (x(4), x(3), x(2)).
det(R2) = 0,116288
det(R2 00) = 0,225384
R2yx = 0,484043
Рассмотрим тройку (x(4), x(3), x(5)).
det(R5) = 0,302783
det(R5 00) = 0,605376
R2yx = 0,499842
Максимальным является множественный коэффициент корреляции для тройки (x(4), x(3), x(5)).
R2yx = 0,499842
D* = 0,406062
Dmin = 0,293496
Dmin, полученное на третьем шаге, меньше Dmin, полученного на втором шаге, следовательно, в модели можно оставить только x(4) (количество удобрений на 1 га) и x(3) ( количество орудий поверхностной обработки почвы на 100 га).
y = 7,29 + 3,48 x(3) + 3,48 x(4)
§ 8 Неоднородные регрессионные данные
Если среди экзогенных переменных есть качественные переменные, так называемые сопутствующие переменные, то возможны следующие варианты:
• разделить наблюдения на отдельные группы с одинаковыми значениями сопутствующих переменных и строить отдельные регрессии для каждой группы,
• ввести в модель фиктивные переменные – манекены, которые принимают только два значения 0 и 1 (дихотомические, бинарные, булевы), тогда можно использовать все наблюдения.
§ 8.1 Проверка однородности – критерий Чоу
Пусть, в модель включена только одна сопутствующая переменная, принимающая только два значения. Тогда выборку можно разделить на две выборки с количеством наблюдений n1 и n2.
Действительно ли эти две выборки будут неоднородны?
Критерий Г.Чоу (G.Chow)
(для случая n2 ≤ p+1)
H0: A(1) = A(2), Dε(1) = Dε(2) = σ2 – выборки однородны
1. По выборке (1) строим МНК оценки коэффициентов регрессии А(1) и вычисляем вектор остатков
ε(1) = Y(1) – X(1)·A(1)
2. По объединенной выборке строим МНК оценки коэффициентов регрессии А и вычисляем вектор остатков
ε = Y – X·A
3. Рассчитываем статистику
Если , то гипотеза отвергается.
Где vα – α % точка распределения Фишера с (n2, n1–p–1) степенями свободы.
Тема 6: Анализ временных рядов
§ 1 Определение и характеристики
Наблюдения выполняются над одним и тем же объектом в течение определенного времени, т. е. прослеживается динамика изменения характеристики для конкретного объекта. Наблюдения фиксируются через одинаковые временные интервалы.
t – время
x(t) – значения временного ряда
1
x(1)
2
x(2)
3
x(3)
…
…
n
x(n)
Временной ряд – совокупность значений какого-либо показателя за несколько последовательных моментов времени. Каждое значение называется уровнем временного ряда.
Примеры
1. Ежегодный урожай ячменя
2. Ежедневное количество покупателей в магазине
3. Ежечасное количество покупателей в магазине
4. Еженедельный объем продаж в магазине
Отличия от регрессионной модели
1. Члены временного ряда не являются статистически независимыми.
2. Члены временного ряда не являются одинаково распределенными.
P( x(t1) < y ) ≠ P( x(t2) < y ), при t1 ≠ t2.
Факторы, под воздействием которых формируются значения временного ряда
• Долговременные – формирующие общую тенденцию в изменениях анализируемой характеристики объекта, описываются функцией тренда (f(t)),
• Сезонные – формирующие периодически повторяющиеся (в определенное время года) колебания анализируемой характеристики объекта (φ(t)),
• Циклические – формирующие изменения анализируемой характеристики объекта, обусловленные действием долговременных циклов экономической, демографической, астрофизической природы (ψ(t)),
• Случайные – не поддающиеся учету и регистрации (ε(t)).
Задача анализа временных рядов
1. Определить наличие факторов f(t), φ(t), ψ(t).
2. Построить модель временного ряда.
3. Оценить функции f(t), φ(t), ψ(t).
4. Подобрать модель, описывающую поведение ε(t) и статистически оценить ее параметры.
Модели временного ряда
• Аддитивная: x(t) = f(t) + φ(t) + ψ(t) + ε(t).
• Мультипликативная: x(t) = f(t) * φ(t) * ψ(t) * ε(t).
§ 1.1 Автокорреляция
Члены временного ряда являются статистически зависимыми. Оценка этой зависимости называется автокорреляцией.
Автокорреляцией уровней ряда называется корреляционная зависимость между последовательными уровнями временного ряда. Количественно можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.
x(t)
x(t-1)
x(t-2)
…
x(t- τ)
x(1)
–
–
…
–
x(2)
x(1)
–
…
–
x(3)
x(2)
x(1)
…
–
x(4)
x(3)
x(2)
…
–
…
…
…
…
…
x(n)
x(n-1)
x(n-2)
…
x(n- τ)
τ – лаг, изменяющийся от 1 до n/4 ???.
Коэффициент автокорреляции первого порядка рассчитывается как коэффициент корреляции между уровнями временного ряда x(t) и x(t-1) (n-1 – пара), второго порядка – x(t) и x(t-2) (n-2 – пары), порядка τ – x(t) и x(t- τ) (n-τ – пар).
Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка) называется коррелограммой.
уровень
коэффициент автокорреляции
1
r1
2
r2
3
r3
…
…
Если большие по модулю значения коэффициента автокорреляции повторяются через равные лаги τ, то если τ=1, то наличие только тренда и отсутствие сезонных колебаний, если τ > 1, то наличие сезонной составляющей с периодом τ.
§ 1.2 Проверка наличия тренда
Разбиваем временной ряд на две равные части (почти равные).
, j=1,2
H0: – тренд отсутствует
Если , то гипотеза отвергается.
t0,2(15) = 1,341
§ 2 Моделирование сезонных колебаний
§ 2.1 Аддитивная модель
Рассмотрим временной ряд, содержащий данные об энергопотреблении за квартал.
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
x(t)
6
4,4
5
9
7,2
4,8
6
10
8
5,6
6,4
11
9
6,6
7
10,8
Лаг
Коэффициент
автокорреляции
1
0,1651
2
– 0,5668
3
0,1135
4
0,9830
5
0,1187
6
– 0,7220
7
– 0,0033
8
0,9738
Шаг 1: сглаживание временного ряда методом скользящего среднего
1. Найдем средние значения временного ряда за 4 лага – период сезонных колебаний.
2. Найдем средние для соседних средних за 2 лага – центрированные скользящие средние.
Шаг 2: Оценка сезонной компоненты
1. Найдем разность между наблюдениями и центрированными скользящими средними.
2. Для каждого сезона найдем среднее значение отклонения от центрированного скользящего среднего – S.
3. Сумма этих значений должна быть равна нулю. Фактически это не так. Найдем сумму средних за сезон S и разделим ее на величину периода. Полученное значение К вычтем из всех сезонных средних. Полученные значения будут сезонной компонентой.
сезон
1
2
3
4
–
–
-1,25
2,55
x(t) – среднее
0,58
-2,08
-1,10
2,70
0,55
-2,03
-1,48
2,88
0,68
-1,78
–
–
S = среднее за сезон
0,60
-1,96
-1,28
2,71
φ(t) = S – K
0,58
-1,98
-1,29
2,69
0,60 + (– 1,958) + (– 1,275) + 2,708 = 0,075
К = 0,075 / 4 = 0,01875
Шаг 3: Оценка тренда
1. Вычтем сезонную составляющую из значений временного ряда.
2. Построим парную линейную регрессию для полученных разностей и времени.
f(t) = 5,715417 + 0,186422 t
3. Рассчитаем значения тренда для каждого лага.
Шаг 4: Оценка случайной составляющей
1. Вычтем из значений временного ряда значения тренда и сезонной составляющей.
2. Найдем квадраты полученных значений
3. Вычислим дисперсию остатков.
σ2 = 0,0686
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
x(t)
6
4,4
5
9
7,2
4,8
6
10
8
5,6
6,4
11
9
6,6
7
10,8
6,1 6,4 6,5 6,75 7 7,2 7,4 7,5 7,75 8 8,25 8,4 8,35
среднее x за период
6,25
6,45
6,625
6,875
7,1
7,3
7,45
7,625
7,875
8,125
8,325
8,375
x(t) – среднее
-1,25
2,55
0,575
-2,075
-1,1
2,7
0,55
-2,025
-1,475
2,875
0,675
-1,775
φ(t)
0,58
-1,98
-1,29
2,69
0,58
-1,98
-1,29
2,69
0,58
-1,98
-1,29
2,69
0,58
-1,98
-1,29
2,69
x(t) – φ(t)
5,42
6,38
6,29
6,31
6,62
6,78
7,29
7,31
7,42
7,58
7,69
8,31
8,42
8,58
8,29
8,11
f(t)
5,90
6,09
6,27
6,46
6,65
6,83
7,02
7,21
7,39
7,58
7,77
7,95
8,14
8,33
8,51
8,70
ε = x(t) –f(t) – φ(t)
-0,48
0,29
0,02
-0,15
-0,03
-0,06
0,27
0,10
0,03
0,00
-0,07
0,36
0,28
0,25
-0,22
-0,59
ε2
0,23
0,08
0,00
0,02
0,00
0,00
0,07
0,01
0,00
0,00
0,01
0,13
0,08
0,06
0,05
0,35
Модель
x(t) = f(t) + φ(t) + ε(t)
f(t) = 5,715417 + 0,186422 t
§ 2.2 Мультипликативная модель
Рассмотрим временной ряд, содержащий данные прибыли компании за квартал.
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
x(t)
72
100
90
64
70
92
80
58
62
80
68
48
52
60
50
30
Шаг 1: сглаживание временного ряда методом скользящего среднего
1. Найдем средние значения временного ряда за 4 лага – период сезонных колебаний.
2. Найдем средние для соседних средних за 2 лага – центрированные скользящие средние.
Шаг 2: Оценка сезонной компоненты
1. Найдем отношение наблюдений и центрированных скользящих средних.
2. Для каждого сезона найдем среднее значение отклонения от центрированного скользящего среднего – S.
3. Сумма этих значений должна быть равна величине периода. Фактически это не так. Найдем сумму средних за сезон S и разделим величину периода на эту сумму. Полученное значение К умножим на каждое сезонное среднее. Полученные значения будут сезонной компонентой.
сезон
1
2
3
4
–
–
1,108
0,800
x(t) / среднее
0,900
1,215
1,081
0,811
0,905
1,217
1,075
0,807
0,950
1,194
–
–
S = среднее за сезон
0,918
1,208
1,088
0,806
φ(t) = S * K
0,914
1,202
1,082
0,802
0,918 + 1208 + 1,088 + 0,806 = 4,021
К = 4 / 4,021 = 0,9948378
Шаг 3: Оценка тренда
1. Разделим значения временного ряда на сезонную компоненту.
2. Построим парную линейную регрессию для полученных отношений и времени.
f(t) = 90,56515 – 2,773252 t
3. Рассчитаем значения тренда для каждого лага.
Шаг 4: Оценка случайной составляющей
1. Разделим значения временного ряда на значения тренда и сезонной составляющей.
2. Найдем квадраты полученных значений
3. Вычислим дисперсию остатков.
σ2 = 1,0123
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
x(t)
72
100
90
64
70
92
80
58
62
80
68
48
52
60
50
30
81,5 81 79 76,5 75 73 70 67 64,5 62 57 52,5 48
среднее x за период
81,25
80
77,75
75,75
74
71,5
68,5
65,75
63,25
59,5
54,75
50,25
x(t)/среднее
1,11
0,8
0,9
1,21
1,08
0,81
0,91
1,22
1,08
0,81
0,95
1,19
φ(t)
0,91
1,20
1,08
0,80
0,91
1,20
1,08
0,80
0,91
1,20
1,08
0,80
0,91
1,20
1,08
0,80
x(t)/φ(t)
78,80
83,18
83,15
79,82
76,61
76,53
73,91
72,34
67,86
66,55
62,83
59,86
56,91
49,91
46,20
37,42
f(t)
87,79
85,02
82,25
79,47
76,70
73,93
71,15
68,38
65,61
62,83
60,06
57,29
54,51
51,74
48,97
46,19
ε = x(t)/f(t)/φ(t)
0,90
0,98
1,01
1,00
1,00
1,04
1,04
1,06
1,03
1,06
1,05
1,05
1,04
0,96
0,94
0,81
ε2
0,81
0,96
1,02
1,01
1,00
1,07
1,08
1,12
1,07
1,12
1,09
1,09
1,09
0,93
0,89
0,66
Модель
x(t) = f(t) * φ(t) * ε(t)
f(t) = 90,59 – 2,773 t
§ 2.3 Построение прогноза
Аддитивная модель
t = 17
f (17) = 5,715 + 0,186 · 17 = 8,877
Сезон равен 1, следовательно φ(17) = 0,581
x(17) = 8,877 + 0,581 = 9,458
t = 18
f (18) = 5,715 + 0,186 · 18 = 9,063
Сезон равен 2, следовательно φ(18) = – 1,977
x(18) = 9,063 – 1,977 = 7,086
Мультипликативная модель
t = 17
f (17) = 90,59 – 2,773 · 17 = 43,401
Сезон равен 1, следовательно φ(17) = 0,913
x(17) = 43,401 * 0,913 = 39,626
t = 18
f (18) = 90,59 – 2,773 · 18 = 40,647
Сезон равен 2, следовательно φ(18) = 1,202
x(18) = 40,647 * 1,202 = 48,865
§ 3 Применение фиктивных переменных для моделирования сезонных колебаний
Если рассмотреть время, как количественную объясняющую переменную, а сезон – качественную объясняющую переменную, то получится уравнение:
X(t) = a0 + a1 t + b z + εt
Если период сезонных колебаний равен k, то количество фиктивных переменных равно (k–1).
Недостаток такого метода заключается в большом количестве переменных при малом количестве исходных наблюдений. Чем больше период колебаний, тем больше фиктивных переменных.
Пример
k=4
X(t) = a0 + a1 t + b1 z(1) + b2 z(2) + b3 z(3) + εt
Методом наименьших квадратов находим коэффициенты:
X(t) = 8,33+ 0,19 t – 2,09 z(1) – 4,48 z(2) – 3,91 z(3)
Для z=1 : X(t) = 8,33 – 2,09 + 0,19 t = 6,24 + 0,19 t = 5,715 + 0,19 t + 0,525 (0,587)
Для z=2 : X(t) = 8,33 – 4,48 + 0,19 t = 3,85 + 0,19 t = 5,715 + 0,19 t – 1,865 (– 1,977)
Для z=3 : X(t) = 8,33 – 3,91 + 0,19 t = 4,42 + 0,19 t = 5,715 + 0,19 t – 1,295 (– 1,294)
Для z=4 : X(t) = 8,33 + 0,19 t = 5,715 + 0,19 t + 2,615 (2,69)