Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Эконометрика-1
Лекция 1. Введение
Филипп Картаев
kartaev@gmail.com
Экономический факультет МГУ
Предупреждение
• Текст презентации не является самодостаточным и не заменяет
комментариев на лекциях, а также соответствующих глав
учебников
• Кроме того, только на лекции у вас есть уникальный шанс узнать
обо всех опечатках в этой презентации
План лекции
• Что такое эконометрика и зачем она нужна
• Организационные вопросы
• Обозначения
• Метод наименьших квадратов
Эконометрика
• Эконометрика — наука, изучающая количественные и
качественные экономические взаимосвязи с помощью
математических и статистических методов и моделей
• Три ингредиента эконометрики
―Экономическая теория
―Экономическая статистика
―Математическая статистика
Молодая и успешная наука
• Возникла в 1930 году. Автор термина — Рагнар Фриш
• Первая в истории Нобелевская премия по экономике присуждена
эконометристам. Тинберген, Фриш, 1969.
• Последние годы: Хекман и Макфадден (2000), Ингл и Грейнджер
(2003), Сарджент и Симс (2011), Хансен (2013)
Зачем нужна эконометрика?
1. Описательный (дескриптивный) анализ
2. Выявление причинно-следственных связей между
переменными
3. Прогнозирование
6
1. Описательный (дескриптивный) анализ
• Речь идет о количественных оценках зависимостей между
переменными (без выявления направления причинноследственных связей)
• Об этом вы уже много знаете из курса статистики. Например, вы
умеете вычислять коэффициент корреляции или сравнивать
средние значения в выборках. В рамках нашего курса мы обсудим
и более продвинутые техники
• Например: Есть ли корреляция между доходностью взаимных
фондов и рыночной доходностью? А если проконтролировать на
прочие важные факторы?
7
2. Выявление причинно-следственных связей
между переменными
Примеры вопросов о причинно-следственных связях, на которые
можно отвечать при помощи эконометрики:
• Если принять закон о ношении личного огнестрельного оружия,
то что произойдет с уровнем преступности?
• Увеличится ли уровень инфляции в результате увеличения темпов
роста денежной массы? Если да, то на сколько? Произойдет ли
это сразу или через некоторое время? Через какое?
• Влияет ли величина рекламного бюджета на объем продаж?
Какова количественная оценка этого эффекта?
8
3. Прогнозирование
Примеры вопросов о построении прогнозов:
• Случится ли рецессия в следующем квартале?
• Каким будет уровень инфляции через месяц?
• С какой вероятностью заемщик с заданными характеристиками
окажется неспособен вернуть долг?
9
Зачем нужна эконометрика?
1. Описательный (дескриптивный) анализ
2. Выявление причинно-следственных связей между
переменными
3. Прогнозирование
На самом деле вторая задача гораздо сложнее (и интереснее!)
первой. Обычный коэффициент корреляции или обычное
соотношение средних значений часто не говорит о причинноследственных связях ровным счетом ничего. Пример — на
следующих слайдах
10
Как связана площадь квартиры и ее цена?
Данные по однокомнатным квартирам в Москве (2013)
9000000
8500000
8000000
7500000
7000000
6500000
6000000
5500000
5000000
4500000
4000000
24
29
34
39
44
11
Как связана площадь квартиры и ее цена?
Данные по однокомнатным квартирам в Москве (2013)
9000000
8500000
y = 135 317x + 786 456
8000000
7500000
7000000
6500000
6000000
5500000
5000000
4500000
4000000
24
29
34
39
44
12
Пример 1: полезны ли подготовительные курсы?
Результаты вступительного экзамена по экономике для
абитуриентов магистратуры
Ходили на
курсы
Не ходили на
курсы
Средний балл
43 балла 48,5 баллов
за экзамен
(50 человек) (100 человек)
Негативный эффект от посещения курсов?
13
Пример 1: полезны ли подготовительные курсы?
Но если учесть еще один фактор,…
Выпускники
бакалавриата
ЭФ
Другие
абитуриенты
Итого
Ходили на
курсы
Не ходили на
курсы
55 баллов
50 баллов
(10 человек)
(95 человек)
40 баллов
20 баллов
(40 человек)
(5 человек)
43 балла
48,5 баллов
(50 человек)
(100 человек)
…то мы увидим
позитивный
эффект для
каждой из групп
14
Пример 1: полезны ли подготовительные курсы?
Вывод №1: если вы будете игнорировать существенные
переменные, вы получите смещенные результаты
Omitted-variable bias
Вывод №2: корреляция — это не то же самое, что причинноследственная связь (causal effect)
― В самой первой табличке между посещением курсов и
результатами отрицательная корреляция, однако на самом деле это
ничего не говорит о качестве курсов
― Корреляцию посчитать просто. Выявить причинно-следственную
связь часто довольно сложно (но это — самая интересная часть
современной эконометрики)
15
Пример 2: Ложная регрессия
Что определяет темпы экономического роста?
16
Пример 2: Ложная регрессия
Зависимость ВВП России от некоторого фактора в 1995–
2012 гг. (реальный ВВП в ценах 2008 г., трлн руб.)
40
38
36
34
32
30
28
26
24
22
20
Что это за фактор?
GDP = 5.1*N – 71.5
R² = 0.93
18
19
20
21
22
23
17
Пример 2: Ложная регрессия
Все дело в тренде
N
23
22
GDP
21
45
20
40
19
35
18
30
17
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18
25
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
18
Пример 2: Ложная регрессия
• Если построить график для разностей,
то ложная связь пропадет
4
3
2
1
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
-1
-2
-3
-4
ΔGDP = -1.3*ΔN + 1.5
R² = 0.005
19
Пример 2: Ложная регрессия
• Вывод №1: если вы будете игнорировать свойства временных
рядов, с которыми вы работаете (например, наличие
трендов), вы получите искаженные результаты
• Вывод №2 (снова): корреляция — это не тоже самое, что
причинно-следственная связь
20
Типы данных в эконометрике
С точки зрения структуры данных:
• Пространственные выборки (Cross-sectional data)
• Временные ряды (Time-series)
• Панельные данные (Panel data)
С точки зрения источника:
• Экспериментальные данные: получаются из контролируемых
случайных экспериментов (randomized controlled experiments)
• Наблюдаемые статистические данные
21
Рекомендуемая литература
[1] Картаев Ф. С. Введение в эконометрику
[2] Доугерти К. Введение в эконометрику
[3] Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика.
Начальный курс
[4] Stock J., Watson M. Introduction to econometrics. Third Edition
(русскоязычное издание тоже подойдет)
Дополнительные источники ищите в списке литературы в
программе курса
22
Оценивание курса
Три промежуточные контрольные
10% за каждую
Четыре практических работы
10% за каждую
Итоговая аттестация (экзамен)
30%
23
Об эконометрических пакетах
По умолчанию в рамках нашего курса мы используем Gretl.
Мотивация для этого выбора:
• Есть все методы и модели, которые нужны в эконометрике-1
(и даже больше)
• Дружелюбный интерфейс (в том числе на русском языке)
• Кроссплатформенность
• Распространяется бесплатно
На ваше усмотрение вы можете применять для практических и
домашних работ любые другие пакеты. Например, Stata, Eviews
или R.
24
Обозначения
Выборочное среднее
𝑥ҧ =
Выборочная дисперсия 𝑣𝑎𝑟
ෞ
𝑥1 +⋯+𝑥𝑛
𝑛
1 𝑛
𝑥 = σ𝑖=1
𝑛
𝑥𝑖 − 𝑥ҧ
2
Выборочная ковариация
𝑛
1
𝑐𝑜𝑣
ෞ 𝑥, 𝑦 = 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑛
𝑖=1
25
Свойства ковариации
1
𝑛
𝑐𝑜𝑣
ෞ 𝑥, 𝑦 = 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത = = 𝑥𝑦 − 𝑥ҧ ∗ 𝑦ത
𝑛
1. 𝑐𝑜𝑣
ෞ
2. 𝑐𝑜𝑣
ෞ
3. 𝑐𝑜𝑣
ෞ
4. 𝑐𝑜𝑣
ෞ
𝑖=1
𝑥, 𝑏 = 0
𝑥, 𝑏𝑦 = 𝑏 ∗ 𝑐𝑜𝑣
ෞ 𝑥, 𝑦
𝑥, 𝑦 + 𝑏 = 𝑐𝑜𝑣
ෞ 𝑥, 𝑦
𝑥, 𝑦 + 𝑧 = 𝑐𝑜𝑣
ෞ 𝑥, 𝑦 + 𝑐𝑜𝑣
ෞ 𝑥, 𝑧
𝑏 — константа
26
Свойства дисперсии
𝑛
1
𝑣𝑎𝑟
ෞ 𝑥 = 𝑥𝑖 − 𝑥ҧ
𝑛
2
= 𝑥 2 − 𝑥ҧ
2
𝑖=1
1. 𝑣𝑎𝑟
ෞ
2. 𝑣𝑎𝑟
ෞ
3. 𝑣𝑎𝑟
ෞ
4. 𝑣𝑎𝑟
ෞ
𝑏 =0
𝑏𝑥 = 𝑏2 ∗ 𝑣𝑎𝑟
ෞ 𝑥
𝑥 + 𝑏 = 𝑣𝑎𝑟
ෞ 𝑥
𝑥 + 𝑦 = 𝑣𝑎𝑟
ෞ 𝑥 + 𝑣𝑎𝑟
ෞ 𝑦 + 2𝑐𝑜𝑣(𝑥,
ෞ
𝑦)
𝑏 — константа
27
Корреляция
Выборочная ковариация
𝑛
1
𝑐𝑜𝑣
ෞ 𝑥, 𝑦 = 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑛
𝑖=1
Выборочный коэффициент корреляции
𝑐ෟ
𝑜𝑟𝑟 𝑥, 𝑦 =
𝑐𝑜𝑣(𝑥,
ෞ
𝑦)
𝑣𝑎𝑟
ෞ 𝑥 ∗ 𝑣𝑎𝑟(𝑦)
ෞ
28
Парная регрессия
• Имеется выборка из 𝑛 пар наблюдений двух переменных: 𝑥 и 𝑦:
𝑥𝑖 , 𝑦𝑖 ,
𝑖 = 1,2, … , 𝑛.
• Мы предполагаем, что две эти переменные взаимосвязаны и
хотим проверить это предположение.
• Парный регрессионный анализ как раз и состоит в исследовании
взаимосвязи между парой переменных
• Будем подбирать функцию, которая наилучшим образом
описывает взаимосвязь между 𝑥 и 𝑦. Для начала будем
предполагать, что эта функция является линейной (конечно, это
упрощение, от которого мы позже откажемся)
29
Парная регрессия
𝒚
𝒙
30
Парная регрессия
1 + 𝛽
2 𝑥𝑖
Линия регрессии: 𝑦ෝ𝑖 = 𝛽
𝒚
𝒙
31
Парная регрессия
1 + 𝛽
2 𝑥𝑖
Будем считать, что функция линейная: 𝑦ෝ𝑖 = 𝛽
𝑒𝑖 = 𝑦𝑖 − 𝑦ෝ𝑖 — остатки регрессии — отклонение значения этой
функции (𝑦ෝ𝑖 ) от фактического значения переменной (𝑦𝑖 )
Один из естественных способов подбирать функцию,
1 и 𝛽
2 таким
описывающую связь между 𝑥 и 𝑦, — выбирать 𝛽
образом, чтобы сумма квадратов остатков по всем наблюдениям
была наименьшей: 𝑒12 + 𝑒22 + ⋯ + 𝑒𝑛2 = σ𝑛𝑖=1 𝑒𝑖2 → min
1 ,𝛽
2
𝛽
Такой подход и называется методом наименьших квадратов
(МНК). Ordinary least squares (OLS)
32
Метод наименьших квадратов
𝑛
𝑛
𝑒𝑖2
𝑖=1
1 − 𝛽
2 𝑥𝑖
= 𝑦𝑖 − 𝛽
𝑖=1
2
→ min
1 ,𝛽
2
𝛽
1 и 𝛽
2 и приравняем их к нулю:
Возьмем производные по 𝛽
𝑛
1 − 𝛽
2 𝑥𝑖 = 0
−2 𝑦𝑖 − 𝛽
𝑖=1
𝑛
1 − 𝛽
2 𝑥𝑖 = 0
−2 𝑥𝑖 𝑦𝑖 − 𝛽
𝑖=1
33
Метод наименьших квадратов
𝑛
𝑛
1 − 𝛽
2 𝑥𝑖 = 0
𝑦𝑖 − 𝑛𝛽
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
1 𝑥𝑖 − 𝛽
2 𝑥𝑖2 = 0
𝑥𝑖 𝑦𝑖 − 𝛽
𝑖=1
𝑖=1
𝑖=1
1 − 𝛽
2 𝑥ҧ = 0
𝑦ത − 𝛽
Поделим каждое уравнение системы на 𝑛: ൝
1 𝑥ҧ − 𝛽
2 𝑥 2 = 0
𝑥𝑦 − 𝛽
34
Метод наименьших квадратов
1 − 𝛽
2 𝑥ҧ = 0
𝑦ത − 𝛽
൝
1 𝑥ҧ − 𝛽
2 𝑥 2 = 0
𝑥𝑦 − 𝛽
1 и 𝛽
2 , находим:
Решив эту систему относительно 𝛽
𝑥𝑦 − 𝑥ҧ ∗ 𝑦ത 𝐶𝑜𝑣(𝑥,
𝑦)
2 =
𝛽
=
𝑉𝑎𝑟(𝑥)
𝑥 2 − 𝑥ҧ 2
𝐶𝑜𝑣(𝑥,
𝑦)
1 = 𝑦ത − 𝛽
2 𝑥ҧ = 𝑦ത −
𝛽
𝑥ҧ
𝑉𝑎𝑟(𝑥)
Почему мы можем быть уверены, что это точка минимума
функции, а не, например, максимума?
35
МНК: свойства остатков
1 + 𝛽
2 𝑥𝑖 — линия регрессии
𝑦ෝ𝑖 = 𝛽
𝑦𝑖 — фактические значения зависимой переменной
𝑦ෝ𝑖 — предсказанные значения (лежат на линии регрессии)
𝑒𝑖 = 𝑦𝑖 − 𝑦ෝ𝑖 — остатки регрессии
Несколько важных свойств остатков (докажите их!):
(а) σ𝑛𝑖=1 𝑒𝑖 = 0, (б) σ𝑛𝑖=1 𝑥𝑖 𝑒𝑖 = 0,
(в) σ𝑛𝑖=1 𝑦𝑖 = σ𝑛𝑖=1 𝑦ො𝑖 ,
(г) σ𝑛𝑖=1 𝑦ො𝑖 − 𝑦ത 𝑒𝑖 = 0, или, что то же самое, 𝐶𝑜𝑣 𝑦,
ො 𝑒 =0
36
МНК: качество оценивания
𝑒𝑖 = 𝑦𝑖 − 𝑦ෝ𝑖 ⇒ 𝑦𝑖 = 𝑒𝑖 + 𝑦ෝ𝑖
Поэтому по свойствам выборочной дисперсии:
𝑦 = 𝑉𝑎𝑟
𝑒 + 𝑦ො =
𝑉𝑎𝑟
𝑒, 𝑦ො =
𝑒 + 𝑉𝑎𝑟
𝑦ො + 2 ∗ 𝐶𝑜𝑣
= 𝑉𝑎𝑟
𝑒 + 𝑉𝑎𝑟
𝑦ො + 2 ∗ 0 = 𝑉𝑎𝑟
𝑒 + 𝑉𝑎𝑟
𝑦ො
= 𝑉𝑎𝑟
𝑦 = 𝑉𝑎𝑟
𝑒 + 𝑉𝑎𝑟
𝑦ො
𝑉𝑎𝑟
37
МНК: качество оценивания
𝑣𝑎𝑟
ෞ 𝑦 = 𝑣𝑎𝑟
ෞ 𝑒 + 𝑣𝑎𝑟
ෞ 𝑦ො
𝑛
1
𝑦𝑖 − 𝑦ത
𝑛
𝑖=1
𝑛
2
1
= 𝑒𝑖 − 𝑒ҧ
𝑛
𝑖=1
𝑛
𝑦𝑖 − 𝑦ത
𝑖=1
𝑛
2
𝑛
2
1
+ 𝑦ෝ𝑖 − 𝑦ത
𝑛
𝑖=1
𝑛
= 𝑒𝑖2 + 𝑦ෝ𝑖 − 𝑦ത
𝑖=1
2
2
𝑖=1
38
МНК: качество оценивания
𝑛
𝑛
𝑦𝑖 − 𝑦ത
𝑖=1
𝑇𝑆𝑆 = σ𝑛𝑖=1
2
𝑛
= 𝑒𝑖2 + 𝑦ෝ𝑖 − 𝑦ത
𝑖=1
𝑖=1
𝑇𝑆𝑆
𝐸𝑆𝑆
𝑅𝑆𝑆
𝑦𝑖 − 𝑦ത 2 общая сумма квадратов
(total sum of squares)
𝐸𝑆𝑆 = σ𝑛𝑖=1 𝑒𝑖2
𝑅𝑆𝑆 = σ𝑛𝑖=1 𝑦ෝ𝑖 − 𝑦ത
2
2
Обратите внимание: в
некоторых учебниках
обозначения сильно
отличаются.
См. следующий слайд
сумма квадратов остатков
(error sum of squares)
объясненная сумма квадратов
(regression sum of squares)
39
Лирическое отступление об обозначениях
𝐸𝑆𝑆 = σ𝑛𝑖=1 𝑒𝑖2 сумма квадратов остатков (error sum of squares).
Указанные обозначения используются в учебнике Магнуса,
Катышева, Пересецкого. В некоторых учебниках (например, в
Доугерти) эта величина обозначается наоборот RSS (residuals sum
of squares). А в Стоке и Ватсоне так и вовсе SSR (sum of squared
residuals)
𝑅𝑆𝑆 = σ𝑛𝑖=1 𝑦ෝ𝑖 − 𝑦ത 2 объясненная сумма квадратов (regression
sum of squares). В некоторых учебниках эта величина
обозначается наоборот ESS (estimated sum of squares).
В общем, полный кавардак. Так что придется понимать смысл, а
не заучивать аббревиатуры.
40
МНК: качество оценивания
Коэффициент детерминации 𝑅2 показывает долю дисперсии
зависимой переменной, «объясненной» уравнением регрессии
𝑣𝑎𝑟(
ෞ 𝑦)
ො
𝑅𝑆𝑆
𝐸𝑆𝑆
2
𝑅 =
=
=1−
𝑣𝑎𝑟
ෞ 𝑦
𝑇𝑆𝑆
𝑇𝑆𝑆
0 ≤ 𝑅2 ≤ 1
• Если между переменными существует точная линейная связь,
то 𝑅2 = 1
• Если в выборке отсутствует видимая линейная связь между
переменными 𝑥 и 𝑦, то 𝑅2 будет близок к нулю
41
𝟐
МНК: о чем говорит и о чем не говорит 𝑹
• Высокий R2 в парной регрессии говорит о тесной корреляции
между рассматриваемыми переменными
• Сам по себе высокий R2 не гарантирует наличия причинноследственной связи между переменными.
(Вспомните наш пример о том, что корреляция ≠ причинноследственная связь)
• Низкий R2 говорит о том, что существуют важные факторы,
которые мы не учли в нашей модели
42
Литература
1. Stock, Watson. Chapter 1. Economic Questions and Data
2. Доугерти. Глава 1
3. Также к первому семинару (и первой контрольной!) стоит
повторить основные понятия из теории вероятностей и
матстатистики: Доугерти. Глава 0.
*Обратите внимание: при составлении контрольных
предполагается, что вы знакомы не только с материалами
семинаров и лекций, но и с указанными главами учебников
43