Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Вводная лекция
Сущность эконометрики
Эконометрика как научная дисциплина получила свое развитие с середины 20 века. Экономические законы, процессы и явления все в большей степени описывают языком математики, и экономику все чаще называют одной из наиболее математизированных наук.
В условиях рыночной экономики невозможно без знания эконометрических методов исследовать и теоретически обобщить эмпирические зависимости экономических переменных, построить прогнозы в банковском деле, финансах или бизнесе.
Единое общепринятое определение эконометрики в настоящее время отсутствует. Сам термин "эконометрика" был введен в 1926 г. норвежским ученым Фришем и в дословном переводе означает "эконометрические измерения". В узкой трактовке эконометрика – это набор математико-статистических методов, используемых в приложениях математики в экономике.
Эконометрика – это наука, изучающая количественные закономерности и взаимозависимости в экономике методами математической статистики.
Эконометрика – это раздел экономики, занимающийся разработкой и применением статистических методов для измерений взаимосвязей между экономическими переменными.
Цель эконометрики – эмпирический вывод экономических законов.
Задачи – построение экономических моделей и оценивание их параметров, проверка гипотез о свойствах экономических показателей и формах их связи.
Эконометрический анализ служит основой для экономического анализа и прогнозирования, создавая возможность для принятия обоснованных экономических решений.
Благодаря своему предмету исследования: экономические процессы и явления, эконометрика объединяет в себе экономическую теорию, экономическую статистику и математико-статистический инструментарий. С помощью эконометрики происходит проверка экономических законов, которые выражены в виде математических соотношений.
Рассмотрим ситуацию. Предположим, что нам необходимо продать автомобиль. Для этого нужно дать объявление, в котором указывается цена продажи. Как определить эту цену? Предварительно продавец изучит рынок, т.е. проанализирует данные о предложении продажи подобных автомобилей. Что значит подобных автомобилей? То есть тех, которые обладают примерно такими же характеристиками или факторами: год выпуска, пробег, мощность двигателя. На основании этого будет сформировано представление о ситуации на рынке и назначена цена.
В данном случае цена зависит от нескольких факторов: год выпуска, пробег, мощность двигателя. Цена будет выступать как зависимая от факторов переменная (объясняемая переменная), а факторы – как объясняющие переменные.
Формируя общее мнение о состоянии рынка, мы обращаемся к интересующему нас объекту и получаем ожидаемое значение зависимой переменной при заданных значениях объясняющих переменных. Указанная конкретная цена – наблюдаемое значение зависимой переменной зависит также и от случайных явлений – таких, например, как сроки продажи автомобиля, потребность в конкретной денежной сумме.
Конечно, продавец-одиночка вряд ли будет строить какую-либо математическую модель, а вот менеджер крупного автосалона, специализирующийся на реализации подержанных автомобилей, скорее всего, захочет иметь представление об ожидаемой цене и о возможном поведении случайной составляющей. Поэтому следующий шаг это и есть собственно эконометрическое моделирование.
Общим моментом для любой эконометрической модели является разбиение зависимой переменной на две части – объясненную и случайную. Сформулируем задачу моделирования неформальным образом: на основании экспериментальных данных определить объясненную часть и, рассматривая случайную составляющую как случайную величину, получить оценки параметров ее распределения.
Таким образом, эконометрическая модель имеет вид:
,
где у – наблюдаемое значение зависимой переменной;
f(x) – объясненная часть, зависящая от значений объясняющих переменных,
- случайная составляющая.
Посмотрим теперь на цели моделирования. Предположим получено следующее выражение для объясненной части переменной у – цены автомобиля:
,
где - ожидаемая цена автомобиля (в усл. ден. ед.),
х1 – срок эксплуатации автомобиля (в годах);
х2 – пробег (в тыс. км).
Каково практическое применение полученного результата?
Во-первых, можно понять, как именно формируется рассматриваемая экономическая переменная – цена на автомобиль.
Во-вторых, выражение дает возможность выявить влияние каждой из объясняющих переменных на цену автомобиля. Так при х1= 0, х2 = 0 цена нового автомобиля будет составлять 18000 усл. д. ед., при этом только за счет увеличения срока эксплуатации на 1 год цена автомобиля уменьшится в среднем на 1000 есл. д. ед, а только за счет увеличения пробега на 1 тыс. км – на 0,5 усл. д. ед.
В-третьих, с помощью полученного выражения можно прогнозировать цену на автомобиль, если известны его основные параметры. Менеджеру не составит большого труда определить ожидаемую цену вновь поступившего для продажи автомобиля, даже если его год выпуска и пробег не встречались ранее в данном салоне.
Типы данных
При моделировании экономических процессов оперируют следующими типами данных: пространственными и временными.
Пространственные данные – это данные по какому-либо экономическому показателю, полученные от разных однотипных объектов (фирм, регионов и т.п.), но относящиеся к одному и тому же моменту времени (пространственный срез). Например, данные об объеме производства, количестве работников, доходе разных фирм в один и тот же момент времени.
Временные данные – это данные, характеризующие один и тот же объект в различные моменты времени (временной срез). Например, ежеквартальные данные об инфляции, средней заработной плате, данные о национальном доходе за последние годы.
Классы моделей
Главным инструментом эконометрики служит эконометрическая модель. Эконометрические модели могут представлять собой модель временного ряда, систему одновременных уравнений, а также регрессионную модель с одним уравнением.
Этапы эконометрического моделирования
В эконометрическом моделировании можно выделить шесть основных этапов: постановочный, априорный, этап параметризации, информационный, этапы идентификации и верификации модели.
1-й этап (постановочный). На данном этапе формируется цель исследования, набор участвующих в модели экономических переменных.
В качестве цели эконометрического моделирования обычно рассматривают анализ исследуемого экономического объекта или процесса; прогноз его экономических показателей, имитацию развития объекта при различных значениях экзогенных переменных, выработку управленческих решений.
2-й этап (априорный). Проводится анализ сущности изучаемого объекта, формирование и формализация априорной информации (известной до начала моделирования).
3-й этап (параметризация). Осуществляется непосредственное моделирование, т.е. выбор общего вида модели, выявление входящих в нее связей.
4-й этап (информационный). Осуществляется сбор необходимой статистической информации – наблюдаемых значений экономической информации (х1, х2, х3,…. хn, у1, у2, у3 …уn).
5-й этап (идентификация модели). Осуществляется статистический анализ модели и оценка ее параметров.
6-й этап (верификация модели). Проводится проверка истинности, адекватности модели, т.е. насколько соответствует построенная модель моделируемому реальному экономическому процессу или явлению.
Функциональная, статистическая и корреляционная зависимости.
В естественных науках часто речь идет о функциональной зависимости, когда каждому значению одной переменной соответствует вполне определенное значение другой.
В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость получила название статистической (или стохастической, вероятностной). Примером статистической связи является зависимость урожайности от количества внесенных удобрений, производительности труда на предприятии от его энерговооруженности и т.п.
Корреляционной связью называют частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения х закономерным образом изменяется среднее значение у, в то время как в каждом отдельном случае у может принимать множество различных значений (с различными вероятностями).
Корреляционная связь между переменными может возникнуть разными путями. Первый путь – причинная зависимость объясняемой переменной (ее вариации) от вариации объясняющей переменной. Например, объясняемая переменная или результативный признак у – это урожайность сельскохозяйственной культуры, а х – как объясняющая переменная (факторный признак) это балл оценки плодородия почвы.
Второй путь – сопряженность, возникающая при наличии общей причины. Известен классический пример, приведенный крупнейшим статистиком России начала 20 века Чупровым: если в качестве х взять число пожарных команд в городе, а за у – сумму убытков за год в городе от пожаров, то между ними в совокупности городов России существовала прямая корреляция, в среднем чем больше пожарных в городе, тем больше и убытков от пожаров. Уж не занимались ли пожарные поджигательством из боязни потерять работу? Но дело в другом. Данную корреляцию нельзя интерпретировать как связь причины и следствия; оба признака-следствия общей причины – размера города. В крупных городах больше пожарных частей, но больше и пожаров, и убытков от них за год, чем в малых городах.
Третий путь возникновения корреляции – взаимосвязь рассматриваемых (переменных) признаков, каждый из которых и причина и следствие. Например, корреляция между уровнями производительности труда рабочих и уровнем оплаты за 1 час труда. С одно стороны, уровень зарплаты это следствие производительности труда, но с другой, установленные тарифные ставки и расценки играют стимулирующую роль: при правильной системе оплаты они выступают в качестве фактора, от которого зависит производительность труда. В такой систем допустимы обе постановки задачи: каждый рассмотренный признак может выступать в роли независимой переменной х и в качестве зависимой переменой у.
Простейшей системой корреляционной связи является линейная связь между двумя признаками – парная линейная корреляция, уравнение которой называется уравнением парной регрессии: .
Таким образом, основными объектами эконометрики являются экономические процессы и явления, описываемые с помощью эконометрических моделей на основе корреляционной связи между рассматриваемыми переменными с применением методов математической статистики.
Основы дисперсионного анализа
В настоящее время дисперсионный анализ определяется как статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.
Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком-статистиком Р.А. Фишером для обработки результатов агрономических опытов по выявлению условий получения максимального урожая различных сортов сельскохозяйственных культур. Сам термин «дисперсионный анализ» Фишер употребил позднее.
По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный дисперсионный анализ.
В дисперсионном анализе общая вариация изучаемого признака подразделяется на составляющие и проводится сравнение этих составляющих. Проверяемая гипотеза заключается в том, что если данные каждой группы представляют случайную выборку из нормально распределенной генеральной совокупности, то величины всех частных дисперсий должны быть пропорциональны своим степеням свободы и каждую из них можно рассматривать как оценку генеральной совокупности.
В случае выделения групп по одному фактору мы имеем так называемый однофакторный дисперсионный комплекс. Разложение дисперсии при этом проводится в соответствии с правилом сложения дисперсии:
,
где - общая сумма квадратов отклонений,
- сумма квадратов отклонений, обусловленная регрессией
(факторная);
- остаточная сумма квадратов отклонений.
На основе разложения дисперсии в соответствии с гипотезой отсутствия различий между группами могут быть получены три оценки генеральной дисперсии, пропорциональные степени свободы: на основе общей вариации, межгрупповой (факторной) и внутригрупповой (остаточной).
Число степеней свободы равно:
• для общей вариации dfобщ = n – 1;
• для межгрупповой (факторной) вариации dfфакт = m – 1;
• для внутригрупповой (остаточной) вариации dfост = n – m.
Как и суммы квадратов отклонений, числа степеней свободы связаны между собой равенством: dfобщ = dfфакт + dfост или n – 1=(m – 1)+( n – m).
Деление суммы квадратов отклонений на соответствующее число степеней свободы дает три оценки генеральной дисперсии:
, , .
Поскольку измеряет вариацию результативного признака, связанную с изменением фактора, по которому проведена группировка, а – вариацию, связанную с изменением всех прочих факторов, сравнение этих величин, рассчитанных на одну степень свободы, дает возможность оценить существенность влияния признака-фактора на результативный признак с помощью F-критерия:
.
Данная запись предполагает, что ≥
Полученное значение F-критерия сравнивается с табличным значением Fтабл-критерия. Если Fтабл‹ Fфакт, то гипотеза Н0 о равенстве выборочных дисперсий генеральной дисперсии отклоняется, признается существенным, статистически значимым влияние признака-фактора на результативный признак.
Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы () и уровне значимости , который принимается равным 0,05 или 0,01.
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня, и она не может быть отклонена без риска сделать неправильный вывод о наличии связи.
Этапы однофакторного дисперсионного анализа представлены в таблице.
Источник вариации
Сумма квадратов отклонений
Число степеней свободы
Дисперсия на одну степень свободы (средний квадрат отклонений)
F-критерий
Общая
n – 1
-
Факторная
(между группами)
m – 1
Остаточная
(внутри групп)
n – m
-
Коэффициент корреляции
Перейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики и теории случай линейной зависимости.
На первый взгляд подходящим измерителем тесноты связи у от х является коэффициент регрессии bух, так как он показывает, на сколько единиц в среднем изменяется у, когда х увеличивается на одну единицу. Однако byx зависит от единиц измерения переменных.
Очевидно, что для «исправления» bух как показателя тесноты связи нужна такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. Статистика знает такую систему единиц. Эта система использует в качестве единицы измерения переменной ее среднее квадратическое отклонение .
Введем формулу:
.
В ней ryx показывает, на сколько величин изменится в среднем y, когда x увеличится на одно значение .
Величина r является показателем тесноты линейной связи и называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции).
На рисунке 1.1 приведены две корреляционные зависимости переменной у от х. Очевидно, что в случае а) зависимость между переменными менее тесная и коэффициент корреляции должен быть меньше, чем в случае б), так как точки корреляционного поля а) дальше отстоят от линии регрессии, чем точки поля б).
Нетрудно видеть, что r совпадает по знаку с bух (а значит, и с bху).
Если r > 0 (bух>0, bху>0), то корреляционная связь между переменными называется прямой, если r < 0 (bух<0, bху<0) — обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой.
Формулу для r можно представить в виде:
r =,
т.е. формула для r симметрична относительно двух переменных, и переменные у и х можно менять местами. Тогда аналогично формуле: можно записать: . Найдя произведение обеих частей равенств получим: r2== bухbху или r=, т.е. коэффициент корреляции r переменных у и х есть средняя геометрическая коэффициентов регрессии, имеющая их знак.
Основные свойства коэффициента корреляции (при достаточно большом объеме выборки n):
1. Коэффициент корреляции принимает значения на отрезке
[-1,1], т.е.
-1 ≤ r ≤ 1.
В зависимости от того, насколько |r| приближается к 1, различают связь слабую, умеренную, заметную, достаточно тесную, тесную и весьма тесную, т.е. чем ближе |r| к 1, тем теснее связь.
2. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится.
3. При r корреляционная связь представляет линейную функциональную зависимость. При этом линии регрессии у пo х и х пo у совпадают и все наблюдаемые значения располагаются на обшей прямой (рис. 1.2.).
4. При r = 0 линейная корреляционная связь отсутствует. При этом групповые средние переменных совпадают с их общими средними, а линии регрессии у пo х и х пo у параллельны осям координат.
Если r = 0, то коэффициент bух=bху=0, и линии регрессии имеют вид: ух= и ху= (рис. 1.3).
Равенство r = 0 говорит лишь об отсутствии линейной корреляционной зависимости (некоррелированности переменных), но не вообще об отсутствии корреляционной, а тем более статистической, зависимости.
Пример. При исследовании корреляционной зависимости между объемом валовой продукции у (млн. руб.) и среднесуточной численностью работающих х (тыс. чел.) для ряда предприятий отрасли получено следующее уравнение регрессии х по у: ху=0,2у – 2,5. Коэффициент корреляции между этими признаками оказался равным 0,8, а средний объем валовой продукции предприятий составил 40 млн. руб.
Найти:
а) среднее значение среднесуточной численности работающих на предприятиях;
б) уравнение регрессии у по х;
в) средний объем валовой продукции на предприятиях со среднесуточной численностью работающих 4 тыс. чел.
Решение: а) Обе линии регрессии у по х и х по у пересекаются в точке (), поэтому найдем по заданному уравнению регрессии при у = = 40,
т.е. = = 5,5 (тыс. чел.).
б) Учитывая, что : r2==bухbху, вычислим коэффициент регрессии bух: bух=.
По формуле получим уравнение регрессии у по х: или .
в) ух=4 найдем по полученному уравнению регрессии у по х: (млн. руб.).
Пример. Найти коэффициент корреляции между производительностью труда у (тыс. руб.) и энерговооруженностью труда х (кВт) (в расчете на одного работающего) для 14 предприятий региона по следующим данным:
х
2,8
2,2
3,0
3,5
3,2
3,7
4,0
4,8
6,0
5,4
5,2
5,4
6,0
9,0
у
6,7
6,9
7,2
7,3
8,4
8,8
9,1
9,8
10,6
10,7
11,1
11,8
12,1
12,4
Решение. Вычислим необходимые суммы:
Используя еще один вариант формулы для расчета r, получим:
Значение r=0,898 говорит о тесной связи между переменными.