Эконометрика

⌛ 2011 год
👀 575 просмотров
📌 517 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Эконометрика», doc

Загружаем конспект в формате doc

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Эконометрика», Word формат

ЭКОНОМЕТРИКА Конспект лекций 2011 Тема 1. Предмет, метод и задачи эконометрики. Вопросы 1. Определение и основные черты предмета эконометрики 2. Задачи, критерии и принципы эконометрики 3. Возможности статистических и математических методов в эконометрических расчетах Вопрос 1. Определение и основные черты предмета эконометрика Термин «эконометрика» появляется в литературе в начале двадцатого века и означает «эконометрические измерения». Приведем некоторые используемые в литературе определения эконометрики. Эконометрия (эконометрика), наука, изучающая конкретные количественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей1. Наиболее часто используют определение эконометрики, которое предложил известный российский ученый С.А. Айвазян. Эконометрика – это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенная для того, чтобы на базе экономической теории, экономической статистики, математико-статистического инструментария придавать конкретное количественное выражение общим закономерностям, обусловленным экономической теорией взаимосвязей экономических явлений и процессов [7]. В мировой науке эконометрика занимает достойное место. Свидетельством этого является присуждение за наиболее выдающиеся разработки в этой области Нобелевских премий по экономике Рагнару Фришу и Яну Тильбергену (1969), Лоуренсу Клейну (1980), Трюгве Хаавельмо (1989), Роберту Лукасу (1995), Джеймсу Хекману и Даниелю Мак-Фаддену (2000) [8]. Типы экономических данных, используемых в эконометрических исследованиях. Пространственные данные – характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделенным сходным объектам в один и тот же момент времени. Таковы, например, данные по курсам покупки или продажи наличной валюты в конкретный день по разным обменным пунктам г. Москвы. Другим примером является, скажем, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени или период. Временные ряды отражают изменения (динамику) какой-либо переменой на промежутке времени. В качестве примеров временных рядов можно привести ежеквартальные данные по инфляции, данные по средней заработной плате, национальному доходу и денежной эмиссии за несколько и др. Вопрос 2. Задачи, критерии и принципы эконометрики В эконометрике решаются задачи описания данных, оценивания, проверки гипотез, восстановления зависимостей, классификации объектов и признаков, прогнозирования, принятия статистических решений и др. При выборе методов анализа конкретных экономических данных следует учитывать, что экономические данные обладают рядом особенностей. Многие экономические показатели неотрицательны. Значит, их надо описывать неотрицательными случайными величинами. В экономике доля нечисловых данных существенно выше, чем в технике и, соответственно больше применений для статистики объектов нечисловой природы. Количество изучаемых объектов в экономическом исследовании часто ограничено в принципе, поэтому обоснование вероятностных моделей в ряде случаев затруднено. Экономические процессы развиваются во времени, поэтому большое место в эконометрике занимают вопросы анализа и прогнозирования временных рядов, в том числе многомерных. При этом следует отметить, что временные ряды качественно отличаются от простых статистических выборок. Эти особенности состоят в следующем: • последовательные по времени уровни временных рядов являются взаимозависимыми, особенно это относится к близко расположенным наблюдениям; • в зависимости от момента наблюдения уровни во временных рядах обладают разной информативностью: информационная ценность наблюдений убывает по мере их удаления от текущего момента времени; • с увеличением количества уровней временного ряда точность статистических характеристик не будет увеличиваться пропорционально числу наблюдений, а при появлении новых закономерностей развития она может даже уменьшаться. [8]. Вопрос 3.Возможности статистических и математических методов в эконометрических расчетах Результирующая (зависимая, эндогенная) переменная Y Она характеризует результат или эффективность функционирования экономической системы. Значения ее формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации, управлению и планированию. В регрессионном анализе результирующая переменная играет роль функции, значение которой определяется значениями объясняющих переменных, выполняющих роль аргументов. По своей природе результирующая переменная всегда случайна (стохастична). Объясняющие (экзогенные, независимые) переменные X Это — переменные, которые поддаются регистрации и описывают условия функционирования реальной экономической системы. Они в значительной мере определяют значения результирующих переменных. Обычно часть из них поддается регулированию и управлению. Значение этих переменных могут задаваться вне анализируемой системы. Поэтому их называют экзогенными. Еще их называют факторными признаками. В регрессионном анализе это аргументы результирующей функции Y. По своей природе они могут быть как случайными, так и неслучайными. Любая эконометрическая модель предназначена для объяснения значений текущих эндогенных переменных (одной или нескольких) в зависимости от значений заранее определенных переменных. Переменные, выступающие в системе в роли факторов-аргументов, или объясняющих переменных называют предопределенными. Множество предопределенных переменных формируется из всех экзогенных переменных и так называемых лаговых эндогенных переменных, т. е. таких эндогенных переменных, значения которых входят в уравнения анализируемой эконометрической системы измеренными в прошлые моменты времени, а, следовательно, являются уже известными, заданными. Типы эконометрических моделей Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических систем • модели временных рядов; • регрессионные модели с одним уравнением; • системы одновременных уравнений. Модели временных рядов Модели временных рядов представляют собой модели зависимости результативного признака от времени. К ним относятся • модели кривых роста (трендовые модели), • адаптивные модели, • модели авторегрессии и скользящего среднего. С помощью таких моделей можно решать задачи прогнозирования объема продаж, спроса на продукцию, краткосрочного прогноза процентных ставок и др. Регрессионные модели с одним уравнением В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (X1, X2, X3, … Xk), где - независимые (объясняющие) переменные, или факторы; k – количество факторов. В качестве зависимой переменной может выступать практически любой показатель, характеризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции f () модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии). Примеры задач, решаемых с помощью регрессионных моделей. • Исследование зависимости заработной платы (Y) от возраста (X1), уровня образования (X2), пола (X3), стажа работы (X4) (). • Прогноз и планирование выпускаемой продукции по факторам производства (производственная функция Кобба – Дугласа означает, что объем выпуска продукции (Y), является функцией количества капитала ( K ) и количества (L) труда). • Прогноз объемов потребления продукции или услуг определенного вида (кривая Энгеля , где Y -удельная величина спроса, Х - среднедушевой доход). Системы эконометрических уравнений Сложные социально-экономические явления иногда невозможно адекватно описать с помощью только одного соотношения (уравнения). Модели с одним уравнением не отражают взаимосвязей между объясняющими переменными или их связей с другими переменными. Кроме того, некоторые переменные могут оказывать взаимные воздействия и трудно однозначно определить, какая из них является зависимой, а какая независимой переменной. Поэтому при построении эконометрической модели прибегают к системам уравнений. Для оценивания систем одновременных уравнений используются специальные методы. Эконометрические методы используются в экономических и технико-экономических исследованиях, работах по управлению (менеджменту). Каждой области экономических исследований, связанной с анализом эмпирических данных, как правило, соответствуют свои эконометрические модели. Тема 2. Парная регрессия и корреляция. Вопросы 1. Понятие о функциональной, статистической и корреляционной связях. 2. Уравнение регрессии, его смысл и назначение 3. Парная регрессия 4. Метод наименьших квадратов и условия его применения для определения параметров уравнения парной регрессии Вопрос 1. Понятие о функциональной, статистической и корреляционной связях. Рассматривая зависимости между признаками, необходимо выделить, прежде всего, две категории зависимости: 1) функциональные и 2) корреляционные. Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина начисленной заработной платы при повременной оплате труда зависит от количества отработанных часов. В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия. Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии. При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений. При изучении взаимосвязи между двумя факторами их, как правило, обозначают X= и Y= Вопрос 2. Уравнение регрессии, его смысл и назначение Регрессионный анализ занимает ведущее место в математике статистических методах эконометрики. До регрессионного анализа следует проводить корреляционный анализ, в процессе которого оценивается степень тесноты статистической связи между исследуемыми переменными. От степени тесноты связи зависит прогностическая сила регрессионной модели. Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели. В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (), где - независимые (объясняющие) переменные, или факторы. Связь между переменной Y и k независимыми факторами Х можно охарактеризовать функцией регрессии Y= f (), которая показывает, каково будет в среднем значение переменной yi, если переменные Xi примут конкретные значения. Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений. Сформулируем регрессионную задачу для случая одного факторного признака. Пусть имеется набор значений двух переменных: Y=- объясняемая переменная и X= - объясняющая переменная, каждая из которых содержит n наблюдений. Пусть между переменными X= и Y= теоретически существует некоторая линейная зависимость . Данное уравнение будем называть «истинным» уравнением регрессии. Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида или . (1.1) Уравнение вида позволяет по заданным значениям фактора находить теоретические значения результативного признака, подставляя в него фактические значения фактора . Построение линейной регрессии сводится к оценке ее параметров – и . Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров и , при которых сумма квадратов отклонений фактических значений результативного признака от теоретических минимальна: . (1.2) Т.е. из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной (рис. 1.2): Рис. 1.2. Линия регрессии с минимальной дисперсией остатков. Как известно из курса математического анализа, чтобы найти минимум функции (1.2), надо вычислить частные производные по каждому из параметров и и приравнять их к нулю. Обозначим через , тогда: . (1.3) После несложных преобразований, получим следующую систему линейных уравнений для оценки параметров и : (1.4) Решая систему уравнений (1.4), найдем искомые оценки параметров и . Можно воспользоваться следующими готовыми формулами, которые следуют непосредственно из решения системы (1.4): , , (1.5) где – ковариация признаков и , – дисперсия признака и , , , . Ковариация – числовая характеристика совместного распределения двух случайных величин, равная математическому ожиданию произведения отклонений этих случайных величин от их математических ожиданий. Дисперсия – характеристика случайной величины, определяемая как математическое ожидание квадрата отклонения случайной величины от ее математического ожидания. Математическое ожидание – сумма произведений значений случайной величины на соответствующие вероятности2. Параметр называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях. Формально – значение при . Если признак-фактор не может иметь нулевого значения, то вышеуказанная трактовка свободного члена не имеет смысла, т.е. параметр может не иметь экономического содержания. Вопрос 3. Парная регрессия Однако в действительности между X и Y наблюдается не столь жесткая связь. Отдельные наблюдения будут отклоняться от линейной зависимости в силу воздействия различных причин. Обычно зависимая переменная находится под влиянием целого ряда факторов, в том числе и не известных исследователю, а также случайных причин (возмущения и помехи); существенным источником отклонений в ряде случаев являются ошибки измерения. Отклонения от предполагаемой формы связи, естественно, могут возникнуть и в силу неправильного выбора вида самого уравнения, описывающего эту зависимость. Учитывая возможные отклонения, линейное уравнение связи двух переменных (парную регрессию) представим в виде , (2) где - постоянная величина (или свободный член уравнения), - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной , при изменении значения на единицу. Если - переменные и положительно коррелированные, если  0 – отрицательно коррелированны; - случайная переменная, или случайная составляющая, или остаток, или возмущение. Она отражает тот факт, что изменение будет неточно описываться изменением Х – присутствуют другие факторы, неучтенные в данной модели. Таким образом, в уравнении (2) значение каждого наблюдения представлено как сумма двух частей — систематической и случайной . В свою очередь систематическую часть можно представить в виде уравнения Можно сказать, что общим моментом для любой эконометрической модели является разбиение зависимой переменной на две части — объясненную и случайную. . ковариация - это статистическая мера взаимодействия двух переменных. Например, положительное значение ковариации доходности двух ценных бумаг показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону. Ковариация между двумя переменными рассчитывается следующим образом: , где - фактические значения случайных переменных x и y, . Ковариация зависит от единиц, в которых измеряются переменные . Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции. Вычисление коэффициента парной корреляции. Коэффициент парной корреляции Для двух переменных коэффициент парной корреляции определяется следующим образом: = , (1) где - оценки дисперсий величин . Дисперсия (оценка дисперсии) характеризуют степень разброса значений () вокруг своего среднего ( , соответственно), или вариабельность (изменчивость) этих переменных на множестве наблюдений. В общем случае для получения несмещенной оценки дисперсии сумму квадратов следует делить на число степеней свободы оценки (n−p), где n - объем выборки, p - число наложенных на выборку связей. В данном случае p = 1, т.к. выборка уже использовалась один раз для определения среднего X, поэтому число наложенных связей равно единице, а число степеней свободы оценки (т.е. число независимых элементов выборки) равно (n −1). Более естественно измерять степень разброса значений переменных в тех же единицах, в которых измеряется и сама переменная. Эту задачу решает показатель, называемый среднеквадратическим отклонением или стандартным отклонением, или стандартной ошибкой переменной Х (переменной Y), определяемый соотношением: Слагаемые в числителе формулы (1) выражают взаимодействие двух переменных и определяют знак (положительной или отрицательной) корреляции. Если, например, между переменными существует сильная положительная взаимосвязь (увеличение одной переменной при увеличении второй), каждое слагаемое будет положительным числом. Аналогично, если между переменными существует сильная отрицательная взаимосвязь, все слагаемые в числителе будут отрицательными числами, что в результате дает отрицательное значение корреляции. Знаменатель выражения для коэффициента корреляции просто нормирует числитель таким образом, что коэффициент корреляции оказывается легко интерпретируемым числом, не имеющим размерности, в диапазоне от -1 до 1. Числитель выражения для коэффициента корреляции, который трудно интерпретировать из-за необычных единиц измерения, называется ковариацией Х и Y. Несмотря на то, что иногда он используется как самостоятельная характеристика (например, в теории финансов для описания совместного изменения курсов акций на двух биржах), удобнее пользоваться коэффициентом корреляции. Корреляция и ковариация представляют, по сути, одну и ту же информацию, однако корреляция представляет эту информацию в более удобной форме. Следует отметить, что величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменениях признаков. Установлению причинно-следственной зависимости предшествует анализ качественной природы явлений. Но есть и еще одно обстоятельство, объясняющее формулировку выводов о возможном наличии связи по величине коэффициента корреляции. Связано это с тем, что оценка степени тесноты связи с помощью коэффициента корреляции производится, как правило, на основе более или менее ограниченной информации об изучаемом явлении. Возникает вопрос, насколько правомерно наше заключение по выборочным данным в отношении действительного наличия корреляционной связи в той генеральной совокупности, из которой была произведена выборка? Принципиально возможны случаи, когда отклонение от нуля полученной величины выборочного коэффициента корреляции оказывается целиком, обусловленным неизбежными случайными колебаниями тех выборочных данных, на основании которых он вычислен. Особенно осторожно следует подходить к истолкованию полученных коэффициентов корреляции при незначительных объемах выборочной совокупности. В этой связи и возникает необходимость оценки существенности линейного коэффициента корреляции, дающая возможность распространить выводы по результатам выборки на генеральную совокупность. В зависимости от объема выборочной совокупности предлагаются различные методы оценки существенности линейного коэффициента корреляции. Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t - критерия Стьюдента. При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле: Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы (n-2). Если tнабл > tкр, то полученное значение коэффициента корреляции признается значимым (то есть нулевая гипотеза, утверждающая равенство нулю генерального коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь. Удобным графическим средством анализа парных данных является диаграмма рассеяния, которая представляет каждое наблюдение в пространстве двух измерений, соответствующих двум факторам. Диаграмму рассеяния, на которой изображается совокупность значений двух признаков, называют еще корреляционным полем. Каждая точка этой диаграммы имеет координаты Xi и Yi. По мере того, как возрастает сила линейной связи, точки на графике будут лежать более близко к прямой линии, а величина r будет ближе к 1. Вопрос 4. Метод наименьших квадратов и условия его применения для определения параметров уравнения парной регрессии Свойства коэффициентов регрессии существенным образом зависят от свойств случайной составляющей. Для того чтобы регрессионный анализ, основанный на обычном методе наименьших квадратов, давал наилучшие из всех возможных результаты, должны выполняться следующие условия, известные как условия Гаусса – Маркова.  Первое условие. Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю. Иногда случайная составляющая будет положительной, иногда отрицательной, но она не должна иметь систематического смещения ни в одном из двух возможных направлений. Фактически если уравнение регрессии включает постоянный член, то обычно это условие выполняется автоматически, так как роль константы состоит в определении любой систематической тенденции , которую не учитывают объясняющие переменные, включенные в уравнение регрессии.  Второе условие состоит в том, что модели (2) возмущение (или зависимая переменная ) есть величина случайная, а объясняющая переменная - величина неслучайная. Если это условие выполнено, то теоретическая ковариация между независимой переменной и случайным членом равна нулю.  Третье условие предполагает отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях. Например, если случайная составляющая велика и положительна в одном наблюдении, это не должно обусловливать систематическую тенденцию к тому, что она будет большой и положительной в следующем наблюдении. Случайные составляющие должны быть независимы друг от друга. В силу того, что , данное условие можно записать следующим образом: Возмущения не коррелированны (условие независимости случайных составляющих в различных наблюдениях). Это условие означает, что отклонения регрессии (а значит, и сама зависимая переменная) не коррелируют. Условие некоррелируемости ограничительно, например, в случае временного ряда . Тогда третье условие означает отсутствие автокорреляции ряда .  Четвертое условие означает, что дисперсия случайной составляющей должна быть постоянна для всех наблюдений. Иногда случайная составляющая будет больше, иногда меньше, однако не должно быть априорной причины для того, чтобы она порождала большую ошибку в одних наблюдениях, чем в других. Эта постоянная дисперсия обычно обозначается , или часто в более краткой форме , а условие записывается следующим образом: Величина , конечно, неизвестна. Одна из задач регрессионного анализа состоит в оценке стандартного отклонения случайной составляющей. Это условие гомоскедастичности, или равноизменчивости случайной составляющей (возмущения).  Предположение о нормальности Наряду с условиями Гаусса— Маркова обычно также предполагается нормальность распределения случайного члена. Дело в том, что если случайный член нормально распределен, то так же будут распределены и коэффициенты регрессии. Свойства оценок МНК. В тех случаях, когда предпосылки выполняются, оценки, полученные по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. Для практических целей важна не только несмещенность, но и эффективность оценок. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Поэтому несмещенность оценки должна дополняться минимальной дисперсией. Степень достоверности доверительных интервалов параметров регрессии обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Оценка параметров регрессионного уравнения Дня оценки параметров регрессионного уравнения наиболее часто используют метод наименьших квадратов (МНК). Метод наименьших квадратов дает оценки, имеющие наименьшую дисперсию в классе всех линейных оценок, если выполняются предпосылки нормальной линейной регрессионной модели. МНК минимизирует сумму квадратов отклонения наблюдаемых значений от модельных значений . Согласно принципу метода наименьших квадратов, оценки и находятся путем минимизации суммы квадратов по всем возможным значениям и при заданных (наблюдаемых) значениях. В результате применения МНК получаем формулы для вычисления параметров модели парной регрессии. (3) Такое решение может существовать только при выполнении условия что равносильно отличию от нуля определителя системы нормальных уравнений. Действительно, этот определитель равен Последнее условие называется условием идентифицируемости модели наблюдений , и означает, что не все значения совпадают между собой. При нарушении этого условия все точки , лежат на одной вертикальной прямой Оценки и называют оценками наименьших квадратов. Обратим внимание на полученное выражение для параметра . В это выражение входят суммы квадратов, участвовавшие ранее в определении выборочной дисперсии и выборочной ковариации так что, в этих терминах параметр можно получить следующим образом: = = = = Оценка качества уравнения регрессии Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков. После построения уравнения регрессии мы можем разбить значение Y, в каждом наблюдении на две составляющих - и . Остаток представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем: (). На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от теоретических (). Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения. При анализе качества модели регрессии используется основное положение дисперсионного анализа, согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения может быть разложена на две составляющие — объясненную и необъясненную уравнением регрессии дисперсии: (4) где - значения y, вычисленные по модели . Разделив правую и левую часть (4) на , получим . Коэффициент детерминации определяется следующим образом: Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе к 1, тем выше качество модели. Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции) R Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной модели он равен коэффициенту линейной корреляции . Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным. Также для оценки качества регрессионных моделей целесообразно использовать среднюю ошибку аппроксимации: Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели. После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров. Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: . Альтернативная ей гипотеза о значимости уравнения — гипотеза о неравенстве нулю параметров регрессии. Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с 1= k и 2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. Для модели парной регрессии: В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины () называется стандартной ошибкой: Для модели парной регрессии Прогнозирование с применением уравнения регрессии Регрессионные модели могут быть использованы для прогнозирования возможных ожидаемых значений зависимой переменной. Прогнозируемое значение переменной получается при подстановке в уравнение регрессии ожидаемой величины фактора . Данный прогноз называется точечным. Значение независимой переменной не должно значительно отличаться от входящих в исследуемую выборку, по которой вычислено уравнение регрессии. Вероятность реализации точечного прогноза теоретически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью. доверительные интервалы, зависят от следующих параметров: • стандартной ошибки , • удаления от своего среднего значения , • количества наблюдений n • и уровня значимости прогноза α. В частности, для прогноза будущие значения с вероятностью (1 - α) попадут в интервал Расположение границ доверительного интервала показывает, что прогноз значений зависимой переменной по уравнению регрессии хорош только в случае, если значение фактора Х не выходит за пределы выборки. Иными словами, экстраполяция по уравнению регрессии может привести к значительным погрешностям. Тема 3. Множественная регрессия. Вопросы 1. Понятие о множественной регрессии. 2. Классическая линейная модель множественной регрессии. 3. Определение параметров уравнения множественной регрессии и метод наименьших квадратов. 4. Множественный коэффициент корреляции и множественный коэффициент детерминации. 5. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками. 6. Мультиколлениарность. Методы устранения мультиколлениарности. Вопрос 1. Понятие о множественной регрессии Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Если же этим влиянием пренебречь нельзя, то в этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии , где – зависимая переменная (результативный признак), – независимые, или объясняющие, переменные (признаки-факторы). Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Функция , описывающая зависимость показателя от параметров, называется уравнением (функцией) регрессии. Уравнение регрессии показывает ожидаемое значение зависимой переменной при определенных значениях зависимых переменных . В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии). В зависимости от вида функции модели делятся на линейные и нелинейные. Модель множественной линейной регрессии имеет вид: y i = 0 + 1x i 1 +2x i 2 +…+ k x i k + i (2.1) - количество наблюдений. коэффициент регрессии j показывает, на какую величину в среднем изменится результативный признак , если переменную xj увеличить на единицу измерения, т. е. j является нормативным коэффициентом. Коэффициент может быть отрицательным. Это означает, что область существования показателя не включает нулевых значений параметров. Если же а0>0, то область существования показателя включает нулевые значения параметров, а сам коэффициент характеризует среднее значение показателя при отсутствии воздействий параметров. Вопрос 2. Классическая линейная модель множественной регрессии. Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям. 1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. 2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором факторов, то для нее рассчитывается показатель детерминации , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии факторов. Влияние других, не учтенных в модели факторов, оценивается как с соответствующей остаточной дисперсией . При дополнительном включении в регрессию фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться: и . Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента. Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии. Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. Анализ уравнения (2.1) и методика определения параметров становятся более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи: (2.2) . Где – вектор зависимой переменной размерности п  1, представляющий собой п наблюдений значений . - матрица п наблюдений независимых переменных , размерность матрицы равна п  (k+1) . Дополнительный фактор , состоящий из единиц, вводится для вычисления свободного члена. В качестве исходных данных могут быть временные ряды или пространственная выборка. - количество факторов, включенных в модель. a — подлежащий оцениванию вектор неизвестных параметров размерности (k+1)  1; — вектор случайных отклонений (возмущений) размерности п  1. отражает тот факт, что изменение будет неточно описываться изменением объясняющих переменных , так как существуют и другие факторы, неучтенные в данной модели. Таким образом, Y = , X = , , a = . Вопрос 3. Определение параметров уравнения множественной регрессии и метод наименьших квадратов. Уравнение (2.2) содержит значения неизвестных параметров 0,1,2,… ,k . Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки (а именно такие регрессии и применяются на практике), имеет вид , (2.3) где A — вектор оценок параметров; е — вектор «оцененных» отклонений регрессии, остатки регрессии е = Y - ХА; —оценка значений Y, равная ХА. Построение уравнения регрессии осуществляется, как правило, методом наименьших квадратов (МНК), суть которого состоит в минимизации суммы квадратов отклонений фактических значений результатного признака от его расчетных значений, т.е.: . Формулу для вычисления параметров регрессионного уравнения по методу наименьших квадратов приведем без вывода (2.4). Для того чтобы регрессионный анализ, основанный на обычном методе наименьших квадратов, давал наилучшие из всех возможных результаты, должны выполняться следующие условия, известные как условия Гаусса – Маркова. Первое условие. Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю. Иногда случайная составляющая будет положительной, иногда отрицательной, но она не должна иметь систематического смещения ни в одном из двух возможных направлений. Фактически если уравнение регрессии включает постоянный член, то обычно это условие выполняется автоматически, так как роль константы состоит в определении любой систематической тенденции , которую не учитывают объясняющие переменные, включенные в уравнение регрессии. Второе условие означает, что дисперсия случайной составляющей должна быть постоянна для всех наблюдений. Иногда случайная составляющая будет больше, иногда меньше, однако не должно быть априорной причины для того, чтобы она порождала большую ошибку в одних наблюдениях, чем в других. Эта постоянная дисперсия обычно обозначается , или часто в более краткой форме , а условие записывается следующим образом: . Выполнимость данного условия называется гомоскедастичностью (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностью, (непостоянством дисперсии отклонений). Третье условие предполагает отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях. Например, если случайная составляющая велика и положительна в одном наблюдении, это не должно обусловливать систематическую тенденцию к тому, что она будет большой и положительной в следующем наблюдении. Случайные составляющие должны быть независимы друг от друга. В силу того, что , данное условие можно записать следующим образом: Возмущения не коррелированны (условие независимости случайных составляющих в различных наблюдениях). Это условие означает, что отклонения регрессии (а значит, и сама зависимая переменная) не коррелируют. Условие некоррелируемости ограничительно, например, в случае временного ряда . Тогда третье условие означает отсутствие автокорреляции ряда . Четвертое условие состоит в том, что в модели (2.1) возмущение (или зависимая переменная ) есть величина случайная, а объясняющая переменная - величина неслучайная. Если это условие выполнено, то теоретическая ковариация между независимой переменной и случайным членом равна нулю. Наряду с условиями Гаусса— Маркова обычно также предполагается нормальность распределения случайного члена. В тех случаях, когда выполняются предпосылки, оценки, полученные по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности. Вопрос 4. Множественный коэффициент корреляции и множественный коэффициент детерминации. Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков - . Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределенные случайные величины. Качество модели регрессии оценивается по следующим направлениям: 1) проверка качества всего уравнения регрессии; 2) проверка значимости всего уравнения регрессии; 3) проверка статистической значимости коэффициентов уравнения регрессии; 4) проверка выполнения предпосылок МНК. При анализе качества модели регрессии, в первую очередь, используется коэффициент детерминации, который определяется следующим образом: , (2.5) где - среднее значение зависимой переменной, - предсказанное (расчетное) значение зависимой переменной. Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе к 1, тем выше качество модели. Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции) R R = = (2.6) Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. Важным моментом является проверка значимости построенного уравнения в целом и отдельных параметров. Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. Для проверки значимости модели регрессии используется F-критерий Фишера. Если расчетное значение с 1= k и 2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. (2.7) В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины () называется стандартной ошибкой: (2.8) значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена): , (2.9) где Saj — это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj. Величина Saj представляет собой квадратный корень из произведения несмещенной оценки дисперсии и j -го диагонального элемента матрицы, обратной матрице системы нормальных уравнений. где - диагональный элемент матрицы . Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится). Проверка выполнения предпосылок МНК. Вопрос 5. Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками. При оценке параметров уравнения регрессии применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки относительно случайной составляющей . В модели случайная составляющая представляет собой ненаблюдаемую величину. После того как произведена оценка параметров модели, рассчитывая разности фактических и теоретических значений результативного признака , можно определить оценки случайной составляющей . Поскольку они не являются реальными случайными остатками, их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения, т.е. . При изменении спецификации модели, добавлении в нее новых наблюдений выборочные оценки остатков могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений , т.е. остаточных величин. При использовании критериев Фишера и Стьюдента делаются предположения относительно поведения остатков – остатки представляют собой независимые случайные величины и их среднее значение равно 0; они имеют одинаковую (постоянную) дисперсию и подчиняются нормальному распределению. Статистические проверки параметров регрессии, показателей корреляции основаны на непроверяемых предпосылках распределения случайной составляющей . Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок (случайных остатков) тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Большой практический интерес представляют те результаты регрессии, для которых доверительный интервал ожидаемого значения параметра регрессии имеет предел значений вероятности, равный единице. Иными словами, вероятность получения оценки на заданном расстоянии от истинного значения параметра близка к единице. Указанные критерии оценок (несмещенность, состоятельность и эффективность) обязательно учитываются при разных способах оценивания. Метод наименьших квадратов строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии . Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии. Исследования остатков предполагают проверку наличия следующих пяти предпосылок МНК: 1) случайный характер остатков; 2) нулевая средняя величина остатков, не зависящая от ; 3) гомоскедастичность – дисперсия каждого отклонения , одинакова для всех значений ; 4) отсутствие автокорреляции остатков – значения остатков распределены независимо друг от друга; 5) остатки подчиняются нормальному распределению. Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель. Прежде всего, проверяется случайный характер остатков – первая предпосылка МНК. С этой целью стоится график зависимости остатков от теоретических значений результативного признака (рис. 2.1). Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения . Рассмотрим выполнение предпосылки гомоскедастичности, или равноизменчивости случайной составляющей (возмущения). Невыполнение этой предпосылки, т.е. нарушение условия гомоскедастичности возмущений означает, что дисперсия возмущения зависит от значений факторов. Такие регрессионные модели называются моделями с гетероскедастичностью возмущений. Обнаружение гетероскедастичности Для обнаружения гетероскедастичности обычно используют тесты, в которых делаются различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда - Квандта, тест Глейзера, двусторонний критерий Фишера и другие [2]. При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда — Квандта. Данный тест используется для проверки такого типа гетероскедастичности, когда дисперсия остатков возрастает пропорционально квадрату фактора. При этом делается предположение, что, случайная составляющая распределена нормально. Чтобы оценить нарушение гомоскедастичности по тесту Голдфельда - Квандта необходимо выполнить следующие шаги. 1. Упорядочение п наблюдений по мере возрастания переменной х. 2. Исключение средних наблюдений ( должно быть примерно равно четверти общего количества наблюдений). 3. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора ) и определение по каждой из групп уравнений регрессии. 4. Определение остаточной суммы квадратов для первой регрессии и второй регрессии . 5. Вычисление отношений (или ). В числителе должна быть большая сумма квадратов. Полученное отношение имеет F распределение со степенями свободы k1=n1-k и k2=n-n1-k, (k– число оцениваемых параметров в уравнении регрессии). Если , то гетероскедастичность имеет место. Чем больше величина F превышает табличное значение F -критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин. Оценка влияния отдельных факторов на зависимую переменную на основе модели (коэффициенты эластичности,  - коэффициенты). Важную роль при оценке влияния факторов играют коэффициенты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бета-коэффициенты (j). Эластичность Y по отношению к Х(j) определяется как процентное изменение Y, отнесенное к соответствующему процентному изменению Х. В общем случае эластичности не постоянны, они различаются, если измерены для различных точек на линии регрессии. По умолчанию стандартные программы, оценивающие эластичность, вычисляют ее в точках средних значений: Эластичность ненормирована и может изменяться от - до + . Важно, что она безразмерна, так что интерпретация эластичности =2.0 означает, что если изменится на 1%, то это приведет к изменению на 2%. Если =-0.5, то это означает, что увеличение на 1% приведет к уменьшению на 0.5%. Высокий уровень эластичности означает сильное влияние независимой переменной на объясняемую переменную. где Sxj — среднеквадратическое отклонение фактора j где . Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов. Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных. Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную. Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта - коэффициентов  (j): где — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной. Прогнозирование с помощью модели множественной регрессии. Уравнение регрессии применяют для расчета значений показателя в заданном диапазоне изменения параметров. Оно ограниченно пригодно для расчета вне этого диапазона, т.е. его можно применять для решения задач интерполяции и в ограниченной степени для экстраполяции. Прогноз, полученный подстановкой в уравнение регрессии ожидаемого значения параметра, является точечным. Вероятность реализации такого прогноза ничтожна мала. Целесообразно определить доверительный интервал прогноза. Для того чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок: рассеивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности, величиной . Ошибки второго рода обусловлены фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными. Для линейной модели регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее U):. (2.10). где . Вопрос 6. Мультиколлениарность. Методы устранения мультиколлениарности. Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т. е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Под мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных, которая приводит к линейной зависимости нормальных уравнений. Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. Существует несколько способов для определения наличия или отсутствия мультиколлинеарности. Один из подходов заключается в анализе матрицы коэффициентов парной корреляции. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,8. Другой подход состоит в исследовании матрицы Х'Х. Если определитель матрицы Х'Х близок к нулю, то это свидетельствует о наличии мультиколлинеарности. Для устранения или уменьшения мультиколлинеарности используется ряд методов. Наиболее распространенные в таких случаях следующие приемы: исключение одного из двух сильно связанных факторов, переход от первоначальных факторов к их главным компонентам, число которых быть может меньше, затем возвращение к первоначальным факторам. Самый простой из них (но не всегда самый эффективный) состоит в том, что из двух объясняющих переменных, имеющих высокий коэффициент корреляции (больше 0,8), одну переменную исключают из рассмотрения. При этом какую переменную оставить, а какую удалить из анализа, решают в первую очередь на основании экономических соображений. Если с экономической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной. Еще одним из возможных методов устранения или уменьшения мультиколлинеарности является использование стратегии шагового отбора, реализованную в ряде алгоритмов пошаговой регрессии. Наиболее широкое применение получили следующие схемы построения уравнения множественной регрессии: метод включения факторов и метод исключения – отсев факторов из полного его набора. В соответствии с первой схемой признак включается в уравнение в том случае, если его включение существенно увеличивает значение множественного коэффициента корреляции, что позволяет последовательно отбирать факторы, оказывающие существенное влияние на результирующий признак даже в условиях мультиколлинеарности системы признаков, отобранных в качестве аргументов из содержательных соображений. При этом первым в уравнение включается фактор, наиболее тесно коррелирующий с Y, вторым в уравнение включается тот фактор, который в паре с первым из отобранных дает максимальное значение множественного коэффициента корреляции, и т.д. Существенно, что на каждом шаге получают новое значение множественного коэффициента (большее, чем на предыдущем шаге); тем самым определяется вклад каждого отобранного фактора в объясненную дисперсию Y. Вторая схема пошаговой регрессии основана на последовательном исключении факторов с помощью t -критерия. Она заключается в том, что после построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьший коэффициент t . После этого получают новое уравнение множественной регрессии и снова производят оценку значимости всех оставшихся коэффициентов регрессии. Если среди них опять окажутся незначимые, то опять исключают фактор с наименьшим значением t -критерия. Процесс исключения факторов останавливается на том шаге, при котором все регрессионные коэффициенты значимы. Ни одна их этих процедур не гарантирует получения оптимального набора переменных. Однако при практическом применении они позволяют получить достаточно хорошие наборы существенно влияющих факторов. При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6–7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а -критерий меньше табличного значения. Особым случаем мультиколлинеарности при использовании временных выборок является наличие в составе переменных линейных или нелинейных трендов. В этом случае рекомендуется сначала выделить и исключить тренды, а затем определить параметры регрессии по остаткам. Игнорирование наличия трендов в зависимой и независимой переменных ведет к завышению степени влияния независимых переменных на результирующий признак, что получило название ложной корреляции. Большим препятствием к применению регрессии является ограниченность исходной информации, при этом наряду с указанными выше затрудняющими обстоятельствами (мультиколлинеарность, зависимость остатков, небольшой объем выборки и т. п.) ценность информации может снижаться за счет ее «засоренности», т. е. проявления новых обстоятельств, которые ранее не были учтены. Резко отклоняющиеся наблюдения могут быть результатом действия большого числа сравнительно малых случайных факторов, которые в достаточно редких случаях приводят к большим отклонениям, либо это действительно случайные один или несколько выбросов, которые можно исключить как аномальные. Однако при наличии не менее трех аномальных отклонений на несколько десятков наблюдений приписывают это наличию одного или нескольких неучтенных факторов, которые проявляются только для аномальных наблюдений. Наиболее распространенные в таких случаях следующие приемы: исключение одного из двух сильно связанных факторов, переход от первоначальных факторов к их главным компонентам, число которых быть может меньше, затем возвращение к первоначальным факторам. Тема 4. Нелинейная регрессия. Вопросы: 1. Виды нелинейных зависимостей. 2. Подходы к линеаризации регрессионных моделей. 3. Производственные функции и их анализ. Вопрос 1. Виды нелинейных зависимостей. При рассмотрении зависимости экономических показателей на основе реальных статистических данных с использованием аппарата теории вероятности и математической статистики можно сделать выводы, что линейные зависимости встречаются не так часто. Линейные зависимости рассматриваются лишь как частный случай для удобства и наглядности рассмотрения протекаемого экономического процесса. Чаще встречаются модели которые отражают экономические процессы в виде нелинейной зависимости. Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций. Различают два класса нелинейных регрессий: • регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам: • регрессии, нелинейные по оцениваемым параметрам. Нелинейные регрессии по включаемым в нее объясняющим переменным, но линейные по оцениваемым параметрам Данный класс нелинейных регрессий включает уравнения, в которых зависимая переменная линейно связана с параметрами. Примером могут служить: полиномы разных степеней (полином k-й степени) и равносторонняя гипербола . При оценке параметров регрессий нелинейных по объясняющим переменным используется подход, именуемый «замена переменных». Суть его состоит в замене «нелинейных» объясняющих переменных новыми «линейными» переменными и сведение нелинейной регрессии к линейной регрессии. К новой «преобразованной» регрессии может быть применен обычный метод наименьших квадратов (МНК). Полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Среди нелинейной полиноминальной регрессии чаще всего используется парабола второй степени; в отдельных случаях — полином третьего порядка. Ограничение в использовании полиномов более высоких степеней связаны с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и, соответственно, менее однородна совокупность по результативному признаку. Равносторонняя гипербола, для оценки параметров которой используется тот же подход «замены переменных» (1/x заменяют на переменную z) хорошо известна в эконометрике. Она может быть использована, например, для характеристики связи удельных расходов сырья, материалов и топлива с объемом выпускаемой продукции. Также примером использования равносторонней гиперболы являются кривые Филлипса и Энгеля.. Регрессии нелинейные по оцениваемым параметрам К данному классу регрессий относятся уравнения, в которых зависимая переменная нелинейно связана с параметрами. Примером таких нелинейных регрессий являются функции: • степенная - ; • показательная - ; • экспоненциальная - Вопрос 2. Подходы к линеаризации регрессионных моделей. Если нелинейная модель внутренне линейна, то она с помощью соответствующих преобразований может быть приведена к линейному виду (например, логарифмированием и заменой переменных). Если же нелинейная модель внутренне нелинейна, то она не может быть сведена к линейной функции и для оценки её параметров используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Примером нелинейной по параметрам регрессии внутренне линейной является степенная функция, которая широко используется в эконометрических исследованиях при изучении спроса от цен: , где у — спрашиваемое количество; х — цена; Данная модель нелинейна относительно оцениваемых параметров, т. к. включает параметры а и b неаддитивно. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию е приводит его к линейному виду . Заменив переменные и параметры, получим линейную регрессию, оценки параметров которой а и b могут быть найдены МНК. Широкое использование степенной функции связано это с тем, что параметр b в ней имеет четкое экономическое истолкование, т. е. он является коэффициентом эластичности. Это значит, что величина коэффициента b показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Коэффициент эластичности можно определять и при наличии других форм связи, но только для степенной функции он представляет собой постоянную величину, равную параметру b. Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных, а дальнейшая оценка параметров производится с помощью метода наименьших квадратов. Рассмотрим некоторые функции. Парабола второй степени приводится к линейному виду с помощью замены: . В результате приходим к двухфакторному уравнению , оценка параметров которого при помощи МНК, как будет показано в параграфе 2.2 приводит к системе следующих нормальных уравнений: А после обратной замены переменных получим (1.17) Парабола второй степени обычно применяется в случаях, когда для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. Равносторонняя гипербола может быть использована для характеристики связи удельных расходов сырья, материалов, топлива от объема выпускаемой продукции, времени обращения товаров от величины товарооборота, процента прироста заработной платы от уровня безработицы (например, кривая А.В. Филлипса), расходов на непродовольственные товары от доходов или общей суммы расходов (например, кривые Э. Энгеля) и в других случаях. Гипербола приводится к линейному уравнению простой заменой: . Система линейных уравнений при применении МНК будет выглядеть следующим образом: (1.18) Аналогичным образом приводятся к линейному виду зависимости , и другие. Несколько иначе обстоит дело с регрессиями нелинейными по оцениваемым параметрам, которые делятся на два типа: нелинейные модели внутренне линейные (приводятся к линейному виду с помощью соответствующих преобразований, например, логарифмированием) и нелинейные модели внутренне нелинейные (к линейному виду не приводятся). К внутренне линейным моделям относятся, например, степенная функция – , показательная – , экспоненциальная – , логистическая – , обратная – . К внутренне нелинейным моделям можно, например, отнести следующие модели: , . Среди нелинейных моделей наиболее часто используется степенная функция , которая приводится к линейному виду логарифмированием: ; ; , где . Т.е. МНК мы применяем для преобразованных данных: а затем потенцированием находим искомое уравнение. Широкое использование степенной функции связано с тем, что параметр в ней имеет четкое экономическое истолкование – он является коэффициентом эластичности. (Коэффициент эластичности показывает, на сколько процентов измениться в среднем результат, если фактор изменится на 1%.) Формула для расчета коэффициента эластичности имеет вид: . (1.19) Так как для остальных функций коэффициент эластичности не является постоянной величиной, а зависит от соответствующего значения фактора , то обычно рассчитывается средний коэффициент эластичности: . (1.20) Приведем формулы для расчета средних коэффициентов эластичности для наиболее часто используемых типов уравнений регрессии: Таблица 1.5 Вид функции, Средний коэффициент эластичности, 1 3 Возможны случаи, когда расчет коэффициента эластичности не имеет смысла. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения в процентах. Уравнение нелинейной регрессии, так же, как и в случае линейной зависимости, дополняется показателем тесноты связи. В данном случае это индекс корреляции: , (1.21) где – общая дисперсия результативного признака , – остаточная дисперсия. Величина данного показателя находится в пределах: . Чем ближе значение индекса корреляции к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии. Квадрат индекса корреляции носит название индекса детерминации и характеризует долю дисперсии результативного признака , объясняемую регрессией, в общей дисперсии результативного признака: , (1.22) т.е. имеет тот же смысл, что и в линейной регрессии; . Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина меньше . А близость этих показателей указывает на то, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Индекс детерминации используется для проверки существенности в целом уравнения регрессии по -критерию Фишера: , (1.23) где – индекс детерминации, – число наблюдений, – число параметров при переменной . Фактическое значение -критерия (1.23) сравнивается с табличным при уровне значимости и числе степеней свободы (для остаточной суммы квадратов) и (для факторной суммы квадратов). О качестве нелинейного уравнения регрессии можно также судить и по средней ошибке аппроксимации, которая, так же как и в линейном случае. Вопрос 3. Производственные функции и их анализ. Рассмотрение понятия «производственная функция» начнем с наиболее простого случая, когда производство обусловлено только одним фактором. В этом случае производственная функция – это функция, независимая переменная которой принимает значения используемого ресурса (фактора производства), а зависимая переменная – значения объемов выпускаемой продукции y=f(x). В этой формуле y есть функция одной переменной x. В связи с этим производственная функция (ПФ) называется одноресурсной или однофакторной. Ее область определения – множество неотрицательных действительных чисел. Символ f является характеристикой производственной системы, преобразующей ресурс в выпуск. В микроэкономической теории принято считать, что y – максимально возможный объем выпуска продукции, если ресурс затрачивается или используется в количестве x единиц. В макроэкономике такое понимание не совсем корректно: возможно при другом распределении ресурсов между структурными единицами экономики выпуск мог бы быть и большим. В этом случае ПФ – статистически устойчивая связь между затратами ресурса и выпуском. Более правильной является символика y=f(x, а), где а – вектор параметров ПФ. В качестве простого примера возьмем однофакторную производственную функцию, характеризующую производство фермером какого-либо сельскохозяйственного продукта. Пусть все факторы производства, такие как величина земельных угодий, наличие у фермера сельскохозяйственной техники, посевного материала, количество труда, вложенного в производство продукта, остаются из года в год постоянными величинами. Меняется только один фактор – количество применяемых удобрений. В зависимости от этого изменяется величина получаемого продукта. Вначале, с ростом переменного фактора, она увеличивается достаточно быстро, затем рост общего продукта замедляется, а начиная с определенных объемов применяемых удобрений, величина получаемого продукта начинает убывать. Дальнейшее увеличение переменного фактора не дает увеличения продукта. ПФ могут иметь разные области использования. Принцип "затраты-выпуск" может быть реализован как на микро-, так и на макроэкономическом уровне. Сначала остановимся на микроэкономическом уровне. ПФ у=axb, рассмотренная выше, может быть использована для описания взаимосвязи между величиной затрачиваемого или используемого ресурса х в течении года на отдельном предприятии (фирме) и годовым выпуском продукции у этого предприятия (фирмы). В роли производственной системы здесь выступает отдельное предприятие (фирма) – имеем микроэкономическую ПФ (МИПФ). На микроэкономическом уровне в роли производственной системы может выступать также отрасль, межотраслевой производственный комплекс. МИПФ строятся и используются в основном для решения задач анализа и планирования, а также задач прогнозирования. ПФ может быть использована для описания взаимосвязи между годовыми затратами труда в масштабе региона или страны в целом и годовым конечным выпуском продукции (или доходом) этого региона или страны в целом. Здесь в роли производственной системы выступает регион или страна в целом – имеем макроэкономический уровень и макроэкономическую ПФ (МАПФ). МАПФ строятся и активно используются для решения всех трех типов задач (анализа, планирования и прогнозирования). Точное толкование понятий затрачиваемого или используемого ресурса и выпускаемой продукции, а также выбор единиц их измерения зависят от характера и масштаба производственной системы, особенностей решаемых задач, наличия исходных данных. На микроэкономическом уровне затраты и выпуск могут измеряться как в натуральных, так и в стоимостных единицах (показателях). Годовые затраты труда могут быть измерены в человеко-часах или в рублях выплаченной заработной платы; выпуск продукции может быть представлен в штуках или в других натуральных единицах или в виде своей стоимости. На макроэкономическом уровне затраты и выпуск измеряются, как правило, в стоимостных показателях и представляют собой стоимостные агрегаты, то есть суммарные величины произведений объемов затрачиваемых ресурсов и выпускаемых продуктов на их цены. Перейдем теперь к рассмотрению производственных функций нескольких переменных. Производственная функция нескольких переменных – это функция, независимые переменные которой принимают значения объемов затрачиваемых или используемых ресурсов (число переменных n равно числу ресурсов), а значение функции имеет смысл величин объемов выпуска: y=f(x)=f(x1,…,хn). (2) В формуле (2) у (у0) – скалярная, а х – векторная величина, x1,…,хn --координаты вектора х, то есть f(x1,…,хn) есть числовая функция нескольких переменных x1,…,хn. В связи с этим ПФ f(x1,…,хn) называют многоресурсной или многофакторной. Более правильной является такая символика f(x1,…,хn,а), где а – вектор параметров ПФ. По экономическому смыслу все переменные этой функции неотрицательны, следовательно, областью определения многофакторной ПФ является множество n-мерных векторов х, все координаты x1,…,хn которых неотрицательные числа. Для отдельного предприятия (фирмы), выпускающего однородный продукт, ПФ f(x1,…,хn) может связывать объем выпуска с затратами рабочего времени по различным видам трудовой деятельности, различных видов сырья, комплектующих изделий, энергии, основного капитала. ПФ такого типа характеризуют действующую технологию предприятия (фирмы). При построении ПФ для региона или страны в целом в качестве величины годового выпуска Y чаще берут совокупный продукт (доход) региона или страны, исчисляемый обычно в неизменных, а не в текущих ценах, в качестве ресурсов рассматривают основной капитал (х1(=К) – объем используемого в течение года основного капитала) и живой труд (х2(=L) – количество единиц затрачиваемого в течение года живого труда), исчисляемые обычно в стоимостном выражении. Таким образом, строят двухфакторную ПФ Y=f(K,L). От двухфакторных ПФ переходят к трехфакторным. Кроме того, если ПФ строится по данным временных рядов, то в качестве особого фактора роста производства может быть включен технический прогресс. ПФ y=f(x1,x2) называется статической, если ее параметры и ее характеристика f не зависят от времени t, хотя объемы ресурсов и объем выпуска могут зависеть от времени t, то есть могут иметь представление в виде временных рядов: x1(0), x1(1),…, x1(Т); x2(0), x2(1),…, x2(Т); y(0), y(1),…,y(T); y(t)=f(x1(t), x2(t)). Здесь t – номер года, t=0,1,…,Т; t= 0 – базовый год временного промежутка, охватывающего годы 1,2,…,Т. ПФКД активно применяется для решения разнообразных теоретических и прикладных задач благодаря своей структурной простоте. ПФКД принадлежит к классу, так называемых, мультипликативных ПФ (МПФ). В приложениях ПФКД х1=К равно объему используемого основного капитала (объему используемых основных фондов – в отечественной терминологии), - затратам живого труда, тогда ПФКД приобретает вид, часто используемый в литературе: Y=. Для производства конкретного продукта требуется сочетание разнообразных факторов. Несмотря на это, различные производственные функции обладают рядом общих свойств. Для определенности ограничимся производственными функциями двух переменных . Прежде всего необходимо отметить, что такая производственная функция определена в неотрицательном ортанте двумерной плоскости, то есть при . ПФ удовлетворяет следующему ряду свойств: 1) без ресурсов нет выпуска, т.е. f(0,0,a)=0; 2) при отсутствии хотя бы одного из ресурсов нет выпуска, т.е. ; 3) с ростом затрат хотя бы одного ресурса объем выпуска растет; 4) с ростом затрат одного ресурса при неизменном количестве другого ресурса объем выпуска растет, т.е. если x>0, то ; 5) с ростом затрат одного ресурса при неизменном количестве другого ресурса величина прироста выпуска на каждую дополнительную единицу i-го ресурса не растет (закон убывающей эффективности), т.е. если то ; 6) при росте одного ресурса предельная эффективность другого ресурса возрастает, т.е. если x>0, то ; 7) ПФ является однородной функцией, т.е. ; при р>1 имеем рост эффективности производства от роста масштаба производства; при р<1 имеем падение эффективности производства от роста масштаба производства; при р=1 имеем постоянную эффективность производства при росте его масштаба. Подобно линии уровня целевой функции оптимизационной задачи, для ПФ также имеет место аналогичное понятие. Линия уровня ПФ – это множество точек, на котором ПФ принимает постоянное значение. Иногда линии уровня называют изоквантами ПФ. Возрастание одного фактора и уменьшение другого могут происходить таким образом, что общий объем производства остается на прежнем уровне. Изокванты как раз и определяют все возможные комбинации факторов производства, необходимых для достижения заданного уровня продукции. Производственные функции позволяют количественно проанализировать важнейшие экономические зависимости в сфере производства. Они дают возможность оценить среднюю и предельную эффективность различных ресурсов производства, эластичность выпуска по различным ресурсам, предельные нормы замещения ресурсов, эффект от масштаба производства и многое другое. Тема 5. Регрессионные модели с переменной структурой (фиктивные переменные). Вопросы: 1. Понятие регрессионных моделей с неоднородными данными. 2. Введение в регрессионную модель фиктивных переменных. 3. Множественные совокупности фиктивных переменных. 4. Фиктивные переменные для коэффициентов наклона. Вопрос 1. Понятие регрессионных моделей с неоднородными данными. Термин “фиктивные переменные” используется как противоположность “значащим” переменным, показывающим уровень количественного показателя, принимающего значения из непрерывного интервала. Как правило, фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В литературе можно встретить термины «структурные переменные» или «искусственные переменные» Например, в результате опроса группы людей 0 может означать, что опрашиваемый — мужчина, а 1 — женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд. Вопрос 2. Введение в регрессионную модель фиктивных переменных. До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для совокупности обследуемых уравнение регрессии имеет вид: , где – количество потребляемого кофе; – цена. Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: и женского пола: . Различия в потреблении кофе проявятся в различии средних и . Вместе с тем сила влияния на может быть одинаковой, т.е. . В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения и и, вводя фиктивные переменные, можно прийти к следующему выражению: , где и – фиктивные переменные, принимающие значения: В общем уравнении регрессии зависимая переменная рассматривается как функция не только цены но и пола . Переменная рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом когда , то , и наоборот. Для лиц мужского пола, когда и , объединенное уравнение регрессии составит: , а для лиц женского пола, когда и : . Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии: . Параметр является общим для всей совокупности лиц, как для мужчин, так и для женщин. Однако при введении двух фиктивных переменных и в модель применение МНК для оценивания параметров и приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т.е. уравнение примет вид . Предполагая при параметре независимую переменную, равную 1, имеем следующую матрицу исходных данных: . В рассматриваемой матрице существует линейная зависимость между первым, вторым и третьим столбцами: первый равен сумме второго и третьего столбцов. Поэтому матрица исходных факторов вырождена. Выходом из создавшегося затруднения может явиться переход к уравнениям или , т.е. каждое уравнение включает только одну фиктивную переменную или . Предположим, что определено уравнение , где принимает значения 1 для мужчин и 0 для женщин. Теоретические значения размера потребления кофе для мужчин будут получены из уравнения . Для женщин соответствующие значения получим из уравнения . Сопоставляя эти результаты, видим, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: – для женщин и – для мужчин. Теперь качественный фактор принимает только два состояния, которым соответствуют значения 1 и 0. Если же число градаций качественного признака-фактора превышает два, то в модель вводится несколько фиктивных переменных, число которых должно быть меньше числа качественных градаций. Только при соблюдении этого положения матрица исходных фиктивных переменных не будет линейно зависима и возможна оценка параметров модели. Фиктивные переменные позволяют строить и оценивать кусочно-линейные модели, которые можно применять для исследования структурных изменений. Пусть, например, мы исследуем зависимость выпуска продукции Y от размера основного фонда предприятия хt. При этом есть основания считать, что в момент времени t0 произошла структурная перестройка и характер зависимости изменился. Чтобы оценить такую модель введем бинарную переменную и запишем нашу модель в виде: При t ≤ t0 линия регрессии имеет наклон , при t > t0 наклон равен и разрыва в точке xt не происходит. При приходим к выводу, что в момент t0 структурного изменения не происходит. Вопрос 3. Множественные совокупности фиктивных переменных В отдельных случаях может оказаться необходимым введение двух и более групп фиктивных переменных, т.е. двух и более качественных факторов, каждый из которых может иметь несколько градаций. Например, при изучении потребления некоторого товара наряду с факторами, имеющими количественное выражение (цена, доход на одного члена семьи, цена на взаимозаменяемые товары и др.), учитываются и качественные факторы. С их помощью оцениваются различия в потреблении отдельных социальных групп населения, дифференциация в потреблении по полу, национальному составу и др. При построении такой модели из каждой группы фиктивных переменных следует исключить по одной переменной. Так, если модель будет включать три социальные группы, три возрастные категории и ряд экономических переменных, то она примет вид: , где – потребление; – экономические (количественные) переменные. До сих пор мы рассматривали фиктивные переменные как факторы, которые используются в регрессионной модели наряду с количественными переменными. Вместе с тем возможна регрессия только на фиктивных переменных. Например, изучается дифференциация заработной платы рабочих высокой квалификации по регионам страны. Модель заработной платы может иметь вид: , где – средняя заработная плата рабочих высокой квалификации по отдельным предприятиям; ……………………………………………………………………….. Поскольку последний район, указанный в модели, обозначен , то в исследование включено район. Мы рассмотрели модели с фиктивными переменными, в которых последние выступают факторами. Может возникнуть необходимость построить модель, в которой дихотомический признак, т.е. признак, который может принимать только два значения, играет роль результата. Подобного вида модели применяются, например, при обработке данных социологических опросов. В качестве зависимой переменной рассматриваются ответы на вопросы, данные в альтернативной форме: «да» или «нет». Поэтому зависимая переменная имеет два значения: 1, когда имеет место ответ «да», и 0 – во всех остальных случаях. Модель такой зависимой переменной имеет вид: . Модель является вероятностной линейной моделью. В ней принимает значения 1 и 0, которым соответствуют вероятности и . Поэтому при решении модели находят оценку условной вероятности события при фиксированных значениях . Для оценки параметров линейно-вероятностной модели применяются методы Logit-, Probit- и Tobit-анализа. Такого рода модели используют при работе с неколичественными переменными. Как правило, это модели выбора из заданного набора альтернатив. Зависимая переменная представлена дискретными значениями (набор альтернатив), объясняющие переменные – характеристики альтернатив (время, цена), – характеристики индивидов (возраст, доход, уровень образования). Модель такого рода позволяет предсказать долю индивидов в генеральной совокупности, которые выбирают данную альтернативу. В регрессионных моделях с временными рядами используется три основных вида фиктивных переменных: 1) Переменные-индикаторы принадлежности наблюдения к определенному периоду — для моделирования скачкообразных структурных сдвигов. Границы периода (моменты “скачков”) должны быть установлены из априорных соображений. Например, 1, если наблюдение принадлежит периоду 1941-45 гг. и 0 в противном случае. Это пример использования для моделирования временного структурного сдвига. Постоянный структурный сдвиг моделируется переменной равной 0 до определенного момента времени и 1 для всех наблюдений после этого момента времени. 2) Сезонные переменные — для моделирования сезонности. Сезонные переменные принимают разные значения в зависимости от того, какому месяцу или кварталу года или какому дню недели соответствует наблюдение. Например, модель потребления, учитывающая сезонные колебания. у = b0 + b1x1 + b2x2 + b3x3, для зимних месяцев иначе для весенних месяцев иначе для летних месяцев иначе Следует отметить, что вводить четвертую переменную х4 для осенних месяцев не требуется, т.к. в этом случае все переменные оказались бы связанными тождеством Xi +Х2+Хз+Х4= 1, что привело бы их к полной коллинеарности и вырожденности информационной матрицы . Для осенних месяцев коэффициенты b1, b2, b3 равны нулю и объем потребления составляет Y= b0 Для зимних месяцев: Y=b0 + b1, Для весенних месяцев: Y=b0 + b2, Для летних месяцев: Y=b0 + b3. При этом, если в результате регрессионного анализа окажется, что b3 = 0, это означает, что между летними и осенними сезонами различие в потреблении несущественно. При b1 = b2 отсутствует различие между потреблением зимой и весной и т.д. 3) Линейный временной тренд — для моделирования постепенных плавных структурных сдвигов. Эта фиктивная переменная показывает, какой промежуток времени прошел от некоторого “нулевого” момента времени до того момента, к которому относится данное наблюдение (координаты данного наблюдения на временной шкале). Если промежутки времени между последовательными наблюдениями одинаковы, то временной тренд можно составить из номеров наблюдений. Временной тренд отличается от бинарных фиктивных переменных тем, что имеет смысл использовать его степени: t2 , t3 и т. д. Они помогают моделировать гладкий, но нелинейный тренд. (Бинарную переменную нет смысла возводить в степень, потому что в результате получится та же самая переменная.) Можно также комбинировать указанные виды фиктивных переменных, создавая переменные “взаимодействия” соответствующих эффектов. Комбинация рассмотренных фиктивных переменных позволяет моделировать еще один эффект — изменение наклона тренда с определенного момента. Помимо тренда в регрессию следует тогда ввести следующую переменную: в начале выборки до некоторого момента времени она равна 0, а вторая ее часть представляет собой временной тренд (1, 2, 3 и т. д. в случае одинаковых интервалов между наблюдениями). Вопрос 4. Фиктивные переменные для коэффициентов наклона. Среди моделей с фиктивными переменными наибольшими прогностическими возможностями обладают модели, в которых зависимая переменная рассматривается как функция ряда экономических факторов и фиктивных переменных . Последние обычно отражают различия в формировании результативного признака по отдельным группам единиц совокупности, т.е. в результате неоднородной структуры пространственного или временного характера. Использование фиктивных переменных имеет следующие преимущества: 1) Интервалы между наблюдениями не обязательно должны быть одинаковыми. В выборке могут быть пропущенные наблюдения. 2) Коэффициенты при фиктивных переменных легко интерпретировать, они наглядно представляют структуру динамического процесса. 3) Для оценивания модели не приходится выходить за рамки классического метода наименьших квадратов. Сопоставляя частные уравнения регрессии, видим, что эти уравнения регрессии отличаются значениями свободного члена, а соответствующие линии регрессии параллельны (см. рис.). График частного уравнения регрессии для мужчин будет располагаться выше, чем график частного уравнения регрессии для женщин. Тема 6. Временные ряды и их характеристика Вопросы: 1. Специфика временных рядов, как источника данных в эконометрических исследованиях. 2. Понятие стационарности временного ряда. 3. Модели стационарных временных рядов. 4. Модели нестационарных временных рядов. Вопрос 1. Специфика временных рядов, как источника данных в эконометрических исследованиях. Информационной базой для анализа экономических процессов являются динамические и временные ряды. Совокупность наблюдений некоторого явления (показателя), упорядоченная в зависимости от последовательности значений другого явления (признака), называют динамическим рядом. Динамические ряды, у которых в качестве признака упорядочения используется время, называют временными. В экономике и бизнесе временные ряды – это очень распространенный тип данных. Во временном ряде содержится информация об особенностях и закономерностях протекания процесса, а статистический анализ позволяет выявить и использовать выявленные закономерности для оценки характеристик процесса в будущем, т.е. для прогнозирования. Временной ряд – это набор чисел, привязанный к последовательным, обычно равноотстоящим моментам времени. Числа, составляющие временной ряд и получающиеся в результате наблюдения за ходом некоторого процесса, называются уровнями временного ряда или элементами. Под длиной временного ряда понимают количество входящих в него уровней n. Временной ряд обычно обозначают Y(t), или , где t=1,2,…,n. В общем случае каждый уровень временного можно представить как функцию четырех компонент: f(t), S(t), U(t), (t) , отражающих закономерность и случайность развития. Где f(t) – тренд (долговременная тенденция) развития; S(t) – сезонная компонента; U(t) –циклическая компонента; (t)– остаточная компонента. В модели временного ряда принято выделять две основные составляющие: детерминированную (систематическую) и случайную. Под детерминированной составляющей временного ряда понимают числовую последовательность, элементы которой вычисляются по определенному правилу как функция времени t. Исключив детерминированную составляющую из данных, мы получим колеблющийся вокруг нуля ряд, который может в одном предельном случае представлять случайные скачки, а в другом – плавное колебательное движение. Детерминированная составляющая может содержать следующие структурные компоненты: 1) тренд, или тенденция f(t), представляет собой устойчивую закономерность, наблюдаемую в течение длительного периода времени. Обычно тренд (тенденция) описывается с помощью той или иной неслучайной функции fтр(t) (аргументом которой является время), как правило, монотонной. Эту функцию называют функцией тренда, или просто – трендом. 2) Сезонная компонента s(t) связана с наличием факторов, действующих с заранее известной периодичностью. Это регулярные колебания, которые носят периодический или близкий к нему характер и заканчиваются в течение года. Типичные примеры сезонного эффекта: изменение загруженности автотрассы по временам года, пик продаж товаров для школьников в конце августа – начале сентября. Спрос на пластические операции сезонный: в осенне-зимний период обращений больше. Типичным примером являются сильные колебания объема товарно-материальных запасов в сезонных отраслях Сезонная компонента со временем может меняться, либо иметь плавающий характер. 3) Циклическая компонента u(t) – неслучайная функция, описывающая длительные периоды (более одного года) относительного подъема и спада и состоящая из циклов переменной длительности и амплитуды. Примером циклической (конъюнктурной) компоненты являются волны Кондратьева, демографические «ямы» и т.п. Подобная компонента весьма характерна для рядов макроэкономических показателей. Здесь циклические изменения обусловлены взаимодействием спроса и предложения, а также наложением таких факторов, как истощение ресурсов, погодные условия, изменения в налоговой политике и т.п. Отметим, что циклическую компоненту крайне трудно идентифицировать формальными методами, исходя только из данных изучаемого ряда. 4) Случайная компонента (t) - это составная часть временного ряда, оставшаяся после выделения систематических компонент. Она отражает воздействие многочисленных факторов случайного характера и представляет собой случайную, нерегулярную компоненту. Она является обязательной составной частью любого временного ряда в экономике, так как случайные отклонения неизбежно сопутствуют любому экономическому явлению. Если систематические компоненты временного ряда определены правильно, то остающаяся после выделения из временного ряда этих компонент так называемая остаточная последовательность (ряд остатков) будет случайной компонентой ряда. Вопрос 2. Понятие стационарности временного ряда. В анализе случайного компонента экономических временных рядов важную роль играет сравнение случайной величины с хорошо изученной формой случайных процессов - стационарными случайными процессами. Стационарным процессом в узком смысле называется такой случайный процесс, вероятностные свойства которого с течением времени не изменяются. Он протекает в приблизительно однородных условиях и имеет вид непрерывных случайных колебаний вокруг некоторого среднего значения. Причем ни средняя амплитуда, ни его частота не обнаруживают с течением времени существенных изменений. Однако на практике чаще встречаются процессы, вероятностные характеристики которых подчиняются определенным закономерностям и не являются постоянными величинами. Поэтому в прикладном эконометрическом анализе используется понятие слабой стационарности (или стационарности в широком смысле), которое предполагает неизменность во времени среднего значения, дисперсии и ковариации временного ряда Случайный процесс называется стационарным в широком смысле, если его математическое ожидание постоянно и автокорреляционная функция зависит только от длины временного интервала . В зависимости от вида связи между этими компонентами может быть построена либо аддитивная модель: Y(t) =f(t)+ S(t)+U(t)+(t); (3.4.1) либо мультипликативная модель: Y(t) =f(t) S(t) U(t)+ (t) (3.4.2) временного ряда. В процессе формирования значений временных рядов не всегда участвуют все четыре компоненты. Однако во всех случаях предполагается наличие случайной составляющей. Основная цель статистического анализа временных рядов – изучение соотношения между закономерностью и случайностью в формировании значений уровней ряда, оценка количественной меры их влияния. Закономерности, объясняющие динамику показателя в прошлом, используются для прогнозирования его значений в будущем, а учет случайности позволяет определить вероятность отклонения от закономерного развития и его возможную величину. Вопрос 3. Модели стационарных временных рядов. Стохастический временной ряд называется стационарным, если его математическое ожидание, дисперсия, автоковариация и автокорреляция являются неизменными во времени. К основным линейным моделям стационарных временных рядов относятся: 1) модели авторегрессии; 2) модели скользящего среднего; 3) модели авторегрессии скользящего среднего. На практике чаще всего используются модели скользящего среднего первого CC(1) и второго порядков CC(2). Коэффициенты модели скользящего среднего порядка q не обязательно должны в сумме давать единицу и не обязательно должны быть положительными. Для достижения большей гибкости модели временных рядов при эконометрическом моделировании в неё включают как члены авторегрессии, так и члены скользящего среднего. Подобные модели получили название смешанных моделей авторегрессии скользящего среднего и также относятся к линейным моделям стационарных временных рядов. Смешанная модель авторегрессии скользящего среднего обозначается как АРСС(p,q) или ARMA(p,q). Чаще всего на практике используется смешанная модель АРСС(1) с одним параметром авторегрессии p=1 и одним параметром скользящего среднего q=1. Временной ряд называется детерминированным, если значения уровней временного ряда точно определены какой-либо математической функцией, являющейся реализацией исследуемого процесса. Временной ряд называется случайным, если уровни временного ряда могут быть описаны с помощью функции распределения вероятностей. Таким образом, уровни временного ряда могут быть детерминированными или случайными величинами. Уровни случайного временного ряда могут быть непрерывными и дискретными случайными величинами. Случайная величинаХ называется дискретной, если множество её возможных значений является конечным или счётным. В качестве примера случайного временного ряда с дискретными уровнями может служить временной ряд, отражающий значения ежемесячной выдачи зарплаты рабочим. Случайная величина Х называется непрерывной, если она может принимать любое значение из конечного или бесконечного интервала. В качестве примера случайного временного ряда с непрерывными уровнями может служить временной ряд, отражающий значения температуры воздуха, зарегистрированные с определённой периодичностью. Стохастическим процессом называется процесс, который развивается во времени в соответствии с законами теории вероятностей. К стохастическим процессам относится класс стационарных процессов. Стохастический процесс называется стационарным, если его основные свойства остаются неизменными во времени. Предположим, что исследуется временной ряд Х. Обозначим через xt уровень данного временного ряда. Тогда стационарный процесс будет характеризоваться следующими четырьмя свойствами: 1) математическое ожидание стационарного ряда E(yt) является постоянным, т. е. среднее значение временного ряда, вокруг которого изменяются уровни, является величиной постоянной: 2) дисперсия стационарного ряда является постоянной. Она характеризует вариацию уровней временного ряда относительно его среднего значения 3) автоковариация стационарного ряда с лагом l является постоянной, т. е. ковариация между значениями xt и xt+l, отделёнными интервалом в l единиц времени, определяется по формуле: для стационарных рядов автоковариация зависит только от величины лага l, поэтому справедливо равенство вида: 4) коэффициенты автокорреляция стационарного ряда с лагом l являются постоянными. Следовательно, автокорреляция является нормированной автоковариацией, т. к. для стационарного процесса G2(y)=const: Таким образом, коэффициент автокорреляции порядка l определяется по формуле: Нестационарным временным рядом называется ряд, который не удовлетворяет вышеперечисленным свойствам. Случайный процесс, называемый белым шумом, является частным случаем стационарных временных рядов. Белым шумом называется случайная последовательность значений y1, y2,…,yN, если её математическое ожидание равно нулю, т.е. E(Yt)=0, где её элементы являются некоррелированными (независимыми друг от друга) одинаково распределёнными величинами, и дисперсия является постоянной величиной D(Yt)=G2=const. Белый шум – это теоретический процесс, который реально не существует, однако он представляет собой очень важную математическую модель, которая используется при решении множества практических задач. Поиск модели, адекватно описывающей поведение случайных остатков t анализируемого временного ряда xt, производят, как правило, в рамках класса стационарных временных рядов. Определение 2.1. Ряд xt называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей m наблюдений такое же, как и для m наблюдений , при любых , и t1,…, tm. Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. В частности, при m = 1 из предположения о строгой стационарности временного ряда xt следует, что закон распределения вероятностей случайной величины xt не зависит от t, а значит, не зависят от t и все его основные числовые характеристики, в том числе: среднее значение Ext =  и дисперсия Dxt = 2. Очевидно, значение  определяет постоянный уровень, относительно которого колеблется анализируемый временной ряд xt, а постоянная величина  характеризует размах этих колебаний. Поскольку закон распределения вероятностей случайной величины xt одинаков при всех t, то он сам и его основные числовые характеристики могут быть оценены по наблюдениям x1,…, xT. В частности:  оценка среднего значения,  оценка дисперсии.(2.1) Автоковариационная функция (). Значения автоковариационной функции статистически оцениваются по имеющимся наблюдениям временного ряда по формуле [11] где  = 1,… T  1, а вычислено по формуле (2.1). Очевидно, значение автоковариационной функции при  = 0 есть не что иное, как дисперсия временного ряда, и, соответственно, (2.2) Автокорреляционная функция r(). Одно из главных отличий последовательности наблюдений, образующих временной ряд, от случайной выборки заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависимыми. Степень тесноты статистической связи между двумя случайными величинами может быть измерена парным коэффициентом корреляции. Поскольку в нашем случае коэффициент измеряет корреляцию, существующую между членами одного и того же временного ряда, его принято называть коэффициентом автокорреляции. При анализе изменения величины r() в зависимости от значения  принято говорить об автокорреляционной функции r(). График автокорреляционной функции иногда называют коррелограммой [4]. Автокорреляционная функция (в отличие от автоковариационной) безразмерна, т.е. не зависит от масштаба измерения анализируемого временного ряда. Ее значения, по определению, могут колебаться от 1 до +1. Кроме того, из стационарности следует, что r() = r(), так что при анализе поведения автокорреляционных функций ограничиваются рассмотрением только положительных значений . Выборочный аналог автокорреляционной функции определяется формулой (2.3) Существуют общие характерные особенности, отличающие поведение автокорреляционной функции стационарного временного ряда. Другими словами, можно описать в общих чертах схематичный вид коррелограммы стационарного временного ряда [9]. Это обусловлено следующим общим соображением: очевидно, чем больше разнесены во времени члены временного ряда xt и xt+, тем слабее взаимосвязь этих членов и, соответственно, тем меньше должно быть по абсолютной величине значение r(). При этом в ряде случаев существует такое пороговое значение r0, начиная с которого все значения будут тождественно равны нулю. Частная автокорреляционная функция rчаст(). С помощью этой функции реализуется идея измерения автокорреляции, существующей между разделенными  тактами времени членами временного ряда xt и xt+, при устраненном опосредованном влиянии на эту взаимозависимость всех промежуточных членов этого временного ряда. Частная автокорреляция 1-го порядка может быть подсчитана с использованием соотношения: (2.4) где   среднее значение анализируемого стационарного процесса. Частные автокорреляции более высоких порядков могут быть подсчитаны аналогичным образом по элементам общей корреляционной матрицы R = ||rij||, в которой rij = = r(xi, xj) = r(|i  j|), где i, j = 1,…, T и r(0) = 1. Так, например, частная автокорреляция 2-го порядка определяется по формуле: (2.5) Эмпирические (выборочные) версии автокорреляционных функций получаются с помощью тех же соотношений (2.4), (2.5) при замене участвующих в них теоретических значений автокорреляций r() их статистическими оценками . Полученные таким образом частные автокорреляции rчаст(1),rчаст (2),… можно нанести на график, в котором роль абсциссы выполняет величина сдвига . Знание автокорреляционных функций r() и rчаст() оказывает существенную помощь в решении задачи подбора и идентификации модели анализируемого временного ряда. Вопрос 4. Модели нестационарных временных рядов. Формирование уровней ряда определяется закономерностями трех основных типов: инерцией тенденции, инерцией взаимосвязи между последовательными уровнями ряда и инерцией взаимосвязи между исследуемым показателем и показателями-факторами, оказывающими на него причинное воздействие. Соответственно различают задачи анализа и моделирования тенденций, взаимосвязи между последовательными уровнями ряда; причинных взаимодействий между исследуемым показателем и показателями - факторами. Первая из них решается с помощью моделей кривых роста, вторая - с помощью адаптивных методов и моделей, а третья с помощью регрессионных моделей Плавную кривую (гладкую функцию), аппроксимирующую временной ряд принято называть кривой роста. Аналитические методы выделения (оценки) неслучайной составляющей временного ряда с помощью кривых роста реализуются в рамках моделей регрессии, в которых в роли зависимой переменной выступает переменная yt, а в роли единственной объясняющей переменной - время t. Наиболее часто в практической работе используются кривые роста, которые позволяют описывать процессы трех основных типов: без предела роста; с пределом роста без точки перегиба; с пределом роста и точкой перегиба. Для описания процессов без предела роста служат функции: прямая (полином первой степени) - , парабола (полином второй степени) - , экспонента - и другие. Процессы развития такого типа характерны в основном для абсолютных объемных показателей. Для описания процессов с пределом роста служат функции: кривая Джонсона, модифицированная экспонента и др. Процессы с пределом роста характерны для многих относительных показателей (душевое потребление продуктов питания, внесение удобрений на единицу площади, затраты на один рубль произведенной продукции и т.п.). Для описания процессов третьего типа - с пределом роста и точкой перегиба используются кинетическая кривая (кривая Перла - Рида) и кривая Гомперца. Такой тип развития характерен для спроса на некоторые новые товары. Математические методы позволяют представить прогнозирующую модель в виде полинома любого порядка. Однако без необходимости использование полиномов высокого порядка представляется излишним. Параметры моделей могут быть содержательно интерпретированы. Так, параметр а0 во всех моделях без предела роста задает начальные условия развития, а в моделях с пределом роста - асимптоту функций, параметр а1 определяет скорость или интенсивность развития, параметр а2 - изменение скорости или интенсивности развития. Параметры большинства "кривых роста", как правило, оцениваются по методу наименьших квадратов, т.е. подбираются таким образом, чтобы график функции "кривой роста" располагался на минимальном удалении от точек исходных данных. Согласно методу наименьших квадратов при оценке параметров модели всем наблюдениям присваиваются равные веса, т.е. их информационная ценность признается равной, а тенденция развития на всем участке наблюдений – неизменной. Предпочтение, как правило, отдается простым моделям, допускающим содержательную интерпретацию. К числу таких моделей относится линейная модель роста , (3.4.14) где – параметры модели, а t = 1, 2,…, n. Математически критерий оценки параметров модели записывается в виде: (3.4.15) Для нахождения минимума функции двух переменных следует взять частные производные по и , а затем приравнять их нулю. В результате получим так называемую систему нормальных уравнений (3.4.16) Решая систему двух линейных уравнений с двумя неизвестными, получим (3.4.17) где и – средние значения моментов наблюдения и уровней ряда, соответственно. Тема 7. Модели временных рядов и прогнозирование Вопросы: 1. Понятие модели временного ряда. 2. Анализ временных рядов с периодическими колебаниями. 3. Аналитическое выравнивание временных рядов и оценка параметров тренда. 4. Прогнозирование значений временных рядов. 5. Анализ временных радов при наличии периодических колебаний: аддитивная и мультипликативная модели. Вопрос 1. Понятие модели временного ряда. Анализом временных рядов наз. статистический анализ данных, собранных в ходе наблюдений за единичным объектом (напр., отдельным человеком, семьей или городом), производимых последовательно во времени, либо через определенные интервалы, либо непрерывно. Как и традиционные параметрические методы анализа данных, методы А. в. р. используются для описания связей между переменными, предсказания будущего поведения и проверки эффектов проведенного лечения. Есть два математически эквивалентных подхода к разработке концептуальных моделей и вычислительных процедур А. в. р. Один подход, наз. анализом во временной области или анализом временных характеристик (time-domain analysis), связан с использованием понятий, сходных с теми, что применяются в традиционном корреляционном и регрессионном анализе. Др. подход получил название анализа частотных характеристик (frequency-domain analysis); он предполагает изучение частотных составляющих и основан на понятиях спектрального анализа. Модель временного ряда представляет собой уравнение, к-рое связывает наблюдение, полученное в нек-рый конкретный момент времени, с наблюдениями, полученными ранее по той же и/или др. характеристикам изучаемой переменной. Напр., если дискретные данные о весе тела собираются через равные промежутки времени на одном объекте, интерес могут представлять два вопроса: а) в какой степени связаны смежные (или несмежные) наблюдения в данном временном ряду, и б) насколько успешно можно предсказать будущие показатели веса тела. Ответы на оба этих вопроса требуют вычисления выборочной автокорреляционной функции, идентификации модели временного ряда и оценивания соотв. параметров. В эконометрике модели временного ряда строятся на основе данных, характеризующих совокупность различных объектов за определенный период времени. Временной ряд — это набор значений какого-либо показателя за несколько последовательных периодов времени. Любой уровень временного ряда формируется под воздействием большого числа факторов, которые можно разделить на 3 группы: • факторы, формирующие циклические колебания ряда; • факторы, формирующие тенденцию временного ряда; • случайные факторы. Вопрос 2.Анализ временных рядов с периодическими колебаниями. экстраполяционное прогнозирование экономических процессов, представленных одномерными временными рядами, сводится к выполнению следующих основных этапов: 1) предварительный анализ данных; 2) построение моделей: формирование набора аппроксимирующих функций (кривых роста) и численное оценивание параметров моделей; 3) проверка адекватности моделей и оценка их точности; 4) выбор лучшей модели; 5) расчет точечного и интервального прогнозов Предварительный анализ данных. В ходе предварительного анализа определяют соответствие имеющихся данных требованиям, предъявляемым к ним математическими методами (объективности, сопоставимости, полноты, однородности и устойчивости); строится график динамики и рассчитываются основные динамические характеристики (приросты, темпы роста, темпы прироста, коэффициенты автокорреляции). Для получения общего представления о динамике исследуемого показателя целесообразно построить его график. При графическом отображении динамики показателя во времени по оси абсцисс откладываются значения переменной t, а по оси ординат - соответствующие значения показателя Y(t). К процедурам предварительного анализа относятся: • выявление аномальных наблюдений; • проверка наличия тренда; • сглаживание временных рядов; • расчет показателей развития динамики экономических процессов. Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномалий данных. Поэтому процедура выявления аномальных наблюдений является обязательной процедурой этапа предварительного анализа данных. Для диагностики аномальных наблюдений разработаны различные критерии, например, метод Ирвина Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина : , (3.4.3) где Если рассчитанная величина превышает табличный уровень (например, для 10 наблюдений значение критерия Ирвина равно 1,5), то уровень считается аномальным. Аномальные наблюдения необходимо исключить из временного ряда и заменить их расчетными значениями (самый простой способ замены – в качестве нового значения принять среднее из двух соседних значений). Табл.3.4.1. Критические значения параметра . Количество наблюдений n P=0,95 P=0,99 2 2,8 3,7 3 2,2 2,9 10 1,5 2,0 20 1,3 1,8 30 1,2 1,7 50 1,1 1,6 100 1,0 1,5 400 0,9 1.3 1000 0,8 1.2 Следующая процедура этапа предварительного анализа данных – выявление наличия тенденций в развитии исследуемого показателя. Отметим, что тенденция прослеживается не только в увеличении или уменьшении среднего текущего значения временного ряда, но она присуща и другим его характеристикам: дисперсии, автокорреляции, корреляции с другими показателями и т.д. тенденцию среднего визуально можно определить из графика исходных данных. Процедура проверки наличия или отсутствия неслучайной (и зависящей от времени t) составляющей по существу, состоит в статистической проверке гипотезы о неизменности среднего значения временного ряда: Эта процедура может быть осуществлена с помощью различных критериев приведем некоторые из них. • Критерий серий, основанный на медиане. Расположим члены анализируемого временного ряда в порядке возрастания, т.е. образуем ряд: . Определим выборочную медиану по формуле (3.4.4) После этого мы образуем «серии» из плюсов и минусов, на статистическом анализе которых основана процедура проверки гипотезы о неизменности среднего значения временного ряда. По исходному временному ряду, построим последовательность из плюсов и минусов следующим образом: вместо xt ставится «+», если , и «-», если (члены временного ряда, равные , в полученной таким образом последовательности плюсов и минусов не учитываются). Образованная последовательность плюсов и минусов характеризуется общим числом серий n(n) и протяженностью самой длинной серии t(n). При этом под «серией» понимается последовательность подряд идущих плюсов и подряд идущих минусов. Если исследуемый ряд состоит из статистически независимых наблюдений, случайно варьирующих около некоторого постоянного уровня (т.е. справедлива гипотеза о неизменности среднего значения временного ряда), то чередование «+» и «-» в построенной последовательности должно быть случайным, т.е. эта последовательность не должна содержать слишком длинных серий подряд идущих «+» или «-», и, соответственно, общее число серий не должно быть слишком малым. Так что в данном критерии целесообразно рассматривать одновременно пару критических статистик (n(n); t(n)). Справедлив следующий приближенный статистический критерия проверки гипотезы о неизменности среднего значения временного ряда: если хотя бы одно из неравенств (3.4.5) окажется нарушенным, то гипотеза о неизменности среднего значения временного ряда отвергается с вероятностью ошибки a, такой, что 0,05 < a < 0,0975 и, тем самым, подтверждается наличие зависящей от времени неслучайной составляющей в разложении Y(t) =f(t)+ S(t)+U(t)+(t). • Критерий «восходящих» и «нисходящих» серий. Этот критерий «улавливает» постепенное смещение среднего значения в исследуемом распределении не только монотонного, но и более общего, например, периодического характера. Так же, как и в предыдущем критерии, исследуется последовательность знаков - плюсов и минусов, однако правило образования этой последовательности в данном критерии иное. Здесь на i-ом месте вспомогательной последовательности ставится «+», если yi+1 - yi > 0, и «-», если yi+1 - yi < 0 (если два или несколько следующих друг за другом наблюдений равны между собой, то принимается во внимание только одно из них). Последовательность подряд идущих «+» (восходящая серия) будет соответствовать возрастанию результатов наблюдения, а последовательность «-» (нисходящая серия) - их убыванию. Критерий основан на том же соображении, что и предыдущий: если выборка случайна, то в образованной последовательности знаков общее число серий не может быть слишком малым, а их протяженность - слишком большой. При уровне значимости 0,05 < a < 0,0975 критерий вид: (3.4.6) где величина t0(n) определяется следующим образом: n n£ 26 26 < n£ 153 153 < n£ 1170 t0(n) t0 = 5 t0 = 6 t0 = 7 Если хотя бы одно из неравенств (3.4.6) окажется нарушенным, то гипотезу о неизменности среднего значения временного ряда следует отвергнуть. • Один из способов проверки обнаружения тренда основан на сравнении средних уровней ряда: временной ряд разбивают на две примерно равные по числу уровней части, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность, имеющая нормальное распределение. Если временной ряд имеет тенденцию к тренду, то средние, вычисленные для каждой совокупности, должны существенно (значимо) различаться между собой. Если же расхождение незначительно, несущественно (случайно), то временной ряд не имеет тенденции. Таким образом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей. Вопрос 3. Аналитическое выравнивание временных рядов и оценка параметров тренда. Сглаживание временного ряда, т.е. замена фактических уровней расчетными значениями, имеющими меньшую колеблемость, чем исходные данные является простым методом выявления тенденции развития. Соответствующее преобразование называется фильтрованием. Сглаживание временных рядов проводится по следующим причинам: • В ряде случаев при графическом изображении временного ряда тренд прослеживается недостаточно отчетливо. Поэтому ряд сглаживают, на график наносят сглаженные значения и, как правило, тенденция проявляется более четко. • Некоторые методы анализа и прогнозирования требуют в качестве предварительного условия сглаживание временного ряда. • Сглаживание временных рядов используется при устранении аномальных наблюдений. • Методы сглаживания в настоящее время применяются для непосредственного прогнозирования экономических показателей. Существующие методы сглаживания делят на две группы: 1. Методы первого типа (аналитические). Сглаживание с использованием кривой, проведенной относительно фактических значений ряда так, чтобы эта кривая отображала тенденцию, присущую ряду и одновременно освобождала его от мелких незначительных колебаний. Такие кривые называют еще кривыми роста, и они используются главным образом для прогнозирования экономических показателей. 2. Методы механического сглаживания. При использовании этих методов производится сглаживание каждого отдельного уровня ряда с использованием фактических значений соседних с ним уровней. Для сглаживания временных рядов часто используются методы простой и взвешенной скользящей средней, экспоненциального сглаживания. Метод простой скользящей средней. 1. Согласно этому методу определяется количество наблюдений, входящих в интервал сглаживания. При этом используют правило: если необходимо сгладить мелкие, беспорядочные колебания, то интервал сглаживания берут по возможности большим и, наоборот, интервал сглаживания уменьшают, когда нужно сохранить более мелкие волны и освободиться от периодически повторяющихся колебаний, возникающих, например, из-за автокорреляций уровней. 2. Вычисляется среднее значение наблюдений, образующих интервал сглаживания, которое одновременно является сглаживающим значением уровня, находящегося в центре интервала сглаживания, при условии, что m - нечетное число, по формуле: , (3.4.8) где m - количество наблюдений, входящих в интервал сглаживания. При нечетном m значение параметра значение параметра p вычисляют следующим образом: - среднее значение наблюдения , которое одновременно является сглаженным значением наблюдения, находящегося в центре интервала сглаживания при нечетном m. p - количество наблюдений, стоящих по разные стороны от сглаживаемого. Первым сглаженным будет наблюдение , где t=p+1. 3. Интервал сглаживания сдвигается на один член вправо и по формуле (3.4.8) находится сглаженное значение для t+1 наблюдения. Затем снова производят сдвиг и т.д. Процедура продолжается до тех пор, пока в интервал сглаживания не войдет последнее наблюдение временного ряда. Недостатком метода является невключение в процедуру сглаживания первых и последних p наблюдений временного ряда. Метод простой скользящей средней возможно использовать, если графическое изображение ряда напоминает прямую линию. В этом случае не искажается динамика развития исследуемого процесса. Однако когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны, использовать для сглаживания ряда метод простой скользящей средней нецелесообразно, поскольку при этом: выравниваются и выпуклые, и вогнутые линии; происходит сдвиг волны вдоль ряда; изменяется знак волны, т.е. на кривой, соединяющей сглаженные точки, вместо выпуклого участка образуется вогнутый и наоборот. Последнее имеет место в случаях, когда интервал сглаживания в полтора раза превышает длину волны. Таким образом, если развитие процесса носит нелинейный характер, то применение метода простой скользящей средней может привести к значительным искажениям исследуемого процесса. В таких случаях более надежным является использование других методов сглаживания, например, метода взвешенной скользящей средней. Метод взвешенной скользящей средней. Этот метод отличается от предыдущего тем, что сглаживание внутри интервала производится не по прямой, а по кривой более высокого порядка. Это обусловлено тем, что суммирование членов ряда, входящих в интервал сглаживания, производится с определенными весами, рассчитанными по методу наименьших квадратов. Если сглаживание производится с помощью полинома (многочлена) второго или третьего порядка, то веса берутся следующие: для m=5 - веса (-3; 12; 17; 12; -3); для m=7 - веса (-2; 3; 6; 7; 6; 3; -2) . Особенности весов: 1) симметричны относительно центрального члена; 2) сумма весов с учетом общего множителя равна 1. Недостаток метода: первые и последние p наблюдений ряда остаются не сглаженными. Метод экспоненциального сглаживания. Рассмотренные методы простой и взвешенной скользящей средней не дают возможности сгладить первые и последние p наблюдений временного ряда. Отсутствие сглаженных первых наблюдений не так важно по сравнению с последними наблюдениями, особенно если целью исследования является прогнозирование развития процесса. Есть методы, позволяющие получить сглаженные значения последних уровней так же, как и всех остальных. К их числу относится метод экспоненциального сглаживания. Особенность этого метода заключена в том, что в процедуре выравнивания каждого наблюдения используются только значения предыдущих уровней, взятых с определенным весом. Вес каждого наблюдения уменьшается по мере его удаления от момента, для которого определяется сглаживаемое значение. Сглаженное значение наблюдения ряда St на момент времени t определяется по формуле: St = yt + (1-) St-1, (3.4.9) где  - сглаживающий параметр, характеризующий вес выравниваемого наблюдения, причем 01. Величину St-1 в формуле (3.4.9) можно представить в виде суммы фактического значения уровня yt-1 и сглаженного значения предшествующего ему наблюдения St-2, взятых с соответствующими весами. Процесс такого разложения можно продолжить для членов St-2, St-3 и т.д. В результате получится следующее выражение: St = yt + (1-) St-1 = yt + (1-) {yt-1 + (1-) St-2} = = yt + (1-) yt-1 + (1-)2 {yt-2 + (1-) St-3} = (3.4.10) = yt + (1-) yt-1 + (1-)2 yt-2 + ... + (1-)k yt-k +...+ (1-)ty0, в котором среднее сглаженное значение является комбинацией всех предшествующих уровней ряда. Величина y0 характеризует начало условия процесса. Формулу (3.4.10) можно переписать короче через знак суммы: St =   (1-)k yt-k + (1-)t y0 (3.4.11) где 0  k  t-1 - число периодов отставания от момента t. Относительный вес каждого предшествующего уровня снижается по экспоненте по мере его удаления от момента, для которого вычисляется сглаженное значение (отсюда произошло название этого метода сглаживания). При практическом использовании метода экспоненциального сглаживания возникают следующие затруднения: выбор сглаживающего параметра  и определение начального условия y0. От численного значения параметра  зависит, насколько быстро будет уменьшаться вес предшествующих наблюдений и в соответствии с этим степень их влияния на сглаживаемый уровень. Чем больше значение параметра , тем меньше сказывается влияние предшествующих уровней и соответственно меньшим оказывается сглаживающее воздействие экспоненциальной средней. Задачу выбора параметра y0, определяющего начальные условия, предлагается решать следующим образом: если есть данные о развитии процесса в прошлом, то их среднее значение можно принять в качестве y0, если таких сведений нет, то в качестве y0 используют исходное (первое) значение наблюдения временного ряда y1. Вопрос 4. Прогнозирование значений временных рядов. Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Проверка адекватности модели реальному явлению является важным этапом прогнозирования социально - экономических процессов. Для этого исследуют ряд остатков , т.е. отклонения расчетных значений от фактических данных. Для оценки адекватности построенных моделей исследуются свойства остаточной компоненты, т.е. расхождения уровней, рассчитанных по модели, и фактических наблюдений. Наиболее важными свойствами остаточной компоненты являются независимость уровней ряда остатков, их случайность и соответствие нормальному закону распределения. Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей нулевой гипотезы . С этой целью строится t-статистика: , (3.4.22) где - среднее арифметическое значение уровней ряда остатков ; а - среднеквадратическое отклонение для этой последовательности, рассчитанное по формуле для малой выборки. На уровне значимости гипотеза отклоняется, если , где – критерий распределения Стьюдента с доверительной вероятностью (1 –) и степенями свободы . Проверка условия случайности возникновения отдельных отклонений от тренда. Для проверки случайности уровней ряда могут быть использованы критерий серий и критерий поворотных точек. Критерий “восходящих” и “нисходящих” серий был описан ранее. Критерий «пиков», или критерий поворотных точек. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны. Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как (3.4.23) где р – фактическое количество поворотных точек в случайном ряду; 1,96 – квантиль нормального распределения для 5%-го уровня значимости. Квадратные скобки здесь так же означают, что от результата вычисления следует взять целую часть. Если неравенство не соблюдается, то ряд остатков нельзя считать случайным (т.е. он содержит регулярную компоненту) и, стало быть, модель не является адекватной. Наличие (отсутствие) автокорреляции в отклонениях от модели роста проверяют с помощью критерия Дарбина – Уотсона (3.3.9). Соответствие ряда остатков нормальному закону распределения важно с точки зрения правомерности построения доверительных интервалов прогноза. Наиболее существенными свойствами ряда отклонений являются их симметричность относительно модели и преобладание малых по абсолютной величине ошибок над большими ошибками. В этой связи определяется близость к соответствующим параметрам нормального закона распределения коэффициентов асимметрии - A (мера скошенности) и эксцесса Э (мера “скученности”) наблюдений около модели: , — среднеквадратическая ошибка выборочной характеристики асимметрии, — среднеквадратическая ошибка выборочной характеристики эксцесса. Если одновременно выполняются неравенства то гипотеза о нормальном характере распределения случайного компонента не отвергается. Если выполняется хотя бы одно из неравенств: то гипотеза о нормальном характере распределения отвергается В случае попадания коэффициентов асимметрии и эксцесса в зону неопределенности (между полутора и двумя СКО) используются другие критерии, частности RS- критерий: (3.4.24) где и соответственно максимальный и минимальный уровни ряда остатков; - среднеквадратическое отклонение ряда остатков Если расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. ( Для n = 10 и 5%-ного уровня значимости этот интервал равен 2,7 - 3,7). В этом случае допустимо строить доверительный интервал прогноза. Если все пункты проверки дают положительный результат, то выбранная трендовая модель является адекватной реальному ряду экономической динамики, и, следовательно, ее можно использовать для построения прогнозных оценок. В противном случае – модель надо улучшать. Оценка точности модели В статистическом анализе известно большое число характеристик точности. Наиболее часто в практической работе, кроме среднеквадратического отклонения, используются: максимальная по абсолютной величине ошибка Emax = max| |; относительная максимальная ошибка Еотн = Еmax / Yср *100% средняя по модулю ошибка |Еср| = (e(1) + ... + e(n))/n средняя относительная по модулю ошибка |Еср|отн= |Еср| / Yср  100% (3.4.25) Эти показатели дают представление об абсолютной величине ошибки модели и о доле ошибки в процентном отношении к среднему значению результативного признака. При использовании ретропрогноза - подхода, когда несколько последних уровней ряда оставляются в качестве проверочной последовательности - точность прогнозных оценок определяется на основе этих же показателей. Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину. Однако эти показатели по-разному отражают степень точности модели и потому нередко дают противоречивые выводы. Для однозначного выбора лучшей модели исследователь должен воспользоваться либо одним основным показателем, либо обобщенным критерием. Построение точечных и интервальных прогнозов. Идея социально-экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективной, а в прошлое – ретроспективной. Прогнозирование методом экстраполяции базируется на следующих предположениях: а) развитие исследуемого явления в целом описывается плавной кривой; б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем; в) учет случайности позволяет оценить вероятность отклонения от закономерного развития. Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность. На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t=n+1, n+2,..., n+k. Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами. 1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты. 2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту. 3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем. Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности. При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет вид: , (3.4.26) где , (3.4.27) - стандартная ошибка (среднеквадратическое отклонение от модели), m – количество факторов в модели, для линейной модели m = 1. Коэффициент является табличным значением t-статистики Стьюдента при заданном уровне значимости и числе наблюдений. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равной 70%, то при n =9 = 1,12. При вероятности, равной 95%, = 2,36. Для других моделей величина U(k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.10), величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности степени углубления в будущее на k шагов вперед, т.е. на момент t = n+k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующие границы: – верхняя граница прогноза = Yпрогноз(n+k) + U(k); – нижняя граница прогноза = Yпрогноз(n+k) – U(k). Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей. После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом. Вопрос 5. Анализ временных радов при наличии периодических колебаний: аддитивная и мультипликативная модели. Для характеристики динамики изменения экономических показателей часто используется понятие автокорреляции, которая характеризует не только взаимозависимость уровней одного и того же ряда, относящихся к разным моментам наблюдений, но и степень устойчивости развития процесса во времени, величину оптимального периода прогнозирования и т.п. Степень тесноты статистической связи между уровнями временного ряда, сдвинутыми на  единиц времени определяется величиной коэффициента корреляции , так как измеряет тесноту связи между уровнями одного и того же временного ряда, поэтому его принято называть коэффициентом автокорреляции. При этом длину временного смещения называют обычно лагом (). Коэффициент автокорреляции вычисляют по формуле (3.4.12) Порядок коэффициентов автокорреляции определяет временной лаг: первого порядка (при = 1), второго порядка (при = 2) и т. д. Последовательность коэффициентов автокорреляции уровней первого, второго, третьего и т.д. порядков называют автокорреляционной функцией. Значения автокорреляционной функции могут колебаться от -1 до +1, но из стационарности следует, что = -. График автокорреляционной функции называется корреллограммой. Выборочный коэффициент автокорреляции вычисляется по формуле: (3.4.13) Для расчета коэффициента автокорреляции по формуле (3.4.12) в Excel можно воспользоваться функцией КОРРЕЛ. Предположим, что базовая переменная включает диапазон А1:А34. Тогда коэффициент автокорреляции равен: =КОРРЕЛ(А1:А33;А2:А34). На практике, как правило, при вычислении автокорреляции используется формула (3.4.13). Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, т.е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда. Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в  моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и сезонных колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты (f(t)) и сезонной компоненты (S). Тема 8. Системы одновременных уравнений Вопросы: 1. Виды систем эконометрических уравнений. 2. Независимые системы. 3. Рекурсивные системы. 4. Системы одновременных уравнений. Вопрос 1. Виды систем эконометрических уравнений. Использование одного регрессионного уравнения в экономических исследованиях часто оказывается недостаточным. На практике ряд факторных переменных чаще всего влияет на целый набор взаимозависимых результирующих переменных. Так, при оценке эффективности производства нельзя руководствоваться только моделью рентабельности. Она должна быть дополнена моделью производительности труда, а также моделью себестоимости единицы продукции. В качестве факторных переменных, при этом, могут выступать показатели квалификации сотрудников, обеспечения необходимыми средствами производства, удалённости от рынков сбыта и другие. Экономические показатели, часто оказываются взаимозависимы. Структура связей между такими показателями (переменными) может быть описана с помощью системы одновременных (структурных) уравнений. В этих уравнениях присутствуют переменных следующих типов: -эндогенные, зависимые переменные y, определяемые внутри системы; -экзогенные, независимые переменные x, значения которых задаются извне, они являются управляемыми, планируемыми; -предопределенные переменные, включающие в себя как экзогенные переменные за текущий период времени, так и лаговые переменные (т.е. экзогенные и эндогенные переменные за предыдущие периоды времени). Таким образом, возникает потребность рассмотрения систем эконометрических уравнений. Выделяются три основных вида систем эконометрических уравнений: система независимых уравнений, система рекурсивных уравнений и система одновременых уравнений. Вопрос 2. Независимые системы. В общем случае уравнения могут быть нелинейными, однако здесь мы ограничимся рассмотрением систем линейных уравнений. Система линейных независимых уравнений имеет следующий общий вид: (4.1) Уравнения системы независимых уравнений могут рассматриваться самостоятельно в произвольном порядке, то есть к каждому их них применимы все операции, которые мы рассматривали выше для линейных уравнений. Вопрос 3.Рекурсивные системы. Если зависимая (исследуемая переменная) одного уравнения выступает в качестве факторных переменной в последующих уравнениях, то может быть построена модель в виде системы линейных рекурсивных уравнений: . (4.2) Уравнения системы рекурсивных уравнений также могут рассматриваться по отдельности. В случае системы линейных уравнений параметры модели могут определяться с помощью МНК. При выполнении прогнозных значений необходимо будет производить вычисления последовательно, начиная с первого уравнения. Вопрос 4. Системы одновременных уравнений. Наибольшее распространение в эконометрических исследованиях получила система одновременных (взаимозависимых) уравнений. В ней одни и те же зависимые (исследуемые) переменные в одних уравнениях входят в левую часть, а других – в правую часть системы. Даже в простейшем случае системы одновременных линейных уравнений (eё также называют структурной формой модели – СФМ) : . (4.3) определение параметров модели сталкивается с большими трудностями и не всегда возможно в принципе. Для нахождения параметров модели исходная система одновременных линейных уравнений сводится к приведённой форме модели (ПФМ), которая имеет вид системы независимых переменных: (4.1) Такое сведение всегда возможно произвести с помощью алгебраических преобразований исходной системы уравнений. Параметры приведённой системы δij можно находить с помощью МНК. Основная трудность заключается в том, что не всегда возможно по коэффициентам приведённой системы восстановить коэффициенты исходной системы уравнений, то есть осуществить обратный переход (подобно тому, как мы это делали, сводя нелинейное уравнение к линейному, находя параметры линейной модели, а затем производя обратный пересчёт параметров нелинейной модели). Проблема перехода от приведённой формы (ПФМ) системы уравнений к исходной СФМ называется проблемой идентификации. Различаются идентифицируемые, неидентифицируемые и сверхидентифицируемые модели. 1. Модель идентифицируема, если все коэффициенты исходной модели определяются однозначно, единственным образом по коэффициентам приведённой модели. Это возможно когда число параметров исходной модели равно числу параметров приведённой формы (здесь и далее не учитывается число свободных коэффициентов в уравнениях). Процедура нахождения коэффициентов идентифицируемой модели носит название косвенного метода наименьших квадратов (КМНК) и содержит следующие этапы: а) исходная модель преобразуется в приведённую форму модели; б) для каждого уравнения приведённой формы модели применяется обычный МНК; в) коэффициенты приведённой модели трансформируются в коэффициенты исходной модели. 2. Модель неидентифицируема, если число параметров приведённой системы меньше чем, число параметров исходной модели, и в результате коэффициенты исходной модели не могут быть оценены через коэффициенты приведённой формы. 3. Модель сверхидентифицируема, если число приведённых коэффициентов больше числа коэффициентов в исходной модели. В этом случае на основе коэффициентов приведённой формы можно получить два и более значений одного коэффициента исходной модели. Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически разрешима, но требует специальных методов исчисления параметров. Наиболее распространённым является двух шаговый метод наименьших квадратов (ДНМК). Основная идея ДНМК – на основе приведённой формы модели получить для сверхидентифицируемого уравнения (имеются критерии для определения идентифицируемости каждого уравнения исходной системы) теоретические значения исследуемых переменных, содержащегося в правой части уравнения. Далее, подставив эти значения вместо фактических значений (результатов наблюдений), применяется МНК к сверхидентифицируемому уравнению исходной системы. Для того, чтобы модель была идентифицируема, необходимо, чтобы каждое уравнение модели было идентифицируемо. Если хотя бы одно уравнение СФМ неидентифицируемо, то вся модель считается неидентифицируемой. Рассмотрим необходимые и достаточные условия идентифицируемости отдельного уравнения модели. Необходимым условием идентифицируемости отдельного уравнения модели является счетное правило. Если обозначить через Н число исследуемых переменных yl, присутствующих в i-м уравнении, а через D обозначить число факторных переменных xj, отсутствующих в i-м уравнении, то счётное правило формулируется следующим образом: • если D + 1 < H, то уравнение неидентифицируемо; • если D + 1 = H, то уравнение идентифицируемо; • если D + 1 > H, то уравнение сверхидентифицируемо. Достаточное условие идентифицируемости отдельного уравнения модели выполняется, если определитель матрицы, составленной из коэффициентов в других уравнениях при переменных (как исследуемых y, так и факторных x), отсутствующих в данном i-м уравнении не равен нулю, а ранг этой матрицы, одновременно, не меньше, чем количество всех исследуемых переменных в системе уравнениё за вычетом 1. Тема 9. Идентификация систем одновременных уравнений Вопросы: 1. Косвенный и двушаговый метод наименьших квадратов. 2. Трехшаговый метод наименьших квадратов. 3. Применение систем эконометрических уравнений в эконометрических исследованиях. Вопрос 1. Косвенный и двушаговый метод наименьших квадратов. При оценивании коэффициентов структурной модели используется ряд методов. Рассмотрим косвенный метод наименьших квадратов (КМНК) , который применяется в случае точно идентифицируемой структурной модели. Рассмотрим этот метод на примере следующей идентифицируемой модели, содержащей две эндогенные и две экзогенные переменные: y1= b12 y2 + a11 x1 + 1 (5.8) y2= b21 y1 + a22 x2 + 2 Для построения модели мы располагаем информацией, представленной в таблице 5.4 Таблица 5.4. Фактические данные для построения модели n у1 у2 х1 х2 1 33,0 37,1 3 11 2 45,9 49,3 7 16 3 42,2 41,6 7 9 4 51,4 45,9 10 9 5 49,0 37,4 10 1 6 49,3 52,3 8 16 Сумма 270,8 263,6 45 62 Средн.знач. 45,133 43,930 7,500 10,333 Структурную модель преобразуем в приведенную форму модели. y1= d11 x1 + d12 x2 + u1 y2= d21 x1 + d22 x2 + u2 u1 и u1 – случайные ошибки. Для каждого уравнения приведенной формы при расчете коэффициентов d можно применить МНК. Для упрощения расчетов можно работать с отклонениями от средних уровней y=y-ycp и x=x-xcp (ycp и xcp –средние значения). Преобразованные таким образом данные таблицы 5.4 сведены в таблицу 5.5. Здесь же показаны промежуточные расчеты, необходимые для определения коэффициентов dik. Переменные, означающие отклонение от средних значений изображаются далее жирным шрифтом и курсивом. Для нахождения коэффициентов d1k первого приведенного уравнения можно использовать следующую систему нормальных уравнений: Σ y1 x1= d11 Σ x12 + d12 Σ x1 x2 Σ y1 x2= d11 Σ x1 x2 + d12 Σ x22 Таблица 5.5 Преобразованные данные для построения приведенной формы модели n у1 у2 х1 х2 у1*х1 х12 х1*х2 у1*х2 у2*х1 у2*х2 х22 1 -12,133 -6,784 -4,500 0,667 54,599 20,250 -3,002 -8,093 30,528 -4,525 0,445 2 0,767 5,329 -0,500 5,667 -0,383 0,250 -2,834 4,347 -2,664 30,198 32,115 3 -2,933 -2,308 -0,500 -1,333 1,467 0,250 0,667 3,910 1,154 3,077 1,777 4 6,267 1,969 2,500 -1,333 15,668 6,250 -3,333 -8,354 4,922 -2,625 1,777 5 3,867 -6,541 2,500 -9,333 9,667 6,250 -23,333 -36,091 -16,353 61,048 87,105 6 4,167 8,337 0,500 5,667 2,084 0,250 2,834 23,614 4,168 47,244 32,115 Сумма 0,002 0,001 0,000 0,002 83,102 33,500 -29,001 -20,667 21,755 134,417 155,334 Подставляя рассчитанные в таблице 5.5 значения сумм, получим 83,102= 33,5 d11 - 29,001d12 -20,667= -29,001d11 + 155,334d12 Решение этих уравнений дает значения d11 = 2,822 и d12 = 0,394. Первое уравнение приведенной формы модели примет вид y1= 2,822 x1 + 0,394 x2 + u1 Для нахождения коэффициентов d2k второго приведенного уравнения можно использовать следующую систему нормальных уравнений: Σ y2 x1= d21 Σ x12 + d22 Σ x1 x2 Σ y2 x2= d21 Σ x1 x2 + d22 Σ x22 Подставляя рассчитанные в таблице 5.5 значения сумм, получим 21,755 = 33,5 d21 - 29,001d22 134,417= -29,001d21 + 155,334d22 Решение этих уравнений дает значения d21 =1,668 и d22 =1,177. Второе уравнение приведенной формы модели примет вид y2= 1,668 x1 + 1,177 x2 + u2 Для перехода от приведенной формы к структурной форме модели найдем x2 из второго уравнения приведенной формы модели x2 = (y2 - 1,668 x1 ) / 1,177 Подставим это выражение в первое уравнение приведенной модели, найдем структурное уравнение y1= 2,822 x1 + 0,394 (y2 - 1,668 x1 ) / 1,177 = = 2,822 x1 + 0,335 y2 - 0,558 x1 = 0,335 y2 + 2,264 x1 Таким образом, b12 = 0,335; a11 = 2,264. Найдем x1 из первого уравнения приведенной формы модели x1 = (y1 - 0,394 x2 ) / 2,822 Подставим это выражение во второе уравнение приведенной модели, найдем структурное уравнение y2= 1,177 x2 + 1,668 (y1 - 0,394 x2 ) / 2,822 = = 1,177 x2 + 0,591 y1 - 0,233 x2 = 0,591 y1 + 0,944 x2 Таким образом, b21 = 0,591; a22 = 0,944. Свободные члены структурной формы находим из уравнений А01= y1,cp - b12 y2,cp - a11 x1,cp = 45,133 – 0,335 * 43,93 –2,264* 7,5 = 13,436 А02= y2,cp - b21 y1,cp - a22 x2,cp = 43,93 – 0,591* 45,133 - 0,944 * 10,333= 7,502 Окончательный вид структурной модели y1= a01+ b12 y2 + a11 x1 + 1= 13,436 + 0,335 y2 + 2,264 x1 + 1 y2= a02+ b21 y1 + a22 x2 + 2= 7,502 + 0,591 y1 + 0,944 x2 + 2 Вопрос 2. Трехшаговый метод наименьших квадратов. Двухшаговый метод наименьших квадратов состоит в том, что оценивают параметры отдельного уравнения системы, а не рассматривают систему в целом. В то же время трехшаговый метод наименьших квадратов применяется для оценки параметров системы одновременных уравнений в целом. Сначала к каждому уравнению применяется двухшаговый метод с целью оценить коэффициенты и погрешности каждого уравнения, а затем построить оценку для ковариационной матрицы погрешностей, После этого для оценивания коэффициентов всей системы применяется обобщенный метод наименьших квадратов При несоблюдении основных предпосылок обычного метода наименьших квадратов приходится корректировать модель: изменять ее форму, добавлять или, наоборот, исключать факторы, преобразовывать исходные данные и т.п. Особенно часто на практике приходится сталкиваться с ситуациями, в которых не выполняются предпосылки 3 и 4 о том, что возмущения модели имеют постоянную дисперсию и не коррелированны между собой. Невыполнение предпосылки 3, т.е. нарушение условия гомоскедастичности возмущений Error: Reference source not found, означает, что дисперсия возмущения зависит от значений факторов. Такие регрессионные модели называются моделями с гетероскедастичностью возмущений. Например, при исследовании зависимости стоимости туристической путевки (переменная Y) от среднемесячного дохода клиента турагенства (фактор X) можно ожидать, что для более обеспеченных клиентов разброс расходов на отдых выше, чем для менее обеспеченных, т.е. дисперсия возмущений не будет одинаковой для разных значений фактора X (рис. 1). рис. 1. Линейная модель регрессии с гетероскедастичностью возмущений Если имеет место гетероскедастичность возмущений, то оценки параметров модели Error: Reference source not found обычным методом наименьших квадратов не будут эффективными, т. е. их дисперсии не будут наименьшими. Рассчитанные значения стандартных ошибок коэффициентов уравнения регрессии Error: Reference source not found могут быть заниженными, а при проверке статистической значимости коэффициентов может быть ошибочно принято решение об их значимом отличии от нуля, тогда как на самом деле это не так. При малом числе наблюдений, что характерно для эконометрических исследований, для выявления гетероскедастичности может использоваться метод Голдфельда–Квандта. Данный тест используется, если предполагается, что возмущения регрессионной модели распределены по нормальному закону, а среднее квадратическое отклонение возмущений (i=1, 2, …, n) возрастает пропорционально значению фактора. Проверка проводится для всех факторов, включенных в модель, либо только для факторов, предположительно влияющих на однородность исследуемой совокупности. Проверка по некоторому фактору Xj выполняется в следующей последовательности: 1. Все n остатков упорядочиваются по возрастанию значений фактора Xj. 2. В упорядоченном ряду выбирают k первых и k последних остатков, при этом k должно быть больше числа факторов, включенных в модель. Обычно принимают . Центральные остатки, таким образом, исключаются из рассмотрения. 3. По каждой из групп выбранных остатков определяется сумма их квадратов: и . 4. Рассчитывается F-статистика Фишера по формуле , если SS1>SS2, или по формуле , если SS2>SS1. 5. Статистическая гипотеза об одинаковой дисперсии возмущений не отклоняется, если F-статистика не превышает табличное значение F-критерия Фишера для принятого уровня значимости  и чисел степеней свободы числителя и знаменателя , где р — число факторов в модели (см. приложение). Предпосылка 4 [условие Error: Reference source not found] может не выполняться при построении регрессионной модели по временным рядам исследуемых переменных, где ввиду наличия тенденции последующие уровни ряда могут зависить от предыдущих уровней. В таком случае говорят, что в модели имеется автокорреляция возмущений. Другими причинами автокорреляции являются: • неучет в модели какого-либо важного фактора; • неправильный выбор формы регрессионной зависимости; • наличие ошибок измерения результативного признака; • цикличность значений экономических показателей; • запаздывание изменения значений показателей по отношению к изменению экономических условий. При наличии автокорреляции возмущений обычный метод наименьших квадратов дает несмещенные и состоятельные оценки параметров модели, которые однако неэффективны, т. е. их дисперсии не будут наименьшими. По сравнению с гетероскедастичностью возмущений автокорреляция приводит, наоборот, к завышению стандартных ошибок коэффициентов уравнения регрессии. На основе таких результатов может быть сделан ошибочный вывод о несущественном влиянии исследуемого фактора на зависимую переменную, в то время как на самом деле влияние фактора на нее значимо. Автокорреляция возмущений бывает положительной или отрицательной. Положительная автокорреляция проявляется в том, что завышенные значения возмущений предыдущих наблюдений результата Y приводят к завышению возмущений последующих наблюдений. На графике временного ряда остатков регрессии это выражается, например, в чередовании зон положительных и отрицательных остатков (рис. 2). При отрицательной автокорреляции, наоборот, завышенные значения возмущений предыдущих наблюдений занижают возмущения последующих наблюдений, а остатки регрессии «слишком часто» меняют знак (рис. 3). Автокорреляцию возмущений выявляют путем исследования ряда остатков с помощью разных критериев. Наиболее часто для этой цели используется тест Дарбина–Уотсона, основанный на предположении, что если имеется автокорреляция возмущений, то она присутствует и во временном ряду остатков регрессии. Тест основан на расчете d‑статистики , () значение которой сравнивают с критическими значениями d1 и d2 (см. приложение). При этом могут возникнуть следующие ситуации: • если , то возмущения признаются некоррелированными; • если , то имеется положительная автокорреляция возмущений; • если , то существует отрицательная автокорреляция; • если или , то это указывает на неопределенность ситуации. В последнем случае для выявления автокорреляции используется коэффициент автокорреляции остатков первого порядка . () Статистическая гипотеза об отсутствии автокорреляции возмущений не отклоняется на принятом уровне значимости , если коэффициент автокорреляции не превышает по абсолютной величине критическое значение (см. приложение). В противном случае делают вывод об автокорреляции возмущений: положительное значение коэффициента автокорреляции указывает на положительную автокорреляцию, а отрицательное — соответственно на отрицательную. рис. 2. Модель регрессии с положительной автокорреляцией возмущений рис. 3. Модель регрессии с отрицательной автокорреляцией возмущений Невыполнение предпосылок 3 и 4 означает, что ковариации и дисперсии возмущений могут быть произвольными, т. е. задаваться некоторой положительно определенной матрицей : , () где  — ковариационная матрица вектора возмущений. Модель множественной регрессии, для которой выполняется условие (), называется обобщенной линейной моделью множественной регрессии (Generalized Linear Multiple Regression Model). Для получения несмещенных и наиболее эффективных оценок параметров такой модели применяют обобщенный метод наименьших квадратов (Generalized Least Squares), условие которого имеет вид: . () Вектор оценок b* параметров обобщенной модели определяется как . () Следует заметить, что коэффициент детерминации R2 для обобщенной модели не является удовлетворительной мерой ее качества и может использоваться лишь как приближенная характеристика модели. На практике ковариационная матрица вектора возмущений , как правило, неизвестна, и для реализации обобщенного метода наименьших квадратов приходится вводить дополнительные условия на структуру матрицы . Поэтому устранение гетероскедастичности и автокорреляции возмущений производят раздельно, для чего используют частные случаи обобщенного метода наименьших квадратов. Вопрос 3. Применение систем эконометрических уравнений в эконометрических исследованиях. Применение систем эконометрических уравнений представляет собой непростую задачу. Проблемы здесь происходят из-за ошибок спецификации. Основной областью применения эконометрических моделей является построение макроэкономических моделей экономики целой страны. Это, главным образом, мультипликаторные модели кейнсианского типа. Более совершенными по сравнению со статическими моделями являются динамические модели экономики, которые содержат в правой части лаговые переменные и учитывают тенденцию развития (фактор времени). Значительные трудности создает невыполнение условия независимости факторов, которое в корне нарушается в системах одновременных (взаимозависимых) уравнений. Использование корреляционно-регрессионного анализа в контексте структурного моделирования — это попытка подойти к выделению и измерению причинных связей переменных. Для этого следует сформулировать гипотезы о структуре влияний и корреляции. Такая система причинных гипотез и соответствующих взаимосвязей изображается графом, вершины которого — это переменные (причины или следствия), а дуги — причинные отношения. Верификация гипотез требует установления соответствия между графом и системой уравнений, описывающей этот граф. Структурные модели эконометрики представляются системой линейных по отношению к наблюдаемым переменным уравнений. Если алгебраическая система соответствует графу без контуров (петель), то она является рекурсивной системой. Такая система позволяет рекуррентно определять значения входящих в нее переменных. В ней в уравнения для признака включаются все переменные, кроме тех, которые расположены выше него по графу. Соответственно формулировка гипотез в структуре рекуррентной модели довольно проста, при условии использования данных динамики. Рекурсивная система уравнений позволяет определить полные и частные коэффициенты влияния факторов. Коэффициенты полного влияния измеряют значение каждой переменной в структуре. Структурные модели позволяют оценить полное и непосредственное влияние переменных, прогнозировать поведение системы, рассчитывать значения эндогенных переменных. Если нужно всего лишь уточнить характер связей переменных, то используют метод путевого анализа (путевых коэффициентов). В основе его лежит гипотеза об аддитивном характере (аддитивность и линейность) связей между переменными. К сожалению, применение путевого анализа в социально-экономических исследованиях затруднено тем, что не всегда линейная зависимость удовлетворительно выражает все разнообразие причинно-следственных связей в реальных системах. Значимость результатов анализа определяется правильностью построения максимально связного графа и, соответственно, изоморфной математической модели в виде системы уравнений. В то же время важным достоинством путевого анализа является возможность производить декомпозицию корреляций. В зависимости от характера ограничений и статистической структуры переменных эконометрические модели классифицируются на линейные модели с одной, двумя и большим числом переменных, а также на пробит-модели, логит-модели, тобит-модели и др. Применение систем эконометрических уравнений представляет собой непростую задачу. Основной областью применения эконометрических моделей является построение макроэкономических моделей экономики целой страны. Это, главным образом, мультипликаторные модели кейнсианского типа. Литература 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998. 2. Балдин К.В., Быстров О.Ф., Соколов М.М. Эконометрика: Учеб. пособие для вузов. — М.: ЮНИТИ–ДАНА, 2004. — 254 с. 3. Доугерти К. Введение в эконометрику.—М.: ИНФРА-М, 1997. —402 с. 4. Дрейпер Н, Смит Г. Прикладной регрессионный анализ. — М.: Статистика, 1973. — 392 с. 5. Елисеева И.И. Практикум по эконометрике: Учебное пособие. – М. : Финансы и статистика, 2001. 6. Елисеева И.И. Эконометрика: Учебник. - М.: Финансы и статистика, 2001. 7. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. — М.: ЮНИТИ-ДАНА, 2002. — 311 с. 8. Орлов А.И. Эконометрика: Учеб. пособие для вузов – М.: «Экзамен», 2002. 9. Орлова И.В. Экономико-математические методы и модели. Выполнение расчетов в среде EXCEL: Практикум: Учебное пособие / И. В. Орлова; ВЗФЭИ. - М.: Финстатинформ, 2000. - 136с. 10. Орлова И.В. Экономико-математическое моделирование. Практическое пособие по решению задач / И. В. Орлова; ВЗФЭИ. - М.: Вузовский учебник, 2004. - 144с. 11. Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учеб. пособие – М.: Вузовский учебник, 2007. 12. Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. — М.: Финансы и статистика, 2002. — 192 с. 13. Практикум по эконометрике: Учебное пособие / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2001,2002,2003,2004. - 192с 14. Эконометрика: Методические указания по изучению дисциплины и выполнению контрольной и аудиторной работы на ПЭВМ для студентов III курса по специальностям «Финансы и кредит», «Бухгалтерский учет, анализ и аудит», «Экономика труда» . — М.: Вузовский учебник, 2005. — 122 с. 15. Эконометрика: Учебник / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2001,2002,2003,2004 . - 344с. 16. Эконометрика: Учебник / Под ред. И.И.Елисеевой. - 2-е изд.; перераб. и доп. - М.: Финансы и статистика, 2005. - 576с. 17. Эконометрика: Учебник / Под ред. И.И. Елисеевой. — М.: Финансы и статистика, 2002. — 344 с.