«Эконометрика» - конспект лекции

Конспект лекции по дисциплине «Эконометрика», Word формат

ЭКОНОМЕТРИКА Эконометрика как самостоятельное знание Эконометрическое знание выделилось и сформировалось как закономерный результат развития и взаимодействия экономической теории, экономической статистики, математической статистики и теории вероятностей. Эконометрика формулирует собственные предмет, цель и задачи исследования. При этом содержание эконометрики, ее структура и область применения тесно связаны с перечисленными науками. Взаимосвязь эконометрики с другими науками Эконометрика Другие науки Изучаются экономические явления с точки зрения количественных характеристик Экономическая теория Изучаются качественные аспекты экономических явлений Осуществляется опытная проверка экономических законов Математическая экономика Получают выражение экономических законов в форме математических моделей Применяется инструментарий экономической статистики для анализа и прогноза экономических взаимосвязей Экономическая статистика Собираются, обрабатываются и представляются экономические данные в наглядном виде Применяется аппарат математической статистики в силу случайного характера большей части экономических показателей Математическая статистика Разрабатываются методы анализа данных в зависимости от целей исследования Понятие «Эконометрика» Термин «эконометрика» экономисты начали применять благодаря исследованиям П.Цъемпы (1910), Й. Шумпетера (1923), Р. Фриша (1930). Этот термин появился в результате соединения двух слов: «экономика» и «метрика». В переводе с греческого oikonomos (экономист) – это управляющий домом, метрика ( metrihe, metron) – мера, размер. Ученые-эконометристы, признанные авторитеты в области эконометрических исследований, по-разному подходили к определению эконометрики. Приведем примеры их высказываний. Формулировки определений понятия «эконометрика» Автор Содержание понятия «Эконометрика» Р.Фриш «…есть единство трех составляющих – статистики, экономической теории и математики» Ц.Грилихес «…является одновременно нашим телескопом и нашим микроскопом для изучения окружающего экономического мира» Э.Маленво «…наполняет эмпирическим содержанием априорные экономические рассуждения» С.Фишер «…занимается разработкой и применением статистических методов для измерения взаимосвязей между экономическими переменными» С.Айвазян «…объединяет совокупность методов и моделей, позволяющих придавать количественные выражения качественным зависимостям» Анализ подходов к определению эконометрики, а также состояние эконометрической науки позволяют сформулировать цель эконометрики, которая достигается решением определенных задач. Цель эконометрики Задачи эконометрики Задачи эконометрики 1. Спецификация модели. Построение эконометрических моделей для эмпирического анализа. 2. Параметризация модели. Оценка параметров построения модели 3. Верификация модели. Проверка качества параметров модели и самой модели в целом 4. Прогнозирование модели. Составление прогноза и рекомендаций для конкретных экономических явлений по результатам эконометрического моделирования Эконометрическая модель Основой механизма эконометрического моделирования является эконометрическая модель. Экономический объект в такой модели описывается и изучается с помощью эмпирических (статистических) данных. Эконометрическая модель учитывает реальные условия существования объекта и не противоречит общим законам экономики. Ошибка предсказаний по такой модели не превосходит заданной величины. Общий вид эконометрической модели : Y=f(X) + ɛ, где Y — наблюдаемое значение зависимой переменной (объясняемая переменная, результат); f(X) — объясненная часть, которая зависит от значений объясняющих переменных (факторов); ɛ — случайная составляющая (ошибка, возмущение). Объясняемая переменная Y — случайная величина с некоторым распределением при заданных значениях объясняющих переменных Xi (i = 1, ..., п). Объясняющие переменные в модели могут иметь случайные или определенные значения. Задачи эконометрического моделирования: 1. Определить объясненную часть, пользуясь экспериментальными данными. 2. Получить оценки параметров распределения случайной составляющей, рассматривая ее как случайную величину. Эконометрическая модель является главным инструментом эконометрики и предназначена для анализа и прогноза экономических явлений и объектов. В связи с этим все эконометрические модели условно делят на три класса. Классы эконометрических моделей I. Регрессионные модели с одним уравнением. Результативный признак представлен в виде функции от факторных признаков Y= f (X1, X2 , ..., Хk) + ɛ. Объясненная составляющая f (X1, X2 , ..., Хk) это Mx(Y), т.е. ожидаемое значение результата Y при заданных значениях факторов X1, X2 , ..., Хk. Уравнение регрессионной модели имеет вид: Y= Mx(Y) + ɛ. II. Системы одновременных уравнений. Состоят из тождеств и регрессионных уравнений, в которых наряду с факторными признаками включены результативные признаки из других уравнений системы. Таким образом, в системе уравнений одни и те же переменные одновременно рассматриваются как зависимые переменные в одних уравнениях и независимые — в других. В тождествах вид и значения параметров известны, в уравнениях параметры оценивают. III. Модели временных рядов. Результативный признак является функцией переменной времени или переменных, относящихся к другим моментам времени Примеры эконометрических моделей каждого класса I. Регрессионные модели с одним уравнением. Модель цены от объема поставки. Модель спроса от цены на отдельный товар от реальных доходов потребителей. Модель зависимости объема производства от производственных факторов. II. Системы одновременных уравнений. Модель спроса и предложения. Кейнсианская модель формирования доходов. III. Модели временных рядов. Модели, описывающие зависимость от времени: ■ тренда ■ сезонности ■ тренда и сезонности Модели, представляющие зависимость результата от переменных, датированных другими моментами времени: ■ с распределенным лагом. Эконометрические модели отражают свойства изучаемых объектов или явлений, например: • свойство времени двигаться вперед (экономические явления происходят в пространстве и во времени) используется в моделях временных рядов; • свойство динамического равновесия многих экономических явлений применяется в решении систем одновременных уравнений; • свойство прошлых, настоящих и будущих значений переменных влиять на текущее состояние экономического явления реализуется в моделях авторегрессии и автокорреляции, в моделях адаптивного прогноза; • свойство временной задержки (лага) между причиной и следствием экономического явления проявляется в моделях с распределенным лагом; • свойство цикличности большого количества экономических явлений находит место в моделях временных рядов с сезонной составляющей. Типы данных и виды переменных в эконометрическом моделировании 1. Пространственные. Набор сведений по разным объектам, взятым за один и тот же период времени, например, объем производства предприятий региона, численность сотрудников институтов города. 2. Временные. Набор сведений, характеризующий один и тот же объект за разные периоды времени, например индекс потребительских цен, численность занятых за последние годы. Объект эконометрического моделирования характеризуется многими признаками. Признаки в модели взаимосвязаны и выступают либо в роли результата (объясняемой переменной), либо в роли фактора (объясняющей переменной). Переменные эконометрической модели любого класса условно делят на следующие виды. Виды переменных 1. Экзогенные (независимые, х) их значения задаются извне модели. 2. Эндогенные (зависимые, у) их значения определяются внутри модели. 3. Лаговые (экзогенные или эндогенные) датируются предыдущими моментами времени и находятся в уравнении с текущими переменными. 4. Предопределенные (лаговые и текущие экзогенные переменные, лаговые эндогенные переменные). ВАЖНО! Эконометрическая модель каждого класса направлена на объяснение значений текущих эндогенных переменных в зависимости от значений предопределенных переменных. Моделирование зависит от объема совокупности (выборки). ВАЖНО! Количество значений переменной или объем выборки должен быть в 6—7 раз больше количества факторов модели. Эконометрическое моделирование представляет собой комплексное решение целого ряда задач, поэтому весь процесс разделен на этапы. Такое разделение условно, однако позволяет понять сущность действий эконометриста. Этапы эконометрического моделирования Содержание этапов эконометрического моделирования 1. Постановочный. Формулируем цель исследования (анализ, прогноз, имитация развития, управленческое решение и т.д.), определяем экономические переменные модели. 2. Априорный. Анализируем изучаемое экономическое явление: формируем и формализуем информацию, известную до начала моделирования. 3. Параметризации. Определяем вид экономической модели, выражаем в математической форме взаимосвязь между ее переменными, формулируем исходные предпосылки и ограничения модели. 4. Информационный. Собираем необходимую статистическую информацию. 5. Идентификации модели. Проводим статистический анализ модели, оцениваем качество ее параметров. 6. Верификации модели. Проверяем истинность модели, определяем, насколько соответствует построенная модель реальному экономическому явлению. Отметим, что чем шире круг задач, решаемых в пределах одного исследования, тем меньше шансов получить эффективный результат. Парная регрессия и корреляция Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками вовсе не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами. Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие — в качестве результатов действия этих факторов. Иными словами, одни представляют собой причину, другие — следствие. Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины — факторными (независимыми, объясняющими переменными х). Различают два типа зависимости между явлениями и их признаками: функциональную, или жестко детерминированную (например, зависимость выработки продукции на одного рабочего от объема выпущенной продукции и численности рабочих), и статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции). Понятие функциональной и статистической зависимости Функциональная зависимость – это связь, при которой каждому значению независимой переменной х соответствует точно определенное значение зависимой переменной у. Функциональная зависимость чаще всего встречается в естественных науках. Реже подобные связи наблюдаются в общественной жизни, в частности в экономических процессах. Для социально-экономических явлений характерно то, что наряду с существенными факторами на них оказывают воздействие многие другие, в том числе случайные факторы. В связи с этим существующая зависимость не проявляется здесь в каждом отдельном случае, как при функциональных связях, а лишь «в общем и среднем» при большом числе наблюдений. В этом случае говорят о статистической зависимости. Статистическая зависимость – это связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем неизвестно заранее, какое именно значение примет у. Частным случаем статистической зависимости является корреляционная зависимость. Корреляционная зависимость – это связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у. Корреляционная связь является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев. Известно, например, что повышение квалификации работника ведет к росту производительности труда. Это положение подтверждается в массе явлений и не означает, что у двух или более рабочих одного разряда, занятых аналогичным процессом, будет одинаковая производительность труда. Уровни их выработки будут различаться, хотя и незначительно, так как у этих рабочих могут быть различными - стаж работы, техническое состояние станка, состояние здоровья и т.д. Из этого следует, что статистическая зависимость свойство совокупности в целом, а не отдельных ее единиц. Особенности зависимости Функциональная. Всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике). С одинаковой силой проявляется у всех единиц совокупности. Является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения. Корреляционная. Разнообразие факторов, их взаимосвязи и противоречивые действия вызывают широкое варьирование переменной у. Обнаруживается не в единичных случаях, a в массе и требует для своего исследования массовых наблюдений. Связь между переменными х и у неполная и проявляется лишь в средних величинах. Виды функциональной и корреляционной зависимости Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная. Функциональная и корреляционная зависимость Прямая. С увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака. Обратная. С увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака. По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной). Функциональная и корреляционная зависимость Прямолинейная. С возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражаются уравнением прямой линии). Криволинейная. С возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно (выражаются уравнениями кривых линий). В зависимости от количества признаков, включенных в модель, корреляционные связи делят на однофакторные и многофакторные. Корреляционные связи Однофакторные (парные). Связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других). Многофакторные (множественные). Связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи). Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа. Корреляционно-регрессионный анализ Корреляционно-регрессионный анализ проводится поэтапно в определенной логической последовательности. Этапы проведения комплексного корреляционно-регрессионного анализа 1. Предварительный анализ явлений и выявление причин возникновения взаимосвязей между признаками, характеризующими эти явления. 2. Разделение признаков на факторные и результативные, выбор наиболее существенных признаков для их исследования на предмет включения в корреляционно-регрессионные модели. 3. Построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков корреляционно-регрессионных моделей. 4. Предварительная оценка формы уравнения регрессии. 5. Решение уравнения регрессии, вычисление коэффициентов регрессии и их смысловая интерпретация. 6. Расчет теоретически ожидаемых (воспроизведенных по уравнению регрессии) значений результативного признака. 7. Определение и сравнительный анализ дисперсий: обшей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель. 8. Общая оценка качества модели, отсев несущественных (или включение дополнительных) факторов, построение модели, т.е. повторение п. 1—7. 9. Статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых по уравнению регрессии значений функции. 10. Практические выводы из анализа. Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной х на переменную у и представляющая собой однофакторный корреляционный и регрессионный анализ. Понятие корреляционного анализа Корреляционный анализ – это раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Применяется тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону. ВАЖНО! Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Понятие корреляции Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. Варианты корреляции Парная. Связь между двумя признаками (результативным и факторным или двумя факторными). Частная. Зависимость между результативным и одним факторным признаками или двумя факторными признаками при фиксированном значении других факторных признаков. Множественная. Зависимость между результативным признаком и двумя и более факторными признаками, включенными в исследование. Теснота связи количественно выражается величиной коэффициентов корреляции. Построение коэффициентов корреляции основано на сумме произведений отклонений индивидуальных значений признаков хi и уi от их средних значений и : Эта величина, деленная на число единиц совокупности п, называется ковариацией. Она характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных. Формула определения ковариации где п — объем исследуемой совокупности; хi — i-е значение независимой переменной (i = 1, 2, ..., n); yi — i-е значение зависимой переменной (i = 1, 2, ..., n); — среднее значение независимой переменной. Определяется по формуле ; — среднее значение зависимой переменной. Определяется по формуле . При наличии прямой связи большие значения х должны сочетаться с большими значениями у, следовательно, отклонения и будут положительными. Для малых значений х и у эти отклонения будут отрицательными, а их произведения — положительными. Значит, при прямой связи ковариация будет величиной положительной. При наличии обратной связи отклонения и будут иметь разные знаки (большие значения х сочетаются с меньшими значениями у и наоборот). Ковариация будет отрицательной величиной. Наконец, при отсутствии связи сочетание знаков отклонений и будет беспорядочным, при суммировании отрицательные и положительные произведения и будут взаимно погашаться и ковариация будет близка к нулю. Размер ковариации зависит от масштаба признаков х и у. Для получения относительной характеристики связи ковариацию делят на максимально возможное значение, равное произведению средних квадратических отклонений двух признаков σх, σу. В результате получают линейный коэффициент корреляции. Формула линейного коэффициента корреляции где σх, σу – средние квадратические отклонения случайных величин x и y . Определяются по формулам: , . Для расчета линейного (парного) коэффициента корреляции можно воспользоваться также следующими формулами: 1) где - средняя арифметическая произведения двух величин. Определяется по формуле: 2) 3) ВАЖНО! Коэффициент корреляции принимает значение от — 1 до +1. Положительное значение коэффициента свидетельствует о наличии прямой связи, отрицательное — обратной. Если ryх = ±1, корреляционная связь представляется линейной функциональной зависимостью. При ryх = 0 линейная корреляционная связь отсутствует. Качественные характеристики связи Значение Характер связи От 0 до |±0,3| Практически отсутствует От |±0,3| до |±0,5| Слабая От |±0,5| до |±0,7| Умеренная От |±0,7| до |±1,0| Сильная Коэффициенты корреляции как статистические величины подвергаются в анализе оценке на достоверность. Это объясняется тем, что любая совокупность наблюдений представляет собой некоторую выборку, следовательно, значение любого показателя, вычисленное на основе выборки, не может рассматриваться как истинное, а является только более или менее точной его оценкой. В связи с этим возникает необходимость проверки существенности (значимости) показателей. Для оценки значимости коэффициента корреляции используют t-критерий Стъюдента (t-статистику), который применяется при t -распределении, отличном от нормального. При этом выдвигается и проверяется нулевая гипотеза (Н0) о равенстве ryх нулю, т.е. Н0: ryх = 0. Если нулевая гипотеза отвергается, то коэффициент корреляции признается значимым, а связь между переменными существенной. Формула расчета t-критерия Стьюдента где k – число факторных признаков, включенных в модель/ Значение t-критерия сравнивают с табличным tαγ , где α — заданный уровень значимости (обычно принимается равным 0,05 или 0,01); γ = (n — k — 1) — число степеней свободы. ВАЖНО! Если выполняется неравенство t > tαγ , то значение коэффициента корреляции признается значимым, т.е. нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается и делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь. Зная линейный коэффициент корреляции, можно определить парный коэффициент детерминации, он представляет собой . Парный коэффициент детерминации () показывает, какая доля вариации переменной у учтена в модели и обусловлена влиянием на нее переменной х. Сущность регрессионного анализа ВАЖНО! Регрессионный анализ заключается в определении аналитической формы связи, в которой изменение результативного признака обусловлено влиянием одного или нескольких факторных признаков, а множество всех прочих факторов, также оказывающих влияние на результативный признак, принимается за постоянные и средние значении Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака от факторных признаков. Основной предпосылкой регрессионного анализа является то, что только результативный признак подчиняется нормальному закону распределения, а факторные признаки произвольному закону распределения. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным и факторными признаками. Уравнение регрессии Уравнение регрессии, или модель связи социально-экономических явлений, выражается функцией Парная регрессия (характеризует связь между двумя признаками: результативным и факторным) Множественная регрессия (характеризует связь между результативным признаком и двумя и болев факторными признаками) Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения требований его построения. Требования к построению уравнения регрессии • Совокупность исходных данных должна быть однородной и математически описываться непрерывными функциями. • Наличие достаточно большого объема исследуемой выборочной совокупности. • Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей. • Причинно-следственные связи между явлениями и процессами, по возможности, следует описывать линейной (или приводимой к линейной) формой зависимости. • Отсутствие количественных ограничений на параметры модели. • Количественное выражение факторных признаков. • Постоянство территориальной и временной структуры изучаемой совокупности. Теоретическая обоснованность моделей Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий. Условия теоретической обоснованности моделей • Все признаки и их совместные распределения должны починяться нормальному закону распределения. • Дисперсия моделируемого признака должна все время оставаться постоянной при изменении величины и значений факторных признаков. • Отдельные наблюдения должны быть независимыми, т.е. результаты, полученные в i-м наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них. Форма связи может быть выражена как линейной функцией (уравнение прямой), так и нелинейными функциями (полиномы разных порядков, гипербола, степенная функция и др.). Подбор функции для выражения формы связи между признаками проходит несколько этапов: графический, логический, экономический, а также математическую проверку близости эмпирических данных к теоретическим. Часто для выражения формы корреляционной связи подходит одновременно несколько функций, поэтому желательно дать окончательное обоснование выбора функции для выражения формы связи на альтернативной основе. Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма регрессии. Уравнение линейной парной регрессии Уравнение линейной парной регрессии – это: ух = а0 — a1xi, — ɛi, где а0,a1 - параметры модели; ɛi - случайная величина (величина остатка). Параметры модели и их содержание Параметр Содержание параметра а0 Свободный коэффициент (член) регрессионного уравнения. Не имеет экономического смысла и показывает значение результативного признака у, если факторный признак х = 0. a1 Коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак у, если переменную х увеличить на единицу измерения. Знак при коэффициенте регрессии показывает направление связи: при a1 > 0 — связь прямая; при a1 < 0 — связь обратная ɛi Независимая, нормально распределенная случайная величина, остаток с нулевым математическим ожиданием (M ɛ = 0) и постоянной дисперсией (Dɛ = σ2). Отражает тот факт, что изменение у будет неточно описываться изменением х, так как присутствуют другие факторы, не учтенные в данной модели. Оценка параметров модели а0 и a1 осуществляется методом наименьших квадратов. Сущность метода наименьших квадратов заключается в том, что отыскиваются такие значения параметров модели (а0 и a1), при которых сумма квадратов отклонений фактических значений результативного признака уi от вычисленных по уравнению регрессии будет наименьшей из всех возможных: Система нормальных уравнений для нахождения параметра линейной парной регрессии методом наименьших квадратов Система нормальных уравнений: Формулы для определения значения параметров а0 и a1 Расчет параметров а0 и a1: ; . Параметр a1 нельзя использовать для непосредственной оценки влияния факторного признака на результативный признак из-за различия единиц измерения исследуемых показателей. Для этих целей вычисляют коэффициент эластичности и бета-коэффициент. Формула определения коэффициента эластичности Коэффициент эластичности: . ВАЖНО! Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак у при изменении факторного признака х на один процент. Формула определения бета-коэффициента Бета-коэффициент: , где и — средние квадратичсские отклонения случайных величин х и у. ВАЖНО! Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднего квадратического отклонения. Проверка адекватности и точности уравнения регрессии После того как уравнение регрессии построено, выполняется проверка его адекватности и точности. Эти свойства модели исследуются на основе анализа ряда остатков ɛi (отклонений расчетных значений от фактических). Уровень ряда остатков: Корреляционный и регрессионный анализ (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. В связи с этим показатели регрессии, корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенной модели. Проверка адекватности модели • Определение значимости модели. • Установление наличия или отсутствия систематической ошибки. Значения , соответствующие данным при теоретических значениях а0 и a1, случайные. Случайными будут и рассчитанные по ним значения коэффициентов а0 и a1. Проверка значимости отдельных коэффициентов регрессии проводится по t-критерию Стьюдента путем проверки гипотезы о равенстве нулю каждого коэффициента регрессии. При этом выясняют, насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатом действия случайных величин. Для соответствующих коэффициентов регрессии применяют соответствующие формулы. Формулы для определения t -критерия Стьюдента t - критерии Стьюдента для оценки коэффициентов регрессии где Sa0 , Sa1 — стандартные отклонения свободного члена и коэффициента регрессии. Определяются по формулам ; , где Sɛ — стандартное отклонение остатков модели (стандартная ошибка оценки). Определяется по формуле Расчетные значения t-критерия сравнивают с табличным значением критерия tα,γ , которое определяется при (n — k — 1) степенях свободы и соответствующем уровне значимости α. ВАЖНО! Если расчетное значение t-критерия превосходит его табличное значение tα,γ , то параметр признается значимым. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. Для проверки значимости уравнения регрессии в целом используют F-критерий Фишера. В случае парной линейной регрессии значимость модели регрессии определяется по следующей формуле: Формула определения F-критерия Фишера F-критерий Фишера: ВАЖНО! Если при заданном уровне значимости расчетное значение F-критерия с γ1 = k , γ2 = n – k – 1 степенями свободы больше табличною, то модель считается значимой, гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Проверка наличия или отсутствия систематической ошибки (выполнения предпосылок метода наименьших квадратов — МНК) осуществляется на основе анализа ряда остатков. Требования, при которых модель считается адекватной • Уровни ряда остатков имеют случайный характер. • Математическое ожидание уровней ряда остатков равно нулю. • Дисперсия каждого отклонения одинакова дня всех значений хi. • Значения уровней ряда остатков независимы друг от друга (отсутствует автокорреляция). • Уровни ряда остатков распределены по нормальному закону. Соблюдение требований, которым должен удовлетворять ряд остатков Требование Метод проверки требований Первое Для проверки свойства случайности ряда остатков можно использовать критерий поворотных точек (пиков). Точка считается поворотной, если выполняются следующие условия: ɛ i-1 < ɛ i > ɛ i+1 или ɛ i-1 > ɛ i < ɛ i+1. Далее подсчитывается число поворотных точек р. Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства: Квадратные скобки означают, что берется целая часть числа, заключенного в скобки. Если неравенство выполняется, то модель считается адекватной. Второе Для проверки равенства математического ожидания остаточной последовательности нулю вычисляется среднее значение ряда остатков: . Если , то считается, что модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего. Если , то проверяется нулевая гипотеза о равенстве нулю математического ожидания. Для этого вычисляют t-критерий Стьюдента по формуле: где Sɛ — стандартное отклонение остатков модели (стандартная ошибка). Значение t-критерия сравнивают с табличным tα,γ . Если выполняется неравенство t > tα,γ , то модель неадекватна по данному критерию. Третье Дисперсия уровней ряда остатков должна быть одинаковой для всех значений хi (свойство гомоскедастичности). Если это условие не соблюдается, то имеет место гетероскедастичность. Для оценки гетероскедастичности при малом объеме выборки можно использовать метод Гольдфельда—Квандта, суть которого заключается в том, что необходимо: • расположить значения переменной хi в порядке возрастания; • разделить совокупность упорядоченных наблюдений на две группы; • по каждой группе наблюдений построить уравнения регрессии; • определить остаточные суммы квадратов для первой и второй групп по формулам: где n1 — число наблюдений в первой группе; п2 — число наблюдений во второй группе. • рассчитать критерий Fpасч = S1 : S2 или Fpасч = S2 : S1 (в числителе должна быть большая сумма квадратов). При выполнении нулевой гипотезы о гомоскедастичности критерий Fpасч будет удовлетворять F'-критерию со степенями свободы γ1 = n1 — m и γ2 = п — п1 — m для каждой остаточной суммы квадратов (где m — число оцениваемых параметров в уравнении регрессии). Чем больше величина Fpасч превышает табличное значение F-критерия, тем больше нарушена предпосылка о равенстве дисперсий остаточных величин. Четвертое Проверку независимости последовательности остатков (отсутствие автокорреляции) осуществляют с помощью d-критерия Дарбина—Уотсона. Он определяется по формуле: Расчетное значение критерия сравнивается с нижним d1 и верхним d2 критическими значениями статистики Дарбина—Уотсона. Возможны следующие случаи: 1) если d < d1 ,то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков; 2) если d1 < d < d2 (включая сами эти значения), то считается, что нет достаточных оснований сделать тот или иной вывод и нужно использовать дополнительный критерий, например первый коэффициент автокорреляции: Если расчетное значение коэффициента по модулю меньше табличного значения r1кр, то гипотеза об отсутствии автокорреляции принимается; в противном случае эта гипотеза отвергается; 3) если d2 < d <2, то гипотеза о независимости остатков принимается и модель признается адекватной по данному критерию; 4) если d > 2, то это свидетельствует об отрицательной автокорреляции остатков. В этом случае расчетное значение критерия необходимо преобразовать по формуле d ' = 4 - d и сравнивать с критическим значением d ', а не d. Пятое Проверку соответствия распределения остаточной последовательности нормальному закону распределения можно осуществить с помощью R/S-критерия, который определяется по формуле: где Sɛ — стандартное отклонение остатков модели (стандартная ошибка). Расчетное значение R/S -критерия сравнивают с табличными значениями (нижней и верхней границами данного отношения), и если значение не попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о нормальности распределения отвергается; в противном случае гипотеза принимается/ Для оценки качества регрессионных моделей целесообразно также использовать индекс корреляции (коэффициент множественной корреляции). Формула определения индекса корреляции Индекс корреляции (корреляционное отношение): где - общая сумма квадратов отклонений зависимой переменной от ее среднего значения. Определяется по формуле: – остаточная сумма квадратов отклонений. Вычисляется по формуле: . Уравнение = + можно представить следующим образом: ВАЖНО! Индекс корреляции принимает значение от 0 до 1. Чем выше значение индекса, тем ближе расчетные значения результативного признака к фактическим. Индекс корреляции используется при любой форме связи переменных; при парной линейной регрессии он равен парному коэффициенту корреляции. В качестве меры точности модели применяют точностные характеристики. Определение меры точности модели Точностные характеристики Расчет и содержание характеристики Максимальная ошибка Соответствует максимальному отклонению расчетных значений от фактических. Средняя абсолютная ошибка Ошибка показывает, насколько в среднем отклоняются фактические значения от модели. Дисперсия ряда остатков (остаточная дисперсия) , где – среднее значение ряда остатков. Определяется по формуле: Средняя квадратическая ошибка Представляет собой корень квадратный из дисперсии: Чем меньше значение ошибки, тем точнее модель. Средняя относительная ошибка аппроксимации Допустимый предел значений составляет не более 8—15% Если модель регрессии признана адекватной, а параметры модели значимы, то переходят к построению прогноза. Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии ожидаемой величины независимой переменной хпрогн. Прогнозируемое значение переменной у и доверительные интервалы прогноза Прогнозируемое значение переменной у: Данный прогноз называется точечным. Вероятность реализации точечного прогноза практически равна нулю, поэтому рассчитывается доверительный интервал прогноза с большой надежностью. Доверительные интервалы прогноза зависят от стандартной ошибки, удаления от своего среднего значения , количества наблюдений п и уровня значимости прогноза α. Доверительные интервалы прогноза: где — определяется по таблице распределения Стьюдента для урония значимости α и числа степеней свободы γ = п — k — 1. Нелинейные модели и их линеаризация Соотношение между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями. Так, нелинейными оказываются производственные функции (зависимости между объемом произведенной продукции и основными факторами производства — трудом, капиталом и т.д.), функции спроса (зависимость между спросом на товары, услуги и их ценами или доходом) и др. Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций. Нелинейность может проявляться как относительно переменных, так и относительно входящих в функцию коэффициентов (параметров). Различают два класса нелинейных регрессий. Классы нелинейных регрессий • Регрессии, нелинейные по переменным, включенным в анализ, но линейные по оцениваемым параметрам (различные полиномы, гипербола). • Регрессии, нелинейные по оцениваемым параметрам (степенная, показательная, экспоненциальная функции). Для оценки параметров нелинейных моделей используют два подхода. Первый подход основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными. Второй подход обычно применяют в случаях, когда подобрать соответствующее линеаризующее преобразование не удается. Тогда используют методы нелинейной оптимизации на основе исходных переменных. Применяемые чаще всего в экономическом анализе виды нелинейных регрессий следующие: полином второго порядка, гипербола, степенная функция и показательная функция. Оценка параметров нелинейной регрессии по переменным, включенным в анализ, но линейным по оцениваемым параметрам, проводится с помощью МНК путем решения нормальных уравнений. Регрессии, нелинейные по переменным, но линейные по оцениваемым параметрам Наименование регрессии Уравнение регрессии Нормальные уравнения Полином второго порядка Гипербола Или заменим 1/ на новую переменную X. В результате получим линейное уравнение: Параметры определяются из следующих формул: Линеаризация регрессий, нелинейных по оцениваемым параметрам Наименование регрессии Уравнение регрессии Линеаризация Степенная функция Для определения параметров степенной функции с помощью МНК необходимо привести ее к линейному виду путем логарифмирования обеих частей уравнения: Это уравнение представляет собой прямую линию на графике, по осям которого откладываются не сами числа, а их логарифмы (так называемая логарифмическая шкала или логарифмическая сетка). Пусть Y=, X= A=. Тогда уравнение примет вид: Параметры модели определяются по следующим формулам: Показательная функция Линеаризацию переменных проведем путем логарифмирования обеих частей уравнения: Уравнение изображается прямой линией на полулогарифмической сетке, которая получается как сочетание натуральной шкалы для значений независимой переменной х и логарифмической шкалы — для значений зависимой переменной у. Пусть Y=, A= B=. Тогда уравнение примет вид: Параметры модели определяются по следующим формулам: При использовании любой формы криволинейной корреляционной зависимости теснота связи между переменными может быть измерена с помощью индекса корреляции, который определяется аналогично коэффициенту корреляции для линейной формы связи. Уравнение корреляционной связи должно быть по возможности более простым, чтобы сущность изучаемой зависимости между переменными проявлялась достаточно четко, а параметры уравнения поддавались определенному экономическому толкованию. Вопрос выбора соответствующего уравнения связи решается в каждом случае отдельно. Пример. Имеются следующие выборочные данные — выборка 20% случайная бесповторная (табл. А). Таблица A Среднедушевые денежные доходы населения и среднедушевой оборот розничной торговли по городам региона (месяц) № города Среднеду-шевой денежный доход Среднеду-шевой оборот розничной торговли № города Среднеду-шевой денежный доход Среднедушевой оборот розничной торговли 1 3 357 2 425 9 3 563 2 200 2 3 135 2 050 10 3 219 1 892 3 2 842 1 683 11 3 308 2 008 4 3 991 2 375 12 3 724 2 225 5 2 293 1 167 13 3 416 1 983 6 3 340 1 925 14 3 022 2 342 7 3 089 1 042 15 3 383 2 458 8 4 372 2 925 16 4 267 2 125 Необходимо построить уравнение регрессии, оценить его адекватность и точность, сделать выводы. Решение. Для определения тесноты связи между признаками и построения уравнения сформируем табл. Б. 1. Теснота связи между признаками определяется по формуле: Средние значения факторного и результативного признаков равны Парный коэффициент корреляции равен Величина коэффициента корреляции свидетельствует о тесной связи между среднедушевым денежным доходом и среднедушевым оборотом розничной торговли. Таблица Б Расчет параметров уравнения парной регрессии № п\п xi yi 1 3 357 2 425 -38 373 -14174 1 444 139 129 11 269 449 2 027 2 3 135 2 050 -260 -2 520 67 600 4 9 828 225 1 886 3 2 842 1 683 -553 -369 204057 305 809 136 161 8 076 964 1 700 4 3 991 2 375 596 323 192508 355 216 104 329 15 928 081 2 431 5 2 293 1 167 -1 102 -885 975270 1 214 404 783 225 5 257 849 1 350 6 3 340 1 925 -55 -127 6985 3 025 16 129 11 155 600 2 017 7 3 089 1 042 -306 -1 010 309060 93 636 1 020 100 9 541 921 1 857 8 4 372 2 925 977 873 852921 954 529 762 129 19 114 384 2 673 9 3 563 2 200 168 148 24864 28 224 21 904 12 694 969 2 158 10 3 219 1 892 -176 -160 28160 30 976 25 600 10 361 961 1 940 11 3 308 2 008 -87 -44 3828 7 569 1 936 10 942 864 1 996 12 3 724 2 225 329 173 56917 108 241 29 929 13 868 176 2 261 13 3 416 1 983 21 -69 -1449 441 4 761 11 669 056 2 074 14 3 022 2 342 -373 290 -108170 139 129 84 100 9 132 484 2 065 15 3 383 2 458 -12 406 -4872 144 164 836 11 444 689 2 044 16 4 267 2 125 872 73 63656 760 384 5 329 18 207 289 2 606 Сумма 54 321 32 825 2590081 4 070 771 3 299 601 188 493 961 Парный коэффициент детерминации ( = 0,498) показывает, что на 49,8% изменение оборота розничной торговли объясняется изменениями денежных доходов населения. Значимость коэффициента корреляции проверяется с помощью t- критерия Стьюдента по формуле Табличное значение t-критерия Стьюдента при доверительной вероятности 0,95 и числе степеней свободы γ = (п - k - 1) = 14 составляет 2,14. Так как tрасч > tтабл, значение коэффициента корреляции признается значимым и делается вывод о том, что между среднедушевым денежным доходом и среднедушевым оборотом розничной торговли есть тесная статистическая взаимосвязь. 2. Уравнение парной линейной регрессии имеет вид: . Параметры модели определим по формулам: Коэффициент регрессии = 0,636 показывает, что с увеличением среднедушевого денежного дохода на 1 руб. среднедушевой розничный оборот возрастает на 63,6 коп. Уравнение парной регрессии имеет вид: . Подставляя в полученное уравнение регрессии значения , можно определить условные средние (расчетные) значения . 3. Проверка адекватности (значимости) модели осуществляется на основе анализа ряда остатков (отклонений расчетных значений от фактических уi ). Расчеты приведены в табл. В. Таблица В Проверка адекватности и точности модели парной линейной регрессии № п/п уi Точки поворота 1 2 425 2 027 398 158 404 16,41 2 2 050 1 886 164 26 896 -234 54 756 8,00 3 1 683 1 700 -17 289 -181 32 761 1,01 4 2 375 2 431 -56 3 136 -39 1 521 2,36 5 1 167 1 350 -183 33 489 1 -127 16 129 15,68 6 1 925 2 017 -92 8 464 1 91 8 281 4,78 7 1 042 1 857 -815 664 225 1 -723 522 729 78,21 8 2 925 2 673 252 63 504 1 1 067 1 138 489 8,62 9 2 200 2 158 42 1 764 -210 44 100 1,91 10 1 892 1 940 -48 2 304 1 -90 8 100 2,54 11 2 008 1 996 12 144 1 60 3 600 0,60 12 2 225 2 261 -36 1 296 -48 2 304 1,62 13 1 983 2 074 -91 8 281 1 -55 3 025 4,59 14 2 342 2 065 277 76 729 1 368 135 424 11,83 15 2 458 2 044 414 171 396 137 18 769 16,84 16 2 125 2 606 -481 231 361 -895 801 025 22,64 Cумма 32 825 -1 1 652 180 8 3 021 007 191,49 Значимость параметров модели оценивается с помощью t-критерия Стьюдента по формулам: , где Sа0, Sа1 — стандартные отклонения свободного члена и коэффициента регрессии. Они определяются по формулам: ; . Стандартное отклонение остатков модели (стандартная ошибка) определяется по формуле: Значения стандартных отклонений следующие: Расчетные значения t-критерия равны: Табличное значение t-критерия с γ = (п - k - 1) = 14 степенями свободы при доверительной вероятности 0,95 (а = 0,05) равно 2,14. Значит, имеются следующие результаты: < → параметр а0 незначим; > → параметр а1 значим. Для проверки значимости уравнения регрессии в целом используется F-критерий Фишера: . Табличное значение F-критерия с γ1 = k = 1 и γ2 = п – k –1 = 14 степенями свободы при доверительной вероятности 0,95 (α= 0,05) равно 4,60. Так как Fрасч > Fтабл, уравнение парной линейной регрессии с вероятностью 0,95 в целом статистически значимое. 4. Проверка выполнения предпосылок МНК (на основе результатов табл. Б). 4.1. Проверка свойства случайности ряда остатков. Число поворотных точек (р) равно 8. Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства: Неравенство выполняется (8 > 6), следовательно, модель может быть признана адекватной по критерию случайности. 4.2.Проверка равенства математического ожидания остаточной последовательности нулю. Вычисляется среднее значение ряда остатков. Так как , модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего. 4.3. Проверка свойства гомоскедастичности. Значения факторного признака располагаются в порядке возрастания: 2293 2842 3022 3089 3135 3219 3308 3340 3357 3383 3416 3563 3724 3991 4267 4372 Совокупность наблюдений разделится на две группы, и для каждой группы с помощью программы «Анализ данных в EXCEL», инструмент «Регрессия», определяются параметры уравнений регрессий и остаточные суммы квадратов (Табл. Г). Таблица Г Расчетные значения Группа Уравнение регрессии Остаток 1 2 Исчисляется расчетный критерий: Fpасч = S1 : S2 = 982 672 : 474 564 = 2,07. Табличное значение F –критерия с γ1 = n1 – m = 6 и γ2 = п – п1 – m = 6 степенями свободы при доверительной вероятности 0,95 (α = 0,05) равно 4,28. Величина Fpасч превышает табличное значение F-критерия, следовательно, свойство гомоскедастичности выполняется. 4.4. Проверка независимости последовательности остатков (отсутствие автокорреляции) с помощью d -критерия Дарбина – Уотсона. Расчетное значение критерия сравнивается с нижним d1 и верхним d2 критическими значениями статистики Дарбина –Уотсона. При п = 16 и уровне значимости 5% d1 = 1,10, d2 = 1,37. Поскольку d2 < d < 2, то гипотеза о независимости остатков принимается и модель признается адекватной по данному критерию. 4.5.Проверка соответствия распределения остаточной последовательности нормальному закону распределения с помощью R/S-критерия. Проверка осуществляется по формуле: =(528+815)/343,53=3,91. Расчетное значение R/S- критерия сравнивается с табличными значениями (нижней и верхней границами данного отношения). Нижняя и верхняя границы отношения при уровне значимости α = 0,05 равны соответственно 3,01 и 4,09. Расчетное значение отношения попадает в интервал между критическими границами, следовательно, с заданным уровнем значимости гипотеза о нормальности распределения принимается. 4.6. Оценка точности модели (табл. В). В качестве показателя точности модели используется средняя относительная ошибка аппроксимации: Уровень точности модели можно признать приемлемым.

Эконометрика

Тебе могут подойти лекции

Другие экономические предметы

Помощь с написанием учебных работ