Парная регрессия
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ТВЕРСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА «БУХГАЛТЕРСКИЙ УЧЕТ, АНАЛИЗ И АУДИТ»
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Тверь 2009
________________________________________________________________________________
Раздел 2. Парная регрессия
Тематические вопросы: Понятие о функциональной, статистической и
корреляционной связях. Основные задачи прикладного корреляционнорегрессионного анализа. Уравнение регрессии, его смысл и назначение.
Выбор типа математической функции при построении уравнения
регрессии. Парная регрессия. Метод наименьших квадратов и условия его
применения для определения параметров уравнения парной регрессии.
Нелинейные модели регрессии и их линеаризация. Оценка степени тесноты
связи между количественными переменными. Коэффициент ковариации.
Показатели корреляции: линейный коэффициент корреляции, индекс
корреляции, теоретическое корреляционное отношение. Коэффициент
детерминации. Стандартная ошибка уравнения регрессии. Оценка
статистической
значимости
показателей
корреляции,
параметров
уравнения регрессии, уравнения регрессии в целом: t-критерий
Стьюдента, F-критерий Фишера.
Минимум содержания в соответствии с ГОС: метод наименьших квадратов
(МНК); свойства оценок МНК; показатель качества регрессии; нелинейные
модели регрессии и их линеаризация.
2.1.Основные понятия регрессионного анализа.......................................2
2.2.Метод наименьших квадратов и условия его применения для
определения параметров уравнения парной регрессии.............................5
2.3.Нелинейные модели регрессии..........................................................8
2.4.Оценка качества парной регрессионной модели...............................10
2.5.Показатели качества коэффициентов
парной регрессионной модели..............................................................10
2.6.Показатели качества уравнения
парной регрессионной модели..............................................................14
2.7.Применение парной регрессионной модели
для прогнозирования (предсказания)....................................................18
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
2.1.Основные понятия регрессионного анализа
Любая экономическая политика заключается в регулировании
экономических переменных, и она должна базироваться на знании того,
как эти переменные связаны с другими переменными, ключевыми для
принимающего решения. При этом в экономике говорят не о
функциональных (строгих), а о статистических (в т.ч. корреляционных),
зависимостях, при которых изменение одной из величин влечет изменение
распределения
другой.
В
частности,
статистическая
зависимость
проявляется в том, что при изменении одной из величин изменяется
среднее значение другой (такую статистическую зависимость называют
корреляционной).
Функциональная
зависимость
Статистическая
зависимость
каждому значению каждому
значению
одной
переменной
(набору
одной переменной переменных) соответствует некоторое вероятностное
соответствует
распределение другой переменной
единственное
Корреляционная
Регрессионная зависимость
значение
другой
зависимость
переменной
переменные
одна
(набор)
из
переменых
считаются
выделяется как независимая(ые)
равноценными в
(объясняющая(ие)),
другая –
том смысле, что
зависимая (объясняемая), в том
они не
смысле
что
изменение
подразделяются на независимой(ых) может служить
независимую и
причиной
для
изменения
зависимую
зависимой
Корреляционный
анализ
исследуется
наличие и сила
взаимосвязи
между
переменными
(напр., цена
товара – объем
спроса на него)
Регрессионный
анализ
исследуется, как объясняющая
(ие) перемененная (ые) влияет
(ют) на зависимую переменную
«в среднем» (напр., рост цены
товара – снижение спроса на
него)
Суть регрессионного анализа заключается в следующем:
•
понимается, что каждому конкретному значению объясняющей
переменной (набору переменных) соответствует некоторое
вероятностное
распределение
зависимой
переменной
(рассматриваемой как случайная величина)
2
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
• исследуется, как объясняющая (ие) перемененная (ые) влияет
(ют) на зависимую переменную «в среднем»
◊Регрессия как функциональная зависимость между объясняющими
переменными и условным математическим ожиданием (средним значением)
зависимой переменной, которая строится с целью предсказания
(прогнозирования) этого среднего значения при фиксированных значениях
первых.
◊Функция
соотношением:
регрессии
Y
на
X
как
зависимость,
выражаемая
M(Y|x) = f(x), [функция парной регрессии]
M(Y | х1 , х2, ..., xm) = f(x1 , x2, ..., xm), [функция множественной регрессии]
при
этом
Xнезависимая
(объясняющая)
переменная
переменных), Y - зависимая (объясняемая) переменная.
(вектор
◊Регрессионные модели (уравнения):
Y = M(Y | х) + ε, [модель парной регрессии]
Y = M(Y|x1,x2, ...,xm) + ε, [модель множественной регрессии]
где для отражения того факта, что реальные значения зависимой
переменной не всегда совпадают с ее условными математическими
ожиданиями и могут быть различными при одном и том же значении
объясняющей переменной (наборе), фактическая зависимость дополнена
некоторым слагаемым ε (случайное отклонение), которое по существу
является случайной величиной и указывает на стохастическую суть
зависимости. Причины обязательного присутствия в регрессионных
моделях случайного фактора (отклонения): невключение в модель всех
объясняющих переменных, неправильный выбор функциональной формы
модели, агрегирование переменных, ошибки измерений, ограниченность
статистических данных, непредсказуемость человеческого фактора.
Основные этапы построения и анализа регрессионной модели:
•
Выдвижение рабочей гипотезы
•
Построение
модели:
спецификация
(выбор
формулы
связи
переменных), параметризация (определение параметров уравнения)
•
Анализ качества и интерпретации модели (верификация)
•
[Определение путей изменения модели, выдвижение новых гипотез и
построение новых моделей]
•
Практическое использование модели
Важным этапом регрессионного анализа является выбор формулы
связи переменных (спецификация). В случае парной регрессии выбор
формулы обычно осуществляется по графическому изображению реальных
статистических данных в виде точек в декартовой системе координат (см.
ниже). В случае множественной регрессии определение подходящего вида
3
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
зависимости
является
более
сложной
задачей,
опирается
на
экономическую теорию.
взаимосвязь близка к
линейной, и прямая 1
достаточно хорошо
соответствует
эмпирическим точкам,
целесообразно
выбрать линейную
функцию Y = b0 + b1X
взаимосвязь, скорее
всего, описывается
квадратичной
функцией Y = аХ2 +
+ bХ + с (линия 2), и
отклонения точек
наблюдений от любой
прямой будут
существенными и
неслучайными
явная взаимосвязь
между X и Y
отсутствует; любая
форма связи,
результаты ее
спецификации и
параметризации будут
неудачными
Если функция регрессии линейна, то речь ведут о линейной
регрессии.
Модель
линейной
регрессии
является
наиболее
распространенным
(и
простым)
уравнением
зависимости
между
экономическими переменными. Кроме того, построенное линейное
уравнение может быть начальной точкой эконометрического анализа.
◊Парная линейная регрессия (теоретическое линейное уравнение
регрессии) представляет собой линейную функцию между условным
математическим ожиданием зависимой переменной У и одной объясняющей
переменной Х (!линейность по параметрам β0 и β1 уравнения) : M(Y|
Х=хi)=β0+β1xi
◊Теоретическая линейная регрессионная модель:
уi=M(Y|Х=хi)+εi =β0+β1xi+εi, или Y=β0+β1Х+ε,
β0 и β1 – теоретические параметры
регрессии, εi – случайное отклонение.
(теоретические
коэффициенты)
◊Эмпирическое уравнение (модель) регрессии:
ŷi=b0+b1xi =b0+b1xi+еi, Ŷ=b0+b1Х+е,
ŷi - оценка условного математического ожидания, b0 и b1 - оценки
неизвестных параметров, называемые эмпирическими коэффициентами
регрессии, отклонение еi – оценка теоретического случайного отклонения
εi.
4
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
2.2.Метод наименьших квадратов и условия его применения для
определения параметров уравнения парной регрессии
В силу несовпадения статистической базы для генеральной
совокупности и выборки оценки b0 и b1 практически всегда отличаются от
истинных значений коэффициентов β0 и β1, что приводит к несовпадению
эмпирической и теоретической линий регрессии:
Различные выборки из одной и той же генеральной совокупности
обычно приводят к определению отличающихся друг от друга оценок.
Задача состоит в том, чтобы по конкретной выборке (хi, yi), i = 1,
2, ... , n, найти оценки b0 и b1 неизвестных параметров β0 и β1 так, чтобы
построенная линия регрессии являлась бы наилучшей в определенном
смысле среди всех других прямых. Другими словами, построенная прямая Y
должна быть "ближайшей" к точкам наблюдений по их совокупности.
◊Метод наименьших квадратов (МНК) как самый распространенный и
теоретически
обоснованный
метод
нахождения
эмпирических
коэффициентов регрессии, при котором минимизируется сумма квадратов
отклонений:
n
∑
i=1
ei2 =
n
∑
i=1
ˆi )2 =
(y i − y
n
∑
i=1
(y i − b0 − b1 x i )2
Среди других методов определения оценок коэффициентов регрессии
отмечаются метод моментов и метод максимального правдоподобия.
Пусть по выборке (xi ; уi), i = 1, 2, ... , n требуется определить оценки
коэффициентов эмпирического уравнения регрессии.
5
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
В этом случае при использовании МНК минимизируется следующая
функция:
Q(b0 , b1 ) =
n
∑
i= 1
n
∑
ei2 =
i=1
(y i − yˆi )2 =
n
∑
i=1
(y i − b0 − b1 x i )2 ,
которая является квадратичной функцией двух параметров b0 и b1 (Q =
Q(b0 и b1)), поскольку xi, yi- известные данные наблюдений. Так как
функция Q непрерывна, выпукла и ограничена снизу (Q >= 0), то она
имеет минимум. Необходимым условием существования минимума функции
двух переменных является равенство нулю ее частных производных по
неизвестным параметрам. В результате процедуры минимизации функции
Q получаются практические формулы для оценок параметров по МНК.
По
МНК
оценки
параметров
определяются по формулам:
b1 =
xy − x ⋅ y
2
x − x
Дополнительные формулы:
b1 =
,
2
S xy
= rxy
Sy
парной
линейной
регрессии
b0 = y − b1 x
, где используются ковариация,
Sx
S
выборочный коэффициент корреляции, стандартные отклонения. Если,
кроме уравнения регрессии У на Х (b1= bх), для тех же эмпирических
данных найдено уравнение регрессии Х на У (b1= bу), то произведения
2
x
6
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
коэффициентов bх и bу равно квадрату коэффициента корреляции:
2
bx by = rxy
.
Выводы по МНК-оценкам коэффициентов регрессии:
•
•
•
•
Оценки МНК являются функциями от выборки.
Оценки
МНК
являются
точечными
оценками
теоретических
коэффициентов регрессии.
Эмпирическая прямая регрессии обязательно проходит через точку
(x , y ) .
Эмпирическое уравнение регрессии построено таким образом, что
сумма отклонений, а также среднее значение отклонения равны
n
нулю:
∑
i=1
•
•
ei = 0, e = 0 .
Случайные
значениями
Случайные
значениями
отклонения еi не коррелированны с наблюдаемыми
yi зависимой переменной Y.
отклонения ei не коррелированны с наблюдаемыми
хi независимой переменной Х.
Предпосылки МНК (условия Гаусса-Маркова): для получения по МНК
наилучших
результатов
необходимо,
чтобы
выполнялся
ряд
предпосылок:
1. Математическое ожидание случайного отклонения εi равно нулю для
всех наблюдений: M(εi)=0.
2. Дисперсия случайных
наблюдений: D(εi)=D(εj)=σ2.
отклонений
εi
постоянна
для
всех
3. Случайные отклонения являются независимыми друг от друга:
cov(εi,εj)=0, i‡j, cov(εi,εj)=σ2, i=j.
4. Случайное отклонение должно быть независимо от объясняющих
переменных (является следствием того, что объясняющие переменные не
являются случайными в данной модели): cov(εi,xi)=0.
5. Модель является линейной относительно параметров.
Согласно теореме Гаусса-Маркова, если предпосылки 1-5 выполнены,
то оценки, полученные по МНК, обладают следующими свойствами (в
англоязычной литературе такие оценки называются
наилучшими
линейными несмещенными оценками, BLUE):
•
•
•
Оценки являются несмещенными (M(b0)=β0, M(b1)=β1), что говорит об
отсутствии систематической ошибки в определении положения линии
регрессии.
Оценки состоятельны (D(b0)0, D(b1)0 при n∞), т.е. при
увеличении объема выборки надежность оценок увеличивается.
Оценки эффективны, т.е. имеют наименьшую дисперсию по
сравнению с любыми другими оценками данных параметров.
7
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
Если предпосылки 2 и 3 нарушены, то свойства несмещенности и
состоятельности сохраняются, но свойство эффективности - нет.
Интерпретация параметров уравнения парной линейной регрессии.
Построенное уравнение регрессии в любом случае требует определенной
интерпретации и анализа. Интерпретация требует словесного описания
полученных результатов с трактовкой найденных коэффициентов, с тем
чтобы
построенная
зависимость
стала
понятной
человеку,
не
являющемуся специалистом в эконометрическом анализе.
Коэффициент b1 определяет тангенс угла наклона прямой регрессии
относительно положительного направления оси абсцисс (объясняющей
переменной): показывает насколько единиц изменится У при изменении Х
на одну единицу; при этом обязательно указание характера изменения
(увеличения, уменьшения), конкретного числового значения и единиц
измерения.
Свободный член b0 уравнения регрессии определяет прогнозируемое
значение Y при величине X, равной нулю (если такая интерпретация
допустима в экономическом смысле).
Следует помнить, что эмпирические коэффициенты регрессии
являются лишь оценками теоретических коэффициентов, а само уравнение
отражает лишь общую тенденцию в поведении рассматриваемых
переменных.
После интерпретации результатов закономерен вопрос о качестве
оценок и самого уравнения в целом.
2.3.Нелинейные модели регрессии
Многие экономические зависимости не являются линейными по своей
сути, и поэтому их моделирование линейными уравнениями регрессии,
безусловно, не даст положительного результата. В рамках данного курса
ограничено рассмотрение нелинейных моделей, допускающих их
сведение к линейным (относительно параметров модели). Подробнее о
свойствах нелинейных моделей регрессии в разделе «Спецификация
переменных в уравнениях регрессии».
8
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
Двойная
Лог-линейная
логарифмическая
модель
модель
Y*=lnY, X*=lnX
Y* = β 0 + β X* + ε
ln Y = β 0 + β X + ε
Y*=lnY
Y* = β 0 + βX + ε
Y = β 0 + β ln X + ε
X*=lnX
Y = β 0 + β X* + ε
1
X
Y = β 0 + β X* + ε
Показательная
модель
Степенная модель
Обратная модель
ln Y = β 0 + β ln X + ε
Линейнологарифмическая
модель
________________________________________________________________________________
Нелинейная модель регрессии
Линейная модель регрессии
Y = β0 + β
1
+ ε
X
Y = β 0 + β 1X + β 2X 2 +
X* =
X = X1 , X 2 = X 2 …
+ ... + ε
+ ... + ε
Y = β 0aβ X eε
Y = β 0 + β 1 X1 + β 2 X 2 +
a β X = e β X ln a ,
ln e β X ln a = β X ln a ,
ln Y = ln β 0 +
,
+ β X ln a + ε
Y*=lnY, β
β
*
*
= β ln a
9
= ln β 0 ,
Y* = β
*
+ β *X + ε
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
2.4.Оценка качества парной регрессионной модели
В общем случае, оценка качества парной регрессионной модели
включает следующие направления анализа:
•
интерпретация регрессии и содержательный экономический
анализ,
•
выполнимость теоретических предпосылок,
•
анализ расчетных статистических показателей качества.
В рамках эконометрического исследования, внимание акцентируется
на анализе расчетных статистических показателей качества.
Система показателей качества парной регрессии
Показатели качества
коэффициентов регрессии
Показатели качества уравнения
регрессии
Стандартные ошибки
коэффициентов регрессии
Коэффициент детерминации
Значения t-статистики
Значение F-статистики
Вспомогательные показатели
Коэффициент корреляции
Сумма квадратов остатков
Стандартная ошибка регрессии
Показатели для предварительной
регрессионной модели:
•
e= 0
•
ˆ= y
y
•
ˆ, e) = 0
cov(y
оценки
удовлетворительности
2.5.Показатели качества коэффициентов
парной регрессионной модели
Стандартные ошибки коэффициентов регрессии для анализа
точности определения оценок коэффициентов регрессии. В силу
случайного отбора элементов в выборку случайными являются также
оценки b0 и b1 коэффициентов теоретического уравнения регрессии. Их
математическое ожидание при выполнении предпосылок об отклонениях
равны
соответственно
коэффициентам
теоретического
уравнения
регрессии. При этом оценки тем надежнее, чем меньше их разброс вокруг
β0, β1, т.е. чем меньше дисперсии оценок D(b0), D(b1). Надежность
10
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
получаемых оценок тесно связана с дисперсией случайных отклонений:
фактически дисперсия случайных отклонений является дисперсией
переменной У относительно линии регрессии (очищенной от влияния Х).
Практические выводы:
•
•
•
Дисперсии b0 и b1 прямо пропорциональны дисперсии случайного
отклонения, следовательно, чем больше фактор случайности, тем
менее точными будут оценки.
Чем больше число n наблюдений, тем меньше дисперсии оценок,
т.к. чем большим числом данных мы располагаем, тем вероятнее
получение более точных оценок.
Чем больше дисперсия объясняющей переменной, тем меньше
дисперсия оценок коэффициентов, т.е. чем шире область изменений
объясняющей переменной, тем точнее будут оценки (тем меньше
доля случайности в их определении).
Практические
формулы
коэффициентов регрессии:
S b0 =
для
2
Sbo
D(b1) ≈ S
2
b1
расчета
, Sb1 =
стандартных
ошибок
Sb21
S2
=
n
∑
i=1
( x i − x )2
,
n
D(b0) ≈ Sb20 =
S 2 ∑ x i2
i=1
n
n∑ ( x i − x )2
= x 2 Sb21
i=1
n
где
S2 =
∑
i=1
ei2
n
=
∑
i=1
(y i − b0 − b1 x i )2
- необъясненная дисперсия (мера
n− 2
n− 2
разброса зависимой переменной вокруг линии регрессии), корень
квадратный из необъясненной дисперсии называется стандартной
ошибкой оценки (стандартной ошибкой регрессии).
Сравнивая значения коэффициентов с его стандартной ошибкой,
можно судить о значимости коэффициента, причем коэффициент
называется значимым, если есть достаточно высокая вероятность того, что
его истинное значение отлично от нуля. Так, если стандартная ошибка
больше значения коэффициента (по модулю), то коэффициент не может
быть признан значимым. Для стандартных ошибок нет критических
уровней, поэтому для точности суждений используется t-статистика.
11
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
t-статистики для проверки значимости коэффициентов регрессии.
Эмпирическое уравнение регрессии определяется на основе конечного
числа статистических данных. Поэтому коэффициенты эмпирического
уравнения регрессии являются случайными величинами, изменяющимися
от выборки к выборке. Анализ сравнения эмпирических коэффициентов
регрессии с некоторыми теоретически ожидаемыми значениями этих
коэффициентов осуществляется по схеме статистической проверки
гипотез. Для проверки гипотезы: Н0: b1=β1, Н1: b1<>β1 используется
статистика t =
b1 − β 1
, которая при справедливости гипотезы Н0 имеет
Sb1
распределение Стьюдента с числом степеней свободы n-2, где n – объем
выборки. Следовательно, Н0 отклоняется на основании данного критерия,
b1 − β 1
≥ tα , n − 2 , где α- требуемый уровень значимости, при
если Tнабл =
2
Sb1
невыполнении считается, что оснований для отклонения Н0 нет.
На практике для установления наличия линейной зависимости между У
и Х формулируется гипотеза о статистической значимости коэффициента
регрессии: Н0: b1=0, Н1: b1<>0. При этом, если Н0 принимается, то
коэффициент статистически незначим, есть основание считать, что
величина У не зависит от Х. При отклонении – наоборот.
b1
Tнабл =
≥ tα , n − 2 , тогда коэффициент считается статистически
2
Sb1
значимым при выбранном уровне значимости.
◊t-статистикой
регрессии
к
его
называется
стандартной
отношение
ошибке
t =
величины
b1
,
Sb1
имеет
коэффициента
распределение
Стьюдента с числом степеней свободы n-2, где n – объем выборки (число
наблюдений).
Порядок
статистике:
работы при
проверке
значимости
коэффициента
по
t-
1. Выбор уровня значимости α (как правило, 1% или 5%).
2. Определение числа степеней свободы: n-2.
3. По таблицам распределения Стьюдента определение критического
значения tα 2 , n − 2 (как правило, используются двухсторонние
гипотезы, использование односторонних гипотез, позволяющее
«спасти»
значимость
коэффициента,
требует
обязательного
экономического обоснования).
4. Формирование суждения, исходя из условия: если t-статистика по
12
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
абсолютной величине больше критического значения tα , n − 2 , то
2
коэффициент
считается
значимым
при
выбранном
уровне
значимости α. В противном случае - коэффициент не может быть
признан значимым при выбранном уровне значимости α.
Грубое правило оценки значимости коэффициента линейной регрессии
(при n>10):
•
•
•
•
Если стандартная ошибка коэффициента больше его модуля, то
коэффициент не может быть признан значимым, т.к. доверительная
вероятность при двусторонней альтернативной гипотезе составит
менее 0,7.
Если 1<|t|<=2, то оценка может рассматриваться как относительно
(слабо) значима, доверительная вероятность 0,7-0,95.
Если 2<|t|<=3, то значимая линейная связь между У и Х,
доверительная вероятность 0,95-0,99.
Если |t|>3, то гарантия наличия линейной связи между У и Х.
Доверительные
интервалы
для
проверки
коэффициентов регрессии.
Технология определения доверительных интервалов:
значимости
1. Для определения 100(1-α)%-ного доверительного интервала по
таблицам критических точек распределения Стьюдента по доверительной
вероятности γ=1-α и числу степеней свободы ν=n-2 определяют
критическое значение tα/2,n-2, удовлетворяющее условию:P(|t| tα
2
,n − 2
.
Сумма квадратов остатков измеряет необъясненную часть разброса
(вариации) зависимой переменной:
RSS =
n
∑
i=1
ei2 =
n
∑ (y
i=1
i
ˆi )
− y
2
,
используется как основная минимизируемая величина в методе
наименьших квадратов и для расчета других показателей. Показатели RSS
в разных моделях с разным числом наблюдений (и переменных)
несравнимы.
Стандартная ошибка регрессии измеряет величину (квадрата)
ошибки, приходящейся на одну степень свободы модели, т.е. для парной
регрессии:
n
S =
∑
i=1
ei2
,
(n − 2)
используется в качестве основной величины для измерения качества
оценивания модели (чем она меньше, тем лучше). Показатели S в
однотипных моделях с разным числом наблюдений (и переменных)
сравнимы.
Типичные ошибки в использовании показателей качества регрессии:
•
Величина коэффициентов регрессии не указывает на силу связи
или влияния на зависимую переменную.
•
Значимость коэффициентов по t-тестам не позволяет сделать
вывод о справедливости тех или иных теорий.
•
t-статистики не указывают
коэффициентов регрессии.
17
на
относительную
важность
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 2. Парная регрессия
________________________________________________________________________________
• t-статистики предназначены для использования исключительно
для выборки и бесполезны для анализа всей совокупности.
•
Нельзя сравнивать t-статистики, F-статистики, коэффициенты
детерминации и др. у разных уравнений регрессии.
2.7.Применение парной регрессионной модели
для прогнозирования (предсказания)
Одной из центральных задач эконометрического моделирования
является
предсказание
(прогнозирование)
значений
зависимой
переменной при определенных значениях объясняющих переменных.
Здесь
возможен
двоякий
подход:
либо
предсказать
условное
математическое ожидание зависимой переменной при определенных
значениях объясняющих переменных (предсказание среднего значения),
либо
прогнозировать
некоторое
конкретное
значение
зависимой
переменной (предсказание конкретного значения).
Предсказание среднего значения: пусть построено уравнение парной
регрессии, на основе которого необходимо предсказать условное
математическое
ожидание
M(Y|X=хр)
переменной
Y
при
X=хр.
Доверительный интервал для M(Y X = x p ) = β 0 + β 1 x p имеет вид:
1
b0 + b1 x P − tα
S
+
,n − 2
2
n
(x − x P )
(x − x P )
1
;
b
+
b
x
+
t
S
+
1 P
α ,n − 2
n
n
2
n
2
(
x
−
x
)
∑i = 1 i
∑i = 1 (x i − x )2
2
2
Предсказание индивидуальных значений зависимой переменной. На
практике иногда более важно знать дисперсию Y, чем ее средние значения
или доверительные интервалы для условных математических ожиданий.
Позволяет определить допустимые границы для конкретного значения Y:
1
+
b0 + b1 x P − tα , n − 2 S 1 +
2
n
1
+
b0 + b1 x P + tα , n − 2 S 1 +
2
n
;
n
2
∑i = 1 (x i − x )
2
(x − x P )
n
2
∑i = 1 (x i − x )
( x − x P )2
,
т.е. определяет границы, за пределами которых могут оказаться не более
100α % точек наблюдений при X = хр. Причем данный интервал шире
доверительного интервала для условного математического ожидания.
18