Фиктивные (бинарные, дамми) переменные
Выбери формат для чтения
Загружаем конспект в формате pptx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Фиктивные (бинарные,
дамми) переменные
COST
Пример использования dummy переменной при
наличии двух категорий
Профессиональны е
Обы чны е
N
COST – годовы е издержки 74 средних школ в Шанхае в середине 1980-х
годов, N – количество обучавшихся в них учеников .
1
COST
Пример использования dummy переменной при
наличии двух категорий
Профессиональ ны е
Обы чны е
N
Затраты в профессиональны х школах больше, т.к. для обучения там
используется специальное оборудование.
2
COST
Пример использования dummy переменной при
наличии двух категорий
Профессиональ ны е
Обы чны е
N
Если оценивать регрессии отдельно для профессиональны х и
обы чны х школ, то размеры вы борок уменьшатся, что снизит точность
оценивания.
3
COST
Пример использования dummy переменной при
наличии двух категорий
b1'
Профессиональ ны е
Обы чны е
b1
N
OCC = 0 Обы чны е школы
COST = b0 + b1N +ξ
OCC = 1 Профессиональны е школы COST = b01+ b1N + ξ
Предположим, что коэффициенты наклона в регрессиях для
профессиональны х и обы чны х школ совпадают, а свободны е члены
различаются.
4
COST
Пример использования dummy переменной
b1'
Профессиональ ны е
Обы чны е
d
b1
N
OCC = 0 Обы чны е школы
COST = b0 + b1N + ξ
OCC = 1 Профессиональны е школы COST = b01 + b1N + ξ
Обозначим d разность свободны х членов: d = b01– b0.
6
COST
Пример использования dummy переменной
b1+d
Профессиональ ны е
Обы чны е
d
b1
N
OCC = 0 Обы чны е школы
COST = b0 + b1N + ξ
OCC = 1 Профессиональны е школы COST = b0 + d + b1N + ξ
Тогда b01 = b0 + d и мы можем переписать регрессию для
профессиональны х школ.
7
COST
Пример использования dummy переменной
b1+d
Профессиональ ны е
Обы чны е
d
b1
N
Общее уравнение
COST = b0 + d OCC + b1N + ξ
OCC = 0 Обы чны е школы
COST = b0 + b1N + ξ
OCC = 1 Профессиональны е школы COST = b0 + d + b1N + ξ
Введем dummy- переменную OCC, которая равна 0 для обы чны х школ и
1 для профессиональны х. Dummy- переменная всегда принимает
только два значения, обы чно 0 и 1.
8
Пример использования dummy переменной
School
Type
COST
N
OCC
1
Occupational
345,000
623
1
2
Occupational
537,000
653
1
3
Regular
170,000
400
4
Occupational
526.000
663
1
5
Regular
100,000
563
6
Regular
28,000
236
7
Regular
160,000
307
8
Occupational
45,000
173
1
9
Occupational
120,000
146
1
10
Occupational
61,000
99
1
В приведенной таблице указаны данны е лишь для 10 школ. В
последней колонке сформирована dummy - переменная.
9
Пример использования dummy переменной
. reg COST N OCC
Source |
SS
df
MS
---------+-----------------------------Model | 9.0582e+11
2 4.5291e+11
Residual | 5.6553e+11
71 7.9652e+09
---------+-----------------------------Total | 1.4713e+12
73 2.0155e+10
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
56.86
0.0000
0.6156
0.6048
89248
-----------------------------------------------------------------------------COST |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------+-------------------------------------------------------------------N |
331.4493
39.75844
8.337
0.000
252.1732
410.7254
OCC |
133259.1
20827.59
6.398
0.000
91730.06
174788.1
_cons | -33612.55
23573.47
-1.426
0.158
-80616.71
13391.61
------------------------------------------------------------------------------
В таблице приведены результаты оценивания регрессии COST
на N и OCC.
10
Пример использования dummy переменной
. reg COST N OCC
Source |
SS
df
MS
---------+-----------------------------Model | 9.0582e+11
2 4.5291e+11
Residual | 5.6553e+11
71 7.9652e+09
---------+-----------------------------Total | 1.4713e+12
73 2.0155e+10
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
56.86
0.0000
0.6156
0.6048
89248
-----------------------------------------------------------------------------COST |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------+-------------------------------------------------------------------N |
331.4493
39.75844
8.337
0.000
252.1732
410.7254
OCC |
133259.1
20827.59
6.398
0.000
91730.06
174788.1
_cons | -33612.55
23573.47
-1.426
0.158
-80616.71
13391.61
------------------------------------------------------------------------------
Коэффициент при OCC значим, расходы на учеников в
профессиональны х школах на 133259 ю аней больше.
11
Пример использования dummy переменной
. reg COST N OCC
Source |
SS
df
MS
---------+-----------------------------Model | 9.0582e+11
2 4.5291e+11
Residual | 5.6553e+11
71 7.9652e+09
---------+-----------------------------Total | 1.4713e+12
73 2.0155e+10
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
56.86
0.0000
0.6156
0.6048
89248
-----------------------------------------------------------------------------COST |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------+-------------------------------------------------------------------N |
331.4493
39.75844
8.337
0.000
252.1732
410.7254
OCC |
133259.1
20827.59
6.398
0.000
91730.06
174788.1
_cons | -33612.55
23573.47
-1.426
0.158
-80616.71
13391.61
------------------------------------------------------------------------------
Коэффициент при N значим, кажды й ученик увеличивает
расходы школы на 331 ю ань .
12
Пример использования dummy переменной
. reg COST N OCC
Source |
SS
df
MS
---------+-----------------------------Model | 9.0582e+11
2 4.5291e+11
Residual | 5.6553e+11
71 7.9652e+09
---------+-----------------------------Total | 1.4713e+12
73 2.0155e+10
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
56.86
0.0000
0.6156
0.6048
89248
-----------------------------------------------------------------------------COST |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------+-------------------------------------------------------------------N |
331.4493
39.75844
8.337
0.000
252.1732
410.7254
OCC |
133259.1
20827.59
6.398
0.000
91730.06
174788.1
_cons | -33612.55
23573.47
-1.426
0.158
-80616.71
13391.61
------------------------------------------------------------------------------
Свободны й член является незначимы м.
13
Пример
Пример