Проверка статистических гипотез
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Национальный Исследовательский Университет
Высшая Школа Экономики. (Департамент
Математики)
Грибкова Надежда Викторовна
Теория Вероятностей и Математическая
Статистика
(лекция 13)
Санкт-Петербург,
2021
1 / 23
4
§4.15 Проверка статистических гипотез
Пусть X1 , . . . , Xn — случайная выборка из распределения ξ ∈ X ,
X — множество возможных значений ξ,
F (x) = P(ξ < x) — (теоретическая) функция распределения.
Пусть F обозначает класс допустимых распределений F ∈ F.
Функция распределения F (x) нам не известна, но часто можно
сделать какие-либо предположения об этом распределении или о его
параметрах. Любое такое предположения называется статистической гипотезой. Пусть имеется некоторое разбиение:
F = F0 ∪ F 1 ,
F0 ∩ F 0 = ∅
Любая гипотеза может быть представлена в виде:
H0 : F ∈ F0 ,
причем, наряду с основной гипотезой, формулируется конкурирующая
H1 : F ∈ F1 — альтернатива.
2 / 23
4
Определение 4.1
Гипотеза H0 называется простой, если F0 = {F0 }, то есть класс F0
состоит из одной функции (одного распределения). В противном
случае гипотеза H0 называется сложной.
Альтернатива H1 также может быть простой или сложной.
Пример 4.1
(a) Монета, имеющая неизвестную вероятность выпадения герба
P({выпал герб}) = θ, подброшена n раз. Мы хотели бы проверить
H0 : θ = 1/2 против альтернативы H1 : θ = 2/3.
Здесь и основная гипотеза, и альтернатива являются простыми.
(b) То же, что и в случае (a), но теперь проверяется гипотеза
H0 : θ = 1/2, как прежде, то против альтернативы H1 : θ 6= 1/2.
Основная гипотеза – простая, альтернатива — сложная.
3 / 23
4
Пример 4.2
Пусть X1 , . . . , Xn — выборка из Fξ ∈ F = {N(µ, σ 2 ), µ ∈ R, σ > 0}.
H0 : µ = µ0 против H1 : µ 6= µ0 .
1) σ известно. В этом случае H0 — простая, H1 — сложная.
2) σ неизвестно. В этом случае и H0 , альтернатива H1 — сложные.
Пример 4.3
Пусть X1 , . . . , Xn — случайная выборка из дискретного распределения.
Мы хотим проверить гипотезу, что Fξ ∈ {Pois(λ), λ > 0}, то есть
H0 : ξ имеет распределение Пуассона
против альтернативы
H1 : распределение ξ не является распределением Пуассона.
Гипотезы о виде распределения относятся к гипотезам о согласии, а
критерии их проверки — критерии согласия (goodness-of-fit tests).
4 / 23
4
В случае, когда альтернатива H1 = H 0 , т.е. заключается в том, что
основная гипотеза не выполняется, альтернатива часто в явном виде
не формулируется.
В этом случае мы говорим о проверке согласованности данных с
гипотезой, которая называется гипотезой согласия (goodness-of-fit).
H0 : Fξ ∈ F = {N(µ, σ 2 )} распределение с.в. — нормальное ,
H0 : Fξ ∈ F = {Exp(λ), λ > 0} распределение с.в. — экспоненциальное
Определение 4.2
Статистический критерий (или просто критерий) — это правило,
позволяющее обоснованным образом принять или отвергнуть гипотезу
H0 на основе статистических данных.
Обычно критерий строится с использованием статистик
Tn = τ (X1 , . . . , Xn ),
для которых характерно принимать умеренные по величине значения,
если гипотеза H0 верна, и большие и/или маленькие значения, если
H0 не верна.
5 / 23
4
Для того, чтобы построить критерий, основанный на статистике Tn ,
нам необходимо знать ее распределение (найденное в предположении
справедливости гипотезы H0 ). Это распределение обычно трудно (или
даже невозможно) найти при конечных значениях n, но часто можно
найти предельное распределение при n → ∞, которое используется в
качестве приближения для распределения тестовой статистики при
достаточно больших n.
Зная распределение Tn (или асимптотическое распределение),
найденное в предположении справедливости гипотезы H0 , мы находим
критическую область
SK = {t; t = τ (x1 , x2 , . . . , xn ), xi ∈ X , i = 1, 2, . . . , n}
объединяющую значения Tn , которые нетипичны для статистики
Tn в
случае, когда H0 верна, т.е. такие, что P Tn ∈ SK |H0 мала.
Остальная часть возможных значений статистики Tn :
SD = S \ SK
(где S = {t : t = τ (x1 , . . . , xn ) ∀ xi ∈ X })
— это область допустимых значение, при попадании в которую
значения статистики Tn гипотеза H0 принимается.
6 / 23
4
Далее, вычисляется значение тестовой статистики
Tn = τ (X1 , X2 , . . . , Xn ).
Если Tn ∈ SK
−→ гипотеза H0 отклоняется (и принимается H1 ).
Если Tn ∈ SD
−→ гипотеза H0 не отклоняется.
В последнем случае мы говорим, что гипотеза не противоречит
опытным данным и может быть принята.
Однако, поскольку Tn зависит от случайных данных, ее значение
также случайно, и оно может попасть в SK с отличной от нуля
вероятностью, когда гипотеза верна, и, наоборот, оно может попасть в
область SD , когда на самом деле гипотеза не верна (а верна H1 ).
Статистическая проверка гипотез (так как она основана на
случайных данных) необходимо сопряжена с ошибками двух видов.
7 / 23
4
Ошибки I-го и II-го рода
При тестировании гипотез возникают ошибки первого и второго рода
природа
решение
вещей
статистика
H0
H1
H0
верное решение
ошибка II-го рода
H1
ошибка I-го рода
верное решение
Ошибка I-го рода состоит в том, чтобы отклонить гипотезу H0 , когда
она верна.
Ошибка II-го рода состоит в том, чтобы отклонить альтернативу H1
(принять основную гипотезу H0 ), когда альтернатива верна.
8 / 23
4
На практике ошибки I-го и II-го рода, как правило, неравноправны:
одна ошибка может привести к более серьезным последствиям, чем
другая.
Например: признать наличие заболевания и приступить к лечению.
Ошибочное непризнание может привести к бóльшим неприятностям,
чем ошибочное признание.
Обычно H0 – это наиболее интересная для исследователя гипотеза, и
задачу ставят так, чтобы наиболее неприятной была ошибка I-го рода.
Определение 4.3
Вероятность α отклонения гипотезы H0 , когда она верна (т.е. ошибки
I-го рода)
P Tn ∈ SK | H0 =: α
называется уровнем значимости критерия
9 / 23
4
Определение 4.4
Вероятность β принятия основной гипотезы H0 , в то время как верна
альтернатива, называется вероятностью ошибки II-го рода.
P Tn ∈ SD | H 1 = β
Определение 4.5
Вероятность γ = 1 − β правильно отвергнуть H0 (то есть принять
альтернативу H1 , когда она действительно верна)
γ := P Tn ∈ SK | H1 = 1 − P Tn ∈ SD | H1 = 1 − β
называется мощностью критерия.
10 / 23
4
Подход Неймана–Пирсона
Поскольку невозможно одновременно сделать вероятности ошибок
обоих типов I и II достаточно малыми при фиксированном объеме
выборки n (это противоречивая задача), в статистике принят
Подход Неймана–Пирсона
(
вер. ошибки I-го рода ≤ α — малое число (уровень значимости),
вер. ошибки II-го рода −→ min
(стандартные значения: α = 0.005, α = 0.01, α = 0.05).
Согласно этому подходу при заданном числе наблюдений n уровень
значимости α назначается заранее, затем (при фиксированном α)
ищут критерии, у которых мощность γ максимальна (следовательно,
вероятность ошибки II-го рода β = 1 − γ минимальна).
Карл Пирсон
11 / 23
4
12 / 23
4
§4.16 Примеры тестов. Проверка гипотез о
параметрах нормального закона
Пусть X1 , . . . , Xn — выборка из распределения ξ ∼ N(µ, σ 2 ).
Рассмотрим классические тесты о параметрах нормального закона.
1. Критерий Стьюдента (t-test).
гипотезу
Наша цель — проверить
H0 : µ = µ 0
против
H1 : µ 6= µ0
В качестве тестовой статистики используем t-статистику Стьюдента:
√
n − 1 X − µ0
,
Tn =
Sn
где мы подставили гипотетическое значение параметра µ.
13 / 23
4
Теперь мы должны найти распределения тестовой статистики при
условии, что гипотеза верна.
Если H0 верна, и µ = µ0 — это правильное значение математического
ожидания, то, как мы знаем,
√
n − 1 X − µ0
∼H0 tn−1 .
Tn =
Sn
Назначаем уровень значимости α (типичные значения 0.05, 0.025,
0.01). Затем, как при построении доверительных интервалов, находим
tα такое, что
P |tn−1 | > tα = α
tα = F −1 1 − α2 , которое находится по таблицам квантилей
распределения Стьюдента. Поскольку Tn ∼ tn−1 , если гипотеза H0
верна, мы имеем
P |Tn | > tα H0 = α
В качестве критической области берем SK = {x : |x| > tα }.
14 / 23
4
Отсюда следует процедура проверки гипотезы:
1. назначаем уровень значимости α;
2. находим квантиль tα ;
3. вычисляем значение Tn на основе имеющихся наблюдений;
4. если |Tn | > tα , то гипотеза H0 отклоняется, вероятность ошибки
равна α,
если |Tn | ≤ tα , мы говорим, что гипотеза не противоречит данным
наблюдений и может быть принята на уровне значимости α.
Стьюдент (Вильям Госсет)
15 / 23
4
16 / 23
4
Фактический уровень значимости (p-value)
Часто на практике уровень значимости не фиксируется заранее,
вместо этого вычисляется так называемый
фактический уровень значимости (p-value) — это вероятность того,
что тестовая статистика примет значение больше, чем фактически
полученное в эксперименте, при условии, что гипотеза H0 верна.
Например, для критерия Стьюдента: пусть cn = Tn обозначает
значение тестовой статистики, которое мы получили (cn — это число).
Тогда
pvalue = P |tn−1 | > cn = 2 Ftn−1 (cn ) − 1
Фактический уровень значимости (p-value) — это вероятность того,
что случайная величина с распределением Стьюдента tn−1 по модулю
окажется больше, чем cn . Иначе говоря, это уровень значимости α,
при котором tα было бы равным cn = Tn .
Если p-value большое ( α), то мы говорим, что гипотеза H0 значима,
если маленькое (< α), то это свидетельствует в пользу альтернативы.
17 / 23
4
2. Проверка гипотезы о дисперсии. Требуется проверить гипотезу
H0 : σ 2 = σ02
против
H1 : σ 2 6= σ02
В качестве критерия мы можем взять статистику хи-квадрат:
Tn =
n Sn2
,
σ02
где мы подставили гипотетическое значение параметра σ 2 .
Теперь нам следует найти распределение тестовой статистики при
условии, что гипотеза верна.
Если H0 верна, то есть если σ 2 = σ02 — это правильное значение
дисперсии, то, как мы знаем,
Tn =
n Sn2
σ02
∼H0
χ2n−1 .
18 / 23
4
Следующим шагом мы назначаем уровень значимости α, затем для
распределения χ2n−1 с n − 1 степенями свободы мы находим κ1, α и
κ2, α такие, что
α
P χ2n−1 < κ1, α = P χ2n−1 > κ2, α =
2
κ1, α — это квантиль уровня α2 распределения хи-квадрат с n − 1
степенями свободы, и κ2, α — квантиль уровня 1 − α2 .
(мы находим эти квантили в таблицах квантилей хи-квадрат
распределения).
Поскольку Tn ∼ χ2n−1 при условии, что H0 верна, мы имеем
α α
P {Tn < κ1, α } ∪ {Tn > κ2, α } H0 = + = α
2
2
SK = {x : {x < κ1, α } ∪ {x > κ2, α }},
SD = {x : x ∈ [κ1, α , κ2, α ]}
— критическая область и область принятия гипотезы, соответственно.
19 / 23
4
Отсюда следует процедура проверки гипотезы:
1. назначаем уровень значимости α;
2. находим квантили κ1, α и κ1, α ;
3. вычисляем значение Tn =
n Sn2
σ02
на основе имеющихся наблюдений;
4. если Tn ∈
/ [κ1, α , κ2, α ], то гипотеза H0 , отклоняется, вероятность
ошибки равна α;
если Tn ∈ [κ1, α , κ2, α ], то мы говорим, что "гипотеза не противоречит
опытным данным и может быть принята на уровне значимости α".
Как и в случае критерия Стьюдента, можно вычислить фактический
уровень значимости, который в данном случае вычисляется, как
pvalue = 2 min Fχ2 (Tn ), 1 − Fχ2 (Tn ) .
n−1
n−1
20 / 23
4
Пример 4.4
Автомобильная компания хотела бы уточнить каков средний пробег
выпускаемого ими автомобиля на литр топлива, чтобы указать его в
документации. Из прошлого опыта известно, что для автомобилей
этого класса средний расход составлял обычно 10 км на литр топлива.
Компания провела эксперименты с 26 автомобилями. Были получены
наблюдения X1 , X2 , . . . , X26 , где Xi — пробег в километрах на литр
топлива. Оказалось, что X = 9.3, Sn2 = 1.96. Можно ли на уровне
значимости α = 0.05 указать в документации, что средний пробег на
литр топлива равен 10 км, предполагая, что пробег на литр топлива —
нормально распределенная случайная величина?
Нам следует проверить гипотезу
H0 : µ = 10
против
H1 : µ 6= 10
21 / 23
4
Воспользуемся критерием Стьюдента. Имеем
√
√
n − 1 X − µ0
25 9.3 − 10
5 · 0.7
Tn =
=
=−
= −2.5.
Sn
1.4
1.4
1−
α
= 1 − 0.025 = 0.975, n − 1 = 25, tα = Ft−1
(0.975) = 2.060
25
2
|Tn | > tα =⇒ H0 отвергается,
вероятность ошибки равна α = 0.05.
22 / 23
4
Пример 4.4 (продолжение)
Основываясь на данных примера 4.4, проверить гипотезу
H0 : σ = 1.3
против
H1 : σ 6= 1.3
Воспользуемся тестом, основанным на статистике, имеющей
распределение хи-квадрат. Имеем α2 = 0.025, 1 − α2 = 0.975
Tn =
n Sn2
26 · 1.96
19.6
≈ 15.8
=
=
2
2
(1.3)
1.3
σ0
κ1, α = Fχ−1
2 (0.025) = 13.1;
25
κ2, α = Fχ−1
2 (0.975) = 40.6;
25
Поскольку Tn ∈ [κ1, α , κ2, α ], гипотеза H0 не противеречит опытным
данным и может быть принята на уровне значимости α = 0.05.
23 / 23