«Проверка статистических гипотез»

Конспект лекции по дисциплине «Проверка статистических гипотез», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Проверка статистических гипотез», Word формат

Национальный Исследовательский Университет Высшая Школа Экономики. (Департамент Математики) Грибкова Надежда Викторовна Теория Вероятностей и Математическая Статистика (лекция 13) Санкт-Петербург, 2021 1 / 23 4 §4.15 Проверка статистических гипотез Пусть X1 , . . . , Xn — случайная выборка из распределения ξ ∈ X , X — множество возможных значений ξ, F (x) = P(ξ < x) — (теоретическая) функция распределения. Пусть F обозначает класс допустимых распределений F ∈ F. Функция распределения F (x) нам не известна, но часто можно сделать какие-либо предположения об этом распределении или о его параметрах. Любое такое предположения называется статистической гипотезой. Пусть имеется некоторое разбиение: F = F0 ∪ F 1 , F0 ∩ F 0 = ∅ Любая гипотеза может быть представлена в виде: H0 : F ∈ F0 , причем, наряду с основной гипотезой, формулируется конкурирующая H1 : F ∈ F1 — альтернатива. 2 / 23 4 Определение 4.1 Гипотеза H0 называется простой, если F0 = {F0 }, то есть класс F0 состоит из одной функции (одного распределения). В противном случае гипотеза H0 называется сложной. Альтернатива H1 также может быть простой или сложной. Пример 4.1 (a) Монета, имеющая неизвестную вероятность выпадения герба P({выпал герб}) = θ, подброшена n раз. Мы хотели бы проверить H0 : θ = 1/2 против альтернативы H1 : θ = 2/3. Здесь и основная гипотеза, и альтернатива являются простыми. (b) То же, что и в случае (a), но теперь проверяется гипотеза H0 : θ = 1/2, как прежде, то против альтернативы H1 : θ 6= 1/2. Основная гипотеза – простая, альтернатива — сложная. 3 / 23 4 Пример 4.2 Пусть X1 , . . . , Xn — выборка из Fξ ∈ F = {N(µ, σ 2 ), µ ∈ R, σ > 0}. H0 : µ = µ0 против H1 : µ 6= µ0 . 1) σ известно. В этом случае H0 — простая, H1 — сложная. 2) σ неизвестно. В этом случае и H0 , альтернатива H1 — сложные. Пример 4.3 Пусть X1 , . . . , Xn — случайная выборка из дискретного распределения. Мы хотим проверить гипотезу, что Fξ ∈ {Pois(λ), λ > 0}, то есть H0 : ξ имеет распределение Пуассона против альтернативы H1 : распределение ξ не является распределением Пуассона. Гипотезы о виде распределения относятся к гипотезам о согласии, а критерии их проверки — критерии согласия (goodness-of-fit tests). 4 / 23 4 В случае, когда альтернатива H1 = H 0 , т.е. заключается в том, что основная гипотеза не выполняется, альтернатива часто в явном виде не формулируется. В этом случае мы говорим о проверке согласованности данных с гипотезой, которая называется гипотезой согласия (goodness-of-fit). H0 : Fξ ∈ F = {N(µ, σ 2 )} распределение с.в. — нормальное , H0 : Fξ ∈ F = {Exp(λ), λ > 0} распределение с.в. — экспоненциальное Определение 4.2 Статистический критерий (или просто критерий) — это правило, позволяющее обоснованным образом принять или отвергнуть гипотезу H0 на основе статистических данных. Обычно критерий строится с использованием статистик Tn = τ (X1 , . . . , Xn ), для которых характерно принимать умеренные по величине значения, если гипотеза H0 верна, и большие и/или маленькие значения, если H0 не верна. 5 / 23 4 Для того, чтобы построить критерий, основанный на статистике Tn , нам необходимо знать ее распределение (найденное в предположении справедливости гипотезы H0 ). Это распределение обычно трудно (или даже невозможно) найти при конечных значениях n, но часто можно найти предельное распределение при n → ∞, которое используется в качестве приближения для распределения тестовой статистики при достаточно больших n. Зная распределение Tn (или асимптотическое распределение), найденное в предположении справедливости гипотезы H0 , мы находим критическую область SK = {t; t = τ (x1 , x2 , . . . , xn ), xi ∈ X , i = 1, 2, . . . , n} объединяющую значения Tn , которые нетипичны для статистики Tn в случае, когда H0 верна, т.е. такие, что P Tn ∈ SK |H0 мала. Остальная часть возможных значений статистики Tn : SD = S \ SK (где S = {t : t = τ (x1 , . . . , xn ) ∀ xi ∈ X }) — это область допустимых значение, при попадании в которую значения статистики Tn гипотеза H0 принимается. 6 / 23 4 Далее, вычисляется значение тестовой статистики Tn = τ (X1 , X2 , . . . , Xn ). Если Tn ∈ SK −→ гипотеза H0 отклоняется (и принимается H1 ). Если Tn ∈ SD −→ гипотеза H0 не отклоняется. В последнем случае мы говорим, что гипотеза не противоречит опытным данным и может быть принята. Однако, поскольку Tn зависит от случайных данных, ее значение также случайно, и оно может попасть в SK с отличной от нуля вероятностью, когда гипотеза верна, и, наоборот, оно может попасть в область SD , когда на самом деле гипотеза не верна (а верна H1 ). Статистическая проверка гипотез (так как она основана на случайных данных) необходимо сопряжена с ошибками двух видов. 7 / 23 4 Ошибки I-го и II-го рода При тестировании гипотез возникают ошибки первого и второго рода природа решение вещей статистика H0 H1 H0 верное решение ошибка II-го рода H1 ошибка I-го рода верное решение Ошибка I-го рода состоит в том, чтобы отклонить гипотезу H0 , когда она верна. Ошибка II-го рода состоит в том, чтобы отклонить альтернативу H1 (принять основную гипотезу H0 ), когда альтернатива верна. 8 / 23 4 На практике ошибки I-го и II-го рода, как правило, неравноправны: одна ошибка может привести к более серьезным последствиям, чем другая. Например: признать наличие заболевания и приступить к лечению. Ошибочное непризнание может привести к бóльшим неприятностям, чем ошибочное признание. Обычно H0 – это наиболее интересная для исследователя гипотеза, и задачу ставят так, чтобы наиболее неприятной была ошибка I-го рода. Определение 4.3 Вероятность α отклонения гипотезы H0 , когда она верна (т.е. ошибки I-го рода) P Tn ∈ SK | H0 =: α называется уровнем значимости критерия 9 / 23 4 Определение 4.4 Вероятность β принятия основной гипотезы H0 , в то время как верна альтернатива, называется вероятностью ошибки II-го рода. P Tn ∈ SD | H 1 = β Определение 4.5 Вероятность γ = 1 − β правильно отвергнуть H0 (то есть принять альтернативу H1 , когда она действительно верна) γ := P Tn ∈ SK | H1 = 1 − P Tn ∈ SD | H1 = 1 − β называется мощностью критерия. 10 / 23 4 Подход Неймана–Пирсона Поскольку невозможно одновременно сделать вероятности ошибок обоих типов I и II достаточно малыми при фиксированном объеме выборки n (это противоречивая задача), в статистике принят Подход Неймана–Пирсона ( вер. ошибки I-го рода ≤ α — малое число (уровень значимости), вер. ошибки II-го рода −→ min (стандартные значения: α = 0.005, α = 0.01, α = 0.05). Согласно этому подходу при заданном числе наблюдений n уровень значимости α назначается заранее, затем (при фиксированном α) ищут критерии, у которых мощность γ максимальна (следовательно, вероятность ошибки II-го рода β = 1 − γ минимальна). Карл Пирсон 11 / 23 4 12 / 23 4 §4.16 Примеры тестов. Проверка гипотез о параметрах нормального закона Пусть X1 , . . . , Xn — выборка из распределения ξ ∼ N(µ, σ 2 ). Рассмотрим классические тесты о параметрах нормального закона. 1. Критерий Стьюдента (t-test). гипотезу Наша цель — проверить H0 : µ = µ 0 против H1 : µ 6= µ0 В качестве тестовой статистики используем t-статистику Стьюдента: √ n − 1 X − µ0 , Tn = Sn где мы подставили гипотетическое значение параметра µ. 13 / 23 4 Теперь мы должны найти распределения тестовой статистики при условии, что гипотеза верна. Если H0 верна, и µ = µ0 — это правильное значение математического ожидания, то, как мы знаем, √ n − 1 X − µ0 ∼H0 tn−1 . Tn = Sn Назначаем уровень значимости α (типичные значения 0.05, 0.025, 0.01). Затем, как при построении доверительных интервалов, находим tα такое, что P |tn−1 | > tα = α tα = F −1 1 − α2 , которое находится по таблицам квантилей распределения Стьюдента. Поскольку Tn ∼ tn−1 , если гипотеза H0 верна, мы имеем P |Tn | > tα H0 = α В качестве критической области берем SK = {x : |x| > tα }. 14 / 23 4 Отсюда следует процедура проверки гипотезы: 1. назначаем уровень значимости α; 2. находим квантиль tα ; 3. вычисляем значение Tn на основе имеющихся наблюдений; 4. если |Tn | > tα , то гипотеза H0 отклоняется, вероятность ошибки равна α, если |Tn | ≤ tα , мы говорим, что гипотеза не противоречит данным наблюдений и может быть принята на уровне значимости α. Стьюдент (Вильям Госсет) 15 / 23 4 16 / 23 4 Фактический уровень значимости (p-value) Часто на практике уровень значимости не фиксируется заранее, вместо этого вычисляется так называемый фактический уровень значимости (p-value) — это вероятность того, что тестовая статистика примет значение больше, чем фактически полученное в эксперименте, при условии, что гипотеза H0 верна. Например, для критерия Стьюдента: пусть cn = Tn обозначает значение тестовой статистики, которое мы получили (cn — это число). Тогда pvalue = P |tn−1 | > cn = 2 Ftn−1 (cn ) − 1 Фактический уровень значимости (p-value) — это вероятность того, что случайная величина с распределением Стьюдента tn−1 по модулю окажется больше, чем cn . Иначе говоря, это уровень значимости α, при котором tα было бы равным cn = Tn . Если p-value большое ( α), то мы говорим, что гипотеза H0 значима, если маленькое (< α), то это свидетельствует в пользу альтернативы. 17 / 23 4 2. Проверка гипотезы о дисперсии. Требуется проверить гипотезу H0 : σ 2 = σ02 против H1 : σ 2 6= σ02 В качестве критерия мы можем взять статистику хи-квадрат: Tn = n Sn2 , σ02 где мы подставили гипотетическое значение параметра σ 2 . Теперь нам следует найти распределение тестовой статистики при условии, что гипотеза верна. Если H0 верна, то есть если σ 2 = σ02 — это правильное значение дисперсии, то, как мы знаем, Tn = n Sn2 σ02 ∼H0 χ2n−1 . 18 / 23 4 Следующим шагом мы назначаем уровень значимости α, затем для распределения χ2n−1 с n − 1 степенями свободы мы находим κ1, α и κ2, α такие, что α P χ2n−1 < κ1, α = P χ2n−1 > κ2, α = 2 κ1, α — это квантиль уровня α2 распределения хи-квадрат с n − 1 степенями свободы, и κ2, α — квантиль уровня 1 − α2 . (мы находим эти квантили в таблицах квантилей хи-квадрат распределения). Поскольку Tn ∼ χ2n−1 при условии, что H0 верна, мы имеем α α P {Tn < κ1, α } ∪ {Tn > κ2, α } H0 = + = α 2 2 SK = {x : {x < κ1, α } ∪ {x > κ2, α }}, SD = {x : x ∈ [κ1, α , κ2, α ]} — критическая область и область принятия гипотезы, соответственно. 19 / 23 4 Отсюда следует процедура проверки гипотезы: 1. назначаем уровень значимости α; 2. находим квантили κ1, α и κ1, α ; 3. вычисляем значение Tn = n Sn2 σ02 на основе имеющихся наблюдений; 4. если Tn ∈ / [κ1, α , κ2, α ], то гипотеза H0 , отклоняется, вероятность ошибки равна α; если Tn ∈ [κ1, α , κ2, α ], то мы говорим, что "гипотеза не противоречит опытным данным и может быть принята на уровне значимости α". Как и в случае критерия Стьюдента, можно вычислить фактический уровень значимости, который в данном случае вычисляется, как pvalue = 2 min Fχ2 (Tn ), 1 − Fχ2 (Tn ) . n−1 n−1 20 / 23 4 Пример 4.4 Автомобильная компания хотела бы уточнить каков средний пробег выпускаемого ими автомобиля на литр топлива, чтобы указать его в документации. Из прошлого опыта известно, что для автомобилей этого класса средний расход составлял обычно 10 км на литр топлива. Компания провела эксперименты с 26 автомобилями. Были получены наблюдения X1 , X2 , . . . , X26 , где Xi — пробег в километрах на литр топлива. Оказалось, что X = 9.3, Sn2 = 1.96. Можно ли на уровне значимости α = 0.05 указать в документации, что средний пробег на литр топлива равен 10 км, предполагая, что пробег на литр топлива — нормально распределенная случайная величина? Нам следует проверить гипотезу H0 : µ = 10 против H1 : µ 6= 10 21 / 23 4 Воспользуемся критерием Стьюдента. Имеем √ √ n − 1 X − µ0 25 9.3 − 10 5 · 0.7 Tn = = =− = −2.5. Sn 1.4 1.4 1− α = 1 − 0.025 = 0.975, n − 1 = 25, tα = Ft−1 (0.975) = 2.060 25 2 |Tn | > tα =⇒ H0 отвергается, вероятность ошибки равна α = 0.05. 22 / 23 4 Пример 4.4 (продолжение) Основываясь на данных примера 4.4, проверить гипотезу H0 : σ = 1.3 против H1 : σ 6= 1.3 Воспользуемся тестом, основанным на статистике, имеющей распределение хи-квадрат. Имеем α2 = 0.025, 1 − α2 = 0.975 Tn = n Sn2 26 · 1.96 19.6 ≈ 15.8 = = 2 2 (1.3) 1.3 σ0 κ1, α = Fχ−1 2 (0.025) = 13.1; 25 κ2, α = Fχ−1 2 (0.975) = 40.6; 25 Поскольку Tn ∈ [κ1, α , κ2, α ], гипотеза H0 не противеречит опытным данным и может быть принята на уровне значимости α = 0.05. 23 / 23

Проверка статистических гипотез

Тебе могут подойти лекции