Проверка статистических гипотез. Начальные определения
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Лекция №5. Проверка статистических гипотез.
Начальные определения
Юрий Белоусов
Институт биоинформатики
Москва
9 октября 2021 г.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Мотивирующий пример
Пример
Вы изучаете некоторый ген a и считаете, что в 50% случаев
наличие этого гена делает особь не способной к размножению.
Ваша выборка — 21 особь с геном a, для каждой из них вы
подсчитали количество ее потомков в первом поколении. Вот
результаты:
1, 0, 2, 1, 2, 3, 2, 2, 4, 5, 4, 4, 3, 2, 1, 1, 1, 0, 0, 2, 6.
I Можно ли сказать, верно ваше предположение или нет?
I Как можно отвечать на подобные вопросы, исходя из
предложенной выборки?
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Статистическая гипотеза
Определение
Гипотеза — любое утверждение о виде (или свойствах)
распределения наблюдаемых в эксперименте с. в. Если для
исследуемого явления сформулирована гипотеза, то ее
называют нулевой (обозначают H0 ), а ее отрицание —
альтернативной гипотезой (обозначают H1 ).
Модель постулируется (не проверяем), гипотеза формулируется
(проверяем).
Пример
Дана выборка X (наблюдения за с. в. ξ из распределения Fξ ).
I H0 : ξ ∼ N(µ, σ 2 ), где µ и σ — известные числа (Fξ = F0 ).
I H0 : ξ ∼ N(θ1 , θ2 ), где θ1 и θ2 — неизвестные (Fξ ∈ FΘ ).
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Примеры статистических гипотез
Пример (Гипотеза о виде распределения)
Дана выборка X, модель: FXi ≡ Fξ . Гипотеза имеет вид
H0 : Fξ ≡ F , где F — фиксированная функция (например,
F (x) = 1 − e −x при x ≥ 0). Или H0 : Fξ ∈ F, где F — семейство
функций (например F = {Fλ (x) = 1 − e −λx }λ>0 ).
Пример (Гипотеза однородности)
Даны выборки X1 , X2 , . . . , Xn где Xi = (Xi1 , . . . , Xini ). Гипотеза
может иметь вид H0 : FXi1 ≡ FXj1 для любых i, j.
Пример (Гипотеза независимости)
Дана выборка X, где Xi = (xi1 , xi2 ). Гипотеза может иметь вид
H0 : Fxi1 ,xi2 (x, y ) = Fxi1 (x) · Fxi2 (y ) для любого i.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Статистический критерий, ошибки I и II рода
Определение
Критерий — правило, по которому оценивается правильность
нулевой гипотезы.
Критерий разбивает выборочное пространство: X = X0 t X1 на
доверительную и критическую область. Если X ∈ X0 , то H0 не
отвергается, иначе отвергается.
Можно совершить
I ошибку первого рода — отклонить H0 , когда она верна,
I ошибку второго рода — принять H0 , когда она не верна.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Функция мощности критерия
Определение
Функция мощности критерия, определяемого критической
областью X1 это W (F ) = P(X ∈ X1 |F ).
Путь F — множество допустимых распределений, а H0 : F ∈ F0 .
Тогда вероятность ошибки первого рода это W (F ) при F ∈ F0 ,
а вероятность ошибки второго рода 1 − W (F ) при F ∈ F \ F0 .
Хотим минимизировать оба типа ошибки. На практике
поступают так: ошибку первого рода постулируют: W (F ) = α
при F ∈ F0 (в этом случае α — уровень значимости), а
критическую область выбирают так, что ошибка второго рода
была минимальна.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Статистика критерия
Обычно критическая область задается с помощью некоторой
статистики — статистики критерия X1 = {X|T (X) ≤ x}.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Статистика критерия
Обычно критическая область задается с помощью некоторой
статистики — статистики критерия X1 = {X|T (X) ≤ x}.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Общая схема построения критерия с помощью
статистики критерия
1. Строим статистику, такую что
1.1 она измеряет, насколько выборка отличается, от того, что
утверждается в H0 ,
1.2 ее распределение известно (может быть, только
асимптотически).
2. Для фиксированного уровня значимости α разбиваем
область значений на критическую и доверительную
область, так что:
2.1 W (F ) = α для всех F ∈ F0 (стремится к α в
асимптотическом случае),
2.2 ошибка второго рода минимальна.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Проверка гипотезы с первого слайда
Выборка: X = {1, 0, 2, 1, 2, 3, 2, 2, 4, 5, 4, 4, 3, 2, 1, 1, 1, 0, 0, 2, 6}.
Нулевая гипотеза H0 : p(X = 0) = 0.5, α = 0.95.
√
Статистика критерия T (X) = √n(0.5−p
∗)
0.5(1−0.5)
, где p ∗ =
P 1(Xi =0)
n
.
Её асимптотическое распределение в случае H0 — N(0, 1).
Доверительная область: −Φ(1 − α2 ); Φ(1 − α2 ) = (−1.96; 1.96).
В нашем случае T (X) = 3.27, т. е. гипотеза отвергается.
Ю. Белоусов
Проверка статистических гипотез
Институт биоинформатики
Понятия гипотезы и критерия
Примеры критериев
Общие замечания
Критерий согласия Колмогорова
Дана выборка X (Fn ее — эмпирическая ф. р.) из неизвестного
распределения F , и выдвинута простая гипотеза: H0 : F = F0 ,
где F0 непрерывна.
Теорема (Колмогоров)
При любом фиксированном t > 0
∞
X
√
2 2
(−1)j e −2t j = K (t).
lim P( n sup |F0 (x)−Fn (x)| ≤ t) =
n→∞
x
Статистика критерия в этом случае:
j=−∞
√
n
sup
−∞
Тебе могут подойти лекции
А давай сэкономим
твое время?
твое время?
Дарим 500 рублей на первый заказ,
а ты выбери эксперта и расслабься
Включи камеру на своем телефоне и наведи на Qr-код.
Кампус Хаб бот откроется на устройстве
Не ищи – спроси
у ChatGPT!
у ChatGPT!
Боты в Telegram ответят на учебные вопросы, решат задачу или найдут литературу
Попробовать в Telegram
Оставляя свои контактные данные и нажимая «Попробовать в Telegram», я соглашаюсь пройти процедуру
регистрации на Платформе, принимаю условия
Пользовательского соглашения
и
Политики конфиденциальности
в целях заключения соглашения.
Пишешь реферат?
Попробуй нейросеть, напиши уникальный реферат
с реальными источниками за 5 минут
с реальными источниками за 5 минут
Проверка статистических гипотез. Начальные определения
Хочу потратить еще 2 дня на работу и мне нужен только скопированный текст,
пришлите в ТГ