Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция №2. Статистические гипотезы, критерии их проверки
В данной лекции кратко изложены лишь основные понятия, касающиеся важной темы проверки статистических гипотез. Данный материал является повторением некоторых моментов соответствующего раздела курсов «Математическая статистика», к которым рекомендуется обратиться читателям для более подробного разбора материала. В частности, рекомендуется обратиться к учебникам:
1. Боровков А. А. Математическая статистика. М.: Наука, 1984.
2. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М., 1998.
3. Колемаев В. А., Калинина В. Н. Теория вероятностей и математическая статистика. М., 1997.
О проверке гипотез
Гипотезой называется любое предположение о распределении наблюдаемой величины
Статистический критерий – это процедура (формально – отображение), приписывающая данной выборке одну из сформулированных гипотез.
Статистический критерий не отвечает на вопрос, верна или нет проверяемая гипотеза. Он лишь решает, противоречат или не противоречат выдвинутой гипотезе выборочные данные, можно ли принять или следует отвергнуть данную гипотезу.
Если есть одна основная гипотеза, а все остальное — нежелательные отклонения от нее, то вывод «данные противоречат гипотезе» всегда весомее, нежели вывод «данные не противоречат гипотезе».
Критерии согласия
Критериями согласия называют критерии, предназначенные для проверки простой гипотезы при сложной альтернативе.
Критерии согласия отвергают или не позволяют отвергнуть основную гипотезу исходя из величины функции отклонения эмпирического распределения от теоретического, распределение которой существенно разнится в зависимости от того, верна или нет основная гипотеза.
Пример построения и использования критерия согласия
Рассмотрим простую модель величины:
, .
Требуется проверить гипотезу против сложной альтернативы если имеется выборка наблюдений
Построим функцию отклонения
где — выборочное среднее:
.
Если гипотеза верна, то
Критерий имеет вид: гипотеза отвергается, если
Ошибки критериев
Нам неизвестно, какая из гипотез верна в действительности, поэтому следует считаться с гипотетическими вероятностями ошибок критерия.
Происходит ошибка i-го рода, если критерий отвергает гипотезу в то время, как она верна.
В случае критериев согласия (простая гипотеза против сложной альтернативы) различают ошибки первого рода и ошибки второго рода.
Например, в случае проверки по вышеуказанному критерию, можно найти вероятность ошибки первого рода:
Варьируя параметр Z (допустимое отклонение) мы получим различные критерии (с разной вероятностью ошибки первого рода).
Далее приведены примеры некоторых критериев, которые обыкновенно рассматриваются в курсах математической статистики и считаются «классическими».
Проверка гипотезы о неизвестном среднем при неизвестной дисперсии нормальной с.в.
Рассмотрим простую модель величины:
,
.
Требуется проверить гипотезу против сложной альтернативы если имеется выборка наблюдений
Построим функцию отклонения
,
Если гипотеза верна, то . Критерий имеет вид: гипотеза отвергается, если .
Вероятность ошибки первого рода критерия:
Критерий Колмогорова – Смирнова
Известно, что — выборка из некоторого (неизвестного) распределения ; требуется проверить гипотезу против сложной альтернативы .
Функция отклонения для построения критерия имеет вид:
где — выборочная функция распределения (построенная по данной выборке), а — теоретическая функция распределения, на принадлежность к которому тестируется данная выборка.
Проверка гипотезы однородности
Известно, что: — выборка из некоторого (неизвестного) распределения и — выборка из некоторого (неизвестного) распределения . требуется проверить сложную гипотезу против сложной альтернативы .
Функция отклонения для построения критерия имеет вид:
Проверка гипотезы об одинаковом среднем при одинаковой дисперсии
Известно, что: — выборка из и — выборка из .
Требуется проверить гипотезу против сложной альтернативы .
Для построения критерия используется статистика
где — распределение t-Стьюдента с степенями свободы.
Реально достигнутый уровень значимости и допустимая вероятность ошибки первого рода, формулировки схемы работы критерия согласия
Важно помнить основной принцип работы критерия — чем больше расчетное значение функции отклонения («статистики», используемой в критерии), тем более мы склонны к тому, чтобы отвергнуть основную («нулевую») гипотезу. Критический уровень статистики (при превышении которого гипотеза отвергается) определяется, исходя из распределения статистики при верной гипотезе.
Часто для упрощения понимания результатов работы с критерием обращают внимание непосредственно на допустимую вероятность ошибки первого рода. Если построенный для проверки некоторой гипотезы критерий основан на некоторой статистике
,
где — некоторое распределение, а критический уровень статистики выбран (т.е. отвергается, если расчетное значение статистики превышает ), то из закона распределения можно определить соответствующую вероятность ошибки первого рода.
Важный показатель при применении критерия — это реально достигнутый уровень значимости (РДУЗ). Если в случае вышеприведенного критерия при некоторой выборке статистика приняла расчетное значение , то реально достигнутый уровень значимости — это вероятность того, что при верной гипотезе статистика превысит данной расчетное значение:
.
где — функция распределения ; таким образом, РДУЗ — это не что иное, как «вероятность хвоста» распределения статистики, на которой основан критерий, при верной нулевой гипотезе. Очевидно, что с ростом расчетного значения статистики РДУЗ не возрастает (и почти всегда критерии построены так, что просто убывает), т.е. чем меньше РДУЗ, тем более мы должны быть склонны отвергнуть нулевую гипотезу.
Если сопоставить две «схемы» работы критерия (в терминах критического уровня статистики и в терминах РДУЗ), то получится пара эквивалентных формулировок критерия:
В терминах значения
функции отклонения
В терминах РДУЗ
Задан критический
уровень статистики
отвергается если,
отвергается если,
Задан критический
уровень значимости
отвергается если,
отвергается если,
т.е. при строго монотонной функции распределения каждому значению критического отклонения соответствует единственное критическое значение достигнутого уровня значимости , и наоборот: .
Формулировку схемы работы критерия в терминах РДУЗ часто связывают с т.н. допустимой вероятностью ошибки первого рода. Интерпретация этого показателя следующая. Допустим, критерий сформулирован в виде «гипотеза отвергается, если РДУЗ меньше 0.05»; такая формулировка означает, что при многократном применении критерия (с независимыми выборками, конечно) приблизительно в 5% случаев мы будем допускать ошибку первого рода, т.е. отвергать нулевую гипотезу, когда она верна. Принимая такую формулировку критерия, мы соглашаемся на эту «погрешность», и поэтому этот показатель 0.05 иногда называют также «допустимая вероятность ошибки первого рода».
Другая трактовка этого термина основывается на более «гибкой» формулировке схемы работы критерия. Допустим, не имея четкой границы допустимого значения РДУЗ (или функции отклонения) мы получили РДУЗ=0.078; стоит ли отвергнуть гипотезу или сделать вывод, что отвергнуть ее не удается при данной выборке? В данном случае, если мы принимаем решения отвергнуть гипотезу , то «автоматически» соглашаемся и с тем, что гипотеза должна быть отвергнута и для всех выборок, для которых РДУЗ составит менее текущего 0.078, тем самым соглашаясь на соответствующую «допустимую вероятность ошибки первого рода».
Построение критерия с помощью доверительного интервала
Известно, что — выборка из некоторого распределения , (или вектор параметров), требуется проверить гипотезу против сложной альтернативы если известен ДИ для параметра .
Критерий принимает вид: не отвергается, если . Вероятность ошибки первого рода такого критерия составит
Каждая из трех формулировок схемы работы критерия (в терминах расчетного/критического значения функции отклонения или в терминах реально достигнутого уровня значимости / допустимой вероятности ошибки первого рода, или в терминах доверительного интервала) имеет свои преимущества в той или иной ситуации, но всегда можно установить соответствие между разными формулировками.
Если в ряде известных критериев, ставших «стандартными» принято ориентироваться на значение расчетное значение статистики, то в других случаях исследователю удобнее определиться с уровнем допустимой вероятности ошибки первого рода или построить доверительный интервал (если гипотеза параметрическая).
Стоит также упомянуть, что «стандартными» уровнями допустимой вероятности ошибки первого рода принято считать 0.1, 0.05, 0.01 (чаще — 0.05).