Статистическая проверка гипотез. Критерий согласия Пирсона
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекции по математической статистике
Лекция №3
• Статистическая проверка гипотез.
• Критерий согласия Пирсона
Статистическая гипотеза
• Статистической гипотезой называют гипотезу о виде
неизвестного распределения генеральной совокупности
или о параметрах известных распределений.
• Нулевой (основной) называют выдвинутую гипотезу Н0.
• Конкурирующей (альтернативной) называют гипотезу Н1,
которая противоречит нулевой.
Пример.
• Пусть Н0 заключается в том, что математическое ожидание
генеральной совокупности а = 3.
• Тогда возможные варианты Н1: а) а ≠ 3;
б) а > 3;
в) а < 3.
Статистическая гипотеза
• Простой называют гипотезу, содержащую только
одно предположение,
• сложной – гипотезу, состоящую из конечного или
бесконечного числа простых гипотез.
Пример.
• Для показательного распределения гипотеза
• Н0: λ = 2 – простая,
• Н0: λ > 2 – сложная, состоящая из бесконечного
числа простых ( вида λ = с, где с – любое число,
большее 2).
Статистическая гипотеза
• Основной прием проверки статистических гипотез
заключается в том, что по имеющейся выборке вычисляется
значение некоторой случайной величины, имеющей
известный закон распределения.
• Статистическим критерием называется случайная
величина К с известным законом распределения, служащая
для проверки нулевой гипотезы.
• Пусть поставлена задача статистической проверки
гипотезы. Выбран критерий, сопоставляющий каждой
выборке соответствующую гипотезу. Возможны следующие
ошибки:
Виды ошибок
• Ошибка первого рода:
Верна нулевая гипотеза Н0, но она отвергнута.
• Ошибка второго рода:
Нулевая гипотеза Н0 ложная, но она принята.
Значимость ошибок 1 и 2 рода
• Пример: по статистической проверке делаем вывод.
Нулевая гипотеза Н0: продукция стандартна,
Альтернативная гипотеза Н1: продукция нестандартна.
Если Н0 верна, но по значению критерия ее отвергли, то
это означает, что
производитель отбракует стандартный продукт.
Поэтому ошибка 1 рода – риск производителя.
Если Н0 ложна, но по значению критерия ее приняли, то
это означает, что
производитель отправит нестандартный продукт на рынок.
Поэтому ошибка 2 рода – риск потребителя.
Критическая область
• Критической областью называют область значений
критерия, при которых нулевую гипотезу отвергают,
областью принятия гипотезы – область значений критерия,
при которых гипотезу принимают.
Различают разные виды критических областей:
-
правостороннюю
критическую
область,
неравенством K > kкр
определяемую
P(K > kкр )=α
( kкр > 0);
-
левостороннюю
критическую
область,
неравенством K < kкр
определяемую
P(K < kкр )=α
( kкр < 0);
-
двустороннюю
критическую
неравенствами K < k1, K > k2
область,
(k2 > k1).
• P(K >- kкр )+ P(K < kкр )= α
определяемую
Процесс проверки статистической гипотезы
• Шаг 1.
Сформулировать основную и
альтернативную гипотезу
• Шаг 2.
Задать уровень значимости α
• Шаг 3.
По таблице найти критические значения и
построить критическую область
• Шаг 4. По выборке вычислить
значение статистики
• Шаг 5. Сравнить значение статистики с критическим.
Если попало в критическую область отклонить
основную гипотезу, нет – принять ее.
• Шаг 6. Записать вывод
• Мощностью
критерия
называют
вероятность
попадания критерия в критическую область при условии,
что верна конкурирующая гипотеза.
• Если обозначить вероятность ошибки второго рода
(принятия
неправильной
нулевой
гипотезы)
β,
то
мощность критерия равна 1 – β.
• Следовательно, чем больше мощность критерия, тем
меньше вероятность совершить ошибку второго рода.
Поэтому после выбора уровня значимости следует
строить критическую область так, чтобы мощность
критерия была максимальной.
Пример. Гипотеза о среднем .
Пусть имеется некоторая генеральная совокупность
(ГС) с нормальным распределением: X N ( , ) .
Требуется: по данным случайной выборки проверить
гипотезу о среднем значении ГС по гипотетическому μ0.
Виды гипотез
Пример.
В журнале «Досуг молодежи» отмечено, что
старшеклассники смотрят телевизор меньше других.
Известно, что в среднем люди проводят 29,4 ч перед
ТВ в неделю со средним отклонением 2 ч.
Для случайной выборки из 25 старшеклассников
получено среднее значение 27 ч.
Проверим утверждение на уровне значимости
α=0,01.
XГ
N ( 29, 4; = 2 )
Пример. Гипотеза о среднем .
ГС распределена нормально. В качестве статистики
(критерия) возьмем
X −
=
В
/ n
.
Центрированная и нормированная СВ ~N(0,1)
Шаг 1. Н0: X В 29, 4
Н1: X В 29, 4 (левосторонняя кр.область)
Шаг 2. α=0,01.
Поиск критической точки.
Z~N(0,1)
P(0zкр)= P(0 uкр, то нулевая гипотеза отвергается.
2) Если конкурирующая гипотеза Н1: р > p0, то критическая область
определяется неравенством U > uкр, то есть является правосторонней,
причем р(U > uкр) = α. Тогда
р(0 U u кр ) =
1
1 − 2
− =
2
2
. Следовательно, икр можно
найти по таблице значений функции Лапласа из условия, что
Вычислим наблюдаемое значение критерия по формуле (4.2).
Если Uнабл < uкр, то нулевая гипотеза принимается.
Если Uнабл > uкр, то нулевая гипотеза отвергается.
Ф(и кр ) =
1 − 2
2
.
Проверка гипотезы о вероятности события
3) Для конкурирующей гипотезы Н1: р < p0 критическая область
является левосторонней и задается неравенством U <- uкр, где икр
вычисляется так же, как в предыдущем случае.
Если Uнабл > - uкр, то нулевая гипотеза принимается.
Если Uнабл < - uкр, то нулевая гипотеза отвергается.
Пример
Пример. Пусть проведено 50 независимых испытаний, и
относительная частота появления события А оказалась равной
0,12. Проверим при уровне значимости α= 0,01 нулевую гипотезу
Н0: р = 0,1 при конкурирующей гипотезе Н1: р > 0,1. Найдем
U набл =
(0,12 − 0,1) 50
= 0,471.
0,1 0,9
Критическая область является правосторонней,
а икр находим из равенства
Ф(икр) =
1 − 2 0,01
= 0,49.
2
Из таблицы значений функции Лапласа
определяем икр = 2,33. Итак, Uнабл < uкр, и гипотеза о том, что р =
0,1, принимается.
Используемые Интернетисточники
• http://www.myshared.ru/slide/218243/