Проверка статистических гипотез. Сравнение двух генеральных средних.
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Глава 3. Проверка статистических гипотез. Сравнение двух
генеральных средних.
3.1. Проверка статистических гипотез. Простая гипотеза.
Статистическая гипотеза – понятие более ёмкое, чем просто оценка значения
неизвестного параметра. Пусть с помощью статистического эксперимента мы хотим
проверить простую гипотезу о том, что неизвестное среднее µ равно некоторому
значению µ0: -H0. Эта гипотеза будет основной. Альтернативной ей является также
простая гипотеза H1 (µ<µ0). Например, известно, что в среднем за смену на станке
производится 110 деталей. Станок сломался, и его отремонтировали. Получив на
отремонтированном станке показатели за n смен, мы хотим проверить гипотезу о том, что
производительность станка не изменилась, если альтернативной гипотезой является та, по
которой производительность изменилась; или что производительность станка
увеличилась, или что производительность станка уменьшилась.
3.2 Понятие критической области и уровня значимости
.при решении таких задач также применяется аппарат построения для
соответствующей статистики области Iβ, вероятность попадания в которую β достаточно
близка к 1. При попадании статистики, построенной по выборке, в эту область
применяется основная гипотеза (в нашем примере, что производительность станка не
изменилась и равна 110); в противном случае, если значение статистики попало в область,
противоположную Iβ, принимается альтернативная гипотеза (производительность станка
изменилась). В задачах о проверке гипотез принято область, противоположную Iβ,
называть критической, а число α=1-β – уровнем значимости. Уровень значимости α
обычно берут равным 0,05, иногда 0,01. При α=0,05 мы, проверяя на деле истинную
гипотезу о том, что µ= µ0, т.е. в среднем 5 из 100 истинных гипотез. Эту ошибку α, когда
отбрасывается основная гипотеза, называют ошибкой первого рода, в отличие от
ошибки второго рода, которую совершают, приняв основную гипотезу, когда она ложна.
В простых случаях областями Iβ оказываются уже знакомые доверительные интервалы.
При проверке гипотезы Θ=Θ0 мы строим с доверительной вероятностью β=1-α при
альтернативной гипотезе Θ≠Θ двусторонний, а при гипотезах Θ>Θ0 и Θ< Θ0
односторонние с нижней границей хн и верхней границей xв доверительные интервалы.
Если этот интервал накрывает Θ0, гипотеза H0 принимается, если не накрывает –
отвергается. Приведём некоторые примеры.
Пример 5. В задаче про ремонт станка проверяем гипотезу об изменении
производительности станка, если за 31 смену получены данные о производительности, для
которых x = 100, s 2 = 202. Уровень значимости α=0,05 (β=0,95) и ν = n-1 = 30. Значения tn,β,
участвующие в процессе доверительного интервала, отыскиваются в таблицах 3 и 6, β или
α в верхней строке:
20
I 0,95 = x + t30;0,95
= 100 ± 7,45.
30
Вывод – гипотеза о том, что производительность станка не изменилась, не проходит на
уровне значимости 5%, так как старая производительность, равная 110, в 95-процентный
доверительный интервал для новой средней производительности не попала. Более того,
она не попала бы в доверительный интервал, даже если бы мы задались 98-процентным
уровнем доверия, для которого t 30;0,98 = 2,46(I 0,98 ± 8,98) . Т.е. наша выборка показала, что
гипотеза о том , что производительность станка не изменилась, не проходит даже на
уровне значимости 2%. Только при уровне доверия 0,99(t 30;0,98) = 2,75) интервал
становится таким большим ( I 0,99 = 100 ± 10,04 ), что мы уже не можем быть на 99%
уверены, что изменение выработки не случайно. Увидев, что новые показатели хуже
старых, берём в качестве альтернативной гипотезу о том, что новое среднее меньше
старого (такая альтернатива естественна, если x < µ 0 ), т.е. производительность станка
уменьшилась. Это предположение подтверждается даже на уровне значимости 0,01.
Действительно, строим односторонний доверительный интервал для уровня доверия 0,99.
Значения t n , β ,участвующие в построении одностороннего доверительного интервала,
отыскиваются снова по таблицам 3, 6.
I 0,99 = (−∞, x + t v , 0,01
20
30
= (−∞,100 + 2,46 * 3,65) = (−∞,108,98).
Так как µ0=110 не входит в построенный односторонний интервал, можно принять
гипотезу о том, что производительность уменьшилась, на уровне значимости 1%.
Подчеркнём, что вывод о приемлемости основной гипотезы, её непротиворечивости
имеющимся данным не означает того, что доказана её истинность. Принимая её, в
некотором проценте случаев мы ошибёмся.
Перечислим критерии, по которым, не привлекая понятия доверительного интервала,
проверяется статистическая гипотеза о том, что среднее значение генеральной
совокупности µ=µ0 на уровне значимости (они выведены из формул для двустороннего и
одностороннего доверительного интервала для уровня доверия β=1-α).
Вычисляем по выборке значение статистики
1.
T=
x − µ0
.
s
n
Критическая область для односторонней проверки гипотезы, что среднее
значение генеральной совокупности µ=µ0 по сравнению с альтернативой µ≠µ0 на
уровне значимости α определяется неравенством T > t n −1,α (tn-1,α) отыскивается
по таблицам 3, 6 из [1,2] критических значений распределения Стьюдента , α в
нижней строке таблицы 6).
2.
Критическая область для односторонней проверки гипотезы, что среднее
значение генеральной совокупности µ=µ0 по сравнению с альтернативой µ>µ0 на
уровне значимости α определяется неравенством
T > t n −1,α (tn-1,α отыскивается
также по таблице 6 критических значений распределения Стьюдента, α в нижней
строке).
Критическая область для односторонней проверки гипотезы, что среднее
3.
значение генеральной совокупности µ=µ0 по сравнению с альтернативой µ<µ0 на
уровне значимости α определяется неравенством T < −t n −1,α (tn-1,α) отыскивается
по таблице 6 критических значений, α в нижней строке).
Если вычисленное значение статистики T попадает в критическую область, то
основная гипотеза отвергается. Вероятность попадания в эту область равна принятому
уровню значимости α.. В этом случае принимается альтернативная гипотеза.
В нашем случае про станок T=-2,74, а t30;0,01 = 2,58. Так что основная гипотеза не
проходит, а проходит альтернативная гипотеза µ<110 при уровне значимости 0,01.