Статистическая гипотеза
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ПРОВЕРКА
СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Лекция 11
СТАТИСТИЧЕСКАЯ ГИПОТЕЗА
Статистическая гипотеза – любое предположение о
свойствах и характеристиках исследуемых генеральных
совокупностей, которое может быть проверено на основе
анализа выборок.
В ходе проверки гипотезы делается один из следующих
выводов:
1) рассматриваемая гипотеза не верна, следует ее
отклонить;
2) можно принять рассматриваемую гипотезу, т.к. нет
причин ее отклонить.
2
ГИПОТЕЗЫ
H0
Проверяемая гипотеза в статистике называется
основной или нулевой гипотезой.
H1
Противоречащая ей гипотеза называется
альтернативной.
В результате проверки имеется две возможности:
1. Принять основную гипотезу H0, отклонив при
этом альтернативную гипотезу H1
2. Отклонить основную гипотезу H0 и принять
альтернативную гипотезу H1
3
ПРИМЕРЫ
ПРИМЕР 1
ПРИМЕР 2
ПРИМЕР 3
Изменится ли
успеваемость студентов
по языку из-за перевода
в онлайн-формат?
Вырастет ли
узнаваемость кандидата
после предвыборной
кампании?
Снизился ли доля
курящих после
коммуникативной
кампании?
Средний балл - 80
Узнаваемость 20%
Доля курящих 25%
ГИПОТЕЗЫ
H0: μ = 80
H1: μ ≠ 80
H0: р ≤ 20%
H1: р > 20%
H0: р ≥ 25%
H1: р < 25%
Двусторонний
критерий
Правосторонний
критерий
Левосторонний
критерий
4
ОШИБКИ
Основная гипотеза верна
Основная гипотеза неверна
Мы приняли
основную гипотезу
Верное решение
Ошибка II рода
Мы отклонили
основную гипотезу
Ошибка I рода
Верное решение
Ошибка первого рода происходит в случае, когда мы отвергаем
нулевую гипотезу, если она верна.
Ошибка второго рода происходит, если мы принимаем нулевую
гипотезу, когда она неверна.
5
УРОВЕНЬ ЗНАЧИМОСТИ
Уровень значимости гипотезы (α) – вероятность совершить
ошибку первого рода, то есть принять гипотезу Н0, когда
она неверна.
Пример
α = 0,05
существует вероятность 5% отвергнуть
истинную нулевую гипотезу.
6
СТАТИСТИКА
Статистика или статистический критерий – специальная
функция от элементов выборки, по значениям которой
принимают решение о принятии или отклонении основной
гипотезы.
Область принятия гипотезы
Критическая
область
Значение статистики попало в
зеленую зону – принимаем H0
Критические значения
Критическая
область
Возможные
значения
статистики
7
КРИТИЧЕСКАЯ ОБЛАСТЬ
Критическая
область
Область принятия гипотезы
Критические значения
Критическая
область
Возможные
значения
статистики
Область принятия гипотезы – множество значений статистики, при которых основную
гипотезу следует принять.
Критическая область – множество значений статистики, при которых основную гипотезу
следует отклонить.
Критические значения отделяют критическую область от области принятия гипотезы.
8
ПРИМЕРЫ
ПРИМЕР 1
ПРИМЕР 2
ПРИМЕР 3
Изменится ли
успеваемость студентов
по языку из-за перевода
в онлайн-формат?
Вырастет ли
узнаваемость кандидата
после предвыборной
кампании?
Снизился ли доля
курящих после
коммуникативной
кампании?
Средний балл - 80
Узнаваемость 20%
Доля курящих 25%
ГИПОТЕЗЫ
H0: μ = 80
H1: μ ≠ 80
H0: р ≤ 20%
H1: р > 20%
H0: р ≥ 25%
H1: р < 25%
Двусторонняя
Правосторонняя
Левосторонняя
9
ЭТАПЫ ПРОВЕРКИ ГИПОТЕЗЫ
1. Сформулировать основную и альтернативную гипотезы.
2. Задать уровень значимости α.
3. По таблице найти критические значения и построить критическую
область.
4. По выборке посчитать значение статистики.
5. Сравнить полученное значение с критической областью. Если
значение попало в критическую область – отклонить основную
гипотезу, не попало – принять.
6. Сделать вывод
10
ВОЗМОЖНЫЕ ГИПОТЕЗЫ
О СРЕДНЕМ
σ известно
или n ≥ 30
О ДОЛЕ
О
ДИСПЕРСИИ
σ неизвестно
и n≤30
11
ГИПОТЕЗЫ О СРЕДНЕМ
σ известно или
n ≥ 30
12
РЕШЕНИЕ
В качестве статистики используется следующая случайная функция:
гипотетическое генеральное среднее
𝑥 − 𝜇𝑜
𝑧=
𝜎/ 𝑛
Если σ неизвестна, используем s.
Эта величина имеет стандартное нормальное распределение.
Для нахождения критических значений пользуемся таблицами функции
нормального распределения.
13
РЕШЕНИЕ
Рассмотрим три варианта:
1
𝛼/2
2
3
H 0 : μ = μ0
H 1 : μ ≠ μ0
H0 : μ ≤ μ0
H1: μ > μ0
H 0 : μ ≥ μ0
H 1 : μ < μ0
Двусторонняя
Правосторонняя
Левосторонняя
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
1−𝛼
+𝑧𝛼
𝛼
𝛼
1−𝛼
−𝑧𝛼
14
РЕШЕНИЕ: ПРАВОСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
2
1.
H 0 : μ ≤ μ0
H 1 : μ > μ0
Правосторонняя
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
1−𝛼
𝛼
𝑧 < 𝑧𝛼
принимаем H0
𝑧 > 𝑧𝛼
отвергаем H0
+𝑧𝛼
15
НАХОДИМ Z𝛼
1−𝛼
𝛼
+𝑧𝛼
Если α=0.05, то
площадь слева от z𝛼
равна 0.95.
Ищем 0.95 в таблице
и смотрим, чему
равно z𝛼.
z𝛼 =1.65
16
РЕШЕНИЕ: ЛЕВОСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
3
H 0 : μ ≥ μ0
H 1 : μ < μ0
Левосторонняя
1.
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
𝛼
1−𝛼
𝑧 > 𝑧𝛼
принимаем H0
𝑧 < 𝑧𝛼
отвергаем H0
−𝑧𝛼
17
НАХОДИМ Z𝛼
𝛼
1−𝛼
−𝑧𝛼
Помня о свойстве
симметрии, находим
z𝛼.
–zα равен z𝛼 с
отрицательным
знаком, то есть -1.65
18
РЕШЕНИЕ: ДВУСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
Рассмотрим три варианта:
1.
1
H 0 : μ = μ0
H 1 : μ ≠ μ0
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
Двусторонняя
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
−𝑧𝛼/2 < 𝑧 < +𝑧𝛼/2
𝑧 > +𝑧𝛼
ИЛИ
+𝑧𝛼Τ2
𝑧 < −𝑧𝛼/2
принимаем H0
отвергаем H0
19
НАХОДИМ Z𝛼/2
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
Если α=0.05, то
α/2=0.025, значит
площадь слева от z𝛼/2
равна 0.975.
Ищем 0.975 в таблице
и смотрим, чему
равно z𝛼/2.
z𝛼/2 =1.96
Значит -z𝛼/2 =-1.96
20
ПРИМЕР
В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор.
Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со
стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27
часов. Необходимо проверить утверждение на уровне значимости α = 0,01.
Сформулировать основную и альтернативную гипотезы.
H 0 : μ ≥ μ0
H 1 : μ < μ0
H0: μ ≥ 29.4
H1: μ < 29.4
Задать уровень значимости α. По условию дано α = 0,01.
По таблице найти критические значения и построить критическую область.
Помня о свойстве симметрии, находим z𝛼.
–zα = -2.33
𝛼
1−𝛼
−𝑧𝛼
21
ПРИМЕР
В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор.
Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со
стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27
часов. Необходимо проверить утверждение на уровне значимости α = 0,01.
По выборке посчитать значение статистики.
𝑥 − 𝜇𝑜 27 − 29.4
𝑧=
=
= −7.1
𝜎/ 𝑛
2/ 35
Сравнить полученное значение с критической областью. Если значение попало в
критическую область – отклонить основную гипотезу, не попало – принять.
1−𝛼
𝑧 = −7
−𝑧𝛼 = −2,33
Сделать вывод
Значение z=-7 попадает в критическую область. Значит,
отклоняем нулевую гипотезу о том, что студенты смотрят
телевизор не меньше, чем все люди в среднем. Принимаем
альтернативную гипотезу о том, что студенты смотрят
телевизор меньше других.
22
ГИПОТЕЗЫ О СРЕДНЕМ
σ неизвестно
или n < 30
23
РЕШЕНИЕ
В качестве статистики используется следующая случайная функция:
𝑥 − 𝜇𝑜
𝑡=
𝑠/ 𝑛
Эта величина имеет t-распределение с числом степеней свободы
df = n – 1.
Для нахождения критических значений пользуемся таблицами t-распределения.
24
РЕШЕНИЕ
Также имеется три варианта:
1
𝛼/2
2
3
H 0 : μ = μ0
H 1 : μ ≠ μ0
H0 : μ ≤ μ0
H1: μ > μ0
H 0 : μ ≥ μ0
H 1 : μ < μ0
Двусторонняя
Правосторонняя
Левосторонняя
1−𝛼
−𝑡𝛼Τ2
𝛼/2
+𝑡𝛼Τ2
1−𝛼
+𝑡𝛼
𝛼
𝛼
1−𝛼
−𝑡𝛼
25
ПРИМЕР
В исследовании, проведенном среди студентов МГИМО, утверждается, что студенты МЖ
читают больше книг в сравнении с другими. Среднее количество книг, прочитанных
студентами за год, составило 15. Опрос среди 25 студентов МЖ показал, что они читают, в
среднем, 16 книг в год, стандартное отклонение равно 2. Справедливо ли утверждение на
уровне значимости α = 0,01?
Сформулировать основную и альтернативную гипотезы.
H 0 : μ ≤ μ0
H 1 : μ > μ0
H0: μ ≤ 15
H1: μ > 15
Задать уровень значимости α. По условию дано α = 0,01.
По таблице найти критические значения и построить критическую область.
1−𝛼
+𝑡𝛼
𝛼
26
Найдем t
По условию дано α = 0,01.
df=n-1=25-1=24
На пересечении ищем t
t=2.797
27
ПРИМЕР
В исследовании, проведенном среди студентов МГИМО, утверждается, что студенты МЖ
читают больше книг в сравнении с другими. Среднее количество книг, прочитанных
студентами за год, составило 15. Опрос среди 25 студентов МЖ показал, что они читают, в
среднем, 16 книг в год, стандартное отклонение равно 2. Справедливо ли утверждение на
уровне значимости α = 0,01?
𝑥 − 𝜇𝑜 16 − 15
𝑡=
=
= 2.5
𝑠/ 𝑛
2/ 25
𝛼 = 0.01
Значение 𝑡=2.5 не
попадает в критическую
область. Значит,
принимаем нулевую
гипотезу о том, что
студенты МЖ читают не
больше книг, чем
студенты в среднем.
𝑡 = 2.5 +𝑡𝛼 = 2.797
28
ГИПОТЕЗА О ДОЛЕ
29
РЕШЕНИЕ
Также имеется три варианта:
1
𝛼/2
2
3
H0: p = p0
H 1 : p ≠ p0
H 0 : p ≤ p0
H 1 : p > p0
H0: p ≥ p0
H1: p < p0
Двусторонняя
Правосторонняя
Левосторонняя
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
1−𝛼
+𝑧𝛼
𝛼
𝛼
1−𝛼
−𝑧𝛼
30
РЕШЕНИЕ
В качестве статистики используется следующая случайная функция:
доля признака в выборке
𝑧=
𝑝ො − 𝑝
𝑝𝑞/𝑛
доля признака в ГС
Или:
𝑚 − 𝑛𝑝
𝑧=
𝑛𝑝𝑞
Условие: np ≥ 5 и nq ≥ 5
31
ПРИМЕР
Кандидат в мэры утверждает, что его поддерживает не менее половины
горожан. Исследовательская компания провела опрос и выяснила, что из 500
опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что
кандидат преувеличивает? Проверьте на уровне значимости 1%.
Сформулируем основную и альтернативную гипотезы
H0: p ≥ p0
H 1 : p < p0
Задаем уровень значимости:
𝛼 = 0.01
Найдем критическое значение и построим критическую область.
32
НАХОДИМ Z𝛼
𝛼
1−𝛼
−𝑧𝛼
Помня о свойстве
симметрии, находим
z𝛼.
–zα равен z𝛼 с
отрицательным
знаком, то есть -2.33
33
ПРИМЕР
Кандидат в мэры утверждает, что его поддерживает не менее половины
горожан. Исследовательская компания провела опрос и выяснила, что из 500
опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что
кандидат преувеличивает? Проверьте на уровне значимости 1%.
Сформулируем основную и альтернативную гипотезы
H0: p ≥ p0
H 1 : p < p0
Задаем уровень значимости:
𝛼 = 0.01
Найдем критическое значение и
построим критическую область.
-2.33
34
ПРИМЕР
Кандидат в мэры утверждает, что его поддерживает не менее половины
горожан. Исследовательская компания провела опрос и выяснила, что из 500
опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что
кандидат преувеличивает? Проверьте на уровне значимости 1%.
Найдем критическое значение и
построим критическую область.
-2.33
По выборке вычисляем значение статистики
𝑧=
𝑝Ƹ − 𝑝
𝑝𝑞/𝑛
=
0.48 − 0.5
−0.02
=
= −0.91
0.5 ∗ 0.5/500 0.022
35
ПРИМЕР
Кандидат в мэры утверждает, что его поддерживает не менее половины
горожан. Исследовательская компания провела опрос и выяснила, что из 500
опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что
кандидат преувеличивает? Проверьте на уровне значимости 1%.
Значение статистики –
0.91 не попадает в
критическую область.
-2.33
-0.91
По выборке вычисляем значение статистики
𝑧=
𝑝Ƹ − 𝑝
𝑝𝑞/𝑛
=
0.48 − 0.5
−0.02
=
= −0.91
0.5 ∗ 0.5/500 0.022
36
ПРИМЕР
Кандидат в мэры утверждает, что его поддерживает не менее половины
горожан. Исследовательская компания провела опрос и выяснила, что из 500
опрошенных кандидата поддерживают 240 человек. Можно ли утверждать, что
кандидат преувеличивает? Проверьте на уровне значимости 1%.
Значение статистики –
0.91 не попадает в
критическую область.
-2.33
-0.91
Вывод: значение статистики попадает в область принятия гипотезы, значит,
принимаем нулевую гипотезу о том, что кандидата поддерживает не менее
половины горожан.
Кандидат не преувеличивает.
37