Проверка статистических гипотез
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ПРОВЕРКА
СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Лекция 11
ЭТАПЫ СОЦИОЛОГИЧЕСКОГО
ИССЛЕДОВАНИЯ
Теоретическая модель
Переменные и гипотезы
Генеральная совокупность и выборка
Выбор метода и сбор данных
Описание и анализ данных
2
СТАТИСТИЧЕСКАЯ ГИПОТЕЗА
Статистическая гипотеза – любое предположение о
свойствах и характеристиках исследуемых генеральных
совокупностей, которое может быть проверено на основе
анализа выборок.
В ходе проверки гипотезы делается один из следующих
выводов:
1) рассматриваемая гипотеза не верна, следует ее
отклонить;
2) можно принять рассматриваемую гипотезу, т.к. нет
причин ее отклонить.
3
ГИПОТЕЗЫ
ГИПОТЕЗЫ
Параметрические
Непараметрические
предположения относительно
значений параметров
исследуемого распределения
допущения о характере
распределения переменных не
делаются
4
ГИПОТЕЗЫ
H0
Проверяемая гипотеза в статистике называется
основной или нулевой гипотезой.
H1
Противоречащая ей гипотеза называется
альтернативной.
В результате проверки имеется две возможности:
1. Принять основную гипотезу H0, отклонив при
этом альтернативную гипотезу H1
2. Отклонить основную гипотезу H0 и принять
альтернативную гипотезу H1
5
ПРИМЕРЫ
ПРИМЕР 1
ПРИМЕР 2
ПРИМЕР 3
Изменится ли
успеваемость студентов
по языку из-за перевода
в онлайн-формат?
Вырастет ли
узнаваемость кандидата
после предвыборной
кампании?
Снизился ли доля
курящих после
коммуникативной
кампании?
Средний балл - 80
Узнаваемость 20%
Доля курящих 25%
ГИПОТЕЗЫ
H0: μ = 80
H1: μ ≠ 80
H0: р ≤ 20%
H1: р > 20%
H0: р ≥ 25%
H1: р < 25%
Двусторонний
критерий
Правосторонний
критерий
Левосторонний
критерий
6
ОШИБКИ
Основная гипотеза верна
Основная гипотеза неверна
Мы приняли
основную гипотезу
Верное решение
Ошибка II рода
Мы отклонили
основную гипотезу
Ошибка I рода
Верное решение
Ошибка первого рода происходит в случае, когда мы отвергаем
нулевую гипотезу, если она верна.
Ошибка второго рода происходит, если мы принимаем нулевую
гипотезу, когда она неверна.
7
УРОВЕНЬ ЗНАЧИМОСТИ
Уровень значимости гипотезы (α) – вероятность отклонить
гипотезу Н0, когда она верна, то есть совершить ошибку
первого рода.
Пример
α = 0,05
существует вероятность 5% отвергнуть
истинную нулевую гипотезу.
8
СТАТИСТИКА
Статистика или статистический критерий – специальная
функция от элементов выборки, по значениям которой
принимают решение о принятии или отклонении основной
гипотезы.
Критическая
область
Область принятия гипотезы
Значение статистики попало в
зеленую зону – принимаем H0
Критические значения
Критическая
область
Возможные
значения
статистики
9
КРИТИЧЕСКАЯ ОБЛАСТЬ
Критическая
область
Область принятия гипотезы
Критические значения
Критическая
область
Возможные
значения
статистики
Область принятия гипотезы – множество значений статистики, при
которых основную гипотезу следует принять.
Критическая область – множество значений статистики, при которых
основную гипотезу следует отклонить.
Критические значения отделяют критическую область от области
принятия гипотезы.
10
КРИТИЧЕСКАЯ ОБЛАСТЬ
Двусторонняя критическая область
Левосторонняя критическая область
Правосторонняя критическая область
11
ПРИМЕРЫ
ПРИМЕР 1
ПРИМЕР 2
ПРИМЕР 3
Изменится ли
успеваемость студентов
по языку из-за перевода
в онлайн-формат?
Вырастет ли
узнаваемость кандидата
после предвыборной
кампании?
Снизился ли доля
курящих после
коммуникативной
кампании?
Средний балл - 80
Узнаваемость 20%
Доля курящих 25%
ГИПОТЕЗЫ
H0: μ = 80
H1: μ ≠ 80
H0: р ≤ 20%
H1: р > 20%
H0: р ≥ 25%
H1: р < 25%
Двусторонняя
Правосторонняя
Левосторонняя
12
КРИТИЧЕСКАЯ ОБЛАСТЬ
►Критическая область строится, исходя из имеющихся
знаний о законе распределения статистики.
►Критические точки находятся по таблицам.
►После построения критической области значение
статистики по выборке сравнивают с критической
областью.
►Если значение статистики попало в область принятия
гипотезы, то основная гипотеза принимается.
►Если значение статистики попало в критическую область,
то основная гипотеза отклоняется и принимается
альтернативная гипотеза.
13
ЭТАПЫ ПРОВЕРКИ ГИПОТЕЗЫ
1. Сформулировать основную и альтернативную гипотезы.
2. Задать уровень значимости α.
3. По таблице найти критические значения и построить критическую
область.
4. По выборке посчитать значение статистики.
5. Сравнить полученное значение с критической областью. Если
значение попало в критическую область – отклонить основную
гипотезу, не попало – принять.
6. Сделать вывод
14
ВОЗМОЖНЫЕ ГИПОТЕЗЫ
О СРЕДНЕМ
σ известно
или n ≥ 30
О ДОЛЕ
О
ДИСПЕРСИИ
σ неизвестно
и n≤30
15
ГИПОТЕЗЫ О СРЕДНЕМ
σ известно или
n ≥ 30
16
РЕШЕНИЕ
В качестве статистики используется следующая случайная функция:
гипотетическое генеральное среднее
𝑥 − 𝜇𝑜
𝑧=
𝜎/ 𝑛
Если σ неизвестна, используем s.
Эта величина имеет стандартное нормальное распределение.
Для нахождения критических значений пользуемся таблицами функции
нормального распределения.
17
РЕШЕНИЕ
Рассмотрим три варианта:
1
𝛼/2
2
3
H 0 : μ = μ0
H 1 : μ ≠ μ0
H0 : μ ≤ μ0
H1: μ > μ0
H 0 : μ ≥ μ0
H 1 : μ < μ0
Двусторонняя
Правосторонняя
Левосторонняя
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
1−𝛼
+𝑧𝛼
𝛼
𝛼
1−𝛼
−𝑧𝛼
18
РЕШЕНИЕ: ПРАВОСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
2
1.
H 0 : μ ≤ μ0
H 1 : μ > μ0
Правосторонняя
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
1−𝛼
𝛼
𝑧 < 𝑧𝛼
принимаем H0
𝑧 > 𝑧𝛼
отвергаем H0
+𝑧𝛼
19
НАХОДИМ Z𝛼
1−𝛼
𝛼
+𝑧𝛼
Если α=0.05, то
площадь слева от z𝛼
равна 0.95.
Ищем 0.95 в таблице
и смотрим, чему
равно z𝛼.
z𝛼 =1.65
20
РЕШЕНИЕ: ЛЕВОСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
3
H 0 : μ ≥ μ0
H 1 : μ < μ0
Левосторонняя
1.
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
𝛼
1−𝛼
𝑧 > 𝑧𝛼
принимаем H0
𝑧 < 𝑧𝛼
отвергаем H0
−𝑧𝛼
21
НАХОДИМ Z𝛼
𝛼
1−𝛼
−𝑧𝛼
Помня о свойстве
симметрии, находим
z𝛼.
–zα равен z𝛼 с
отрицательным
знаком, то есть -1.65
22
РЕШЕНИЕ: ДВУСТОРОННЯЯ
КРИТИЧЕСКАЯ ОБЛАСТЬ
Рассмотрим три варианта:
1.
1
H 0 : μ = μ0
H 1 : μ ≠ μ0
Сформулировать основную и альтернативную
гипотезы.
2. Задать уровень значимости α.
Двусторонняя
𝛼 = 0.05
3. По таблице найти критические значения и построить
критическую область.
4. По выборке посчитать значение статистики. 𝑧
5. Сравнить полученное значение с критической
областью. Если значение попало в критическую
область – отклонить основную гипотезу, не попало –
принять.
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
−𝑧𝛼/2 < 𝑧 < +𝑧𝛼/2
𝑧 > +𝑧𝛼
ИЛИ
+𝑧𝛼Τ2
𝑧 < −𝑧𝛼/2
принимаем H0
отвергаем H0
23
НАХОДИМ Z𝛼/2
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
Если α=0.05, то
α/2=0.025, значит
площадь слева от z𝛼/2
равна 0.975.
Ищем 0.975 в таблице
и смотрим, чему
равно z𝛼/2.
z𝛼/2 =1.96
Значит -z𝛼/2 =-1.96
24
ПРИМЕР
В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор.
Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со
стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27
часов. Необходимо проверить утверждение на уровне значимости α = 0,05.
Сформулировать основную и альтернативную гипотезы.
H 0 : μ ≥ μ0
H 1 : μ < μ0
H0: μ ≥ 29.4
H1: μ < 29.4
Задать уровень значимости α. По условию дано α = 0,05.
По таблице найти критические значения и построить критическую область.
Помня о свойстве симметрии, находим z𝛼.
–zα = -1.645
𝛼
1−𝛼
−𝑧𝛼
25
НАХОДИМ Z𝛼
𝛼
1−𝛼
−𝑧𝛼
Помня о свойстве
симметрии, находим
z𝛼.
–zα равен z𝛼 с
отрицательным
знаком, то есть -1.645
26
ПРИМЕР
В одном исследовании утверждается, что студенты в среднем меньше смотрят телевизор.
Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со
стандартным отклонением 2 часа. Случайная выборка из 35 студентов имеет среднее 27
часов. Необходимо проверить утверждение на уровне значимости α = 0,05.
По выборке посчитать значение статистики.
𝑥 − 𝜇𝑜 27 − 29.4
𝑧=
=
= −7.1
𝜎/ 𝑛
2/ 35
Сравнить полученное значение с критической областью. Если значение попало в
критическую область – отклонить основную гипотезу, не попало – принять.
1−𝛼
𝑧 = −7 −𝑧𝛼 = −1,645
Сделать вывод
Значение z=-7 попадает в критическую область. Значит,
отклоняем нулевую гипотезу о том, что студенты смотрят
телевизор не меньше, чем все люди в среднем. Принимаем
альтернативную гипотезу о том, что студенты смотрят
телевизор меньше других.
27