Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
СРАВНЕНИЕ ВЫБОРОК
Лекция 12
НЕЗАВИСИМЫЕ И ПАРНЫЕ
ВЫБОРКИ
В независимых выборках объекты выбираются независимо
друг от друга.
Выборка 1
Выборка 2
В парных (зависимых) выборках с каждым наблюдением
одной выборки сопоставлено наблюдение другой выборки.
Выборка 1
Выборка 2
2
НЕЗАВИСИМЫЕ И ПАРНЫЕ
ВЫБОРКИ
НЕЗАВИСИМЫЕ
Выборки из двух разных ГС
► Жители Москвы vs. жители СанктПетербурга
► Россияне vs. Французы
► Студенты МГИМО vs. студенты МГУ
Выборки из одной ГС
►
►
►
►
Студенты МГИМО: МЖ vs. МЭО
Москвичи: женщины vs. мужчины
Россияне: молодые vs. пожилые
Покупатели: предпочитающие
Apple vs. предпочитающие Samsung
ПАРНЫЕ
► Мужья vs. Жены
► Исследования близнецов
► Apple vs. Samsung: экспертные
оценки
► Студенты 1 МЖ: оценки по
математике в осеннем и весеннем
семестре
3
ПАРНЫЕ ВЫБОРКИ
Мужья vs. Жены
Исследования
близнецов
Apple vs. Samsung
Оценки студентов
1 МЖ
• Мнению каждого мужа соответствует мнение
именно его жены
• Показателям близнеца №1 соответствуют
показатели близнеца №2, то есть брата/сестры
• Каждой оценке Apple соответствует оценка
Samsung от того же эксперта
• Каждой оценке за осенний семестр соответствует
оценка за весенний семестр этого же студента
4
НЕЗАВИСИМЫЕ И ПАРНЫЕ
ВЫБОРКИ
НЕЗАВИСИМЫЕ
ПАРНЫЕ
Город
Доверие
мэру
Эксперт
Оценка
марки А
Оценка
марки В
Мск
4
1
4
3
СПб
6
2
3
4
Мск
2
3
2
3
6
4
5
4
3
5
1
2
СПб
СПб
5
ВОЗМОЖНЫЕ ГИПОТЕЗЫ
О СРЕДНИХ
Независимые выборки
σ известны
σ
неизвестны,
но равны
О ДОЛЯХ
О ДИСПЕРСИЯХ
Зависимые
выборки
σ
неизвестны
и неравны
6
НЕЗАВИСИМЫЕ ВЫБОРКИ
7
ПРОВЕРКА ГИПОТЕЗЫ О
РАВЕНСТВЕ СРЕДНИХ
H0
Генеральные средние равны
H1
Генеральные средние не равны
H0: μ1 = μ2
H1: μ1 ≠ μ2
𝛼/2
1−𝛼
𝛼/2
8
ВЫБОР КРИТЕРИЯ
σ12 и σ22
Неизвестны
Объем выборок
𝑧=
Известны
𝜎12 𝜎22
𝑛1 + 𝑛2
Большой
𝑧=
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
Малый
H0: σ12 = σ22
𝑋1 − 𝑋2
Отвергается
𝑡min(𝑛1−1,𝑛2−1) =
Принимается
𝑡𝑛1+ 𝑛2 −2 =
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
9
H0: μ1 = μ2
H1: μ1 ≠ μ2
ПРИМЕР
В результате проведенного исследования среди потребителей сока выяснилось, что вкус
марки А люди в возрасте 60+ (214 респондентов) оценивают на 4.5 балла, а люди в
возрасте 18-25 – на 4.2 балла (178 респондентов). Действительно ли оценка молодых
отличается от оценки пожилых? Проверить утверждение на уровне значимости α = 0,01.
Считать дисперсии равными единице.
Известны
σ12 и σ22
𝑧=
𝑋1 − 𝑋2
𝜎12 𝜎22
𝑛1 + 𝑛2
𝑧=
=
4.5 − 4.2
1
1
+
214 178
= 2.96
𝑋1 − 𝑋2
𝜎12 𝜎22
𝑛1 + 𝑛2
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
10
ПРИМЕР
ВНИМАНИЕ! На слайде исправлена ошибка. Общий принцип
определения z при двусторонней области такой. В таблице указаны
значения для площади, лежащей слева от +𝑧𝛼Τ2 . Эта площади
складывается из площадей 1 − 𝛼 + 𝛼/2. При 𝛼 = 0.01 эта площадь равна
0.99 (1 − 𝛼) + 0.005 (𝛼/2). Итого - 0.995 (это значение обведено красным
прямоугольником).
𝛼/2
1−𝛼
−𝑧𝛼Τ2
𝛼/2
+𝑧𝛼Τ2
𝛼 = 0.01
𝛼
= 0.005
2
1−
ищем в
таблице
𝛼
= 0.995
2
+𝑧𝛼Τ2 = 2.575
11
H0: μ1 = μ2
H1: μ1 ≠ μ2
ПРИМЕР
В результате проведенного исследования среди потребителей сока выяснилось, что вкус
марки А люди в возрасте 60+ (214 респондентов) оценивают на 4.5 балла, а люди в
возрасте 18-25 – на 4.2 балла (178 респондентов). Действительно ли оценка молодых
отличается от оценки пожилых? Проверить утверждение на уровне значимости α = 0,01.
Считать дисперсии равными единице.
σ12 и σ22
𝑧=
Известны
Значение статистики
попадает в
критическую область,
значит, принимаем
альтернативную
гипотезу.
𝜎12 𝜎22
𝑛1 + 𝑛2
𝑧=
𝑋1 − 𝑋2
𝜎12 𝜎22
𝑛1 + 𝑛2
−2.58
+2.58 +2.96
𝑋1 − 𝑋2
=
4.5 − 4.2
1
1
+
214 178
= 2.96
12
ПРИМЕР 2
В результате проведенного продуктового теста среди потребителей сока выяснилось, что
вкус марки А люди в возрасте 60+ (25 респондентов) оценивают на 4.5 балла, а люди в
возрасте 18-25 – на 4.2 балла (18 респондентов). Генеральные дисперсии неизвестны,
вычисленные по выборке дисперсии равны 2.0 и 1.7 соответственно. Действительно ли
оценки сока различны? Проверить утверждение на уровне значимости α = 0,05.
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
H0: μ1 = μ2
H1: μ1 ≠ μ2
13
ВЫБОР КРИТЕРИЯ
σ12 и σ22
Неизвестны
Объем выборок
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 1.7
𝑠22 = 2.0
𝑧=
Известны
𝜎12 𝜎22
𝑛1 + 𝑛2
Большой
𝑧=
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
Малый
H0: σ12 = σ22
𝑋1 − 𝑋2
Отвергается
𝑡min(𝑛1−1,𝑛2−1) =
Принимается
𝑡𝑛1+ 𝑛2 −2 =
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
14
ГИПОТЕЗА О РАВЕНСТВЕ
ДИСПЕРСИЙ
15
F-КРИТЕРИЙ
F-критерий, (критерий Фишера) используется для проверки равенства
дисперсий двух генеральных совокупностей, имеющих нормальное
распределение.
Условие:
𝑠12 > 𝑠22
Если не выполняется, поменять местами номера генеральных
совокупностей. То есть 𝑠12 - это всегда та дисперсия, которая больше.
𝑠12
𝐹= 2
𝑠2
Имеет F-распределение с числом степеней
свободы:
числителя df1 = n1 – 1
знаменателя df2 = n2 – 1.
16
РАСПРЕДЕЛЕНИЕ ФИШЕРА
Плотность распределения
Функция распределения
17
НАЙДЕМ F-КРИТЕРИЙ
𝐹=
2
𝑠1
𝑠22
Имеет F-распределение с числом степеней
свободы:
числителя df1 = n1 – 1
знаменателя df2 = n2 – 1.
Чтобы найти F, надо знать три параметра: α / df1 / df2
Соответственно, таблица должна быть трехмерная. Для удобства
используется несколько таблиц для разных α.
18
НАЙДЕМ F-КРИТЕРИЙ
𝐹=
2
𝑠1
𝑠22
Чтобы найти F, надо знать три
параметра: α / df1 / df2
На пересечении
df1 / df2 лежит
нужное значение
статистики
19
ВЕРНЕМСЯ К
ПРИМЕРУ
20
ПРИМЕР 2
В результате проведенного продуктового теста среди потребителей сока выяснилось, что
вкус марки А люди в возрасте 60+ (25 респондентов) оценивают на 4.5 балла, а люди в
возрасте 18-25 – на 4.2 балла (18 респондентов). Генеральные дисперсии неизвестны,
вычисленные по выборке дисперсии равны 2.0 и 1.7 соответственно. Действительно ли
оценки сока различны? Проверить утверждение на уровне значимости α = 0,05.
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
H0: μ1 = μ2
H1: μ1 ≠ μ2
21
ВЫБОР КРИТЕРИЯ
σ12 и σ22
Неизвестны
Объем выборок
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
𝑧=
Известны
𝜎12 𝜎22
𝑛1 + 𝑛2
Большой
𝑧=
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
Малый
H0: σ12 = σ22
𝑋1 − 𝑋2
Отвергается
𝑡min(𝑛1−1,𝑛2−1) =
Принимается
𝑡𝑛1+ 𝑛2 −2 =
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
22
ПРИМЕР 2
Для выбора критерия проверим гипотезу о равенстве дисперсий.
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
𝐹=
2
𝑠1
2
𝑠2
2
H0: 𝜎1
2
H1: 𝜎1
2
= 𝜎2
2
≠ 𝜎2
2.0
=
= 1.8
1.7
23
ПРИМЕР 2
α=0.05
число
степе
ней
свобо
ды v2
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
число степеней свободы v1
1
2
3
4
5
6
7
8
9
10
11
12
15
20
24
30
40
60
120
1
161
200
216
225
230
234
237
239
271
242
243
244
246
248
249
250
251
252
253
2
18,5
19,0
19,2
19,2
19,3
19,3
19,4
19,4
19,4
19,4
19,4
19,4
19,4
19,4
19,5
19,5
19,5
19,5
19,5
3
10,1
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,76
8,74
8,70
8,66
8,64
8,62
8,59
8,57
8,55
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,94
5,91
5,86
5,80
5,77
5,75
5,72
5,69
5,66
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,71
4,68
4,62
4,56
4,53
4,50
4,46
4,43
4,40
6
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
4,03
4,00
3,94
3,87
3,84
3,81
3,77
3,74
3,70
7
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,64
3,60
3,57
3,51
3,44
3,41
3,38
3,34
3,30
3,27
8
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,35
3,31
3,28
3,22
3,15
3,12
3,08
3,04
3,01
2,97
9
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,14
3,10
3,07
3,01
2,94
2,90
2,86
2,83
2,79
2,75
10
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,98
2,94
2,91
2,85
2,77
2,74
2,70
2,66
2,62
2,58
11
4,84
3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,90
2,85
2,82
2,79
2,72
2,65
2,61
2,57
2,53
2,49
2,45
12
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
2,75
2,72
2,69
2,62
2,54
2,51
2,47
2,43
2,38
2,34
13
4,67
3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,71
2,67
2,63
2,60
2,53
2,46
2,42
2,38
2,34
2,30
2,25
14
4,60
3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,65
2,60
2,57
2,53
2,46
2,39
2,35
2,31
2,27
2,22
2,18
15
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
2,54
2,51
2,48
3,52
3,37
3,29
3,21
3,13
3,05
2,96
16
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
2,49
2,46
2,42
2,35
2,28
2,24
2,19
2,15
2,11
2,06
17
4,45
3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,49
2,45
2,41
2,38
2,31
2,23
2,19
2,15
2,10
2,06
2,01
df1 = n1 – 1=25-1=24
df2 = n2 – 1=18-1=17
24
ПРИМЕР 2
Для выбора критерия проверим гипотезу о равенстве дисперсий.
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
𝐹=
2
𝑠1
2
𝑠2
2.0
=
= 1.8
1.7
Критическое значение равно 2,19
25
ПРИМЕР 2
H0: 𝜎12 = 𝜎22
H1: 𝜎12 ≠ 𝜎22
Значение статистики не
попадает в критическую
область, значит, принимаем
нулевую гипотезу.
𝛼
1−𝛼
𝑓𝑎
Критическая область распределения
Фишера
𝛼
1−𝛼
𝐹 = 1.8
𝑓𝑎 = 2.19
Наш пример
𝐹 = 1.8
𝑓𝑎 = 2.19
26
ВЫБОР КРИТЕРИЯ
σ12 и σ22
Неизвестны
Объем выборок
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
𝑧=
Известны
𝜎12 𝜎22
𝑛1 + 𝑛2
Большой
𝑧=
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
Малый
H0: σ12 = σ22
𝑋1 − 𝑋2
Отвергается
𝑡min(𝑛1−1,𝑛2−1) =
Принимается
𝑡𝑛1+ 𝑛2 −2 =
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
27
ПРИМЕР 2
𝑡𝑛1+ 𝑛2−2 =
𝑡𝑛1 + 𝑛2−2 =
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
𝑛1 + 𝑛2 − 2
1
1
∗ 𝑛 +𝑛
1
2
4.5 − 4.2
25 − 1 ∗ 2.0 + 18 − 1 ∗ 1.7
1
1
∗
+
25 + 18 − 2
25 18
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
= 0.71
28
ПРИМЕР 2
Найдем t
𝛼=0.05
df=25+18-2=41
𝛼/2
1−𝛼
-2. 0
𝛼/2
+2.0
29
ПРИМЕР 2
H0: μ1 = μ2
H1: μ1 ≠ μ2
𝑡𝑛1 + 𝑛2 −2 = 0.71
−2.0
Значение статистики не
попадает в критическую
область, значит,
принимаем нулевую
гипотезу.
+0.71
+2.0
30
ПРИМЕР 2
В результате проведенного продуктового теста среди потребителей сока выяснилось, что
вкус марки А люди в возрасте 60+ (25 респондентов) оценивают на 4.5 балла, а люди в
возрасте 18-25 – на 4.2 балла (18 респондентов). Генеральные дисперсии неизвестны,
вычисленные по выборке дисперсии равны 2.0 и 1.7 соответственно. Действительно ли
оценки сока различны? Проверить утверждение на уровне значимости α = 0,05.
Пожилые
Молодые
𝑛 = 25
𝑛 = 18
𝑋1 = 4.5
𝑋2 = 4.2
𝑠12 = 2.0
𝑠22 = 1.7
H0: μ1 = μ2
H1: μ1 ≠ μ2
Оценки вкусовых качеств сока у пожилых и молодых не отличаются.
31
ПРОМЕЖУТОЧНЫЙ
ИТОГ
32
СРАВНЕНИЕ СРЕДНИХ ДВУХ
НЕЗАВИСИМЫХ ВЫБОРОК
σ12 и σ22
Неизвестны
Объем выборок
𝑧=
Известны
𝜎12 𝜎22
𝑛1 + 𝑛2
Большой
𝑧=
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
Малый
H0: σ12 = σ22
𝑋1 − 𝑋2
Отвергается
𝑡min(𝑛1−1,𝑛2−1) =
Принимается
𝑡𝑛1+ 𝑛2 −2 =
𝑋1 − 𝑋2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
33
ПРОВЕРКА ГИПОТЕЗЫ О
РАВЕНСТВЕ ДИСПЕРСИЙ
F-критерий (критерий Фишера) используется для проверки равенства
дисперсий двух генеральных совокупностей, имеющих нормальное
распределение.
Условие:
𝐹=
𝑠12 > 𝑠22
2
𝑠1
𝑠22
Имеет F-распределение с
числом степеней свободы:
числителя df1 = n1 – 1
знаменателя df2 = n2 – 1.
1−𝛼
𝛼
𝑓𝑎
34
ПАРНЫЕ ВЫБОРКИ
35
ГИПОТЕЗА О РАВЕНСТВЕ
СРЕДНИХ
H0: μd = 0
H1: μd ≠ 0
критерий
среднее для парных разностей
генеральной совокупности
𝑑
𝑑
𝑠𝑑
𝑛
𝑑ҧ
𝑡= 𝑠
𝑑
𝑛
- разность между двумя значениями в одной паре
- выборочное среднее для парных разностей
- стандартное отклонение разностей для выборки
- количество пар
36
ПРИМЕР
Эксперт
Apple
Samsung
1
8
9
2
7
8
3
6
5
4
5
7
5
8
6
6
9
7
7
10
9
8
6
7
9
7
6
10
9
8
Экспертов попросили
оценить продукт двух
торговых марок по шкале от
1 до 10. Оценки
представлены в таблице.
Проверим гипотезу о
равенстве оценок при
α=0.05
H0: μd = 0
H1: μd ≠ 0
37
ПРИМЕР
Эксперт
1
2
3
4
5
6
7
8
9
10
Apple
8
7
6
5
8
9
10
6
7
9
Samsung
9
8
5
7
6
7
9
7
6
8
𝑑
8-9=-1
7-8=-1
6-5=1
5-7=-2
8-6=2
9-7=2
10-9=1
6-7=-1
7-6=1
9-8=1
𝑑ҧ
𝑡= 𝑠
𝑑
𝑛
σ𝑑
= 0.3
𝑛
n - количество пар оценок = количество экспертов
n=10
𝑑ҧ =
38
ПРИМЕР
Эксперт
1
2
3
4
5
6
7
8
9
10
𝑠𝑑 =
Apple
8
7
6
5
8
9
10
6
7
9
𝛴𝑑
2
𝛴𝑑 −
𝑛
𝑛−1
Samsung
9
8
5
7
6
7
9
7
6
8
𝑑
8-9=-1
7-8=-1
6-5=1
5-7=-2
8-6=2
9-7=2
10-9=1
6-7=-1
7-6=1
9-8=1
𝑑ҧ
𝑡= 𝑠
𝑑
𝑛
2
39
ПРИМЕР
Эксперт
1
2
3
4
5
6
7
8
9
10
Apple
8
7
6
5
8
9
10
6
7
9
Samsung
9
8
5
7
6
7
9
7
6
8
Разности (𝑑)
-1
-1
1
-2
2
2
1
-1
1
1
𝑑2
1
1
1
4
4
4
1
1
1
1
𝛴𝑑 = 3
𝛴𝑑 2 = 19
𝛴𝑑
𝑠𝑑 =
𝛴𝑑
−
𝑛
𝑛−1
𝛴𝑑 2
2
𝑑ҧ
𝑡= 𝑠
𝑑
𝑛
=9
2
19 − 9/10
=
= 1.4
9
40
ПРИМЕР
Эксперт
1
2
3
4
5
6
7
8
9
10
𝑑ҧ = 0.3
𝑠𝑑 = 1.4
n = 10
Apple
8
7
6
5
8
9
10
6
7
9
Samsung
9
8
5
7
6
7
9
7
6
8
𝑑ҧ
0.3
𝑡= 𝑠 =
= 0.68
1.4
𝑑
𝑛
10
α = 0.05
41
ПРИМЕР 2
Найдем t
𝛼=0.05
df=n-1=10-1=9
𝛼/2
1−𝛼
-2. 3
𝛼/2
+2.3
𝑑ҧ
0.3
𝑡= 𝑠 =
= 0.68
1.4
𝑑
𝑛
10
42
ПРИМЕР
Эксперт
1
2
3
4
5
6
7
8
9
10
𝑑ҧ = 0.3
𝑠𝑑 = 1.4
n = 10
α = 0.05
Apple
8
7
6
5
8
9
10
6
7
9
𝑑ҧ
0.3
𝑡= 𝑠 =
= 0.68
1.4
𝑑
𝑛
10
Samsung
9
8
5
7
6
7
9
7
6
8
Значение статистики не
попадает в критическую
область, значит, принимаем
нулевую гипотезу.
Эксперты дали одинаковые
оценки продуктам двух
брендов.
43
ГИПОТЕЗА О
РАВЕНСТВЕ ДОЛЕЙ
ТОЛЬКО ДЛЯ
НЕЗАВИСИМЫХ
ВЫБОРОК
44
КРИТЕРИЙ
H0: p1 = p2
H1: p1 ≠ p2
𝑧=
условия: np ≥ 5 и nq ≥ 5.
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞( + )
𝑛1 𝑛2
𝑝
ෞ1 и 𝑝
ෞ2 - доли признака в выборке 1 и 2
𝑝ҧ
- доля «успехов» в двух выборках
𝑚1 + 𝑚2
𝑝ҧ =
𝑛1 + 𝑛2
45
ПРИМЕР
Предположим, что из 100 случайно отобранных МЖ 52 учат немецкий, а из 200
студентов МЭО - 103 человек. На уровне значимости α = 0,05 проверить
гипотезу о том, что нет значимого различия между долей изучающих немецкий
на двух факультетах.
H0: p1 = p2
H1: p1 ≠ p2
По таблице нормального закона находим критические значения: z = - 1,96 и z =
1,96. Критическая область двусторонняя.
Вычисляем значение статистики.
𝑧=
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞(𝑛 + 𝑛 )
1
2
46
ПРИМЕР
Вычисляем значение статистики.
𝑧=
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞( + )
𝑛1 𝑛2
𝑝
ෞ1 − 𝑝
ෞ2 =
𝑝ҧ =
𝑧=
52 103
−
= 0.005
100 200
𝑚1 + 𝑚2
52 + 103
=
= 0.52
𝑛1 + 𝑛2
100 + 200
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞( + )
𝑛1 𝑛2
=
0.005
1
1
0.52 ∗ 0.48 ∗ (
+
)
100 200
𝑞ത = 1 − 0.52 = 0.48
= 0.08
47
ПРИМЕР
Предположим, что из 100 случайно отобранных МЖ 52 учат немецкий, а из 200
студентов МЭО - 103 человек. На уровне значимости α = 0,05 проверить
гипотезу о том, что нет значимого различия между долей изучающих немецкий
на двух факультетах.
H0: p1 = p2
H1: p1 ≠ p2
По таблице нормального закона находим критические значения: z = - 1,96 и z =
1,96. Критическая область двусторонняя.
Вычисляем значение статистики.
𝑧=
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞(𝑛 + 𝑛 )
1
2
= 0.08
Значение статистики не попадает в критическую область, значит, принимаем нулевую
гипотезу.
Доли изучающих немецкий равны.
48
ПОДВЕДЕМ ИТОГ
49
О СРЕДНИХ
О ДОЛЯХ
Зависимые
выборки
Независимые выборки
𝑧=
О ДИСПЕРСИЯХ
𝑝
ෞ1 − 𝑝
ෞ2
1
1
𝑝𝑞( + )
𝑛1 𝑛2
𝑠12
𝐹= 2
𝑠2
Только для независимых
σ известны
𝑧=
𝑋1 − 𝑋2
σ
неизвестны,
но равны
σ
неизвестны
и неравны
𝑡min(𝑛1 −1,𝑛2 −1) =
𝜎12 𝜎22
+
𝑛1 𝑛2
𝑡𝑛1 + 𝑛2 −2 =
𝑑ҧ
𝑡= 𝑠
𝑑
𝑛
𝑋1 − 𝑋2
𝑠12 𝑠22
+
𝑛1 𝑛2
𝑋1 − 𝑋2
(𝑛1 − 1)𝑠12 +(𝑛2 −1)𝑠22
1
1
∗
+
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
50