Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 8.
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ГЕНЕРАЛЬНЫХ СРЕДНИХ
(ЗАВИСИМЫЕ ВЫБОРКИ)
1. Постановка задачи о различии средних для зависимых выборок
Существует много практических задач, в которых две сравниваемые выборки
взаимосвязаны в силу особенностей организации эксперимента или просто потому, что
этой взаимосвязи нельзя избежать.
Примеры зависимых выборок:
- первая и вторая выборки состоят из наблюдений типа «до – после»;
- первая выборка – совокупность значений времени самостоятельного выполнения
задания, а вторая – совокупность значений времени выполнения задания под
наблюдением и при руководстве преподавателя.
В практике психологических, педагогических, медицинских исследований часто
используются так называемые парные сравнения. При парных сравнениях нельзя
использовать методы для независимых выборок, поскольку это приведет к большим
ошибкам.
Для сравнения средних значений здесь используется модификация t -критерия Стьюдента
для зависимых выборок.
Постановка задачи.
Даны две зависимые выборки объема n , то есть связанные пары наблюдений: x1, y1 ,
x2 , y2 , …, xn , yn . Проверяется гипотеза H 0 о равенстве математических ожиданий
a x a y . Альтернативной гипотезой H1 является гипотеза a x a y .
Критерий (правило) проверки гипотезы
1. Формулируем нулевую гипотезу H 0 : x y , что генеральные средние равны.
2. Формулируем альтернативную гипотезу Н1 : x y .
3. Назначаем уровень значимости .
4. Делаем предположение о нормальном распределении разностей di xi yi .
5. Вычисляется эмпирическое значение t -критерия по формуле
t эмп
d
n,
Sd
n
1 n
1
( xi y i ) ; S d
(d i d ) 2 .
n i 1
n 1 i 1
6. По таблице критических значений t -критерия распределения Стьюдента находится
критическое значение t кр (, k ) при уровне значимости и числе степеней свободы
где величины d
k n 1.
7. Сравниваем t эмп и t кр . Если t эмп t кр , то гипотеза H 0 отклоняется, так как t эмп.
попало в критическую область. Значит, наблюдаемое различие между средними значениями
двух связанных выборок значимо на уровне значимости . Если t эмп t крит , то различие
между средними значениями двух связанных выборок статистически незначимо.
2. Задача об оценке различия средних значений признака в зависимых выборках
Задача.
Группа школьников ( n 10 ) в течение летних каникул находилась в спортивном лагере.
До и после сезона у них измерили жизненную емкость легких (признак X ).
До «эксперимента» ( x i , мл):
3400, 3600, 3000, 3500, 2900, 3100, 3200, 3400, 3200, 3400.
После «эксперимента» ( y i , мл):
3800, 3700,3300, 3600, 3100, 3200, 3200, 3300, 3500, 3600.
По результатам измерений нужно определить, значимо ли изменился этот показатель под
влиянием интенсивных физических упражнений.
Решение.
Вычислим средние значения жизненной емкости легких школьников
до эксперимента
x
3400 3600 3000 3500 2900 3100 3200 3400 3200 3400
3270
10
и
после эксперимента
y
3800 3700 3300 3600 3100 3200 3200 3300 3500 3600
3430 .
10
Как оказалось, средние значения двух зависимых выборок различаются.
Определим, значимо ли это различие.
Будем считать, что разности d i xi yi имеют нормальное распределение. Выдвигаем
нулевую гипотезу о равенстве средних значений жизненной емкости легких школьников
до и после спортивного сезона H 0 : x y .
В качестве альтернативной возьмем двустороннюю гипотезу H 1 : x y .
Выбираем уровень значимости 0,05 . Имеем две зависимые (связанные) выборки
объема n 10 .
Для удобства результаты вычислений проведем в таблице.
Расчетная таблица критерия t -Стьюдента для зависимых выборок
Значения признака
Разности связанных Квадраты
Номер
пар
результатов отклонений
до
после
школьн эксперимента
эксперимент измерений
d i2 ( xi yi ) 2
ика
di xi yi
( xi )
а ( yi )
1
2
3
4
5
6
7
8
9
10
Сумма
Среднее
3400
3600
3000
3500
2900
3100
3200
3400
3200
3400
32700
3800
3700
3300
3600
3100
3200
3200
3300
3500
3600
34300
- 400
- 100
- 300
- 100
- 200
- 100
100
- 300
- 200
- 1600
х 3270
y 3430
1 n
d di 160
n
i 1
1600
10000
90000
10000
40000
10000
10000
90000
40000
460000
–
Вычислим среднее арифметическое разностей d i :
1 n
1
d d i 400 100 300 100 200 100 0 100 300 200 160 .
n
10
i 1
Теперь вычислим для разностей d i «исправленную» выборочную дисперсию (так как
n
1
2
d 2 (d ) 2 , получим:
объем выборки меньше 30) по формуле S
d n 1 i
i 1
1
S 2 400 2 100 2 300 2 100 2 200 2 100 2 0 100 2 300 2 200 2 (160) 2
d 9
25511,11.
Тогда выборочное среднее квадратическое отклонение равно S d
и эмпирическое значение t -критерия:
t эмп
25511,11 159,72
d
160
n
10 3,17 .
Sd
159,72
Найдем критическое значение распределения Стьюдента t крит (0,05; 9) 2,262 для
уровня значимости
0,05 и числа степеней свободы k n 1 9 .
Так как альтернативная гипотеза H 1 : x y 0 , то критическая область двусторонняя.
Строим ось значимости для t -критерия Стьюдента, на которой отмечаем значение
t эмп 3,17 .
Критическая
область
(различия значимы)
t эмп 3,17
Критическая
область
(различия значимы)
Область
допустимых
значений
t кр 2,262
t кр 2,262
t
Значение t эмп 2,238 попало в область допустимых значений, поэтому показатели
жизненной емкости легких школьников до и после спортивного лагеря значимо
различаются с достоверностью 0,95.
Контрольные вопросы
1. Опишите последовательность действий применения критерия Стьюдента для
зависимых выборок.
2. Каковы особенно применения критерия Стьюдента для зависимых выборок