Проверка статистической значимости (достоверности) различий двух выборок
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
(ДОСТОВЕРНОСТИ) РАЗЛИЧИЙ ДВУХ ВЫБОРОК
Пример 1. У двух групп борцов (независимые выборки) измерили
кистевую динамометрию. Результаты в кг представлены в таблице.
1 группа (Х) 65 67 63 64
2 группа (Y) 62 66 58 72
69
64
70
68
64
74
63
56
68
66
64
60
68
58
61
64
62
-
Цель – определить, одинаковая ли подготовка у спортсменов этих групп
(борцов) по данному параметру (кистевая динамометрия) при уровне
значимости р = 0,05 (вероятность ошибки). Для этого нужно решить 2
задачи.
Задача 1. Сравнить дисперсии этих выборок (разброс данных в
выборках). Для этого выдвигаем следующие гипотезы.
1. Гипотезы
Н0: дисперсии генеральных совокупностей D(X) = D(Y), различие
дисперсий статистически незначимо.
Н1: дисперсии генеральных совокупностей D(X) D(Y), различие
дисперсий статистически значимо.
Алгоритм решения примера 1 в LibreOfficeCalc (Excel)
Объем выборки n1 = СЧЁТ(данные Х).
Объем выборки n2 = СЧЁТ(данные Y).
Средние значения хср и уср = СРЗНАЧ(соответствующие данные).
Исправленные выборочные дисперсии 𝑠𝑥2 и 𝑠𝑦2 = ДИСП.В(соотв. данные).
Наблюдаемое значение критерия Фишера
𝐹набл. =
𝑆б2
𝑆м2
,
где 𝑠б2 – большая дисперсия; 𝑠м2 – меньшая дисперсия; поэтому
𝐹набл. = МАКС(𝑠𝑥2 ; 𝑠𝑦2 )/МИН(𝑠𝑥2 ; 𝑠𝑦2 ).
Критическое значение критерия Фишера
Fкр.(р, k1, k2) = F.ОБР.ПХ (р, k1, k2),
где k1 = n1 – 1; k2 = n2 – 1, причем n1 – объем выборки с большей
дисперсией; n2 – объем выборки с меньшей дисперсией, поэтому
k1 = ЕСЛИ(𝑠𝑥2 > 𝑠𝑦2 ;n1 – 1;n2 – 1);
k2 = ЕСЛИ(𝑠𝑥2 < 𝑠𝑦2 ;n1 – 1;n2 – 1).
Критическая область правосторонняя.
Область принятия
гипотезы
Критическая область
Fкр.
F
Возможны два случая.
Если Fнабл. < Fкр., то гипотезу Н0 принимаем, т. е. различия дисперсий
статистически незначимы.
Если Fнабл. Fкр., то гипотезу Н0 отвергаем, т. е. различия дисперсий
статистически значимы.
Результаты вычислений в примере:
n1= 13; n2 = 12; хср = 65,23; уср = 64; 𝑠𝑥2 = 8,19; 𝑠𝑦2 = 31,27; Fнабл. = 3,82
k1 = 11; k2 = 12;
Fкр.(0,05; 11, 12) = 2,72.
Вывод: т. к. Fнабл. Fкр., то гипотезу Н0 отвергаем, различия дисперсий
статистически значимы.
Задача 2. Сравнить средние значения этих выборок. Для этого выдвигаем
следующие гипотезы.
2. Гипотезы
Н0: генеральные средние Xср. = Yср.; различие между средними
значениями результатов статистически незначимо.
Н1: генеральные средние Xср. Yср.; различие между средними
значениями результатов статистически значимо.
Наблюдаемое значение критерия Стьюдента для независимых
выборок
|𝑇набл. | = ABS(хср – уср) / КОРЕНЬ(𝑠𝑥2 /n1 + 𝑠𝑦2 /n2)
Критическое значение критерия Стьюдента
Ткр.(p, k) = СТЬЮДЕНТ.ОБР.2Х (p, k),
Критическая область двусторонняя.
где k = n1 + n2 – 2.
Критическая область
Область принятия
гипотезы
-Ткр.
Критическая область
Ткр.
Т
Возможны два случая: если Тнабл.< Ткр., то гипотезу Н0 принимаем;
т.е. различие между средними значениями результатов статистически
незначимо; если Тнабл.> Ткр., то гипотезу Н0 отвергаем; т.е. различие
между средними значениями результатов статистически значимо.
В примере:
𝑇набл. = 0,68;
Ткр.(0,05; 23) = 2,07.
Вывод: т. к. Тнабл.< Ткр., то гипотезу Н0 принимаем; т.е. различие
между средними значениями результатов статистически незначимо.
Пример 2. У группы конькобежцев с интервалом в один месяц измерили
результаты в беге на 500 м. Результаты в секундах представлены в табл.
1 измерение (Х)
42
45
38
44
41
38
40
42
43
2 измерение (Y)
41
44
37
43
40
37
39
42
44
di = xi – yi
1
1
1
1
1
1
1
-1
Цель – определить, эффективны ли тренировки при уровне значимости
р = 0,05 (вероятность ошибки).
Гипотезы
Н0: генеральные средние
Xср. = Yср.; изменение результатов
статистически незначимо.
Н1: генеральные средние
Xср. Yср.; изменение результатов
статистически значимо.
Алгоритм решения примера 2 в LibreOfficeCalc (Excel)
Количество сравниваемых пар n = СЧЁТ(данные Х).
Разница результатов di = xi – yi.
Средняя разность значений dср = СРЗНАЧ(данные di).
Стандартное отклонение Sd = СТОТКЛ.В(данные di)
в Excel СТАНДОТКЛОН.В(данные di)
Наблюдаемое значение критерия Стьюдента для зависимых выборок
|𝑇набл. | = |dср|*КОРЕНЬ(n)/ Sd .
Критическое значение критерия Стьюдента
Ткр.(р, k) = СТЬЮДЕНТ.ОБР.2Х (р, k),
Критическая область двусторонняя.
где k = n – 1.
Результаты вычислений в примере:
n = 9; dср = 0,67; Sd = 0,71; |𝑇набл. | = 2,83;
k = 8; Ткр.(0,05; 8) = 2,31.
Вывод: т. к. Тнабл.> Ткр., то гипотезу Н0 отвергаем, принимаем
гипотезу Н1, т. е. изменение результатов статистически значимо,
тренировки эффективны.