U -критерий Манна-Уитни
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 13. U -критерий Манна-Уитни.
Мы уже рассмотрели несколько статистических критериев, как
параметрических (в них рассчитываются параметры – средние значения и
дисперсии). Параметры хороши и информативны при нормальном
распределении по частоте данных, с которыми работает исследователь. Но
….
О параметрических и непараметрических критериях
Сводная таблица статистических критериев
Название
критерия
1. t-критерий
Стьюдента
2. F-критерий
Фишера
Критерий
Пирсона 2
Тип
Требования
к данным
Характер
вывода
Примечания
Параметрич Количествен
еский
ные
Норм. закон
О различии Применяется для
средних
связанных
и
несвязанных
выборок
Параметрич Количествен О различии
F≥1
еский
ные
дисперсий
Две
степени
Норм. закон
свободы
Непараметр Качественны О различии Ведены
ический
е
частотных
ограничения
на
Порядковые распределен величины
Количествен ий
теоретич. частот
ные
U -критерий Манна-Уитни это непараметрический критерий различия, он
применяется для cравнения данных, полученных на независимых выборках.
Применяется для данных, измеренных на шкале не ниже шкалы порядка, то-есть
он не применяется для качественных данных.
В критерии U - Манна-Уитни проверяется гипотеза о принадлежности
сравниваемых независимых выборок к одной Г.С.
Его идея состоит в определении того, насколько пересекаются два ряда
значений переменной, измеренных на двух выборках, объемом n1 и n2.
Отметим, что этот критерий относится к т.н. «неправильным», то-есть, чем
меньше U, тем больше вероятность, что различия значимы. Нулевая гипотеза
здесь принимается при превышении (или равенстве) фактическим значением
граничного значения.
Итак, U – значение отражает степень совпадения (пересечения) двух рядов
чисел. Чем больше U, тем больше пересечение, тем обоснованней вывод о
недостоверности различий в этих двух рядах, то-есть тем вероятней H0.
Техника расчетов такова: располагаем все данные (из двух рядов чисел) в
возрастающем порядке, в один ряд от 1 до N=n1+n2. Находим общие ранги, то
есть ранги для соединенной выборки.
Затем отдельно для каждой выборки найдем суммы рангов, то-есть R1 для
первой выборки и R2 для второй выборки.
Далее определим для первой выборки: U1= n1n2 + n1(n1+1)/2 - R1
и для второй выборки: U2= n1n2 + n2(n2+1)/2 - R2
Используем Umin=min (U1, U2), то есть минимальное из двух этих значений.
Находим U гр и при Uф > Uгр принимается Ho -о недостоверности различий.
Для примера используем следующие данные:
Пример: В исследовании импрессивных способностей школьников
определялась точность идентификации эмоциональных состояний людей,
изображенных на фото. Сравнивались две выборки испытуемых, где n1=7,
n2=8 . Данные представлены в таблице:
№ группы п/п
Точность идентификации
1 выборка
60; 80; 68; 53; 42; 70; 72
2 выборка
55; 71; 40; 82; 50; 56; 58; 90
1.Запишем все данные в единую стоку и находим общие ранги – то-есть ранги
результатов в соединенной выборке, расположенных в возрастающем порядке:
Точность
40 42 50 53 55 56 58 60 68 70 71 72 80 82 90 Сумма
идентифик.
рангов
Общий
ранг
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 120
2. Выделим данные по 1-й выборке и подсчитаем сумму рангов для неё:
Точность
идентификации
60
Общие ранги
8
80
68
53
42
70
72
Сумма
рангов
13
9
4
2
10
12
58
То-есть для первой выборки R1 = 8+13+9+4+2+10+12=58
3. Выделим данные по 2-й выборке и подсчитаем сумму рангов для неё:
Точность
идентификации
55
Общие ранги
5
71
40
82
50
56
58
90
Сумма
рангов
11
1
14
3
6
7
15
62
Для второй выборки R2 = 5+11+14+3+2+6+7+15= 62
Правильность вычислений проверена тем, что общая сумма равна
R1 +R2= 120, как и сумма в общей таблице.
4. Вычисляем U1= n1n2 + n1(n1+1)/2 - R1 = 7x8 + 7x8/2 - 58 = 26.
U2= n1n2 + n2(n2+1)/2 - R2 = 7x8 + 8x9/2 - 62 = 26
Поскольку значения U равны, Uфак= Umin = 26. Это значение больше
граничного Uгр (5%) = 10 и Uгр (1%) = 6 (см. табл. стр.151), принимается нулевая
гипотеза H0 (напомним, что критерий “неправильный»), согласно которой
сравниваемые выборки недостоверно отличаются по значениям измеренной
переменной, на 1% уровне значимости. Можно сделать психологический вывод
о недостоверности различий о точности идентификации эмоций по мимике
лица, полученные в обеих группах.