Понятие сдвига в значениях исследуемого признака
Сдвиг – это разность показателей между вторым и первым замерами измеряемого признака у одного испытуемого.
В психологических исследованиях может случиться, что под действием каких-либо факторов произошли сдвиги в измеряемых показателях и это важно доказать. Сдвиги могут быть со знаком «плюс» и знаком «минус».
Те сдвиги, которые преобладают, носят названия типичных сдвигов, а более редкие сдвиги называются нетипичными.
Статистически достоверные сдвиги дают возможность утверждать, что эксперимент и его действия были эффективными.
Могут существовать и неучтенные причины, объясняющие наличие сдвига. Для того чтобы избежать заблуждений, вводится контрольная группа, при отсутствии которой сдвиг в экспериментальной группе могут объяснить время суток замера или важное для испытуемых событие, случившееся между замерами.
Об эффективности воздействий свидетельствует достоверность сдвигов в экспериментальной группе и недостоверность их в контрольной группе. При отсутствии контрольной группы изучать изменения можно при помощи нескольких экспериментальных групп, но условия и способы воздействия на них должны различаться.
Группы могут быть отличными друг от друга по условиям эксперимента, условиям жизни испытуемых, географическому расположению и др. Различие групп по этим признакам дает возможность уточнить специфическое действие естественных факторов, однако надо помнить, что более мощным может оказаться воздействие неучтенных факторов.
В ряде исследований возможность измерения двух замеров на одной выборке может отсутствовать, тогда возможно сопоставление показателей разных выборок. Только в этом случае они должны быть уравновешены по всем признакам, значимым для исследования. К этим признакам могут относиться:
- пол испытуемого,
- профессия,
- возраст,
- уровень образования и др.
Существует ещё одна возможность «уравновешивания», которая связана с введением параллельных форм теста. Если при повторных замерах на результаты оказывают влияние эффекты научения, то реакции испытуемого «до» можно измерять с помощью одного инструмента, а реакции «после» –с помощью другого. На измерениях, таким образом, может отразиться действие фактора времени и различия в параллельных формах теста.
Уровень тревоги, например, или объем внимания до экзамена можно измерять у одной подгруппы, а у другой подгруппы измерять после экзамена, если подгруппы «уравновешены». Трудность состоит в том, что создать параллельную форму методики также сложно, как и подобрать «уравновешенную» группу испытуемых.
Критерий Фридмана
Данный критерий является непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений.
Критерий Фридмана является распространением критерия Т-Вилкоксона на большее, чем два, количество условий измерения.
Критерий разработал Нобелевский лауреат американский экономист Милтон Фридман. Его критерий дает возможность проверки гипотез о различии более чем двух повторных измерений по уровню выраженности изучаемой переменной.
Рисунок 1. Критерий Фридмана. Автор24 — интернет-биржа студенческих работ
Критерий имеет простую логику – например, больной подвергается каждому методу лечения ровно один раз, результаты их применения у каждого больного упорядочиваются, причем упорядочивание значений у каждого больного идет отдельно, независимо от всех остальных. В результате получается столько упорядоченных рядов, сколько в данном исследовании участвует больных.Далее вычисляется сумма рангов для каждого метода лечения и различия считаются статистически значимыми, если разброс сумм велик.
Критерий Фридмана помогает проверить нулевую гипотезу о том, что при разных методах лечения результаты практически одинаковые.
В столбцах таблицы для применения этого критерия отражаются различные значения переменной эффекта, а строчки соответствуют повторным измерениям того же субъекта.
Процедура состоит в том, чтобы в каждой строке упорядочить значения, суммировать по каждому столбцу полученные ранги и вычислить статистики хи-квадрат.
Ранги в каждой строке принимают значения от 1 до m – это число сравниваемых методов лечения. Статистика хи-квадрат имеет такое же распределение как хи-квадрат при (m-1) степенях свободы.
Нулевая гипотеза будет отклонена в том случае, если соответствующее значение превзойдет критическое значение. Данный критерий можно применить и в том случае, когда сравниваются однородные группы.
Критерий Фридмана – это обобщение критерия Вилкоксона на большее, чем два условия измерения. Ранжирование при этом идет самих индивидуальных значений измерения, а не абсолютных величин сдвигов.
Применяя критерий Фридмана, необходимо выполнять ряд условий:
- измерение проводится в шкале интервалов или отношений;
- выборка должна быть связной;
- испытуемых в выборке должно быть не менее двух;
- каждый испытуемый должен иметь не менее трех измеренных показателей;
- для количества испытуемых верхний предел не определен, а количество измерений не может быть больше 100;
- в зависимости от количества испытуемых и от числа измерений применяются разные таблицы значимости.
Данный критерий дает возможность установить, что величины показателей изменяются от условия к условию, но на направление измерений при этом не указывает – в этом плане он похож на критерий знаков.
Критерий $X^2_r$ предназначен для того чтобы сопоставить показатели, измеренные в трех и более условиях на одной и той же выборке испытуемых. Он дает возможность установить, что величины показателей от одного условия к другому изменяются, однако критерий не указывает на направление изменений.
Критерий является распространением критерия Т. Вилкоксона на большее, чем два количество условий измерения. Ранжируются сами индивидуальные значения, которые получил испытуемый в 1,2,3 и последующих замерах, а не абсолютные величины сдвигов.
Если у испытуемого, например, определена в первом замере скорость прохождения логического лабиринта 54 секунды, а во втором замере скорость составила 45 секунд, в третьем замере – 61 секунду, то данные показатели получают соответствующие ранги – 2,1,3, потому что меньшему значению присваивается меньший ранг.
После того, как все значения будут ранжированы, по каждому замеру в отдельности подсчитывается сумма рангов. Если различия между значениями признака будут случайны, то суммы рангов по разным условиям приблизительно будут равны.
При изменении значений признака в разных условиях высокие ранги будут преобладать в одних условиях, а в других они будут низкие.
Суммы рангов между собой будут достоверно различаться.
Эмпирическое значение критерия $X^2_r$ указывает, насколько суммы рангов различаются и чем эмпирическое значение будет больше, тем существеннее оно отражает расхождение сумм рангов.
В том случае, когда критерий $X^2_r$ превышает или равняется критическому значению, то его значения будут статистически достоверны.