Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1.
2.
3.
4.
5.
6.
7.
8.
Лекция Использование методов математической статистики в
психолого-педагогическом исследовании
План:
Понятие признаков и переменных.
Шкалы измерения.
Распределение признака. Параметры распределения.
Статистические гипотезы.
Статистические критерии.
Уровни статистической значимости.
Методы проверки статистических гипотез в зависимости от задач
психологического исследования.
Основные типы исследовательских задач, предопределяющие тип
статистического критерия.
Понятие признаков и переменных
Использование методов математической статистики при обработке
первичных эмпирических данных необходимо для повышения достоверности выводов в психологическом исследовании. При этом не
рекомендуется ограничиваться использованием таких показателей, как
среднее арифметическое и проценты. Они чаще всего не дают достаточных
оснований для обоснованных выводов из эмпирических данных.
Признаки и переменные - это измеряемые психологические явления.
Такими явлениями могут быть время решения задачи, количество
допущенных ошибок, уровень тревожности, показатель интеллектуальной
лабильности, интенсивность агрессивных реакций, угол поворота корпуса
в беседе, показатель социометрического статуса и множество других
переменных.
Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо них
используются понятия показателя или уровня, например, уровень настойчивости, показатель вербального интеллекта и др. Понятия показателя
и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения «высокий» или
«низкий», например, высокий уровень интеллекта, низкие показатели
тревожности.
Психологические переменные являются случайными величинами,
поскольку заранее неизвестно, какое именно значение они примут.
Математическая обработка - это оперирование со значениями
признака, полученными у испытуемых в психологическом исследовании.
Такие индивидуальные результаты называют также «наблюдениями»,
«наблюдаемыми значениями», «вариантами», «датами», «индивидуальны-
ми показателями» и др. В психологии чаще всего используются термины
«наблюдение» или «наблюдаемое значение».
Значения признака определяются при помощи специальных шкал
измерения.
Шкалы измерения
Измерение - это приписывание числовых форм объектам или событиям в соответствии с определенными правилами. С. Стивенсом
предложена классификация из 4 типов шкал измерения:
номинативная, или номинальная, или шкала наименований;
порядковая, или ординальная, шкала;
интервальная, или шкала равных интервалов;
шкала равных отношений.
Номинативная шкала - это шкала, классифицирующая по названию.
Название же не измеряется количественно, оно лишь позволяет отличить
один объект от другого или одного субъекта от другого. Номинативная
шкала - это способ классификации объектов или субъектов, распределения
их по ячейкам классификации.
Простейший случай номинативной шкалы - дихотомическая шкала,
состоящая из двух ячеек, например: «имеет братьев и сестер единственный ребенок в семье»; «иностранец - соотечественник»;
«проголосовал «за» - проголосовал «против»» и т.п.
Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два
значения. При этом исследователь зачастую заинтересован в одном из них,
и тогда говорят, что признак «проявился», если тот принял интересующее
исследователя значение, и что признак «не проявился», если он принял
противоположное значение. Например: «Признак леворукости проявился у
8 испытуемых из 20». В принципе номинативная шкала может состоять из
ячеек «признак проявился - признак не проявился».
Более сложный вариант номинативной шкалы - классификация из
трех и более ячеек, например: «экстрапунитивные - интрапунитивные импунитивные реакции» или «выбор кандидатуры А - кандидатуры Б кандидатуры В - кандидатуры Г» или «старший - средний - младший единственный ребенок в семье» и др.
Расклассифицировав все объекты, реакции или всех испытуемых по
ячейкам классификации, исследователь получает возможность от
наименований перейти к числам, подсчитав количество наблюдений в
каждой из ячеек.
Наблюдение - это одна зарегистрированная реакция, один
совершенный выбор, одно осуществленное действие или результат одного
испытуемого.
Таким образом, номинативная шкала позволяет подсчитывать частоты
встречаемости разных «наименований», или значений признака, и затем
работать с этими частотами с помощью математических методов.
Единица измерения, которой исследователь при этом оперирует количество наблюдений (испытуемых, реакций, выборов и т.п.), или
частота. Точнее, единица измерения - это одно наблюдение.
Порядковая шкала - это шкала, классифицирующая по принципу
«больше – меньше». Если в шкале наименований было безразлично, о
каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое
значение» к ячейке «самое большое значение» (или наоборот). Ячейки
теперь называют классами, поскольку по отношению к классам
употребляются определения «низкий», «средний» и «высокий» класс, или
1-й, 2-й, 3-й класс, и т.д.
В порядковой шкале должно быть не менее трех классов, например
«положительная реакция - нейтральная реакция - отрицательная реакция»
или «подходит для занятия вакантной должности - подходит с оговорками
- не подходит» и т.п.
В порядковой шкале исследователь не знает истинного расстояния
между классами, а знает лишь, что они образуют последовательность.
Например, классы «подходит для занятия вакантной должности» и
«подходит с оговорками» могут быть реально ближе друг к другу, чем
класс «подходит с оговорками» к классу «не подходит».
От классов переходят к числам, если мы условимся считать, что
низший класс получает ранг 1, средний класс - ранг 2, а высший класс ранг 3, или наоборот. Чем больше классов в шкале, тем больше у
исследователя возможностей для математической обработки полученных
данных и проверки статистических гипотез.
Например, можно оценить различия между двумя выборками
испытуемых по преобладанию у них более высоких или более низких
рангов или подсчитать коэффициент ранговой корреляции между двумя
переменными, измеренными в порядковой шкале, допустим, между
оценками профессиональной компетентности руководителя, данными ему
разными экспертами.
Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Если испытуемому предлагается
упорядочить 18 ценностей, по степени их значимости для него,
проранжировать список личностных качеств социального работника или
скольких-либо претендентов на эту должность по степени их
профессиональной пригодности, то во всех этих случаях испытуемый
совершает так называемое принудительное ранжирование, при котором
количество рангов соответствует количеству ранжируемых субъектов или
объектов (ценностей, качеств и т.п.).
Независимо от того, приписывает ли исследователь каждому качеству
или испытуемому один из 3-4 рангов или совершает процедуру принудительного ранжирования, он получает в обоих случаях ряды значений,
измеренные по порядковой шкале. При этом, если у исследователя всего 3
возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20
ранжируемых испытуемых, то некоторые из них неизбежно получат
одинаковые ранги.
Итак, единица измерения в шкале порядка - расстояние в 1 класс или в
1 ранг, при этом расстояние между классами и рангами может быть
разным (оно исследователю неизвестно). К данным, полученным по
порядковой шкале, применимы многообразные критерии и методы.
Интервальная шкала - это шкала, классифицирующая по принципу
«больше на определенное количество единиц - меньше на определенное
количество единиц». Каждое из возможных значений признака отстоит от
другого на равном расстоянии. Это метрическая шкала, она определяет
величину различий между объектами в проявлении свойства. С помощью
шкалы интервалов можно сравнивать два объекта. При этом выясняют,
насколько более или менее выражено определенное свойство у одного
объекта, чем у другого.
Интервальная шкала позволяет применять практически всю
параметрическую статистику для анализа данных, полученных с ее
помощью.
Шкала отношений - это шкала, классифицирующая объекты или
субъектов пропорционально степени выраженности измеряемого свойства.
В шкалах отношений классы обозначаются числами, которые
пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это
предполагает наличие абсолютной нулевой точки отсчета. Считается, что в
психологии примерами шкал равных отношений являются шкалы порогов
абсолютной чувствительности. Возможности человеческой психики столь
велики, что трудно представить себе абсолютный нуль в какой-либо
измеряемой психологической переменной. Хотя вполне можно
предположить уровень «нулевой» осведомленности испытуемого в какойто области знаний или «нулевой» уровень владения каким-либо навыком.
Абсолютный нуль может иметь место также при подсчете количества
объектов или субъектов. Например, при выборе одной из 3 альтернатив
испытуемые не выбрали альтернативу А ни одного раза, альтернативу Б 14 раз и альтернативу В - 28 раз. В этом случае исследователь может
утверждать, что альтернативу В выбирают в два раза чаще, чем
альтернативу Б. Однако при этом измерено не психологическое свойство
человека, а соотношение выборов у 42 человек.
Единица измерения в шкале отношений - 1 наблюдение, 1 выбор, 1
реакция и т.п.
Таким образом, расклассифицировав испытуемых по ячейкам
номинативной шкалы, исследователь может применить потом высшую
шкалу измерения - шкалу отношений между частотами.
Распределение признака. Параметры распределения
Распределением признака называется закономерность встречаемости
разных его значений.
В психологических исследованиях чаще всего ссылаются на
нормальное распределение.
Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к
средней величине - достаточно часто. Нормальным такое распределение
называется потому, что оно очень часто встречалось в естественнонаучных исследованиях и казалось «нормой» всякого массового
случайного проявления признаков. Это распределение следует закону,
открытому тремя учеными в разное время: Муавром в 1733 г. в Англии,
Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции. График
нормального распределения представляет собой так намываемую
колоколообразную кривую.
Параметры распределения - это его числовые характеристики,
указывающие, где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное
появление определенных значений признака. Наиболее практически
важными параметрами являются математическое ожидание, дисперсия,
показатели асимметрии и эксцесса.
Среднее арифметическое (оценка математического ожидания) –
величина, сумма отрицательных и положительных отклонений от которой
равна нулю. Обозначается буквой М или х.
Дисперсия несмещенная оценка параметра в исследованной выборке.
Обозначается буквой S.
Оценка дисперсии определяется для вычисления стандартного
отклонения в генеральной совокупности (среднего квадратичного
отклонения). Обозначается буквой δ (сигма).
В тех случаях, когда какие-либо причины способствуют более
частому появлению значений, которые выше или, наоборот, ниже
среднего, образуются асимметричные распределения. При левосторонней
(положительной) асимметрии в распределении чаще встречаются более
низкие значения признака, при правосторонней (отрицательной) – более
высокие.
В тех случаях, когда какие-либо причины способствуют
преимущественному появлению средних или близких к средним значений,
образуется распределение с положительным эксцессом. Если в
распределении преобладают крайние значения, причем одновременно и
более высокие, и более низкие, то такое распределение характеризуется
отрицательным эксцессом.
В реальных психологических исследованиях исследователь
оперирует не параметрами, а их приближенными значениями, так
называемыми оценками параметров. Это объясняется ограниченностью
обследованных выборок. Чем больше выборка, тем ближе может быть
оценка параметра к его истинному значению. Говоря о параметрах, имеют
в виду их оценки.
На практике психолог-исследователь может рассчитывать параметры
любого распределения, если единицы, которые он использовал при
измерении, признаются разумными в научном сообществе.
Статистические гипотезы
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Нулевая гипотеза - это гипотеза об отсутствии различий. Она
обозначается как Н0 и называется нулевой потому, что содержит число 0:
Х1 - Х2=0, где Х1, Х2 – сопоставляемые значения признаков.
Нулевая гипотеза - это то, что исследователь хочет опровергнуть, если
перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза - это гипотеза о значимости различий. Она
обозначается как Х1. Альтернативная гипотеза - это то, что исследователь
хочет доказать, поэтому иногда ее называют экспериментальной
гипотезой.
Бывают задачи, когда исследователь хочет доказать как раз
незначимость различий, то есть подтвердить нулевую гипотезу. Например,
если нужно убедиться, что разные испытуемые получают хотя и
различные, но уравновешенные по трудности задания, или что
экспериментальная и контрольная выборки не различаются между собой
по каким-то значимым характеристикам. Однако чаще исследователь хочет
все-таки доказать значимость различий, т.к. они более информативны в
поисках нового. Нулевая и альтернативная гипотезы могут быть
направленным и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы
Н0: X1 не отличается от Х2
Н1: Х1 отличается от Х2
Если исследователь заметил, что в одной из групп индивидуальные
значения испытуемых по какому-либо признаку, например по социальной
активности, выше, а в другой ниже, то для проверки значимости этих
различий необходимо сформулировать направленные гипотезы.
Если исследователь хочет доказать, что в группе А под влиянием
каких-то экспериментальных воздействий произошли более выраженные
изменения, чем в группе Б, то необходимо сформулировать направленные
гипотезы.
Если же исследователь хочет доказать, что различаются формы
распределения признака в группе А и Б, то формулируются
ненаправленные гипотезы.
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Таким образом, статистическая гипотеза необходима для организации
процедуры сравнения регистрируемых параметров. Статистическая
гипотеза необходима на этапе математической интерпретации данных
эмпирических исследований.
Статистические критерии
Статистический критерий - это решающее правило, обеспечивающее
надежное поведение, то есть принятие истинной и отклонение ложной
гипотезы с высокой вероятностью.
Статистические критерии обозначают также метод расчета определенного числа и само это число.
Когда мы говорим, что достоверность различий определялась по
определенному критерию, то имеем в виду, что использовали данный
метод для расчета определенного числа.
Когда мы говорим, далее, что результат вычислений с использованием
какого-то конкретного критерия равен 12,676, то имеем в виду определенное число, рассчитанное по этому методу. Это число обозначается
как эмпирическое значение критерия.
По соотношению эмпирического и критического значений критерия
мы можем судить о том, подтверждается, ли или опровергается нулевая
гипотеза.
В большинстве случаев для того, чтобы мы признали различия
значимыми, необходимо, чтобы эмпирическое значение критерия
превышало критическое, хотя есть критерии (например, критерий МаннаУитни или критерий знаков), в которых мы должны придерживаться
противоположного правила.
Эти правила оговариваются в описании каждого из критериев 22; 25.
В некоторых случаях расчетная формула, критерия включает в себя
количество наблюдений в исследуемой выборке, обозначаемое как n. В
этом случае эмпирическое значение критерия одновременно является
тестом для проверки статистических гипотез. По специальной таблице мы
определяем, какому уровню статистической значимости различий
соответствует данная эмпирическая величина.
В большинстве случаев, однако, одно и то же эмпирическое значение
критерия может оказаться значимым или незначимым в зависимости от
количества наблюдений в исследуемой выборке (n) или от так называемого
количества степеней свободы, которое обозначается как V или как df.
Число степеней свободы V равно числу классов вариационного ряда
минус число условий, при которых он был сформирован. К числу таких
условий относятся объем выборки (n), средние и дисперсии 15.
Если мы расклассифицировали наблюдения по классам какой-либо
номинативной шкалы и подсчитали количество наблюдений в каждой
ячейке классификации, то мы получаем так называемый частотный
вариационный ряд. Единственное условие, которое соблюдается при его
формировании - объем выборки n. Допустим, у нас 3 класса: «Умеет
работать на компьютере - «умеет выполнять лишь определенные операции
- не умеет работать на компьютере». Выборка состоит из 50 человек. Если
в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем
классе должны оказаться все остальные 10 испытуемых. Мы ограничены
одним условием - объемом выборки. Поэтому даже если мы потеряли
данные о том, сколько человек не умеют работать на компьютере, мы
можем определить это, зная, что в первом и втором классах - по 20
испытуемых. Мы не свободны в определении количества испытуемых в
третьем, разряде, «свобода» простирается только на первые две ячейки
классификации:
v = с-1 = 3 - 1 = 2
Аналогичным образом, если бы у нас была классификация из 10
разрядов, то мы были бы свободны только в 9 из них, если бы у нас было
100 классов - то в 99 из них и т. д.
Зная n и/или число степеней свободы, мы по специальным таблицам
можем определить критические значения критерия и сопоставить с ними
полученное эмпирическое значение. Обычно это записывается так: «при
n=22 критические значения критерия составляют ...» или «при V=2
критические значения критерия составляют ...» и т.п.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии - критерии, включающие в формулу
расчета параметры распределения, то есть средние и дисперсии.
Непараметрические критерии - критерии, не включающие в
формулу расчета параметров распределения и основанные на
оперировании частотами или рангами.
И те, и другие критерии имеют свои преимущества и недостатки.
Возможности и ограничения параметрических и непараметрических
критериев представлены в таблице 1.
Таблица 1.
Возможности и ограничения параметрических и непараметрических
критериев (Е.М.Сидоренко)
1
2
3
4
5
Нараметрические критерии
Позволяют прямо оценить
различия
в
средних,
полученных в двух выборках (t
- критерий Стьюдента)
Позволяют прямо оценить
различия
в
дисперсиях
(критерий Фишера)
Позволяют выявить тенденции
изменения
признака
при
переходе от условия к условию
(дисперсионный
однофакторный анализ), но
лишь при условии нормального
распределения признака
Позволяют
оценить
взаимодействие двух и более
факторов в их влиянии на
изменения
признака
(двухфакторный
дисперсионный анализ)
Экспериментальные
данные
должны отвечать двум, а
иногда трем, условиям:
а)
значения признака
измерены
по
интервальной шкале;
б)
распределение
признака
является
нормальным;
в)
в дисперсионном анализе
должно
соблюдаться
требование
равенства
дисперсий в ячейках комплекса
Непараметрические критерии
Позволяют оценить лишь средние
тенденции, например, ответить на
вопрос, чаще ли в выборке А
встречаются более высокие, а в
выборке Б - более низкие значения
признака (критерии Q, U, φ* и др.)
Позволяют оценить лишь различия
в
диапазонах
вариативности
признака (критерий φ*)
Позволяют выявить тенденции
изменения признака при переходе
от условия к условию при любом
распределении признака (критерии
тенденций L и S)
Эта возможность отсутствует
Экспериментальные данные могут
не отвечать ни одному из этих
условий:
а)
значения
признака
могут быть представлены в любой
шкале,
начиная
от
шкалы
наименований;
б)
распределение
признака может быть любым и
совпадение его с каким-либо
теоретическим
законом
распределения необязательно и не
нуждается в проверке
в)
требование
равенства
дисперсий отсутствует
6
7
Математические
расчеты
довольно
сложны
Если условия, перечисленные в
п.5,
выполняются, параметрические
критерии
оказываются
несколько более мощными, чем
непараметрические
Математические
расчеты
по
большей части просты и занимают
мало времени
Если условия, перечисленные в
п.5,
не
выполняются,
непараметрические
критерии
оказываются более мощными
Параметрические критерии могут оказаться несколько более
мощными, чем непараметрические, но только в том случае, если признак
измерен по интервальной шкале и нормально распределен. С интервальной
шкалой есть определенные проблемы. Лишь с некоторой натяжкой можно
считать данные, представленные не в стандартизованных оценках, как
интервальные. Кроме того, проверка распределения «на нормальность»
требует достаточно сложных расчетов, результат которых заранее
неизвестен. Может оказаться, что распределение признака отличается от
нормального, и нам так или иначе все равно придется обратиться к
непараметрическим критериям.
Непараметрические критерии лишены всех этих ограничений и не
требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном - с их помощью
невозможно оценить взаимодействие двух или более условий или
факторов, влияющих на изменение признака. Эту задачу может решить
только дисперсионный двухфакторный анализ.
Уровни статистической значимости
Уровень значимости - это вероятность того, что мы сочли различия
существенными, а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне
значимости, или при р≤0,05, то мы имеем виду, что вероятность того, что
они все-таки недостоверны, составляет 0,05.
Когда мы указываем, что различия достоверны на 1%-ом уровне
значимости, или при р≤0,01, то мы имеем в виду, что вероятность того, что
они все-таки недостоверны, составляет 0,01.
Если перевести все это на более формализованный язык, то уровень
значимости - это вероятность отклонения нулевой гипотезы, в то время как
она верна.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то
время как она верна, называется ошибкой 1 рода.
Вероятность такой ошибки обычно обозначается как α. В сущности,
мы должны были бы указывать в скобках не р≤0,05 или p≤O,0l, а α ≤О,05
или α ≤0,01. В некоторых руководствах так и делается.
Если вероятность ошибки - это α, то вероятность правильного
решения: 1— α. Чем меньше α, тем больше вероятность правильного
решения.
Исторически сложилось так, что в психологии принято считал низшим
уровнем статистической значимости 5%-ый уровень (р≤0,05) достаточным
- 1%-ый уровень (р≤0,01) и высшим 0,1%-ый уровень (р≤0,001), поэтому в
таблицах критических значений обычно приводятся значения критериев,
соответствующих уровням статистической значимости р≤0,05 и р≤0,01,
иногда - р≤0,001. Для некоторых критериев в таблицах указан точный
уровень значимости их разных эмпирически значений.
До тех пор, однако, пока уровень статистической значимости не
достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу.
Правило отклонении H0 и принятия H1
Если эмпирическое значение критерия равняется критическому
значению, соответствующему р≤0,05 или превышает его, то Но отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое
значение критерия равняется критическому значению, соответствующему
р≤0,01 или превышает его, то H0 отклоняется и принимается H1.
Исключения: критерий знаков G, критерий Т-Вилкоксона и критерий UМанна-Уитни. Для них установлены обратные соотношения.
Для облегчения процесса принятия решения можно всякий раз
вычерчивать «ось значимости», представленную на рисунке 1.
6
8 9
Рис.1. Пример «оси значимости» для критерия Q-Розенбаума
Критические значения критерия обозначены как Q0,05
и Q0,Ol,
эмпирическое значение критерия как Qэмп. Оно заключено в эллипс.
Вправо от критического значения Q0,01 простирается «зона значимости» - сюда попадают эмпирические значения, превышающие Q0,01 и,
следовательно, значимые.
Влево от критического значения Q0,05 простирается «зона
незначимости», - сюда попадают эмпирические значения Q, которые ниже
Q0,05 и, следовательно, незначимы.
Мы видим, что Q0,05=6; Q0,01=9; Qэмп=9.
Эмпирическое значение критерия попадает в область между Q0,05 и
Q0,01. Это зона «неопределенности»: мы уже можем отклонить гипотезу о
недостоверности различий (H0), но еще не можем принять гипотезу об их
достоверности (H1).
Практически, однако, исследователь может считать достоверными уже
те различия, которые не попадают в зону незначимости, заявив, что они
достоверны при р≤0,05, или указав точный уровень значимости
полученного эмпирического значения критерия, например: р=0,02.
Уровень статистической значимости или критические значения
критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез.
При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет
различия в обе стороны, и поэтому то эмпирическое значение критерия,
которое ранее соответствовало уровню значимости р≤0,05, теперь
соответствует лишь уровню р≤0,10.
Методы проверки статистических гипотез в зависимости от задач
психологического исследования
Выбирать математические методы обработки эмпирических данных
нужно в процессе планирования исследования. Выбирать метод
математической обработки полученных эмпирических данных лучше до
того, как получены данные. При планировании исследования необходимо
заранее
продумать,
какие
эмпирические
показатели
будут
регистрироваться, с помощью каких методов будут обрабатываться.
Необходимо идентифицировать тип переменных и шкалу измерения.
При выборе статистического критерия нужно, прежде всего
идентифицировать тип переменных (признаков) и шкалу, которая
использовалась при измерении психологических показателей и других
переменных (возраст, состав семьи, уровень образования).
В качестве переменных могут выступать любые показатели, которые
можно сравнивать друг с другом (то есть измерять). Это может быть время
выполнения задания, количество ошибок, уровень самооценки, количество
правильно решенных задач и качественные особенности их выполнения,
личностные показатели, получаемые в психологических тестах, и др.
Следует иметь в виду, что в области практической психологии могут
широко использоваться номинативные и порядковые шкалы. Речевые
высказывания испытуемого, виды поведенческих реакций, действия, — все
это может рассматриваться и качестве переменных.
Нужно учитывать тип распределения данных при выборе статистического критерия. При выборе статистического критерия следует также
ориентироваться на тип распределения данных, который получился в
исследовании. Параметрические критерии используются в том случае,
когда распределение полученных данных рассматривается как нормальное.
Нормальное распределение с большей вероятностью (но не обязательно)
получается при выборках более 100 испытуемых (может получиться и при
меньшем количестве, а может не получиться и при большем). При
использовании параметрических критериев необходима проверка
нормальности распределения.
Для непараметрических критериев тип распределения данных не
имеет значения. При небольших объемах выборки испытуемых
целесообразно выбирать непараметрические критерии, которые дают
большую достоверность выводам, независимо от того, получено ли в
исследовании нормальное распределение данных. В некоторых случаях
статистически обоснованные выводы могут быть сделаны даже при
выборках и 5-10 испытуемых.
Основные типы исследовательских задач, предопределяющие тип
статистического критерия
1. Поиск различий в психологических показателях у испытуемых,
имеющих те или иные особенности. При обработке соответствующих
данных могут использоваться критерии для выявления различий в уровне
исследуемого признака или в его распределении. Для определения
значимости различий в проявлении признака в психологических
исследованиях часто используются такие показатели, как парный Ткритерий Вилкоксона, U-критерий Манна-Уитни, критерий хи-квадрат, φ*критерий (угловое преобразование Фишера), биномиальный критерий.
2. Поиск взаимосвязи статистических показателей у одних и тех же
испытуемых. Для обработки соответствующих данных могут
использоваться коэффициенты корреляции. Связь величин друг с другом и
их зависимость часто характеризуются коэффициентом линейной
корреляции Пирсона и rs-коэффициентом ранговой корреляции Спирмена.
3. Выявление структуры данных (и соответственно структуры
изучаемой психологической реальности), а также их взаимосвязи
выявляется факторным анализом.
4.Анализ изменчивости признака под влиянием каких-либо
контролируемых факторов, иначе оценка влияния разных факторов на
изучаемый признак. Для математической обработки данных в таких
задачах может использоваться U-критерий Манна—Уитни, Н-критерий
Крускала-Уоллиса, Т-критерий Вилкоксона, хr2-критерий Фридмана.
Однако для исследования влияния нескольких факторов на изучаемый
параметр (а тем более их взаимовлияния) полезнее может оказаться
дисперсионный анализ. Исследователь исходит из предположения, что
одни переменные могут рассматриваться как причины, а другие как
следствия. Переменные первого рода считаются факторами, а переменные
второго рода — результативными признаками. В этом отличие
дисперсионного анализа от корреляционного, в котором предполагается,
что изменения одного признака просто связаны с определенными
изменениями другого 8; 25.
5.Выявление
значимости
изменений
(сдвига)
каких-либо
психологических, поведенческих параметров и проявлений
за
определенный промежуток времени в определенных условиях (например, в
условиях коррекционного воздействия). Формирующие эксперименты в
практической психологии решают именно эту задачу. Для обработки
соответствующих данных могут использоваться коэффициенты оценки
достоверности сдвига в значениях исследуемого признака. Для этого часто
применяются G-критерии знаков, Т-критерий Вилкоксона.
Важно обратить внимание на ограничения, которые имеет каждый
критерий. Если один критерий не подходит для анализа имеющихся
данных, всегда можно найти какой-либо другой, возможно, изменив тип
представления самих данных. Прежде чем обрабатывавать эмпирические
данные, полезно проверить, существуют ли в пособии, которым пользуется
исследователь, критические значения, соответствующие количеству и типу
полученных данных. В противном случае подсчеты могут оказаться
напрасными по причине отсутствия в таблице критических значений при
объеме выборки, которая была обследована.