Справочник Автор24
Лекторий Автор24
Лекционные и методические материалы по высшей математике
Компьютерная обработка данных психологического исследования

Компьютерная обработка данных психологического исследования

⌛ 2019 год
👀 687 просмотров
📌 627 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Компьютерная обработка данных психологического исследования», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Компьютерная обработка данных психологического исследования», Word формат

Блюменау Нина Федоровна Компьютерная обработка данных психологического исследования Конспект лекций Рига, 2019 © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 1 CОДЕРЖАНИЕ Введение 7 1. Популяция и выборка 10 1.1. Популяция 10 1.2. Выборка 10 1.3. Выборочный метод 11 2. Измерение 11 2.1. Измерительные шкалы 12 2.1.1. Шкала наименований 12 2.1.2. Порядковая шкала 13 2.1.3. Шкала интервалов 16 2.14. Шкала отношений 16 2.2. Мощность шкалы 18 2.3. Особенности обработки данных в зависимости от шкал 20 2.4. Переменные величины 22 3. Основные показатели описательной статистики 22 3.1. Число наблюдений 23 3.2. Среднее арифметическое 23 3.3. Стандартная ошибка среднего 23 3.4. Медиана 24 3.5. Мода 24 3.6. Дисперсия 24 3.7. Стандартное отклонение 25 3.8. Размах 26 3.9. Асимметрия 27 3.10. Стандартная ошибка асимметрии 28 3.11. Эксцесс 28 3.12. Стандартная ошибка эксцесса 29 3.13. Квартили 30 3.14. Стандартизованные данные 31 4. Расчет описательных статистик с помощью компьютерной программы SPSS 32 © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 2 5. Гендерные различия агрессии у подростков 5.1. Ввод данных 34 34 5.1.1. Описание переменных 36 5.1.2. Ввод данных 45 5.2. Описательные статистики 45 5.3. Графические иллюстрации уровней агрессии мальчиков и девочек 53 5.3.1. Коробчатые диаграммы 53 5.3.2. Построение и редактирование коробчатых диаграмм в SPSS 57 5.3.3. Диаграммы для средних значений 66 5.3.3.1. Построение с помощью Excel 66 5.3.3.2. Построение с помощью SPSS 67 6. Распределения 72 6.1. Случайные величины 72 6.2. Нормальное распределение 75 6.3. Распределение «Хи-квадрат» ( χ 2 ) 77 6.4. Распределение Стьюдента или t-распределение 79 6.5. Распределение Фишера-Снедекора или f-распределение 80 7. Проверка статистических гипотез с помощью SPSS 81 7.1. Виды статистических гипотез 81 7.2. Ошибки 1-ого и 2-ого рода 84 7.3. Статистический критерий 85 7.4. Критическая область. Критические точки 85 7.5. Нахождение критических точек распределения χ 2 с помощью компьютерной программы Excel 88 7.6. р-value 92 7.7. Вычисление р-value с помощью компьютерной программы Excel 94 7.8. Мощность критерия 98 7.9. Параметрические и непараметрические критерии 99 8. Проверка нормальности распределения данных 8.1. Проверка нормальности распределения данных с помощью SPSS 100 100 8.2. Гипотезы об асимметрии и эксцессе и о соответствии © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 3 распределения данных нормальному распределению 9. Гендерные различия агрессии у подростков. Продолжение 9.1.Проверка нормальности распределения данных 101 104 104 9.1.1. Стандартные ошибки асимметрии и эксцесса 104 9.1.2. Критерий Колмогорова-Смирнова 105 9.1.3. Критерий Колмогорова-Смирнова в модификации Лиллифора и критерий Шапиро-Уилкса 107 9.1.4. Получение гистограмм с нормальной кривой 110 9.1.5. Выбор критерия для исследования гендерных различий 117 9.2. Исследование различия уровня агрессии с помощью U-критерия МаннаУитни 119 9.3. Представление результатов теста Манна-Уитни в отчетах. Размер эффекта 121 9.4. Исследование различия средних уровней агрессии с помощью параметрического t-теста 123 9.5. Представление результатов t-теста в отчетах. Размеры эффекта Домашнее задание 1 127 130 10. Исследование связи 131 10.1. Корреляционная диаграмма 131 10.2. Коэффициент корреляции Пирсона 134 10.2.1. Вычисление коэффициента корреляции Пирсона 134 10.2.2. Размер эффекта для коэффициента корреляции Пирсона 135 10.2.3. Проверка статистической значимости коэффициента корреляции Пирсона 136 10.2.4. Представление коэффициента корреляции Пирсона в отчетах 141 10.2.5. Сравнение корреляций Пирсона для двух независимых выборок 142 10.2.6. Размер эффекта для разности коэффициентов корреляции Пирсона 143 10.2.7. Сравнение коэффициентов корреляции двух зависимых выборок 145 10.3 Коэффициенты корреляции Спирмена и Кендалла 147 10.3.1. Коэффициент ранговой корреляции Спирмена 147 10.3.2. Размер эффекта для коэффициента корреляции Спирмена 149 © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 4 10.3.3. Проверка статистической значимости коэффициентов корреляции Спирмена 10.3.4. Коэффициент ранговой корреляции τ-Кендалла 149 150 10.3.5. Проверка статистической значимости коэффициентов корреляции τ-Кендалла 151 10.4. Коэффициент корреляции «Фи» 152 10.5. Точечно-бисериальный коэффициент корреляции 154 10.6. Размер эффекта для коэффициентов корреляции 157 10.7. Частная корреляция 157 10.8. Немонотонный характер связи 161 10.9. Частотный анализ 161 10.10. Исследование связи, когда коэффициентами одна переменная количественная, а другая номинальная 162 10.11. Исследование связи между номинальными переменными 162 10.12. Схема исследования связи 163 11. Связь между самооценкой и агрессией подростков 11.1. Ввод данных 164 165 11.2. Описательная статистика и проверка нормальности распределения данных 168 11.2.1. Показатели описательной статистики 169 11.2.2. Гистограммы с нормальной кривой 169 11.2.3. Критерий Колмогорова-Смирнова в модификации Лиллифора и критерий Шапиро-Уилкса 172 11.2.4. Графическая иллюстрация: Boxplots 175 11.3. Вычисление коэффициентов корреляции 177 11.4. Корреляционные диаграммы 180 11.5. Нелинейный регрессионный анализ. Выбор вида связи 183 11.6. Графическая иллюстрация результатов регрессионного анализа 198 11.7. Переход к низким и к высоким показателям 203 11.7.1. Анализ двух групп самооценки 204 11.7.2. Анализ двух групп вербальной агрессии 229 11.8. Выводы по корреляционному анализу © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 236 5 12. Частотный анализ. Критерий «Хи-квадрат» Пирсона 12.1. Сравнение распределения с теоретическим: Goodness-of-Fit Test 238 238 12.1.1. Сравнение эмпирического распределения признака с равномерным распределением 239 12.1.2. Пример 1. Без поправки на непрерывность 241 12.1.3. Пример 2. С поправкой на непрерывность 246 12.2. Связь номинальных переменных: Test of Independence 248 12.2.1. Пример 3. Без поправки на непрерывность 253 12.2.2. Пример 4. С поправкой на непрерывность 263 13. Исследование выборов терминальных ценностей по М. Рокичу 269 14. Частотный анализ. Тест «Угловое преобразования Фишера φ*» 283 Домашнее задание 2 289 15. Частотный анализ для примера исследования связи между самооценкой и агрессией 290 Домашнее задание 3 311 Литература 312 Приложение 1. Методика Басса-Дарки 315 Приложение 2. Математическая часть работы «Исследование гендерных различий агрессивности у подростков» 329 Приложение 3. Методика Дембо-Рубинштейна 353 Приложение 4. Математическая часть работы «Исследование связи между самооценкой и агрессией в подростковом возрасте» © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 358 6 Введение В ХХ веке в социальных науках стали активно использоваться математические методы. С развитием вычислительной техники происходило совершенствование этих методов. Наряду с математиками статистические методы, теорию вероятностей и вычислительные методы развивали физики, биологи, генетики, психологи, политологи, медики и ученые из других областей науки. Их именами названы многие статистические термины. Например, теоретическое распределение Фишера-Снедекора. Рональд Фишер – статистик, биолог, генетик, основатель дисперсионного анализа (ANOVA). Благодаря работе Фишера, регрессионный анализ используется для того, чтобы сделать вывод о связи между переменными. Известен статистический критерий Фишера. В настоящее математическое время обоснование. любые По исследования требованиям в психологии Американской должны иметь Психологической Ассоциации (АРА) в научных статьях обязательно должны быть представлены статистические методы обработки данных. Существует специальная система статистических сокращений, которые не нуждаются в пояснениях. Разработан комплекс статистических компьютерных программ, который назвали «Statistical Package for Social Sciences», сокращенно – SPSS. Сейчас SPSS используют не только в социальных науках. Современному психологу необходимо уметь организовывать исследование так, чтобы его результаты можно было бы обработать с применением математических методов, уметь выбирать адекватные методы обработки данных, анализировать и интерпретировать полученные результаты. Без статистической обработки данных невозможно защитить бакалаврскую работу, магистерскую работу и докторскую диссертацию по психологии. Психологу необходимо уметь совершать переход от психологического языка к языку математики. Определять математическую идентификацию исследовательской ситуации, выбирать валидные методики для измерения переменных и адекватные методы анализа данных. Обрабатывать данные, анализировать их математически, получать результаты. А затем, поработав с математикой, необходимо переходить обратно, на психологический язык, давать результатам психологическую интерпретацию. © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 7 Основной целью преподавания статистических методов студентам-психологам является подготовка студентов к будущей научной работе, начальными этапами которой служат курсовая, дипломная и магистерская работы. Психолог должен знать возможности статистических программ и уметь их применять. В данном учебном пособии рассматривается применение компьютерных программ SPSS и MS Excel. Для усвоения данного предмета требуется предварительное изучение курса «Статистические методы в психологии» и умение пользоваться компьютером (MS Word, Excel, Internet). Все примеры, которые рассматриваются в данном конспекте лекций основаны на реальных данных, взятых из курсовых, дипломных работ. Конспект лекций содержит: • теоретическое описание основных понятий статистики, • руководство по использованию компьютерных программ Excel и SPSS (версия 22.0) для решения конкретных психологических задач, • список основной и дополнительной литературы, • файлы данных в Excel, для примеров, разбираемых в конспекте, • файлы с вариантами домашних заданий, • некоторые методики психологических измерений, • приложения с примерами оформления домашних заданий. Без самостоятельного выполнения домашних заданий освоение курса невозможно. К конспекту лекций прилагаются файлы данных, предназначенные для самостоятельного освоения курса и для выполнения домашних заданий (Таблица 1). Конспектом лекций могут пользоваться как студенты бакалаврской программы. Выставляемая студенту оценка складывается из оценки выполнения домашних заданий (50%) и из оценки, полученной при выполнении экзаменационной работы (50%). © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 8 Таблица 1 Файлы данных, предназначенные для самостоятельного освоения курса и для выполнения домашних заданий Файлы в фолдере Aggression_Data.xlsx Aggression_Data_Factor.xlsx Aggression_Variants_(1-16).xlsx Self-Esteem_Aggression_Data.xlsx Self-Esteem_Aggression_Data-Factor.xlsx Self-Esteem_Aggression_Variants._(1-24).xlsx Home_Work_2_Chi_Square_Variants.docx Data_Chi_Rokich.xlsx Fishers_angular_transformation_2T.xlsx Домашнее задание 1 3 2 Замечание. Варианты домашних заданий 1-3 приведены в «Moodle» БМА. © Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 9 1. Популяция и выборка Математическая статистика – это наука о математических методах систематизации и использования статистических данных для научных и практических выводов. В математической статистике можно выделить две основные части: 1) Описательная статистика (Descriptive Statistics); 2) Теория статистического вывода (Inferential Statistics). Освоение описательной статистики предусматривает знание математики в рамках средней школы. Теория статистического вывода подразумевает знание высшей математики, в том числе таких математических дисциплин, как теория вероятностей, математический анализ. Теория статистического вывода всегда пользуется терминами теории вероятностей. 1.1. Популяция Популяция (Генеральная совокупность) – Population - это все множество объектов, в отношении которых формулируется исследовательская гипотеза (Наследов, 2004; с.19). Если, все же, исследованию подвергаются все объекты популяции, то такое исследование называют полным или сплошным. Количество всех объектов популяции называют ее объемом (size). Все показатели, вычисленные для популяции (например среднее значение), называют параметрами. Параметры стараются обозначать буквами греческого алфавита. При этом в соответствии с требованиями Американской Психологической Ассоциации (American Psychological Association, APA), в научных отчетах греческие буквы не пишутся курсивом (not Italic). 1.2. Выборка Часть объектов популяции, отобранных для того, чтобы после их изучения, сделать заключение о всей популяции, называют выборкой (Sample). Количество всех объектов выборки называют объемом выборки (Sample size). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 10 Все показатели, вычисленные для выборки, называют статистиками. Статистики стараются обозначать буквами латинского алфавита. Их обозначения, в соответствии с требованиями APA, в научных отчетах пишутся курсивом (Italic). 1.3. Выборочный метод Метод исследования, позволяющий делать заключение о характере изучаемых свойств популяции на основе рассмотрения некоторой ее части (выборки), называется выборочным методом. Практически все исследования являются выборочными, а их выводы распространяются на популяцию. Репрезентативность – это свойство выборки достаточно полно отражать изучаемое свойство популяции. Чтобы выборка отражала свойства популяции, она должна быть сформирована случайно. Неслучайный отбор может исказить истину и привести к ошибочным выводам. Случайный отбор предполагает создание таких условий, чтобы каждый объект популяции имел равные с другими объектами шансы попасть в выборку (Random Sample). 2. Измерение Американский психолог-психофизик, автор теории психофизических измерений Стивенс Стэнли Смит в середине ХХ века дал следующее определение измерению. Под измерением понимают процедуру приписывания числовых форм объектам или событиям в соответствии с определенными правилами. Эти правила устанавливают соответствие между измеряемым свойством объекта и результатом измерения (в частности - числом). В результате измерения исследователь получает данные (data), которые могут быть количественными (quantitative), либо категориальными (categorical). Примеры количественных данных: вес, индекс массы тела, время реакции; значение физической агрессии, определенное по ответам на вопросы специального теста в соответствии с его специальными «ключами». Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 11 Примеры категориальных данных: профессия (учитель, продавец, портной, дворник, врач), пол (мужской, женский). 2.1. Измерительные шкалы Шкала (лат. scala – лестница) – это некоторая числовая структура, подобранная для конкретной эмпирической структуры данных, т.е. результат числового представления эмпирической структуры данных. Современная классификация шкал была предложена в 1946 году Стэнли Смитом Стивенсом (Stevens, 1946): номинальная шкала, шкала порядка, шкала интервалов и шкала отношений. Шкалы позволяют замещенать интересующие исследователя эмпирические объекты числами, которые удобны в обращении. Шкалы также разделяют на метрические и неметрические. Если есть или может быть установлена единица измерения, то шкалу называют метрической. В противном случае – неметрической. 2.1.1. Шкала наименований Как правило, шкалу наименований (Nominal Scale) используют, когда приходится иметь дело с категориальными переменными (variables). 1. Пример: категориальная национальность: переменная латыш - 11 русский - 23 поляк – 34 еврей - 41 немец – 58 - 2. Пример: категориальная переменная - пол: мужской – 1 женский – 0. Измерение в номинальной шкале предполагает группировку объектов по категориям. Внутри категории объекты должны быть идентичны по измеряемому свойству. Категории нумеруют произвольным способом. Создается так называемая категориальная или номинальная переменная (categorical or nominal variable), значения которой равны числам, присвоенным категориям этой переменной. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 12 То, что присвоенное число больше или меньше другого присвоенного числа никак не связано со свойством объекта. Например, то, что 1 > 0 для Примера 2 (переменная - пол) не говорит о том, что какого-то «полового свойства» в мужчине больше, а в женщине меньше. Или, например, в Примере 1, не говорит о том, что немец, которому присвоили число 58, имеет количество «свойства национальности больше», чем поляк, которому присвоили число 34. Числа, присвоенные категориям в номинальной шкале, говорят только о том, что качества этих категорий отличаются. Разновидностью номинальных шкал является дихотомическая или бинарная (dichotomous or binary) шкала наименований, в которой категориальная (номинальная) переменная имеет всего две категории (Пример 2). Результат измерения в номинальной шкале дает ответ на вопрос: «К какой группе принадлежит результат измерения?» 2.1.2. Порядковая шкала Порядковая шкала (Ordinal Scale) – неметрическая шкала. Измерение в этой шкале предполагает приписывание свойствам объектов чисел, в зависимости от степени выраженности измеряемого свойства. Фиксируется различие степеней измеряемого свойства. Баллы в порядковой шкале говорят только о месте свойства одного объекта, по отношению к свойствам других объектов, но не отвечают на вопрос: на сколько одно значение переменной одного объекта отличается от другого. 1.Пример. Переменная – внешняя красота. Местам, полученным в конкурсе красоты можно поставить в соответствие значения переменной - баллы: Света – 1, Маша – 2, Таня -3, Оля -4. Присвоение баллов является измерением в порядковой шкале. Присвоенные баллы в говорят о том, что Света самая красивая, а Оля самая некрасивая. Но вовсе не следует, что Света красивее Маши ровно на столько же, насколько Таня красивее Оли, хотя разности между соответствующими баллами равны: 2-1=4-3. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 13 Числа, приписанные объектам в порядковой шкале, говорят только о месте свойства одного объекта, по отношению к свойствам других объектов, но не отвечают на вопрос: на сколько больше или меньше выражено измеряемое свойство у одного объекта, чем у другого объекта. Пример 2. В Таблице 2.1.2.1 приведены результаты измерения памяти школьников по специальному тесту в баллах (признак Х, столбец 3). В этом тесте большему баллу соответствует лучшая память. Если нет дополнительных исследований эмпирических данных, то можно считать, что данные измерения представлены в порядковой шкале. Таня запоминает лучше всех, хуже всех запоминает Юра. У Марины память лучше чем Коли, но хуже чем у Тани, и т.д. При обработке данных, измеренных в порядковых шкалах, часто приходится ранжировать данные. Присвоим результатам теста ранги так, чтобы большему баллу соответствовал больший ранг. Упорядочим баллы в порядке убывания (Таблица 2.1.2.1, столбец 3). В первом столбце запишем номера участников, начиная с 10 в убывающем порядке. Если оценка встречается один раз, то ей присваивается обычный (несвязанный) ранг, совпадающий с порядковым номером оценки. Если имеется группа одинаковых оценок, то каждой из них присваивается один и тот же (связанный) ранг, который равен сумме порядковых номеров этих одинаковых оценок, деленной на количество этих оценок. Танин балл (15) встречается один раз. Танин ранг будет совпадать с ее порядковым номером – 10. Запишем его в столбце 4. Это несвязанный ранг. У Оли и Светы одинаковые баллы (по 14). Их ранги равны 8+9 = 8,5 Это связанные 2 ранги. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 14 Таблица 2.1.2.1 Присвоение рангов для Примера 3. Результаты измерения памяти школьников по специальному тесту Nr. Имя Оценка за тест в баллах (признак Х) 1 2 3 4 10 Таня 15 10 9 8 7 6 5 4 3 2 1 Оля Света Ася Катя Андрей Марина Миша Коля Юра 14 14 10 10 10 9 8 5 3 8,5 8,5 6 6 6 4 3 2 1 Ранг, присвоенный оценке Подсчет связанных рангов 5 8+9 = 8,5 2 5+6+7 =6 3 Правильность присвоения рангов можно проконтролировать - сумма всех рангов равна сумме порядковых номеров и равна: n (n + 1) . 2 Объем выборки n = 10. n - совпадает с количеством участников тестирования. Контроль правильности присвоения рангов: Сумма всех рангов = 10 + 8, 5 + 8, 5 + 6 + 6 + 6 + 4 + 3 + 2 + 1 = 55 . Сумма всех порядковых номеров в Таблице 1.1.2.1 равна 1 + 2 + L + n = 1 + 2 + 3 + L + 10 = 55 . С другой стороны, n (n + 1) 10 ⋅ (10 + 1) = = 55 . 2 2 55=55, следовательно, ранжирование выполнено верно. 3.Пример. Признак – способности по математике. Для выявления способностей по математике использовался специальный тест, содержащий 60 вопросов. Каждый ответ оценивался «правильно» - 1, «неправильно» - 0. В результате были получены баллы: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 15 Валерий – 45, Дмитрий -34, Антон – 15, Виталий – 22. Результаты можно упорядочить по способностям к математике. Самым способным оказался Валерий (45), затем Дмитрий (34), затем Виталий (22), затем Антон (15). Пусть имеются нормы, например, 0-10 очень плохие способности; 11-20 плохие способности; 21-40 средние способности; 41-50 хорошие способности; 51-60 очень хорошие способности. Тогда, Валерий относится к группе учеников с хорошими способностями по математике, Дмитрий и Виталий относятся к группе учеников со средними способностями, а Антон – к группе с плохими способностями. Результат измерения в порядковой шкале дает ответы на вопросы: 1) «К какой группе принадлежит результат измерения?» 2) «Как можно упорядочить результаты измерения?» 2.1.3. Шкала интервалов 2.1.4. Шкала отношений Это – метрические шкалы. А. Общее для шкал интервалов и отношений Шкала интервалов (Interval Scale) и Шкала отношений (Ratio Scale) предназначены для признаков, которые могут быть выражены количественно. При этом равные разности чисел, присвоенных объектам, соответствуют равным различиям выраженности измеряемого свойства объектов. Поэтому измерение в шкалах интервалов и отношений дает возможность применения единицы измерения (метрики). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 16 Измерение в этих шкалах предполагает приписывание объектам чисел, которые отражают не только различия в степени выраженности измеряемого свойства, но и то, насколько больше или меньше выражено свойство. Б. Различие между шкалами интервалов и отношений Шкала интервалов: Нулевая точка выбрана условно. Свойство, которое измеряется, не исчезает, если результат измерения равен нулю. Условность выбора нулевой точки позволяет судить только о том, насколько больше или меньше выражено свойство, но не дает ответа на вопрос, во сколько раз больше или меньше выражено свойство. Примеры: Ø Исчисление времени в соответствии с Григорианским календарем. Нулевая точка выбрана условна и связывается с рождеством Иисуса Христа. Она не говорит об исчезновении времени. Ø Температура, определяемая в физике через кинетическую энергию движения молекул1, измеренная по шкале Цельсия. Температура 00С не говорит об остановке молекул. Она принята условно, как температура, при которой замерзает вода. Результат измерения в шкале интервалов дает ответы на вопросы: 1) К какой группе принадлежит результат измерения? 2) Как можно упорядочить результаты измерения? 3) Насколько один результат измерения больше другого результата измерения? Шкала отношений: Нулевая точка указывает на полное отсутствие выраженности измеряемого свойства. Название шкалы связано с тем, что отношение присваиваемых при измерении чисел можно интерпретировать как отношение выраженности измеряемых свойств объектов. Дает ответ на вопрос насколько больше или меньше выражено свойство, а также на вопрос, во сколько раз больше или меньше выражено свойство. В молекулярно-кинетической теории температура определяется как величина, характеризующая приходящуюся на одну степень свободы среднюю кинетическую энергию частиц макроскопической системы, находящейся в состоянии термодинамического равновесия. 1 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 17 Примеры: Ø Исчисление времени в соответствии с иудейским календарем. Нулевая точка указывает на сотворение мира. Она говорит об отсутствии времени; Ø Рост, равный нулю, говорит об исчезновении роста, как свойства; Ø Вес, равный нулю, говорит об исчезновении веса, как свойства. Ø Температура, измеренная по шкале Кельвина. Абсолютный ноль 00К соответствует -2730С – есть наиболее низкая возможная температура, при которой в принципе невозможно извлечь из вещества тепловую энергию, то есть соответствует прекращению движения молекул. Результат измерения в шкале интервалов дает ответы на вопросы: 1) К какой группе принадлежит результат измерения? 2) Как можно упорядочить результаты измерения? 3) Насколько один результат измерения больше другого результата измерения? 4) Во сколько раз один результат измерения больше другого результата измерения? 2.2. Мощность шкалы Мощность шкалы - это способность шкалы различать свойства или дифференцирующая способность шкалы (Наследов, 2004; с.27). Это подразумевает способность шкалы отвечать на вопросы (Таблица 2.2.1): А. К какой группе принадлежит результат измерения? B. Как можно упорядочить результаты измерения? C. Насколько один результат измерения больше другого результата измерения? D. Во сколько раз один результат измерения больше другого результата измерения? По мере возрастания мощности шкалы можно расположить следующим образом: 1) наименований, 2) порядковая, 3) интервалов, 4) отношений. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 18 Метрические шкалы оказываются более мощными, чем неметрические. Они лучше дифференцируют испытуемых. Метрические шкалы не ограничивают исследователя в выборе последующего анализа. Таблица 2.2.1 Мощность шкал Шкала На какие вопросы отвечает результат измерения Номинальная неметрическая A Порядковая неметрическая A B Интервалов метрическая A B C Отношений метрическая A B C D Неметрические шкалы менее мощные, чем метрические. Они содержат меньше информации о различии объектов (участников исследования) по измеренному свойству. Переход к менее мощным шкалам от более мощных часто приводит к утрате эмпирической информации об индивидуальных свойствах участников исследования. Поэтому надо стараться по возможности при исследовании применять более мощные измерительные шкалы. И только если нет выбора, тогда используется любая доступная исследователю шкала. Пример. В Таблице 2.2.2 приводится фрагмент таблицы данных для некоторого исследования. Признаки «пол» и «темперамент» измерены в номинальной шкале, «самооценка» - в порядковой шкале, «температура, ºС» - в шкале интервалов, «время реакции», «возраст», «рост» - в шкале отношений2. Вопрос А (К какой группе принадлежит результат измерения?) имеет ответ для всех указанных переменных. Например, результаты измерений для участника МП16 принадлежат к По виду данных в психологии трудно бывает отличить данные, измеренные в порядковой шкале от метрических данных. Если распределение неноминальных данных статистически значимо не отличается от нормального распределения, можно говорить о том, что они метрические. В противном случае данные являются порядковыми: «либо выборка не репрезентативна популяции, либо измерения произведены не в шкале равных интервалов» (Наследов, 2004, с.51). 2 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 19 группам: мужчин, преклонного возраста, высокого роста, меланхоликов, с низкой самооценкой, с быстрой реакцией, измеренния проводились в условиях холода. Вопрос В (Как можно упорядочить результаты измерения?). Упорядочить по возрастанию или по убыванию результаты измерения можно только для признаков «самооценка», «возраст», «рост», «время реакции» и «температура, ºС». Например, признак «возраст»: участник АВ11 моложе участника АЛ12, который моложе участника ДЛ8, который моложе чем НГ11, который моложе чем МП16. Или Вопрос С (Насколько один результат измерения больше другого результата измерения?) имеет ответ только для признаков «возраст», «рост», «время реакции» и «температура, ºС». Вопрос D (Во сколько раз один результат измерения больше другого результата измерения?) имеет ответ только для признаков «возраст», «рост» и «время реакции». Таблица 2.2.2 Фрагмент таблицы данных для некоторого исследования Код участника АВ11 НГ11 АЛ12 МП16 ДЛ8 Пол: 0-женский, 1-мужской Возраст (лет) 1 1 1 20 70 40 80 55 Рост (см) 160 120 165 180 140 Темперамент: 1-сангвинник, Время Темпера2-меланхолик, Самооценка реакции тура, ºС 3-холерик, (мс) 4-флегматик 1 34 3030 32 1 56 1010 24 3 82 934 19 2 40 815 -4 4 20 455 2 2.3. Особенности обработки данных в зависимости от шкал Номинальная шкала Методы анализа: Частотный анализ. Таблицы сопряженности (Crosstabs). Критерий «Хи-квадрат» - Chi-square test. Сравнение процентных долей по критерию ϕ ∗ -угловое преобразование Фишера. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 20 Мера центральной тенденции: МОДА. То есть наиболее часто встречающийся категория признака. Исключение: Дихотомические переменные. Для дихотомических переменных можно определять коэффициенты корреляции, значения которых можно интерпретировать. Например, коэффициент корреляции «фи» для двух дихотомических переменных, точечнобисериальный коэффициент корреляции для дихотомической и метрической переменных (Гласс & Стенли, 1976). Эти коэффициенты вычисляются по формуле для коэффициента корреляции Пирсона. Порядковая шкала Методы анализа: Частотный анализ. Процентили. В задачах связи: коэффициенты ранговой корреляции Спирмена и «Тау»-Кендалла ( τ -Кендалла). В задачах различия: непараметрические критерии, у которых вычисление наблюдаемых значений основано на рангах. Мера центральной тенденции: МЕДИАНА. Если объем выборки равен нечетному числу, то посередине упорядоченного в возрастающем порядке ряда оценок находится одна оценка, которую называют МЕДИАНОЙ. Если объем выборки равен четному числу, то посередине упорядоченного в возрастающем порядке ряда оценок находятся две оценки. Их полусумму называют МЕДИАНОЙ. 50-% оценок не превышают оценку, равную медиане! Иногда возможно вычисление среднего значения. Метрические шкалы В SPSS обработка данных, измеренных в метрических шкалах (интервальной и отношений) не отличается. Поэтому, метрические переменные описываются как интервальные (Scale). Методы анализа: Переменные, измеренные в метрических шкалах (при наличии нормального распределения) могут обрабатываться любыми статистическими методами. Меры центральной тенденции: СРЕДНЕЕ. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 21 Замечание. На величину среднего значения влияет каждое значение признака. Если имеются экстремальные значения - «выбросы», то лучше использовать непараметрическую статистику, а в качестве меры центральной тенденции - медиану. Пример. В некоторой фирме работают 10 человек. Их заработная плата (€ в неделю) равна: 65; 75; 80; 80; 80; 80; 80; 80; Средняя зарплата на фирме составляет M = 80; 10000 65 + 75 + 7 ⋅ 80 + 10000 = 1070 €. 10 Медиана равна Mdn = 80, что говорит о том, что 50% сотрудников фирмы получают зарплату не выше 80 € в неделю. Таким образом, в данной ситуации медиана является более объективной характеристикой уровня жизни работающих на фирме, чем среднее арифметическое. 2.4. Переменные величины Каждый признак можно рассматривать как переменную величину, значения которой принимают в данном исследовании различные численные значения. Различаются непрерывные и дискретные переменные. Непрерывные переменные могут принимать любые значения из некоторого определенного числового интервала. Например, вес, рост, время реакции, продолжительность жизни и т.д. Дискретные переменные могут принимать лишь отдельные значения. Например, число детей в семье, число пользователей интернета и т.д. 3. Основные описательные статистики Статистические показатели, рассчитанные для выборки, называются статистиками (statistics). Основной набор этих статистик, большая часть которых будет рассмотрена в данной главе, принято тазывать описательными статистиками (descriptive statistics). Статистики, как правило, обозначаются буквами латинского алфавита. Аналогичные показатели для популяции Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 22 называют параметрами (parameters). Параметры, как правило, обозначаются буквами греческого алфавита. В данном конспекте будут даваться два типа обозначений: во-первых, в соответствии с обозначениями, принятыми в математической статистике; во-вторых – обозначения в соответствии с требованиями Американской Психологической Ассоциации (American Psychological Association, APA) 3.1. Число наблюдений Число наблюдений (Count): как правило – это число участников, анкеты которых включены в обработку данных. Обозначение по требованиям АРА3: N – . общее число участников эксперимента, n - число баллов или наблюдений для конкретного экспериментального условия. Valid – имеющиеся в наличии данные; Missing – пропущенные данные. 3.2. Среднее арифметическое Среднее арифметическое (Mean, average) - это сумма всех баллов, деленная на их количество. Обозначение - x , обозначение по требованиям АРА : М - среднее для выборки; μ – среднее для популяции. 3.3. Стандартная ошибка среднего. Standard Error of Mean Стандартная ошибка среднего (Standard Error of Mean) - sx обозначение по АРА: SEM, Standard Error of Mean. Если из популяции извлекать случайные выборки одинакового объема и для каждой из них вычислять среднее значение некоторого признака, то получится распределение выборочных средних этого признака. Согласно центральной предельной теореме (Гласс & Стенли, 1976, сc. 221-225) распределение выборочных средних нормальное. Стандартное отклонение этого распределения будет равно МSE. Примерно 68% выборочных средних будет находиться в диапазоне М ± MSE , то есть в интервале ( M − SEM ; M + SEM ) . 3 APA – American Psychological Association. http://www.apa.org/. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 23 3.4. Медиана Медиана (Median) - обозначения медианы по АРА: Mdn. Другие обозначения: Md, Me. Определение. Если объем выборки равен нечетному числу, то посередине упорядоченного в возрастающем порядке ряда оценок находится одна оценка, которую называют МЕДИАНОЙ. Если объем выборки равен четному числу, то посередине упорядоченного в возрастающем порядке ряда оценок находятся две оценки. Их полусумму называют МЕДИАНОЙ. 50-% данных не превышают значения, равного медиане! 3.5. Мода Мода (Mode) – это наиболее часто встречающаяся оценка. Если существует несколько мод, то в SPSS принято показывать наименьшую моду. СРЕДНЕЕ, МЕДИАНА и МОДА – это показатели центральной тенденции. Если распределение данных не отличается от нормального распределения, то эти показатели равны. Моду обычно используют для номинальных измерений. Обозначение: Мо. 3.6. Дисперсия Дисперсия (Variance) характеризует разброс данных относительно среднего. Чем выше дисперсия, тем больше разброс данных. Слово «дисперсия» означает «рассеяние». Определение. Пусть дан эмпирический4 ряд данных: x1 , x2 , K, xn . Выборочная дисперсия определяется как отношение суммы квадратов отклонений баллов от среднего значения, деленная на n − 1 : n s X2 = 4 ∑( x − x ) i =1 2 i n −1 . (3.6.1) наблюдаемый Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 24 2 Обозначение по АРА: sx . 3.7. Стандартное отклонение Стандартное отклонение (Standard Deviation) - это квадратный корень из дисперсии. Характеризует разброс данных относительно среднего значения. Чем выше стандартное отклонение, тем больше разброс данных. Обозначение по sx . Обозначение по АРА: SD. Стандартное отклонение иногда может быть использовано для разбивки данных по уровню оценок. Самостоятельный процесс разбивки данных, как правило, возможен только тогда, когда в соответствующих адаптированных психологических методиках она не приводится. Разбивать данные с помощью среднего арифметического и стандартного отклонения можно, если эмпирическое распределение данных не отличается от нормального распределения. Из теории вероятностей известно, что если распределение данных подчиняется нормальному закону распределения, то: 1) Вероятность того, что оценки попадут в интервал ( x − s x ; x + s x ) равна 68. 3%5; 2) Вероятность того, что оценки попадут в интервал ( x − 2 s x ; x + 2 s x ) равна 95. 5%; 3) Вероятность того, что оценки попадут в интервал ( x − 3s x ; x + 3s x ) равна 99. 73%. Вероятность того, что оценки окажутся вне интервала ( x − 3s x ; x + 3s x ) ничтожно мала: .27%. То есть для нормально распределенных данных должен выполняться так называемый закон «трех сигма» (для нашего случая σ = SD= sx ): Отклонения нормально распределенных данных от среднего значения не превышают трех стандартных отклонений. 5 Максимальное возможное значение вероятности равно 1 или 100%. Минимальное значение – 0 или 0%. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 25 Если эмпирическое распределение данных не отличается от нормального распределения и в соответствующих методиках нет указаний, какие оценки считать высокими, низкими и адекватными (средними), то можно поступать следующим образом (Рис.3.7.1). Рисунок 3.7.1. Разбивка данных на уровни в случае нормального распределения. При нормальном распределении данных вероятность оценки среднего уровня равна 68.3%; Вероятность оценки высокого или низкого уровня равна (95.5-68.3):2=13.6%; Вероятность оценки очень высокого или очень низкого уровня равна (99.73-95.5):2=2.115%; Вероятность оценки очень высокого или очень низкого уровня равна (100-99.73):2=.135%. Если распределение данных подчиняется нормальному закону распределения, то за пределами трех стандартных отклонений могут находиться оценки, не принадлежащие данной популяции. 3.8. Размах Размах (Range) – это разность между максимальной и минимальной оценками: l = xmax − xmin . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 26 ДИСПЕРСИЯ, СТАНДАРТНОЕ ОТКЛОНЕНИЕ и РАЗМАХ – это основные меры изменчивости. 3.9. Асимметрия Асимметрия (Skewness) является мерой несимметричности распределения относительно среднего значения. Обозначение: S. Если S = 0, то распределение имеет симметричную форму. При отрицательной асимметрии левый «хвост» длиннее. При положительной асимметрии правый «хвост» длиннее. Примеры приведены на Рис.3.9.1 (Гласс & Стенли, 1976). При нормальном распределении данных асимметрия равна нулю. Поэтому, если асимметрия сильно отличается от нуля, распределение данных не является нормальным. Критерием отличия от нуля является стандартная ошибка асимметрии. S=0 M = 17 S>0 M = 17.5 S<0 M = 15.2 Рисунок 3.9.1. Примеры распределений с нулевой ( S = 0 ), левосторонней ( S > 0 ) и правосторонней ( S < 0 ) асимметриями (Гласс & Стенли, 1976). Для вычисления асимметрии в SPSS и в Excel используется формула: S= n n ( n −1)( n − 2) ∑ i =1 ( xi − x ) s3 3 , (3.9.1) где s – стандартное отклонение. Для оценки величины асимметрии можно использовать следующее правило:6 • При -0.5 ≤ S ≤ .0.5 распределение можно считать симметричным; • При -1 ≤ S < -0.5 или при 0.5 < S ≤ 1 распределение умеренно асимметричное; 6 Are the Skewness and Kurtosis Useful Statistics? (2016). Retrieved in https://www.spcforexcel.com/knowledge/basicstatistics/are-skewness-and-kurtosis-useful-statistics Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 27 • При S < -1 или при S > 1 распределение асимметрично. 3.10. Стандартная ошибка асимметрии Стандартная ошибка асимметрии (Standard Error of Skewness) - обозначение по АРА: SES. Если из популяции извлекать случайные выборки одинакового объема и для каждой из них вычислять асимметрию некоторого признака, то получится распределение выборочных асимметрий. Стандартное отклонение этого распределения будет равно SES. Близкие к нулю значения SES указывают на симметричность распределения изучаемого признака популяции. В этом случае можно считать, что изучаемый признак в выборке тоже имеет симметричное распределение. Высокие значения SES указывают на более высокое отклонение распределения признака в выборке от симметричного распределения. Стандартная ошибка асимметрии вычисляется по объему выборки (Cramer, 1997; p.85): SES = 6n ( n −1) ( n − 2)( n +1)( n + 3) . (3.10.1) Если наблюдения подчиняются нормальному закону распределения, то асимметрия равна нулю. Поэтому большое отличие асимметрии от нуля свидетельствует о том, что распределение данных не соответствует нормальному распределению. Если показатель асимметрии по абсолютной величине превышает свою стандартную ошибку: S ≥ SES , (3.10) то распределение данных не соответствует нормальному распределению (Наследов, 2004; с.60). 3.11. Эксцесс Эксцесс (Kurtosis) – это показатель островершинности или плосковершинности кривой распределения. За эталон принимают вершину кривой для нормального распределения (K = 0). Примеры приведены на Рис.3.11.1 (Гласс & Стенли, 1976). Обозначение: K. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 28 Нормальное распределение: K = 0 K>0 K<0 Рисунок 3.11.1. Примеры распределений с нулевым ( K = 0 ), положительным ( K > 0 ) и отрицательным ( K < 0 ) эксцессами (Гласс & Стенли, 1976). Для вычисления эксцесса в SPSS и в Excel используется формула: K= n ( n +1) n ( n −1)( n − 2)( n − 3) ∑ i =1 ( xi − x ) s4 4 − 3( n −1) 2 ( n − 2)( n − 3) , (3.11.1) где s – стандартное отклонение. 3.12. Стандартная ошибка эксцесса Стандартная ошибка эксцесса (Standard Error of Kurtosis) – обозначение по АРА: SEK. Если из популяции извлекать случайные выборки одинакового объема и для каждой из них вычислять эксцесс некоторого признака, то получится распределение выборочных эксцессов. Стандартное отклонение этого распределения будет равно SEК. Если из популяции извлекать случайные выборки одинакового объема и для каждой из них вычислять эксцесс некоторого признака, то получится распределение выборочных эксцессов. Стандартное отклонение этого распределения будет равно SEK. Близкие к нулю значения SEK говорят о том, что выборочные эксцессы мало отличаются между собой и от нуля и поэтому распределение признака в данной выборке не отклоняется от распределения с нулевым эксцессом. Стандартная ошибка эксцесс вычисляется по объему выборки (Cramer, 1997; p.89): n2 −1 SEK = 2 ∗ SES ∗ = ( n − 3)( n + 5) 24n ( n −1) . ( n − 2)( n − 3)( n + 3)( n + 5) 2 (3.12.1) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 29 Если наблюдения подчиняются нормальному закону распределения, то эксцесс равен нулю. Поэтому сильное отличие эксцесса от нуля свидетельствует о том, что распределение данных не соответствует нормальному распределению. Стандартная ошибка эксцесса – это одна из мер степени отличия эксцесса от нуля. Если показатель эксцесса по абсолютной величине превышает свою стандартную ошибку: K ≥ SEK , (3.12.2) то распределение данных не соответствует нормальному распределению. 3.13. Квартили Квартиль (Quartile) – это один из видов процентилей (Percentile) Квартили – это показатели, которые делят упорядоченный по возрастанию ряд данных на четыре одинаковые части. Существуют три квартили: Q1 , Q2 , Q3 . Процентили – это показатели, которые делят упорядоченный по возрастанию ряд данных на сто одинаковых частей Существует 99 процентилей: P1 , P2 ,K, P99 . P50 = Q2 = Mdn P25 = Q1 P1 P10 P20 P25 P30 P75 = Q3 P40 P50 P60 P70 P75 P80 P90 P99 Рисунок 3.13.1. Процентили, квартили и медиана. Справедливы соотношения (Рис.3.13.1): P25 = Q1 ; P50 = Q2 = Mdn; P75 = Q3 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 30 Процентиль Pk дает информацию о том, что k-% данных, не превышает значения, совпадающего с Pk . Таким образом, 25-% данных не превышают значения, равного квартили Q1 . 50-% данных не превышают значения, равного медиане и квартили Q2 . 75-% данных не превышают значения, равного квартили Q3 . Довольно часто используют меру изменчивости – междуквартильный размах (Interquartie Range, IQR): Q = Q3 - Q1 . (3.13.1) 50% данных меняется в пределах Q. 3.14. Стандартизованные данные Если от данных баллов xi . переходят к другим баллам zi по формуле zi = xi − x , sx (3.14.1) то баллы zi называют стандартизованными (z-scores). Стандартизованные оценки обладают следующими свойствами. 1. Среднее арифметическое равно нулю: M (Z ) = z = 1 n ∑ zi = 0 . n i =1 (3.14.2) 2. Дисперсия равна единице: s z2 = 1 n −1 n 2 ∑ (z i − z ) i =1 = 1 n −1 n ∑z i =1 2 i = 1. (3.14.3) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 31 3. Стандартное отклонение равно единице: SD ( Z ) = s z = s z2 = 1 . (3.14.4) Как можно стандартизовать переменные с помощью компьютерной программы SPSS Забегая вперед, покажем, как с помощью SPSS можно перевести переменные X 1 , X 2 ,K , X m в стандартизованные переменные. Для этого нужно загрузить SPSS файл данных с этими переменными. Analyze Descriptive Statistics Descriptives… Перенести переменные в окно «Variables» Поставить галочку в окне Save standardized values as variable OК В файле данных появятся новые стандартизованные переменные, которые можно назвать, например, Z1 , Z 2 ,K, Z m . 4. Расчет описательных статистик с помощью компьютерной программы SPSS SPSS английское название компьютерной программы: Statistical Package for Social Sciences (Статистический пакет для социальных наук). Разработан специально для социальных исследований. Ввод данных и статистический анализ соответствуют типам данных, встречающихся в анкетах и методам аналаза, применяющихся в социальных науках. С помощью программы SPSS показатели описательной статистики можно вычислить разными способами. Основные из них показаны в Таблице 4.1. Работу с программой SPSS рассмотрим на примерах. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 32 Таблица 4.1. Frequencies Explore ▲ ▲ ▲ ▲ Median (Медиана) ▲ ▲ ▲ Mode (Мода) ▲ Quartiles (Квартили) ▲ Percentiles (Процентили) ▲ ▲ Mean (Среднее) Case Summaries Descriptives Расчет показателей описательной статистики в SPSS7 (Бююль) Variance (Дисперсия) ▲ ▲ ▲ ▲ Standard Deviation (Стандартное отклонение) ▲ ▲ ▲ ▲ Standard Error of Mean (Стандартная ошибка среднего) ▲ ▲ ▲ ▲ Sum (Сумма) ▲ ▲ Minimum (Минимум) ▲ ▲ ▲ ▲ Maximum (Максимум) ▲ ▲ ▲ ▲ Range (Размах) ▲ ▲ ▲ ▲ ▲ ▲ Q=Q3-Q1 ▲ ▲ ▲ ▲ ▲ ▲ ▲ ▲ Kurtosis (Эксцесс) ▲ ▲ ▲ ▲ Standard Error of Kurtosis (Стандартная ошибка эксцесса) ▲ ▲ ▲ ▲ Skewness (Асимметрия) Standard Error of Skewness (Стандартная ошибка асимметрии) Confidence Interval for Mean (Доверительный интервал для ▲ среднего) ▲ Outliers (Выбросы) Стандартизация переменных: Z-преобразование ▲ Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб: ООО «ДиаСофтЮП». C. 164-165. 7 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 33 5. Гендерные различия агрессии у подростков 5.1. Ввод данных Проверяется гипотеза о наличии гендерных различий агрессии у подростков. Используется опросник Басса-Дарки (Бартышев, 2005; сс. 195-200) (Приложение 1). Данные8 находятся в файле Aggression_Data.xlsx. Рисунок 5.1.1. Запуск программы SPSS. Рисунок 5.1.2. Электронная таблица. Просмотр данных. Данные взяты из курсовой работы студентки Высшей школы психологии (Сейчас Балтийская Международная Академия - БМА) Наталии Баранчук, выполненной в 2003-2004 учебном году. 8 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 34 Рисунок 5.1.3. Электронная таблица. Просмотр переменных. Фрагмент таблицы данных, которые надо ввести, находится в Таблице 4.1.1. Полная таблица данных - в файле Agr_Data.xlsx. Таблица 5.1.1 Показатели уровней агрессии подростков по методике Басса – Дарки Code m1 m2 m3 m4 Gender: 0-Female; 1-Male PhA IA I N R S VA G 5 5 5 6 8 8 7 6 6 8 7 7 3 3 1 4 6 5 3 3 6 7 4 5 7 4 5 7 4 3 5 5 Обозначения9: Physical aggression (PhA) Indirect Aggression (IA) Irritation (I) Negativism (N) Resentment (R) Suspicion and Distrust (S) Verbal Aggression (VA) Guilt (G) 9 Физическая агрессия Косвенная агрессия Раздражение Негативизм Обида Подозрительность Вербальная агрессия Чувство вины Questionnaire Bass-Darky. Retrieved from http://ecowoman-english.tk/articles.php?id=35667 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 35 5.1.1. Описание переменных Ввод данных следует начать с описания переменных (Variable View). Левой клавишей мыши щелкнуть на Variable View (Просмотр переменных). В результате появится окно (Рис.5.1.3), в котором надо описать каждую из переменных. 1. Прежде всего необходимо дать имя переменной (Name). При выборе имени следует соблюдать основные правила. 1) Имя каждой переменной должно быть единственным. Дублирование имени не допускается. 2) Имена могут содержать: - буквы латинского или русского алфавита; - цифры; - символ подчеркивания; - точку; - символы: @, $ и #. 3) Не разрешаются пробелы, знаки других алфавитов и специальные символы, такие как ! ? « *()- 4) Имя должно начинаться с буквы. 5) Последний символ имени не может быть точкой или знаком подчеркивания. 6) Недопустимо в названиях использовать слова: all and or not with by eq ne lt le gt ge to Если вводится неразрешенное имя переменной, то программа SPSS сообщает об этом. В имена переменных для рассматриваемого примера приведены в Таблице 4.1.2. Основой для наименования переменных послужили соответствующие термины на латышском языке. 2. Тип переменной (Type). По умолчанию все переменные численные с максимальной длиной 8 знаков, дробная часть состоит из 2 знаков. Если требуется что-то изменить, необходимо встать мышью на соответствующую ячейку и щелкнуть по кнопке с тремя точками: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 36 После чего откроется диалоговое окно (Рис.5.1.1.1) Define Variable Type – Определение типа переменной. Ввод данных в SPSS будет осуществлен на английском языке с использованием терминологии авторов методики.10 Возможно использование других языков. Таблица 5.1.1.2 Описание переменных. Имена переменных, метки и значения. Переменная Обозначение Имя в SPSS (Label) Шифр участника Пол (0-девочка; 1-мальчик) Физическая агрессия Косвенная агрессия Раздражение Негативизм Обида Подозрительность Вербальная агрессия Чувство вины Gender Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt Code sex PhA IA I N R S VA G Метки значений (Values) (0-Female; 1-Male) Рисунок 5.1.1.1. Диалоговое окно Define Variable Type. 10 Questionnaire Bass-Darky. Available at: http://ecowoman-english.tk/articles.php?id=35667 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 37 В нашем примере необходимо изменить тип переменной kod, так как это не численная переменная, а строка символов. Поэтому для нее надо выбрать String. С такими переменными нельзя выполнять никаких вычислений, но можно проводить подсчеты ее повторяемости. 3. Формат столбца (Width) и количество десятичных разрядов (Decimals) меняется по необходимости. 4. Метка переменной (Label) – это более подробное название переменной. Оно может содержать 256 символов. Это то, что будет выдаваться в таблицах, на рисунках в выходной информации. Например, если мы хотим, чтобы в выходной информации вместо символов PhA на диаграмме было бы напечатано: «Physical Aggression», то в колонке Label надо написать: Physical Aggression. 5. Метки значений (Values). Это более подробное описание переменной. Например, переменную sex (Пол) для значения 1 можно задать название «Male» (мальчик), а для значения 0 – название «Female» (девочка). При этом эти же названия будут в выходной информации. 6. Пропущенные значения (Missing values). Допускаются два вида пропущенных значений: - Пропущенные значения, определяемые системой (System-defined missing values) – если в матрице данных есть незаполненные ячейки, то SPSS идентифицирует их как пропущенные значения. Тогда в ячейке, где пропущено значение, появляется запятая; - Пропущенные значения, задаваемые пользователем (User-defined missing values). С помощью кнопки Missing пользователь при желании может объявить эти значения пропущенными. Пропущенные значения можно исключить из последующих вычислений. 7. Столбцы (Columns) – ширина столбца, которую будет иметь в таблице данный столбец при отображении значений. 8. Выравнивание (Alignment). Можно задавать вид отображения значений в таблице: выровненными по правому краю, по центру, или по левому краю. 9. Шкала измерения (Measure). Можно задать номинальную (Nominal), порядковую (Ordinal) или метрическую шкалу (интервалов или отношений: Scale). Это будет иметь значение только при создании интерактивных графиков – когда номинальная и порядковая шкала измерений объединяются в «категориальный» тип. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 38 Начало работы «Шифр испытуемого» 1. В ячейку Name 1 напишем слово Code После этого в остальных ячейках строки 1 появится некоторая информация. 2. Type. Встанем мышью на соответствующую ячейку Type-1 и щелкнем по кнопке с тремя точками: Откроется диалоговое окно (Рис.5.1.1.2) Variable Type – Определение типа переменной. Выберем String. Рисунок 5.1.1.2. Диалоговое окно Variable Type. OK 3. Width – 4. Decimals: 5. Label: 6. Values: 7. Missing: 8. Columns: 9. Align: 10. Measure: 8 None None None 8 Left Nominal «Пол»: sex 11. В ячейку Name 2 напишем sex 12. Decimals: 0 13. Width – 1 14. Label: Gender Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 39 15. Values: Нажмем кнопку: Появится диалоговое окно (Рис.5.1.1.3): Рисунок 5.1.1.3. Диалоговое окно Value Labels. Value 0 Value Label Female Add Value 1 Value Label MaleAdd В результате получаем (Рис.5.1.1.4): Рисунок 5.1.1.4. Диалоговое окно Value Labels с введенными данными. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 40 OK 16. Missing: None 17. Columns: 8 18. Align: Right 19. Measure: Nominal Сохранить данные! (File, Save и т.д.). Дать имя файлу! Например, «Data.sav». В результате должен появиться новый файл (Output 1) с сообщением о том, что файл сохранен по такому-то адресу. Например (Рис.5.1.1.5): Рисунок 5.1.1.5. Новый файл Output 1 сообщением о файле с исходными данными. «Физическая агрессия» 20. В ячейку Name 3 напишем PhA 21. Type Numeric 22. Width – 8 23. Decimals: 2 24. Label: Physical Aggression 25. Values: None 26. Missing: None 27. Columns: 8 28. Align: Right 29. Measure: Scale «Косвенная агрессия» 30. В ячейку Name 4 напишем IA Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 41 31. Type Numeric 32. Width – 8 33. Decimals: 2 34. Label: Indirect Aggression 35. Values: None 36. Missing: None 37. Columns: 8 38. Align: Right 39. Measure: Scale «Раздражение» 40. В ячейку Name 5 напишем I 41. Type Numeric 42. Width – 8 43. Decimals: 2 44. Label: Irritation 45. Values: None 46. Missing: None 47. Columns: 8 48. Align: Right 49. Measure: Scale «Негативизм» 50. В ячейку Name 6 напишем N 51. Type Numeric 52. Width – 8 53. Decimals: 2 54. Label: Negativism 55. Values: None 56. Missing: None 57. Columns: 8 58. Align: Right 59. Measure: Scale Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 42 «Обида» 60. В ячейку Name 7 напишем R 61. Type Numeric 62. Width – 8 63. Decimals: 2 64. Label: Resentment 65. Values: None 66. Missing: None 67. Columns: 8 68. Align: Right 69. Measure: Scale «Подозрительность» 70. В ячейку Name 8 напишем S 71. Type Numeric 72. Width – 8 73. Decimals: 2 74. Label: Suspicion and Distrust 75. Values: None 76. Missing: None 77. Columns: 8 78. Align: Right 79. Measure: Scale «Вербальная агрессия» 80. В ячейку Name 9 напишем VA 81. Type Numeric 82. Width – 8 83. Decimals: 2 84. Label: Verbal Aggression 85. Values: None 86. Missing: None 87. Columns: 8 88. Align: Right 89. Measure: Scale Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 43 «Чувство вины» 90. В ячейку Name 10 напишем G 91. Type Numeric 92. Width – 8 93. Decimals: 2 94. Label: Guilt 95. Values: None 96. Missing: None 97. Columns: 8 98. Align: Right 99. Measure: Scale В результате получится (Рис.5.1.1.6). Рисунок 5.1.1.6. Описание переменных. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 44 5.1.2. Ввод данных Перейти в окно Data View и ввести данные (их можно скопировать из Excel или из Word). Фрагмент результата (Рис.5.1.2.1): Рисунок 5.1.2.1. Ввод данных. Фрагмент. 5.2. Описательные статистики Вариант I После ввода данных начинается их обработка, в зависимости от сформулированной исследователем гипотезы. Но, как правило, показатели описательной статистики вычисляются всегда. Для вычисления показателей описательной статистики имеется следующие возможности (Таблица 4.1) (Бююль & Цефель, 2002; сс.164-165). 1) Analyze (Анализ) Descriptive Statistics (Описательная статистика) Descriptives... (Описательная статистика) 2) Analyze (Анализ) Descriptive Statistics (Описательная статистика) Frequencies (Частоты) 3) Analyze (Анализ) Descriptive Statistics (Описательная статистика) Explore... (Исследовать) 4) Analyze (Анализ) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 45 Reports (Отчеты) Case Summaries... (Итоги по наблюдениям) Для рассматриваемой задачи о гендерных различиях необходимо получить показатели описательной статистики для мальчиков и для девочек по-отдельности, чтобы потом их сравнить. Поэтому, в начале работы надо расщепить данные отдельно на мальчиков и девочек, используя группирующую переменную «Dzimums» (sex). Data Split file...(Рис.5.2.1) Рисунок 5.2.1. Анализ всех случаев, без создания групп. Organize output by groups Перенести переменную «Dzimums [sex]» в окно “Groups Based on” ...(Рис.5.2.2). OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 46 Рисунок 5.2.2. Организация выхода по группам. В результате данные окажутся разбитыми на 2 группы: мальчиков и девочек. Результаты будут выдаваться по группам мальчиков и девочек отдельно. В выходном файле (Output) появится сообщение: SORT CASES BY sex. SPLIT FILE SEPARATE BY sex. Новый файл с выходной информацией Output2 надо сохранить (в том же фолдере) под каким-либо именем, например, Results. Точнее Results.spv. Получение показателей описательной статистики Analyze Descriptive Statistics Frequencies... Перенести в окно “Variables” все переменные, за исключением “Code” и “Gender” (Рис.5.2.3). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 47 Рисунок 5.2.3. Перенос переменных для получения описательной статистики. Галочку с “Display frequency tables” можно снять. При этом программа SPSS предупредит о том, что никакой выходной информации не заказано. Statistics Рисунок 5.2.4. Заказ показателей описательной статистики. Отметить статистики, значения которых надо получить (Рис.5.2.4). Continue OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 48 Выходная информация Выходная информация выдается в виде таблиц, в которых данные необходимо округлить (до 2 знаков после запятой). Обработку таблиц удобно проводить с помощью Компьютерной программы Excel (Файл Agr_Results.xls). В результате получаются таблицы 5.2.1 и 5.2.2. В Таблицах 5.2.1-5.2.2 отмечены случаи, когда показатели асимметрии и эксцесса по абсолютной величине превосходят свои стандартные ошибки. В этих случаях распределение данных отличается от нормального распределения. В Таблицах 5.2.1-5.2.2 использованы сокращенные названия переменных, вместо полных названий, которые выдает SPSS. Таблица 5.2.1. Показатели описательной статистики для девочек PhA IA I N R S VA G 30 30 30 30 30 30 30 30 Mean 5.33 7.17 6.43 2.27 4.67 5.53 6.07 5.03 Std. Error of Mean 0.22 0.20 0.17 0.19 0.19 0.25 0.22 0.25 Median 5.00 7.00 6.00 2.00 5.00 6.00 6.00 5.00 Std. Deviation 1.21 1.12 0.94 1.01 1.06 1.38 1.23 1.38 Skewness 2.03 -0.03 0.61 0.05 -0.38 0.18 -0.61 0.19 Std. Error of Skewness 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 Kurtosis 6.66 -1.16 0.76 -1.20 -1.01 -0.83 -0.61 -0.59 Std. Error of Kurtosis 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Range 6.00 4.00 4.00 3.00 3.00 5.00 4.00 5.00 Minimum 4.00 5.00 5.00 1.00 3.00 3.00 4.00 3.00 N Valid Missing Maximum 10.00 9.00 9.00 4.00 6.00 8.00 8.00 8.00 25 5.00 6.00 6.00 1.00 4.00 4.00 5.75 4.00 50 5.00 7.00 6.00 2.00 5.00 6.00 6.00 5.00 75 a Gender = Female 6.00 8.00 7.00 3.00 5.25 6.25 7.00 6.00 Percentiles Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 49 Таблица 5.2.2. Показатели описательной статистики для мальчиков PhA IA I N R S VA G 30 30 30 30 30 30 30 30 Mean 8.03 5.00 6.27 4.33 4.07 5.10 9.60 5.20 Std. Error of Mean 0.30 0.38 0.24 0.19 0.22 0.19 0.37 0.21 Median 8.50 5.00 6.00 5.00 4.00 5.00 10.00 5.00 Std. Deviation 1.65 2.10 1.34 1.03 1.23 1.06 2.04 1.16 Skewness -0.60 -0.41 0.31 -1.35 0.58 0.53 -0.61 0.58 Std. Error of Skewness 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 Kurtosis -0.43 0.00 -0.49 0.54 -0.46 -0.93 0.33 0.05 Std. Error of Kurtosis 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Range 6.00 8.00 5.00 3.00 5.00 3.00 8.00 5.00 Minimum 5.00 1.00 4.00 2.00 2.00 4.00 5.00 3.00 N Valid Missing Maximum Percentiles 11.00 9.00 9.00 5.00 7.00 7.00 13.00 8.00 25 7.00 4.00 5.00 4.00 3.00 4.00 8.75 4.00 50 8.50 5.00 6.00 5.00 4.00 5.00 10.00 5.00 75 9.00 7.00 7.00 5.00 5.00 6.00 11.00 6.00 a Gender = Male Вариант 2 Если данной процедуре предшествовало разбиение данных на группы, то необходимо вернуться к исходной неразбитой группе. Data Split file... Reset OK В файле с выходной информацией Results.spv появится сообщение: SPLIT FILE OFF. Начало новой процедуры: Analyze Descriptive Statistics Explore Перенести переменную «Gender [sex]» в окно “Factor List”. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 50 Перенести в окно “Dependent List” все переменные, за исключением “Code” и “Gender” (Рис.5.2.5). Поставить точку у Statistics (Рис.5.2.5). OK Рисунок 5.2.5. Получение показателей описательной статистики в Explore. Выходная информация: Таблица с информацией об обработанных наблюдениях (Таблица 5.2.3). Таблица 5.2.3 Фрагмент таблицы «Case Processing Summary» (Обработанные наблюдения) Gender N Physical Aggression Indirect Aggression Irritation Valid Percent Cases Missing N Percent N Total Percent Female 30 100.0% 0.0% 30 100.0% Male Female Male Female Male 30 30 30 30 30 100.0% 100.0% 100.0% 100.0% 100.0% 0.0% 0.0% 0.0% 0.0% 0.0% 30 30 30 30 30 100.0% 100.0% 100.0% 100.0% 100.0% Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 51 Таблица 5.2.4 Описательные статистики (Descriptives). Фрагмент таблицы. Gender Statistic Mean 95% Confidence Interval for Mean 5.3333 Lower Bound 4.8804 Upper Bound 5.7863 5% Trimmed Mean 5.2037 Median 5.0000 Variance Female Physical Aggression Std. Deviation 1.21296 Minimum 4.00 Maximum 10.00 Range 6.00 Interquartile Range 1.00 Skewness 2.033 .427 Kurtosis 6.661 .833 8.0333 .30127 95% Confidence Interval for Mean Lower Bound 7.4172 Upper Bound 8.6495 5% Trimmed Mean 8.0556 Median 8.5000 Variance Std. Deviation Minimum • .22145 1.471 Mean Male Std. Error 2.723 1.65015 5.00 Interquartile Range (Междуквартильный размах). Это разность между третьим и первым квартилями: Q = Q3 − Q1 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 52 5.3. Графические иллюстрации уровней агрессии мальчиков и девочек 5.3.1. Коробчатые диаграммы Коробчатые диаграммы (Boxplots) (Рис.5.3.1) состоят из прямоугольника, занимающего пространство от первого до третьего квартиля. Рисунок 5.3.1.1. Коробчатая диаграмма. Линия внутри прямоугольника соответствует медиане. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 53 Значения, удаленные от границ более чем на три длины построенного прямоугольника (экстремальные значения или «выбросы»), помечаются на диаграмме звездочками с номером соответствующего наблюдения в программе SPSS (Extremes). Значения, удаленные более, чем на полторы длины прямоугольника (экстремальные значения или «выбросы»), помечаются кружкам с номером соответствующего наблюдения в программе SPSS (Outliers). На коробчатой диаграмме в виде «усов»1 отмечаются минимальное и максимальное значения, если они не являются выбросами (Extremes и Outliers) (Бююль & Цефель, 2002 c.173). Задание. Для переменных «Физическая агрессия» (PhA), «Косвенная агрессия» (IA) и «Вербальная агрессия» (VA) в группах мальчиков (Male) и девочек (Female) даны фрагменты частотных таблиц и квартили. По этим данным рекомендуется вручную PhA IA VA 25 5.00 6.00 5.75 50 5.00 7.00 6.00 75 6.00 8.00 7.00 Percentiles Percentiles построить коробчатые диаграммы и сверить с диаграммами, полученными в SPSS. VA 25 7.00 4.00 8.75 50 8.50 5.00 10.00 75 9.00 7.00 11.00 Frequency IA Frequency 5.00 1 1.00 4 5.00 14 6.00 2 6.00 10 4.00 7 6.00 7 7.00 3 7.00 5 5.00 8 7.00 2 8.00 6 8.00 11 6.00 10.00 1 9.00 11 9.00 3 7.00 Total 30 10.00 3 Total 30 8.00 11.00 1 Total 30 a Пол Female a Пол = Male = Frequency IA 4 VA Frequency 5.00 Frequency PhA 6 VA Frequency 4.00 a Пол = Female IA a Пол = Male (мальчик) PhA a Пол = Female (девочка) PhA 4.00 6 5.00 2 5.00 1 6.00 1 6.00 10 7.00 1 3 7.00 11 8.00 3 5 8.00 2 9.00 5 2 Total 30 9.00 1 Total 30 a Пол Female 10.00 11.00 12.00 13.00 9 4 3 2 Total 30 a Пол = Male = a Пол = Male Для «Физической агрессии» построение изображено на Рис.5.3.1.2. Из Рис.5.3.1.2 видно, что уровень физической агрессии выше у мальчиков. В русскоязычной литературе коробчатые диаграммы часто называют «ящик с усами». Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 1 54 Среди девочек имеется девочка-драчунья (*24), у которой экстремально высокий уровень физической агрессии. Информация о ней поволяет разыскать ее родителей, с тем, чтобы принять меры относительно ее здоровья. Рисунок 5.3.1.2. Коробчатая диаграмма для «Физической агрессии» девочек и мальчиков: построение. Если распределение данных не отличается от нормального распределения, то разбивку данных на высокие, средние и низкие осуществляют по стандартным отклонениям (п. 3.7). В любых случаях разбивку данных на уровни можно осуществлять используя квартили (Наследов, 2004; с.43): Низкие показатели – ниже Q1 ; Средние показатели - ( Q1 ; Q3 ) ; Высокие показатели - выше Q3 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 55 Рисунок 5.3.1.3. Разбивка данных на уровни по коробчатой диаграмме. Очевидно, что более детальную разбивку можно осуществлять используя коробчатые диаграммы (Рис.5.3.1.3). В пределах «коробки» ( Q1 ; Q3 ) будут лежать средние показатели. Ниже «коробки» (ниже Q1 ) – низкие показатели. Причем для (Q1 − 1,5Q ; Q1 ) - низкие; для (Q1 − 3Q ; Q1 − 1,5Q ) - очень низкие показатели (зона Outliers); для показателей, которые меньше, чем Q1 − 3Q - чрезвычайно низкие показатели (зона Extremes), для которых соответствующие испытуемые могут быть уже представителями другой популяции («патологически недоразвитых», для признака «способности»). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 56 Выше «коробки» (выше Q3 ) – высокие показатели. Причем для (Q3 ; Q3 + 1,5Q ) высокие; для (Q3 + 1,5Q; Q3 + 3Q ) - очень высокие показатели (зона Outliers); для показателей, которые больше, чем Q3 + 3Q - чрезвычайно высокие показатели (зона Extremes), для которых соответствующие испытуемые могут быть уже представителями другой популяции («гениев», для признака «способности»). 5.3.2. Построение и редактирование коробчатых диаграмм в SPSS Data Split file Reset OK В файле Results.spv появится сообщение: SPLIT FILE OFF. Analyze Descriptive Statistics Explore Plots Plots Рисунок 5.3.2.1. Получение коробчатых диаграмм, где все переменные по-отдельности. Continue OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 57 Рисунок 5.3.2.2. Коробчатые диаграммы для переменной «Физическая агрессия». Неотредактированный рисунок. Для получения рисунка, который займет гораздо меньше места и будет более строгим (например, по вертикальной оси будут отложены целые числа, цвета на рисунке будут черно-серо-белыми), рисунок, полученный в файле Results.spv, надо отредактировать. Для этого щелкнем два раза мышью по этому рисунку и войдем в редактор рисунков (Chart Editor) (Рис.5.3.2.3), с диалоговым окном Properties. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 58 Рисунок 5.3.2.3. Редактор рисунков для переменной «FА» с диалоговым окном Properties. Рисунок 5.3.2.4. Редактор рисунков. Мышь поставлена на произвольную точку серого поля рисунка. При этом это поле выделяется. Задачей является сделать это поле белым. Для этого надо щелкнуть мышью по белому прямоугольнику окна «Properties». Apply. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 59 Рисунок 5.3.2.5. Редактор рисунков. Мышь поставлена на левую «коробку» рисунка. Два щелчка. При этом «коробка» выделяется. Задачей является сделать ее серой. Для этого надо щелкнуть мышью по серому прямоугольнику окна «Properties». Apply. Повторить это же действие с правой «коробкой», сделав ее белой (Рис.5.3.2.6). Рисунок 5.3.2.6. Редактор рисунков. Мышь поставлена на левую «звездочку». При этом «звездочка» выделяется. Задачей является сделать ее большой. Для этого в окне «Properties» надо мышью выбрать Size 15. Apply. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 60 Рисунок 5.3.2.7. Редактор рисунков. Мышь поставлена на метку «24» «звездочки» - номер девочки - драчуньи. При этом метка выделяется. Задачей является сделать метку большой. Для этого в окне «Properties» надо мышью нажать на кнопку Text Style и в изменившемся окне выбрать размеры шрифта. Наример, Prefered Size: 22, Minimum Size 22. Apply. Аналогичным образом, поочередно вставая мышью на слова «Physical Aggression» и «Gender» изменить размер их шрифта на Prefered Size: 22, Minimum Size 22. Apply. Рисунок 5.3.2.8. Редактор рисунков. Мышь поставлена на горизонтальную ось. Например, на «Female». При этом выделяются «Female» и «Male». Задачей является сделать эти буквы большими. Для этого в окне «Properties», Text Style выбрать размеры шрифта. Prefered Size: 20, Minimum Size 20. Apply. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 61 Аналогичным образом изменить размер шрифта на вертикальной оси, выбрав Prefered Size: 18, Minimum Size 18. Apply. Наконец, изменим формат числа на вертикальной оси, убрав нули после точки. Рисунок 5.3.2.9. Редактор рисунков. Мышь поставлена на вертикальную ось. Например, на «10.00». При этом выделяются все числа на оси. Задачей является сделать эти числа целыми. Для этого в окне «Properties» нажимаем на кнопку Number Format и выбираем Decimal Places: 0. Apply. После чего закрываем редактор рисунков. Копируем рисунок в файле Results.spv, переносим его в Word и уменьшаем. В результате получается Рис.5.3.2.10. Все дальнейшие рисунки, приведенные в данном конспекте, будут отредактированными. Основные идеи редактирования были показаны при редактировании рисунка 5.3.2.2. Дальнейшие ситуации, которые могут возникнуть в процессе редактирования, придется осваивать читателю самостоятельно. В результате получим коробчатые диаграммы для всех переменных (Рис.5.3.2.10) – (5.3.2.17). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 62 Рисунок 5.3.2.10. Коробчатые диаграммы для переменной «Physical Aggression» (физическая агрессия). Рисунок 5.3.2.11. Коробчатые диаграммы для переменной «Indirect Аggression» (косвенная агрессия). Рисунок 5.3.2.12. Коробчатые диаграммы для переменной «Irritation» (раздражение). Рисунок 5.3.2.13. Коробчатые диаграммы для переменной «Negativism» (негативизм). Рисунок 5.3.2.14. Коробчатые диаграммы для переменной «Resentment» (обида). Рисунок 5.3.2.15. Коробчатые диаграммы для переменной «Suspicion» (Подозрительность). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 63 Рисунок 5.3.2.16. Коробчатые диаграммы для переменной «Verbal Аggression» (вербальная агрессия). Рисунок 5.3.2.17. Коробчатые диаграммы для переменной «Guilt» (Чувство вины). Коробчатую диаграмму для всех переменных на одном рисунке (Рис. 5.3.2.18) можно получить так: Analyze Descriptive Statistics Explore Plots Plots Dependents Together Continue OK Рисунок 5.3.2.18. Коробчатая диаграмма, для всех переменных вместе. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 64 Для получения информации о выбросах на коробчатых диаграммах (например, для переменной “Physical Aggression”), надо выполнить следующие действия. Analyze Descriptive Statistics Explore (оставит только переменную “Physical Aggression”) Statistics Statistics Статистические показатели Descriptives уже вычислены, поэтому флажок для них можно снять. Установим флажок для выбросов: Outliers. Рисунок 5.3.2.19. Диалоговое окно Explore: Statistics Outliers Continue OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 65 Выходная информация Таблица 5.3.2.1 Фрагмент выходной таблицы «Extreme Values» Gender Case Number Value 1 24 10.00 2 19 7.00 Highest 3 22 7.00 4 4 6.00 5 7 6.00a Female 1 28 4.00 2 25 4.00 Lowest 3 17 4.00 4 13 4.00 5 8 4.00b Physical Aggression 1 38 11.00 2 31 10.00 Highest 3 36 10.00 4 50 10.00 5 32 9.00c Male 1 58 5.00 2 54 5.00 Lowest 3 43 5.00 4 41 5.00 5 55 6.00d a. Only a partial list of cases with the value 6.00 are shown in the table of upper extremes. b. Only a partial list of cases with the value 4.00 are shown in the table of lower extremes. c. Only a partial list of cases with the value 9.00 are shown in the table of upper extremes. d. Only a partial list of cases with the value 6.00 are shown in the table of lower extremes. Таблица 5.3.2.1 – это выходная таблица «Extreme Values»с информацией о выбросах и других максимальных (highest) и минимальных (lowest) значениях обрабатываемых данных. Выводятся по 5 наименьших и наибольших значений. 5.3.3. Диаграммы для средних значений 5.3.3.1. Построение с помощью Excel По данным описательной статистики в Excel строится Таблица 5.3.3.1.1 для средних значений: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 66 Таблица 5.3.3.1.1 Средние значения для мальчиков и для девочек Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Female 5.33 7.17 6.43 2.27 4.67 5.53 6.07 5.03 Mean 8.03 5.00 6.27 4.33 4.07 5.10 9.60 5.20 Guilt Затем строится график (Рис.5.3.3.1.1). Рисунок 5.3.3.1.1. Диаграмма для средних значений. 5.3.3.2. Построение с помощью SPSS Образуем новый файл с данными Data_Factor.sav, предварительно подготовив их в Excel (Aggression_Data_Factor.xlsx). Данные надо ввести по-другому: образовать новую переменную (factor) и группирующую переменную для ее уровней fac_ind (1- Physical Aggression, 2- Indirect Aggression, 3- Irritation, 4- Negativism, 5- Resentment, 6- Suspicion and Distrust, 7- Verbal Aggression, 8- Guilt) (Рис.5.3.3.2.1-5.3.3.2.3). Graphs Legacy Dialogs2 Bar (Рис.5.3.3.2.4) Clustered Define 2 То, что взято из более старых версий SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 67 В появившемся окне «Define Clustered Bar: Summaries for Groups of Cases» распределить переменные Factor[f_ind] в окно «Category Axis», группирующую переменную «Gender» в окно «Define Clusters by», переменную Factor [f] в окно «Variable». Получившийся вид окна изображен на Рис.5.3.3.2.5. OK. Рисунок 5.3.3.2.1. Ввод данных с переменной «factor» и с группирующей переменной «fac_ind». Рисунок 5.3.3.2.2. Описание группирующей переменной «fac_ind». Рисунок 5.3.3.2.3. Окно значений переменной «factor» и «f_ind». группирующей переменной Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 68 Рисунок 5.3.3.2.4. Окно «Bar Charts» для выбора построения кластерной диаграммы средних значений. Рисунок 5.3.3.2.5. Окно «Define Clustered Bar: Summaries for Groups of Cases». Все переменные распределены по окнам. Нажать на кнопку Options Появится окно – Рис.5.3.3.2.6. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 69 Display error bars Standard deviation Multiplier 1.0 Рисунок 5.3.3.2.5. Окно «Options». OK Рисунок 5.3.3.2.6. Диаграмма для средних значений, построенная и отредактированная с помощью SPSS. В файле Results.spv появится нужный график (Рис.5.3.3.2.6.), на котором изображен отредактированный график для средних значений: изменен цвет фона и столбиков, числа Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 70 на вертикальной оси округлены до целых, все буквы увеличены для того, чтобы график после сжатия был бы читаемым. C тем же самым файлом можно получить коробчатую диаграмму, сгруппированную также, как и диаграмма средних значений – по полу. Graphs Legacy Dialogs Boxplot... (Рис.5.3.3.2.7) Clustered Define Рисунок 5.3.3.2.7. Окно «Bar Charts» для выбора построения кластерной диаграммы средних значений. Рисунок 5.3.3.2.8. Окно « Define Clustered Boxplot: Summaries for Groups of Cases». Все переменные распределены по окнам. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 71 В появившемся окне «Define Clustered Boxplot: Summaries for Groups of Cases» распределить переменные Factor[f_ind] в окно «Category Axis», группирующую переменную «Gender» в окно «Define Clusters by», переменную Factor [f] в окно «Variable». Получившийся вид окна изображен на Рис.5.3.3.2.8. OK В файле Result_Aggression.spv появится нужный график (Рис.4.3.3.2.9.), на котором изображена отредактированная коробчатая диаграмма. Рисунок 5.3.3.2.9. Коробчатая диаграмма, построенная и отредактированная с помощью SPSS. 6. Распределения 6.1. Случайные величины Случайной величиной, называется переменная, которая в результате испытания принимает одно из возможного множества своих значений, какое именно – заранее неизвестно. Случайные величины принято обозначать большими (прописными) буквами латинского алфавита: X, Y, Z,..., а их значения - маленькими (строчными) буквами: x, y, z... Случайные величины бывают двух видов: 1) дискретными (прерывными); Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 72 2) непрерывными. Рассмотрим дискретные случайные величины. Случайная величина называется дискретной, если значения которые она может принимать образуют дискретный ряд чисел, конечный или бесконечный. Например, дискретной случайной величиной можно считать: - количество студентов на лекции; - количество цыплят, вылупившихся за ночь; - оценку, полученную на экзамене. Соответствие между всеми возможными значениями дискретной случайной величины и их вероятностями называется законом распределения вероятностей данной случайной величины. Непрерывной случайной величиной называют переменную, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Например, непрерывной случайной величиной можно считать: - продолжительность жизни; - расход воды за месяц; - дальность полета пули. Значения дискретной случайной величины можно прогнозировать до испытания. Например, количество студентов на лекции. А продолжительность жизни нельзя. Непрерывная случайная величина может принимать все значения из некоторого промежутка. Число ее возможных значений бесконечно. Однако, вероятность того, что значение непрерывной случайной величины будет равняться в точности любому заданному числу x равна нулю. Поэтому находят вероятность того, что значение, принятое непрерывной случайной величиной X в данном испытании окажется в некотором интервале [ a; b ] . Эту вероятность обозначают P ( a ≤ X ≤ b ) или Р( a < X < b). Распределением вероятностей непрерывной случайной величины называют закон, с помощью которого можно найти вероятность того, что ее значение окажется после испытания в интервале [ a; b ] . Этот закон задают с помощью функции плотности распределения вероятностей y = f ( x ) (probability density function, PDF). Вероятность того, Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 73 что значение непрерывной случайной величины X окажется в интервале [ a; b ] вычисляют по формуле: b P ( a ≤ X ≤ b ) = ∫ f ( x )dx . (6.1.1) a Символ в правой части равенства (6.1.1) называют определенным интегралом от функции y = f ( x ) по промежутку [ a; b ] . Определенные интегралы изучают в разделе высшей математики «Математический анализ». Интегралы, которые используются в теории вероятностей и в математической статистике, как правило, вычисляют с помощью компьютерных программ. Функция f ( x ) должна удовлетворять трем основным требованиям: 1) f ( x ) ≥ 0 - быть неотрицательной; 2) Быть такой, чтобы интеграл в правой части формулы (6.1.1) существовал; 3) P ( −∞ < X < +∞ ) = +∞ ∫ f ( x )dx = 1 как вероятность достоверного события, что после −∞ испытания, случайная величина X примет одно значение x ∈ ( −∞; + ∞ ) . График функции y = f ( x ) называют кривой распределения. Определенный интеграл (6.1.1), равный вероятности P ( a ≤ X ≤ b ) равен площади фигуры S, ограниченной сверху кривой распределения и опирающейся на отрезок [ a; b ] (Рис.6.1.1). Поэтому P ( a ≤ X ≤ b) = S . (6.1.2) Площадь между всей кривой распределения и осью Ох равна единице, так как она совпадает с вероятностью достоверного события. Рисунок 6.1.1 Площадь заштрихованного участка под кривой распределения совпадает с вероятностью: S = P ( a ≤ X ≤ b ) . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 74 Наиболее часто в математической статистике используют нормальное распределение, распределение «Хи-квадрат, t-распределение Стьюдента и f-распределение Фишера-Снедекора. Рассмотрим их подробнее. 6.2. Нормальное распределение Normal Distribution Функция плотности распределения вероятностей для нормального распределения: f ( x) = 1 σ 2π e − ( x−µ ) 2σ 2 2 (6.2.1) В формуле (6.2.1) присутствуют: 1) два знаменитых иррациональных числа (бесконечные непериодические десятичные дроби) число «пи»: π = 3.141592653589790... и число Эйлера «е»: e = 2.718281828459050... ; 2) параметр µ , в точности равный математическому ожиданию (выборочный аналог которого – среднее арифметическое) непрерывной случайной величины Х, вычисленному с помощью соответствующего интеграла; 3) параметр σ , в точности равный стандартному отклонению (выборочный аналог которого – выборочное стандартное отклонение) непрерывной случайной величины Х, вычисленному с помощью соответствующего интеграла. Нормальное распределение описывается двумя параметрами: µ и σ . Кривую нормального распределение (график функции y = f ( x ) ) называют кривой Гаусса. Она имеет форму колокола (Рис.6.2.1). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 75 y y= 1 1 σ 2π e − ( x − µ )2 2σ 2 σ 2π x µ − 3σ µ − 2σ µ −σ µ µ +σ µ + 2σ µ + 3σ Рисунок 6.2.1. Кривая Гаусса для нормального распределения с параметрами µ и σ . Для нормального распределения справедлив закон «трех стандартных отклонений» или закон «трех сигма» («3 σ »): Отклонения нормально распределенной случайной величины от ее математического ожидания µ не превышают 3σ . Вероятность того, что значения нормально распределенной случайной величины Х, попадут в интервал ( µ − σ ; µ + σ ) , равна .6827 или 68.27%. Вероятность того, что значения нормально распределенной случайной величины Х, попадут в интервал ( µ − 2σ ; µ + 2σ ) , равна .9545 или 95.45%. Вероятность того, что значения нормально распределенной случайной величины Х, попадут в интервал ( µ − 3σ ; µ + 3σ ) , равна .9973 или 99.73%. Вероятность того, что значения нормально распределенной случайной величины отклонятся от µ в обе стороны на величину меньше 3σ равна .9973. Вероятность того, что отклонения от µ на величину больше 3σ ничтожно мала: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 76 1-.9973 = .0027 или 0.27%. y σ 1 2π 0.341 0.341 0.136 0.136 x 0.022 0.022 µ µ −σ 0.6827 µ +σ 0.9545 µ − 2σ µ + 2σ 0.9973 µ − 3σ µ + 3σ Рисунок 6.2.2. Иллюстрация к закону «трех сигма» 6.3. Распределение «Хи-квадрат» ( χ 2 ) Chi-Square Distribution or χ 2 - Distribution Распределение «Хи-квадрат» впервые было описано немецким геодезистом, математиком и астрономом Фридрихом Робертом Хельмертом (Friedrich Robert Helmert) в 1875-1876 годах (Айвазян, 1983)3,4. В Германии это распределение традиционно известно как распределение Хельмерта. В связи с гауссовской теорией ошибок Хелмерт исследовал суммы квадратов k независимых стандартно нормально распределенных случайных величин. Распределение «Хи-квадрат» было независимо вновь открыто английским Айвазян, С. А. (1983). Прикладная статистика. Основы моделирования и первичная обработка данных. Москва: «Финансы и статистика». С.190. 4 https://en.wikipedia.org/wiki/Chi-squared_distribution Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 77 лекций. 3 математиком Карлом Пирсоном в контексте критерия согласия «хи-квадрат», опубликованного им в 1900 году. Название "хи-квадрат" происходит от стенографии Пирсона, который использовал букву греческого алфавита χ (русская транскрипция – «Хи», английская - Chi): χ 2 . Идея семейства "хи-квадрат распределений" была развита Рональдом Фишером (см.п. 6.5) в 1920-е годы. Сейчас распределение "хи-квадрат" носит имя Пирсона. 0.9 y Chi-square(1) Chi-square(2) Chi-square(3) Chi-square(5) Chi-square(10) Chi-square(20) y = Chi − square ( k ) 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 x 5 10 15 20 25 Рисунок 6.3.1. Кривые распределения χ 2 ( 30 35 40 y = Chi − square ( k ) ) для числа степеней свободы 1, 2, 3, 5, 10, 20. Функция плотности распределения вероятностей для распределения χ 2 5: y= 1 k 2 Γ  2 k 2 k −1 − x x2 e 2 , (6.3.1) где Г(x) специальная (не элементарная) функция, которая определяется через несобственный интеграл и называется гамма-функцией6; 5 В названии распределения использована греческая буква χ - «хи». Г( ) = ∫ Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 6 78 k = df (degrees of freedom) – параметр распределения χ 2 , который называется числом степеней свободы. Распределение χ 2 описывается одним параметром - числом степеней свободы k =df. Кривые распределения χ 2 для некоторых k=df показаны на Рис.6.3.17. 6.4. Распределение Стьюдента или t-распределение Student’s Distribution or t- distribution Распределение Стьюдента было разработано английским химиком и статистиком Уильямом С. Госсетом (William S. Gosset), когда он работал сотрудником ирландского отделения пивоваренной компании Guinness. Компания Guinness запрещала своим сотрудникам публиковать работы под собственными именами. Поэтому свои публикации Уильям С. Госсет начиная с 1908 года в журнале "Биометрика" писал под псевдонимом "Student", что в переводе означает "Студент". Функция плотности распределения вероятностей для t-распределения Стьюдента: y= Γ ( k + 1) 1 , ⋅ k +1 k 2 x πk ⋅Γ     2  1 + k    (6.4.1) где Г(x) специальная функция, которая определяется через несобственный интеграл и называется гамма-функцией; k = df (degrees of freedom) – параметр распределения t, который называется числом степеней свободы. t-распределение Стьюдента описывается одним параметром - числом степеней свободы k =df. Кривые распределения t для некоторых k=df показаны на Рис.6.4.1. Внешне t-распределение Стьюдента напоминает стандартизованное нормальное распределение (частный случай нормального распределения, когда μ=0, σ=1). Оба 7 https://en.wikipedia.org/wiki/Chi-squared_distribution Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 79 распределения имеют колоколообразную форму и являются симметричными. Однако хвосты в t-распределении «тяжелее» (т.е. ограничивают большую площадь), а площадь фигуры в центре распределения меньше, чем у стандартизованного нормального распределения (Рис.6.4.1). Yjhvfkmyjt 0.4 Y Нормальное распределение k = 16 k =4 0.3 k=2 k =1 0.2 0.1 X -3 -2 -1 1 2 3 Рисунок 6.4.1. Кривая Гаусса (стандартизованное нормальное распределение) и кривые t- распределения Стьюдента с числом степеней свободы k = 1 , k = 2 , k = 4 , k = 16 . 6.5. Распределение Фишера-Снедекора или f-распределение Fisher-Snedecor’s Distribution or f-distribution Два самых выдающихся статистика XX столетия непосредственно причастны к получению f-распределения. Один - крупнейший английский статистик Рональд Фишер (1890-1962), предложивший первые теоретические формулировки, которые были опубликованы в середине 20-х годов (Fisher, 1925). Другой - Джордж Снедекор (1881-1974), один из плеяды первых американских статистиков, разработавший способ сравнения двух независимых выборок любого объема посредством вычисления отношения двух оценок дисперсии. Он назвал это отношение f-отношением, в честь Фишера. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 80 Функция плотности распределения вероятностей для f-распределения ФишераСнедекора: k1  k  2 k1 −1  k y= ⋅  1  x 2 1 + 1 k k  k  k2 Β 1 , 2   2  2 2 1  x  − k1 + k2 2 , (6.5.1) где B(x) - специальная функция, которая определяется через несобственный интеграл и называется бета-функцией8; k1 = df1, k2 = df2 (degrees of freedom) – параметры распределения f, которые называются степенями свободы. Рисунок 6.5.1. Кривые f-распределения Фишера-Снедекора: F1,1, F2,1, F5,2, F10,1, F100,100,. На рисунке обозначено: d1=k1, d2=k2. Кривые распределения f для некоторых k1 = df1, k2 = df2 ( Рис.6.5.19. , ) показаны на 7. Проверка статистических гипотез с помощью SPSS 7.1. Виды статистических гипотез Гипотеза происходит от греческого слова hypothesis - основание, основа. Статистической гипотезой называют предположение о свойствах популяции совокупности. Статистическую гипотезу подтверждают или отвергают методами математической статистики на основе выборочных данных. ( , )=∫ (1 − ) https://upload.wikimedia.org/wikipedia/commons/thumb/7/74/F-distribution_pdf.svg/1200px-Fdistribution_pdf.svg.png Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 8 9 81 Одновременно выдвигаются нулевая (основная) гипотеза H 0 и противоречащая ей альтернативная гипотеза H 1 : Нулевая гипотеза H 0 всегда о том, что различия в популяции нулевые. В выборке статистически значимых или существенных отличий нет. Все имеющиеся различия несущественны, их можно объяснить случайными обстоятельствами. Альтернативная (конкур ирующая) гипотеза H 1 о том, что в популяции имеются различия. В этом случае в выборке различия статистически значимые. Это закономерно и не может быть объяснено случайными причинами. Альтернативная гипотеза – это то, что очень часто исследователь хочет доказать, поэтому ее иногда называют экспериментальной гипотезой. Альтернативная гипотеза может быть направленной или ненаправленной. В Примерах 1-3 выборочная дисперсия отличается от гипотетической10 дисперсии. Возникает вопрос: являются ли эти различия случайными или закономерными? Случайные различия в выборке означают отсутствие различий в популяции. Закономерные различия в выборке говорят о различиях в популяции. Пример 1 H 0 : Выборочная дисперсия дисперсии σ 02 =15.00; H 1 : Выборочная дисперсия закономерно. х =25.34 х =25.34 имеет случайное отличие от гипотетической отличается от гипотетической дисперсии σ 02 =15.00 При справедливости H0 различие может быть объяснено случайными причинами. При справедливости быть H1 различие закономерно и не может быть объяснено случайными причинами. В Примере 1 альтернативная гипотеза является ненаправленной (nondirectional). предполагаемой Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 10 82 Пример 2 H0 : Выборочная дисперсия дисперсии σ 02 =15.00; H1 : Выборочная дисперсия закономерно. х =25.34 х =25.34 имеет случайное отличие от гипотетической превышает от гипотетическую дисперсию σ 02 =15.00 Пример 3 H0 : Выборочная дисперсия дисперсии σ 02 =15.00; H1 : Выборочная дисперсия закономерно. х =12.51 имеет случайное отличие от гипотетической х =12.51 меньше гипотетической дисперсии σ 02 =15.00 В Примерах 2 и 3 альтернативная гипотеза является направленной (directional). Замечание. Те же самые гипотезы могут быть сформулированы для популяции. Параметры популяции обычно обозначают буквами греческого алфавита. Дисперсию популяции обозначим записаны следующим образом. . Тогда для Примеров 1-3 гипотезы могут быть Пример 1. Пример 2. Пример 3. H 0 : σ 2 = σ 02 H 0 : σ 2 = σ 02 H 0 : σ 2 = σ 02 H 1 : σ 2 ≠ σ 02 , H 1 : σ 2 > σ 02 , H1 : σ 2 < σ 02 , где σ 02 =15.00, х =25.34. где σ 02 =15.00, х =25.34. где σ 02 =15.00, х =12.51. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 83 7.2. Ошибки 1-ого и 2-ого рода Статистическая проверка гипотез, в основе которой лежат выборочные результаты, неизбежно связана с риском принять ошибочное решение. Возможны два вида ошибок. Ошибка 1-ого рода. Отклонить правильную нулевую гипотезу H 0 (α-error, type I error ). Ошибка 2-ого рода. Принять неправильную нулевую гипотезу H 0 (β-error, Type II error). Вероятность ошибки 1-ого рода называют уровнем значимости (significance level) и обозначают буквой греческого алфавита α . Обычно рассматривают уровни значимости α = .05 , α = .01 и α = .001. Если α = .05 - то это значит, что в 5 случаях из 100 имеется риск отвергнуть правильную нулевую гипотезу. Когда указывают, что различия достоверны на уровне значимости α = .01 , то имеют в виду, что вероятность того, что они все-таки недостоверны, не превышает .01 (или 1%). Вероятность ошибки 2-ого рода обозначают через β . Возможны 4 случая (Таблица 7.2.1). Таблица 7.2.1 (Howell, 1999; P.133) Возможные результаты процесса принятия решений Истинное состояние H0 Верна H 0 Неверна Решение Нет оснований отвергнуть Отвергается Правильное решение Ошибка 1-ого рода р = 1-α p=α Ошибка 2-ого рода Правильное решение p=β p = 1-β=мощность (power) Замечание. p – вероятность. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 84 Вероятность ошибки 1-ого рода называют уровнем значимости (significance level) и обозначают буквой греческого алфавита α . Обычно рассматривают уровни значимости α = .05 , α = .01 и α = .001. Если α = .05 - то это значит, что в 5 случаях из 100 имеется риск отвергнуть правильную нулевую гипотезу. Когда указывают, что различия достоверны на уровне значимости α = .01 , то имеют в виду, что вероятность того, что они все-таки недостоверны, не превышает .01 (или 1%). Вероятность ошибки 2-ого рода обозначают через β . 7.3. Статистический критерий Критерий - от греческого слова criterion - средство для суждения - признак, на основании которого производится оценка, средство проверки, - мерило оценки. Для проверки нулевой гипотезы ( H 0 - гипотезы об отсутствии различий) используют специально подобранную случайную величину, которую называют статистическим критерием или просто критерием. При справедливости нулевой гипотезы эта случайная величина имеет определенное распределение плотности вероятностей (стандартизованное нормальное: z- распределение, распределение хи-квадрат (chi-square distribution), t-распределение Стьюдента, f-распределение Фишера-Снедекора или другие распределения). Кривая плотности распределения, как правило, имеет вид колокола – симметричного или скошенного (Рисунки п.6). Наблюдаемое или эмпирическое значение критерия – это значение критерия, вычисленное по выборочным данным. Также принято критерий называть тестом, а его эмпирическое значение - статистикой. 7.4. Критическая область. Критические точки Множество всех возможных значений статистики делится на две области. Критической областью (critical region, regection region) называют совокупность значений статистики, при которой нулевую гипотезу отвергают. Областью областью принятия гипотезы (acceptance region) называют совокупность значений статистики, при которых нулевую гипотезу нет оснований отвергнуть. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 85 Критическими точками называют точки, отделяющие критическую область от области принятия гипотезы (Рис.7.4.1). Критической области соответствуют значения статистики, которые наименее вероятны - так называемые, «хвосты» распределения. Критические точки находятся по уровню значимости α и по параметрам соответствующих распределений из специальных таблиц или с помощью компьютерных программ. Обычно их обозначают kα , или более конкретно, например: . при α = 0.05. Вместо буквы k обычно пишут букву, соответствующую распределению случайной величины ( z ; χ 2 ; t ; f и др.) Рисунок 7.4.1. Кривая распределения. На горизонтальной оси отложены наблюдаемые значения критерия К – статистики, kα – критические точки. (a) – правоторонняя критическая область (one-tailed), площадь правого «хвоста» равна α; (b) – левоторонняя критическая область (one-tailed), площадь левого «хвоста» равна α; (с) – двухсторонняя критическая область (two-tailed), площадь каждого «хвоста» равна α/2. В зависимости ненаправленной), от различают вида альтернативной «односторонние гипотезы гипотезы» (направленной (one-tailed test) – или для направленных гипотез и «двусторонние гипотезы» (two-tailed test) – для ненаправленных Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 86 гипотез. Односторонние гипотезы, бывают левосторонними (left-tailed) и правосторонними (right-tailed). В соответствии с этим определяются правосторонняя (one-tailed), левосторонняя (one-tailed) и двухсторонняя (two-tailed) критические области (Рис.7.4.1). После вычисления значения статистики для имеющейся выборки, смотрят, в какую из этих двух областей попало это вычисленное значение. Если оно попало в критическую область, то нулевая гипотеза отвергается. Если значение статистики попало в «область принятия гипотезы Н0», то делается вывод о том, что нет оснований отклонить нулевую гипотезу. Пример 4. Выборка, объема n = 17 взята из популяции, в которой признак имеет нормальное распределение. Выборочная дисперсия равна х =25.34. Гипотетическая дисперсия равна σ 02 =15.00. Сравнить выборочную дисперсию с гипотетической дисперсией. Решение Из математической статистики следует, что для сравнения выборочной дисперсии с гипотетической дисперсией следует использовать критерий χ 2 , наблюдаемое значение (статистика) которого вычисляется по формуле (Гласс & Стенли, 1976; сс.279-280). χ 2 = (n − 1) s x2 . σ 02 (7.4.1) Вычислим значение χ 2 - статистики: Нулевая гипотеза: =(17 − 1) . . = 27.03. H 0 : σ 2 = σ 02 , где 11 − дисперсия популяции11. Эквивалентная формулировка нулевой гипотезы: H0 : Выборочная дисперсия х =25.34 имеет случайное отличие от гипотетической дисперсии σ 02 =17.00; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 87 Случайная величина χ 2 при справедливости нулевой гипотезы распределение χ 2 с df=n-1 степенями свободы. Дальнейший ход решения задачи предполагает рассмотрение двух вариантов: направленной и ненаправленной альтернативных гипотез. Случай 1. (Направленная альтернативная гипотеза) H 1 : σ 2 > σ 02 12 В этом случае рассматриваем правостороннюю критическую область, уровни значимости α = .05, α = .01. α = .001 и число степеней свободы df = 17-1 = 16. Дальнейшее решение задачи проведем с помощью компьютерной программы Excel. 7.5. Нахождение критических точек с помощью компьютерной программы Excel Получим критическую точку распределения χ 2 для уровня значимости р=.05 и числа степеней свободы df = 16 c помощью Excel. Встанем на ячейку, в которой хотим получить ответ. Например, в С3 (Рис.7.5.1). Рисунок 7.5.1. Получение критических точек распределения χ 2 . Выбор ячейки Formulas fx 12 Insert Function … H1 : Выборочная дисперсия х =25.34 превышает от гипотетическую дисперсию σ 02 =15.00 закономерно. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 88 В появившемся окне найдем функцию CHISQ.INV.RT (Рис.7.5.2). В появившемся окне зададим уровень значимости α: р = 0.05 (Probability) и число степеней свободы df = 16 (Deg_freedom) (Рис.7.5.3). Таким образом, критическое значение для уровня значимости α = .05 и числа степеней свободы 16 равно 26.2962276. Округляя получаем: Аналогично находим: . . = 26.30. Вычисленная статистика : = 32.00, . = 39.25. =27.03. Справедливо неравенство (Рис.7.4.2): . ≤ < . Рисунок 7.5.2. Выбор функции CHISQ.INV.RT OK Рисунок 7.5.3. Задание уровня значимости (Probability) и числа степеней свободы (Deg_freedom). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 89 OK В ячейке С3 появится ответ (Рис.8.5.4). Рисунок 7.5.4. Вычисленная в ячейке С3 критическая точка распределения χ 2 для уровня значимости р = .05 и числа степеней свободы df = 16 . Вычисленная статистика оказалась в критической области для уровня значимости α=.05. Поэтому нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Рисунок 7.5.5. Правосторонняя критическая область для Примера 4. Ответ: Была использована правосторонняя альтернативная гипотеза. Выборочная дисперсия х =25.34 статистически значимо превышает гипотетическую дисперсию σ 02 = 17.00. Значение статистики Chi-square (16) = 27.03. Уровень значимости α = .05. Случай 2. (Ненаправленная альтернативная гипотеза) H 1 : σ 2 ≠ σ 02 В этом случае рассматриваем двухстороннюю критическую область, уровни значимости α = .05, α = .01, α = .001 и число степеней свободы df = 17-1 = 16. Для того, чтобы найти левую критическую точку, перед которой площадь, ограниченная кривой распределения и осью Ох (Рис.7.4.1 (с), критическая точка kα1), равна α/2. Чтобы ее найти надо подставить Probability = 1- α/2 = 1-0.05/2 = 0.975 (Рис.7.5.6). Результат вычисления . ( ) = 6.91. Для α = .01, Probability = 1- α/2 = 1-.01/2 = .995, для α = .001, Probability = 1- α/2 = 1-.001/2 = .9995. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 90 Критические точки: . = 5.14, ( ) . ( ) = 3.54. Для того, чтобы найти правую критическую точку, за которой площадь, ограниченная кривой распределения и осью Ох (Рис.7.4.1 (с), критическая точка kα2), равна α/2. Чтобы ее найти надо подставить в Probability = α/2 = .05/2 = .025 (как на Рис.7.5.5). Результат вычисления . ( ) = 28.85. Для α = .01, Probability = α/2 = .01/2 = .005, для α = .001, Probability = α/2=.001/2=.0005. Критические точки: . ( ) = 34.27, . ( ) = 41.31. Рисунок 7.5.6. Вычисление левой критической точки для двухсторонней критической области. Вычисленная статистика =27.03 принадлежит области принятия нулевой гипотезы, так как справедливо неравенство (Рис.7.5.5): 6.91 = . ( ) < < . ( ) = 28.85 Поэтому нет основания отвергнуть нулевую гипотезу. Различия между выборочной дисперсией и гипотетической дисперсией не найдены. Рисунок 7.5.7. Двухсторонняя критическая область для Примера 4. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 91 Ответ: Была использована двухсторонняя альтернативная гипотеза. Статистически значимых различий между выборочной дисперсией σ 02 =17.00 не найдено. х =25.34 и гипотетической дисперсией Из Примера 4 видно, что «двухвостовый» тест является более строгим, чем «однохвостовый». Чтобы вычислить с помощью Excel критические точки для других распределений, используют функции: • CHISQ.INV.RT(Probability, df) для распределения «Хи-квадрат», one-tailed; • F. INV.RT(Probability, df1, df2) для F-распределения, one-tailed; • T. INV.RT(Probability, df) для t-распределения, one-tailed; • T. INV.2T(Probability, df) для t-распределения, two-tailed; • Для стандартизованного нормального распределения критические точки для правосторонней критической области равны: z.05 = 1.64 , z.01 = 2.33 , z.001 = 3.09 ; для двухсторонней критической области: z.05 = 1.96 , z.01 = 2.58 , z.001 = 3.29 . 7.6. р-value Для проверки стптистических гипотез можно использовать не только критические области и критические точки, но также p-value (p-вероятность, р-значение), которая вычисляется для конкретных значений статистики – наблюдаемого значения критерия. Формально р-value определяется (и вычисляется) следующим образом. Пусть случайная величина К является критерием, который используется для проверки нулевой гипотезы. Предполагается, что при справедливости нулевой гипотезы распределение этой случайной величины известно. Наблюдаемое значение критерия или Кстатистику обозначим через Кe. Для правосторонней альтернативной гипотезы р-value определяется как вероятность того, что значения случайной величины К будут либо равны вычисленной статистике Кe, либо больше ее (Рис.7.6.1): Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 92 р-value = Р(K≥Ke). (7.6.1) Для левосторонней альтернативной гипотезы р-value определяется как вероятность того, что значения случайной величины К будут либо равны вычисленной статистики Кe, либо меньше ее: (Рис.7.6.2) р-value = Р(K≤Ke). (7.6.2) Для двухсторонней альтернативной гипотезы р-value определяется как как удвоенная наименьшая вероятность из двух вероятностей Р(K≤Ke) и Р(K≥Ke): р-value = 2 min{Р(K≤Ke), Р(K≥Ke)}. (7.6.3) Таким образом, р-value – это вероятность того, что не следует отклонять нулевую гипотезу, или вероятность ошибки при отклонении нулевой гипотезы. р-value - это вероятность того, что обнаруженное различие носит случайный характер. Если эта вероятность большая, то различие случайное. Нет оснований отклонить нулевую гипотезу. Например р = .68. Если эта вероятность маленькая, то различия неслучайные, а закономерные. Нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Например, р = .002. 7.6.1. Определение p-value (площадь заштрихованной области под кривой распределения) для правосторонней альтернативной гипотезы: Рисунок р-value = Р(K≥Ke). 7.6.2. Определение p-value (площадь заштрихованной области под кривой распределения) для левосторонней альтернативной гипотезы: Рисунок р-value = Р(K≤Ke). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 93 Чем меньше р-value, тем надежнее найденное различие. p-value сравнивают с общепринятыми уровнями значимости α = .05, α = .01 или α = .001. Если в результате применения статистического теста p-value окажется меньше, чем выбранный уровень значимости, то нулевая гипотеза отвергается и принимается альтернативная гипотеза. А если p-значение окажется больше заданного уровня значимости, то нет оснований отвергнуть нулевую гипотезу. Это не означает, что нулевая гипотеза истинна, просто не хватает аргументов, чтобы ее отвергнуть. Исторически сложилось так, что принято считать (Бююль & Цефель, 1976; сс. 8788): 1) p > .05 - различия случайны; 2) α = .05 (или p ≤ .05 ) – различия значимы; 3) α = .01 (или p ≤ .01 ) – различия очень значимы; 4) α = .001 (или p ≤ .001) – различия максимально значимы. Чем меньше значение р, тем сильнее аргументы против нулевой гипотезы. В некоторых статистических компьютерных программах (в том числе и в SPSS) pvalue обозначают через Sig. (significance). 7.7. Вычисление р-value с помощью компьютерной программы Excel Пример 4. (См. пп.7.4-7.5) Выборка, объема n = 17 взята из популяции, в которой признак имеет нормальное распределение. Выборочная дисперсия равна х =25.34. Гипотетическая дисперсия равна σ 02 =15.00. Сравнить выборочную дисперсию с гипотетической дисперсией. Решение Из математической статистики следует, что для сравнения выборочной дисперсии с гипотетической дисперсией следует использовать критерий χ 2 , наблюдаемое значение (статистика) которого вычисляется по формуле (Гласс & Стенли, 1976. Сc. 279-280). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 94 χ 2 = (n − 1) s x2 . σ 02 (7.4.1) Вычислим значение χ 2 - статистики: . =(17 − 1) Нулевая гипотеза: . = 27.03. H 0 : σ 2 = σ 02 , где − дисперсия популяции13. Случайная величина χ 2 при справедливости нулевой гипотезы распределение χ 2 с df = 17-1 = 16 степенями свободы. Дальнейший ход решения задачи предполагает рассмотрение двух вариантов: направленной и ненаправленной альтернативных гипотез. Случай 1. (Направленная альтернативная гипотеза) H 1 : σ 2 > σ 02 14 Для вычисленной статистики p-value. Открываем программу = 27.03 , число степеней свободы df = 16. Находим Excel. На верхней панели выбираем функцию СHISQ.DIST.RT, появляется окно, в которое вводим информацию Х = 27.03, Deg_freedom = 16 (Рис.7.7.1), OK. В соответствующей ячейке появляется число, равное р-значению (Рис.7.7.2): р = .041. 13 Эквивалентная формулировка нулевой гипотезы: H0 : Выборочная дисперсия х =25.34 дисперсии σ =17.00; 2 H1 : Выборочная дисперсия =15.00 закономерно. 14 х имеет случайное отличие от гипотетической =25.34 превышает от гипотетическую дисперсию σ 02 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 95 Появляется окно gretl: p-value finder, на котором выбираем распределение chisquare, df = 16, value = 27.03 (Рис.7.7.2). ОК Имеет место неравенство р = .041 ≤ .05. Поэтому нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Рисунок 7.7.1. Окно СHISQ.DIST.RT в Excel. Рисунок 7.7.2. Найденное р-значение. Ответ: Была использована правосторонняя альтернативная гипотеза. Выборочная дисперсия х =25.34 статистически значимо превышает гипотетическую дисперсию: σ 02 = 17.00: χ2 (16) = 27.03, p = .041 ≤ .05. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 96 Случай 2. (Ненаправленная альтернативная гипотеза) H 1 : σ 2 ≠ σ 02 Это ненаправленная альтернативная гипотеза. Воспользуемся уже найденной информацией (Рис.7.7.3) . Для статистики 27.03, распределения chi-square, df = 16, p-value = .041, площадь справа от значения статистики (как на Рис.7.6.1). Площадь слева равна .959. р-value для двухвостовой альтернативной гипотезы будет равно удвоенной наименьшей из этих двух площадей: p-value = .041∗ 2 = .082 > .05. Поэтому нет оснований отклонить нулевую гипотезу. Ответ: Была использована двухсторонняя альтернативная гипотеза. Статистически значимых различий между выборочной дисперсией σ 02 =17.00 не найдено: χ2(16) = 27.03, p = .082. х =25.34 и гипотетической дисперсией p-value для других распределений Чтобы вычислить с помощью Excel p-value для других распределений, используют функции: • CHISQ.DIST.RT(number,df) для распределения «Хи-квадрат», one-tailed; • F.DIST.RT(number,df1, df2) для F-распределения, one-tailed; • T.DIST.RT(number,df) для t-распределения, one-tailed; • T.DIST.2T(number,df) для t-распределения, two-tailed; • Для стандартизованного нормального распределения one-tailed p-value: = 1 – NORM.S.DIST(number,TRUE) ENTER Это площадь под нормальной кривой справа от точки «number», то есть это one-tailed pvalue. Для нахождения two-tailed p-value, вычисленное значение one-tailed p-value надо умножить на два: two-tailed p-value = 2* one-tailed p-value Примеры будут рассмотрены в дальнейших параграфах. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 97 7.8. Мощность критерия Одни и те же задачи могут быть решены с помощью различных критериев. При этом некоторые критерии позволяют выявлять отличия там, где другие критерии не способны их выявить. Один из критериев может быть более мощным, чем другой (Сидоренко, 2000). Мощность (Power) любого теста определяется как вероятность того, что будет отвергнута ложная нулевая гипотеза. Ошибку 2-го рода совершают тогда, когда не отвергают нулевую гипотезу, если она ложна, и делают вывод, что нет эффекта (различия), тогда как в действительности эффект существует. Шанс возникновения ошибки 2-го рода обозначается β; а величина (1-β) равна мощности критерия. Мощностью критерия (рower of the test) называют вероятность того, что нулевая гипотеза H 0 будет отвергнута, если верна альтернативная гипотеза H1 . «Мощность критерия – это способность критерия выявлять различия, если они имеются», «это шанс обнаружить реальный эффект в выборке данного объема как статистически значимый» (Сидоренко, 2000). При планировании исследования, необходимо знать мощность критерия, которым исследователь собирается воспользоваться. Можно начинать исследование, если есть «хороший» шанс обнаружить эффект, если он существует. Разработана «Теория мощностей», изложенная, например, в книгах Коуэна (Cohen, 1988), Эллиса (Ellis, 2010). Мощность критерия увеличивается по мере увеличения объема выборки. Это означает, что у большей выборки больше возможностей обнаружить эффект, если он существует. Мощность критерия больше для эффектов большего размера (понятие «размер эффекта» будет рассмотрено в дальнейших параграфах). Эффекты больших размеров легче обнаружить, чем эффекты меньших размеров. Мощность критерия больше, если уровень значимости выше. Мощность критерия увеличивается по мере того, как изменчивость наблюдений уменьшается. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 98 Величина мощности используется для вычисления размера выборки, необходимой для подтверждения гипотезы с необходимым размером эффекта. 7.9. Параметрические и непараметрические критерии Существуют параметрические и непараметрические критерии. Критерий называется параметрическим, если он основан на конкретном типе распределения ГС. Критерий называется непараметрическим, если он не базируется на типе распределения ГС. (Критерий, свободный от распределения). Параметрические критерии включают в расчетную формулу параметры распределения (средние, стандартные отклонения, число степеней свободы и другие параметры в зависимости от распределения). Например, t-критерий Стьюдента, F-критерий Фишера и другие критерии. Непараметрические не включают в формулу параметров распределения. Они основаны на оперировании частотами или рангами (Сидоренко, 2000; с.27). Как у параметрических критериев, так и у непараметрических критериев есть свои преимущества и недостатки. Если параметры распределения известны, то применяются параметрические критерии как более мощные, чем непараметрические. Если параметры распределения неизвестны, то ничего не остается, как использовать непараметрические критерии. Поэтому параметрические критерии следует применять всегда, когда это возможно. Теорией вероятности установлен общий характер нормального закона распределения. Поэтому разумно предполагать, что в обычных случаях многие случайные величины имеют распределение вероятностей близкое к нормальному распределению. Поскольку свойства нормального распределения всесторонне изучены – очень важно понять, можем ли мы считать признак нормально распределенным. Непараметрические критерии можно применять для порядковых и метрических переменных независимо от распределения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 99 Параметричекие критерии в большинстве случаев корректно применять когда распределение данных не отличается от нормального распределения. Бывают случаи, когда распределение данных отличается от нормального распределения, но можно применять параметрические критерии. Основное требование – это отсутствие «выбросов», которые влияют на средние значения, дисперсии и на стандартные отклонения. Существуют и другие требования. Каждый случай, когда нет нормального распределения, а мы хотим воспользоваться параметрическим критерием следует рассматривать отдельно. 8. Проверка нормальности распределения данных Параметрические критерии применяют только тогда, когда известно, что распределение признака является нормальным. Если выборочное распределение не отличается от нормального распределения, то это значит, что измеряемое свойство удалось отразить в метрической шкале (Наследов, 2004; с.59). Если при изучении некоторого свойства мы произвели его измерение на выборке участников и получили распределение эмпирических данных, отличающееся от нормального распределения, то это значит, что либо выборка не репрезентативна популяции, либо измерения произведены не в шкале равных интервалов (Наследов, 2004; с.51). Общей причиной отклонения выборочного распределения признака от нормального распределения чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости (Наследов, 2004; с.61). 8.1. Проверка нормальности распределения данных с помощью SPSS Методы проверки соответствия распределения данных нормальному закону распределения в SPSS которыми мы будем пользоваться в рамках данного конспекта - это: 1) Сравнение абсолютных величин показателей асимметрии и эксцесса с их критическими значениями. Если хотя бы один из показателей асимметрии или эксцесса Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 100 превышает по абсолютной величине свою стандартную ошибку, то распределение данных отличается от нормального распределения; 2) Критерий Колмогорова-Смирнова; 3) Критерий Колмогорова-Смирнова (модификация Лиллифора); 4) Критерий - Шапиро-Уилкса (если объем выборки меньше 50); 5) Визуальные сравнения: - гистограммы с нормальной кривой, - квантильные диаграммы Q-Q (Normal Q-Q Plots), - Q-Q диаграммы с исключенным трендом (Detrended Normal Q-Q Plots). В SPSS есть и другие методы сравнения распределения данных с нормальным распределением. Проверка нормальности распределения данных с помощью SPSS для рассматриваемого примера о гендерных рахличиях агрессии у подростков будет рассмотрен в п.10. 8.2. Гипотезы об асимметрии и эксцессе и о соответствии распределения данных нормальному распределению Гипотезы об асимметрии Нулевая гипотеза: Распределение признака в популяции не отличается от симметричного. Альтернативная гипотеза: Распределение признака в популяции несимметричное. Для проверки нулевой гипотезы используется критерий Z – случайная величина, которая при справедливости нулевой гипотезы имеет стандартизованное нормальное распределение с математическим ожиданием µ = 0 и стандартным отклонением σ = 1 . Z – статистика вычисляется по формуле ZS = S , SES (8.2.1) где S – показатель асимметрии (Skewness), SES cтандартная ошибка асимметрии (3.10.1) (Field, 2009; p.139). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 101 С помощью программы Excel (п.7.5) можно найти критическую точку для уровня значимости α = .05. Она равна z.05 = 1.96 . Поэтому, при ZS = S SES ≥ 1.96 или при S ≥ 1.96 ∗ SES (8.2.2) выборочное распределение отличается от симметричного распределения статистически значимо на уровне значимости α = .05. Гипотезы об эксцессе Нулевая гипотеза: Распределение признака в популяции не отличается от распределения с нулевым эксцессом. Альтернативная гипотеза: Распределение признака в популяции отличаается от распределения с нулевым эксцессом. Для проверки нулевой гипотезы используется критерий Z – случайная величина, которая при справедливости нулевой гипотезы имеет стандартизованное нормальное распределение с математическим ожиданием µ = 0 и стандартным отклонением σ = 1 . Z – статистика вычисляется по формуле ZK = K , SEK (8.2.3) где K – показатель эксцесса (Kurtosis), SEK cтандартная ошибка эксцесса (3.12.1). С помощью программы Excel (п.7.5) можно найти критическую точку для уровня значимости α = .05. Она равна z.05 = 1.96 . Поэтому, при ZK = выборочное K SEK ≥ 1.96 распределение или при отличается K ≥ 1.96 ∗ SEK от распределения (8.2.4) с нулевым эксцессом статистически значимо на уровне значимости α = .05 (Field, 2009; p.139). Гипотезы о соответствии нормальному распределению Нулевая гипотеза: Распределение признака в популяции не отличается от нормального распределения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 102 Альтернативная гипотеза: Распределение признака в популяции отличаается от нормального распределения. Для проверки гипотез используем Д'Агостино-Пирсона омнибуса тест (D'AgostinoPearson Omnibus Test) (D’Agostino & Stephens, 1986; pp.390-391). В названии теста присутствует слово «омнибус» - двухэтажный автобус – так как тест использует оба показателя: асимметрию и эксцесс. Статистика теста вычисляется по формуле DP = ZS2 + ZK2 , (8.2.5) для которой соответствующая случайная величина при справедливости нулевой гипотезы подчиняется распределению «Хи-квадрат» (Chi-square) с числом степеней свободы df = 2. Существует рекомендация (Moriarty, 2015) не использовать этот тест, если объем выборки меньше 20. Пример. S= 0.460, SES = 0.111, K = 0.638, SEK = 0.222. 1. ZS = 0.460 = 4.14 ≥ 1.96 - распределение статистически значимо отличается от 0.111 симметричного распредления. Ассиметрия положительная (левосторонняя). 2. ZK = 0.638 = 2.87 ≥ 1.96 - распределение статистически значимо отличается от 0.222 распределения с нулевым эксцессом. Оно с положительным эксцессом (островершинное). 3. DP = ( 4.14) + ( 2.87 ) = 25.38 . 2 2 С помощью программы Excel (п.8.7) находим p-value для двухсторонней альтернативной гипотезы (Chi-square, df = 2). Получаем: p < .001. Распределение статистически значимо отличается от нормального распределения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 103 9. Гендерные различия агрессии у подростков. Продолжение 9.1.Проверка нормальности распределения данных 9.1.1. Стандартные ошибки асимметрии и эксцесса В таблицах показателей описательной статистики (Таблицы 5.2.1-5.2.2) были вычислены показатели асимметрии S и эксцесса K и их стандартные ошибки SES и SEK. В Таблице 9.1.1.1 показана проверка нормальности распределения с помощью асимметрии и эксцесса у мальчиков и девочек для шкал агрессии c использованием трех тестов: асимметрии (8.2.2), эксцесса (8.2.4) и D'Agostino-Pearson Omnibus Test со статистикой (8.2.5). Таблица 9.1.1.1 Проверка нормальности распределения с помощью асимметрии и эксцесса у мальчиков и Gender = male Gender = female девочек для шкал агрессии Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt S 2.03 -0.03 0.61 0.05 -0.38 0.18 -0.61 0.19 -0.60 -0.41 0.31 -1.35 0.58 0.53 -0.61 0.58 SES 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 K 6.66 -1.16 0.76 -1.20 -1.01 -0.83 -0.61 -0.59 -0.43 0.00 -0.49 0.54 -0.46 -0.93 0.33 0.05 SEK 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Z(S) Z(K) DP p 4.76 0.08 1.44 0.13 0.88 0.42 1.43 0.45 1.40 0.95 0.72 3.17 1.36 1.24 1.42 1.37 8.00 1.40 0.91 1.44 1.22 1.00 0.73 0.71 0.52 0.00 0.59 0.65 0.56 1.12 0.40 0.06 86.68 1.95 2.89 2.09 2.26 1.18 2.59 0.70 2.24 0.91 0.87 10.44 2.16 2.78 2.19 1.88 .000 .38 .24 .35 .32 .55 .27 .70 .33 .64 .65 .005 .34 .25 .33 .39 ND no no no Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует DP. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 104 9.1.2. Критерий Колмогорова-Смирнова Критерий Колмогорова-Смирнова (K-S) позволяет оценить вероятность того, что выборка принадлежит популяции с нормальным распределением. Нулевая гипотеза. Распределение данных имеет случайное отличие от нормального распределения. Альтернативная гипотеза. Распределение данных имеет закономерное отличие от нормального распределения. Как получить: Разбить данные на мальчиков и девочек по переменной Gender. Analyze Nonparametric Tests Legacy Dialogs 1-Sample K-S... Рисунок 9.1.2.1. Диалоговое окно для критерия Колмогорова-Смирнова. Появится диалоговое окно для критерия Колмогорова-Смирнова проверки нормальности распределения данных. Перенести переменные (кроме Gender) в Test Variable List (Рис.9.1.2.1). OK. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 105 Выходная информация NPar Tests Gender = Female Таблица 9.1.2.1 One-Sample Kolmogorov-Smirnov Testc PhA N Normal Parametersa,,b Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) IA 30 30 5.3333 7.1667 1.21296 1.11675 .275 .239 .275 .219 -.192 -.239 1.506 1.308 .021 .065 I 30 6.4333 .93526 .245 .245 -.188 1.342 .054 N 30 2.2667 1.01483 .232 .194 -.232 1.269 .080 R S 30 30 4.6667 5.5333 1.06134 1.38298 .257 .166 .143 .166 -.257 -.165 1.405 .910 .038 .378 VA G 30 30 6.0667 5.0333 1.22990 1.37674 .245 .176 .157 .176 -.245 -.157 1.342 .966 .054 .309 a. Test distribution is Normal. b. Calculated from data. c. Gender = Female Gender = Male Таблица 9.1.2.2 One-Sample Kolmogorov-Smirnov Testc PhA N Normal Parametersa,,b Mean Std. Deviation Most Extreme Absolute Differences Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) IA 30 30 8.0333 5.0000 1.65015 2.10090 .221 .184 .146 .133 -.221 -.184 1.210 1.006 .107 .263 I 30 6.2667 1.33735 .162 .162 -.142 .885 .414 N 30 4.3333 1.02833 .375 .258 -.375 2.054 .000 R S 30 30 4.0667 5.1000 1.22990 1.06188 .240 .217 .240 .217 -.160 -.150 1.317 1.186 .062 .120 VA G 30 30 9.6000 5.2000 2.04434 1.15669 .178 .269 .122 .269 -.178 -.165 .973 1.471 .026 .301 a. Test distribution is Normal. b. Calculated from data. c. Gender = Male Если Asymp. Sig. (2-tailed) или р ≤ .05, то распределение существенно отличается от нормального. Если р > .05, то отличие эмпирического распределения данных от нормального распределения не выявлено. Критерий Колмогорова-Смирнова оказался недостаточно мощным. Он выявил отличие распределения данных от нормального распределения лишь в 4 случаях из 16. Он не выявил отличия от нормального распределения по переменным, у которых асимметрия или эксцесс превышают свои критические значения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 106 9.1.3. Критерий Колмогорова-Смирнова в модификации Лиллифора и критерий Шапиро-Уилкса Нулевая гипотеза. Распределение данных имеет случайное отличие от нормального распределения. Альтернативная гипотеза. Распределение данных имеет закономерное отличие от нормального распределения. Как получить: (Можно не разбивать данные на мальчиков и девочек). Analyze Descriptive Statistics Explore.... Появится диалоговое окно Explore, в котором перенести в Dependent List переменные – шкалы агрессии, а переменную Dzimums[sex] перенести в окно Factor List (Рис.9.1.3.1): Рисунок 9.1.3.1. Диалоговое окно Explore. Plots Normally plots with tests Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 107 Рисунок 9.1.3.2. Заказ критериев Колмогорова-Смирнова (K-S) и Шапиро-Уилкса (S-W) c поправкой Лиллифора. Continue OK ВЫХОДНАЯ ИНФОРМАЦИЯ: Таблица 9.1.3.1 Tests of Normality Kolmogorov-Smirnova Shapiro-Wilk Gender Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt Female Statistic .275 df 30 Sig. .000 Statistic .775 df 30 Sig. .000 Male Female Male Female Male Female Male Female Male Female Male Female Male Female .221 .239 .184 .245 .162 .232 .375 .257 .240 .166 .217 .245 .178 .176 30 30 30 30 30 30 30 30 30 30 30 30 30 30 .001 .000 .011 .000 .044 .000 .000 .000 .000 .034 .001 .000 .017 .018 .897 .876 .923 .880 .933 .856 .681 .854 .887 .922 .841 .846 .938 .930 30 30 30 30 30 30 30 30 30 30 30 30 30 30 .007 .002 .032 .003 .061 .001 .000 .001 .004 .030 .000 .001 .082 .050 Male .269 30 .000 .902 30 .009 a. Lilliefors Significance Correction Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 108 В Таблице 9.1.3.1 представлены результаты двух тестов на нормальное распределение: - Лиллифора (модификация критерия Колмогорова-Смирнова); - Шапиро-Уилкса (если объем выборки меньше 50). Statistics – наблюдаемое значение критерия; df – число степеней свободы; Sig. – это р-value. При Sig. ≤ .05 распределение значимо отличается от нормального. Рисунок 9.1.3.3. Диаграммы Normal Q-Q plots. Физическая агрессия. Девочки. Рисунок 9.1.3.4. Диаграммы Normal Q-Q plots. Физическая агрессия. Мальчики. Рисунок 9.1.3.5. Диаграммы Detrended Normal Q-Q plots. Физическая агрессия. Девочки. Рисунок 9.1.3.6. Диаграммы Detrended Normal Q-Q plots. Физическая агрессия. Мальчики. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 109 Критерий Колмогорова-Смирнова с поправкой Лиллифора оказался самым мощным: он выявил 16 отличий эмпирического распределения данных от нормального распределения данных в 16 случаях из 16 возможных. Критерий Шапиро-Уилкса нашел только 15 различий. Найденные различия выделены в таблице «Tests of Normality» в редакторе программы SPSS, который появляется после двух щелчков мышью по таблице. Вместе с таблицей «Tests of Normality» появляются Normal Q-Q Plots – (диаграммы Q-Q), по которым визуально можно определить, достаточно ли близко заданное распределение приближается к нормальному. Каждое наблюдаемое значение сравнивается со значением, ожидаемым при нормальном распределении. При условии точного выполнения нормального распределения все точки лежат на прямой. На Рис.9.1.3.3-9.1.3.4 эти диаграммы приведены для переменной PhA (физическая агрессия). По осям отложены процентили эмпирические (Х) и теоретические (Y). Также появляются Detrended Normal Q-Q Plots (Диаграммы с исключенным трендом). На них изображены отклонения наблюдаемых значений от ожидаемых при нормальном распределении значений в зависимости от наблюдаемых значений. В случае нормального распределения все точки лежат на горизонтальной прямой, проходящей через нуль. Все значения переведены в стандартизованные z-оценки. На Рис.9.1.3.5-9.1.3.6 эти диаграммы приведены для переменной Physical Aggression (физическая агрессия). 9.1.4. Получение гистограмм с нормальной кривой Гистограммы с нормальной кривой позволяют визуально сравнить эмпирическое распределение данных с нормальным распределением. Нормальная кривая строится по выборочному среднему и выборочному нормальному отклонению. Если эмпирическое распределение данных не отличается от нормального распределения, то столбики гистограммы хорошо вписываются в нормальную кривую. Как получить гистограммы с нормальной кривой? Способ 1 Data Split file... Перенести переменную “Gender” в окно “Groups Based on”. OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 110 В результате данные окажутся разбитыми на 2 группы: мальчиков и девочек. Результаты будут выдаваться по группам девочек и мальчиков отдельно. Analyze Descriptive Statistics Frequencies... Перенести в окно “Variables” все переменные, за исключением “Code” “Gender”. Снять галочку с Display frequency tables. Charts В диалоговом окне Frequencies: Charts поставить галочки у Histograms и Show normal curve on histogram (Рис.9.1.4.1). Рисунок 9.1.4.1. Заказ гистограмм с нормальной кривой Continue OK ВЫХОДНАЯ ИНФОРМАЦИЯ – гистограммы с нормальной кривой. На Рис.9.1.4.2-9.1.4.3 приведены гистограммы с нормальными кривыми для переменной FA (физическая агрессия) для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 111 лекций. Рисунок 9.1.4.2. Гистограмма с нормальной кривой для девочек. Рисунок 9.1.4.3. Гистограмма с нормальной кривой для мальчиков. Интересно отметить, что на Рис.9.1.4.2 для переменной «Физическая агрессия» видна «девочка-драчунья», та же, что и на Рис.5.3.2 – «выбоос» типа Extreme, Nr.24. Действительно, значения нормально распределенной случайной величины не должны выходить за пределы трех стандартных отклонений от среднего значения. У девочек среднее значение М = 5.33, а стандартное отклонение равно SD = 1.21. Тогда М + 3SD = = 5.33 + 3*1.21 = 8.94 < 10. Последний правый столбик гистограммы соответствует FA = 10. Это та самая девочка «драчунья». Значение ее балла по «Физической агрессии» превысило три стандартных отклонения. Очевидно, что эта девочка не совсем здорова. Девочку надо найти и проверить, действительно ли этот факт имеет место. Если имеет, то девочка нуждается в соответствующем лечении. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 112 лекций. Способ 2 Для экономии места и для получения гистограмм для мальчиков и девочек в одном и том же масштабе можно получить диаграммы с нормальной кривой для мальчиков и для девочек на одном рисунке. Для этого нужно, чтобы файл данных не был бы разбит на две группы: Data Split file... Reset OK. После чего можно заказывать гистограммы: Graphs Legacy Dialogs Histogram… Появится диалоговое окно (Рис.9.1.4.4). Для построения гистограмм с нормальной кривой по «Физической агрессии» переменную Physical Aggression надо перенести в окно «Variable», переменную Gender – в окно «Rows:», а в окошке «Display normal curve» надо поставить галочку и нажать кнопку ОК. Рисунок 9.1.4.4. Построение гистограмм с нормальной кривой для мальчиков и девочек на одном рисунке. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 113 лекций. После чего появится рисунок с двумя гистограммами (Рис.10.1.4.5). Рисунок 9.1.4.5. Гистограммы с нормальной кривой по переменной «Физическая агрессия» для мальчиков и девочек. Если переменную Gender перенести не в окно «Rows:» (Рис.9.1.4.4), а в окно «Columns:», то получатся гистограммы с нормальной кривой в одной строке (Рис.9.1.4.6). Рисунок 9.1.4.6. Гистограммы с нормальной кривой по переменной «Физическая агрессия» для мальчиков и девочек. Ту же самую процедуру надо проделать для всех остальных переменных (Рис.9.1.4.7-9.1.4.13.). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 114 лекций. Рисунок 9.1.4.7. Гистограммы с нормальной кривой по переменной «Косвенная агрессия» для мальчиков и девочек. Рисунок 9.1.4.8. Гистограммы с нормальной кривой по переменной «Раздражение» для мальчиков и девочек. Рисунок 9.1.4.9. Гистограммы с нормальной кривой по переменной «Негативизм» для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 115 лекций. Рисунок 9.1.4.10. Гистограммы с нормальной кривой по переменной «Обида» для мальчиков и девочек. Рисунок 9.1.4.11. Гистограммы с нормальной кривой по переменной «Подозрительность» для мальчиков и девочек. Рисунок 9.1.4.12. Гистограммы с нормальной кривой по переменной «Вербальная агрессия» для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 116 лекций. Рисунок 9.1.4.13. Гистограммы с нормальной кривой по переменной «Чувство вины» для мальчиков и девочек. Из анализа полученных гистограмм видно, что распределения данных отличаются от нормального распределения. 9.1.5. Выбор критерия для исследования гендерных различий Если обе сравниваемые переменные имеют нормальное распределения, то с помощью t-тестов сравнивают средние. Если распределение хотя бы одной из переменных отличается от нормального распределения, то с помощью U-критерия Манна-Уитни сравнивают уровни признака. Для выбора критерия сравнения агрессии мальчиков и девочек строят Таблицу 9.1.5.1: Таблица 9.1.5.1 Выбор критерия сравнения Variable Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt Normal Distribution Female Male no no no no no no no no no no no no no no no no Test U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 117 лекций. 9.2. Исследование различия уровня агрессии с помощью Uкритерия Манна-Уитни Так как распределение данных отличается от нормального распределения, то для исследования различия в агрессии у мальчиков и девочек следует применить непараметрический U-критерий Манна-Уитни (Mann-Whitney U-test). Замечание. Непараметрические тесты могут, конечно, применяться и в случае нормального распределения. Но тогда они будут иметь лишь 95% эффективность по сравнению с параметрическими тестами (Бююль & Цефель, 2002; С. 234.). Если выборки частично подчиняются нормальному закону распределения, а частично нет, то рекомендуется всегда применять U-критерий (тест) Манна-Уитни. Data Split File Reset OK Analyze Nonparametric Tests Legacy Dialogs 2 Independent Samples.... Рисунок 9.2.1. Диалоговое окно Two Independent-Samples Tests с введенными переменными Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 118 лекций. В появившемся диалоговом окне (Рис.9.2.1) Two Independent-Samples Tests перенести в окно Test Variable List все переменные, кроме Code и Gender . Переменную Gender перенести в окно GroupingVariable Define Groups Group 1: Group 2: 1 Рисунок 9.2.2. Диалоговое окно Two Independent-Samples. Определение сравниваемых групп Continue OK Выходные данные. В файле RESULTS.spv появятся Таблиц 9.2.1-9.2.2. Таблица 9.2.1 Суммы рангов для мальчиков и для девочек в объединенной группе (Ranks) Gender Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt N Mean Rank Female Male 30 30 Total Female Male Total Female Male Total Female Male Total Female Male Total Female Male Total Female Male Total Female Male 60 30 30 60 30 30 60 30 30 60 30 30 60 30 30 60 30 30 60 30 30 Total 60 Sum of Ranks 19.02 41.98 570.50 1259.50 40.13 20.87 1204.00 626.00 31.88 29.12 956.50 873.50 18.35 42.65 550.50 1279.50 34.98 26.02 1049.50 780.50 33.18 27.82 995.50 834.50 18.02 42.98 540.50 1289.50 29.58 31.42 887.50 942.50 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 119 лекций. Таблица 9.2.2 Статистики тестов и р-вероятности (Test Statisticsa) Physical Aggression Indirect Aggression Irritation Negativism 105.5 570.5 -5.196 161.0 626.0 -4.339 408.5 873.5 -.637 85.5 550.5 -5.542 .000 .000 .524 .000 Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2tailed) Resent ment Suspicion and Distrust Verbal Aggression 315.5 780.5 -2.061 369.5 834.5 -1.229 75.5 540.5 -5.593 422.5 887.5 -.422 .039 .219 .000 .673 a. Grouping Variable: Gender В Таблице 9.2.2 представлены U-статистика Манна-Уитни, W-статистика Вилкоксона, равная наименьшей сумме рангов объединенной группы и Z-статистика для стандартизованного нормального распределения ( z = 0, sz = 1 ). Прежде всего нам необходима последняя строка Таблицы 9.2.2. В соответствии с принятой в (Бююль & Цефель, 2002; с.88) терминологией, если Sig. ≤ .05, то различие значимое, Sig. ≤ .01, то различие очень значимое, Sig. ≤ .001, то различие максимально значимое. Максимально значимые различия имеются по переменным Physical Aggression, Indirect Aggression, Negativism, Verbal Aggression. Значимые различия имеются по переменной Resentment. Для выяснения, чей же уровень агрессии выше: мальчиков или девочек, обратимся к Таблице рангов 9.2.1. Группа, у которой при значимых различиях средний ранг выше, агрессивнее. Физическая агрессия (Physical Aggression) Выше у мальчиков: U = 105.5, р < .001; Косвенная агрессия (Indirect Aggression) Выше у девочек U = 161.0, р < .001; Негативизм (Negativism) Выше у мальчиков U = 85.5, р < .001; Обида (Resentment) выше у девочек U = 315.5, р = .039; Вербальная агрессия (Verbal Aggression) Различия по переменным Выше у мальчиков U = 75.5, р < .001. Раздражение (Irritation), Подозрительность (Suspicion and Distrust), и Чувство вины (Guilt) выявлены не были. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 120 лекций. Guilt 9.3. Представление результатов теста Манна-Уитни в отчетах. Размер эффекта Для отчетов о результатах непараметрических тестов не приводят значения средних значений и стандартных отклонений. Приводят значения медианы и размер эффекта r. Это связано с тем, что размеры эффектов являются стандартизованными показателями, которые можно сравнивать с размерами эффектов, полученными в других исследованиях. Размер эффекта может быть вычислен путем деления Z (из Таблицы 9.2.2) на корень квадратный из числа всех наблюдений N (Fritz, Morris, & Richler, 2012, p.12): r= Z N . (9.3.1) Каждый статистический тест имеет свой индекс размера эффекта. Коэн (Cohen, 1988) сделал несколько широко используемых предложений о том, что составляет большой или малый эффект (Fritz et al. 2012, p.12): • r = .10 (небольшой эффект): в этом случае эффект объясняет 1% от общей дисперсии, • r = .30 (средний эффект): эффект составляет 9% от общей дисперсии, • r = .50 (большой эффект): эффект составляет 25% от дисперсии. Следует иметь в виду, что r не измеряется в линейном масштабе, поэтому эффект с r = .6 не вдвое больше, чем с r = .3. Данные рекомендации могут быть полезны для оценки важности эффекта на практике (независимо от значимости тестовых статистик), но не следует забывать, что эти «законсервированные» размеры эффекта не могут заменить оценку размера эффекта в контексте конкретного исследования. Размер эффекта мы вычисляем для конкретной выборки. Но нас интересует размер эффекта для популяции. Исследуя один и тот же вопрос для получения размера эффекта в популяции можно комбинировать размеры эффектов из разных исследований. Это называется мета-анализом (Field, 2009; Pр.56-57). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 121 лекций. По результатам теста Манна-Уитни можно сделать следующие выводы (Таблица 9.3.1). Таблица 9.3.1 Результаты исследования гендерных различий по шкалам методики Басса-Дарки с Девочки, Mdn Statistics, U Statistics, Z p-value Variable Мальчики, Mdn помощью теста Манна-Уитни 8.50 5.00 105.5 5.20 .000 .67 большой 5.00 7.00 161.0 4.34 .000 .56 большой 5.00 6.00 2.00 6.00 85.5 408.5 5.54 0.64 .000 .52, ns .72 .08 большой нет эффекта 5.00 6.00 369.5 2.06 .22, ns .27 небольшой 4.00 5.00 315.5 1.23 .039 .16 небольшой 10.0 6.00 75.5 5.59 .000 .72 большой 5.00 5.00 422.5 0.42 .67, ns .05 нет эффекта Физическая агрессия (Physical Aggression) Косвенная агрессия (Indirect Aggression) Негативизм (Negativism) Раздражение (Irritation) Подозрительность (Suspicion and Distrust) Обида (Resentment) Вербальная агрессия (Verbal Aggression) Чувство вины (Guilt) Effect size, r Пример вычисления размера эффекта. Для Физической агрессии размер эффекта равен r = 5.196 = .67 . 60 Тест Манна-Уитни указывает на то, что физическая агрессия мальчиков (Mdn = 8.50) превыает агрессию девочек (Mdn = 5.00), U = 105.5, (Z = -5.20), p < .001, различие агрессии у мальчиков и девочек r = .67. Размер эффекта большой. Интересно отметить, что для переменной «Подозрительность», статистической значимости различий не найдено, хотя эффект малого размера (почти среднего, r = .27) имеется. Для переменной «Обида» гендерные различия значимые, но размер эффекта меньше: r = .16. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 122 лекций. 9.4. Исследование различия средних уровней агрессии с помощью параметрического t-теста Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест МаннаУитни не выявил различий. Было установлено, что можно воспользоваться более мощным параметрическим t-тестом для сравнения средних двух независимых выборок, так как только для переменной «Раздражение» (Рис.5.3.5.12) в группе девочек был всего лишь один «выброс» типа «Outliers», который не оказывает существенного влияния на среднее значение и абсолютная величина асимметрии распределений всех трех переменных (Таблица 9.1.1.1) небольшая: в пределах 1.96*SES = 0.84, где SES = 0.43 - стандартная ошибка асимметрии. Таблица 9.4.1 Асимметрия для шкал «Раздражение» (I), «Подозрительность» (S) и «Чувство вины» (G) в группах мальчиков и девочек Девочки Асимметрия, S Мальчики I S G I S G 0.61 0.18 0.19 0.31 0.53 0.58 Примечание. В таблице выделены случаи, когда абсолютная величина асимметрии превышает свою стандартную ошибку: S ≥ SES = 0.43 . Во всех случаях абсолютная величина асимметрии меньше 1.96*SES = 0.84. Следовательно, к переменным «Раздражение» (I), «Подозрительность» (S) и «Чувство вины» (G) может быть применена параметрическая статистика (Наследов, 2004, с.43), а именно t-тест. В качестве упражнения, ради того, чтобы понять, как работать на SPSS с tтестами для двух независимых выборок, мы применим t-тест ко всем шкалам методики Басса-Дарки. Analyze Compare Means Independent-Samples T Test.... Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 123 лекций. В диалоговом окне (Рис.9.4.1) Independent-Samples T Test надо перенести в окно Test Variable(s) переменные: Physical Aggression [PhA], Indirect Aggression [IA], Indirect Aggression [VA] и др. Рисунок 9.4.1. Independent-Samples t-test с введенными переменными. Переменную Пол [sex] перенести в окно GroupingVariable Define Groups (Рис.9.4.2) Group 1: Group 2: 1 Continue OK Рисунок 9.4.2. Independent-Samples t-test с введенными переменными. Выходные данные В файле RESULTS.spv появятся Таблицы 9.4.1-9.4.2. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 124 лекций. Таблица 9.4.1. Статистики групп (Group Statistics) Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt N Gender Female Male Female Male Female Male Female Male Female Male Female Male Female Male Female Male 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 Mean 5.3333 8.0333 7.1667 5.0000 6.4333 6.2667 2.2667 4.3333 4.6667 4.0667 5.5333 5.1000 6.0667 9.6000 5.0333 5.2000 Std. Deviation Std. Error Mean 1.21296 .22145 1.65015 .30127 1.11675 .20389 2.10090 .38357 .93526 .17075 1.33735 .24417 1.01483 .18528 1.02833 .18775 1.06134 .19377 1.22990 .22455 1.38298 .25250 1.06188 .19387 1.22990 .22455 2.04434 .37324 1.37674 .25136 1.15669 .21118 Таблица 9.4.2 t-тест для независимых выборок (Independent Samples Test). Фрагмент выходной таблицы Levene's Test for Equality of Variances F Physical Aggression Equal variances assumed Sig. 3.645 t-test for Equality of Means t .061 Equal variances not assumed df Sig. (2-tailed) -7.221 58 .000 -7.221 53.257 .000 Indirect Aggression Equal variances assumed Equal variances not assumed 4.134 .047 4.988 4.988 58 44.176 .000 .000 Equal variances assumed Equal variances not assumed 4.381 .041 Irritation .559 .559 58 51.891 .578 .578 Equal variances assumed Equal variances not assumed .089 .767 -7.835 -7.835 58 57.990 .000 Negativism Equal variances assumed Equal variances not assumed .664 2.023 2.023 58 56.784 .048 Resentment Suspicion and Distrust Equal variances assumed Equal variances not assumed 3.091 .084 1.361 1.361 58 54.374 .179 .179 Equal variances assumed 4.768 .033 -8.112 58 .000 -8.112 47.561 .000 -.508 58 .614 -.508 56.326 .614 Verbal Aggression Equal variances not assumed Equal variances assumed Guilt .418 Equal variances not assumed .622 .433 .000 .048 В таблице (Independent Samples Test), фрагмент которой представлен в Таблице 9.4.2, имеются результаты двух тестов: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 125 лекций. • F-тест Ливена для сравнения дисперсий, • t-тест Стьюдента для сравнения средних. Если выборочные дисперсии различаются статистически незначимо (Sig. >.05; верхняя строка «Equal variances assumed»), то для сравнения средних используется tкритерий Стьюдента. Если выборочные дисперсии различаются статистически значимо (Sig. ≤ .05; нижняя строка «Equal variances not assumed»), то такая ситуация называется проблемой Фишера-Беренса и для сравнения средних используется модификация t-критерия Стьюдента. Схема исследования: 1) Если дисперсии, проверенные с помощью теста Левена равны, то смотрят результаты t-теста по строке Equal variances assumed. 2) Если дисперсии, проверенные с помощью теста Левена не равны, то смотрят результаты t-теста по строке Equal variances not assumed. Дисперсии не равны, если Sig. ≤ .05. Случаи неравных дисперсий в Таблице 9.4.2 выделены. В соответствующей строке для t-теста: Sig. = – это p-value. Если (Бююль & Цефель, 1976, с.88): Sig. > .05. то различие незначимое (ns). Sig. ≤ .05. то различие значимое (уровень значимости α = .05). Sig. ≤ .01. то различие очень значимое (уровень значимости α = .01). Sig. ≤ .001. то различие максимально значимое (уровень значимости α = .001). Максимально значимые различия имеются по переменным Physical Aggression, Indirect Aggression, Negativism, Verbal Aggression. Значимое различие имеется по переменной Resentment. Незначимые различия имеются по переменным Irritation, Suspicion and Distrust, Guilt. Для выяснения, у кого выше среднии значения: у мальчиков или у девочек, обращаются к Таблице 9.4.1 (Group Statistics). У кого при значимых различиях среднее значение выше, тот и агрессия выше. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 126 лекций. Результаты исследования те же, что и с непараметрическими критериями. Физическая агрессия (Physical Aggression) выше у мальчиков t(58) = -7.22, р < .001; Косвенная агрессия (Indirect Aggression) выше у девочек t(44) = 4.99, р < .001; Негативизм (Negativism) выше у юношей t(58) = -7.84, р < .001; Обидчивость (Resentment) выше у девочек t(58) = 2.02, р = .048; Вербальная агрессия (Verbal Aggression) выше у мальчиков t(48) = -8.11, р < .001. Различия по переменным Irritation, Suspicion and Distrust, Guilt выявлены не были. Следует помнить, что на величину среднего влияет каждое значение признака. То есть среднее чувствительно к экстремальным значениям («выбросам»). Если нет нормального распределения, то сравнение средних значений возможно, если: (1) Группы достаточно большие, чтобы можно было бы судить о форме распределения; (2) Распределения симметричны; (3) Отсутствуют «выбросы». Если хотя бы одно из этих условий не выполняется, то следует ограничиться сравнением уровней признака (например, использовать тест Манна-Уитни). 9.5. Представление результатов t-теста в отчетах. Размеры эффекта Размер эффекта для t-теста можно выразить с помощью индексов: d Коэна (Cohen's d, effect size). Размер эффекта d Коэна используется при сравнении двух средних. Его используют при описании результатов t-теста. Для t-теста для двух независимых выборок размер эффекта - Cohen's d находится путем деления разности средних значений этих выборок на суммарное стандартное отклонение «pooled standard deviation»: d= где SD pooled = M1 − M 2 , SDpooled (9.5.1) SD12 + SD22 . 2 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 127 лекций. Значения размера эффекта меняются в том же диапазоне, что и три стандартных отклонения для стандартизованных данных: от -3.0 до 3.0. Можно использовать интерпретацию, предложенную Коэном (Cohen, 1988): 0.8 - большой размер эффекта (8/10 от стандартного отклонения), 0.5 - умеренный размер эффекта (1/2 от стандартного отклонения), 0.2 - маленький размер эффекта (1/5 от стандартного отклонения). Иллюстрация для размера эффекта t-теста для двух независимых выборок приводится на Рис.9.5.1. Пример вычисления размера эффекта d. Для «Физической агрессии» размер эффекта равен (см. Таблицу 9.5.1): d= 8.0333 − 5.3333 (1.65015) + (1.21296 ) 2 2 = 1.86 . 2 Индексы размеров эффекта d Коуэна по результатам t-теста (Таблицы 9.4.1-9.4.2) вычислены в Таблице 9.5.1. Рисунок 9.5.1. Иллюстрация для размера эффекта Cohen’s d = .6. Рисунок взят из публикации в Интернете: Magnusson, K. (2014). Interpreting Cohen's d effect size an interactive visualization. Retrieved in http://rpsychologist.com/d3/cohend/ Результаты t – теста для двух независимых выборок представлены в Таблице 9.5.1. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 128 лекций. Таблица 9.5.1 Результаты исследования гендерных различий по шкалам методики Басса-Дарки с Мальчики, M Мальчики, SD Девочки, M Девочки, SD Statistics, t df p-value помощью t-теста Физическая агрессия 8.03 1.65 5.33 1.21 -7.22 58 .000 1.86 большой Косвенная агрессия 6.27 1.34 7.17 1.12 4.99 44 .000 0.73 средний Негативизм 4.33 1.03 2.27 1.01 -7.84 58 .000 2.02 большой Раздражение 6.27 1.34 6.43 0.94 0.60 52 .58, ns 0.14 нет эффекта Подозрительность 5.10 1.06 5.53 1.38 1.36 58 .18, ns 0.35 небольшой Обида 4.07 1.23 4.67 1.06 2.02 58 .048 0.52 средний Вербальная агрессия 9.60 2.04 6.07 1.23 -8.11 48 .000 2.09 большой Чувство вины 5.20 1.16 5.03 1.38 -0.51 58 .61 0.13 нет эффекта Переменная Размер эффекта, d Примеры описания некоторых результатов. С помощью t-теста для независимых выборок найдено: • Cреднее значение «Физической агрессии» в выборке девочек M = 5.33 (SD = 1.21) статистически значимо меньше среднего значения в выборке мальчиков M = 8.03 (SD = 1.65): t(58) = -7.22, p < .001, d = 1.86, размер эффекта большой; • Cреднее значение «Косвенной агрессии» в выборке девочек M = 7.17 (SD = 1.12) статистически значимо больше среднего значения в выборке мальчиков M = 6.27 (SD = 1.34): t(44) = 4.99, p < .001, d = 0.73, размер эффекта умеренный. Тест Левина показал неравные дисперсии (F = 4.13, p = .047), поэтому число степеней свободы было скорректировано от 58 до 44; • Cреднее значение по переменной «Обида» в выборке мальчиков M = 4.07 (SD = 1.23) статистически значимо меньше среднего значение в выборке девочек M = 4.67 (SD = 1.06): t(58) = 2.02, p = .048, d = 0.52, размер эффекта умеренный. Интересно отметить, что для переменной «Подозрительность», статистической значимости различий не найдено, хотя эффект малого размера (d = 0.35) наблюдается). Девочки (M = 5.53, SD = 1.38) оказались более подозрительными, чем мальчики (M = 5.10, SD = 1.06). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 129 лекций. В Таблице 9.5.3 приводятся все вычисленные размеры эффекта. Таблица 9.5.3 Размеры эффектов для U-теста и t-теста для исследования гендерных различий по шкалам методики Басса-Дарки Переменная t-test U-test Размер эффекта, d Размер эффекта, r Физическая агрессия 1.86 большой .67 большой Косвенная агрессия Негативизм Раздражение Подозрительность Обида Вербальная агрессия Чувство вины 0.73 2.02 0.14 0.35 0.52 2.09 0.13 средний большой нет эффекта небольшой средний большой нет эффекта .56 .72 .08 .27 .16 .72 .05 большой большой нет эффекта небольшой небольшой большой нет эффекта Домашнее задание 1 1. Варианты данных для Домашнего задания 1 находятся в файле Aggression_Variants_(1-16).xlsx Номер варианта назначается преподавателем. 2. Требуется провести все необходимые вычисления и написать математическую часть для работы с исследовательской гипотезой о наличии гендерных различий агрессивности у подростков. Пример оформления находится в Приложении 2. 3. При написании математической части работы необходимо выполнять требования АРА по написанию исследовательских отчетов1 2, некоторые из которых приводятся в Приложении 5. 1 Purdue Online Writing Lab http://owl.english.purdue.edu/owl/resource/560/3/ Reporting Statistics in Psychology. Available at http://evc-cit.info/psych018/Reporting_Statistics.pdf http://evccit.info/psych018/Reporting_Statistics.pdf 2 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 130 лекций. 10. Исследование связи Две переменные могут быть связаны: 1. Функциональной связью, когда каждому значению переменной X соответствует одно определенное значение переменной Y. В психологических задачах переменных, связанных функциональной связью нет; 2. Стохастической или вероятностной связью, если одному значению признака X соответствует распределение различных значений признака Y и наоборот. Например, связь между ростом и весом людей (Наследов, 2004; с.66). В частном случае, если вероятностная связь проявляется в том, что при изменении одного из признаков изменяется среднее значение другого, то вероятностную связь называют корреляционной (Гмурман, 1999; с.253). 10.1. Корреляционная диаграмма Наглядной иллюстрацией характера связи является корреляционная диаграмма, или диаграмма рассеивания (scattering diagram). Пусть значения признака X равны x1 ; x2 ; K ; x n , а значения признака Y соответственно равны y1 ; y2 ; K ; yn . Графическое изображение на плоскости всех точек с координатами ( xi ; y i ) , называется корреляционной диаграммой или диаграммой рассеивания. Например, для данных Таблицы 10.1.1 корреляционная диаграмма изображена на Рис.10.1.1. Для четырех наблюдений с кодами s6, s7, s8, s9 компьютерные программы рисуют всего лишь одну точку. Поэтому для изучения связи требуются не только корреляционные диаграммы, которые не совсем точно отражают реальную ситуацию, но и другие статистические показателя. Корреляционные диаграммы иногда позволяют выявить случаи, когда корреляция обусловлена неоднородностью выборки по той или другой переменной, а также определить характер связи: линейность и монотонность. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 131 8 7 s3 6 s10 Code s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 s5 5 Y Таблица 10.1.1. Значения признаков Х и Y 4 s2 4 3 s6, s7, s8, s9 s1 2 s4 1 1 2 3 4 5 X X 1 1 1 2 2 3 3 3 3 4 Y 2 4 6 1 5 4 4 4 4 6 Рисунок 10.1.1. Корреляционная диаграмма для данных Таблицы 11.1.1. Корреляционная диаграмма представляет собой некоторое скопление, "облако" точек на плоскости. По форме и наклону этого "облака" по отношению к оси абсцисс можно оценить наличие корреляционной связи и ее тип. 1. Если "облако" точек имеет приблизительно форму овала, вытянутого вдоль некоторой воображаемой горизонтальной прямой (графика функции y = const ), то корреляционной связи между переменными нет (Рис.10.1.2). 2. Если "облако" точек вытянуто вдоль некоторой воображаемой наклонной прямой (графика линейной функции y = ax + b, (a ≠ 0) ), то между переменными имеется линейная корреляционная связь (Рис.10.1.3-10.1.5). 3. Если "облако" точек распространяется вдоль некоторой воображаемой линии, которая не является прямой (т.е. вдоль графика некоторой нелинейной функции y = f ( x ) ), то корреляционная связь между переменными нелинейная (Рис. 10.1.3, 10.1.6, 10.1.7). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 132 Y Y 55 8 7 45 6 5 35 4 3 2 25 1 15 50 100 150 50 100 150 X Рисунок 10.1.2. Связи нет. X Рисунок 10.1.3. Нелинейная немонотонная связь. Y Y 60 60 50 50 40 40 30 30 20 20 10 10 30 60 90 120 150 30 60 90 120 X X Рисунок 10.1.4. Линейная положительная связь. Рисунок 10.1.5. Линейная отрицательная связь. Y 70 Y 60 60 50 50 150 40 40 30 30 20 20 10 10 30 60 90 120 150 30 60 90 120 150 X X Рисунок 10.1.6. (Монотонная) нелинейная Рисунок 10.1.7. (Монотонная) нелинейная положительная связь. отрицательная связь. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 133 4. Если функция y = f ( x ) монотонная (возрастающая или убывающая), то говорят о монотонной связи (Рис. 10.1.4-10.1.7). При этом если y = f ( x ) - возрастающая функция, то есть большим значениям одной переменной соответствуют большие значения другой переменной, то связь называют положительной (Рис. 10.1.4, 10.1.6). Если y = f ( x ) убывающая функция, то есть большим значениям одной переменной соответствуют меньшие значения другой переменной, то связь называют отрицательной (Рис. 10.1.5, 10.1.7). Монотонная связь может быть, в частности, линейной (Рис. 10.1.4-10.1.5). 10.2. Коэффициент корреляции Пирсона Количественной мерой силы и направления корреляционной связи двух переменных является коэффициент корреляции. В этом параграфе мы рассмотрим коэффициенты корреляции Пирсона, Спирмена, τКендалла, бисериальный коэффициент корреляции и точечно-бисериальный коэффициент корреляции. Если данные представлены в порядковых шкалах или в метрических шкалах, то для исследования связи используют коэффициенты корреляции Пирсона (Pearson), Спирмена (Spearman) и «тау»-Кендалла ( τ − Kendall). Если связь является немонотонной, то коэффициенты корреляции не подходят. Коэффициенты корреляции также не подходят для номинальных переменных. Исключение: дихотомические переменные. 10.2.1. Вычисление коэффициента корреляции Пирсона Для оценки тесноты линейной связи используют коэффициент корреляции Пирсона rxy = r (Pearson’s product-moment correlation coeffcient). Коэффициент корреляции Пирсона вычисляется с помощью формулы (10.2.1.1), которая содержит средние арифметические значения и отклонения от средних. Поэтому на его значение оказывают влияние «выбросы» и отклонения распределения данных от нормального распределения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 134 n rXY = ∑ (x i =1 n ∑ (x i =1 i − x )( y i − y ) i n − x ) ⋅ ∑ ( yi − y ) 2 , (10.2.1.1) 2 i =1 Коэффициент корреляции Пирсона принимает значения из интервала [-1;1]. Показателем силы связи является абсолютная величина коэффициента корреляции. Направление связи определяется знаком коэффициента корреляции. Если распределение данных по двум переменным не отличается от нормального распределения, то вычисляют коэффициент корреляции Пирсона. Иногда его можно использовать и в случае отсутствия нормального распределения, но при этом должны выполняться условия (Наследов, 2004, С.89): - обе переменные не должны иметь выраженной асимметрии, - должны отсутствовать «выбросы», - связь между переменными предполагается линейной. 10.2.2. Размер эффекта для коэффициента корреляции Пирсона Так как коэффициент корреляции Пирсона является безразмерной мерой связи, то его также используют в качестве индекса размера эффекта. Он имеет следующую интерпретацию (см., например, Field, 2009, p.173; Ellis, 2010, p.41): .1 – малый размер эффекта, .3 – средний размер эффекта, .5 – большой размер эффекта. Для определения силы связи можно использовать классификацию коэффициентов корреляции Пирсона, приведенную в Таблице 10.2.5. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 135 Таблица 10.2.2.1 Классификация коэффициента корреляции Пирсона rxy rxy Характер связи 1 Функциональная, линейная, положительная [ .5; 1 ) Сильная линейная, положительная [ .3; .5 ) Умеренная линейная, положительная [ .1; 3 ) Слабая линейная, положительная ( -.1; .1 ) Линейной связи нет. Может быть нелинейная связь ( -.3; -.1 ] Слабая линейная, отрицательная ( -.5; -.3 ] Умеренная линейная, отрицательная ( -1; -.5 ] Сильная линейная, отрицательная -1 Функциональная, линейная, отрицательная 10.2.3. Проверка статистической значимости коэффициента корреляции Пирсона Если переменные X и Y, нормально распределенные; выборка случайная, объема n и выборочный коэффициент корреляции Пирсона: rxy = r, то встают вопросы: «Является ли коэффициент корреляции Пирсона статистически значимым или его отличие от нуля можно объяснить случайностями?», «Связаны ли признаки линейной корреляционной связью?». Ответ на эти вопросы дает проверка статистических гипотез. H 0 : Выборочный коэффициент корреляции Пирсона r имеет случайное отличие от нуля. H 1 : Выборочный коэффициент корреляции Пирсона r отличается от нуля закономерно. Можно эти же гипотезы сформулировать и для популяции. Пусть ρ – коэффициент корреляции Пирсона для популяции. Тогда: H 0 : ρ = 0, H 1 : ρ ≠ 0. Если подтверждается нулевая гипотеза, то говорят, что линейная связь между переменными не выявлена. Может быть, найдется другой способ ее выявить. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 136 Если принимается альтернативная гипотеза, то говорят, что выборочный коэффициент корреляции Пирсона статистически значим, и что переменные в популяции связаны линейной (положительной или отрицательной связью, в зависимости от знака коэффициента корреляции). Критерий: T= r 1− r2 n−2 . (10.2.3.1) При справедливости нулевой гипотезы случайная величина Т имеет t-распределение Стьюдента с df = n – 2 степенями свободы. Пример. Проверить, имеется ли линейная корреляционная связь между двумя переменными, если известны коэффициенты корреляции Пирсона r и объемы выборок n. Сформулировать гипотезы о связи. Рассмотреть ненаправленную альтернативную гипотезу (случай two-tailed, двухвостовый). Исходные данные: r .321 -.302 .278 .278 .461 n 22 44 115 30 40 Гипотезы: H 0 : Выборочный коэффициент корреляции Пирсона r имеет случайное отличие от нуля. H 1 : Выборочный коэффициент корреляции Пирсона r отличается от нуля закономерно. Или H 0 : ρ = 0, H 1 : ρ ≠ 0. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 137 Случай 1. r = .351; n = 22. Т-статистика: t= 0.351 1 − ( 0.351) 22 − 2 2 = 1.5158 . p-value находим с помощью Excel. Открываем программу Excel. Выбираем функцию T.DIST.2T и в появившееся окно вносим информацию: Х = 1.5158, Deg_freedom = 20 (Рис.10.2.2.1), OK. В соответствующей ячейке появляется число 0.145216394 Рисунок 10.2.3.1. Окно для функция T.DIST.2T. Таким образом, two-tailed p-value = 0.145216. Ответ: Нет оснований отклонить нулевую гипотезу. Линейная связь между переменными не найдена, выборочный коэффициент корреляции Пирсона r = .35 отличается от нуля статистически незначимо: t(20) = 1.52, p = .15 (two-tailed). Отличие r от нуля может быть объяснено случайными причинами. Можно также записать: r(22) = .35, p = .15 (two-tailed). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 138 Замечание. Для правосторонней альтернативной гипотезы: H 1 : ρ > 0 мы получили р = .073 > .05. Также нет оснований отклонить нулевую гипотезу. Случай 2. r = -.302; n = 44. Т-статистика: t= −0.302 1 − ( −0.302 ) 44 − 2 2 = −2.0530 . p-value находим с помощью Excel. df = 42. Two-tailed p-value = .046 < .05. Ответ: На уровне значимости α = .05 справедлива альтернативная гипотеза. Переменные в популяции связаны между собой линейной отрицательной корреляционной связью. Выборочный коэффициент корреляции Пирсона r = -.30 отличается от нуля статистически значимо: t(42) = -2.05, p = .046 (two-tailed). Можно также записать: r(44) = -.30, p = .046 (two-tailed). Случай 3. r = .278; n = 115. Т-статистика: t= 0.278 1 − ( 0.278 ) 115 − 2 2 = 3.0765 . p-value находим с помощью Excel. df = 113. Two-tailed p-value = .003 < .01. Ответ: На уровне значимости α = .01 справедлива альтернативная гипотеза. Переменные в популяции связаны между собой линейной положительной корреляционной связью. Выборочный коэффициент корреляции Пирсона r = .28 отличается от нуля статистически значимо: t(113) = 3.08, p = .003 (two-tailed). Можно также записать: r(115) = .28, p = .003 (two-tailed). Случай 4. r = .278; n = 30. Т-статистика: t= 0.278 1 − ( 0.278 ) 30 − 2 2 = 1.5314 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 139 p-value находим с помощью Excel. df = 28. Two-tailed p-value = .137 > .05. Ответ: Нет оснований отклонить нулевую гипотезу. Линейная связь между переменными не найдена, выборочный коэффициент корреляции Пирсона r = .28 отличается от нуля статистически незначимо: t(28) = 1.53, p = .14 (two-tailed). Отличие r от нуля может быть объяснено случайными причинами. Можно также записать: r(30) = .28, p = .14 (two-tailed). Случай 5. r = .461; n = 90. Т-статистика: t= 0.461 1 − ( 0.461) 90 − 2 2 = 4.8733 . p-value находим с помощью Excel. df = 98. Two-tailed p-value = 0.0000048184 < .001. Ответ: На уровне значимости α = .001 справедлива альтернативная гипотеза. Переменные в популяции связаны между собой линейной положительной корреляционной связью. Выборочный коэффициент корреляции Пирсона r = .46 отличается от нуля статистически значимо: t(88) = 4.87, p < .001 (two-tailed). Можно также записать: r(90) = .35, p < .001 (two-tailed). Коэффициент корреляции Пирсона Статистически значим Статистически незначим Выявлена линейная корреляционная связь Линейная корреляционная связь не выявлена Связь не выявлена Есть нелинейная связь Рисунок 10.2.3.2. Исследование связи с помощью коэффициента корреляции Пирсона. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 140 Таблица 10.2.3.1 Используемые обозначения при обработке данных с помощью SPSS и принятая терминология (Бююль & Цефель, 2002; с.88) Вероятность ошибки (p=Sig.) Значимость коэффициентов корреляции Обозначение p > .05 Незначим ns p ≤ .05 Значим * p ≤ .01 Очень значим ** p ≤ .001 Максимально значим *** Если коэффициент корреляции Пирсона статистически значим, то выявлена линейная корреляционная связь – положительная или отрицательная11. Если коэффициент корреляции Пирсона статистически незначим, то возможны два варианта (Рис.10.2.3.2): или линейная связь не выявлена, или связь нелинейная. 10.2.4. Представление коэффициента корреляции Пирсона в отчетах Для представления коэффициента корреляции Пирсона в научных отчетах по рекомендациям АРА12 необходимо выполнять следующие правила. Ноль в целой части значения коэффициента корреляции. Так как │r│≤ 1, то ноль в целой части значения коэффициента корреляции не пишется. Например, значения коэффициентов корреляции могут быть записаны как: .13, .84, -.23, -35. Абсолютная величина коэффициента корреляции. При .1 ≤ │r│≤ 1 следует оставлять два знака после запятой. При 0 ≤ │r│< .1 следует оставлять три знака после запятой. Курсив и пробелы. Следует обратить внимание на написание курсивом и на пробелы. Стиль APA очень точен. Для обозначения коэффициента корреляции Пирсона используется 11 12 Если, конечно, корреляция не является ложной. См. п.10.5. http://evc-cit.info/psych018/Reporting_Statistics.pdf Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 141 буква латинского алфавита r, которая пишется курсивом. До и после знаков = , < , > должен быть пробел. Указание объема выборки. Объем выборки пишется в скобках, сразу за буквой r. Например, r(50) = .67. Указание статистической значимости. Для коэффициентов корреляции Пирсона значение величины t-теста не указывается. Приводится только р-значение. Запись p-значения. Но стиль APA требует предстивления в исследовательских отчетов точного p-значения, в случаях, когда p ≥ .001. При .1 ≤ р ≤ 1 следует оставлять два знака после запятой. При 0 ≤ р < .1 следует оставлять три знака после запятой. Например, р = .002, или р = .084, или р = .23. Если SPSS выдает .000, то пишут p < .001. Часто дописывают «two tailed p-values are assumed» или «one tailed p-values are assumed». Примеры. Приведем примеры записи коэффициентов корреляции Пирсона в научных отчетах: r(60) = -.55, p < .001; r(60) = -.073, p = .58; r(60) = -.39, p = .002; r(60) = -.16, p = .20. Во всех примерах two tailed p-values are assumed. 10.2.5. Сравнение корреляций Пирсона для двух независимых выборок Рассмотрим сравнение коэффициентов корреляции для двух независимых выборок (Гласс, & Стенли, 1976, сс.283-285; Field, 2009, p.191). Признаки популяций: нормально распределенные; Коэффициенты корреляции популяции: ρ1 , ρ 2 ; Выборки: случайные, независимые, объемов n1 , n2 ; Выборочные коэффициенты корреляции Пирсона: r1 , r2 ; Гипотезы: H 0 : ρ1 = ρ 2 , H 1 : ρ1 ≠ ρ 2 , Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 142 H 0 : Выборочные коэффициенты корреляции r1 и r2 отличаются друг от друга случайно. H 1 : Выборочные коэффициенты корреляции r1 и r2 отличаются друг от друга закономерно. Критерий: Z= Z (r1 ) − Z (r2 ) , (10.2.5.1) 1 1+ r ln 2 1− r (10.2.5.2) 1 1 + n1 − 3 n 2 − 3 где Z (r ) = - это Z-преобразование Фишера. Z (r1 ) и Z (r2 ) можно найти путем вычисления по данной формуле с помощью калькулятора. Случайная величина Z при справедливости нулевой гипотезы имеет нормальное распределение с параметрами µ Z = 0 и σ Z = 1 . Используя компьютерную программу Excel (см. п.7.7) можно найти p-value Z – стандартизованного нормального распределения, когда μ=0, σ=1. 10.2.6. Размер эффекта для разности коэффициентов корреляции Пирсона Индексом размера эффекта, который оценивает разность коэффициентов корреляции r1 и r2 является Cohen’s q, который определяется по формуле: q = Z ( r1 ) − Z ( r2 ) . (10.2.6.1) Интерпретация Cohen’s q такая же, что и у коэффициентов корреляции: ± .10 представляют собой небольшой эффект, ± .30 - средний эффект, ± .50 - большой эффект (Сohen, 1988; p.115). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 143 Пример. Выяснить: статистически значимо или незначимо отличается выборочный коэффициент корреляции r1 = -.88 (объем выборки n1 =45) от выборочного коэффициента корреляции r2 = - .91 другой случайной выборки объема n2 =64. Вычислить размер эффекта. Дать интерпретацию. Гипотезы: H 0 : Выборочные коэффициенты корреляции r1 = - .88 и r2 = - .91 имеют случайное отличие. H 1 : Выборочные коэффициенты корреляции r1 = - .88 и r2 = - .91 отличаются друг от друга закономерно. Преобразованные по Фишеру (11.2.6.2) коэффициенты корреляции равны: 1 1 + ( −0.88 ) Z(r1) = Z(-.88) = ln = −1.3758 ; 2 1 − ( −0.88 ) Z(r2) = Z(-.91) = 1 1 + ( −0.91) = −1.5275 . ln 2 1 − ( −0.91) Z-статистика: z= −1.3758 − ( −1.5275 ) 1 1 + 45 − 3 64 − 3 = 0.76 Используя компьютерную программу Excel (см. п.7.7) находим p-value Z – стандартизованного нормального распределения, когда μ=0, σ=1. Для этого набираем в ячейке = 1 – NORM.S.DIST(0.76,TRUE) Enter Получаем two-tailed p-value = 0.447254 p = .45 > .05. Размер эффекта, который оценивает разность коэффициентов корреляции r1 и r2 является Cohen’s q, который определяется по формуле (10.2.6.1): q = Z ( r1 ) − Z ( r2 ) = −1.3758 − ( −1.5275) = 0.15 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 144 Ответ: Нет оснований отклонить Отличие H0 : между выборочными коэффициентами корреляции r1 (45)= -.88 и r2 (45) = -.91 друг от друга статистически незначимо и может быть объяснено случайными причинами Z = 0.76, p = .45 (two-tailed). Размер эффекта Cohen’s q = .15, небольшой. 10.2.7. Сравнение коэффициентов корреляции двух зависимых выборок Рассмотрим сравнение коэффициентов корреляции двух зав исимых выборок (Field, 2009, pp.191-192). Признаки популяций (X, Y), (X, Z), (Y, Z): двумерные, нормально распределенные; Коэффициенты корреляции популяций: ρ xy , ρ xz , ρ yz ; Выборка: случайная объема n ; Выборочные коэффициенты корреляции: rxy , rxz , ryz ; H 0 : ρ xy = ρ xz , Гипотезы: H 1 : ρ xy ≠ ρ xz , H 0 : Переменная Y имеет одинаковую корреляцию с переменными X и Z. Выборочные коэффициенты корреляции rxy и ryz отличаются друг от друга статистически незначимо. Отличие может быть объяснено случайными причинами. H 1 : Переменная Y имеет неодинаковые корреляции с переменными X и Z. Выборочные коэффициенты корреляции rxy и ryz отличаются друг от друга статистически значимо. Отличие закономерно и не может быть объяснено случайными причинами. Критерий: t = ( rxy − ryz ) ( ( n − 3)(1 + rxz ) 2 1 − r − rxz2 − ryz3 + 2rxy rxz rzy 2 xy ) . (10.2.7.1) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 145 Случайная величина T при справедливости нулевой гипотезы имеет t- распределение с df = n – 3 степенями свободы. Используя компьютерную программу Excel (см. п.7.7) можно найти p-value. Пример. Выяснить: имеет ли переменная «самооценка» (Y) одинаковую корреляцию с «личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Исходные данные: rxy = -.52; rxz = .75; ryz = -.28; объем выборки n = 64. Гипотезы: H 0 : Переменная «самооценка» (Y) имеет в популяции одинаковую корреляцию с «личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Выборочные коэффициенты корреляции rxy =.-52 и ryz =-.28 отличаются друг от друга статистически незначимо. Отличие может быть объяснено случайными причинами. H 1 : Переменная «самооценка» (Y) имеет в популяции неодинаковые корреляции с «личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Выборочные коэффициенты корреляции rxy =.-52 и ryz =-.28 отличаются друг от друга статистически значимо. Отличие закономерно и не может быть объяснено случайными причинами. Z-статистика: t = ( ( −0.52 ) − ( −0.28 ) ) ( 64 − 3) (1 + ( 0.75 ) ) = −2.67 . 2 2 2 (1 − ( −0.52 ) − ( 0.75 ) − ( −0.28 ) + 2 ( −0.52 )( 0.75 )( −0.28 ) ) 2 Используя компьютерную программу Excel (см. п.7.7) находим p-value t – распределения, когда df = n - 3 = 64 – 3 = 61, two-tailed. Откуда р-value: p = .00970826 = .010. Размер эффекта, который оценивает разность коэффициентов корреляции r1 и r2 является Cohen’s q, который определяется по формуле (11.2.7.1): q = Z ( −0.52 ) − Z ( −0.28 ) = 1 1 + ( −0.52 ) 1 1 + ( −0.28 ) ln − ln = −0.576 − ( −0.288 ) = 0.29 . 2 1 − ( −0.52 ) 2 1 − ( −0.28 ) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 146 Ответ: H0 отклоняется: различие между выборочными коэффициентами корреляции r1 (64)= -.52 и r2 (64) = -.28 статистически значимо и не может быть объяснено случайными причинами: t(61) = -2.76, p = .010 (two-tailed). Размер эффекта Cohen’s q = .29, почти средний. «Самооценка» теснее связана с «личностной тревожностью», чем с «ситуативной тревожностью». 10.3. Коэффициенты корреляции Спирмена и Кендалла Если распределение данных хотя бы для одной из переменных отличается от нормального, то вычисляют коэффициенты ранговой корреляции Спирмена и «τ (тау)»Кендалла. Их используют для оценки тесноты монотонной связи. При вычислении все значения переменных X и Y сначала переводятся в ранги. Поэтому «выбросы» не оказывают столь заметного влияния на значения ранговых коэффициентов корреляции. 10.3.1. Коэффициент ранговой корреляции Спирмена Для вычисления коэффициента ранговой корреляции Спирмена rS используется та же самая формула (10.2.1.1), что и для коэффициента Пирсона, только уже для ранговых переменных. В нее входят средние ранги и отклонения рангов от среднего ранга. Пример. Для вычисления коэффициента корреляции Пирсона по формуле (10.2.1.1) используется Таблица 10.3.1.1 и в результате получается rXY = .71 . Для вычисления коэффициента корреляции Спирмена данные переводятся в ранги (Таблицы 10.3.1.2 и 10.3.1.3). Данные ранжируются таким образом, чтобы наименьшей оценке соответствовал бы наименьший ранг, а наибольшей оценке – наибольший ранг. По Таблицам 10.3.1.2 и 10.3.1.3 составляется Таблица 10.3.1.4 – исходные данные для вычисления коэффициентов корреляции Спирмена по формуле (10.2.1.1). По этим данным Таблицы 10.3.1.4 вычисляется коэффициент корреляции Спирмена. В результате получается rS = .65 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 147 Таблица 10.3.1.2 Ранги по Х Таблица 10.3.1.1 Исходные данные в баллах xi yi Шифр s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 s11 s12 s13 s14 s15 145 137 125 124 122 116 113 111 109 102 87 82 79 55 45 Шифр s15 s14 s13 s12 s11 s10 s9 s8 s7 s6 s5 s4 s3 s2 s1 49 30 45 33 40 44 28 33 35 24 39 35 10 23 11 Таблица 10.3.1.3 Ранги по Y Шифр s13 s15 s14 s10 s7 s2 s4 s8 s9 s12 s11 s5 s6 s3 s1 Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 xi rang xi 45 55 79 82 87 102 109 111 113 116 122 124 125 137 145 1 2 3 4 5 5 7 8 9 10 11 12 13 14 15 Таблица 10.3.1.4 Данные в рангах yi rang yi Шифр rang xi rang yi 10 11 23 24 28 30 33 33 35 35 39 40 44 45 49 1 2 3 4 5 6 7.5 7.5 9.5 9.5 11 12 13 14 15 s15 s14 s13 s12 s11 s10 s9 s8 s7 s6 s5 s4 s3 s2 s1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2 3 1 9.5 11 4 9.5 7.5 5 13 12 7.5 14 6 15 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 148 10.3.2. Размер эффекта для коэффициента корреляции Спирмена Так как коэффициент корреляции Спирмена является безразмерной мерой связи, то его также используют в качестве индекса размера эффекта. Для коэффициентов корреляции Спирмена интерпретация коэффициентов корреляции как индексов размеров эффекта такая же, как и для коэффициента корреляции Пирсона (см., например, Ellis, 2010, p.41): .1 – малый размер эффекта, .3 – средний размер эффекта, .5 – большой размер эффекта. Для определения силы связи можно использовать такую же классификацию, как и для коэффициентов корреляции Пирсона, приведенную в Таблице 10.2.2.1. 10.3.3. Проверка статистической значимости коэффициентов корреляции Спирмена Проверка значимости коэффициента корреляции Спирмена осуществляется с помощью того же Т критерия, который используется для коэффициентов корреляции Пирсона. Гипотезы для коэффициента корреляции Спирмена rS : H 0 : Выборочный коэффициент корреляции Спирмена rS отличается от нуля статистически незначимо. Отличие rS от нуля может быть объяснено случайными причинами. Монотонная корреляционная связь не выявлена. H 1 : Выборочный коэффициент корреляции Спирмена rS отличается от нуля статистически значимо. Отличие rS от нуля закономерно и не может быть объяснено случайными причинами. Между признаками имеется монотонная корреляционная связь. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 149 Коэффициент ранговой корреляции Спирмена Статистически значим Статистически незначим Выявлена монотонная корреляционная связь Монотонная корреляционная связь не выявлена Связь не выявлена Есть немонотонная связь Рисунок 10.3.3.1. Исследование связи с помощью коэффициентов ранговой корреляции Спирмена. Если коэффициент ранговой корреляции Спирмена статистически значим, то выявлена монотонная корреляционная связь – положительная или отрицательная. Если коэффициент ранговой корреляции Спирмена статистически незначим, то возможны два варианта (Рис.10.3.3.1): или монотонная связь не выявлена, или связь немонотонная. 10.3.4. Коэффициент ранговой корреляции τ-Кендалла Для вычисления коэффициента ранговой корреляции τ -Кендалла используется подсчет совпадений и инверсий: если у пары испытуемых изменение по Х совпадает по направлению с изменением по Y, то это говорит о положительной связи («совпадение», p). Если нет – то об отрицательной связи («инверсии», q). Коэффициент ранговой корреляции τ -Кендалла есть разность относительных частот совпадений w( P) и инверсий w(Q) при переборе всех пар испытуемых в выборке: τ = w( P) − w(Q) = P−Q . ( N − 1) N 2 (10.3.4.1) Пример вычисления коэффициента корреляции τ-Кендалла можно найти в книге Гласса и Стенли (1976). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 150 Коэффициент ранговой корреляции τ-Кендалла по абсолютной величине на 66-75% меньше, чем абсолютная величина коэффициента корреляции Спирмена rS . Таким образом, если τ используется как размер эффекта, то следует иметь в виду, что он не сопоставим с rS (Field, 2009; pp.192-193). 10.3.5. Проверка статистической значимости коэффициентов корреляции τ-Кендалла Гипотезы для коэффициента корреляции τ-Кендалла: H 0 : Выборочный коэффициент корреляции τ-Кендалла отличается от нуля статистически незначимо. Отличие τ-Кендалла от нуля может быть объяснено случайными причинами. Монотонная корреляционная связь не выявлена. H 1 : Выборочный коэффициент корреляции τ-Кендалла отличается от нуля статистически значимо. Отличие τ-Кендалла от нуля закономерно и не может быть объяснено случайными причинами. Между признаками имеется монотонная корреляционная связь. Коэффициент ранговой корреляции -Кендалла Статистически значим Статистически незначим Выявлена монотонная корреляционная связь Монотонная корреляционная связь не выявлена Связь не выявлена Есть немонотонная связь Рисунок 10.3.5.1. Исследование связи с помощью коэффициентов ранговой корреляции τ Кендалла. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 151 Проверка статистической значимости коэффициент корреляции τ - Кендалла осуществляется c помощью другого критерия (Z-критерия) (Гмурман, 1999; сс.341-343). Z = S∗ ⋅ 18 , n ⋅ (n − 1) ⋅ (2n + 5) (10.3.5.1) где  P − Q + 1 , если P < Q ; S∗ =   P − Q − 1 , если P > Q . Р – число совпадений; Q – число инверсий. Случайная величина Z при справедливости нулевой гипотезы имеет нормальное распределение с параметрами µ Z = 0 и σ Z = 1 . Используя компьютерную программу Excel (см. п.7.7) можно найти p-value. Если коэффициент ранговой корреляции τ-Кендалла статистически значим, то выявлена монотонная корреляционная связь – положительная или отрицательная. Если коэффициент ранговой корреляции τ-Кендалла статистически незначим, то возможны два варианта (Рис.10.3.5.1): или монотонная связь не выявлена, или связь немонотонная. 10.4. Коэффициент корреляции «Фи» Если обе переменные Х и Y измеряются в дихотомических шкалах наименований, то коэффициент корреляции Пирсона называют коэффициентом корреляции φ, «Фи». Коэффициент корреляци φ можно вычислить по формуле для вычисления коэффициента корреляции Пирсона (10.2.1.1). Несмотря на то, что переменные измерены в номинальной шкале, коэффициент корреляции φ можно интерпретировать. В книге Гласса и Стенли (1976) рассматривается следующий пример. На основании наблюдения за 12 студентами второго курса колледжа по переменным: X – семейное положение ( x = 1 - женат; x = 0 - холост); Y - исключение из колледжа ( y = 1 - исключен; y = 0 – не исключен), Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 152 был получен коэффициент корреляции φ = .51. Коэффициент корреляции получился положительным. Обе переменных согласованно возрастают. Для того, чтобы его интерпретировать, рассмотрим, что означает согласованное возрастание переменных Х и Y. x=0 холост x=1 женат y=0 не исключен y=1 исключен Возрастание переменной Х от 0 до 1 соответствует женитьбе. Возрастание переменной Y от 0 до 1 соответствует исключению из колледжа. Корреляционная связь между женитьбой и исключением из колледжа положительная. Из чего можно сделать вывод: Имеется тенденция: если студент женится, то его исключают из колледжа. Обратное утверждение, очевидно, смысла не имеет. Проверка значимости коэффициента корреляции ϕ Если коэффициент корреляции популяции: ϕ P , выборка: случайная, объема n , ( n ≥ 20 ). Гипотезы: H0 : ϕP = 0 , H1 : ϕ P ≠ 0 , или H 0 : Выборочный коэффициент корреляции ϕ отличается от нуля случайно. H 1 : Выборочный коэффициент корреляции ϕ отличается от нуля закономерно. Критерий: Z = n ⋅ ϕ (Гласс & Стенли, 1976; c.287). Случайная величина Z при справедливости нулевой гипотезы имеет нормальное распределение с параметрами µ Z = 0 и σ Z = 1 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 153 Используя компьютерную программу Excel (см. п.7.7) можно найти p-value Z – стандартизованного нормального распределения, когда μ=0, σ=1. Другим подходом к исследованию связи между дихотомическими переменными является частотный анализ с применением тестов «Хи-квадрат» и «Угловое преобразование Фишера» (см. п.). 10.5. Точечно-бисериальный коэффициент корреляции Если одна из переменных измерена в дихотомической шкале наименований, а другая в шкале интервалов или в шкале отношений, то коэффициент корреляции Пирсона называют точечным-бисериальным коэффициентом корреляции и обозначают rpb . Бисериальный – потому что у одной переменной имеется две серии объектов при наблюдении (дихотомическая шкала), на что указывает нижний индекс «b» - biserial в обозначении rpb . Точечный – потому что вторая переменная метрическая, на что указывает нижний индекс «p» - point. Коэффициент корреляци rpb можно вычислить по формуле для вычисления коэффициента корреляции Пирсона (10.2.1.1). Проверка значимости точечно-бисериального коэффициента корреляции Пусть коэфициент корреляции популяции: ρ pb ; выборка: случайная, объема n; Гипотезы: H 0 : ρ pb = 0 , H 1 : ρ pb ≠ 0 . H 0 : Выборочный коэффициент корреляции rpb отличается от нуля случайно. H 1 : Выборочный коэффициент корреляции rpb отличается от нуля закономерно. Критерий такой же, как и для проверки значимости коэффициентов корреляции Пирсона и Спирмена: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 154 T= r 1− r2 n−2 . (10.2.3.1) При справедливости нулевой гипотезы случайная величина Т имеет t-распределение Стьюдента с df = n – 2 степенями свободы. С помощью программы Excel находится p-value. Например, с помощью точечно-бисериального коэффициента корреляции можно исследовать связь между полом и агрессивностью подростков для данных п.4 (файл Agr_Data.xlsx). После загрузки данных в SPSS: Analyze Correlate Bivariate Рисунок 10.5.1. Диалоговое окно Bivariate Correlations с внесенными переменными для вычисления точечно-бисериальных коэффициентов корреляции. ОК Выходная информация Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 155 Таблица 10.5.1 Фрагмент корреляционной матрицы13 Gender Pearson Correlation Sig. (2tailed) Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt .688** -.548** -.073 .717** -.257* -.176 .729** .067 .000 .000 .578 .000 .048 .179 .000 .614 60 60 60 60 60 N 60 60 60 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). • Физическая агрессия (Physical Aggression) связана с полом: rpb ( 60 ) = .69, p < .001 . У мальчиков она выше, чем у девочек. Размер эффекта большой. • Косвенная агрессия (Indirect Aggression) связана с полом: rpb ( 60 ) = −.55, p < .001 . У мальчиков она ниже, чем у девочек. Размер эффекта большой. • Связь между раздражением (Irritation) и полом не найдена: rpb ( 60 ) = −.073, p = .58, ns . Эффекта нет. • Негативизм (Negativism) связан с полом: rpb ( 60 ) = .72, p < .001 . У мальчиков он выше, чем у девочек. Размер эффекта большой. • Обида (Resentment) связана с полом: rpb ( 60 ) = −.26, p = .048 . У мальчиков она ниже, чем у девочек. Размер эффекта средний. • Связь между подозрительностью (Suspicion and Distrust) и полом не найдена: rpb ( 60 ) = −.18, p = .18, ns . Размер эффекта маленький. В данной выборке девочки подозрительнее мальчиков. • Вербальная агрессия (Verbal Aggression) связана с полом: rpb ( 60 ) = .73, p < .001 . У мальчиков она выше, чем у девочек. Размер эффекта большой. • Связь между чувством вины (Guilt) и полом не найдена: rpb ( 60 ) = .067, p = .61, ns . Эффекта нет. 13 Отредактированная таблица. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 156 10.6. Размер эффекта для коэффициентов корреляции Коэффициент корреляции является часто используемой мерой размера эффекта: его значения для коэффициентов корреляции Пирсона, Спирмена и точечно-бисериального коэффициентов корреляции ± .10 представляют собой небольшой эффект, ± .30 - средний эффект, ± .50 - большой эффект (например, Field, 2009, p.173) или (Ellis, 2010, p.41): При изучении простой регрессии (п.18) будет показано, что квадрат коэффициента 2 корреляции Пирсона rXY равен доле дисперсии одной из переменных, которая объясняется действием другой переменной. Для квадрата коэффициента ранговой корреляции Спирмена rS2 интерпретация отличается только тем, что переменные выражены в рангах и доля дисперсии относится к рангам. 2 При наличии нормальных распределений переменных rS2 приблизительно равен rXY . Однако коэффициент ранговой корреляции τ-Кендалла по величине отличается от rS Спирмена и τ 2 не имеет интерпретации «доли дисперсии». Коэффициент ранговой корреляции τ-Кендалла по абсолютной величине на 66-75% меньше, чем абсолютная величина каждого из коэффициентов rS и rXY . Таким образом, если τ используется как размер эффекта, то следует иметь в виду, что он не сопоставим с rS и rXY и возведение его в квадрат не имеет смысла для интерпретации (Field, 2009; pp.192-193). Точечно-бисериальный коэффициент корреляции rpb и коэффициент корреляции φ также различаются по размеру. В более общем плане, при использовании корреляций в качестве размеров эффекта надо помнить (как при составлении собственного анализа, так и при интерпретации исследований других авторов), что выбор коэффициента корреляции может существенно повлиять на кажущийся размер эффекта. 10.7. Частная корреляция Иногда переменные X и Y могут коррелировать между собой только за счет того, что обе они согласованно меняются под влиянием некоторой третьей переменной Z. Связь Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 157 между X и Y может отсутствовать, но коэффициенты корреляции могут быть статистически значимыми. Это - ложная корреляция между X и Y. Для исключения такой «искажающей» третьей переменной, как Z, необходимо вычисление коэффициента частной корреляции X и Y с учетом Z (Partial Correlation) rXY −Z rXY − Z = ( rXY − rXZ rYZ )( 2 1 − rXZ 1 − rYZ2 ) . (10.7.1) Если частная корреляция X и Y с учетом Z ( rXY −Z ) по абсолютной величине существенно меньше абсолютной величины rXY , то скорее всего, именно Z является истинной причиной корреляции X и Y. Пример. Исследовалась связь между ростом и длиной волос (Наследов, 2005, сс.86-87). Корреляция оказалась отрицательной: r (15 ) = −.70**, p = .004 < .01 . Чем больше рост, тем короче волосы (Таблица 10.7.1) и наоборот. Таблица 10.7.1 Корреляционная матрица для признаков «Рост» – «Длина волос». Вся выборка Correlations Рост Рост Длина волос Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 . 15 -,700** ,004 15 Длина волос -,700** ,004 15 1 . 15 **. Correlation is significant at the 0.01 level (2-tailed). Таблица 10.7.2 Корреляционные матрицы для признаков «Рост» – «Длина волос». Выборки мужчин и женщин Correlationsa Correlationsa Рост Рост Длина волос Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N a. Пол = женский 1 . 8 -,113 ,790 8 Длина волос -,113 ,790 8 1 . 8 Рост Рост Длина волос Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 . 7 -,238 ,607 7 Длина волос -,238 ,607 7 1 . 7 a. Пол = мужской Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 158 При рассмотрении третьей переменной «Пол», оказалось что в группах мужчин и женщин по-отдельности корреляции нет ни в одной из групп (Таблица 10.7.2). Для получения частного коэффициента корреляции между переменными X и Y с учетом переменной Z надо задать следующие команды: Analyze Correlate Partial После чего распределить переменные, как показаны на Рис.10.7.1, и ОК. Рисунок 10.7.1. Диалоговое окно Partial Correlations с введенными переменными. Выходная информация содержится в Таблице 10.7.3. Таблица 10.7.3 Частная корреляция Correlations Control Variables Rost Correlation Рост Пол Significance (2-tailed) df Correlation Длина волос Significance (2-tailed) df Dlina volos 1.000 -.151 . .607 12 -.151 1.000 .607 . 12 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 159 Коэффициент частной корреляции равен rXY −Z = -.15, р = .61 ns. Обнаруженная связь между ростом и длиной волос оказалась ложной. Рост и длина волос коррелируют исключительно за счет пола. Частная корреляция между ними с учетом переменной «пол» оказалось малой и статистически незначимой (Рис.10.7.2). Рисунок 10.7.2. Связь между ростом и длиной волос. Корреляционная диаграмма с прямыми регрессии группы мужчин, группы женщин и объединенной группы. Пунктирная прямая является линией регрессии для всей группы. Красная прямая относится только к женщинам, синяя – только к мужчинам. Действительно, средний рост мужчин больше среднего роста женщин. Рост связан с полом. Средняя длина волос мужчин меньше средней длины волос женщин. Длина волос связана с полом. Как в выборке мужчин, так и в выборке женщины корреляции между ростом и длиной волос не наблюдается. Поэтому статистически значимая отрицательная корреляция между ростом и длиной волос во всей выборке оказалась ложной. «За редким исключением факт наличия или отсутствия корреляции может быть объяснен влиянием некоторой «третьей» переменной, упущенной из поля зрения исследователя. Таким образом, всегда остается возможность альтернативной интерпретации обнаруженной корреляции» (Наследов, 2005, с.87). Таким образом, если корреляция между переменными X и Y вызывает, с точки зрения здравого смысла, сомнение, а также имеется некоторая переменная Z, которая может «создать» эту корреляцию, то вычисляют коэффициент частной корреляции. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 160 Для выяснения того, оказывает ли переменная Z влияние на коэффициент корреляции между переменными X и Y: rXY , надо вычислить частный коэффициент корреляции между переменными X и Y с учетом переменной Z: rXY − Z . Если rXY − Z существенно меньше rXY и меняется p-value, то корреляция между переменными X и Y оказывается ложной. 10.8. Немонотонный характер связи Если коэффициент корреляции Пирсона или Спирмена, или Кендалла близок к нулю, это означает либо отсутствие связи, либо наличие немонотонной связи. Немонотонную связь иногда можно обнаружить при визуальном изучении корреляционной диаграммы. Первый способ. Если из теоретического анализа или из изучения корреляционных диаграмм вид связи остается неясным, то можно применить нелинейный регрессионный анализ. По величине и уровню значимости коэффициента детерминации можно выбрать наиболее вероятный вид связи. Затем разбить соответствующую переменную на интервалы монотонности (например, по методике, или по квартилям, или по корреляционным диаграммам с линией регрессии). На каждом из участков монотонности надо вычислить коэффициенты корреляции Пирсона или Спирмена, или Кендалла, которые могут оказаться статистически значимыми. Второй способ «предполагает отказ от коэффициентов корреляции. Необходимо ввести дополнительную номинальную переменную, которая делит исследуемую выборку на контрастные группы по одной из переменных. Далее можно изучать различия между этими группами по уровню выраженности» (Наследов, 2004, с.88). Третий способ. Разделить переменные на категории (например, по уровням выраженности: низкий, средний, высокий) и применить частотный анализ. Пример будет рассмотрен в п.16. 10.9. Частотный анализ От метрических или порядковых переменных можно перейти к номинальным переменным. Или с самого начала исходные данные могут быть измерены в номинальных шкалах. Тогда можно проводить частотный анализ. Наиболее часто используют критерий Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 161 χ 2 («Хи-квадрат», Chi-Square) Пирсона для сравнения распределений и критерий «Угловое преобразование Фишера» для сравнения долей Это позволяет сформулировать вывод о связи. Более подробно этот вопрос будет рассмотрен в пп.13-16. 10.10. Исследование связи, когда одна переменная количественная, а другая номинальная Если одна переменная количественная, а другая номинальная то для исследования связи между ними коэффициент корреляции не подходит. Изучение такой связи возможно при помощи сравнения групп, выделяемых по категориям номинальной переменной. Группы сравниваются по уровню выраженности количественной переменной. 10.11. Исследование связи между номинальными переменными Связь между переменными, измеренными в номинальной шкале (а также в порядковой шкале, но не с очень большим количеством категорий), лучше всего представить в форме таблиц сопряженности (Crosstabs). Таблица сопряженности – это таблицы совместного распределения частот двух или более номинальных признаков, измеренных на одной группе объектов. Например, таблица для двух признаков: стратегии поведения старшеклассников в конфликтной ситуации и самооценка (Таблица 10.11.1). Статистическая значимость связи определяется с помощью критерия для сравнения распределений – «Хи»-квадрат Пирсона (Pearson’s Chi-square Test). Этот тест проверяет, есть ли значимое различие между наблюдаемыми и ожидаемыми частотами (Гласс & Стенли, 1976; c.180). Теоретические частоты nti вычисляются по формуле: nti = ( Сумма частот строки ) ⋅ ( Сумма частот столбца ) , n (10.11.1) где суммы частот берутся из Таблицы 10.11.1: Например, теоретическая частота для эмпирической частоты 22 (Заниженная самооценка – Компромисс) будет равна Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 162 nei = 63*52 = 25.7953 . 127 Исследование связи с применением критерия – «Хи»-квадрат Пирсона будет рассмотрено подробно в п.12. Таблица 10.11.1 Таблица сопряженности. Связь между стратегиями поведения старшеклассников в конфликтной ситуации и самооценкой Соперничество Заниженная самооценка Адекватная самооценка Суммы Стратегия поведения Сотрудничество Компромисс Избегание Приспособление Суммы 20 5 22 6 10 63 10 6 30 3 15 64 30 11 52 9 25 n=127 10.12. Схема исследования связи В Таблице 10.12.1 классифицированы методы исследования связи в соответствии с измерительными шкалами. Таблица 10.12.1 Исследование связи (Наследов, 2004, с.113) Типы шкал I. X, Y - количественные II. X, Y – номинальные Задачи: Корреляционный анализ Частотный анализ: а) Коэффициент rПирсона для нормально распределенных X,Y; б) rS − Спирмена, τ − Методы: Кендалла для неноминальных X и Y. в) частная корреляция и сравнение корреляций; Тесты χ 2 − Пирсона, «Угловое преобразование Фишера». III. X - номинальный, Y - количественный Сравнения выборок по уровню выраженности признака Методы сравнения Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 163 11. Связь между самооценкой и агрессией подростков Рассмотрим пример, как решить задачу об исследовании связи между самооценкой и агрессией подростков с применением компьютерных программ SPSS и Excel. Агрессия подростков измерялась с помощью методики Басса-Дарки (Бартышев, 2005, сс.195-200). Самооценка подростков измерялась с помощью методики Дембо-Рубинштейна (2008)34. Гипотеза работы: «Существует связь между самооценкой и агрессией в подростковом возрасте». Обозначения35, 36: Self-Esteem (SE) Самооценка Physical aggression (PhA) Физическая агрессия Indirect (IA) Косвенная агрессия Irritation (I) Раздражение Negativism (N) Негативизм Resentment (R) Обида Suspicion (S) Подозрительность Verbal aggression (VA) Вербальная агрессия Guilt (G) Чувство вины 34 Ярославский государственный педагогический университет им. К.Д. Ушинского. Отдел образовательных информационных технологий. Измерение самооценки по методике Дембо-Рубинштейн. http://citoweb.yspu.org/link1/metod/met35/node33.html 35 Questionnaire Bass-Darky. Retrieved from http://ecowoman-english.tk/articles.php?id=35667 36 Bakholdina, V., Bakholdina, D.,Movsesiana, A.A., & Stupina, K.S. (2014). On Certain Aspects of DemboRubinstein Method of Self-Esteem Measurement. Procedia - Social and Behavioral Sciences 140, 547 – 552. Retrieved from https://www.sciencedirect.com/science/article/pii/S1877042814033941 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 164 Таблица 11.1 Исходные данные. Фрагмент таблицы Code SE PhA IA I N R S VA G 1 81 9 7 5 3 5 5 7 5 2 85 8 7 6 3 4 2 5 6 3 77 9 8 4 4 3 4 6 2 4 91 7 7 5 5 3 5 7 2 5 79 9 8 8 1 3 3 6 2 и так далее... Полностью37 Таблица 11.1 приведена в файле: Self-Esteem_Aggression_Data.xlsx. 11.1. Ввод данных 1. Загрузить SPSS 2. Type in data ОК 3. Variable View Введем описание всех переменных из Таблицы 11.1. 3.1. В ячейку Name 1 введем слово Code После этого в остальных ячейках строки 1 появится некоторая информация. 3.2. Type – тип переменной Numeric String (Рис.11.1.1) OK 3.3. Width – формат столбца: 8 3.4. Decimals: - количество знаков после запятой - 0 3.5. Label: None 3.6. Values: None 3.7. Missing: None 37 Данные взяты из дипломной работы студентки Высшей школы психологии (Сейчас Балтийский институт психологии и менеджмента- БИМП) Татьяны Инкиной, выполненной в 2003-2004 учебном году. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 165 3.8. Columns: 8 3.9. Align: Left 3.10. Measure: Nominal Рисунок 11.1.1. Тип переменной - строка Сохранить файл под названием: Self-Esteem_Aggression.sav. «Cамооценка» „SE” 3.11. В ячейку Name 2 напишем слово SE 3.12. Type Numeric 3.13. Width – 8 3.14. Decimals: 3.15. Label: Self-Esteem 3.16. Values: None 3.17. Missing: None 3.18. Columns: 8 3.19. Align: Right 3.20. Measure: Scale «Физическая агрессия» 3.21. В ячейку Name 3 напишем слово PhA 3.22. Type Numeric 3.23. Width – 8 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 166 3.24. Decimals: 3.25. Label: Physical Aggression 3.26. Values: None 3.27. Missing: None 3.28. Columns: 8 3.29. Align: Right 3.30. Measure: Scale «Косвенная агрессия» 3.31. В ячейку Name 4 напишем слово IA 3.32. Type Numeric 3.33. Width – 8 3.34. Decimals: 3.35. Label: Indirect Aggression 3.36. Values: None 3.37. Missing: None 3.38. Columns: 8 3.39. Align: Right 3.40. Measure: Scale «Раздражение» 3.41. В ячейку Name 5 напишем слово I 3.42. Type Numeric 3.43. Width – 8 3.44. Decimals: 3.45. Label: Irritation 3.46. Values: None 3.47. Missing: None 3.48. Columns: 8 3.49. Align: Right 3.50. Measure: Scale И так далее. В результате должно получиться (Рис.11.1.2): Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 167 Рисунок 11.1.2. Вид переменных. Фрагмент. В окно Data View скопировать данные из Excel (Рис.11.1.3). Рисунок 11.1.3. Вид данных (таблица далее продолжается). 11.2. Описательная статистика и проверка нормальности распределения данных Analyze Descriptive Statistics Frecuencies Убрать галочку с “Display frequencies tables” Перенести переменные (кроме Code) в окно “Variables”: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 168 Statistics... Расставить соответствующие галочки: Quartiles, Mean, Median, Std. deviation, Range, Minimum, Maximum, S.E. mean, Skewness, Kurtosis. Continue Charts... Расставить соответствующие галочки: Histograms, With normal curve Continue OK 11.2.1. Показатели описательной статистики Полученную Таблицу 11.2.1.1 желательно перевести в Excel, округлить показатели описательной статистики до двух знаков после запятой и выделить все случаи, когда показатели асимметрии и эксцесса по абсолютной величине превосходят свои стандартные ошибки. В этих случаях распределение данных не соответствует нормальному распределению. В результате получится Таблица 11.2.1.2. 11.2.2. Гистограммы с нормальной кривой В выходном файле также появятся гистограммы с нормальной кривой (Рис.11.2.2.111.2.2.9), позволяющие визуально сравнить эмпирическое распределение данных с нормальным распределением. Все рисунки отредактированы в SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 169 Таблица 11.2.1.1 145 145 62.30 5.36 4.70 5.56 2.89 3.41 3.66 5.50 3.99 1.19 0.22 0.20 0.17 0.11 0.13 0.12 0.16 0.16 Median 62.33 5.00 5.00 5.00 3.00 3.00 4.00 6.00 4.00 Std. Deviation 14.27 2.66 2.42 2.06 1.28 1.58 1.50 1.88 1.94 Skewness -0.14 0.04 0.14 -0.12 0.17 0.31 0.64 -0.26 -0.04 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 -0.77 -1.38 -1.26 -0.64 -0.89 -0.02 0.52 -0.40 -0.32 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 Range 60.34 10.00 8.00 8.00 5.00 8.00 8.00 8.00 9.00 Minimum 31.16 0.00 1.00 1.00 0.00 0.00 1.00 1.00 0.00 Maximum 91.50 10.00 9.00 9.00 5.00 8.00 9.00 9.00 9.00 25 52.91 3.00 2.00 4.00 2.00 2.00 2.00 4.50 2.00 50 62.33 5.00 5.00 5.00 3.00 3.00 4.00 6.00 4.00 75 71.58 8.00 7.00 7.00 4.00 5.00 5.00 7.00 5.00 Mean Std. Error of Mean Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles Guilt 145 Verbal 145 Distrust 145 Missing Aggression Suspicion and Resentment Irritation 145 Negativism Aggression 145 Indirect 145 Valid Physical 145 N Aggression Self-Esteem Описательные статистики (после редактирования и округления) Рисунок 11.2.2.1. Гистограмма с нормальной Рисунок 11 .2.2.2. Гистограмма с кривой. Cамооценка. нормальной кривой. Физическая агрессия. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 170 Рисунок 11.2.2.3. Гистограмма с нормальной кривой. Косвенная агрессия. Рисунок 11.2.2.4. Гистограмма с нормальной кривой. Негативизм. 11.2.2.6. Гистограмма Рисунок 11.2.2.5. Гистограмма с нормальной Рисунок нормальной кривой. Обида. кривой. Раздражение. Рисунок 11.2.2.7. Гистограмма с нормальной кривой. Подозрительность. с Рисунок 11.2.2.8. Гистограмма с нормальной кривой. Вербальная агрессия. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 171 Рисунок 11.2.2.9. Гистограмма с нормальной кривой. Чувство вины. 11.2.3. Критерий Колмогорова-Смирнова Лиллифора и критерий Шапиро-Уилкса в модификации Analyze Descriptive Statistics Explore.... Рисунок 11.2.3.1. Диалоговое окно Explore. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 172 Перенести в Dependent List переменные (Рис.11.2.3.1) Display Plots Plots Normally plots with tests (Рис. 11.2.3.2) Continue OK Рисунок 11.2.2.2. Заказ тестов на нормальность распределения. Сохранить выходной файл под именем S_A_Results.spv. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 173 Выходные данные Таблица 11.2.3.1 «Case Processing Summary» - Обработанные наблюдения Cases Valid N Missing Percent N Total Percent N Percent Self-Esteem 145 100.0% 0.0% 145 100.0% Physical Aggression 145 100.0% 0.0% 145 100.0% Indirect Aggression 145 100.0% 0.0% 145 100.0% Irritation 145 100.0% 0.0% 145 100.0% Negativism 145 100.0% 0.0% 145 100.0% Resentment 145 100.0% 0.0% 145 100.0% Suspicion and Distrust 145 100.0% 0.0% 145 100.0% Verbal Aggression 145 100.0% 0.0% 145 100.0% Guilt 145 100.0% 0.0% 145 100.0% Таблица 11.2.3.2 Tests of Normality (Тесты на нормальность) Kolmogorov-Smirnova Statistic df Shapiro-Wilk Sig. Statistic df Sig. Self-Esteem .085 145 .012 .975 145 .009 Physical Aggression .157 145 .000 .913 145 .000 Indirect Aggression .137 145 .000 .925 145 .000 Irritation .152 145 .000 .950 145 .000 Negativism .185 145 .000 .916 145 .000 Resentment .144 145 .000 .944 145 .000 Suspicion and Distrust .189 145 .000 .866 145 .000 Verbal Aggression .146 145 .000 .959 145 .000 Guilt .172 145 .000 .945 145 .000 a. Lilliefors Significance Correction Для ответа на вопрос, отличается ли распределение данных от нормального распределения, необходимо проанализировать столбцы Таблицы 11.2.3.2 «Sig» – это р-value; При Sig. < .05 распределение значимо отличается от нормального распределения. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 174 Из Таблицы 11.2.3.2 видно, что распределение всех данных отличается от нормального распределения. Вместе с таблицей «Tests of Normality» появляются Normal Q-Q Plots – (квантильные диаграммы Q-Q), по которым визуально можно определить, достаточно ли близко заданное распределение приближается к нормальному распределению. Каждое наблюдаемое значение сравнивается со значением, ожидаемым при нормальном распределении. При условии точного выполнения нормального распределения все точки лежат на прямой. На Рис. 11.2.3.3 эти диаграммы приведены для переменной FA (физическая агрессия). По осям отложены процентили эмпирические (Х) и теоретические (Y) (Наследов, 2004; сс.59-60). Также появляются Detrended Normal Q-Q Plots (диаграммы с исключенным трендом). На этих диаграммах изображены отклонения наблюдаемых значений от ожидаемых значений при нормальном распределении в зависимости от наблюдаемых значений. В случае нормального распределения все точки лежат на горизонтальной прямой, проходящей через нуль. Все значения переведены в стандартизованные z-оценки. На Рис. 11.2.3.4 эти диаграммы приведены для переменной FA (физическая агрессия). Рисунок 11.2.2.3. Диаграмма диаграммы Q-Q. Физическая агрессия. Рисунок 11.2.2.4. Диаграмма с исключенным трендом. Физическая агрессия. 11.2.4. Графическая иллюстрация: Boxplots По переменной «Самооценка» и по шкалам агрессивности коробчатые диаграммы заказываются отдельно. Процедура получения коробчатых диаграмм уже известная. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 175 Получение коробчатых диаграмм Analyze Descriptive Statistics Explore Из списка зависимых переменных убрать Self-Esteem [SE]. Plots Plots Рисунок 11.2.4.1. Заказ коробчатых диаграмм. Continue (Рис. 11.2.4.2) OK Повторить заказ, вернув переменную Self-Esteem [SE] в список зависимых переменных и убрав из него все остальные переменные. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 176 Рисунок 11.2.4.2. Коробчатые диаграммы для шкал агрессивности. Рисунок 11.2.4.3. Коробчатая диаграмма для самооценки 11.3. Вычисление коэффициентов корреляции Если распределение данных между двумя переменными не отличается от нормального, то вычисляют коэффициент корреляции Пирсона. Если распределение данных хотя бы для одной из переменных отличается от нормального распределения, то вычисляют коэффициенты ранговой корреляции Спирмена и τ (Тау)-Кендалла. В нашем случае распределения всех переменных отличаются от нормального распределения. Поэтому выбираем коэффициенты Спирмена и «Тау»-Кендалла. Analyze Correlate Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 177 Bivariate... Переносим в окно Variables переменные и ставим галочки у Kendall’s tau-b и Spearman (Рис.11.3.1) OK Рисунок 11.3.1. Заказ коэффициентов корреляции Выходные данные В результате получаем корреляционную матрицу, состоящую из двух частей: коэффициенты корреляции Спирмена и коэффициенты корреляции Кендалла (Таблица 11.3.1). Корреляционные таблицы симметричны относительно главной диагонали корреляционной матрицы (из верхнего левого угла – в правый нижний). Для определения связи с самооценкой достаточно рассмотреть или первую строчку, или первый столбец корреляционных матриц (Таблица 11.3.1). Все коэффициенты корреляции в первой строке (соответственно в первом столбце) являются статистически незначимыми, поскольку все Sig. (2-tailed) > .05. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 178 Поэтому монотонной связи не обнаружено. Возможно, что есть немонотонная связь. Таблица 11.3.1 Коэффициенты ранговой корреляции Спирмена и Кендалла для всей выборки SelfEsteem Kendall's Self-Esteem tau_b Physical Aggression Correlation Coefficient Irritation Resentment Suspicion and Distrust Verbal Aggression Guilt Spearma Self-Esteem n's rho Physical Aggression Irritation Resentment Suspicion and Distrust Verbal Aggression Guilt Suspicion Verbal and Aggression Distrust Guilt .002 -.028 -.075 .013 .042 .112 -.011 .045 .979 .632 .213 .836 .490 .071 .851 .463 145 145 145 145 145 145 145 Correlation Coefficient .002 1.000 ** ** -.181 .005 -.035 .013 ** .979 .487 .000 ** Sig. (2-tailed) .461 .000 .589 .848 .388 .000 -.142 .026 Correlation Coefficient * 145 145 145 145 145 145 145 145 145 -.028 ** 1.000 .486 .000 ** -.188 .004 ** -.044 .011 ** -.088 Sig. (2-tailed) .632 .461 .000 .498 .865 .319 .000 N 145 145 145 145 145 145 145 145 145 -.075 .487 .000 ** .486 .000 ** 1.000 -.258 .000 ** -.104 -.030 ** .106 .648 .338 .000 -.145 .025 Correlation Coefficient .213 .167 * N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .013 ** ** -.258 .000 1.000 .103 -.014 ** .121 .834 -.230 .000 -.054 .836 -.188 .004 ** Sig. (2-tailed) -.181 .005 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .042 -.035 -.044 -.104 .103 1.000 -.019 -.045 .008 Sig. (2-tailed) .490 .589 .498 .106 .121 .773 .487 .902 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .112 .013 .011 -.030 -.014 -.019 1.000 .066 -.038 Sig. (2-tailed) .071 .848 .865 .648 .834 .773 .320 .572 N 145 145 145 145 145 145 145 145 145 -.011 ** .319 .000 ** .338 .000 ** -.230 .000 ** -.045 .066 1.000 -.006 Correlation Coefficient .419 Sig. (2-tailed) .851 .388 .000 .487 .320 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .045 * -.088 * .008 -.038 -.006 1.000 .463 .167 -.145 .025 -.054 Sig. (2-tailed) -.142 .026 .419 .902 .572 .926 N 145 145 145 145 145 145 145 145 145 1.000 .018 -.027 -.111 .016 .060 .150 -.055 .060 .474 Correlation Coefficient Sig. (2-tailed) .926 .826 .746 .183 .845 .474 .071 .508 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .018 1.000 ** ** -.233 .005 -.048 .017 ** .826 .644 .000 ** Sig. (2-tailed) .628 .000 .570 .840 .524 .000 -.183 .027 Correlation Coefficient * 145 145 145 145 145 145 145 145 145 -.027 ** 1.000 .627 .000 ** -.239 .004 ** -.060 .014 ** -.115 Sig. (2-tailed) .746 .628 .000 .476 .869 .427 .000 N 145 145 145 145 145 145 145 145 145 -.111 .644 .000 ** .627 .000 ** 1.000 -.324 .000 ** -.132 -.035 ** .112 .679 .451 .000 -.184 .026 Correlation Coefficient Sig. (2-tailed) Negativism Resentment 145 N Indirect Aggression Negativism 145 Sig. (2-tailed) Negativism Irritation N N Indirect Aggression 1.000 Sig. (2-tailed) Physical Indirect Aggression Aggression .183 .170 * N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .016 ** ** -.324 .000 1.000 .128 -.017 ** .126 .839 -.289 .000 -.069 .845 -.239 .004 ** Sig. (2-tailed) -.233 .005 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .060 -.048 -.060 -.132 .128 1.000 -.023 -.063 .007 Sig. (2-tailed) .474 .570 .476 .112 .126 .781 .453 .929 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .150 .017 .014 -.035 -.017 -.023 1.000 .083 -.047 Sig. (2-tailed) .071 .840 .869 .679 .839 .781 .323 .573 N 145 145 145 145 145 145 145 145 145 -.055 ** .427 .000 ** .451 .000 ** -.289 .000 ** -.063 .083 1.000 -.009 Correlation Coefficient .408 Sig. (2-tailed) .508 .524 .000 .453 .323 N 145 145 145 145 145 145 145 145 145 Correlation Coefficient .060 * -.115 * .007 -.047 -.009 1.000 .474 .170 -.184 .026 -.069 Sig. (2-tailed) -.183 .027 .408 .929 .573 .910 N 145 145 145 145 145 145 145 145 .910 145 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 179 Если, все же, попробовать вычислить коэффициенты корреляции Пирсона (поставив «галочку» у Pearson на Рис.11.3.1), то в результате получится корреляционная матрица (Таблица 11.3.2). Коэффициент корреляции Пирсона для переменных «СамооценкаПодозрительность», равный .166 оказался статистически значимым р = .046 < .05. Но вряд ли эту связь можно считать выявленной: ведь асимметрия по переменной «Подозрительность» равна 0.644, что более, чем в три раза превышает ее стандартную ошибку, равную 0.201. Кроме того, по корреляционной диаграмме «Самооценка Подозрительность» также трудно предположить существование связи. Таблица 12.3.2 Коэффициенты корреляции Пирсона для всей выборки SelfEsteem Self-Esteem Pearson Correlation Physical Indirect Aggression Aggression 1 N Pearson Correlation Sig. (2-tailed) N Indirect Aggression Negativism Resentment -.093 .073 .264 .386 145 145 145 145 -.065 .040 ** -.203* .015 -.150 .052 .069 .728 .451 .072 .534 .411 145 145 145 145 145 -.029 1 ** ** ** .440 .634 .672 .000 .668 .000 -.265 .001 .535 .000 145 145 145 145 145 145 145 145 145 -.063 1 .632** .000 -.261** .002 -.069 .005 -.149 Sig. (2-tailed) .451 .409 .948 N 145 145 145 145 145 145 145 145 145 -.150 .632** .000 1 -.355** .000 -.149 -.025 .073 .766 .426** .000 -.186* .025 .073 Sig. (2-tailed) .072 .668** .000 N 145 145 145 145 145 145 145 145 145 Pearson Correlation .052 -.261** .002 -.355** .000 1 .119 .056 -.062 Sig. (2-tailed) .534 -.265** .001 .155 .502 -.272** .001 N 145 145 145 145 145 145 145 145 145 Pearson Correlation .069 -.065 -.069 -.149 .119 1 -.095 -.039 -.012 Sig. (2-tailed) .411 .440 .409 .073 .155 .254 .641 .888 N 145 145 145 145 145 145 145 145 145 * 1 .042 -.057 .614 .499 N Guilt .166* .046 -.063 .728 Guilt .403** .000 Suspicion and Pearson Correlation Distrust Sig. (2-tailed) Verbal Aggression Suspicion Verbal and Aggression Distrust .672** .000 Pearson Correlation Pearson Correlation Irritation Negativism Resentment -.029 Sig. (2-tailed) Physical Aggression Irritation .455 .166 .046 .040 .005 -.025 .056 -.095 .634 .948 .766 .502 .254 145 145 145 145 145 145 145 145 145 -.093 .403** .000 .426** .000 -.272** .001 -.039 .042 1 -.025 Sig. (2-tailed) .264 .535** .000 .641 .614 N 145 145 145 145 145 145 145 145 145 Pearson Correlation .073 -.149 -.012 -.057 -.025 1 .386 .073 -.186* .025 -.062 Sig. (2-tailed) -.203* .015 .455 .888 .499 .767 N 145 145 145 145 145 145 145 145 Pearson Correlation .767 145 *. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed). 11.4. Корреляционные диаграммы Любая задача, связанная с исследованием связи, нуждается в изучении корреляционных диаграмм (Рис.11.4.3-11.4.10). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 180 Graphs Legacy Dialogs Scatter/Dot... Рисунок 11.4.1. Заказ корреляционных диаграмм Define Появится диалоговое окно (Рис.11.4.2), в которое надо внести пару переменных, связь между которыми изучается. Рисунок 11.4.2. Заказ корреляционных диаграмм OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 181 На Рис.11.4.3-11.4.10 показаны полученные корреляционные диаграммы, которые отредактированы в SPSS. Представление в научных отчетах корреляционных диаграмм при изучении корреляционной связи является обязательным. На некоторых корреляционных диаграммах (Рис.11.4.3-11.4.5, 11.4.9) видно, что должна быть немонотонная (скорее всего квадратическая – виде параболы) связь. По остальным рисункам трудно что-либо сказать о связи. Но надо помнить, что несколько одинаковых пар наблюдений изображаются на корреляционной диаграмме одной точкой. Поэтому необходимо провести дополнительное исследование. Статистически незначимые коэффициенты корреляции и корреляционные диаграммы свидетельствуют в пользу того, что связь между самооценкой и агрессией может оказаться нелинейной. Поэтому есть смысл исследовать нелинейные корреляционные связи. В качестве «разведывательного» метода исследования целесообразно применить нелинейный регрессионный анализ. Рисунок 11.4.3. Самооценка – Физическая агрессия. Рисунок 11.4.4. Самооценка – Косвенная агрессия. Рисунок 11.4.5. Самооценка – Раздражение, Рисунок 11.4.6. Самооценка – Негативизм. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 182 Рисунок 11.4.7. Самооценка – Обида. Рисунок 11.4.8. Самооценка – Подозрительность. Рисунок 11.4.9. Самооценка – Вербальная агрессия. Рисунок 11.4.10. Самооценка – Чувство вины. 11.5. Нелинейный регрессионный анализ. Выбор вида связи регрессии Настоящий параграф посвящен лишь одному из аспектов Регрессионного анализа выбору вида связи. При корреляционной связи точки на корреляционной диаграмме группируются вдоль некоторой линии, которая "наилучшим" образом приближена ко всем точкам в совокупности. Эта линия является графиком некоторой функции ŷ = f ( x ) . (11.5.1) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 183 Уравнение (11.5.1) называют выборочным уравнением регрессии Y на Х, а график функции ŷ = f ( x ) - выборочной линией регрессии Y на Х. Если ŷ = f ( x ) линейная функция: yˆ = f ( x ) = b0 + b1 x, ( b1 ≠ 0 ) , (11.5.2) то уравнение (11.5.2) называют уравнением линейной регрессии, а график функции ŷ = b0 + b1 x - прямой регрессии Y на Х. Параметры линии регрессии определяют так, чтобы линия регрессии наилучшим образом ложилась на полученную систему точек. Линию регрессии (Regression Line) обычно строят «методом наименьших квадратов»: сумма квадратов отклонений (вычисленных по оси Y) от каждой точки диаграммы рассеивания до линии является минимальной. Например, отклонением от точки ( xi ; y i ) до прямой регрессии с уравнением ŷ = b0 + b1 x называют разность: ei = yi − yˆi = yi − ( b1 xi + b0 ) (11.5.3) (Рис.11.5.1). Фрагмент корреляционной диаграммы Y X Рисунок 11.5.1. Фрагмент корреляционной диаграммы с прямой регрессии. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 184 С помощью компьютерной программы SPSS можно построить следующие линии регрессии, которые наиболее часто встречаются на практике: линейная модель (LIN): ŷ = b0 + b1 x , (11.5.4) квадратическая модель (QUA): ŷ = b0 + b1 x + b2 x2 , (11.5.5) кубическая модель (CUB): ŷ = b0 + b1 x + b2 x2 + b3 x3 . (11.5.6) Y – зависимая переменная (Dependent Variable); Х – независимая переменная (Independent Variable). Доля вариации зависимой переменной, обусловленная влиянием независимой переменной, называется коэффициентом детерминации (R-square). Коэффициент детерминации показывает, в какой степени изменчивость одной переменной обусловлена влиянием другой переменной, а не случайными факторами. Чем ближе R-square к единице, тем меньше разброс значений Y относительно линии регрессии, тем сильнее зависимость Y от Х. В случае линейной модели коэффициент детерминации совпадает с квадратом 2 коэффициента корреляции Пирсона: R-square = rXY и имеет смысл доли дисперсии зависимой переменной, обусловленная влиянием независимой переменной. Обработка на компьютере Analyze Regression Curve Estimation (Оценка с помощью кривой, подгон кривых) В появившемся окне надо выбрать переменные по соответствующим осям и поставить галочки у предлагаемых моделей функций: линейной, квадратической и кубической. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 185 Рисунок 11.5.2. Заказ регрессионного анализа: линейная, квадратическая и кубическая модели. OK Выходные данные для выбора линии регрессии Самооценка – Физическая агрессия Таблица 11.5.1 Описание модели (Model Description) Model Name Dependent Variable Equation 1 1 2 3 Independent Variable Constant Variable Whose Values Label Observations in Plots Tolerance for Entering Terms in Equations MOD_1 Physical Aggression Linear Quadratic Cubic Self-Esteem Included Unspecified .0001 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 186 Таблица 11.5.2 Обработанные наблюдения (Case Processing Summary) N Total Cases Excluded Casesa Forecasted Cases Newly Created Cases 145 a. Cases with a missing value in any variable are excluded from the analysis. Таблица 11.5.3 Описание переменных (Variable Processing Summary) Variables Number of Positive Values Number of Zeros Number of Negative Values Number of Missing Values Dependent Independent Physical Aggression Self-Esteem User-Missing 144 1 145 System-Missing Таблица 11.5.4 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Physical Aggression Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .001 .121 1 143 .728 5.697 -.005 Quadratic .502 71.538 2 142 .000 35.817 -1.044 .008 Cubic .502 47.363 3 141 .000 36.821 -1.097 .009 -4.797E-6 The independent variable is Self-Esteem. Рисунок 11.5.3. Корреляционная диаграмма с линиями линейной, квадратической и кубической регрессии. Самооценка - физическая агрессия. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 187 Замечания: 1. R-square - коэффициент детерминации. Коэффициенты детерминации равны: для линейной модели: R-square = .000; для квадратической модели: R-square = .502; для кубической модели: R-square = .502. 2. В столбце «F» указаны наблюдаемые значения F-критерия для проверки статистической значимости коэффициента детерминации R-square. 3. По столбцу «Sig.» проверяется статистическая значимость коэффициента детерминации. Если Sig. ≤ .05, то R-square значим (уровень значимости α = .05), Sig. ≤ .01, то R-square очень значим (уровень значимости α = .01), Sig. ≤ .001, то R-square максимально значим (уровень значимости α = .001). Максимально значимые коэффициенты детерминации R-square имеются для квадратической и кубической моделей. 4. Столбцы b0, b1, b2, b3 – это значения параметров в соответствующих уравнениях регрессии. Таблица 11.5.5 Регрессионные модели в задаче связи независимой переменной – самооценки и зависимой переменной – физической агрессии Модели Линейная Уравнение в общем виде ŷ = b0 + b1 x Полученное уравнение yˆ = −0.005 + 5.697 ⋅ x Квадратическая ŷ = b0 + b1 x + b2 x 2 yˆ = 35.817 − 1.044 x + 0.008 x 2 Кубическая ŷ = b0 + b1 x + b2 x2 + b3 x3 yˆ = 36.821 − 1.097 x + 0.009 x 2 − 0.000005x3 Переменная x- это самооценка, а переменная y- физическая агрессия. В данном случае квадратическая модель мало отличается от кубической, но является более простой, поэтому выбираем квадратическую модель. 5. Уравнение yˆ = 35.817 − 1.044 x + 0.008 x 2 может служить для прогноза агрессии по самооценке. Например, если показатель самооценки некоторого подростка равен x=40, то прогнозируемый показатель этой агрессии будет равен: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 188 yˆ = 35.817 − 1.044 ⋅ 40 + 0.008 ⋅1600 = 6.857 ≈ 6.9 , (Рис.11.5.3). 6. Как видно из графика, квадратическая линия и кубическая практически неразличимы. Физическая агрессия - Самооценка Меняем переменные «Самооценка» и «Физическая агрессия» местами. Analyze Regression Curve Estimation Рисунок 11.5.4. Заказ регрессионного анализа: переменные меняются местами. OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 189 Таблица 11.5.6 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 Linear .001 .121 1 143 .728 63.137 Quadratic .002 .128 2 142 .880 64.894 -1.010 Cubic .019 .921 3 141 .432 53.761 b2 b3 -.156 8.314 .079 -2.007 .133 The independent variable is Physical Aggression. Статистически значимых отличий коэффициента детерминации от нуля не выявлено. При изменении физической агрессии самооценка у подростков меняется случайным образом. Рисунок 11.5.5. Корреляционная диаграмма с линиями линейной, квадратической и кубической регрессии. Физическая агрессия – самооценка. Аналогичное исследование проводим для оставшихся случаев. Самооценка – Косвенная агрессия Таблица 11.5.7 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Indirect Aggression Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .004 .572 1 143 .451 5.362 -.011 Quadratic .443 56.366 2 142 .000 30.953 -.893 .007 Cubic .443 37.437 3 141 .000 26.663 -.666 .003 2.051E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.11.5.6). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 190 Косвенная агрессия - Самооценка Таблица 11.5.8 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .004 .572 1 143 .451 64.050 -.373 Quadratic .006 .412 2 142 .663 61.878 .811 -.122 Cubic .007 .325 3 141 .807 58.794 3.587 -.781 .045 The independent variable is Indirect Aggression. При изменении косвенной агрессии самооценка меняется случайным образом. (Рис.11.5.7). Рисунок 11.5.6. Самооценка - Косвенная агрессия. Рисунок 11.5.7. Косвенная агрессия – Самооценка. Самооценка – Раздражение Таблица 11.5.9 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Irritation Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .022 3.288 1 143 .072 6.905 -.022 Quadratic .416 50.539 2 142 .000 27.546 -.733 .006 Cubic .417 33.652 3 141 .000 22.746 -.480 .002 2.295E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.11.5.8). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 191 Раздражение - Самооценка Таблица 11.5.10 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .022 3.288 1 143 .072 68.080 -1.040 Quadratic .034 2.470 2 142 .088 60.232 2.329 -.310 Cubic .039 1.900 3 141 .132 50.899 9.811 -1.950 b3 .105 The independent variable is Irritation При изменении «раздражения» самооценка меняется случайным образом. (Рис.11.5.9). Рисунок 11.5.8. Самооценка – Раздражение. Рисунок 11.5.9. Раздражение – Самооценка. Самооценка – Негативизм Таблица 11.5.11 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Negativism Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .003 .390 1 143 .534 2.599 .005 Quadratic .042 3.101 2 142 .048 -1.436 .144 -.001 Cubic .043 2.117 3 141 .101 -4.229 .291 -.004 1.335E-5 The independent variable is Self-Esteem. Возможна квадратическая модель (Рис.11.5.10). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 192 Негативизм - Самооценка Таблица 11.5.12 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .003 .390 1 143 .534 60.614 Quadratic .004 .304 2 142 .739 63.073 -1.422 .335 Cubic .021 1.017 3 141 .387 50.581 17.105 -7.109 b3 .583 .861 The independent variable is Negativism. При изменении негативизма самооценка меняется случайным образом. (Рис.12.5.11). Рисунок 11.5.10. Самооценка – Негативизм. Рисунок 11.5.11. Негативизм – Самооценка. Самооценка – Обида Таблица 11.5.13 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Resentment Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .005 .681 1 143 .411 2.931 .008 Quadratic .029 2.143 2 142 .121 -1.037 .144 -.001 Cubic .031 1.518 3 141 .212 3.338 -.087 .003 b3 -2.092E-5 The independent variable is Self-Esteem. При изменении самооценки «обида» меняется случайным образом. (Рис.11.5.12). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 193 Обида - Самооценка Таблица 11.5.14 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .005 .681 1 143 .411 60.185 .621 Quadratic .007 .516 2 142 .598 62.430 -.902 .209 Cubic .010 .474 3 141 .701 65.741 -4.647 1.297 b3 -.089 The independent variable is Resentment. При изменении «обиды» самооценка меняется случайным образом (Рис.11.5.13). Рисунок 11.5.12. Самооценка – Обида. Рисунок 11.5.13. Обида – Самооценка. Самооценка – Подозрительность Таблица 11.5.15 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Suspicion and Distrust Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .028 4.061 1 143 .046 2.566 .017 Quadratic .029 2.110 2 142 .125 1.717 .047 .000 Cubic .033 1.628 3 141 .186 8.035 -.287 .005 b3 -3.020E-5 The independent variable is Self-Esteem. Возможна линейная модель (Рис.11.5.14). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 194 Подозрительность - Самооценка Таблица 11.5.16 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .028 4.061 1 143 .046 56.527 1.579 Quadratic .029 2.149 2 142 .120 59.250 .038 .186 Cubic .031 1.486 3 141 .221 52.075 5.904 -1.176 b3 .093 The independent variable is Suspicion and Distrust. Возможна линейная модель (Рис.11.5.15). Рисунок 11.5.14. Самооценка – Подозрительность. Рисунок 11.5.15. Подозрительность – Самооценка. Самооценка – Вербальная агрессия Таблица 11.5.17 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Verbal Aggression Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .009 1.258 1 143 .264 6.269 -.012 Quadratic .239 22.352 2 142 .000 20.702 -.510 .004 Cubic .242 15.042 3 141 .000 14.327 -.173 -.002 b3 3.048E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.11.5.16). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 195 Вербальная агрессия - Самооценка Таблица 11.5.18 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .009 1.258 1 143 .264 66.204 -.710 Quadratic .151 12.676 2 142 .000 36.024 12.455 -1.251 Cubic .192 11.201 3 141 .000 67.375 -11.352 3.820 b3 -.322 The independent variable is Verbal Aggression. Выбираем квадратическую модель (Рис.11.5.17). Рисунок 11.5.16. Самооценка - Вербальная агрессия. Рисунок 11.5.17. Вербальная агрессия – Самооценка. Самооценка – Чувство вины Таблица 11.5.19 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Guilt Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant Linear .005 .757 1 143 .386 3.373 Quadratic .037 2.742 2 142 .068 -2.160 Cubic .043 2.087 3 141 .105 6.581 b1 b2 b3 .010 .201 -.002 -.261 .006 -4.179E-5 The independent variable is Self-Esteem. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 196 При изменении самооценки «Чувство вины» меняется случайным образом (Рис.11.5.18). Чувство вины - Самооценка Таблица 11.5.20 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 Linear .005 .757 1 143 .386 60.167 .535 Quadratic .006 .441 2 142 .644 61.230 -.174 .090 Cubic .009 .428 3 141 .733 58.934 2.715 -.719 b3 .062 The independent variable is Guilt. При изменении «Чувства вины» самооценка меняется случайным образом (Рис.12.5.19). Рисунок 11.5.18. Самооценка - Чувство вины. Рисунок 11.5.19. Чувство вины – Самооценка. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 197 11.6. Графическая иллюстрация результатов регрессионного анализа Отобразим линии регрессии на корреляционных диаграммах для связей, предполагаемых на основании результатов регрессионного анализа. Graphs Legacy Dialogs Scatter/Dot... Simple Scatter (Рис.11.6.1). Define Появится диалоговое окно, в которое надо внести пару переменных, связь между которыми изучается. Continue OK. Двойным щелчком левой клавиши мыши на изображении графика, надо вызвать окно редактора диаграмм (Chart editor) (Рис.11.6.1). Рисунок 11.6.1. Редактор графиков. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 198 На верхней панели инструментов нажать на . Появится диалоговое окно, на котором надо выбрать линию квадратической регрессии (Quadratic) (Рис. 11.6.2). Рисунок 11.6.2. Выбор линии регрессии. Apply В редакторе диаграмм появится корреляционная диаграмма с квадратической линией регрессии, наилучшим способом приближенная ко всем точкам в совокупности, с указанием коэффициента детерминации Rsq=0.502. Закрыв редактор диаграмм, мы должны получить корреляционную диаграмму с параболой (Рис.11.6.3). Рисунок 11.6.3. Корреляционная диаграмма с линией регрессии: самооценка – физическая агрессия. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 199 Если данную связь подтвердить с помощью коэффициентов корреляции, то можно будет сделать вывод: • для группы участников с низкой самооценкой при увеличении самооценки физическая агрессия уменьшается; • для группы участников с адекватной самооценкой при увеличении самооценки физическая агрессия меняется случайным образом; • для группы участников с высокой самооценкой при увеличении самооценки физическая агрессия увеличивается; Аналогичным образом получим остальные диаграммы (Рис.11.6.4-11.6.9)38. Рисунок 11.6.4. Корреляционная диаграмма с линией регрессии: самооценка – косвенная агрессия. Рисунок 11.6.5. Корреляционная диаграмма с линией регрессии: самооценка – раздражение. 38 Диаграммы отредактированы в SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 200 Рисунок 11.6.6. Корреляционная диаграмма с линией регрессии: самооценка – негативизм. Рисунок 11.6.7. Корреляционная диаграмма с линией регрессии: самооценка – подозрительность. Рисунок 11.6.8. Корреляционная диаграмма с линией регрессии: самооценка – вербальная агрессия. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 201 Рисунок 11.6.9. Корреляционная диаграмма с линией регрессии: вербальная агрессия самооценка. Таким образом, с помощью регрессионного анализа показано, что в некоторых случаях возможна нелинейная немонотонная связь квадратического типа. Для ее обоснования можно поступать двояким образом: 1. По диаграмме рассеивания находятся точки интервалы монотонности. Выборка делится на группы, различающиеся направлением связи между переменными. После этого вычисляются коэффициенты корреляции для каждой группы. 2. От коэффициентов корреляции отказываются. Вводят номинативную переменную, которая делит выборку на контрастные группы по одной из переменных. Далее изучаются различия между группами по уровню выраженности другой переменной (Наследов, 2004, с.89). 3. По одной из переменных переходят (1) к низким и высоким показателям или (2) к низким, средним и высоким показателям. Переход лучше всего осуществлять в соответствии с методикой, при условии, что эта методика адаптирована к соответствующим участников. В каждой из трех групп вычисляют коэффициенты корреляции. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 202 11.7. Переход к низким и к высоким показателям Переход к низким, высоким и средним показателям правильнее всего осуществлять с помощью методик измерения. Если, по каким-либо причинам в методике нормы не указаны, или неясно, насколько методика адаптирована, то можно осуществлять разбивку по выборочным данным. Если распределение выборочных данных соответствует нормальному распределению, то разбивка данных на две группы может осуществляться с помощью выборочного среднего x . Если оценки по тесту выше x , то их называют «выше среднего уровня». Если ниже x , то «ниже среднего уровня» (Таблица 11.7.1). Если распределение выборочных данных не соответствует нормальному распределению, то разбивка данных на две группы может осуществляться с помощью медианы Mdn. Если оценки по тесту выше Mdn, то их называют «выше среднего уровня». Если ниже Mdn, то «ниже среднего уровня» (Таблица 11.7.1). Таблица 11.7.1 Разбивка данных на две группы: «выше среднего уровня» и «ниже среднего уровня» В случае нормального распределения данных В любых случаях (Наследов, 2004, с.43) Если распределение Показатели ниже среднего уровня Показатели выше среднего уровня Ниже x Выше x Ниже Mdn Выше Mdn выборочных данных соответствует нормальному распределению, то разбивка данных на три группы может осуществляться с помощью выборочного среднего x и стандартного отклонения sX . Если оценки по тесту выше x + sX , то их называют «высокими». Если они находятся в интервале ( x − s X ; x − s X ) , то они считаются «средними». Если ниже x − sX , то оценки «низкие» (Таблица 11.7.1). Если распределение выборочных данных не соответствует нормальному распределению, то разбивка данных на три группы может осуществляться с помощью Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 203 квартилей Q1 и Q3 Если оценки по тесту выше Q3 , то их называют «высокими». Если они находятся в интервале от Q1 до Q3 , то они считаются «средними». Если ниже Q1 , то оценки «низкие» (Таблица 11.7.2). Таблица 12.7.2 Разбивка данных на три группы:«высокий», «средний» и «низкий» уровень В случае нормального распределения данных В любых случаях39 Низкие показатели ( x − 3sx ; x − sx ) Средние показатели ( x − sx ; x + sx ) Высокие показатели ( x + sx ; x + 3sx ) Ниже Q1 = P25 ( Q1; Q3 ) Выше Q3 = P75 11.7.1. Анализ двух групп самооценки В данном исследовании распределение всех данных статистически значимо отличается от нормального распределения. Поэтому разбивка самооценки на две группы будет осуществляться с помощью медианы. Из Таблицы 11.2.1.2 находим, что Mdn=62.33. Это значит, что 50% оценок не превышает 62.33. Ø Значение показателя, который меньше Mdn=62.33 будем считать показателем самооценки ниже среднего уровня, «низкой самооценкой»; Ø Значение показателя, который больше Mdn=62.33 будем считать показателем самооценки выше среднего уровня, «высокой самооценкой»; Низким показателям самооценки присвоим значение „1”. Высоким показателям самооценки присвоим значение „2”. Разбиение данных осуществляется автоматически, с помощью программы Syntax. Откроем новое окно синтакса: File New Syntax и напишем здесь следующий текст программы (Рис.11.7.1.1): 39 Там же. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 204 if (SE<=62.33) SE1_ind=1 . if (SE>62.33) SE1_ind=2 . variable labels SE1_ind 'Self-Esteem'. value labels p1_ind 1 'Low' 2 'High'. execute. Рисунок 11.7.1.1 Переход к низкому и высокому уровню самооценки. Ввод данных. Сохраним полученный файл синтаксиса под именем Mdn_of_Syntax_SE_AGG.SPS. Для того, чтобы программа выполнила необходимые действия необходимо ВЫДЕЛИТЬ ВЕСЬ ТЕКСТ (Edit – Select All) и нажать «треугольник» (пуск), All (Рис. 11.7.1.2). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 205 Рисунок 11.7.1.2. Запуск программы. После выполнения всех выше перечисленных действий в наш исходный файл “ Samoocenka_Agresija.sav” автоматически будет добавлен один столбец данных. Появится новая переменная с названием р1_ind, меткой (Label) P и значениями 1 – zems (низкий уровень самооценки) и 2 – augsts - высокий уровень. Останется только поставить число знаков после запятой (Decimals) равным нулю и выбрать Nominal Measure. (Рис. 11.7.1.3). Рисунок 11.7.1.3. Вид переменных с новой переменной SE1_ind. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 206 Рисунок 11.7.1.4. Вид данных с новой переменной SE1_ind. Расщепление файла Для того, чтобы выбрать правильные коэффициенты корреляции, повторим исследование данных для каждого из уровней самооценки. Разобьем файл на две группы: Data Split File Organize output by groups Рисунок 11.7.1.5. Расщепление файла по группам самооценки. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 207 OK Описательные статистики: Analyze Descriptive Statistics Frequencies… Рисунок 11.7.1.6. Ввод переменных. Statistics Рисунок 11.7.1.7. Заказ показателей описательной статистики. OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 208 Таблица 11.7.1.1 Описательные статистики для участников с низкой самооценкой SelfEsteem Valid N Missing Mean Std. Error of Mean Median Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Physical Aggression Indirect Aggression Irritation Negativism Verbal Aggression 73 73 73 73 73 73 50.78 1.049 53.82 8.961 -.296 .281 -1.187 .555 31 31 62 5.30 .309 5.00 2.644 -.053 .281 -1.337 .555 9 9 4.78 .280 5.00 2.394 .079 .281 -1.251 .555 8 1 9 5.62 .259 5.00 2.209 -.243 .281 -.749 .555 8 1 9 2.93 .148 3.00 1.262 .047 .281 -.739 .555 5 5 5.58 .248 5.00 2.121 -.103 .281 -.810 .555 8 1 9 a. Self-Esteem = Low Таблица 11.7.1.2 Описательные статистики для участников с высокой самооценкой SelfEsteem Valid N Missing Mean Std. Error of Mean Median Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Physical Aggression Indirect Aggression Irritation Negativism Verbal Aggression 72 72 72 72 72 72 73.98 .890 71.58 7.552 .434 .283 -.709 .559 29 63 92 5.42 .318 5.00 2.695 .132 .283 -1.452 .559 9 1 10 4.61 .289 4.00 2.453 .213 .283 -1.255 .559 8 1 9 5.50 .225 5.00 1.906 .038 .283 -.479 .559 7 2 9 2.85 .153 3.00 1.296 .292 .283 -.987 .559 4 1 5 5.43 .190 6.00 1.608 -.717 .283 .106 .559 7 1 8 a. Self-Esteem = High Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 209 Получение гистограмм с нормальными кривыми Для экономии места можно получить диаграммы с нормальной кривой для низкой и высокой самооценки на одном рисунке. Для этого нужно, чтобы файл данных не был бы разбит на две группы: Data Split file... Reset OK. После чего можно заказывать гистограммы: Graphs Legacy Dialogs Histogram… Рисунок 11.7.1.8. Заказ гистограмм с нормальной кривой. Появится диалоговое окно (Рис.11.7.1.8). Для построения гистограмм с нормальной кривой по Self-Esteem [SE] переменную Self-Esteem [SE] надо перенести в окно «Variable», Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 210 переменную Self-Esteem [SE1_ind] – в окно «Columns», а в окошке «Display normal curve» надо поставить галочку и нажать кнопку ОК. После чего появится рисунок с двумя гистограммами (Рис. 11.7.1.9). Рисунок 11.7.1.9. Гистограммы с нормальной кривой по переменной «Самооценка» для высокой и низкой самооценок. Ту же самую процедуру надо проделать для всех остальных переменных (Рис. 11.7.1.10-11.7.1.14.). Все рисунки отредактированы в SPSS. На Рис.11.7.1.9-11.7.1.14 изображены гистограммы с нормальной кривой для визуального сравнения с нормальным распределением. Рисунок 11.7.1.10. Гистограммы с нормальной кривой по переменной «Физическая агрессия» для высокой и низкой самооценок. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 211 Рисунок 11.7.1.11. Гистограммы с нормальной кривой по переменной «Косвенная агрессия» для высокой и низкой самооценок. Рисунок 11.7.1.12. Гистограммы с нормальной кривой по переменной «Раздражение» для высокой и низкой самооценок. Рисунок 11.7.1.13. Гистограммы с нормальной кривой по переменной «Негативизм» для высокой и низкой самооценок. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 212 Рисунок 11.7.1.14. Гистограммы с нормальной кривой по переменной «Вербальная агрессия» для высокой и низкой самооценок. Тесты на нормальность распределения: Analyze Descriptive Statistics Explore… Рисунок 11.7.1.15. Заказ тестов на нормальность распределения. Plots Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 213 Рисунок 11.7.1.16. Заказ тестов на нормальность распределения. Continue OK Таблица 11.7.1.3 Тесты на нормальность распределения (Tests of Normality) Kolmogorov-Smirnova Shapiro-Wilk Self-Esteem Statistic df Sig. Statistic df Sig. Low .140 73 .001 .908 73 .000 High .148 72 .001 .953 72 .009 Low .161 73 .000 .915 73 .000 High .159 72 .000 .900 72 .000 Low .151 73 .000 .926 73 .000 High .147 72 .001 .922 72 .000 Low .145 73 .001 .944 73 .003 High .159 72 .000 .941 72 .002 Low .167 73 .000 .927 73 .000 High .202 72 .000 .897 72 .000 Low .127 73 .005 .951 73 .007 High .180 72 .000 .922 72 .000 Self-Esteem Physical Aggression Indirect Aggression Irritation Negativism Verbal Aggression a. Lilliefors Significance Correction Тесты Колмогорова-Смирнова с поправкой Лиллифора и Шапиро-Уилкса показали несоответствие распределения данных нормальному распределению. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 214 Построение коробчатых диаграмм Analyze Descriptive Statistics Explore… Убрать самооценку Р из списка переменных (Dependent List). Plots Рисунок 11.7.1.17. Заказ коробчатых диаграмм. Continue OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 215 Рисунок 11.7.1.18. Коробчатые диаграммы. Аналогичным способом можно получить коробчатую диаграмму для самооценки (Рис.11.7.1.19). Рисунок 11.7.1.19. Коробчатая диаграмма для самооценки. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 216 Вычисление коэффициентов корреляции Распределения данных не соответствует нормальному распределению Поэтому надо вычислять непараметрические коэффициенты корреляции Спирмена и Кендалла. Расщепление данных: Data Split File Organize output by groups В окно переменных ввести Self-Esteem [SE1_ind] OK Analyze Correlate Bivariate… Рисунок 11.7.1.20. Заказ коэффициентов корреляции. OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 217 Таблица 11.7.1.4 Корреляционная матрица. Низкая самооценка SelfEsteem Kendall's tau_b Self-Esteem Correlation Coefficient Sig. (2-tailed) Correlation Coefficient Sig. (2-tailed) Correlation Coefficient Sig. (2-tailed) Irritation Correlation Coefficient Sig. (2-tailed) Negativism Correlation Coefficient Sig. (2-tailed) Verbal Aggression Correlation Coefficient Sig. (2-tailed) .202* .022 -.389** .000 73 73 73 73 73 73 ** -.520 .000 1.000 ** .434 .000 ** .585 .000 ** -.304 .001 .413** .000 73 73 73 73 73 73 ** -.513 .000 ** .434 .000 1.000 ** .582 .000 ** -.273 .003 .379** .000 73 73 73 73 73 73 ** -.584 .000 ** .585 .000 ** .582 .000 1.000 ** -.371 .000 .431** .000 73 73 73 73 73 73 * .202 .022 ** -.304 .001 ** -.273 .003 ** -.371 .000 1.000 -.324** .000 73 73 73 73 73 73 ** -.389 .000 ** .413 .000 ** .379 .000 ** .431 .000 ** -.324 .000 1.000 73 73 73 73 73 73 1.000 ** ** ** * -.537** .000 N N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) Indirect Aggression Correlation Coefficient Sig. (2-tailed) Irritation Correlation Coefficient Sig. (2-tailed) -.765 .000 .276 .018 73 73 73 73 73 1.000 .587** .000 .757** .000 -.387** .001 .569** .000 73 73 73 73 73 73 -.681** .000 .587** .000 1.000 .730** .000 -.339** .003 .485** .000 73 73 73 73 73 73 -.765** .000 .757** .000 .730** .000 1.000 -.464** .000 .580** .000 73 73 73 73 73 73 * .276 .018 ** -.387 .001 ** -.339 .003 ** -.464 .000 1.000 -.413** .000 73 73 73 73 73 73 ** -.537 .000 ** .569 .000 ** .485 .000 ** .580 .000 ** -.413 .000 1.000 73 73 73 73 73 73 N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) -.681 .000 73 N Verbal Aggression -.724 .000 -.724** .000 N Negativism Verbal Aggression -.584** .000 N Physical Aggression Negativism -.513** .000 N Spearman's Self-Esteem rho Irritation -.520** .000 N Indirect Aggression Indirect Aggression 1.000 N Physical Aggression Physical Aggression N **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). a. Self-Esteem = Low Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 218 Таблица 11.7.1.5 Корреляционная матрица. Высокая самооценка SelfEsteem Kendall's tau_b Self-Esteem Correlation Coefficient Sig. (2-tailed) Correlation Coefficient Sig. (2-tailed) Correlation Coefficient Sig. (2-tailed) Correlation Coefficient Sig. (2-tailed) -.042 .635 .427** .000 72 72 72 72 72 72 ** .485 .000 1.000 ** .495 .000 ** .388 .000 -.063 .495 .358** .000 72 72 72 72 72 72 ** .496 .000 ** .495 .000 1.000 ** .388 .000 -.120 .239** .009 72 72 72 72 72 72 ** .380 .000 ** .388 .000 ** .388 .000 1.000 -.144 .178 .125 .055 72 72 72 72 72 72 -.042 -.063 -.120 -.144 1.000 -.123 .635 .495 .196 .125 72 72 72 72 72 72 ** .427 .000 ** .358 .000 ** .239 .009 .178 -.123 1.000 .055 .195 72 72 72 72 72 72 1.000 ** ** ** -.058 .555** .000 Correlation Coefficient Sig. (2-tailed) N Verbal Aggression Correlation Coefficient Sig. (2-tailed) N Spearman's Self-Esteem rho Correlation Coefficient Sig. (2-tailed) N Physical Aggression Correlation Coefficient Sig. (2-tailed) Indirect Aggression Correlation Coefficient Sig. (2-tailed) Irritation Correlation Coefficient Sig. (2-tailed) .522 .000 .631 72 72 72 72 72 1.000 .674** .000 .515** .000 -.085 .466** .000 .476 72 72 72 72 72 72 .686** .000 .674** .000 1.000 .519** .000 -.154 .341** .003 .196 72 72 72 72 72 72 .522** .000 .515** .000 .519** .000 1.000 -.181 .127 .233* .049 72 72 72 72 72 72 -.058 -.085 -.154 -.181 1.000 -.148 .631 .476 .196 .127 72 72 72 72 72 72 ** ** ** * 1.000 N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) .686 .000 .195 72 N Verbal Aggression .701 .000 .196 .701** .000 N Negativism Verbal Aggression .380** .000 N Negativism Negativism .496** .000 N Irritation Irritation .485** .000 N Indirect Aggression Indirect Aggression 1.000 N Physical Aggression Physical Aggression .213 .555 .000 .466 .000 .341 .003 .233 .049 -.148 72 72 72 72 72 N .213 72 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). a. Self-Esteem = High Построение корреляционных диаграмм с прямыми регрессии Убрать расщепление файла: Data Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 219 Split File Reset OK Graphs Legacy Dialogs Scatter/Dot... (Рис.11.7.1.21): Рисунок 11.7.1.21. Заказ корреляционных диаграмм. Define Появится диалоговое окно (Рис.11.7.22), в которое надо внести пару переменных, связь между которыми изучается. Рисунок 11.7.1.22. Заказ корреляционных диаграмм с учетом групп самооценки. OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 220 В результате появится корреляционная диаграмма, в которой точки, относящиеся к наблюдениям из разных групп самооценки отличаются по цвету. Щелкнув два раза мышью по корреляционной диаграмме, мы войдем в редактор графиков – Chart Editor. Рисунок 11.7.1.23. Редактор графиков. Корреляционная диаграмма с учетом групп самооценки. Для того, чтобы получить две регрессионные прямые для высокой и низкой самооценок, надо нажать на . По умолчанию появятся прямые регрессии (Рис.11.7.1.24). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 221 Самооценка – Физическая агрессия Рисунок 11.7.1.24. Прямые регрессии для групп с низкой и с высокой самооценкой поотдельности Для того, чтобы получить параболу – линию регрессии для всех наблюдений – надо в редакторе графиков нажать на . Поставить точку у окошка квадратической регрессии (Quadratic) (Рис.11.7.1.25). Apply Рисунок 11.7.1.25. Выбор квадратической линии регрессии. Закрыть редактор графика. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 222 Полученная корреляционная диаграмма и коэффициенты корреляции показывают следующие результаты. Самооценка – Физическая агрессия Рисунок 11.7.1.26. Корреляционная диаграмма (Самооценка – Физическая агрессия) с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой и с линией квадратической регрессии для всех наблюдений (пунктиром). В группе участников с высокой самооценкой связь самооценки с физической агрессией монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .70; p < .001 (Таблица 11.7.1.5). В группе участников с низкой самооценкой связь самооценки с физической агрессией монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.72; p < .001 (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с физической агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = -.018, р = .83, ns (Таблица 11.3.1). Для остальных случаев схема получения корреляционных диаграмм с прямыми регрессии сохраняется. Рассмотрим результаты. На Рис.11.7.1.27-11.7.1.33 изображены корреляционные диаграммы с линиями регрессии для двух групп самооценки. Все рисунки отредактированы в SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 223 Самооценка – Косвенная агрессия Рисунок 11.7.1.27. Корреляционная диаграмма (Самооценка – Косвенная агрессия) с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой и с линией квадратической регрессии для всех наблюдений. В группе участников с высокой самооценкой связь самооценки с косвенной агрессией монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .69, p < .001 (Таблица 11.7.1.4). В группе участников с низкой самооценкой связь самооценки с косвенной агрессией монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.68, p < .001 (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с косвенной агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = - .027, р = .75 (Таблица 11.3.1). Корреляционная диаграмма с линиями регрессии показана на Рис.11.7.1.27. Самооценка – Вербальная агрессия В группе участников с высокой самооценкой связь самооценки с вербальной агрессией монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .56; p < .001 (Таблица 11.7.1.5). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 224 В группе участников с низкой самооценкой связь самооценки с вербальной агрессией монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.54, p < .001 (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с вербальной агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = -.055, р = .51, ns (Таблица 11.3.1). Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.28. Рисунок 11.7.1.28. Корреляционная диаграмма (Самооценка – Вербальная агрессия) с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой и с линией квадратической регрессии для всех наблюдений. Самооценка – Раздражение В группе участников с высокой самооценкой связь самооценки с раздражением монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .52, p < .001 (Таблица 11.7.1.5). В группе участников с низкой самооценкой связь самооценки с раздражением монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.77, p < .001 (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с раздражением не найдена. Коэффициент корреляции Спирмена rS (145) = - .11, р = .18, ns (Таблица 12.3.1). Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.29. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 225 Рисунок 11.7.1.29. Корреляционная диаграмма (Самооценка – Раздражение) с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой и с линией квадратической регрессии для всех наблюдений. Самооценка – Негативизм В группе участников с высокой самооценкой связь самооценки с негативизмом не найдена. Коэффициент корреляции Спирмена rS (72) = .058, р = .63, ns (Таблица 11.7.1.5). В группе участников с низкой самооценкой связь самооценки с негативизмом монотонная, положительная. Коэффициент корреляции Спирмена rS (73) = .28, р = .018, ns (Таблица 11.7.1.4) Для всей группы участников корреляционная связь самооценки с негативизмом не найдена. Коэффициент корреляции Спирмена rS (145) = .016, р = .85, ns (Таблица 11.3.1). Корреляционная диаграмма с линиями регрессии показана на Рис.11.7.1.30. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 226 Рисунок 11.7.1.30. Корреляционная диаграмма (Самооценка – Негативизм) с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой и с линией квадратической регрессии для всех наблюдений. Самооценка – Обида Рисунок 11.7.1.31. Корреляционная диаграмма (Самооценка – Обида) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. В группе участников с высокой самооценкой связь самооценки с обидой не найдена. Коэффициент корреляции Спирмена rS (72) = - .086, р = .47, ns (Таблица 11.7.1.5). В группе участников с низкой самооценкой связь самооценки с обидой не найдена. Коэффициент корреляции Спирмена rS (73) = .18, р = .13, ns (Таблица 12.1.1.4). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 227 Для всей группы участников корреляционная связь самооценки с обидой не найдена. Коэффициент корреляции Спирмена rS (145) = .060, р = .47, ns (Таблица 11.3.1). Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.31. Самооценка – Подозрительность В группе участников с высокой самооценкой связь самооценки с подозрительностью не найдена. Коэффициент корреляции Спирмена rS (72) = .055, р = .65, ns (Таблица 11.7.1.5). В группе участников с низкой самооценкой связь самооценки с подозрительностью не найдена. Коэффициент корреляции Спирмена rS (73) = .022, р = .85, ns (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с подозрительностью не найдена. Коэффициент корреляции Спирмена rS (145) = .15, р = .071, ns (Таблица 11.3.1). Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.32. Рисунок 11.7.1.32. Корреляционная диаграмма (Самооценка – Подозрительность) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 228 Самооценка – Чувство вины В группе участников с высокой самооценкой связь самооценки с чувством вины не найдена. Коэффициент корреляции Спирмена rS (72) = - .11, р = .34, ns (Таблица 11.7.1.5). В группе участников с низкой самооценкой найдена положительная монотонная связь самооценки с чувством вины. Коэффициент корреляции Спирмена rS (73) = .23, р = .052. Коэффициент корреляции Кендалла τ (73) = .17; p = .049 (Таблица 11.7.1.4). Для всей группы участников корреляционная связь самооценки с чувством вины не найдена. Коэффициент корреляции Спирмена rS (145) = -.055, р = .51, ns (Таблица 11.3.1). Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.33. Рисунок 11.7.1.33. Корреляционная диаграмма (Самооценка – Чувство вины) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. 11.7.2. Анализ двух групп вербальной агрессии Одним из результатов регрессионного анализа оказалась возможная квадратическая связь, когда независимой переменной является вербальная агрессивность, а зависимой – самооценка. Для «Вербальной агрессивности» Mdn = 6 . Эта переменная принимает всего лишь 9 значений (Таблица 11.7.2.1). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 229 Если присоединить значение медианы к «низкой» «Вербальной агрессивности», то в этой группе окажется 69% данных (100 наблюдений), а в группе с «высокой» «Вербальной агрессивностью будет всего лишь 31% данных (45 наблюдений). Группы получатся с очень разными объемами. Если присоединить значение медианы к «высокой» «Вербальной агрессивности», то в этой группе окажется 51% данных (74 наблюдения), а в группе с «низкой» «Вербальной агрессивностью будет 49% данных (71 наблюдение). Группы получатся с уравненными по объему. Поэтому, будем рассматривать именно этот вариант разбивки: Mdn < 6 - низкий уровень вербальной агрессивности (low); Mdn ≥ 6 - высокий уровень вербальной агрессивности (high). Таблица 11.7.2.1 Частотная таблица для «Вербальной агрессивности» Frequency Valid Verbal Aggression Percent Valid Percent Cumulative Percent 1 2 1.4 1.4 1.4 2 10 6.9 6.9 8.3 3 12 8.3 8.3 16.6 4 12 8.3 8.3 24.8 5 35 24.1 24.1 49.0 6 29 20.0 20.0 69.0 7 24 16.6 16.6 85.5 8 14 9.7 9.7 95.2 9 7 4.8 4.8 100.0 145 100.0 100.0 Total Откроем файл Mdn_of_Syntax_SE_AGG.SPS. Допишем имеющуюся в нем программу: if (VA<6) VA1_ind=1 . if (VA>=6) VA1_ind=2 . variable labels VA1_ind 'Verbal Aggression'. value labels VA1_ind 1 'Low' 2 'High'. Получится окно, изображенное на Рис.11.7.2.1. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 230 Рисунок 11.7.2.1. Добавление перехода к низкому и высокому уровням «Вербальной агрессивности». Ввод данных в Syntax. ВЫДЕЛИМ ВЕСЬ ТЕКСТ (Edit – Select All) и нажмем «треугольник» (пуск), All. После выполнения всех выше перечисленных действий в наш исходный файл “SelfEsteem_Aggression.sav” автоматически будет добавлен еще один столбец данных. Появится новая переменная с названием v1_ind, меткой (Label) Verbal Aggression и значениями 1 – low (низкий уровень вербальной агрессивности) и 2 – high - высокий уровень. Поставим число знаков после запятой (Decimals) равным нулю и выберем Nominal Measure. Выходная информация Таблице 11.7.2.2 является объединенной из двух выходных таблиц SPSS, отредактированной, к ней добавлены две нижние строчки, вычисленные в Excel. Отмечены случаи, когда показатели асимметрии и эксцесса превышают свои стандартные ошибки, умноженные на 1.96. В этих случаях нормального распределения нет. Таблица 11.7.2.2 Описательные статистики для участников с низкой вербальной агрессивностью Verbal Aggression low N Valid Missing SelfEsteem 71 Verbal Aggression high Verbal Aggression 71 SelfEsteem 74 Verbal Aggression 74 Mean 62.06 3.96 62.53 6.99 Median 62.16 4.00 65.58 7.00 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 231 Std. Deviation 10.57 1.22 17.16 0.99 Skewness -0.42 -0.78 -0.09 0.64 0.28 0.28 0.28 0.28 -0.65 Std. Error of Skewness Kurtosis 0.66 -0.70 -1.39 Std. Error of Kurtosis 0.56 0.56 0.55 0.55 Range 53.50 4.00 60.34 3.00 Minimum 31.33 1.00 31.16 6.00 Maximum 84.83 5.00 91.50 9.00 1.96*SES 0.56 0.56 0.55 0.55 1.96*SEK 1.10 1.10 1.08 1.08 На Рис. 11.7.2.1-11.7.2.2 изображены гистограммы с нормальной кривой для визуального сравнения с нормальным распределением. Рисунки отредактированы в SPSS. Рисунок 11.7.2.1. Гистограммы с нормальной кривой для самооценки в группах с низкой и высокой вербальной агрессивностью. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 232 Рисунок 11.7.2.2. Гистограммы с нормальной кривой для вербальной агрессивности в группах с низкой и высокой вербальной агрессивностью. Тесты на нормальность распределения: Таблица 11.7.2.3 Тесты на нормальность распределения (Tests of Normality) Verbal Aggression Kolmogorov-Smirnova Statistic df Sig. Shapiro-Wilk Statistic df Sig. Low .091 71 .200* .976 71 .191 High .159 74 .000 .921 74 .000 Low .296 71 .000 .792 71 .000 High .233 74 .000 .829 74 .000 Self-Esteem Verbal Aggression a. Lilliefors Significance Correction Тесты Колмогорова-Смирнова и Шапиро-Уилкса нашли отличия распределения данных от нормального распределения. Коробчатые диаграммы (Рис. 11.7.2.3-11.7.2.4) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 233 Рисунок 11.7.2.3. Коробчатые диаграммы для самооценки. Низкая и высокая вербальная агрессивность. Рисунок 11.7.2.4. Коробчатые диаграммы для вербальной агрессивности. Низкая и высокая вербальная агрессивность. Вычисление коэффициентов корреляции Распределения данных не соответствует нормальному распределению. Но по всем переменным «выбросы» отсутствуют («выброс» на Рис.11.7.2.3 для низкой вербальной агрессивности не может существенно исказить среднее значение). Но большая асимметрия (Таблица 11.7.2.2) по «Вербальной агрессивности», как для низких, так и для высоких ее значений не дает возможности использовать коэффициент корреляции Пирсона. Поэтому надо вычислять непараметрические коэффициенты корреляции Спирмена и Кендалла. Разобьем файл по переменной VA1_ind. Вычислим коэффициенты корреляции. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 234 При низкой «Вербальной агрессивности»: rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним. τ ( 71) = .16, p = .082 . При высокой «Вербальной агрессивности»: rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим. τ ( 71) = −.28, p = .002 . Вербальная агрессивность - Самооценка Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.2.5. Рисунок 11.7.2.5. Корреляционная диаграмма (Вербальная агрессивность – Самооценка) с прямыми регрессиями для участников с низкой вербальной агрессивностью и для участников с высокой вербальной агрессивностью и с линией квадратической регрессии для всех наблюдений. В группе участников с низкой вербальной агрессивностью связь найдена тенденция к отрицательной нелинейной зависимости «Самооценки» от «Вербальной агрессивности». Коэффициент корреляции Спирмена rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним. В группе участников с высокой вербальной агрессивностью связь найдена отрицательная нелинейная зависимость «Самооценки» от «Вербальной агрессивности». Коэффициент корреляции Спирмена rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 235 11.8. Выводы по корреляционному анализу «Самооценка» и «Физическая агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Физической агрессивности» от «Самооценки»: r (73) = -.77; p<.001 - при увеличении «Самооценки» «Физическая агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .74; p<.001 - при увеличении «Самооценки» «Физическая агрессивность» увеличивается. Размер эффекта большой. При увеличении «Физической агрессивности», «Самооценка» меняется случайным образом. «Самооценка» и «Косвенная агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Косвенной агрессивности» от «Самооценки»: r (73) = -.70; p<.001 - при увеличении «Самооценки» «Косвенная агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость r (72) = .69; p<.001 - при увеличении «Самооценки» «Косвенная агрессивность» увеличивается. Размер эффекта большой. При увеличении «Косвенной агрессивности», «Самооценка» меняется случайным образом. «Самооценка» и «Раздражительность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Раздражения» от «Самооценки»: r (73) = -.76; p<.001 - при увеличении «Самооценки» «Раздражительность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .53; p<.001 - при увеличении «Самооценки» «Раздражительность» увеличивается. Размер эффекта большой. Обнаружена тенденция уменьшения «Самооценки» при увеличении «Раздражения»: r(145) = -.15 р = .072. Размер эффекта небольшой «Самооценка» и «Негативизм». В группе подростков с низкой «Самооценкой» обнаружена положительная зависимость «Негативизма» от «Самооценки»: r (73) = .32; p =.005 - при увеличении «Самооценки» «Негативизм» увеличивается. Размер эффекта средний. В группе подростков с высокой «Самооценкой» связь не обнаружена: при увеличении «Самооценки» «Негативизм» меняется случайным образом. При увеличении «Негативизма», «Самооценка» меняется случайным образом. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 236 «Самооценка» и «Обидчивость». Связь не обнаружена. «Самооценка» и «Подозрительность». Обнаружена положительная связь r(145) = .17; p = .046: «Самооценка» и «Подозрительность» согласованно возрастают. Размер эффекта небольшой. «Самооценка» и «Вербальная агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Вербальной агрессивности» от «Самооценки»: r (73) = -.53; p<.001 - при увеличении «Самооценки» «Вербальная агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: rS (72) = .56; p<.001 - при увеличении «Самооценки» «Вербальная агрессивность» увеличивается. Размер эффекта большой. В группе участников с низкой «Вербальной агрессивностью» обнаружена положительная зависимость «Самооценки» от «Вербальной агрессивности»: rS ( 71) = .21, p = .082 - чем выше «Вербальная агрессивность», тем выше «Самооценка». Размер эффекта между небольшим и средним. В группе участников с высокой «Вербальной агрессивностью» обнаружена отрицательная зависимость: rS ( 74 ) = −.40, p < .001 . Чем выше «Вербальная агрессивность», тем ниже «Самооценка». Размер эффекта размер эффекта между средним и большим. «Самооценка» и «Чувство вины». В группе подростков с низкой «Самооценкой» обнаружена положительная зависимость «Чувства вины» от «Самооценки»: r (73) = .23; p =.051, τ (73) = .17; p = .049: при увеличении «Самооценки» «Чувство вины» увеличивается. Размер эффекта небольшой, ближе к среднему. В группе подростков с высокой «Самооценкой» связь самооценки с «Чувством вины» не найдена: r (72) = -.14; p = .24, размер эффекта небольшой - при увеличении «Самооценки» «Чувство вины» меняется случайным образом. Коэффициент корреляции Пирсона указывает на статистически незначимую отрицательную зависимость небольшого размера эффекта. При увеличении «Чувства вины» «Самооценка» меняется случайным образом. Отчет по оданному исследованию можно найти в Приложении 4. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 237 12. Частотный анализ. Критерий «Хи-квадрат» Пирсона Критерий согласия «Хи-квадрат» Пирсона (χ2 – Пирсона, Chi-square, Pearson) используют: - Для сравнения распределения значений номинальной переменной по ее категориям с теоретическим распределением (Goodness-of-Fit Test); - Для исследования связи номинальных переменных (Test of Independence). 12.1. Сравнение распределения с теоретическим: Goodness-ofFit Test Исследование отличия эмпирического распределения значений номинальной переменной по ее категориям от теоретического распределения проведем с помощью разновидности теста «Хи-квадрат» Пирсона: Goodness-of-Fit Test. Гипотезы H 0 : Отличие эмпирического распределения значений номинальной переменной по ее категориям от теоретического распределения случайное. H 1 : Отличие эмпирического распределения значений номинальной переменной по ее категориям от теоретического распределения случайное закономерное. Статистики теста «Хи-квадрат» для Goodness-of-Fit Test Если число разрядов признака k>2, то статистику теста «Хи-квадрат» можно вычислить по формуле: k ( nei − nti ) i =1 nti χ =∑ 2 e 2 , (12.1.1) где k – число разрядов (групп); nei -эмпирические частоты; nti - теоретические частоты. Если число разрядов признака k=2, то следует учитывать «поправку на непрерывность» Йета (Yates’ Correction for Continuity) (Хили, 2005; С.341): 2 χ =∑ 2 e i =1 (n ei − nti − 0.5) nti 2 . (12.1.2) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 238 Степени свободы для Goodness-of-Fit Test df = k − 1 . (12.1. 3) Ограничения критерия «Хи-квадрат»: 1. Точность критерия растет с увеличением числа наблюдений N. 2. Каждая теоретическая частота должна быть ntij ≥ 5 . 3. Если число категорий номинальных переменных равно двум, то необходимо учитывать „поправку на непрерывность” Йета. 4. Если наблюдение относится к конкретной категории, то оно не должно принадлежать ни к одной другой категории. Размер эффекта для Goodness-of-Fit Test Размер эффекта при сравнении эмпирического распределения с теоретическим распределением с помощью критерия «Хи-квадрат» определяется w – статистикой (Cohen, 1988), которую вычисляют по формуле: w= χ2 , N (12.1.4) где N – размер всей выборки. Согласно (Cohen, 1988), значения w, равные .10 – соответствует небольшому размеру эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта. 12.1.1. Сравнение эмпирического распределения признака с равномерным распределением В рассматриваемом случае всего одно эмпирическое распределение m=1. Если число разрядов признака k>2, то наблюдаемое значение критерия можно вычислить по формуле (12.1.1.1). Для равномерного распределения теоретические частоты nti находятся по формуле: nti = N , k (12.1.1.1) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 239 где N – число наблюдений. Должны соблюдаться равенства: N = ne1 + ne 2 +L nek и N = nt1 + nt 2 +L ntk , (12.1.1.2) которые могут быть использованы для контроля. Также справедливо равенство: k ∑ (n i =1 ei − nti ) = 0 , (12.1.1.3) которое также может быть использовано для контроля. Если число разрядов признака k = 2 то теоретические частоты равны nti = N , и 2 следует учитывать „поправку на непрерывность” Йета (Yate) (Хили, 2005; с.341): χ 2 e (n = e1 − N 2 − 0.5) 2 N 2 (n + e2 − N 2 − 0.5) 2 N 2 . (12.1.1.4) Алгоритм применения критерия χ2 Гипотезы: H 0 : Эмпирическое распределение признака имеет случайные отличия от равномерного распределения. H 1 : Эмпирическое распределение признака отличается от равномерного распределения закономерно. Если N – число наблюдений и количество разрядов k > 2, то строят таблицу с 5-ю столбцами и k+2 строками, в соответствии с Таблицей 12.1.1.1, в которой nei - эмпирические частоты; nti - теоретические частоты: nti = N . В последней строке вычисляют суммы k (12.1.1.2)-(12.1.1.3) для контроля. Сумма последнего столбца совпадает со статистикой χ e2 . Если число наблюдений n и количество разрядов признака k=2, то строят таблицу с 6-ю столбцами и k+2 строками, по образцу Таблицы 12.1.1.2. По числу степеней свободы df = k − 1 и по статистике χ e2 с помощью программы Excel (CHISQ.DIST.RT) находят p-value для правостороннего (one-tailed) теста (п.7.7). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 240 В соответствии с найденным значением p-value формулируют ответ. При p > .05 нет оснований отклонить нулевую гипотезу H 0 . Нулевая гипотеза отклоняется и принимается альтернативная гипотеза H 1 , если p ≤ .05. Таблица 12.1.1.1 Вычисление статистики - χ e2 Разряды nei nti 1 ... k ne1 ... nek N k ... N k Суммы N N nei − nti (nei − nti )2 (nei − nti ) 2 nti χ e2 Таблица 12.1.1.2. Вычисление скорректированной статистики χ e2 Разряды nei nti nei − nti nei − nti − 0.5 1. ne1 n2 ne1 − n 2 ne1 − n 2 − 0.5 2. ne 2 n2 ne 2 − n 2 ne 2 − n 2 − 0.5 Суммы N N (n ei − nti − 0.5) 2 (n ei − nti − 0.5) nti 2 χ e2 12.1.2. Пример 1. Без поправки на непрерывность На вопрос: „Какие эмоции и чувства вызывает у Вас реклама пива «ПИТ» были получены ответы: Таблица 12.1.2.1 Результаты опроса Ответ a) Раздражение b) Безразличие c) Восторг Число ответов 30 27 9 Являются ли ответы случайными? Может быть нет различия в восприятии рекламы пива «ПИТ»? Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 241 Решение В данном примере речь идет о номинальной переменной, которую можно было бы назвать «Восприятие рекламы» и которая имеет три категории: «Раздражение», «Безразличие» и «Восторг». Теоретические частоты в данном случае равны nti = N , где k = 3 – число вариантов k ответов, N = 66 – число наблюдений. В нашем случае nti = 66 = 22 . 3 Гипотезы: H 0 : Распределение значений переменной «Восприятие рекламы» пива «ПИТ» имеет случайные отличия от равномерного распределения. H 1 : Распределение значений переменной «Восприятие рекламы» пива «ПИТ» отличается от равномерного распределения закономерно. Таблица 12.1.2.2 Вычисление статистики - χ e2 Разряды nei nti nei − nti (nei − nti )2 a) b) c) Суммы 30 27 9 66 22 22 22 66 8 5 -13 64 25 169 (nei − nti )2 nti 2.90909 1.13636 7.68182 2 χ e =11.72727 Контроль: 1) N = 30 + 27 + 9 = 66; 2) N = 22 + 22 + 22 = 66; k 3) ∑(n i =1 ei − nti ) = 8 + 5 − 13 = 0 . Сумма последнего столбца совпадает со статистикой χ e2 = 11.72727. Число степеней свободы равно df = 3 − 1 = 2 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 242 C помощью программы Excel (CHISQ.DIST.RT) находим p-value для правостороннего one-tailed теста p = .003 < .01. Размер эффекта вычисляется по формуле (12.1.4): w= χ2 11.72727 = = .42 N 66 Размер эффекта w = .42 средний Ответ. Распределение значений переменной «Восприятие рекламы» пива «ПИТ» закономерно отличается от равномерного распределения: χ2(2, N = 66) = 11.7, p = .003. Размер эффекта w = .42 средний. Решение с помощью SPSS Для решения данной задачи на SPSS исходные данные должны быть представлены в виде двух столбцов: «шифр респондента [Code]» и номинальной переменной «Восприятие [Perception]», для которой должны быть описаны разряды «Раздражение [Irritation]», «Безразличие [Disinterest]», «Восторг [Delight]» (Рис.12.1.2.1-12.1.2.2). Данные должны быть в наличии с самого начала. По ним строится Таблица 12.1.2.1. Но так как в данной задаче исходных данных нет, то их можно «восстановить», сконструировав Таблицу 12.1.2.3, используя данные Таблицы 12.1.2.1. Файл с данными назовем Beer_PIT_Advertising.xlsx. Рисунок 12.1.2.1. Описание переменных. Рисунок 12.1.2.2. Ввод данных. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 243 Таблица 12.1.2.3 Результаты опроса Code Perception k1 1 k2 1 k3 1 k4 1 k5 1 k6 1 k7 1 k8 1 k9 1 k10 1 k11 1 k12 1 k13 1 k14 1 k15 1 k16 1 k17 1 k18 1 k19 1 k20 1 k21 1 k22 1 Code Perception k23 1 k24 1 k25 1 k26 1 k27 1 k28 1 k29 1 k30 1 k31 2 k32 2 k33 2 k34 2 k35 2 k36 2 k37 2 k38 2 k39 2 k40 2 k41 2 k42 2 k43 2 k44 2 Code Perception k45 2 k46 2 k47 2 k48 2 k49 2 k50 2 k51 2 k52 2 k53 2 k54 2 k55 2 k56 2 k57 2 k58 3 k59 3 k60 3 k61 3 k62 3 k63 3 k64 3 k65 3 k66 3 После ввода данных: Analyze Nonparametric Tests Legacy Dialogs Chi-Square … В появившемся диалоговом окне перенести переменную Perception в окно Test Variable List (Рис.12.1.2.3). OK Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 244 Рисунок 12.1.2.3. Диалоговое окно теста Chi-Square – сравнение с равномерным распределением. Выходная информация: Таблица 12.1.2.4 Построенная в SPSS таблица результатов опроса с теоретическими частотами и разностями частот Perception Observed N Irritation Disinterest Delight 30 27 9 Total 66 Expected N Residual 22.0 22.0 22.0 8.0 5.0 -13.0 Таблица 12.1.2.5 Статистики теста χ 2 (Test Statistics) Test Statistics Perception Chi-Square df Asymp. Sig. 11.727a 2 .003 a. 0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 22.0. В верхней строчке - наблюдаемое значение критерия χ e2 = 11.727; Во второй строке – число степеней свободы df=2; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 245 В третьей строке – р-value, равное .003 < .01, которое говорит о том, что выявлено отличие от равномерного распределения: χ2(2, N = 66) = 11.7, p = .003. Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая) частота в ячейках равна 15, что нет ни одной ячейки с теоретической частотой, меньшей 5. Результаты совпадают с результатами, полученными вручную. 12.1.3. Пример 2. С поправкой на непрерывность Из опрошенных N = 101 респондентов: 77 респондентов категорически против введения смертной казни, а 24 – за. Сравнить распределение ответов с равномерным распределением. Решение В данном примере речь идет о номинальной переменной, которую можно было бы назвать «Отношение к смертной казни» и которая имеет две категории: «За» и «Против». Гипотезы: H 0 : Распределение значений переменной «Отношение к смертной казни» имеет случайное отличие от равномерного распределения. H 1 : Распределение значений переменной «Отношение к смертной казни» отличается от равномерного распределения закономерно. В нашем случае количество разрядов признака k = 2, имеются лишь две группы ответов. Поэтому надо учесть „поправку на непрерывность”. Таблица 12.1.3.1 Вычисление наблюдаемого значения критерия- χ 2 Разряды nei n ti nei − nti nei − nti − 0.5 a) против b) за 77 24 50.5 50.5 26.5 26.5 26 26 Суммы 101 101 (n ei − nti − 0.5) 2 676 676 (n ei − nti − 0.5) nti 2 13.38614 13.38614 χ e2 =26.77228 В последней строке указаны суммы для контроля. Контроль: 1) N = 77 + 24 =101; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 246 2) N = 50.5 + 50.5 =101. Сумма последнего столбца совпадает с наблюдаемым значением критерия- χ 2 : с χ e2 =26.77228. Число степеней свободы равно df = 2 −1 = 1 . C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста p = .0000002 < .001. Нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Размер эффекта (12.1.4): w= χ2 26.77228 = = .51 . 101 N Ответ. Распределение значений переменной «Отношение к смертной казни» отличается от равномерного распределения закономерно. Число респондентов, которые «против» введения смертной казни превышает число респондентов, которые «за». Распределение ответов закономерно отличается от равномерного распределения: χ2(1, N = 101) = 26.8, p < .001. Размер эффекта большой: w = .51 . Решение с помощью SPSS Для решения данной задачи на SPSS исходные данные должны быть представлены в виде двух столбцов: «Code» и номинальной переменной «Отношение [Attitude]», для которой должны быть описаны разряды «против [against]», «за [for]». Файл с данными назовем Death_Penalty.xlsx. Ввод данных и заказ теста такие же, как и в Примере 1. Выходная информация: В результате появляются Таблицы 12.1.3.2 – 12.1.3.3. В верхней строчке - наблюдаемое значение критерия χ e2 =13.462; Во второй строке – число степеней свободы df=1; В третьей строке – р-value, равное .000 <. 001, которая говорит о том, что выявлено максимально значимое отличие от равномерного распределения. Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая) частота в ячейках равна 45.5, что нет ни одной ячейки с теоретической частотой, меньшей 5. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 247 Таблица 12.1.3.2 Построенная в SPSS таблица результатов опроса с теоретическими частотами и разностями частот against for Total Observed N Expected N Residual 77 24 91 50.5 50.5 26.5 -26.5 Таблица 12.1.3.4 Статистики теста χ 2 (Test Statistics) Answer 27.812a 1 .000 Chi-Square df Asymp. Sig. a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 50.5. Результаты немного отличаются от результатов, полученных вручную: χ2(1, N = 101) = 27.8, p < .001. Программа SPSS не учитывает «поправки на непрерывность». Размер эффекта (12.1.4): w= 27.812 = .52 . 101 Размер эффекта большой: w = .52 . 12.2. Связь номинальных переменных: Test of Independence Для исследования связи между номинальными переменными сравниваются распределения значений этих переменных по категориям с помощью критерия «Хиквадрат» (Test of Independence). Связь между переменными наблюдается при наличии закономерного различия в распределениях этих переменных. Гипотезы Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 248 H 0 : Две номинальные переменные связаны. H 1 : Две номинальные переменные не связаны. Пусть номинальная переменная Х имеет k категорий, а номинальная переменная Y имеет m категорий. Таблица сопряженности (контингентности) Значения номинальных переменных, между которыми ищется связь, можно представить в таблицах сопряженности (контингентности). Например, в Таблица 12.1.1.1 – таблица контингентности для двух переменных: «Темперамент» (холерик, сангвинник, флегматик, меланхолик) и «Стратегия поведения в конфликтной ситуации» (соперничество, избегание, компромисс, приспособление, сотрудничество). Таблица сконструирована по результатам измерений для случайной выборки из 400 подростков, сформированной для изучения связи между темпераментом и стратегиями поведения в конфликтной ситуации. Число категорий переменной «Темперамент» m = 4, число категорий переменной «Стратегия поведения в конфликтной ситуации» k = 5. Таблица 12.2.1 Таблица сопряженности (контингентности) Темперамент Холерик Сангвинник Флегматик Меланхолик Суммы: Избегание 15 9 15 20 59 Стратегия поведения в конфликтной ситуации Компромисс Приспособление Сотрудничество Соперничество 16 17 32 18 25 22 34 12 27 20 30 7 25 25 23 8 93 84 119 45 Суммы: 98 102 99 101 400 Таблица контингентности позволяет увидеть соотношения участников с конкретным темпераментом, выбирающими в конфликтной ситуации конкретную стратегию поведения – эмпирические частоты neij . Индекс i указывает на номер строки (на категорию переменной «Темперамент») и меняется от 1 до m = 4, а индекс j указывает на номер столбца (на категорию переменной «Стратегия поведения в конфликтной ситуации») и меняется от 1 до k = 5. Например, количество холериков, выбирающих в конфликтной ситуации стратегию избегания ne11 = 15 , выбирающих приспособление ne13 = 17 . Количество сангвинников, выбирающих стратегию сотрудничества ne 24 = 34 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 249 Суммы по строкам и столбцам (по категриям переменных) называются маргинальными суммами. Для переменной «Темперамент»: Количество холериков равно 98, количество сангвинников равно 102, количество флегматиков равно 99, количество меланхоликов равно 101. Для переменной «Стратегия поведения в конфликтной ситуации»: Количество участников исследования, выбирающих в конфликтной ситуации избегание равно 59, компромисс – 93, приспособление – 84, сотрудничество – 119, соперничество – 45. Общее количество наблюдений, представленных в таблице контингентности - это число в правом нижнем углу, количество участников исследования, равное N = 400. По таблице контингентности вычисляются ожидаемые (expected) частоты или теоретические частоты ntij : ntij = ( Сумма частот строки i ) ⋅ ( Сумма частот столбца j ) . N (12.2.1) Например, количество холериков, выбирающих в конфликтной ситуации стратегию приспособление ne13 = 17 - это эмпирическая частота, а nt13 = 98 ⋅ 84 = 20.6 ожидаемая или 400 теоретическая частота. Статистическую значимость различий эмпирических частот и теоретических частот можно найти с помощью критерия «Хи-квадрат» Пирсона (Pearson's Сhi-Squared test). Связь между переменными наблюдается при наличии закономерных различий между эмпирическими частотами neij и теоретическими частотами ntij . Статистики теста «Хи-квадрат» для Test of Independence Test of Independence. Если число разрядов признака k>2, то наблюдаемое значение критерия можно вычислить по формуле: m k χ = ∑∑ 2 e i =1 j =1 (n eij − ntij ) ntij 2 , (12.2.2) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 250 где k – число категорий переменной Y; m – число категорий переменной X; neij эмпирические частоты; ntij - теоретические частоты. Если число категорий обеих переменных равно m = k = 2, то следует учитывать «поправку на непрерывность» Йета (Yates’ Correction for Continuity) (Хили, 2005; С.341): 2 2 χ = ∑∑ 2 e (n eij − ntij − 0.5 ) 2 ntij i =1 j =1 . (12.2.3) Степени свободы для Test of Independence df = ( k − 1)( m − 1) . (12.2.4) Ограничения критерия «Хи-квадрат»: 1. Точность критерия растет с увеличением числа наблюдений N. 2. Каждая теоретическая частота должна быть ntij ≥ 5 . 3. Если число категорий номинальных переменных равно двум, то необходимо учитывать „поправку на непрерывность” Йета. 4. Если наблюдение относится к конкретной категории, то оно не должно принадлежать ни к одной другой категории. Размер эффекта для Test of Independence Размер эффекта в тесте «Хи-квадрат» для сравнения двух эмпирических распределений может быть найден как коэффициент Phi (φ) для таблиц контингентности 2х2: ϕ= χ 2 (1) N , (12.2.5) где N – число наблюдений. Для любых таблиц контингентности размер эффекта w (в SPSS обозначается Phi) вычисляется по формуле: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 251 w= χ2 . N (12.2.6) Согласно (Cohen, 1988), значения φ и w, равные .10 – соответствует небольшому размеру эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта. Размером эффекта для любых таблиц контингентности также является коэффициент Cramer’s V1, который находится по формуле: V= χ2 , N ( L − 1) (12.2.7) где L равно минимальному из чисел строк, или столбцов в таблице сопряженности. Например, для Таблицы 12.2.1 размера 4 х 5, L = 4. Для интерпретации Cramer’s V можно использовать Таблицу 12.2.2. Для таблицы контингентности размера 4 х 5 будет следующая интерпретация размера эффекта Cramer’s V: .06 - небольшой, .17 – средний, .29 – большой. Таблица 12.2.2 Интерпретация размера эффекта Cramer’s V в зависимости от минимального числа из числа строк и столбцов (L) Небольшой Средний Большой размер эффекта размер эффекта размер эффекта 1 .10 .30 .50 2 .07 .21 .35 3 .06 .17 .29 4 .05 .15 .25 5 .04 .13 .22 L-1 Примечание. Таблица взята из http://www.real-statistics.com/chi-square-and-f-distributions/effect-size-chi-square/ 1 Chapter 12: Chi-Square tests of independence and goodness-of-fit. http://geography.unt.edu/~wolverton/ChiSquare.pdf Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 252 Коэффициенты φ, w, V изменяются от 0 до 1. При размере эффекта, равном нулю переменные не связаны (независимы), при размере эффекта, равном единице, максимально связаны (зависимы). Размер эффекта для таблиц сопряженности может быть также вычислен как коэффициент контингентности Пирсона (Pearson’s Contingency Coefficient, C): C= χ2 . N + χ2 (12.2.8) Максимальный коэффициент контингентности равен:  1  1  Cmax = 4 1 −  1 −  < 1 ,  r  c  (12.2.9) где c – число столбцов, r – число строк. Стандартизованный коэффициент контингентности равен (Tormakangas, 2014)2: Cst = С . Cmax (12.2.10) Коэффициент Pearson’s C изменяются от 0 до Cmax < 1 . При размере эффекта, равном нулю переменные не связаны (независимы), при размере эффекта, равном Cmax , максимально связаны (зависимы). Можно считать, что значения Cst , равные .10 – соответствует небольшому размеру эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта. 12.2.1. Пример 3. Без поправки на непрерывность Проверить, связан ли выборов фигур с тревожностью. Исходные данные: Низкая тревожность Высокая тревожность Треугольник Круг 10 5 72 10 Выбираемые фигуры Квадрат Зигзаг 12 11 6 47 Прямоугольник 8 19 2 Tormakangas, T. (2014). Contingency coefficient. Available at http://users.jyu.fi/~tatima/TER/ContCoef.pdf Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 253 Решение Для решения этой задачи можно выделить две группы участников: с высокой и низкой тревожностью и с помощью Test of Independence проверить, различаются ли распределения выборов фигур у участников с высокой и низкой тревожностью случайно или закономерно. При закономерном различии можно сделать вывод о том, что тревожность и выбор фигур связаны. Построим таблицу контингентности (Таблица 12.2.1.1). Таблица 12.2.1.1 Распределения выборов геометрических фигур старшеклассников и уровней тревожности Низкая тревожность Высокая тревожность Суммы Выбираемые фигуры Квадрат Зигзаг Суммы Треуголь ник Круг Прямоуголь 1 2 3 4 5 1 10 72 12 6 8 108 2 5 10 11 47 19 92 15 82 23 53 27 N = 200 ник Число всех наблюдений N = 200. Количество категорий переменной «Выбор фигур» k = 5 > 2. Число участников исследования с низкой тревожностью Σ1 =108; Число участников исследования с высокой тревожностью Σ 2 =92. Контроль: Σ1 + Σ 2 =108+92=200. Количество категорий переменной «Тревожность» m = 2. Число выборов по фигурам: треугольник: 10+5=15; круг: 72+10=82; квадрат: 12+11=23; зигзаг: 6+47=53; прямоугольник: 8+19=27. Контроль: 15+82+23+53+27=200. Эмпирические частоты: Число выборов в группе с низкой тревожностью: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 254 треугольник: n11 = 10 ; круг: n12 = 72 ; квадрат: n13 = 12 ; зигзаг: n14 = 6 ; прямоугольник: n15 = 8 . Сумма 10+72+12+6+8=108= Σ1 ; Число выборов в группе с высокой тревожностью: треугольник: n21 = 5 ; круг: n22 = 10 ; квадрат: n23 = 11 ; зигзаг: n24 = 47 ; прямоугольник: n25 = 19 . Сумма 5+10+11+47+19=92= Σ 2 . 80 Коичество выборов 70 60 50 40 30 20 10 Треугольник Круг Квадрат Зигзаг Прямоугольник Выбираемые фигуры Низкая тревожность Высокая тревожность Рисунок 12.2.1.1. Диаграмма pаспределения участников с высокой и низкой тревожностями по выборам фигур, построенная в Excel. 80 Коичество выборов 70 60 50 40 30 20 10 Низкая тревожность Высокая тревожность Выбираемые фигуры Треугольник Круг Квадрат Зигзаг Прямоугольник Рисунок 12.2.1.2. Диаграмма распределения выборов фигур между участниками с высокой и низкой тревожностями, построенная в Excel. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 255 Гипотезы: H 0 : Выбор фигур и тревожность не связаны. H 1 : Выбор фигур и тревожность связаны. С помощью Таблицы 12.2.1.2 можно вычислить теоретические частоты: ntij = ( Сумма частот строки , i ) ⋅ ( Сумма частот столбца, j ) . N (12.2.1.1) Таблица 12.2.1.2 Вычисление теоретических частот Ячейка 1-1 1-2 1-3 1-4 1-5 Теоретические частоты 15 ⋅108 nt11 = = 8.1 200 82 ⋅108 nt12 = = 44.28 200 23 ⋅108 nt13 = = 12.42 200 53 ⋅108 nt14 = = 28.62 200 27 ⋅108 = 14.58 nt15 = 200 Ячейка Теоретические частоты 15 ⋅ 92 nt 21 = = 6.9 200 82 ⋅ 92 nt 22 = = 37.72 200 23 ⋅ 92 nt 23 = = 10.58 200 53 ⋅ 92 nt 24 = = 24.38 200 27 ⋅ 92 nt 25 = = 12.42 200 2-1 2-2 2-3 2-4 2-5 Таблица 12.2.1.3 Вычисление наблюдаемого значения критерия- χ 2 Разряд nei nti nei − nti (nei − nti ) 1-1 1-2 1-3 1-4 1-5 2-1 2-2 2-3 2-4 2-5 10 72 12 6 8 5 10 11 47 19 8.10 44.28 12.42 28.62 14.58 6.90 37.72 10.58 24.38 12.42 1.90 27.72 -0.42 -22.62 -6.58 -1.90 -27.72 0.42 22.62 6.58 3.6100 768.3984 0.1764 511.6644 43.2964 3.6100 768.3984 0.1764 511.6644 43.2964 Суммы 200 200 2 (nei − nti )2 nti 0.446 17.353 0.014 17.878 2.970 0.523 20.371 0.017 20.987 3.486 χ e2 =84.04 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 256 Контроль: Сумма 2-ого столбца: N = ne11 + ne12 + ne13 + ne14 + ne15 + ne 21 + ne 22 + ne 23 + ne 24 + ne 25 = 200 ; Сумма 3-его столбца: N = nt11 + nt12 + nt13 + nt14 + nt15 + nt 21 + nt 22 + nt 23 + nt 24 + nt 25 = 200 ; ∑∑ ( n 2 Сумма 4-ого столбца: 5 j =1 i =1 eij − ntij ) = 0 . Сумма последнего столбца совпадает со статистикой χ 2 : χ e2 = 84.04. Число степеней свободы равно df = ( k − 1)( m − 1) = ( 5 − 1)( 2 − 1) = 4 . C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста p = .000 < .001. Нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Коэффициенты размера эффектов (12.2.5)-(12.2.8): w= 84.04 = .65 , 200 V= 84.04 = .65 , 200 ( 2 − 1) C= 84.02 = .54 200 + 84.02 Размер эффекта большой. Ответ. Распределения выборов фигур у участников с высокой и низкой тревожностью друг от друга отличаются закономерно. χ2(4, N = 200) = 84.0, p < .001. Выбор фигур связан с тревожностью. Размер эффекта большой: w = V = .65, C = .54. Решение с помощью SPSS Для решения данной задачи на SPSS исходные данные должны быть представлены в виде трех столбцов: «шифр респондента [Code]», номинальной переменной «Тревожность [Anxiety]», с двумя разрядами «низкая [low]», «высокая [high]», и номинальной переменной Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 257 «Фигура [Figure]» c пятью разрядами «треугольник [triangle]», «круг [circle]», «квадрат [square]», «зигзаг [zigzag]», «прямоугольник [rectangle]» (Рис.12.2.1.3-12.2.1.4). Данные должны быть в наличии с самого начала. По ним строится Таблица 12.2.1.1. Но так как в данной задаче исходных данных нет, то их можно «восстановить», сконструировав Таблицу 12.2.1.4, используя данные Таблицы 12.2.1.1. Файл с данными назовем Anxiety_Figures.xlsx. Рисунок 12.2.1.3. Описание переменных. Рисунок 12.2.1.4. Ввод данных. После ввода данных: Analyze Descriptive Statistics Crosstabs … В появившемся диалоговом окне Crosstabs перенести переменную Figure в окно Row(s), а переменную Anxiety - в окно Column(s). Поставить галочку в окошке Display clustered bar charts (Рис.12.2.1.5). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 258 Таблица 12.2.1.4 Code Anxiety Figure Code Anxiety Figure Code Anxiety Figure Code Anxiety Figure Code Anxiety Figure Результаты опроса k1 1 1 k41 1 2 k81 1 2 k121 2 2 k161 2 4 k2 1 1 k42 1 2 k82 1 2 k122 2 2 k162 2 4 k3 1 1 k43 1 2 k83 1 3 k123 2 2 k163 2 4 k4 1 1 k44 1 2 k84 1 3 k124 2 3 k164 2 4 k5 1 1 k45 1 2 k85 1 3 k125 2 3 k165 2 4 k6 1 1 k46 1 2 k86 1 3 k126 2 3 k166 2 4 k7 1 1 k47 1 2 k87 1 3 k127 2 3 k167 2 4 k8 1 1 k48 1 2 k88 1 3 k128 2 3 k168 2 4 k9 1 1 k49 1 2 k89 1 3 k129 2 3 k169 2 4 k10 1 1 k50 1 2 k90 1 3 k130 2 3 k170 2 4 k11 1 2 k51 1 2 k91 1 3 k131 2 3 k171 2 4 k12 1 2 k52 1 2 k92 1 3 k132 2 3 k172 2 4 k13 1 2 k53 1 2 k93 1 3 k133 2 3 k173 2 4 k14 1 2 k54 1 2 k94 1 3 k134 2 3 k174 2 4 k15 1 2 k55 1 2 k95 1 4 k135 2 4 k175 2 4 k16 1 2 k56 1 2 k96 1 4 k136 2 4 k176 2 4 k17 1 2 k57 1 2 k97 1 4 k137 2 4 k177 2 4 k18 1 2 k58 1 2 k98 1 4 k138 2 4 k178 2 4 k19 1 2 k59 1 2 k99 1 4 k139 2 4 k179 2 4 k20 1 2 k60 1 2 k100 1 4 k140 2 4 k180 2 4 k21 1 2 k61 1 2 k101 1 5 k141 2 4 k181 2 4 k22 1 2 k62 1 2 k102 1 5 k142 2 4 k182 2 5 k23 1 2 k63 1 2 k103 1 5 k143 2 4 k183 2 5 k24 1 2 k64 1 2 k104 1 5 k144 2 4 k184 2 5 k25 1 2 k65 1 2 k105 1 5 k145 2 4 k185 2 5 k26 1 2 k66 1 2 k106 1 5 k146 2 4 k186 2 5 k27 1 2 k67 1 2 k107 1 5 k147 2 4 k187 2 5 k28 1 2 k68 1 2 k108 1 5 k148 2 4 k188 2 5 k29 1 2 k69 1 2 k109 2 1 k149 2 4 k189 2 5 k30 1 2 k70 1 2 k110 2 1 k150 2 4 k190 2 5 k31 1 2 k71 1 2 k111 2 1 k151 2 4 k191 2 5 k32 1 2 k72 1 2 k112 2 1 k152 2 4 k192 2 5 k33 1 2 k73 1 2 k113 2 1 k153 2 4 k193 2 5 k34 1 2 k74 1 2 k114 2 2 k154 2 4 k194 2 5 k35 1 2 k75 1 2 k115 2 2 k155 2 4 k195 2 5 k36 1 2 k76 1 2 k116 2 2 k156 2 4 k196 2 5 k37 1 2 k77 1 2 k117 2 2 k157 2 4 k197 2 5 k38 1 2 k78 1 2 k118 2 2 k158 2 4 k198 2 5 k39 1 2 k79 1 2 k119 2 2 k159 2 4 k199 2 5 k40 1 2 k80 1 2 k120 2 2 k160 2 4 k200 2 5 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 259 Рисунок 12.2.1.5. Диалоговое окно теста Crosstabs – сравнение двух эмпирических распределений. Statistics… В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окошке Chi-square (Рис.12.2.1.6). Рисунок 12.2.1.6. Диалоговое окно теста Crosstabs: Statistics. Continue OK Выходная информация: Crosstabs Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 260 Таблица 12.2.1.5 Обработанные наблюдения (Case Processing Summary) Cases Valid Figure * Anxiety Missing Total N Percent N Percent N Percent 200 100.0% .0% 200 100.0% Таблица 12.2.1.6 Построенная в SPSS таблица результатов опроса (Figure * Anxiety Crosstabulation) Count Figure triangle circle Total square zigzag rectangle low 10 72 12 6 8 108 high 5 10 11 47 19 92 15 82 23 53 27 200 Anxiety Total Таблица 12.2.1.7 Статистики тестов χ 2 (Chi-Square Tests) Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases a 84.045 93.979 59.902 df Asymp. Sig. (2-sided) 4 4 1 .000 .000 .000 200 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 6.90. В верхней строчке (Pearson Chi-Square): Value- наблюдаемое значение критерия χ e2 = 84.045; число степеней свободы df = 4; р-value, равное .000 < .001, говорит о том, что распределения отличаются статистически значимо. Выявлена связь между тревожностью и выбором фигур. Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая) часота в ячейках равна 6.90, что нет ни одной ячейки с теоретической частотой, меньшей 5. Таким образом, принимаем альтернативную гипотезу: χ2(4, N = 200) = 84.0, p < .001. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 261 Таблица 12.2.1.8 Симметричные меры (Symmetric Measures) Value Nominal by Nominal Approx. Sig. Phi .648 .000 Cramer's V .648 .000 Contingency Coefficient .544 .000 N of Valid Cases 200 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Из Таблицы 12.2.1.8 находим размеры эффектов: w = φ = V = .65, p < .001, C = .54, p < .001. Размеры эффектов совпадают с размерами эффектов, рассчитанными вручную. Графические иллюстрации, полученные в SPSS (Рис.12.2.1.7-12.2.1.8). Рисунки отредактированы в SPSS. Рисунок 12.2.1.7. Распределения участников с высокой и низкой тревожностями по выборам фигур, построенная в SPSS. Рисунок 12.2.1.8. Распределения выборов фигур между участниками с высокой и низкой тревожностями, построенная в SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 262 Диаграмма распределения участников с высокой и низкой тревожностями по выборам фигур (Рис.12.2.1.7) получается автоматически по заказу - галочка в окне Display clustered bar charts (Рис.12.2.1.5). Для получения диаграммы распределения выборов фигур испытуемыми с высокой и низкой тревожностями (Рис.12.2.1.8) в диалоговом окне Crosstabs переменную Anxiety надо перенести в окно Row(s), а переменную Figure - в окно Column(s) (Рис.12.2.1.5). Результаты совпадают с результатами, полученными вручную. 12.2.2. Пример 4. С поправкой на непрерывность Было опрошено N = 250 участников с низким и высоким уровнями интеллекта (IQ). Им были предложены два вида рекламы: абстрактная и образная. Результаты опроса представлены в Таблице 12.2.2.1. Сравнить распределения выборов рекламы у участников с низким IQ и высоким IQ. Найти размер эффекта. Таблица 12.2.2.1 Распределения выборов рекламы Низкий IQ Высокий IQ Суммы 1 2 Реклама Абстрактная Образная 1 2 12 82 93 63 105 145 Суммы 94 156 n=250 Число всех наблюдений N = 250. Количество категорий номинальной переменной «IQ» k = 2. Количество участников исследования с низким IQ: 94; количество участников исследования с высоким IQ: 156. Контроль: 94+156=250. Количество категорий номинальной переменной «Реклама» m = 2. Количество участников исследования, которые предпочитают абстрактную рекламу: 105; количество участников исследования которые предпочитают образную рекламу: 145. Контроль: 105+145=250. Эмпирические частоты: Количество выборов абстрактной рекламы участниками с низким IQ: ne11 = 12 ; Количество выборов абстрактной рекламы участниками с высоким IQ: ne 21 = 93 ; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 263 Количество выборов образной рекламы участниками с низким IQ: ne12 = 82 ; Количество выборов образной рекламы участниками с высоким IQ: ne 22 = 63 ; Kонтроль: 12 + 93 + 82 + 63 = 250. Гипотезы: H 0 : Распределения выборов рекламы у участников с высоким IQ и низким IQ имеют случайные отличия друг от друга. H 1 : Распределения выборов рекламы у участников с высоким IQ и низким IQ друг от друга отличаются закономерно. С помощью Таблицы 12.2.2.2 можно вычислить теоретические частоты: nti = ( Сумма частот строки ) ⋅ ( Сумма частот столбца ) . n Таблица 12.2.2.2 Вычисление теоретических частот Ячейки 1-1 1-2 Теоретические частоты 105 ⋅ 94 nt11 = = 39.48 250 145 ⋅ 94 nt12 = = 54.52 250 Ячейки 2-1 Теоретические частоты 105 ⋅156 nt 21 = = 65.52 250 145 ⋅156 nt 22 = = 90.48 250 2-2 Количество категорий обеих номинальных переменных k = m = 2. Поэтому надо учесть „поправку на непрерывность”. Таблица 12.2.2.3 Вычисление наблюдаемого значения критерия- χ 2 Разряды nei nti nei − nti nei − nti − 0.5 1-1 1-2 2-1 2-2 Суммы 12 82 93 63 39.48 54.52 65.52 90.48 27.48 27.48 27.48 27.48 26.98 26.98 26.98 26.98 250 250 (n − nti − 0.5) 2 ei 727.9204 727.9204 727.9204 727.9204 (n ei − nti − 0.5) nti 2 18.438 13.351 11.110 8.045 2 χ e =50.94 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 264 В последней строке Таблицы 12.2.2.3 указаны суммы для контроля. Контроль: 1) Сумма 2-ого столбца: N = ne11 + ne12 + ne 21 + ne22 = 12 + 82 + 93 + 63 = 250 ; 2) Сумма 3-ого столбца: N = nt11 + nt12 + nt 21 + nt 22 = 39.48 + 54.52 + 65.52 + 90.48 = 250 . Сумма последнего столбца совпадает с наблюдаемым значением критерия- χ 2 : χ e2 = 50.94 . Число степеней свободы равно df = ( k − 1)( m − 1) = ( 2 − 1)( 2 − 1) = 1 . C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста p = .000 < .001. Нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Размеры эффекта (12.2.5)-(12.2.8): ϕ= 50.94 = .45 , 250 V= 50.94 = .45 , 250 ( 2 − 1) C= 50.94 = .41 . ( 250 + 50.94) Размер эффекта для φ и С средний (.1 – небольшой размер эффекта, .3 – средний размер эффекта, .5 – большой размер эффекта). Размер эффекта для V определяется по Таблице 12.2.2. Ответ. Распределения выборов рекламы у участников с высоким IQ и низким IQ друг от друга отличаются закономерно. χ2(1, N = 250) = 50.9, p < .001. Выбор рекламы связан с IQ. Размер эффекта средний: φ = V= .45, С = .41 . Решение с помощью SPSS Для решения данной задачи на SPSS исходные данные должны быть представлены в виде трех столбцов: «шифр респондента [Code]», номинальной переменной «IQ [IQ]», с Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 265 двумя разрядами «low [1]», «high [2]» и номинальной переменной «Advertisement [AD]» c двумя разрядами «abstraсt [1]», «imaginative [2]» (Рис.12.2.2.1-12.2.2.2). Рисунок 12.2.1.1. Описание переменных. Рисунок 12.2.2.2. Ввод данных. Данные можно «восстановить», используя данные Таблицы 12.2.2.1, по аналогии с Примером 3. Файл с данными назовем Advertisement_IQ.xlsx. После ввода данных: Analyze Descriptive Statistics Crosstabs … В появившемся диалоговом окне Crosstabs перенести переменную IQ [IQ] в окно Row(s), а переменную Advertisement [AD] - в окно Column(s). Поставить галочку в окошке Display clustered bar charts. Statistics… В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окошке Chi-square, поставить галочку в окошке Phi and Cramer’s V поставить галочку в окошке Сontingency Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 266 Continue OK Выходная информация: Crosstabs Таблица 12.2.2.4 Обработанные наблюдения (Case Processing Summary) Cases Valid N IQ * Advertisement Missing Percent 250 N 100.0% Total Percent N 0.0% Percent 250 100.0% Таблица 12.2.2.5 Построенная в SPSS таблица результатов опроса (IQ * Advertisement Crosstabulation) Count Advertisement abstract IQ Total imaginative low 12 82 94 high 93 105 63 145 156 250 Total Таблица 12.2.2.6 Статистики тестов χ 2 (Chi-Square Tests) Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided) 52.850a 50.944 57.890 1 1 1 .000 .000 .000 52.638 1 Exact Sig. (2-sided) Exact Sig. (1-sided) .000 .000 .000 250 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 39.48. b. Computed only for a 2x2 table В верхней строчке (Pearson Chi-Square): Value- наблюдаемое значение критерия χ e2 = 52.850; число степеней свободы df = 1; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 267 р-вероятность, равная .000 < .001, которая говорит о том, что распределения отличаются статистически значимо. В следующей строчке (Continuity Correction - поправка на непрерывность Yate): Value- наблюдаемое значение критерия χ e2 = 50.944; число степеней свободы df = 1; р-вероятность, равная .000 < .001, которая говорит о том, что распределения выборов рекламы отличаются статистически значимо. Под таблицей находится сообщение о том, что минимальная ожидаемая (теоретическая) частота в ячейках равна 39.48, что нет ни одной ячейки с теоретической частотой, меньшей 5. Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Выявлена связь между IQ и выбором рекламы: χ2(1, N = 250) = 50.9, p < .001. Таблица 12.2.2.7 Симметричные меры (Symmetric Measures) Value Phi Nominal by Nominal Approx. Sig. -.460 .000 Cramer's V .460 .000 Contingency Coefficient .418 .000 N of Valid Cases 250 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Из Таблицы 12.2.2.7 находим размеры эффектов: w = φ = V = .46, p < .001, C = .42, p < .001. Размеры эффектов немного завышенные по сравнению с размерами эффектов, рассчитанными вручную. Это происходит вследствие того, что при их вычислении SPSS не учитывает поправку Yate. Графические иллюстрации, полученные в SPSS (Рис. 12.2.2.3-12.2.2.4). Рисунки отредактированы в SPSS. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 268 Диаграмма распределения участников с высоким и низким IQ по выборам рекламы (Рис. 12.2.2.3) получается строится автоматически по заказу - галочка в окошке Display clustered bar charts. Для получения диаграммы распределения выборов рекламы испытуемыми с высоким и низким IQ (Рис. 12.2.2.4) в диалоговом окне Crosstabs переменную IQ [IQ] надо перенести в окно Row(s), а переменную Advertisement [AD] - в окно Column(s). Рисунок 12.2.2.3. Распределения участников с высоким и низким IQ по выборам рекламы. Рисунок 12.2.2.4. Распределения выборов рекламы испытуемыми с высоким и низким IQ. Результаты совпадают с результатами, полученными вручную, с помощью Excel. 13. Исследование выборов терминальных ценностей (ТЦ) по М. Рокичу Терминальными ценностями по М.Рокичу являются следующие 18 ценностей: t1 активная, деятельная жизнь; жизненная мудрость (зрелость суждений и здравый смысл, достигаемые t2 жизненным опытом); t3 здоровье (физическое и психическое здоровье); t4 интересная работа; t5 красота природы и искусства t6 любовь (духовная и физическая близость) t7 материально обеспеченная жизнь (отсутствие материальных затруднений) t8 наличие хороших и верных друзей; t9 общественное признание Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 269 познание (возможность расширения своего образования, кругозора, общей t10 культуры, интеллектуальное развитие); t11 продуктивная жизнь; t12 развитие; t13 развлечения; t14 свобода; t15 счастливая семейная жизнь; t16 счастье других; t17 творчество; t18 уверенность в себе Исследовалось, какие именно ценности предпочитают люди переживающие одиночество (выборка G1, 30 участников) и не переживающие одиночество (выборка G2, 30 участников). Исходные данные представлены в файле Data_Chi_Rokich.xlsx. Участникам было предложено проранжировать ценности по отношению их важности для себя. Ранг 1 соответствовал наиболее важной ценности, а ранг 18 – наименее важной. Для решения данной задачи на SPSS исходные данные должны быть представлены в виде 20 столбцов: «шифр участника [Code]», номинальной переменной «Group [gr]», с двумя разрядами «G1 [1]», «G2 [2]» и порядковыми переменными t1, t2, …, t18 (Рис.13.1). Рисунок 13.1. Описание переменных. Фрагмент. Рисунок 13.2. Ввод данных. Фрагмент. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 270 Если разбить группу из 18 рангов на квартили, то точные значения квартилей (Наследов, 2004; с.43) - Q1=4.75 и Q3=14.25. Значения рангов, меньших, чем 5, будет составлять группу наиболее важных ценностей. Значения рангов от 5 до 14 составляют группу ценностей средней важности, а значения рангов, больших, чем 14, будет составлять группу наименее важных ценностей. Сравнивались распределения ценностей, имеющих ранги от одного до четырех (первая квартильная группа – наиболее важные ценности) в выборках G1 и G2. Статистическая значимость полученных результатов проверялась с помощью критерия «Хи-квадрат» Пирсона. Analyze Descriptive Statistics Frequencies… Рисунок 13.3. Заказ частотных таблиц OK С помощью полученных частотных таблиц были составлены Таблицы 13.1-13.2. Распределение ценностей по первым четырем рангам представлены Таблицами 13.313.4. Таблицы 13.3-13.4 объединены в Таблицу 13.5. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 271 Таблица 13.1 Распределения терминальных ценностей в выборке переживающих одиночество G1 t10 t11 t12 t13 t14 t15 t16 t17 t18 Суммы G1 t1 t2 t3 t4 t5 t6 t7 t8 t9 1 1 2 1 8 5 4 1 1 1 6 1 31 2 3 3 3 5 2 5 2 2 3 1 4 33 3 2 1 2 1 5 2 3 2 2 1 1 3 1 1 27 4 1 5 2 2 2 1 5 1 1 2 2 5 3 32 5 1 3 1 1 2 3 2 3 1 1 3 1 2 3 2 29 6 1 2 2 1 1 2 2 2 8 2 2 2 1 3 31 7 4 3 1 1 1 2 2 2 3 4 2 2 1 28 8 3 1 2 3 1 2 2 1 4 2 4 2 2 1 1 5 36 9 5 3 2 1 1 2 2 1 3 3 2 1 3 29 10 4 2 1 2 3 2 2 2 4 1 2 1 26 11 1 3 2 1 1 2 1 2 6 4 1 1 3 1 3 32 12 3 2 1 1 1 3 1 3 3 1 3 1 1 1 1 26 13 2 2 5 1 1 1 5 2 3 1 2 3 3 31 14 7 6 1 2 1 2 4 1 8 2 1 2 37 15 1 3 1 3 1 2 2 2 1 2 1 2 2 1 24 16 2 1 1 6 1 2 2 5 6 4 30 17 1 8 2 1 8 3 2 5 6 36 18 2 1 2 2 5 10 22 Суммы 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 540 Таблица 13.2 Распределения терминальных ценностей в выборке непереживающих одиночество G2 t10 t11 t12 t13 t14 t15 t16 t17 t18 Суммы G2 t1 t2 t3 t4 t5 t6 t7 t8 t9 1 8 2 5 1 1 6 1 2 1 2 1 30 2 2 6 8 2 2 2 1 1 1 1 1 1 2 30 3 8 3 6 3 3 1 1 1 2 3 31 4 5 4 2 2 8 2 2 1 2 1 1 30 5 1 1 3 3 3 1 1 1 3 1 1 3 3 1 5 31 6 3 1 1 4 2 2 4 3 1 4 3 1 3 32 7 4 3 1 5 3 3 4 1 2 1 3 30 8 1 1 2 1 4 1 2 1 5 3 1 1 5 2 30 9 1 4 3 3 3 3 2 1 1 5 1 1 2 30 10 1 1 3 1 2 1 1 2 2 7 1 3 2 2 29 11 1 1 1 1 1 1 8 1 5 3 2 3 1 29 12 1 1 1 1 1 1 3 4 2 4 2 3 2 1 4 31 13 3 3 4 2 4 3 1 3 6 1 2 32 14 1 4 1 3 6 4 1 2 3 1 1 1 28 15 1 5 1 8 1 1 1 1 2 2 4 3 5 1 1 37 16 1 2 1 7 1 1 3 2 3 5 1 27 17 1 1 3 2 3 6 9 25 18 3 1 1 1 3 5 14 28 Суммы 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 540 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 272 Таблица 13.3 Распределения терминальных ценностей, попавших на 1-4 место в выборке переживающих одиночество G1 t10 t11 t12 t13 t14 t15 t16 t17 t18 Суммы G1 t1 t2 t3 t4 t5 t6 t7 t8 t9 1 1 2 1 8 5 4 1 1 1 6 1 31 2 3 3 3 5 2 5 2 2 3 1 4 33 3 2 1 2 1 5 2 3 2 2 1 1 3 1 1 27 4 1 5 2 2 2 1 5 1 1 2 2 5 3 32 Суммы 6 5 12 3 3 20 10 17 3 3 2 4 1 6 17 1 1 9 123 Таблица 13.4 Распределения терминальных ценностей, попавших на 1-4 место, в выборке непереживающих одиночество G2 t10 t11 t12 t13 t14 t15 t16 t17 t18 Суммы G2 t1 t2 t3 t4 t5 t6 t7 t8 t9 1 8 2 5 1 1 6 1 2 1 2 1 30 2 2 6 8 2 2 2 1 1 1 1 1 1 2 30 3 8 3 6 3 3 1 1 1 2 3 31 4 5 4 2 2 8 2 2 1 2 1 1 30 Суммы 23 2 13 21 1 3 13 14 4 1 3 4 1 4 4 2 2 6 121 Таблица 13.5. Распределения терминальных ценностей по М. Рокичу, попавших на 1-4 место, в выборках людей, субъективно переживающих одиночество (G1) и непереживающих одиночество (G2) t1 t2 t3 t4 t5 t6 t7 t8 t9 G1 6 5 12 3 3 20 10 17 3 t10 t11 t12 t13 t14 t15 t16 t17 t18 3 2 4 1 G2 23 2 13 21 1 3 13 14 4 1 3 4 1 Суммы 29 7 25 24 4 23 23 31 7 4 5 8 2 6 Суммы 9 123 2 6 121 3 15 244 17 1 1 4 4 2 10 21 3 По Таблице 13.5 составим файл данных TermValues.sav. Данные должны быть представлены в виде двух столбцов: номинальной переменной «Group», с двумя разрядами «G1 [1]», «G2 [2]» и номинальной переменной «Terminal Values [TV]» c 18 разрядами «t1 [1]», «t1 [2]» (Рис.13.4). Данные для SPSS приведены в Таблице 13.6. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 273 Таблица 13.6 Выбираемые на 1-4 место терминальные ценности Nr Gr TV Nr Gr TV Nr Gr TV Nr Gr TV Nr Gr TV Nr Gr TV 1 1 1 42 1 6 83 1 11 124 2 1 165 2 4 206 2 8 2 1 1 43 1 6 84 1 11 125 2 1 166 2 4 207 2 8 3 1 1 44 1 6 85 1 12 126 2 1 167 2 4 208 2 8 4 1 1 45 1 6 86 1 12 127 2 1 168 2 4 209 2 8 5 1 1 46 1 6 87 1 12 128 2 1 169 2 4 210 2 8 6 1 1 47 1 6 88 1 12 129 2 1 170 2 4 211 2 8 7 1 2 48 1 6 89 1 13 130 2 1 171 2 4 212 2 8 8 1 2 49 1 6 90 1 14 131 2 1 172 2 4 213 2 8 9 1 2 50 1 7 91 1 14 132 2 1 173 2 4 214 2 9 10 1 2 51 1 7 92 1 14 133 2 1 174 2 4 215 2 9 11 1 2 52 1 7 93 1 14 134 2 1 175 2 4 216 2 9 12 1 3 53 1 7 94 1 14 135 2 1 176 2 4 217 2 9 13 1 3 54 1 7 95 1 14 136 2 1 177 2 4 218 2 10 14 1 3 55 1 7 96 1 15 137 2 1 178 2 4 219 2 11 15 1 3 56 1 7 97 1 15 138 2 1 179 2 4 220 2 11 16 1 3 57 1 7 98 1 15 139 2 1 180 2 4 221 2 11 17 1 3 58 1 7 99 1 15 140 2 1 181 2 4 222 2 12 18 1 3 59 1 7 100 1 15 141 2 1 182 2 4 223 2 12 19 1 3 60 1 8 101 1 15 142 2 1 183 2 5 224 2 12 20 1 3 61 1 8 102 1 15 143 2 1 184 2 6 225 2 12 21 1 3 62 1 8 103 1 15 144 2 1 185 2 6 226 2 13 22 1 3 63 1 8 104 1 15 145 2 1 186 2 6 227 2 14 23 1 3 64 1 8 105 1 15 146 2 1 187 2 7 228 2 14 24 1 4 65 1 8 106 1 15 147 2 2 188 2 7 229 2 14 25 1 4 66 1 8 107 1 15 148 2 2 189 2 7 230 2 14 26 1 4 67 1 8 108 1 15 149 2 3 190 2 7 231 2 15 27 1 5 68 1 8 109 1 15 150 2 3 191 2 7 232 2 15 28 1 5 69 1 8 110 1 15 151 2 3 192 2 7 233 2 15 29 1 5 70 1 8 111 1 15 152 2 3 193 2 7 234 2 15 30 1 6 71 1 8 112 1 15 153 2 3 194 2 7 235 2 16 31 1 6 72 1 8 113 1 16 154 2 3 195 2 7 236 2 16 32 1 6 73 1 8 114 1 17 155 2 3 196 2 7 237 2 17 33 1 6 74 1 8 115 1 18 156 2 3 197 2 7 238 2 17 34 1 6 75 1 8 116 1 18 157 2 3 198 2 7 239 2 18 35 1 6 76 1 8 117 1 18 158 2 3 199 2 7 240 2 18 36 1 6 77 1 9 118 1 18 159 2 3 200 2 8 241 2 18 37 1 6 78 1 9 119 1 18 160 2 3 201 2 8 242 2 18 38 1 6 79 1 9 120 1 18 161 2 3 202 2 8 243 2 18 39 1 6 80 1 10 121 1 18 162 2 4 203 2 8 244 2 18 40 1 6 81 1 10 122 2 18 163 2 4 204 2 8 41 1 6 82 1 10 123 2 18 164 2 4 205 2 8 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 274 Рисунок 13.4. Описание переменных. Рисунок 13.5. Ввод данных. Фрагмент. Данные можно «восстановить», сконструировав Таблицу 13.5, используя данные Таблицы 13.6. Сравнение двух эмпирических распределений с равномерным распределением Гипотезы: 1-ая группа H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, переживающих одиночество, отличается от равномерного распределения случайно. H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, переживающих одиночество, отличается от равномерного распределения закономерно. 2-ая группа H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, непереживающих одиночество, отличается от равномерного распределения случайно. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 275 H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, непереживающих одиночество, отличается от равномерного распределения закономерно. Data Split file… Рисунок 13.6. Создание выхода по группам. ОК Analyze Nonparametric Tests Legacy Dialogs Chi-Square … В появившемся диалоговом окне перенести переменную Terminal Values [TV] в окно Test Variable List. ОК Выходная информация: Таблица 13.7 Статистики теста χ 2 (Test Statistics). Группа G1 TC Chi-Square df Asymp. Sig. 91.281a 17 .000 a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 6.7. b. Group = G1 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 276 Таблица 13.8 Построенная в SPSS таблица результатов опроса с теоретическими частотами и разностями частот. Группа G1 Observed N t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 Total Expected N 6 5 12 3 3 20 10 17 3 3 2 4 1 6 17 1 1 7 121 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 6.7 Residual -.7 -1.7 5.3 -3.7 -3.7 13.3 3.3 10.3 -3.7 -3.7 -4.7 -2.7 -5.7 -.7 10.3 -5.7 -5.7 .3 a. Group = G1 В Таблице 13.7 р = .000 <. 001, говорит о том, что распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, переживающих одиночество, максимально значимо (то есть на уровне значимости α = .001) отличается от равномерного распределения: χ2(17, N = 121) = 91.3, p < .001. Размер эффекта (12.1.3) равен: w = 91.281 = .87 большой. 121 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 277 Таблица 13.9 Построенная в SPSS таблица результатов опроса с теоретическими частотами и разностями частот. Группа G2 Observed N t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 Total Expected N 23 2 13 21 1 3 13 14 4 1 3 4 1 4 4 2 2 8 123 Residual 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 16.2 -4.8 6.2 14.2 -5.8 -3.8 6.2 7.2 -2.8 -5.8 -3.8 -2.8 -5.8 -2.8 -2.8 -4.8 -4.8 1.2 a. Group = G2 Таблица 13.10 Статистики теста χ 2 (Test Statistics). Группа G2 TC Chi-Square df Asymp. Sig. 120.659a 17 .000 a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 6.8. b. Group = G1 р = .000<.001, говорит о том, что распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, непереживающих одиночество, максимально значимо отличается от равномерного распределения: χ2(17, N = 123) = 120, p < .001. Размер эффекта (12.1.3) равен: w = 120.659 = .99 большой. 123 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 278 Сравнение двух эмпирических распределений Гипотезы: H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, переживающих одиночество и у участников, непереживающих одиночество, имеют случайные отличия друг от друга. H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у участников, переживающих одиночество и у участников, непереживающих одиночество, отличаются друг от друга закономерно. Data Split file… Reset OK Analyze Descriptive Statistics Crosstabs … В появившемся диалоговом окне Crosstabs перенести переменную Terminal Values [TV] в окно Row(s), а переменную Group - в окно Column(s). Поставить галочку в окошке Display clustered bar charts. Statistics… В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в оконах Chisquare, , Contingency Coefficient, Phi and Cramer’s V. Continue OK Выходная информация: Crosstabs Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 279 Таблица 13.11 Построенная в SPSS таблица результатов опроса (TC * Group Crosstabulation) Count Group G1 TC G2 Total t1 6 23 29 t2 5 2 7 t3 12 13 25 t4 3 21 24 t5 3 1 4 t6 20 3 23 t7 10 13 23 t8 17 14 31 t9 3 4 7 t10 3 1 4 t11 2 3 5 t12 4 4 8 t13 1 1 2 t14 6 4 10 t15 17 4 21 t16 1 2 3 t17 1 2 3 t18 7 121 8 123 15 244 Total Таблица 13.12 Статистики тестов χ 2 (Chi-Square Tests) Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 49.549a 54.176 7.309 244 df Asymp. Sig. (2-sided) 17 17 1 .000 .000 .007 a. 19 cells (52.8%) have expected count less than 5. The minimum expected count is .99. р-value, равное .000 <. 001, говорит о том, что распределения отличаются статистически значимо: χ2(17, N = 244) = 49.6, p < .001. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 280 Таблица 13.13 Симметричные меры (Symmetric Measures) Value Nominal by Nominal Approx. Sig. Phi .451 .000 Cramer's V .451 .000 Contingency Coefficient .411 .000 N of Valid Cases 244 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Размер эффекта (12.2.5)-(12.2.8) средний. Коэффициенты равны: w = V = .45 , p < .001, C = .41, p < .001. Выявлена связь между переживанием одиночества и выбором терминальных ценностей. Графические иллюстрации, полученные в SPSS (Рис.13.7-13.8). Рисунки отредактированы в SPSS. Для получения диаграммы (Рис.13.8) в диалоговом окне Crosstabs переменную Group надо перенести в окно Row(s), а переменную Terminal Values [TV] - в окно Column(s). Рисунок 13.7. Распределения участников переживающих одиночество (Группа 1) и непереживающих одиночество (Группа 2) по выборам терминальных ценностей. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 281 Рисунок 13.8. Распределения выборов терминальных ценностей испытуемыми переживающих одиночество (Группа 1) и непереживающих одиночество (Группа 2). Так как распределения отличаются статистически значимо, то можно просто описать рисунки. Наиболее выраженными ценностями можно считать ценности, количество выборов которых превышает 3-ий квартиль. Если рассмотреть все выборы, то это будет: Q3 = 11.5. Значимые терминальные ценности у непереживающих одиночество (из Таблиц 14.5 или 14.11): t1, t3, t4, t7, t8. Это: § активная, деятельная жизнь; § здоровье (физическое и психическое здоровье); § интересная работа; § материально обеспеченная жизнь (отсутствие материальных затруднений); § наличие хороших и верных друзей. Значимые ценности у переживающих одиночество: t3, t6, t8, t15. Это: § здоровье (физическое и психическое здоровье); § любовь (духовная и физическая близость); § наличие хороших и верных друзей; § счастливая семейная жизнь. Таким образом, выбор терминальных ценностей связан с переживанием одиночества. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 282 14. Частотный анализ. Тест «Угловое преобразования Фишера φ*» ϕ ∗ - угловое преобразование Фишера (Fisher's angular transformation). Применение теста Фишера ϕ ∗ позволяет решать задачи, в которых можно перейти к сравнению долей или процентов, с их последующим сравнением. Поэтому эмпирические данные могут быть представлены в любой шкале, выборки могут быть как зависимыми, так и независимыми. Критерий Фишера ϕ ∗ предназначен для сравнения двух выборок по частоте встречаемости исследуемого эффекта и основан на сравнении долей. Доли могут также быть выражены в процентах. Ограничения: pi ≠ 0 , где через pi обозначены доли участников с исследуемым эффектом в группе i. Алгоритм применения критерия- ϕ ∗ Даны две выборки участников: 1 и 2. Объемы выборок n1 и n 2 . Количество участников в выборке 1, у которых присутствует изучаемый эффект равно ne1 и доля этих участников равна p1 = n e1 n , или в процентах: p1 = e1 ⋅ 100% . n1 n1 Аналогично, количество участников в выборке 2, у которых присутствует изучаемый эффект равно ne2 и доля этих участников равна p 2 = p2 = ne 2 , или в процентах: n2 ne 2 ⋅ 100% n2 Гипотезы: H 0 : Доли участников, у которых проявляется исследуемый эффект в выборках 1 и 2 имеют случайные отличия. H 1 : Доли участников, у которых проявляется исследуемый эффект в выборках 1 и 2 имеют закономерные отличия. Вычислить ϕ1 и ϕ 2 по формуле: ϕ = 2 ⋅ arcsin ( p ), Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. (14.1) 283 в которой p выражено в долях единицы: 0 < p ≤ 1 . Вычислить наблюдаемое значение критерия ϕe∗ по формуле (Сидоренко, 2000) 3: ϕe∗ = ϕ 2 − ϕ1 ⋅ n1n2 , n1 + n2 (14.2) n1 и n 2 - объемы выборок. Способ 1. Исследование значимости различий с помощью критических точек Критические точки φα (α - уровень значимости) для двухсторонней критической области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны: φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 . Если φ∗e < 1.96, то различие долей не найдено: нет основания отклонить нулевую гипотезу. Нулевая гипотеза отклоняется на уровне значимости α и принимается альтернативная гипотеза при φ∗e ≥ 1.96. Если 1.96 ≤ φ∗e < 2.58, то различие статистически значимо на уровне значимости α = .05. Если 2.58 ≤ φ∗e < 3.29, то различие статистически значимо на уровне значимости α = .01. Если φ∗e ≥ 3.29, то различие статистически значимо на уровне значимости α = .001. Способ 2. Исследование значимости различий с помощью p - value Открываем программу Excel (п.7.7). Для стандартизованного нормального распределения one-tailed p-value: = 1 – NORM.S.DIST(number,TRUE) ENTER 3 Tests for Two Proportions using Effect Size. In PASS Sample Size Software. Chapter 199. Pp. 1-2. NCSS, LLC. Available at https://ncss-wpengine.netdna-ssl.com/wpcontent/themes/ncss/pdf/Procedures/PASS/Tests_for_Two_Proportions_using_Effect_Size.pdf Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 284 Это площадь под нормальной кривой справа от точки «number», то есть это one-tailed pvalue. Для нахождения two-tailed p-value, вычисленное значение one-tailed p-value надо умножить на два: two-tailed p-value = 2* one-tailed p-value Замечание. Процесс вычисления ϕe∗ -статистики может быть организован в Excel (Смотрите файл Fisher's_angular_transformation.xlsx). Программирование формул: 1) ϕ = 2 ⋅ arcsin ( p) =2*ASIN(SQRT(номер ячейки, где стоит р, вычисленное в долях единицы)) 2) φ∗e = φ 2 − φ1 ⋅ n1n2 n1 + n2 =ABS( φ2 − φ1 )*SQRT( n1n2 /( n1 + n2 )) где вместо φ2 , φ1 , n1 , n2 стоят номера их ячеек. Размер эффекта Коуэна h для различий долей (ненаправленный) (Cohen, 1988, p.181)4: h = ϕ1 − ϕ2 . (14.3) Принята классификация размеров эффекта: 0.2 - небольшой, 0.5 - средний, 0.8 – большой. Пример 1 В ходе исследования установлено, что в конфликтной ситуации избегание, как стратегию поведения, выбирают 83.7% взрослых (из 43 участников) с заниженной самооценкой и 32.4% взрослых (из 37 участников) с адекватной самооценкой. Проверить, является ли полученное различие статистически значимым? Использовать тест «Угловое преобразование Фишера». Рассмотреть два варианта исследования статистической значимости: с помощью критических точек и с помощью р-value. Найти размер эффекта. 4 Ramsay, R.F. (2010). Generating Cohen’s effect size “h” via/arcsin/arcsine transformations. https://people.ucalgary.ca/~ramsay/cohen-effect-size-h-arcsin-transformation.htm. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 285 Решение Даны две выборки участников: 1 (с адекватной самооценкой) и 2 (с заниженной самооценкой). Объемы выборок n1 =37 и n2 =43. Доля участников в выборке 1, которые выбирают избегание, как стратегию поведения в конфликтной ситуации, равна p1 =32.4%; Доля участников в выборке 2, которые выбирают избегание, как стратегию поведения в конфликтной ситуации, равна p2 =83.7%. Гипотезы: H 0 : Доля участников с адекватной самооценкой, выбирающих избегание, как стратегию поведения в конфликтной ситуации имеет случайное отличие, от доли участников с заниженной самооценкой, выбирающих избегание. H 1 : Доля участников с адекватной самооценкой, выбирающих избегание, как стратегию поведения в конфликтной ситуации имеет закономерное отличие, от доли участников с заниженной самооценкой, выбирающих избегание. Находим: ( ) ( ) φ1 = 2 ⋅ arcsin .324 = 1.211; φ2 = 2 ⋅ arcsin .837 = 2.310. Вычисляем наблюдаемое значение критерия φ∗e : φ∗e = ( 2.310 − 1.211) ⋅ 37 ⋅ 43 = 4.90 . 37 + 43 Способ 1. Исследование значимости различий с помощью критических точек Критические точки φα (α - уровень значимости) для двухсторонней критической области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны: φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 . Нулевая гипотеза отклоняется на уровне значимости α и принимается альтернативная гипотеза так как φ∗e = 4.90 ≥ 1.96. φ∗e = 4.90 ≥ 3.29, поэтому различие статистически значимо на уровне значимости α = .001. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 286 Способ 2. Исследование значимости различий с помощью p - value p-value находим с помощью программы Excel (п.7.7). В результате получаем: two-tailed value = p = 9.58367e-007 = .000000958367 < .001. Оба способа проверки статистической значимости привели к одному и тому же результату. Размер эффекта Коуэна h для различий отношений (ненаправленный) равен (14.3): h = 1.211 − 2.310 = 1.10 . Ответ. Доля взрослых участников с адекватной самооценкой, выбирающих избегание, как стратегию поведения в конфликтной ситуации ниже, чем доля участников с заниженной самооценкой, выбирающих избегание ( φ∗e =4.90; p < .001 , two-tailed). Взрослые люди с заниженной самооценкой в конфликтной ситуации, как правило, в качестве стратегии поведения выбирают избегание, для людей с адекватной самооценкой не характерно выбирать именно эту стратегию поведения. Результат является закономерным и не может быть объяснен случайными причинами. Выбор стратегии поведения в конфликтной ситуации связан с самооценкой. Найти размер эффекта. Размер эффекта Коуэна h =1.10 большой. Пример 2. В ходе исследования установлено, что из 35 молодых участников с высоким социометрическим статусом (СС) высокий уровень субъективного контроля (УСК) имеют 22 участника, а из 45 участников с низким социометрическим статусом высокий уровень субъективного контроля лишь у 4. Проверить гипотезу: «Девушки и юноши с высоким социометрическим статусом имеют интернальный (т.е. высокий) локус контроля» Использовать тест «Угловое преобразование Фишера». Рассмотреть два варианта исследования статистической значимости: с помощью критических точек и с помощью р-value. Найти размер эффекта. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 287 Решение Даны две выборки участников: 1 (с высоким СС) и 2 (с низким СС). Объемы выборок n1 =35 и n 2 =45. Количество участников с высоким СС, у которых высокий УСК, равно ne1 =22 и доля таких участников равняется p1 = 22 = .6286 или p1 = 62.86% . 35 Количество участников с низким СС, у которых высокий УСК, равно ne2 =4 и доля таких участников равняется p2 = 4 = .0889 или p2 = 8.89% . 45 При этом p1 > p2 . Гипотезы: H 0 : Доля участников с высоким социометрическим статусом, у которых высокий уровень субъективного контроля, и доля участников с низким социометрическим статусом, у которых высокий уровень субъективного контроля имеют случайное отличие. H 1 : Доля участников с высоким социометрическим статусом, у которых высокий уровень субъективного контроля, и доля участников с низким социометрическим статусом, у которых высокий уровень субъективного контроля имеют закономерное отличие. Находим: ( ) ( ) φ1 = 2 ⋅ arcsin .6286 = 1.83; φ2 = 2 ⋅ arcsin .0889 = 0.61. Вычисляем наблюдаемое значение критерия ϕe∗ : φ∗e = (1.83 − 0.61) ⋅ 35 ⋅ 45 = 5.44 . 35 + 45 Способ 1. Исследование значимости различий с помощью критических точек Критические точки ϕα (α - уровень значимости) для двухсторонней критической области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны: φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 288 Нулевая гипотеза отклоняется на уровне значимости α и принимается альтернативная гипотеза так как φ∗e = 5.44 ≥ 1.96. φ∗e =5.44 ≥ 3.29, поэтому различие статистически значимо на уровне значимости α = .001. Способ 2. Исследование значимости различий с помощью p - value p-value находим с помощью программы Excel (п.8.7). Для стандартизованного нормального распределения one-tailed p-value: = 1 – NORM.S.DIST(ABS(number), TRUE) В результате получаем: two-tailed value = p = 5.32806e-008 = .0000000532806 < .001. Оба способа проверки статистической значимости привели к одному и тому же результату. Размер эффекта Коуэна h для различий отношений (ненаправленный) равен: h = 1.83 − 0.61 = 1.22 . Ответ. Доля участников с высоким социометрическим статусом, у которых высокий уровень субъективного контроля, выше, чем доля участников с низким социометрическим статусом, у которых высокий уровень субъективного контроля ( φ∗e =5.44; p < .001 ). Результат является закономерным и не может быть объяснен случайными причинами. Размер эффекта Коуэна h =1.22 большой. Домашнее задание 2 Выполнить задания, которые находятся в файле Home_Work_2_Chi_Square_Variants.pdf. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 289 15. Частотный анализ для примера исследования связи между самооценкой и агрессией Продолжим исследование связи между самооценкой и агрессией у подростков, которое было начато в параграфе 11. Переход к низким, к высоким и к средним показателям Переход к низким, высоким и средним показателям правильнее всего осуществлять с помощью методик измерения. Если, по каким-либо причинам в методике нормы не указаны, или неясно, насколько методика адаптирована, то можно осуществлять разбивку по выборочным данным. Если распределение выборочных данных не соответствует нормальному распределению, то разбивка данных на три группы может осуществляться с помощью квартилей Q1 и Q3 . Если оценки по самооценке выше Q3 , то их называют «высокими» (“augsts”). Если они находятся в интервале от Q1 до Q3 , то они считаются для самооценки «адекватными» (“adekvāts”) и для других переменных «средними» (“vidējs”). Если ниже Q1 , то оценки «низкие» (“zems”) (Таблица 15.1). Из Таблицы 15.1 находим, квартили Q1 и Q3 по всем переменным (берем их из Таблицы 11.2.1.1). Таблица 11.1 and Distrust 2.00 4.50 2.00 Q3 71.58 8.00 7.00 7.00 4.00 5.00 5.00 7.00 5.00 Guilt 2.00 Aggression 2.00 Verbal Resentment 4.00 Suspicion Negativism 2.00 Aggression 3.00 Indirect 52.91 Aggression Q1 Physical Irritation Self-Esteem Квартили Q1 и Q3 Разбиение данных осуществляется автоматически, с помощью программы Syntax. Откроем файл Samoocenka_Agresija.sav Откроем новое окно синтакса: File New Syntax Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 290 и напишем в нем следующий текст программы: if (SE<=52.91) SE_ind=1 . if (SE>52.91 & SE<71.58 ) SE_ind=2 . if (SE>=71.58) SE_ind=3 . variable labels SE_ind 'Self-Esteem'. value labels SE_ind 1 'Low' 2 'Medium' 3 'High'. if (PhA<=3) PhA_ind=1 . if (PhA>3 & PhA<8 ) PhA_ind=2 . if (PhA>=8) PhA_ind=3 . variable labels PhA_ind 'Physical Aggression'. value labels PhA_ind 1 'Low' 2 'Medium' 3 'High'. if (IA<=2) IA_ind=1 . if (IA>2 & IA<7 ) IA_ind=2 . if (IA>=7) IA_ind=3 . variable labels IA_ind 'Indirect Aggression'. value labels IA_ind 1 'Low' 2 'Medium' 3 'High'. if (I<=4) I_ind=1 . if (I>4 & I<7 ) I_ind=2 . if (I>=7) I_ind=3 . variable labels I_ind 'Irritation '. value labels I_ind 1 'Low' 2 'Medium' 3 'High'. if (N<=2) N_ind=1 . if (N>2 & N<4 ) N_ind=2 . if (N>=4) N_ind=3 . variable labels N_ind 'Negativism'. value labels N_ind 1 'Low' 2 'Medium' 3 'High'. if (R<=2) R_ind=1 . if (R>2 & R<5 ) R_ind=2 . if (R>=5) R_ind=3 . variable labels R_ind 'Resentment'. value labels R_ind 1 'Low' 2 'Medium' 3 'High'. if (S<=2) S_ind=1 . if (S>2 & S<5 ) S_ind=2 . if (S>=5) S_ind=3 . variable labels S_ind 'Suspicion and Distrust'. value labels S_ind 1 'Low' 2 'Medium' 3 'High'. if (VA<=4.5) VA_ind=1 . if (VA>4.5 & VA<7 ) VA_ind=2 . if (VA>=7) VA_ind=3 . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 291 variable labels VA_ind 'Verbal Aggression'. value labels VA_ind 1 'Low' 2 'Medium' 3 'High'. if (G<=2) G_ind=1 . if (G>2 & G<5 ) G_ind=2 . if (G>=5) G_ind=3 . variable labels G_ind 'Guilt'. value labels G_ind 1 'Low' 2 'Medium' 3 'High'. execute. Сохраним файл под именем Q_of SyntaxSA.SPS (Рис.15.1). Рисунок 15.1. Переход к низким, средним и высоким показателям. Для того, чтобы программа выполнила необходимые действия необходимо ВЫДЕЛИТЬ ВЕСЬ ТЕКСТ (Edit – Select All) и нажать «треугольник» (пуск), All (Рис.15.2). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 292 Рисунок 15.2. Запуск программы. После выполнения всех выше перечисленных действий в наш исходный файл SelfEsteem_Aggression.sav автоматически будут добавлены столбцы данных. Появятся новые переменные. Останется только поставить число знаков после запятой (Decimals) равным нулю и выбрать Nominal Measure (Рис.15.3). Рисунок 15.3. Новые переменные Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 293 Рисунок 15.4. Новые данные Analyze Descriptive Statistics Crosstabs … В появившемся диалоговом окне Crosstabs перенести переменную SE[SE_ind] в окно Row(s), а переменную Physical Aggression[PhA_ind] - в окно Column(s). Поставить галочку в окне Display clustered bar charts (Рис.15.5). Рисунок 15.5. Диалоговое окно теста Crosstabs – сравнение двух эмпирических распределений Statistics… В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окне Chisquare (Рис.15.6). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 294 Рисунок 15.6. Диалоговое окно теста Crosstabs: Statistics Continue OK Выходные данные: «Самооценка – Физическая агрессия» Таблица 15.2 Обработанные наблюдения Cases Valid N Self-Esteem * Physical Aggression Missing Percent 145 N Total Percent 100.0% .0% N Percent 145 100.0% Таблица 15.3 Self-Esteem * Physical Aggression Crosstabulation Count Physical Aggression Low Self-Esteem Total Low Medium High Total 4 9 23 36 Medium 36 36 1 73 High 3 43 11 56 22 46 36 145 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 295 Таблица 15.4 Chi-Square Tests Value df Asymp. Sig. (2-sided) 66.447a 4 .000 80.532 4 .000 Linear-by-Linear Association .000 1 1.000 N of Valid Cases 145 Pearson Chi-Square Likelihood Ratio a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.68. Таблица 15.5 Cимметричные меры (Symmetric Measures) Value Nominal by Nominal Approx. Sig. Phi .677 .000 Cramer's V .479 .000 Contingency Coefficient .561 .000 N of Valid Cases 145 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. При помощи критерия «Хи-квадрат» проверена выявлена связь между переменными «Самооценка» и «Физическая агрессия» (Бююль & Цефель, 2002): χ2(4, N = 145) = 66.5, p < .001. Размер эффекта (12.2.5)-(12.2.8) большой. Коэффициенты равны: w = .68 , p < .001; V = .48, p < .001; C = .56, p < .001. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .35 размер эффекта считается большим. Из полученных Таблицы 15.3 и диаграммы (Рис.15.7) видно, что 1) Среди подростков с низкой самооценкой больше всего подростков с высокой физической агрессией; 2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и средней физической агрессией; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 296 3) Среди подростков с высокой самооценкой больше всего подростков с высокой физической агрессией. Поменяв местами (Рис.15.5) переменные «Самооценка (Self-Esteem [SE_ind])» и «Физическая агрессия («Physical Aggression [PhA_ind])», можно получить другую диаграмму, относящуюся к той же таблице сопряженности (Рис.15.8). Рисунок 15.7. Распределение участников с высокой, средней и низкой физической агрессией по самооценке. Рисунок 15.8. Распределение участников с высокой, адекватной и низкой самооценкой по физической агрессии. Из диаграммы (Рис.15.8) видно, что 1) Среди подростков с низкой физической агрессией больше всего подростков с адекватной самооценкой; Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 297 2) Среди подростков со средней физической агрессией больше всего подростков с адекватной самооценкой; 3) Среди подростков с высокой физической агрессией больше всего подростков с высокими и низкими самооценками. Аналогичным способом можно получить таблицы (Таблицы 15.6 – 15.26) и диаграммы (отредактированные Рис.15.9 – 15.22) для остальных переменных. «Самооценка – Косвенная агрессия» Таблица 15.6 Self-Esteem * Indirect Aggression Crosstabulation Count Indirect Aggression Low Self-Esteem Medium Low High Total 3 11 22 36 Medium 34 38 1 73 High 2 39 13 62 21 44 36 145 Total Таблица 15.7 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 65.040a 79.219 .000 145 Asymp. Sig. (2-sided) .000 4 4 1 .000 1.000 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.68. Таблица 15.8 Cимметричные меры (Symmetric Measures) Nominal by Nominal N of Valid Cases Phi Cramer's V Contingency Coefficient Value .670 .474 .556 145 Approx. Sig. .000 .000 .000 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Максимально значимая связь: χ2(4, N = 145) = 65.0, p < .001. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 298 Размер эффекта (12.2.5)-(12.2.8) большой. Коэффициенты равны: w = .67 , p < .001; V = .47, p < .001; C = .56, p < .001. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .35 размер эффекта считается большим. Рисунок 15.9. Распределение участников с высокой, средней и низкой косвенной агрессией по самооценке Рисунок 15.10. Распределение участников с высокой, адекватной и низкой самооценкой по косвенной агрессии «Самооценка – Раздражение» Таблица 15.9 Self-Esteem * Irritation Crosstabulation Count Irritation Low Self-Esteem Medium Low High Total 3 4 29 36 Medium 34 37 2 73 High 5 42 12 53 19 50 36 145 Total Таблица 15.10 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 73.384a 85.181 3.146 145 df Asymp. Sig. (2-sided) 4 4 1 .000 .000 .076 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.43. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 299 Максимально значимая связь: χ2(4, N = 145) = 73.4, p < .001. Таблица 15.11 Cимметричные меры (Symmetric Measures) Nominal by Nominal Value .711 .503 .580 145 Phi Cramer's V Contingency Coefficient N of Valid Cases Approx. Sig. .000 .000 .000 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Размер эффекта (12.2.5)-(12.2.8) большой. Коэффициенты равны: w = .71, p < .001; V = .50, p < .001; C = .58, p < .001. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .35 размер эффекта считается большим. Рисунок 15.11. Распределение участников с высоким, средним и низким раздражением по самооценке Рисунок 15.12. Распределение участников с высокой, адекватной и низкой самооценкой по раздражению «Самооценка – Негативизм» Таблица 15.12 Self-Esteem * Negativism Crosstabulation Count Negativism Low Self-Esteem Total Medium High Total Low 17 12 7 36 Medium 28 16 29 73 High 17 62 9 37 10 46 36 145 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 300 Таблица 15.13 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 5.264a 5.382 .169 145 Asymp. Sig. (2-sided) 4 4 1 .261 .250 .681 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.19. Таблица 15.14 Cимметричные меры (Symmetric Measures) Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases Value .191 .135 .187 145 Approx. Sig. .261 .261 .261 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Связь не выявлена: χ2(4, N = 145) = 5.26, p = .26, ns. Размер эффекта (12.2.5)-(12.2.8) небольшой. Коэффициенты равны: w = .19, p = .26; V = .14, p = .26; C = .19, p = .26. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .07 размер эффекта считается небольшим. Рисунок 15.13. Распределение участников с высоким, средним и низким негативизмом по самооценке Рисунок 15.14. Распределение участников с высокой, адекватной и низкой самооценкой по негативизму Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 301 «Самооценка – Обида» Таблица 15.15 Self-Esteem * Resentment Crosstabulation Count Resentment Low Self-Esteem Medium High Total Low 18 13 5 36 Medium 18 30 25 73 High 12 48 14 57 10 40 36 145 Total Таблица 15.16 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 8.456a 8.654 2.764 145 Asymp. Sig. (2-sided) 4 4 1 .076 .070 .096 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.93. Таблица 15.17 Cимметричные меры (Symmetric Measures) Symmetric Measures Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases Value .241 .171 .235 145 Approx. Sig. .076 .076 .076 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Связь не выявлена: χ2(4, N = 145) = 8.46, p = .076, ns. Имеется тенденция к связи. Размер эффекта (12.2.5)-(12.2.8) небольшой. Коэффициенты равны: w = .24, p = .076; V = .17, p = .076; C = .24, p = .076. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .07 размер эффекта считается небольшим. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 302 Рисунок 15.16. Распределение участников с высокой, адекватной и низкой самооценкой по обиде Рисунок 15.15. Распределение участников с высокой, средней и низкой обидой по самооценке «Самооценка – Подозрительность» Таблица 15.18 Self-Esteem * Suspicion and Distrust Crosstabulation Count Suspicion and Distrust Low Self-Esteem Medium High Total Low 17 11 8 36 Medium 23 24 26 73 High 7 47 13 48 16 50 36 145 Total Таблица 15.19 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 7.125a 7.276 6.685 145 df Asymp. Sig. (2-sided) 4 4 1 .129 .122 .010 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11.67. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 303 Таблица 15.20 Cимметричные меры (Symmetric Measures) Symmetric Measures Nominal by Nominal Value .222 .157 .216 145 Phi Cramer's V Contingency Coefficient N of Valid Cases Approx. Sig. .129 .129 .129 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Связь не выявлена: χ2(4, N = 145) = 7.13, p = .13, ns. Размер эффекта (12.2.5)-(12.2.8) небольшой. Коэффициенты равны: w = .22, p = .13; V = .16, p = .13; C = .22, p = .13. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .07 размер эффекта считается небольшим. Рисунок 15.17. Распределение участников с высокой, средней и низкой подозрительностью по самооценке Рисунок 15.18. Распределение участников с высокой, адекватной и низкой самооценкой по подозрительности «Самооценка – Вербальная агрессия» Таблица 15.21 Self-Esteem * Verbal Aggression Crosstabulation Count Verbal Aggression Low Self-Esteem Total Low Medium High Total 4 8 24 36 Medium 31 38 4 73 High 1 36 18 64 17 45 36 145 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 304 Таблица 15.22 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 57.289a 65.614 .398 145 Asymp. Sig. (2-sided) .000 4 4 1 .000 .528 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.94. Таблица 15.23 Cимметричные меры (Symmetric Measures) Symmetric Measures Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases Value .629 .444 .532 145 Approx. Sig. .000 .000 .000 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Максимально значимая связь: χ2(4, N = 145) = 57.3, p < .001. Размер эффекта (15.2.5)-(15.2.8) большой. Коэффициенты равны: w = .63, p < .001; V = .44, p < .001; C = .53, p < .001. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .35 размер эффекта считается большим. Рисунок 15.19. Распределение участников с высокой, средней и низкой вербальной агрессией по самооценке Рисунок 15.20. Распределение участников с высокой, адекватной и низкой самооценкой по вербальной агрессии Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 305 «Самооценка – Чувство вины» Таблица 15.24 Self-Esteem * Guilt Crosstabulation Count Guilt Low Self-Esteem Medium High Total Low 13 8 15 36 Medium 18 17 38 73 High 13 44 9 34 14 67 36 145 Total Таблица 15.25 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 2.746a 2.762 .019 145 Asymp. Sig. (2-sided) 4 4 1 .601 .598 .891 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.44. Таблица 15.26 Cимметричные меры (Symmetric Measures) Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases Value .138 .097 .136 145 Approx. Sig. .601 .601 .601 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Связь не выявлена: χ2(4, N = 145) = 2.75, p = .601, ns. Размер эффекта (12.2.5)-(12.2.8) небольшой. Коэффициенты равны: w = .14, p = .60; V = .10, p = .60; C = .14, p = .60. Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s V > .07 размер эффекта считается небольшим. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 306 Рисунок 15.21. Распределение участников с высокой, средней и низкой «чувством вины» по самооценке Рисунок 15.22. Распределение участников с высокой, адекватной и низкой самооценкой по «чувством вины» Очевидно, что различий в распределениях, а, следовательно, и связи между переменными нет. Хотя статистически значимых результатов не выявлено, ситуацию, на уровне выборки, можно описать так: 1) Среди подростков с низкой самооценкой больше всего подростков с высоким и низким уровнем чувства вины; 2) Среди подростков с адекватной самооценкой больше всего подростков с высоким уровнем чувства вины; 3) Среди подростков с высокой самооценкой больше всего подростков с высоким и низким уровнями чувства вины; 4) Среди подростков с низким уровнем чувством вины больше всего подростков с адекватной самооценкой; 5) Среди подростков с адекватным уровнем чувства вины больше всего подростков с адекватной самооценкой; 6) Среди подростков с высоким уровнем чувства вины больше всего подростков с адекватной самооценкой. Для уточнения можно сравнить процентные доли участников в разных категориях с помощью теста Фишера φ∗ . Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 307 Исследование связи путем сравнения процентных долей с помощью ∗ критерия Фишера φ Перенесем в Excel таблицы сопряженности (например, 15.3 (СамооценкаФизическая агрессия) и 15.17 (Чувство вины)). Сравним столбики по высоте внутри каждой группы. Для этого организуем в Excel таблицу 15.19 (См. файл Fisher_angular_transformation_2T.xlsx, которую можно продолжать, можно в нее записывать другие исходные данные). Все формулы во второй строке таблицы программируются следующим образом. ki - число из соответствующей ячейки таблицы сопряженности; ni - объем соответствующей группы; pi = ki ⋅ 100% = ki / ni *100 ni  pi  ϕi = 2 ⋅ arcsin  = 2*asin(sqrt( pi /100))  100    ϕ ∗ = ϕ 2 − ϕ1 n1 n2 =abs( ϕ2 - ϕ1 )*sqrt( n1 * n2 /( n1 + n2 )) n1 + n2 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 308 Таблица 15.27 Исследование различий процентных долей (Самооценка – SE; Физическая агрессия – PhA; Чувство вины – G). Размер эффекта h (0.2 - небольшой, 0.5 - средний, 0.8 – большой) 1 High PhA Medium PhA Low PhA High SE Medium SE Low SE High G Medium G Low G High SE Medium SE Low SE 2 k1 k2 n1 n2 p1 p2 ϕ1 ϕ2 ϕ∗ h p High SE Medium SE 22 1 46 46 47.8 2.2 1.53 0.30 5.91 1.23 .000 High SE Low SE 22 23 46 46 47.8 50.0 1.53 1.57 0.21 0.04 .84 Medium SE Low SE 1 23 46 46 2.2 50.0 0.30 1.57 6.11 1.27 .000 High SE Medium SE 11 36 56 56 19.6 64.3 0.92 1.86 4.99 0.94 .000 High SE Low SE 11 9 56 56 19.6 16.1 0.92 0.82 0.49 0.09 .62 Medium SE Low SE 36 9 56 56 64.3 16.1 1.86 0.82 5.48 1.04 .000 High SE Medium SE 3 36 43 43 7.0 83.7 0.53 2.31 8.24 1.78 .000 High SE Low SE 3 4 43 43 7.0 9.3 0.53 0.62 0.40 0.09 .69 Medium SE Low SE 36 4 43 43 83.7 9.3 2.31 0.62 7.84 1.69 .000 High PhA Medium PhA 22 11 36 36 61.1 30.6 1.79 1.17 2.65 0.62 .008 High PHA Low PhA 22 3 36 36 61.1 8.3 1.79 0.59 5.13 1.21 .000 Medium PhA High PhA Low PhA Medium PhA 11 1 3 36 36 73 36 73 30.6 1.4 8.3 49.3 1.17 0.23 0.59 1.56 2.48 7.99 0.59 1.32 .013 .000 High PhA Low PhA 1 36 73 73 1.4 49.3 0.23 1.56 7.99 1.32 .000 Medium PhA Low PhA 36 36 73 73 49.3 49.3 1.56 1.56 0.00 0.00 1.00 High PHA Medium PHA 23 9 36 36 63.9 25.0 1.85 1.05 3.42 0.81 .001 High PHA Low PHA 23 4 36 36 63.9 11.1 1.85 0.68 4.97 1.17 .000 Medium PHA Low PHA 9 4 36 36 25.0 11.1 1.05 0.68 1.56 0.37 .12 High SE Medium SE 12 38 67 67 17.9 56.7 0.87 1.71 4.81 0.83 .000 High SE Low SE 14 15 67 67 20.9 22.4 0.95 0.99 0.21 0.04 .83 Medium SE Low SE 38 15 67 67 56.7 22.4 1.71 0.99 4.17 0.72 .000 High SE Medium SE 9 17 34 34 26.5 50.0 1.08 1.57 2.02 0.49 .043 High SE Low SE 9 8 34 34 26.5 23.5 1.08 1.01 0.28 0.07 .78 Medium SE Low SE 17 8 34 34 50.0 23.5 1.57 1.01 2.30 0.56 .021 High SE Medium SE 13 18 44 44 29.5 40.9 1.15 1.39 1.12 0.24 .26 High SE Low SE 13 13 44 44 29.5 29.5 1.15 1.15 0.00 0.00 1.00 Medium SE Low SE 18 13 44 44 40.9 29.5 1.39 1.15 1.12 0.24 .26 High G Medium G 14 9 36 36 38.9 25.0 1.35 1.05 1.27 0.30 .20 High G Low G 14 13 36 36 38.9 36.1 1.35 1.29 0.24 0.06 .81 Medium G Low G 9 13 36 36 25.0 36.1 1.05 1.29 1.03 0.24 .30 High G Medium G 38 17 73 73 52.1 23.3 1.61 1.01 3.65 0.60 .000 High G Low G 38 18 73 73 52.1 24.7 1.61 1.04 3.46 0.57 .001 Medium G Low G 17 18 73 73 23.3 24.7 1.01 1.04 0.19 0.03 .85 High G Medium G 15 8 36 36 41.7 22.2 1.40 0.98 1.79 0.42 .074 High G Low G 15 13 36 36 41.7 36.1 1.40 1.29 0.48 0.11 .63 Medium G Low G 8 13 36 36 22.2 36.1 0.98 1.29 1.30 0.31 .19 Замечание: Two-tailed Z-test. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 309 Некоторые выводы: «Самооценка - Физическая агрессия» 1) Среди подростков с высокой физической агрессией в одинаковой степени большие доли составляют подростки с высокой и низкой самооценками ( ϕ ∗ = 5.91, р<.001, ϕ ∗ = 6.11, р<.001). Размеры эффектов большие: h = 1.23 и h = 1.27 соответственно. 2) Среди подростков со средней и низкой физическими агрессиями преобладает доля подростков с адекватной самооценкой (р<.001). Размеры эффектов большие: h = 0.94 и h = 1.04, h = 1.78 и h = 1.69 соответственно. 3) Среди подростков с высокой самооценкой большую долю составляют подростки с высокой физической агрессией, затем со средней физической агрессией ( ϕ ∗ = 2.65, р < .001, размер эффекта h = 0.62 средний) затем с низкой физической агрессией ( ϕ ∗ = 2.48, р < .001, размер эффекта h = 0.59 средний). 4) Среди подростков с адекватной самооценкой большую долю составляют подростки со средней и низкой физической агрессией (р<.001, h = 1.32). Размер эффекта большой. 5) Среди подростков с низкой самооценкой большую долю составляют подростки с высокой физической агрессией, затем со средней физической агрессией ( ϕ ∗ = 3.42, р < .001, размер эффекта h = 0.81 большой) затем с низкой физической агрессией ( ϕ ∗ = 1.56, р > .05, ns, размер эффекта h = 0.37 небольшой). «Самооценка- чувство вины» 1) Среди подростков с высоким чувством вины большую долю составляют подростки с адекватной самооценкой (р<.001); 2) Среди подростков со средним чувством вины большую долю составляют подростки с адекватной самооценкой (р<.05); 3) Среди подростков с низким чувством вины, доли подростков с высокой, средней и адекватной самооценками различаются статистически незначимо; 4) Среди подростков с высокой самооценкой доли подростков с высоким, средним и низким чувством вины различаются статистически незначимо. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 310 Домашнее задание 3 Провести исследование связи между самооценкой подростков, измеренной по методике Дембо-Рубинштейна и агрессией, измеренной по методике Басса-Дарки. Варианты данных находятся в файле Samoocenka-Agressija_Varianti_(1-16).xlsx. Результаты оформить по образцу Приложения 4. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 311 Литература Основная: Field, A. (2009). Discovering statistics using SPSS (3rd Edition). Los Angeles, London, New Delhi, Singapore, Washington DC: Sage. Available at http://fac.ksu.edu.sa/sites/default/files/ktb_lktrwny_shml_fy_lhs.pdf Блюменау, Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. Рига: БМА, «Moodle». Наследов А. (2013) IBM SPSS Statistics 20 и AMOS: профессиональньй статистический анализ данных. СПб.: Питер. Дополнительная: Aron, A., Coups, E.J., & Aron, E. (2013). Statistics for psychology. Sixth edition. Upper Sadle River, NJ: Pearson Education. Coolican, H. (2014). Research methods and statistics in psychology. Sixth edition. London and New York: Psychology Press. Available in BIA “Moodle”. Cramer, D. (1997). Basic Statistics for Social Research. Routledge. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Earlbaum Associates. D’Agostino, R. B., & Stephens, M. A. (1986). Goodness-of-Fit Techniques. New York: Marcel Dekker, Inc. Ellis, P.D. (2010). The essential guide to effect sizes. Statistical power, meta-analysis, and the interpretation of research results. Cambridge: University Press. Heiman, G.W. (2011). Basic Statistics for the behavioural sciences. Sixth edition. Wadsworth: Cengage Learning. Available in BIA “Moodle”. Howell, D.С. (2010). Statistical methods for psychology. Seventh edition. Wadsworth: Cengage Learning. Available in BIA “Moodle”. Howell, D.С. (1999). Fundamental Statistics for Behavioural Sciences. USA: Duxbury Press. http://www.psych.utoronto.ca/courses/c1/statstoc.htm. 312 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018 Howitt, D., & Cramer D. (2011). Introduction to statistics in psychology. Fifth edition. Harlow, England, London and Associated Companies throughout the world: Pearson Prentice Hall. Available in BIA library. Available at https://epdf.pub/queue/introduction-to-statistics-inpsychology-5th-editionb14c72a74e215cccb2c491108c1752ac82858.html. Johnson, R.A., & Kam-Wah Tsui (1998). Statistical reasoning and methods. USA: J.Wiley& Sons, Inc. Available in BIA library. Krastiņš, O. (1998). Statistika un ekonometrija. Rīga: LR CSP. Available in BIA library Langdridge, D. (2004). Introduction to Research Methods and Data Analysis in Psychology. Edinburg Gate, Harlow, Essex CM20 2J.E., England London: Pearson Prentice Hall and Associated Companies throughout the world. Available in BIA library. Lasmanis A. (2002) Datu ieguves, apstrādes un analīzes metodes pedagoģijas un psiholoģijas pētījumos. 1. grāmata. Rīga: “Izglītības soļi”. Lasmanis A. (2002) Datu ieguves, apstrādes un analīzes metodes pedagoģijas un psiholoģijas pētījumos. 2. grāmata. Rīga: “Izglītības soļi”. Moriarty, D.J. (2015). Test for Normality. In BIO 2011 Biometrics Lab Statistical Tests. Stat Cat version 3.7.1. California State Polytechnic University, Pomona. Retrieved from https://www.cpp.edu/~djmoriarty/b211/index.html. Raščevska, M., & Kristapsone, S. (2000). Statistika psiholoģijas pētījumos. Rīga: SIA „Izglītības soļi”. Stevens, S.S. (1946). On the theory of Scales of Measurement. Science, 103(2684), 677-680. Retrieved in http://science.sciencemag.org/content/103/2684/677 Zaiontz, C. (2018). Real statistics using Excel. Available at http://www.real-statistics.com/. Бартышев, А.В. (2005). Тестирование: Основной инструментарий практического психолога. М.: Дело. Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб.: ООО «ДиаСофтЮП». (Доступен в Интернете электронный учебник) Гласс, Дж., Стенли, Дж. (1976). Статистические методы в педагогике и в психологии. Москва: Прогресс. Available in BIA library and at https://www.studmed.ru/glass-dzhstenli-dzh-statisticheskie-metody-v-pedagogike-i-psihologii_b68abaad535.html. 313 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018 Ложников А. (2010). Исследование самооценки по методике Дембо - Рубинштейн. http://newgoal.ru/issledovanie-samoocenki-po-metodike-dembo-rubinshtejn/ Наследов, А.Д. (2004). Математические методы психологического исследования. Анализ и интерпретация данных. СПб.: Речь. Наследов А.Д. (2005) SPSS: Компьютерный анализ данных в психологии и социальных науках. СПб.: Питер. Наследов, А.Д. (2011). SPSS 19: Профессиональный статистический анализ данных. СПб.: Питер. Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО «Речь». Хили, Д. (2005). Статистика. Социологические и маркетинговые исследования. Под ред. Руденко А.А. Киев: ООО «ДиаСофтЮП». Ярославский государственный педагогический университет им. К.Д. Ушинского. Отдел образовательных информационных технологий. (2008). Измерение самооценки по методике Дембо-Рубинштейн. Available at http://cito-web.yspu.org/link1/metod/met35/node33.html 314 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018 Приложение 1 Методика Басса-Дарки1 Описание методики Опросник враждебности Басса - Дарки (англ. Buss - Durkee Hostility Inventory, сокращенно: BDHI), опубликованный в 1957 году американскими психологами Арнольдом Бассом и Энн Дарки (Arnold H. Buss, Ann Durkee), предназначен для выявления уровня агрессивности и враждебности. Опросник состоит из 75 утверждений. На русском языке стандартизирован А.А. Хваном, Ю.А. Зайцевым и Ю.А. Кузнецовой в 2005 году. Конструируя опросник, Басс вначале провел разграничения между враждебностью и агрессией. Враждебность была определена им как реакция отношения, скрытно-вербальная реакция, которой сопутствуют негативные чувства и негативная оценка людей и событий. Агрессию он определил как ответ, содержащий стимулы, способные причинить вред другому существу. Дальнейшая дифференциация проводилась в направлении выделения подклассов внутри враждебности и агрессии. В результате Басс и Дарки выделили два вида враждебности (обида и подозрительность) и пять видов агрессии (физическая агрессия, косвенная агрессия, раздражение, негативизм и вербальная агрессия). В литературе встречается несколько русскоязычных вариантов методики. Теоретические основы Различные авторы в своих исследованиях, монографиях по-разному определяют агрессию и агрессивность: 1 Опросник уровня агрессивности Басса – Дарки. Материал Psylab.info - энциклопедии психодиагностики http://psylab.info/%D0%9E%D0%BF%D1%80%D0%BE%D1%81%D0%BD%D0%B8%D0%BA_%D1%83%D1%80%D0%B E%D0%B2%D0%BD%D1%8F_%D0%B0%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B2%D0%BD%D0 %BE%D1%81%D1%82%D0%B8_%D0%91%D0%B0%D1%81%D1%81%D0%B0__%D0%94%D0%B0%D1%80%D0%BA%D0%B8 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 315 • как врожденную реакцию человека для "защиты занимаемой территории" (Лоренц, Ардри); • как установку к господству (Моррисон); • как реакцию личности на враждебную человеку окружающую действительность (Хорни, Фромм). Очень широкое распространение получили теории, связывающие агрессию и фрустрацию (Миллер, Дуб, Доллард). Под агрессивностью понимают свойство, качество личности, характеризующееся наличием деструктивных тенденций, в основном в области субъектно-субъектных отношений. Вероятно, деструктивный компонент человеческой активности является необходимым в созидательной деятельности, так как потребности индивидуального развития с неизбежностью формируют в людях способность к устранению и разрушению препятствий, преодолению того, что противодействует этому процессу. Агрессивность обладает качественной и количественной характеристикой. Как и всякое свойство, она имеет различную степень выраженности: от почти полного отсутствия до ее предельного развития. Каждая личность должна обладать определенной степенью агрессивности. Отсутствие ее приводит к пассивности, ведомости, конформности и т.д. Чрезмерное развитие ее начинает определять весь облик личности, которая может стать конфликтной, неспособной на сознательную кооперацию и т.д. Сама по себе агрессивность не делает субъекта сознательно опасным, так как, с одной стороны, существующая связь между агрессивностью и агрессией не является жесткой, а, с другой, сам акт агрессии может не принимать сознательно опасные и неодобряемые формы. В житейском сознании агрессивность является синонимом "злонамеренной активности". Однако само по себе деструктивное поведение "злонамеренностью" не обладает, таковой его делает мотив деятельности, те ценности, ради достижения и обладания которыми активность разворачивается. Внешние практические действия могут быть сходны, но их мотивационные компоненты прямо противоположны. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 316 Исходя из этого, можно разделить проявления агрессии на два основных типа: первый мотивационная – агрессия, как самоценность, второй – инструментальная, как средство (подразумевая при этом, что и та, и другая могут проявляться как под контролем сознания, так и вне его, и сопряжены с эмоциональными переживаниями (гнев, враждебность). Практических психологов в большей степени должна интересовать мотивационная агрессия как прямое проявление реализации присущих личности деструктивных тенденций. Определив уровень таких деструктивных тенденций, можно с большой степенью вероятности прогнозировать возможность проявления открытой мотивационной агрессии. Одной из подобных диагностических процедур является опросник Басса-Дарки. Валидизация Выборку стандартизации составили 646 подростков 16 – 17 лет, проживающих в городе Новокузнецке, обучающихся в общеобразовательных школах (400 человек), гимназиях (180 человек), детских домах-интернатах (66 человек). Таким подбором испытуемых мы стремились обеспечить репрезентативность выборки. Данная выборка была проверена на нормальность распределения. Значения рассчитывались отдельно для каждой шкалы опросника, в двух вариантах: 1. Для «сырых» баллов, где за каждое совпадение с ключом начисляется 1 балл; 2. «Сырые» баллы умножены на предложенный коэффициент. Оба показателя не превышают в три раза свою ошибку репрезентативности, из чего мы можем заключить, что распределение не отличается от нормального. Таким образом, можно утверждать, что введение коэффициента не приводит к искажению данных. Для проверки устойчивости распределения было проверено половинное (полученное на половине выборки) распределение. Устойчивость распределения проверяется с целью определения способности выборки моделировать распределение генеральной совокупности. Предполагается, что если половинное распределение хорошо моделирует конфигурацию целого распределения, то Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 317 целое распределение будет также хорошо моделировать распределение генеральной совокупности. Из выборки случайным образом были отобраны 323 анкеты и просчитаны вышеописанным способом. Полученные результаты также свидетельствуют о том, что распределение не отличается от нормального. «Сырые» баллы переводятся в «стены». Среднее арифметическое в «сырых» баллах принимается за точку отсчета. Вправо и влево отмеряются интервалы, равные ½ стандартного отклонения. При сопоставлении типов распределения обнаружилось, что распределения шкал физическая агрессия, вербальная агрессия, негативизм и чувство вины достоверно отличаются от распределений шкал косвенная агрессия, раздражение, подозрительность, обида. Кроме того провели корреляционное сравнение между всеми шкалами опросника. Практически все шкалы между собой положительно коррелируют, при уровне значимости p = 0,01 и p = 0,05. Отсутствие корреляции выявлено между шкалами: физическая агрессия/чувство вины, вербальная агрессия/обида, вербальная агрессия/чувство вины и негативизм/чувство вины. Наиболее сильная положительная корреляционная связь обнаружена между шкалами: косвенная агрессия/раздражение (0,52), подозрительность/обида (0,48), вербальная агрессия/раздражение (0,45). Внутренняя структура Арнольд Басс, воспринявший ряд положений своих предшественников, разделил понятия агрессии и враждебность и определил последнюю как: "...реакцию, развивающую негативные чувства и негативные оценки людей и событий". Создавая свой опросник, дифференцирующий проявления агрессии и враждебности, А. Басс и А. Дарки выделили следующие виды реакций: 1. Физическая агрессия – использование физической силы против другого лица. 2. Косвенная – агрессия, окольным путем направленная на другое лицо или ни на кого не направленная. 3. Раздражение – готовность к проявлению негативных чувств при малейшем возбуждении (вспыльчивость, грубость). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 318 4. Негативизм – оппозиционная манера в поведении от пассивного сопротивления до активной борьбы против установившихся обычаев и законов. 5. Обида – зависть и ненависть к окружающим за действительные и вымышленные действия. 6. Подозрительность – в диапазоне от недоверия и осторожности по отношению к людям до убеждения в том, что другие люди планируют и приносят вред. 7. Вербальная агрессия – выражение негативных чувств как через форму (крик, визг), так и через содержание словесных ответов (проклятия, угрозы). 8. Чувство вины – выражает возможное убеждение субъекта в том, что он является плохим человеком, что поступает зло, а также ощущаемые им угрызения совести. При составлении опросника использовались следующие принципы: • вопрос может относиться только к одной форме агрессии. • вопросы формулируются таким образом, чтобы в наибольшей степени ослабить влияние общественного одобрения ответа на вопрос. Процедура проведения Инструкция Внимательно прослушайте утверждения. Если вы согласны с утверждением, то ставьте знак «+», если нет, ставьте знак «-». Обработка результатов Ответы оцениваются по восьми шкалам следующим образом: 1. Физическая агрессия: • «да» = 1, «нет» = 0: 1, 25, 33, 48, 55, 62, 68; • «нет» = 1, «да» = 0: 9, 17, 41. • Коэффициент 10 (по Хвану). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 319 2. Косвенная агрессия: • «да» = 1, «нет» = 0: 2, 18, 34, 42, 56, 63; • «нет» = 1, «да» = 0: 10, 26, 49. • Коэффициент 8 (по Хвану). 3. Раздражение: • «да» = 1, «нет» = 0: 3, 19, 27, 43, 50, 57, 64, 72; • «нет» = 1, «да» = 0: 11, 35, 69. • Коэффициент 11 (по Хвану). 4. Негативизм: • «да» = 1, • «нет» = 0: 4, 12, 20, 23, 36; • Коэффициент 20 (по Хвану). 5. Обида: • «да»= 1, «нет» = 0: 5, 13, 21, 29, 37, 51, 58. • «нет» = 1, «да» = 0: 44, • Коэффициент 9 (по Хвану). 6. Подозрительность: • «да» = 1, «нет» = 0: 6, 14, 22, 30, 38, 45, 52, 59; • «нет» = 1, «да» = 0: 65, 70. • Коэффициент 10 (по Хвану). 7. Вербальная агрессия: • «да» = 1, «нет» = 0: 7, 15, 28, 31, 46, 53, 60, 71, 73; • «нет» = 1, «да» = 0: 39, 66, 74, 75, • Коэффициент 13 (по Хвану). 8. Чувство вины: • «да» = 1, • «нет» = 0: 8, 16, 24, 32, 40, 47, 54, 61, 67, • Коэффициент 11 (по Хвану). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 320 Индекс враждебности включает в себя 5 и 6 шкалу, а индекс агрессивности (как прямой, так и мотивационной) включает в себя шкалы 1, 3, 7. • Враждебность = Обида + Подозрительность; • Агрессивность = Физическая агрессия + Раздражение + Вербальная агрессия. По Хвану А.А. с соавторами, значение этих показателей равно среднему арифметическому составляющих показателей (так как максимальным уровнем во всех случаях является 100 стандартных баллов): Враждебность = (Обида + Подозрительность)/2, Агрессивность = (Физическая агрессия + Раздражение + Вербальная агрессия)/3. Интерпретация результатов По Рогову Е.И., нормой агрессивности является величина ее индекса, равная 21 ± 4, а враждебности – 6,5-7 ± 3. При этом обращается внимание на возможность достижения определенной величины, показывающей степень проявления агрессивности. Хван А.А. с соавторами предлагают более сложную схему. Сырые баллы по каждой шкале необходимо умножить на коэффициент, цель которого привести максимальное значение по каждой шкале к 100 баллам. Затем эти баллы переводятся в стены: Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 321 Пользуясь данной методикой, необходимо помнить, что агрессивность, как свойство личности, и агрессия, как акт поведения, могут быть поняты в контексте психологического анализа мотивационно-потребностной сферы личности. Поэтому опросником Басса-Дарки следует пользоваться в совокупности с другими методиками: личностными тестами психических состояний (Кеттел, Спилбергер), проективными методиками (Люшер) и т.д. Стимульный материал Опросник уровня агрессивности Басса - Дарки/Текст опросника Материал Psylab.info - энциклопедии психодиагностики 1. Временами я не могу справиться с желанием причинить вред другим 2. Иногда сплетничаю о людях, которых не люблю 3. Я легко раздражаюсь, но быстро успокаиваюсь 4. Если меня не попросят по-хорошему, я не выполню 5. Я не всегда получаю то, что мне положено 6. Я не знаю, что люди говорят обо мне за моей спиной 7. Если я не одобряю поведение друзей, я даю им это почувствовать 8. Когда мне случалось обмануть кого-нибудь, я испытывал мучительные угрызения совести 9. Мне кажется, что я не способен ударить человека 10. Я никогда не раздражаюсь настолько, чтобы кидаться предметами 11. Я всегда снисходителен к чужим недостаткам Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 322 12. Если мне не нравится установленное правило, мне хочется нарушить его 13. Другие умеют почти всегда пользоваться благоприятными обстоятельствами 14. Я держусь настороженно с людьми, которые относятся ко мне несколько более дружественно, чем я ожидал 15. Я часто бываю несогласен с людьми 16. Иногда мне на ум приходят мысли, которых я стыжусь 17. Если кто-нибудь первым ударит меня, я не отвечу ему 18. Когда я раздражаюсь, я хлопаю дверями 19. Я гораздо более раздражителен, чем кажется 20. Если кто-то воображает себя начальником, я всегда поступаю ему наперекор 21. Меня немного огорчает моя судьба 22. Я думаю, что многие люди не любят меня 23. Я не могу удержаться от спора, если люди не согласны со мной 24. Люди, увиливающие от работы, должны испытывать чувство вины 25. Тот, кто оскорбляет меня и мою семью, напрашивается на драку 26. Я не способен на грубые шутки 27. Меня охватывает ярость, когда надо мной насмехаются 28. Когда люди строят из себя начальников, я делаю все, чтобы они не зазнавались 29. Почти каждую неделю я вижу кого-нибудь, кто мне не нравится 30. Довольно многие люди завидуют мне 31. Я требую, чтобы люди уважали меня 32. Меня угнетает то, что я мало делаю для своих родителей 33. Люди, которые постоянно изводят вас, стоят того, чтобы их "щелкнули по носу" 34. Я никогда не бываю мрачен от злости 35. Если ко мне относятся хуже, чем я того заслуживаю, я не расстраиваюсь 36. Если кто-то выводит меня из себя, я не обращаю внимания 37. Хотя я и не показываю этого, меня иногда гложет зависть 38. Иногда мне кажется, что надо мной смеются 39. Даже если я злюсь, я не прибегаю к "сильным" выражениям Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 323 40. Мне хочется, чтобы мои грехи были прощены Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 324 41. Я редко даю сдачи, даже если кто-нибудь ударит меня 42. Когда получается не по-моему, я иногда обижаюсь 43. Иногда люди раздражают меня одним своим присутствием 44. Нет людей, которых бы я по-настоящему ненавидел 45. Мой принцип: "Никогда не доверять "чужакам" 46. Если кто-нибудь раздражает меня, я готов сказать, что я о нем думаю 47. Я делаю много такого, о чем впоследствии жалею 48. Если я разозлюсь, я могу ударить кого-нибудь 49. С детства я никогда не проявлял вспышек гнева 50. Я часто чувствую себя как пороховая бочка, готовая взорваться 51. Если бы все знали, что я чувствую, меня бы считали человеком, с которым нелегко работать 52. Я всегда думаю о том, какие тайные причины заставляют людей делать что-нибудь приятное для меня 53. Когда на меня кричат, я начинаю кричать в ответ 54. Неудачи огорчают меня 55. Я дерусь не реже и не чаще чем другие 56. Я могу вспомнить случаи, когда я был настолько зол, что хватал попавшуюся мне под руку вещь и ломал ее 57. Иногда я чувствую, что готов первым начать драку 58. Иногда я чувствую, что жизнь поступает со мной несправедливо 59. Раньше я думал, что большинство людей говорит правду, но теперь я в это не верю 60. Я ругаюсь только со злости 61. Когда я поступаю неправильно, меня мучает совесть 62. Если для защиты своих прав мне нужно применить физическую силу, я применяю ее 63. Иногда я выражаю свой гнев тем, что стучу кулаком по столу 64. Я бываю грубоват по отношению к людям, которые мне не нравятся 65. У меня нет врагов, которые бы хотели мне навредить 66. Я не умею поставить человека на место, даже если он того заслуживает 67. Я часто думаю, что жил неправильно 68. Я знаю людей, которые способны довести меня до драки Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 325 69. Я не огорчаюсь из-за мелочей 70. Мне редко приходит в голову, что люди пытаются разозлить или оскорбить меня 71. Я часто только угрожаю людям, хотя и не собираюсь приводить угрозы в исполнение 72. В последнее время я стал занудой 73. В споре я часто повышаю голос 74. Я стараюсь обычно скрывать свое плохое отношение к людям 75. Я лучше соглашусь с чем-либо, чем стану спорить Литература Практикум по психологии состояний Учебное пособие (2004). Под ред. проф. О.А. Прохорова. СПб: Речь, 2004. Практическая психодиагностика. Методики и тесты. Учебное пособие. (1998). Самара: Издательский Дом «Бахрах». Семенюк, Л.М. (1996). Психологические особенности агрессивного поведения подростка. Москва-Воронеж. Хван А.А., Зайцев Ю.А., & Кузнецова Ю.А. (2008). Стандартизация опросника А. Басса и А. Дарки. Психологическая диагностика, 1, 35-58. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 326 Опросник уровня агрессивности Басса – Дарки (Бланк ответов) Материал Psylab.info - энциклопедии психодиагностики Ф.И.О.: _______________________________________________Возраст: _______ 1 31 61 2 32 62 3 33 63 4 34 64 5 35 65 6 36 66 7 37 67 8 38 68 9 39 69 10 40 70 11 41 71 12 42 72 13 43 73 14 44 74 15 45 75 16 46 17 47 18 48 19 49 20 50 21 51 22 52 23 53 24 54 25 55 26 56 27 57 28 58 29 59 30 60 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 327 Названия шкал на английском языке Physical aggression. This is a strong desire to use physical force against anyone. Indirect. This aggression can be either not directed at an individual, or manifest indirectly. Irritation. It is an expression of negative feelings, with little excitement. Such people are called short-tempered and rude. Negativism. The so-called opposition demeanor. It is uncertain, because unstable -from the non-resistance to an active struggle against the established laws and customs. Resentment. sharp enough aggression. People who are prone to this type of aggression, envy and hatred show. Suspicion and distrust. Varies by excessive caution and forethought for others to confidence in other people`s conscious intent to harm. Verbal aggression. These people show their negative feelings through curses, threats, shouting and squealing. Guilt. Too expressed remorse, self-awareness bad man. Questionnaire Bass-Darky. Retrieved from: http://ecowoman-english.tk/articles.php?id=35667 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 328 Приложение 2 Математическая часть работы «Исследование гендерных различий агрессивности у подростков» Статистические методы обработки данных1 Обработка данных проводилась с помощью компьютерной программы SPSS 17.0. Математический аппарат исследования выбирался в соответствии с гипотезой исследования: «Существуют различия в агрессивности подростков: мальчиков и девочек». Для определения: какими тестами пользоваться для выявления различий параметрическими или непараметрическими, было проверено соответствие распределений эмпирических данных нормальному распределению. Для проверки были использованы тесты асимметрии и эксцесса, тест Колмогорова-Смирнова с поправкой Лиллифора, тест Шапиро-Уилкса. Также было проведено визуальное исследование гистограмм с нормальной кривой и коробчатых диаграмм на наличие экстремальных значений («выбросов»). Оказалось, что распределения данных не соответствуют нормальному распределению. Поэтому для исследования гендерных различий по шкалам методики Басса-Дарки был выбран непараметрический тест Манна-Уитни, который основан на исследовании рангов объединенной группы. С помощью теста Манна-Уитни были найдены статистически значимые различия для «Физической агрессии», «Косвенной агрессии», «Вербальной агрессии», «Негативизма» и «Обиды». Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест Манна-Уитни не выявил различий. Было установлено, что можно воспользоваться более мощным параметрическим t-тестом для сравнения средних двух независимых выборок, так как только для переменной «Раздражение» в группе девочек был всего лишь один «выброс» типа «Outliers», который не оказывал существенного влияния на среднее значение и абсолютная величина асимметрии распределений всех трех переменных была небольшая: в пределах 1.96*SES (стандартной ошибки асимметрии). Выпускная работа должна быть написана по форме статьи и содержать разделы «Метод» и «Результаты». «Статистические методы обработки данных» это последняя часть раздела выпускной работы «Метод». 1 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 329 Результаты Исходные данные Данные, полученные в результате диагностирования состояния агрессии с помощью опросника Басса-Дарки (Бартышев, 2005, сс. 195-200), были обработаны в соответствии с ключами для каждого испытуемого и сведены в Таблицы А1 и А2 (Приложение А). В настоящей работе приняты обозначения, используемые в таблицах и рисунках (Таблица 1): Таблица 1 Описание переменных. Имена переменных, метки и значения. Переменная Шифр участника Пол (0-девочка; 1-мальчик) Физическая агрессия Косвенная агрессия Раздражение Негативизм Обида Подозрительность Вербальная агрессия Чувство вины Обозначение Gender Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt Имя в SPSS Code sex PhA IA I N R S VA G Метки значений (0-Female; 1-Male) Описательные статистики Рисунок 1. Диаграмма средних значений по шкалам агрессии мальчиков и девочек. С помощью компьютерной программы SPSS были получены показатели описательной статистики, приведенные в Приложении В. Таблицах В1 и В2. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 330 На Рис.1. приведены средние значения по уровням агрессии у мальчиков и у девочек. Видно, что средние показатели у мальчиков и у девочек отличаются. Необходимо выяснить, являются ли полученные различия закономерными, или их можно объяснить случайными причинами. Полученные результаты также иллюстрируются коробчатыми диаграммами (Boxplots), изображенными на Рис.2 (и в Приложении D, Рис.D1-D8). На коробчатой диаграмме (Рис.2, Приложении D, Рис.D1) по шкале «Физическая агрессия» в группе девочек имеется одно экстремальное значение – «выброс» типа «Extremes». Порядковый номер девочки в программе SPSS – 24. Все остальные «выбросы» типа «Outliers». Их немного, они не могут существенно влиять на средние значения. Из Рис.2 также видно, что показатели по шкалам агрессивности у мальчиков и девочек отличаются. Так, например, уровень физической агрессии мальчиков выше, чем уровень физической агрессии девочек. Уровень вербальной агрессии выше у мальчиков, но у некоторых мальчиков он занижен (Outliers). Имеются и девочки с заниженной вербальной агрессией. Показатели косвенной агрессии мальчиков имеют больший разброс, чем у девочек. При этом уровень косвенной агрессии выше у девочек. Уровень негативизма выше у мальчиков, несмотря на испытуемого с заниженным негативизмом. Необходимо выяснить, являются ли полученные различия закономерными, или их можно объяснить случайными причинами. Рисунок 2. Коробчатые диаграммы по шкалам агрессии мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 331 Проверка нормальности распределения данных Соответствие данных нормальному распределению проверялось следующими методами (Приложение С): - с помощью тестов для показателей асимметрии и эксцесса (Таблица С1 Приложения С) (Блюменау, 2019; с.105-108)2; - с помощью теста Колмогорова-Смирнова в модификации Лиллифора (Таблица С2 Приложения С); - с помощью теста Шапиро-Уилкса (Таблица С2 Приложения С); - с помощью визуального исследования диаграмм с нормальной кривой (Рис. С1-С8, Приложения С); - с помощью исследования коробчатых диаграмм (Boxplots): наличия или отсутствия экстремальных значений или «выбросов» (Рис. 2). Результаты проверки соответствия данных нормальному распределению и выбор критерия для сравнения агрессивности мальчиков и девочек иллюстрируются Таблицей С3 Приложения С. В настоящем исследовании эмпирические распределения всех данных не соответствовали нормальному распределению. Поэтому для дальнейшего исследования использовались методы непараметрической статистики: U-тест Манна-Уитни для двух независимых выборок. В Приложении С также приведены гистограммы с нормальной кривой (Рис. С1-С8), по которым визуально можно определить, достаточно ли близко эмпирическое распределение к нормальному распределению. Исследование различий с помощью непараметрического критерия Манна-Уитни Так как распределение данных отличается от нормального распределения, то для исследования различия в агрессивности у мальчиков и девочек был применен непараметрический U-критерий Манна-Уитни (Приложение D, Таблицы D1 – D3), который предназначен для оценки различий по уровню признака3. Размер эффекта вычислялся по Блюменау, Н.Ф. (2019). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 2 Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО «Речь». С.49-55. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 3 332 формуле (D1). Результаты исследования гендерных различий по шкалам агрессии у мальчиков и девочек с помощью теста Манна-Уитни представлены в Таблице 1. Для шкалы «Подозрительность», статистической значимости различий не найдено, хотя эффект малого размера (почти среднего, r =.27) имеется: у девочек подозрительность выше. Для переменной «Обида» гендерные различия значимые, но размер эффекта меньше: r =.16. На данном этапе можно сказать, что гипотеза работы: «Существуют различия в агрессивности у подростков мальчиков и девочек» подтверждается. Таблица 1. Результаты исследования гендерных различий по шкалам методики Басса-Дарки с помощью критерия Манна-Уитни Переменные Выявленные различия агрессии Физическая агрессия У девочек (Mdn = 5.00) ниже, чем у мальчиков (Mdn = 8.50). Косвенная агрессия У девочек (Mdn = 7.00) выше, чем у мальчиков (Mdn = 5.00). Раздражение Негативизм Обида Уровень статистической значимости для отличий Максимально значимые различия: U = 106, p < .001, r = .67, эффект большой. Максимально значимые различия: U = 161, p < .001, r = .56, эффект большой. Раздражение у мальчиков (Mdn = 6.00) и девочек (Mdn = 6.00) имеет случайное отличие. Различия не выявлены: U = 409, p = .52, ns; r = .08, нет эффекта. У девочек (Mdn = 2.00) ниже, чем у мальчиков (Mdn = 5.00). Максимально значимые различия: U = 86.5, p < .001, r = .72, эффект большой. Девочки (Mdn = 5.00) обидчивее мальчиков (Mdn = 4.00). Значимые различия: U = 316, p = .039, r = .16, эффект небольшой. Подозрительность Различия не выявлены U = 370, Подозрительность мальчиков (Mdn = p = .22, ns; r = .27, эффект 5.00) и девочек (Mdn = 6.00) имеет небольшой: девочки случайное отличие подозрительнее. Вербальная агрессия У мальчиков (Mdn = 10.0) уровень вербальной агрессии выше, чем у девочек (Mdn = 6.00). Чувство вины У мальчиков (Mdn = 5.00) и девочек Различия не выявлены U = 423, (Mdn = 5.00) уровни чувства вины p = .67, ns; r = .05, нет эффекта. имеют случайное отличие Максимально значимые различия: U = 76, p < .001, r = .72, эффект большой. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 333 Исследование различий средних показателей с помощью параметрических критериев Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест Манна-Уитни не выявил различий. Было установлено, что можно воспользоваться более мощным параметрическим t-тестом для сравнения средних двух независимых выборок, так как только для переменной «Раздражение» (Рис.2) в группе девочек был всего лишь один «выброс» типа «Outliers», который не оказывает существенного влияния на среднее значение. Также абсолютная величина асимметрии распределений всех трех переменных (Таблица 2) небольшая: она меняется в пределах 1.96*SES = 0.84, где SES = 0.43 стандартная ошибка асимметрии. Таблица 2 Асимметрия для шкал «Раздражение» (I), «Подозрительность» (S) и «Чувство вины» (G) в группах мальчиков и девочек Девочки I Асимметрия, S 0.61 S 0.18 Мальчики G 0.19 I 0.31 S G 0.53 0.58 Примечание. В таблице выделены случаи, когда абсолютная величина асимметрии превышает свою стандартную ошибку: S ≥ SES = 0.43 . Во всех случаях абсолютная величина асимметрии меньше 0.84. Следовательно, к переменным «Раздражение» (I), «Подозрительность» (S) и «Чувство вины» (G) может быть применена параметрическая статистика (Наследов, 2004, с.43), а именно t-тест (Приложение Е, Таблицы Е1-Е2). Вычисление размеров эффектов для теста проводилось по формуле (Е1, Приложение Е). По результатам t-теста можно сделать следующие выводы (Таблица 3). Cреднее значение по переменной «Раздражение» в выборке мальчиков M = 6.27 (SD = 1.34) и среднее значение в выборке девочек M = 6.43 (SD = 0.94) различаются статистически незначимо: t(52) = .56, p =.58, ns; d = 0.14, нет эффекта. Тест Левина показал неравные дисперсии (F = 4.38, p = .041), поэтому число степеней свободы было скорректировано от 58 до 52. Cреднее значение по переменной «Подозрительность» в выборке мальчиков M = 5.20 (SD = 1.16) и среднее значение в выборке девочек M = 5.53 (SD = 1.38) различаются статистически незначимо: t(58) = 1.36, p =.18, ns; d = 0.35, эффект небольшого размера. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 334 Девочки оказались более подозрительными, чем мальчики, хотя на популяцию это не распространяется. Тест Манна-Уитни также нашел этот эффект. Cреднее значение по переменной «Чувство вины» в выборке мальчиков M = 5.10 (SD = 1.06) и среднее значение в выборке девочек M = 5.03 (SD = 1.38) различаются статистически незначимо: t(58) = -.51, p =.61, ns; d = 0.13, эффекта нет. Таблица 3. Результаты исследования различий с помощью параметрических Т-критериев Переменные Раздражение Подозрительность Чувство вины Выявленные различия в средних значениях агрессии Раздражение у девочек (M=6.43, SD=0.94) и у мальчиков (M=6.27, SD=1.34) различаются случайно. Уровень статистической значимости для отличий Незначимые различия t(52) = .56, p =.58, d = 0.14, нет эффекта Подозрительность у девочек (M=5.53, SD=1.38) и мальчиков (M=5.10, SD=1.06) отличается случайно Незначимые различия У мальчиков (M=5.20, SD=1.16) и девочек (M=5.03, SD=1.38) уровни чувства вины имеют случайные отличия Незначимые различия t(58) = 1.36, p =.18, d = 0.35, небольшой эффект: девочки подозрительнее. t(58) = -.51, p =.61, d = 0.13, нет эффекта Общий вывод по результатам § Физическая агрессия у мальчиков (Mdn = 8.50) выше, чем у девочек (Mdn = 5.00): U = 106, p < .001. Размер эффекта r = .67, эффект большой. § Косвенная агрессия у мальчиков (Mdn = 5.00) ниже, чем у девочек (Mdn = 7.00): U = 161, p < .001. Размер эффекта r = .56, эффект большой. § Статистически значимого различия в Раздражении мальчиков (Mdn = 6.00; M = 6.27, SD = 1.34) и девочек (Mdn = 6.00; M = 6.43, SD = 0.94) не обнаружено: U = 409, p = .52; t(52) = .56, p =.58. Размеры эффекта d = 0.14, r = .08 – эффект не наблюдается. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 335 § Негативизм мальчиков (Mdn = 5.00) превышает негативизм девочек (Mdn = 2.00): U = 86.5, p < .001. Размер эффекта r = .72, эффект большой. § Обида у мальчиков (Mdn = 4.00) меньше, чем у девочек (Mdn = 5.00): U = 316, p = .039. Размер эффекта r = .16, эффект небольшой. § Статистически значимого различия в Подозрительности мальчиков (Mdn = 5.00; М = 5.20, SD = 1.16) и девочек (Mdn = 6.00; M = 5.53, SD = 1.38) не обнаружено: U = 370, p = .22; t(58) = 1.36, p =.18. Размеры эффекта d = 0.35, r = .27. Небольшой эффект присутствует: девочки подозрительнее мальчиков. § Вербальная агрессия у мальчиков (Mdn = 10. 0) выше, чем у девочек (Mdn = 6.00): U = 76, p < .001. Размер эффекта r = .72, эффект большой. § Статистически значимого различия в Чувстве вины мальчиков (Mdn = 5.00; М = 5.10, SD = 1.06) и девочек (Mdn = 5.00; M = 5.03, SD = 1.38) не обнаружено: U = 423, p = .67; t(58) = -0.51, p =.61. Размеры эффекта d = 0.13, r = .07 – эффект не наблюдается. Таким образом, гипотеза работы: «Существуют различия в агрессии у подростков мальчиков и девочек» подтверждается. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 336 Приложение А Исходные данные Таблица А1 Показатели агрессии девочек Сode m1 m2 m3 m4 m5 m6 m7 m8 m9 m10 m11 m12 m13 m14 m15 m16 m17 m18 m19 m20 m21 m22 m23 m24 m25 m26 m27 m28 m29 m30 PhA IA 5 8 5 8 5 7 6 6 4 8 5 6 6 9 4 8 5 7 5 7 6 8 6 6 4 6 5 8 5 5 5 8 4 8 5 8 7 6 6 9 5 8 7 6 6 6 10 9 4 6 5 7 6 7 4 8 5 6 5 6 I 6 8 7 7 6 6 5 6 6 7 7 7 6 6 7 7 7 9 6 5 6 6 5 6 6 5 8 7 6 7 N 3 3 1 4 3 3 2 1 1 2 3 1 2 2 2 3 3 3 4 2 3 4 3 1 1 1 3 1 2 1 R 6 5 3 3 4 3 5 4 5 5 6 4 5 6 5 6 5 3 5 5 6 5 4 3 6 3 4 5 5 6 S 6 7 4 5 5 6 6 4 4 6 6 5 7 6 4 7 8 6 6 7 8 6 3 8 5 4 4 5 4 4 VA 7 4 5 7 7 6 6 4 4 8 7 7 6 7 6 7 7 4 7 6 6 7 8 4 7 6 6 6 4 6 G 4 3 5 5 6 7 5 5 3 4 6 5 3 3 5 5 5 6 7 7 8 7 4 6 3 4 6 5 4 5 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 337 Таблица А2 Показатели агрессии мальчиков Сode z1 z2 z3 z4 z5 z6 z7 z8 z9 z10 z11 z12 z13 z14 z15 z16 z17 z18 z19 z20 z21 z22 z23 z24 z25 z26 z27 z28 z29 z30 PhA IA 10 5 9 4 9 5 9 5 9 5 10 9 8 7 11 1 9 1 9 8 5 4 8 7 5 6 6 4 7 4 9 5 8 4 8 4 9 5 10 5 9 6 9 1 8 1 5 7 6 7 7 4 7 5 5 8 9 6 8 7 I 5 7 5 5 7 9 7 8 7 6 5 7 7 6 6 5 4 5 6 6 7 9 8 7 8 5 6 6 5 4 N 5 5 5 5 5 5 2 5 5 5 5 3 5 4 5 5 5 5 5 4 5 2 3 5 2 4 3 5 4 4 R 5 3 3 4 5 6 6 5 7 3 3 5 3 3 4 5 3 2 4 3 6 5 3 3 4 4 3 5 4 3 S 5 7 7 7 6 6 4 7 6 5 4 5 4 4 4 6 6 5 4 5 5 4 4 5 5 4 4 6 4 5 VA 10 12 13 12 11 11 10 13 9 11 10 10 10 9 8 7 5 8 10 10 8 9 9 6 5 10 9 10 11 12 G 6 5 5 5 7 7 7 6 8 5 5 4 6 4 5 5 5 4 4 5 3 4 4 5 6 7 5 4 5 5 В таблицах А1 и А2 обозначено: Переменная Шифр участника Пол (0-девочка; 1-мальчик) Физическая агрессия Косвенная агрессия Раздражение Негативизм Обида Подозрительность Вербальная агрессия Чувство вины Обозначение Gender Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt Имя в SPSS Code sex PhA IA I N R S VA G Метки значений (0-Female; 1-Male) Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 338 Приложение В Описательные статистики Таблица В1 Описательные статистики для девочек PhA IA I N R S VA G 30 30 30 30 30 30 30 30 Mean 5.33 7.17 6.43 2.27 4.67 5.53 6.07 5.03 Std. Error of Mean 0.22 0.20 0.17 0.19 0.19 0.25 0.22 0.25 Median 5.00 7.00 6.00 2.00 5.00 6.00 6.00 5.00 Std. Deviation 1.21 1.12 0.94 1.01 1.06 1.38 1.23 1.38 Skewness 2.03 -0.03 0.61 0.05 -0.38 0.18 -0.61 0.19 Std. Error of Skewness 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 Kurtosis 6.66 -1.16 0.76 -1.20 -1.01 -0.83 -0.61 -0.59 Std. Error of Kurtosis 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Range 6.00 4.00 4.00 3.00 3.00 5.00 4.00 5.00 Minimum 4.00 5.00 5.00 1.00 3.00 3.00 4.00 3.00 Maximum 10.00 9.00 9.00 4.00 6.00 8.00 8.00 8.00 25 5.00 6.00 6.00 1.00 4.00 4.00 5.75 4.00 50 5.00 7.00 6.00 2.00 5.00 6.00 6.00 5.00 75 a Gender = Female 6.00 8.00 7.00 3.00 5.25 6.25 7.00 6.00 N Percentiles Valid Missing Таблица В2 Описательные статистики для мальчиков PhA IA I N R S VA G 30 30 30 30 30 30 30 30 Mean 8.03 5.00 6.27 4.33 4.07 5.10 9.60 5.20 Std. Error of Mean 0.30 0.38 0.24 0.19 0.22 0.19 0.37 0.21 Median 8.50 5.00 6.00 5.00 4.00 5.00 10.00 5.00 Std. Deviation 1.65 2.10 1.34 1.03 1.23 1.06 2.04 1.16 Skewness -0.60 -0.41 0.31 -1.35 0.58 0.53 -0.61 0.58 Std. Error of Skewness 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 Kurtosis -0.43 0.00 -0.49 0.54 -0.46 -0.93 0.33 0.05 Std. Error of Kurtosis 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Range 6.00 8.00 5.00 3.00 5.00 3.00 8.00 5.00 Minimum 5.00 1.00 4.00 2.00 2.00 4.00 5.00 3.00 Maximum 11.00 9.00 9.00 5.00 7.00 7.00 13.00 8.00 25 7.00 4.00 5.00 4.00 3.00 4.00 8.75 4.00 50 75 8.50 9.00 5.00 7.00 6.00 7.00 5.00 5.00 4.00 5.00 5.00 6.00 10.00 11.00 5.00 6.00 N Percentiles Valid Missing a Gender = Male Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 339 Приложение С Проверка нормальности распределения данных Таблица С1 Результаты проверки соответствия распределения данных нормальному распределению Gender = male Gender = female с помощью асимметрии и эксцесса у мальчиков и девочек для шкал агрессии Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt S 2.03 -0.03 0.61 0.05 -0.38 0.18 -0.61 0.19 -0.60 -0.41 0.31 -1.35 0.58 0.53 -0.61 0.58 SES 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 0.43 K 6.66 -1.16 0.76 -1.20 -1.01 -0.83 -0.61 -0.59 -0.43 0.00 -0.49 0.54 -0.46 -0.93 0.33 0.05 SEK 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 0.83 Z(S) Z(K) DP p 4.76 0.08 1.44 0.13 0.88 0.42 1.43 0.45 1.40 0.95 0.72 3.17 1.36 1.24 1.42 1.37 8.00 1.40 0.91 1.44 1.22 1.00 0.73 0.71 0.52 0.00 0.59 0.65 0.56 1.12 0.40 0.06 86.68 1.95 2.89 2.09 2.26 1.18 2.59 0.70 2.24 0.91 0.87 10.44 2.16 2.78 2.19 1.88 .000 .38 .24 .35 .32 .55 .27 .70 .33 .64 .65 .005 .34 .25 .33 .39 ND no no no Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует DP. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 340 Таблица С2 Tests of Normality Gender Female Male Female Male Female Male Female Male Female Male Female Male Female Male Female Male Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt Kolmogorov-Smirnova Statistic .275 .221 .239 .184 .245 .162 .232 .375 .257 .240 .166 .217 .245 .178 .176 .269 df 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 Sig. .000 .001 .000 .011 .000 .044 .000 .000 .000 .000 .034 .001 .000 .017 .018 .000 Shapiro-Wilk Statistic .775 .897 .876 .923 .880 .933 .856 .681 .854 .887 .922 .841 .846 .938 .930 .902 df 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 Sig. .000 .007 .002 .032 .003 .061 .001 .000 .001 .004 .030 .000 .001 .082 .050 .009 a. Lilliefors Significance Correction df – число степеней свободы; Sig. - р-вероятность. При Sig. ≤ .05 распределение значимо отличается от нормального распределения. Случаи значимого отличия распределения от нормального в таблице С2 выделены. Таблица С3 Выбор критерия сравнения Variable Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt Normal Distribution Female Male no no no no no no no no no no no no no no no no Test U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney U-Mann-Whitney На Pис. С1-С8 приведены гистограммы с нормальной кривой, позволяющие визуально сравнить эмпирическое распределение данных с нормальным распределением. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 341 Рисунок C1. Гистограммы с нормальной кривой по переменной «Физическая агрессия» для мальчиков и девочек. Рисунок C2. Гистограммы с нормальной кривой по переменной «Косвенная агрессия» для мальчиков и девочек. Рисунок C3. Гистограммы с нормальной кривой по переменной «Раздражение» для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 342 Рисунок C4. Гистограммы с нормальной кривой по переменной «Негативизм» для мальчиков и девочек. Рисунок C5. Гистограммы с нормальной кривой по переменной «Обида» для мальчиков и девочек. Рисунок C6. Гистограммы с нормальной кривой по переменной «Подозрительность» для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 343 Рисунок C7. Гистограммы с нормальной кривой по переменной «Вербальная агрессия» для мальчиков и девочек. Рисунок C8. Гистограммы с нормальной кривой по переменной «Чувство вины» для мальчиков и девочек. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 344 Приложение D Исследование различий с помощью непараметрического критерия Манна-Уитни U-критерий Манна-Уитни предназначен для оценки различий по уровню признака4. Гипотезы: H 0 : Уровни признака в группах мальчиков и девочек имеют случайные отличия. H 1 : Уровни признака в группах мальчиков и девочек имеют закономерные отличия. Две сравниваемые группы объединяются в одну. Показатели ранжируются. Вычисляются суммы рангов для каждой группы в отдельности. Эти суммы рангов входят в расчетную формулу для эмпирического значения критерия (статистики) Манна-Уитни. Таблица D1 Суммы рангов для мальчиков и для девочек в объединенной группе Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion and Distrust Verbal Aggression Guilt 4 Gender Female Male N 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Female Male 30 30 Total 60 Mean Rank 19.02 41.98 Sum of Ranks 570.50 1259.50 40.13 20.87 1204.00 626.00 31.88 29.12 956.50 873.50 18.35 42.65 550.50 1279.50 34.98 26.02 1049.50 780.50 33.18 27.82 995.50 834.50 18.02 42.98 540.50 1289.50 29.58 31.42 887.50 942.50 Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО «Речь». С.49-55. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 345 Таблица D2 Статистики тестов и р-вероятности (Test Statisticsa) Physical Indirect Irritation Negativism Aggression Aggression 105.5 161.0 408.5 85.5 570.5 626.0 873.5 550.5 -5.196 -4.339 -.637 -5.542 Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2.000 tailed) a. Grouping Variable: Gender .000 .524 .000 Resent Suspicion Verbal ment and Distrust Aggression 315.5 369.5 75.5 780.5 834.5 540.5 -2.061 -1.229 -5.593 .039 .219 Guilt 422.5 887.5 -.422 .000 .673 В Таблице D2 представлены U-статистика Манна-Уитни, W-статистика Вилкоксона, равная наименьшей сумме рангов объединенной группы и Z-статистика для стандартизованного нормального распределения, которая используется для вычисления рvalue и для вычисления размера эффекта для теста Манна-Уитни: r= Z , N (D1) r = .10 (небольшой,эффект): в этом случае эффект объясняет 1% от общей дисперсии, r = .30 (средний эффект): эффект составляет 9% от общей дисперсии, r = .50 (большой эффект): эффект составляет 25% от дисперсии. Sig. = – это p-value. Если (Бююль & Цефель, 1976, с.88)5 Sig. > .05. то различие незначимое (ns). Sig. ≤ .05. то различие значимое (уровень значимости α = .05). Sig. ≤ .01. то различие очень значимое (уровень значимости α = .01). Sig. ≤ .001. то различие максимально значимое (уровень значимости α = .001). Максимально значимые различия имеются по переменным Physical Aggression, Indirect Aggression, Negativism, Verbal Aggression. Значимое различие имеется по переменной Resentment. Незначимые различия имеются по переменным Irritation, Suspicion and Distrust, Guilt. Для выяснения. чей же уровень агрессии выше: мальчиков или девочек. обратимся к таблице рангов. У кого при значимых различиях средний ранг выше. у того и агрессия выше. Physical Aggression Выше у мальчиков (U = 105.5. p < .001); Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб: ООО «ДиаСофтЮП». C. 88. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 346 лекций. 5 Indirect Aggression - Выше у девочек (U = 161.0. p < .001); Irritation - Различия не выявлены (U = 408.5. p = .52); Negativism - Выше у мальчиков (U = 85.5. p < .001); Resentment - У девочек выше (U = 315.5. p = .039); Suspicion and Distrust - Различия не выявлены (U = 369.5. p = .22); Verbal Aggression - Выше у мальчиков (U = 75.5. p < .001); Guilt - Различия не выявлены (U = 422.5. p = .67). Те же выводы можно сделать анализируя коробчатые диаграммы (Рис.D1-D8)6. Рисунок D1. Коробчатые диаграммы для переменной «Physical Aggression» (физическая агрессия). Рисунок D2. Коробчатые диаграммы для переменной «Indirect Аggression» (косвенная агрессия). Рисунок D3. Коробчатые диаграммы для переменной «Irritation» (раздражение). Рисунок D4. Коробчатые диаграммы для переменной «Negativism» (негативизм). На Рис.D1-D8 вместо Z (мальчик) стоит puika, что также означает – мальчик. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 6 347 Рисунок D5. Коробчатые диаграммы для переменной «Resentment» (обида). Рисунок D6. Коробчатые диаграммы для переменной «Suspicion and Distrust» (Подозрительность). Рисунок D7. Коробчатые диаграммы для переменной «Verbal Аggression» (вербальная агрессия). Рисунок D8. Коробчатые диаграммы для переменной «Guilt» (Чувство вины). Таблица D3 Male, Mdn Female, Mdn Statistics, U Statistics, Z p-value Вычисление размеров эффектов по формуле (D1) Физическая агрессия 8.50 5.00 105.5 5.20 .000 .67 большой Косвенная агрессия 5.00 7.00 161.0 4.34 .000 .56 большой Негативизм Раздражение 5.00 6.00 2.00 6.00 85.5 408.5 5.54 0.64 .000 .52, ns .72 .08 большой нет эффекта Подозрительность 5.00 6.00 369.5 2.06 .22, ns .27 небольшой Обида 4.00 5.00 315.5 1.23 .039 .16 небольшой Вербальная агрессия Чувство вины 10.0 5.00 6.00 5.00 75.5 422.5 5.59 0.42 .000 .67, ns .72 .05 большой нет эффекта Переменная Размер эффекта, r Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 348 Пример вычисления размера эффекта. Для Физической агрессии размер эффекта равен r = 5.196 = 0.67 . 60 Тест Манна-Уитни указывает на то, что физическая агрессия мальчиков (Mdn = 8.50) превыает агрессию девочек (Mdn = 5.00), U = 105.5, (Z = -5.20), p < .001, различие агрессии у мальчиков и девочек r = .67. Размер эффекта большой. Интересно отметить, что для переменной «Подозрительность», статистической значимости различий не найдено, хотя эффект малого размера (почти среднего, r = .27) имеется. Для переменной «Обида» гендерные различия значимые, но размер эффекта меньше: r = .16. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 349 Приложение Е Исследование различий средних показателей с помощью параметрических критериев Проверка однородности выборочных дисперсий в программе SPSS проводится с помощью теста Левена (аналог F-критерия Фишера: F-Test Two-Sample for Variances). В Таблице Е2 приведены результаты проверки однородности дисперсий можно увидеть в колонке «Sig.». Гипотеза о равенстве дисперсий не принимается. если Sig. ≤ .05. Только для переменной «Раздражение» (Irritation) дисперсии неоднородны. Если выборочные дисперсии различаются статистически незначимо (Sig. > 0.05; верхняя строка «Equal variances assumed»), то для сравнения средних используется t-тест Стьюдента. Если выборочные дисперсии различаются статистически значимо (Sig. ≤ 0.05; нижняя строка «Equal variances not assumed»), то такая ситуация называется проблемой Фишера-Беренса и для сравнения средних используется модификация t-теста Стьюдента. В соответствующей строке для t-теста: Sig. = – это p-value. Таблица Е1. Статистики групп (Group Statistics) Gender Irritation Suspicion and Distrust Guilt N Mean Std. Deviation Std. Error Mean Female 30 6.4333 .93526 .17075 Male 30 6.2667 1.33735 .24417 Female 30 5.5333 1.38298 .25250 Male 30 5.1000 1.06188 .19387 Female 30 5.0333 1.37674 .25136 Male 30 5.2000 1.15669 .21118 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 350 Таблица Е2 t-тест для независимых выборок (Independent Samples Test). Фрагмент выходной таблицы Levene's Test for Equality of t-test for Equality of Means Variances F Irritation Suspicion and Distrust Guilt Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Sig. 4.381 3.091 .622 t .041 .084 .433 df Sig. (2-tailed) .559 58 .578 .559 51.891 .578 1.361 58 .179 1.361 54.374 .179 -.508 58 .614 -.508 56.326 .614 По переменным Irritation, Suspicion and Distrust, SP имеются незначимые различия средних значений. Для t-теста для двух независимых выборок размер эффекта - Cohen's d находится путем деления разности средних значений этих выборок на суммарное стандартное отклонение «pooled standard deviation»: d= где SD pooled M1 − M 2 , SDpooled (E1) SD12 + SD22 = . 2 Значения размера эффекта меняются в том же диапазоне, что и три стандартных отклонения для стандартизованных данных: от -3.00 до 3.00. Интерпретация размера эффекта зависит от исследовательского вопроса. Можно использовать классификацию, предложенную Коэном (Cohen, 1988)7: 0.8 - большой размер эффекта (8/10 от стандартного отклонения), 0.5 - умеренный размер эффекта (1/2 от стандартного отклонения), 0.2 - небольшой размер эффекта (1/5 от стандартного отклонения) 7 Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Earlbaum Associates. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 351 Таблица Е3 Male, M Male, SD Female, M Female, SD Statistics, t df p-value Вычисление размеров эффектов по формуле (Е1) Раздражение 6.27 1.34 6.43 0.94 0.60 52 0.58, ns 0.14 нет эффекта Подозрительность ( 5.10 1.06 5.53 1.38 1.36 58 0.18, ns 0.35 небольшой Чувство вины 5.20 1.16 5.03 1.38 -0.51 58 0.61 0.13 нет эффекта Variable Размер эффекта, d Пример вычисления размера эффекта d. Для «Раздражения» (К) размер эффекта равен (см. Таблицу Е1): d= 6.2667 − 6.4333 (1.33735) + ( 0.93526 ) 2 2 = −0.14 . 2 Результаты t-тестов соответствуют результатам теста Манна-Уитни. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 352 Приложение 3 Исследование самооценки по методике ДембоРубинштейн в модификации А. М. Прихожан http://psylist.net/praktikum/15.htm Данная методика основана на непосредственном оценивании (шкалировании) школьниками ряда личных качеств, таких как здоровье, способности, характер и т. д. Обследуемым предлагается на вертикальных линиях отметить определенными знаками уровень развития у них этих качеств (показатель самооценки) и уровень притязаний, т. е. уровень развития этих же качеств, который бы удовлетворял их. Каждому испытуемому предлагается бланк методики, содержащий инструкцию и задание. Тамара Дембо (1902-1993; родилась в Баку, Россия; работала в Германии, затем в США) - известная исследовательница в области психологии, в свое время предложила использовать эту методику. Сусанна Яковлевна Рубинштейн (1911 - 1990) - советский психолог, модифицировала методику Дембо для исследования самооценки (Ложников, 2010). Проведение исследования На листе бумаги проводится вертикальная черта, обозначающая одно из свойств, например, счастье. Верхний край соответствует состоянию, где, по вашему мнению находится самый счастливый человек, которого можно представить, а нижнему соответствует состояние самого несчастного человека. То есть внизу находятся отрицательные ценности, которых человек старается избежать, а вверху наоборот положительные, к которым человек стремится. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 353 Инструкция “Любой человек оценивает свои способности, возможности, характер и др. Уровень развития каждого качества, стороны человеческой личности можно условно изобразить вертикальной линией, нижняя точка которой будет символизировать самое низкое развитие, а верхняя — наивысшее. Вам предлагаются семь таких линий. Они обозначают: 1. здоровье; 2. ум, способности; 3. характер; 4. авторитет у сверстников; 5. умение многое делать своими руками, умелые руки; 6. внешность; 7. уверенность в себе. На каждой линии чертой (-) отметьте, как вы оцениваете развитие у себя этого качества, стороны вашей личности в данный момент времени. После этого крестиком (х) отметьте, при каком уровне развития этих качеств, сторон вы были бы удовлетворены собой или почувствовали гордость за себя”. Испытуемому выдается бланк, на котором изображено семь линий, высота каждой — 100 мм, с указанием верхней, нижней точек и середины шкалы. При этом верхняя и нижняя точки отмечаются заметными чертами, середина — едва заметной точкой. Методика может проводиться как фронтально — с целым классом (или группой), так и индивидуально. При фронтальной работе необходимо проверить, как каждый ученик заполнил первую шкалу. Надо убедиться, правильно ли применяются предложенные значки, ответить на вопросы. После этого испытуемый работает самостоятельно. Время, отводимое на заполнение шкалы вместе с чтением инструкции, 10—12 мин. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 354 Обработка и интерпретация результатов Обработка проводится по шести шкалам (первая, тренировочная — «здоровье» — не учитывается). Каждый ответ выражается в баллах. Как уже отмечалось ранее, длина каждой шкалы 100мм, в соответствии с этим ответы школьников получают количественную характеристику (например, 54мм = 54 баллам). По каждой из шести шкал определить: • уровень притязаний — расстояние в мм от нижней точки шкалы («0») до знака «х»; • высоту самооценки — от «о» до знака «—»; • значение расхождения между уровнем притязаний и самооценкой — расстояние от знака «х» до знака «-», если уровень притязаний ниже самооценки, он выражается отрицательным числом. Рассчитать среднюю величину каждого показателя уровня притязаний и самооценки по всем шести шкалам. Уровень притязаний Норму, реалистический уровень притязаний, характеризует результат от 60 до 89 баллов. Оптимальный — сравнительно высокий уровень — от 75 до 89 баллов, подтверждающий оптимальное представление о своих возможностях, что является важным фактором личностного развития. Результат от 90 до 100 баллов обычно удостоверяет нереалистическое, некритическое отношение детей к собственным возможностям. Результат менее 60 баллов свидетельствует о заниженном уровне притязаний, он — индикатор неблагоприятного развития личности. Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 355 Высота самооценки Количество баллов от 45 до 74 («средняя» и «высокая» самооценка) удостоверяют реалистическую (адекватную) самооценку. Количество баллов от 75 до 100 и выше свидетельствует о завышенной самооценке и указывает на определенные отклонения в формировании личности. Завышенная самооценка может подтверждать личностную незрелость, неумение правильно оценить результаты своей деятельности, сравнивать себя с другими; такая самооценка может указывать на существенные искажения в формировании личности — «закрытости для опыта», нечувствительности к своим ошибкам, неудачам, замечаниям и оценкам окружающих. Количество баллов ниже 45 указывает на заниженную самооценку (недооценку себя) и свидетельствует о крайнем неблагополучии в развитии личности. Эти ученики составляют «группу риска», их, как правило, мало. За низкой самооценкой могут скрываться два совершенно разных психологических явления: подлинная неуверенность в себе и «защитная», когда декларирование (самому себе) собственного неумения, отсутствия способности и тому подобного позволяет не прилагать никаких усилий. В Таблице 1 даны количественные характеристики уровня притязаний и самооценки, полученные для учащихся 7-10 классов городских школ (около 900 чел.). Таблица 1 Количественные характеристики уровня притязаний и самооценки учащихся 710 классов городских школ. Количественная характеристика (балл) Параметр низкий средний высокий Очень высокий Уровень притязаний Менее 60 60-74 75-89 90-100 Уровень самооценки Менее 45 45-59 60-74 75-100 Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 356 Более подробно про этот тест можно прочитать в интернете по ссылке: Измерение самооценки по методике Дембо-Рубинштейн (2008). В книге (С.Б. Корнилова и др. Ред.) Содержание и организация психолого-педагогического сопровождения индивидуального развития воспитанников детских домов и школ-интернатов. Выпуск 1. Теоретическое обоснование психолого-медикопедагогического сопровождения воспитанников детских домов и школинтернатов. Комплекс методик для изучения воспитанников детских домов и школ-интернатов на разных возрастных этапах развития. Компьютерная база психодиагностических данных Методические материалы для специалистов сопровождения. Ярославль: ГОУ ЯО «Центр помощи детям». http://citoweb.yspu.org/link1/metod/met35/node33.html Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 357 Приложение 4 Математическая часть работы «Исследование связи между самооценкой и агрессией в подростковом возрасте» Статистические методы обработки данных1 Обработка данных проводилась с помощью компьютерной программы SPSS 17.0. Математический аппарат исследования выбирался в соответствии с гипотезой исследования: «Существует связь между самооценкой и агрессией в подростковом возрасте». Чтобы определить: какими тестами пользоваться для выявления связи параметрическими или непараметрическими, было проверено соответствие распределений эмпирических данных нормальному распределению. Для проверки были использованы тест Колмогорова-Смирнова с поправкой Лиллифора, тест Шапиро-Уилкса, тест асимметрии, тест эксцесса и D'Agostino-Pearson Omnibus Test. Также было проведено визуальное исследование гистограмм с нормальной кривой и коробчатых диаграмм на наличие экстремальных значений («выбросов»). Оказалось, что распределения данных не соответствуют нормальному распределению. Поэтому для исследования связи между самооценкой и шкалами методики Басса-Дарки были выбраны непараметрические коэффициенты ранговой корреляции Спирмена и τ-Кендалла. Известно, что при отсутствии нормального распределения можно использовать коэффициент корреляции Пирсона, если нет «выбросов», асимметрия небольшая ( S ≤ 1.96 ⋅ SES ) и связь предполагается линейной (Наследов, 2004, с.89). Поэтому было также проведено исследование связи с помощью коэффициентов корреляции Пирсона. Монотонной связи для всей выборки и для всех шкал агрессивности не обнаружено: коэффициенты корреляции оказались статистически незначимыми. Анализ корреляционных диаграмм позволил сделать предположение о возможности нелинейной связи между переменными. Выпускная работа должна быть написана по форме статьи и содержать разделы «Метод» и «Результаты». «Статистические методы обработки данных» это последняя часть раздела выпускной работы «Метод». 1 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 358 Для выявления нелинейной связи был проведен нелинейный регрессионный анализ. Были рассмотрены линейная, квадратическая и кубическая модели. Вычислялись коэффициенты детерминации и проверялась их статистическая значимость. Исследование проводилось в двух направлениях: зависимая и независимая переменные менялись местами. В результате были выявлены возможные немонотонные связи. Наличие немонотонных связей уточнялось путем разбиения данных по одной из переменных на интервалы монотонности (по медиане) и вычисления на каждом из них коэффициентов корреляции. Были выполнены следующие процедуры. 1. Данные по «Самооценке» были разбиты на две группы по медиане. В каждой из групп были вычислены коэффициенты корреляции Спирмена, Кендалла и, где возможно Пирсона. 2. Данные по «Вербальной агрессивности» были разбиты на две группы по медиане. В каждой из групп были вычислены коэффициенты корреляции Спирмена и Кендалла. 3. По всем переменным данные были разбиты на три группы по квартилям. С помощью критерия «Хи-квадрат» (The Test of Independence) и критерия «Угловое преобразование Фишера» для сравнения долей были установлены те же связи, что и в пп.12. Для всех полученных результатов были вычислены размеры эффектов и доверительные интервалы для размеров эффектов. Результаты Исходные данные Данные, обработанные в соответствии с ключами методик Дембо-Рубинштейна (Под ред. Корниловой, 2008) и Басса-Дарки (Батаршев, 2005, сс. 195-200) приведены в Таблице А1 (Приложение А). В настоящей работе приняты обозначения, используемые в таблицах и рисунках (“Questionnaire Bass-Darky”, n. d.; Buss & Durkee, 1957; Bakholdina, Bakholdina, Movsesiana, & Stupina, 2014.). Обозначения: Self-Esteem (SE) Самооценка Physical aggression (PhA) Физическая агрессивность Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 359 Indirect (IA) Косвенная агрессивность Irritation (I) Раздражительность Negativism (N) Негативизм Resentment (R) Обидчивость Suspicion (S) Подозрительность Verbal aggression (VA) Вербальная агрессивность Guilt (G) Чувство вины Описательные статистики С помощью компьютерной программы SPSS были получены показатели описательной статистики, приведенные в Приложении В, в Таблице В1. В Таблице В1 отмечены случаи, когда показатели асимметрии и эксцесса по абсолютной величине превосходят свои стандартные ошибки, умноженные на 1.96. В этих случаях соответствующие показатели считаются большими и распределения данных не соответствует нормальному распределению. Большая асимметрия наблюдается только для переменной «Подозрительность». Рисунок 1. Средние значения и стандартные отклонения по шкалам агрессивности методики Басса-Дарки. На Рис.1. приведены средние значения и стандартные отклонения по шкалам агрессивности (методика Басса-Дарки). По самооценке М = 62.3, SD = 14.3. Для шкал агрессивности и самооценки, приведены коробчатые диаграммы (Boxplots), (Рис.2 и Рис.3). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 360 «Выбросы» (Outliers) присутствуют только для показателей по шкале вербальной агрессивности (VA) – имеется два участника с заниженными показателями вербальной агрессивности. Рисунок 2. Коробчатые диаграммы по шкалам агрессивности методики Басса-Дарки. Рисунок 3. Коробчатая диаграмма показателей самооценки методики ДембоРубинштейна. Большая асимметрия ( S ≤ 1.96 ⋅ SES = 0.39) наблюдается только по переменной «Подозрительность». Проверка нормальности распределения данных Чтобы определить: какими тестами пользоваться для выявления связи параметрическими или непараметрическими, было проверено соответствие распределений эмпирических данных нормальному распределению. Для проверки были использованы тест Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 361 Колмогорова-Смирнова с поправкой Лиллифора, тест Шапиро-Уилкса, тест асимметрии, тест эксцесса и D'Agostino-Pearson Omnibus Test (Приложение С, Таблицы С1-С2). Также было проведено визуальное исследование гистограмм с нормальной кривой (Приложение С, Рис.С1-С9) и коробчатых диаграмм на наличие экстремальных значений - «выбросов» (Рис.2-3). Оказалось, что распределения данных не соответствуют нормальному распределению. Поэтому для исследования связи между самооценкой и шкалами методики Басса-Дарки были выбраны непараметрические коэффициенты ранговой корреляции Спирмена и τ-Кендалла. Результаты проверки соответствия данных нормальному распределению и выбор коэффициентов корреляции иллюстрируется Таблицей С3 Приложения С. Эмпирические распределения всех данных не соответствуют нормальному распределению. Корреляционный анализ Так как распределения всех переменных отличаются от нормального распределения, то для исследования связи были выбраны коэффициенты Спирмена и «Тау»-Кендалла (Приложение С, Таблица С3). Все вычисленные коэффициенты корреляции оказались статистически незначимыми (Приложение D, Таблицы D1-D2). Есть тенденция к положительной связи «Самооценки» с «Подозрительностьм»: rS (145) = .15, p = .071, размер эффекта небольшой, 95%CI = [-.013; .31]. Также найдена статистически незначимая отрицательная связь «Самооценки» с «Раздражительностьм»: rS (145) = -.11, p = .18, ns, размер эффекта небольшой, 95%CI = [.27; .054]. Если нет нормального распределения, но отсутствуют выбросы, асимметрия небольшая ( S ≤ 1.96 ⋅ SES ) и предполагается линейная связь, то можно использовать коэффициент корреляции Пирсона (Наследов, 2004; с.89). В нашем случае только у переменной «Вербальная агрессивность» имеется два выброса типа “Outliers”, которые не могут существенно повлиять на среднее значение (Рис.2). Большая асимметрия имеется только по переменной «Подозрительность». Были вычислены коэффициенты корреляции Пирсона (Приложение D, Таблица D3). Была найдена положительная линейная связь «Самооценки» с «Подозрительностьм»: r (145) = .17, p = .046, размер эффекта небольшой, 95%CI = [.007; Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 362 .32]. Из-за большой асимметрии эта связь может быть поставлена под сомнение, но в случае хорошей психологической интерпретации может быть признанной. Также найдена тенденция к отрицательной линейной связи «Самооценки» с «Раздражительностьм»: r (145) = -.15, p = .072, размер эффекта небольшой, 95%CI = [-.31; .013]. Кроме этих двух случаев монотонной связи не обнаружено. Возможно, что есть немонотонная связь. Корреляционные диаграммы. Для иллюстрации приведены корреляционные диаграммы (Рис.4-11). Все рисунки отредактированы в SPSS. Статистически незначимые коэффициенты корреляции, у которых размер эффекта меньше минимального и корреляционные диаграммы свидетельствуют в пользу того, что связь между самооценкой и агрессивностью может оказаться нелинейной. Рисунок 4. Самооценка – Физическая агрессивность. Рисунок 5. Самооценка – Косвенная агрессивность. Рисунок 7. Самооценка – Негативизм. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 363 Рисунок 6. Самооценка – Раздражительность. Рисунок 8. Самооценка – Обидчивость. Рисунок 10. Самооценка – Вербальная агрессивность. Рисунок 9. Самооценка – Подозрительность. Рисунок 11. Самооценка – Чувство вины. Нелинейный регрессионный анализ. Выбор линии регрессии Анализ корреляционных диаграмм, также как и сами коэффициенты корреляции, позволил сделать предположение о возможности нелинейной связи между самооценкой и шкалами агрессивности. Для выявления нелинейной связи был проведен нелинейный регрессионный анализ. Были рассмотрены линейная, квадратическая и кубическая модели (Приложение Е, Таблицы Е1-Е16, Рис.Е1-Е16). Вычислялись коэффициенты детерминации R 2 и проверялась их статистическая значимость. Исследование проводилось в двух направлениях: зависимая и независимая переменные менялись местами. В результате были Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 364 выявлены возможные немонотонные связи. В качестве размера эффекта рассматривался коэффициент детерминации. Использовалась интерпретация размера эффекта: .02 небольшой, .13 средний, .26 большой. Вычислялись доверительные интервалы для размера эффекта. Результаты исследавания отражены в Таблице 1. Таблица 1. Самооценка Самооценка Самооценка Зависимая Физическая агрессивност ь Косвенная агрессивност ь Раздражител ьность Самооценка Негативизм Самооценка Вербальная агрессивност ь Вербальная агрессивност ь Самооценка Самооценка Чувство вины 95% CI .50 [.35; .65] F(2, 142) = 71.5, .44 Самооценка Самооценка Подозрительность [.29; .60] большой .15 [.012; .29] F(2, 142) = 12.7, p < .001 [-.022; .096] небольшой, тенденция [-.039; .083] небольшой, тенденция отрицательная .028 F(2, 142) = 50.5, p < .001 F(2, 142) = 3.10, p =.048 F(2, 142) = 22.4, p < .001 средний .037 F(2, 142) = 56.4, p < .001 .42 [.26; .57] большой .042 [-.041; .13] небольшой .24 [.083; .40] [-.041; .099] небольшой, положительная .028 Самооценка p < .001 большой .022 Раздражител ьность Подозрительность R2 Статистическая значимость модели Размер эффекта большой Линейная Независимая Квадратическая Переменные, N = 145 Модель связи Результаты выбора вида связи [-.041; .099] небольшой положительная F(2, 142) = 2.74, p = .068 F(1, 143) = 3.29, p = .072 F(1, 143) = 4.06, p = .046 F(1, 143) = 2.15, p = .046 На Рис.12-20 приведены корреляционные диаграммы с выбранными статистически значимыми линиями регрессии. Данные связи необходимо подтвердить с помощью коэффициентов корреляции. Можно сделать следующие предварительные выводы. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 365 Самооценка – Физическая агрессивность (Рис.12) • Для группы участников с низкой самооценкой при увеличении самооценки физическая агрессивность уменьшается; • Для группы участников с высокой самооценкой при увеличении самооценки физическая агрессивность увеличивается. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 366 Самооценка – Косвенная агрессивность (Рис.13) • Для группы участников с низкой самооценкой при увеличении самооценки косвенная агрессивность уменьшается; • Для группы участников с высокой самооценкой при увеличении самооценки косвенная агрессивность увеличивается. Рисунок 12. Корреляционная диаграмма с Рисунок 13. Корреляционная диаграмма с линией регрессии: самооценка – линией регрессии: самооценка – косвенная физическая агрессивность. агрессивность. Самооценка – Раздражительность (Рис.14) • Для группы участников с низкой самооценкой при увеличении самооценки Раздражительность уменьшается; • Для группы участников с высокой самооценкой при увеличении самооценки Раздражительность увеличивается. Рисунок 14. Корреляционная диаграмма с линией регрессии: самооценка – Раздражительность. Рисунок 15. Корреляционная диаграмма с линией регрессии: Раздражительность самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 367 Раздражительность - Самооценка (Рис.15) Для всей группы при уваеличении раздражения самооценка уменьшается. Самооценка – Негативизм (Рис.16) • Для группы участников с низкой самооценкой при увеличении самооценки негативизм увеличивается; • Для группы участников с высокой самооценкой при увеличении самооценки негативизм уменьшается. Рисунок 16. Корреляционная диаграмма с Рисунок 17. Корреляционная диаграмма с регрессии: самооценка – линией регрессии: самооценка – линией Подозрительность. негативизм. Самооценка – Подозрительность (Рис.17) • Самооценка и Подозрительность согласованно увеличиваются. Самооценка – Вербальная агрессивность (Рис.18) • Для группы участников с низкой самооценкой при увеличении самооценки вербальная агрессивность уменьшается; • Для группы участников с высокой самооценкой при увеличении самооценки вербальная агрессивность увеличивается. Вербальная агрессивность - Самооценка (Рис.19) • Для группы участников с низкой вербальной агрессией при увеличении вербальной агрессивности самооценка увеличивается; Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 368 • Для группы участников с высокой вербальной агрессией при увеличении самооценки вербальная агрессивность увеличивается. Рисунок 18. Корреляционная диаграмма с Рисунок 19. Корреляционная диаграмма с линией регрессии: самооценка – линией регрессии: самооценка – вербальная агрессивность. вербальная агрессивность. Рисунок 20. Корреляционная диаграмма с линией регрессии: самооценка – чувство вины. Самооценка – Чувство вины (Рис.20) • Для группы участников с низкой самооценкой при увеличении самооценки чувство вины увеличивается; • Для группы участников с высокой самооценкой при увеличении самооценки чувство вины уменьшается. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 369 Таким образом, с помощью регрессионного анализа показано, что в некоторых случаях возможна нелинейная немонотонная связь квадратического типа (Таблица 1). Для обоснования этой связи разобьем выборку на две группы монотонности по медиане независимой переменной (Наследов, 2004, с. 43) и вычислим коэффициенты корреляции в каждой из групп. Для исследования квадратической связи с помощью коэффициентов корреляции, осуществим разбивку по медиане для переменных: • «Самооценка» (чтобы вычислить коэффициенты корреляции в группах подростков с высокой самооценкой или с низкой самооценкой) с переменными «Физическая агрессивность», «Косвенная агрессивность», «Раздражительность», «Негативизм», «Вербальная агрессивность», «Чувство вины»; • «Вербальная агрессивность» (чтобы вычислить коэффициенты корреляции в группах подростков с высокой самооценкой или с низкой самооценкой) с переменной «Самооценка». Анализ двух групп самооценки Распределение данных по самооценке статистически значимо отличается от нормального распределения. Поэтому разбивка самооценки на две группы осуществлялась с помощью медианы. Из таблицы В1 (Приложение В) находим, что Mdn = 62.3. Это значит, что 50% оценок не превышает 62.3. Ø Значение показателя, который меньше Mdn = 62.3 будем считать показателем самооценки ниже среднего уровня, «низкой самооценкой»; Ø Значение показателя, который больше Mdn = 62.3 будем считать показателем самооценки выше среднего уровня, «высокой самооценкой»; Описательные статистики приведены в Приложении В (Таблицы В2-В3). На Рис.21 приведены коробчатые диаграммы по шкалам агрессивности для групп участников с самооценкой ниже медианы и выше медианы. На Рис.22 приведены коробчатые диаграммы по самооценке для групп участников с самооценкой ниже медианы и выше медианы. Проверка соответствия распределения данных нормальному распределению приведена в Приложении С, Таблицы С4-С5. Выбор коэффициентов корреляции в Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 370 Приложении С, Таблицы С6-С7. Гистограммы с нормальной кривой для визуального сравнения с нормальным распределением изображены на Рис.С10-С18, Приложение С. Рисунок 21. Коробчатые диаграммы по шкалам агрессивности для групп участников с самооценкой ниже медианы (Low) и выше медианы (High). Рисунок 22. Коробчатая диаграмма для самооценки для групп участников с самооценкой ниже медианы (Low) и выше медианы (High). Распределение всех данных отличается от нормального распределения. Поэтому были вычисены непараметрические коэффициенты корреляции Спирмена и Кендалла, а также коэффициенты корреляции Пирсона (Приложение D, Таблицы D4-D6). Для иллюстрации квадратическоц связи на Рис.23-28 изображены корреляционные диаграммы с прямыми регрессии. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 371 Корреляционные диаграммы и коэффициенты корреляции показывают следующие закономерности. Самооценка – Физическая агрессивность В группе участников с низкой самооценкой найдена линейная отрицательная зависимость «Физической агрессивности» от «Самооценки» (Таблица D6): r (73) = -.77; p<.001, размер эффекта большой, 95%CI = [-.85; -.66]. В группе участников с высокой самооценкой найдена линейная положительная зависимость «Физической агрессивности» от «Самооценки»: r (72) = .74; p<.001, размер эффекта большой, 95%CI = [.61; .83]. Корреляционная диаграмма с линиями регрессии показана на Рис.23. Для всей группы участников корреляционная связь «Самооценки» с «Физической агрессией» не найдена. При увеличении «Физической агрессивности» «Самооценка» меняется случайным образом (Таблица D1-D3). Рисунок 23. Корреляционная диаграмма («Самооценка» – «Физическая агрессивность») с прямыми регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой. Пунктиром изображена парабола, отображающая нелинейный характер связи. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 372 Самооценка – Косвенная агрессивность В группе участников с низкой самооценкой найдена линейная отрицательная зависимость «Косвенной агрессивности» от «Самооценки» (Таблица D6): r (73) = -.70; p<.001, размер эффекта большой, 95%CI = [-.80; -.56]. В группе участников с высокой самооценкой найдена линейная положительная зависимость «Косвенной агрессивности» от «Самооценки»: r (72) = .69; p<.001, размер эффекта большой, 95%CI = [.55; .80]. Для всей группы участников корреляционная связь «Самооценки» с «Косвенной агрессией» не найдена. При увеличении «Косвенной агрессивности» «Самооценка» меняется случайным образом (Таблицы D1-D3). Корреляционная диаграмма с линиями регрессии показана на Рис.24. Рисунок 24. Корреляционная диаграмма (Самооценка – Косвенная агрессивность) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. Самооценка – Раздражительность В группе участников с низкой самооценкой найдена линейная отрицательная зависимость «Раздражения» от «Самооценки» (Таблица D6): r (73) = -.76; p<.001, размер эффекта большой, 95%CI = [-.84; -.64]. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 373 В группе участников с высокой самооценкой найдена монотонная положительная зависимость «Раздражения» от «Самооценки»: r (72) = .53; p<.001, размер эффекта большой, 95%CI = [.34; .68]. При увеличении «Раздражения» «Самооценка» имеет тенденцию уменьшаться (Таблица D3): r(145) = -.15 р = .072. Размер эффекта небольшой, 95%CI = [-.31; .013]. Корреляционная диаграмма с прямыми регрессии показана на Рис.25. Рисунок 25. Корреляционная диаграмма (Самооценка – Раздражительность) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. Самооценка – Негативизм В группе участников с низкой самооценкой найдена линейная положительная зависимость «Негативизма» от «Самооценки» (Таблица D6): r (73) = .32; p =.005, размер эффекта средний, 95%CI = [.10; -.52]. В группе участников с высокой самооценкой В группе участников с высокой самооценкой связь «Самооценки» с «негативизмом» не найдена. При увеличении «Самооценки» «Негативизм» меняется случайным образом. При увеличении «Негативизма» «Самооценка» меняется случайным образом. Корреляционная диаграмма с линиями регрессии показана на Рис.26. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 374 Рисунок 26. Корреляционная диаграмма (Самооценка – Негативизм) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. Самооценка – Вербальная агрессивность Рисунок 27. Корреляционная диаграмма (Самооценка – Вербальная агрессивность) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. В группе участников с низкой самооценкой найдена линейная отрицательная зависимость «Вербальной агрессивности» от «Самооценки» (Таблица D6): r (73) = -.53; p<.001, размер эффекта большой, 95%CI = [-.68; -.34]. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 375 В группе участников с высокой самооценкой найдена монотонная положительная зависимость «Вербальной агрессивности» от «Самооценки» (Таблица D5): коэффициент корреляции Спирмена rS (72) = .56; p<.001, размер эффекта большой, 95%CI = [.61; .83]. Корреляционная диаграмма с прямыми регрессии показана на Рис.27. Самооценка – Чувство вины Рисунок 28. Корреляционная диаграмма (Самооценка – Чувство вины) с прямыми регрессиями для всех участников, для участников с низкой самооценкой, для участников с высокой самооценкой. В группе участников с низкой самооценкой найдена тенденция к линейной положительной зависимости «Чувства вины» от «Самооценки» (Таблица D6): r (73) = .23; p =.051, размер эффекта между небольшим и средним, 95%CI = [-.002; .44]. Коэффициент корреляции Кендалла τ (73) = .17; p = .049 (Таблица D4) В группе участников с высокой самооценкой статистически значимой зависимости «Чувства вины» от «Самооценки» не найдено. Но коэффициент корреляции Пирсона указывает на статистически незначимую отрицательную зависимость небольшого размера эффекта «Чувства вины» от «Самооценки» (Таблица D5): r (72) = -.14; p =.24, размер эффекта небольшой, 95%CI = [-.36; .095]. При увеличении «Чувства вины» «Самооценка» меняется случайным образом. Корреляционная диаграмма с прямыми регрессии показана на Рис.28. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 376 Анализ двух групп вербальной агрессивности Одним из результатов регрессионного анализа оказалась возможная квадратическая связь, когда независимой переменной является «Вербальная агрессивность», а зависимой – «Самооценка». В данном исследовании распределение данных по вербальной агрессивности статистически значимо отличается от нормального распределения. Поэтому разбивка вербальной агрессивности на две группы осуществлялась с помощью медианы. Из таблицы В1 (Приложение В) находим, что Mdn = 6. Это значит, что 50% оценок не превышает 6. Разбиение: Mdn < 6 - низкий уровень вербальной агрессивности (Low); Mdn ≥ 6 - высокий уровень вербальной агрессивности (High). Описательные статистики приведены в Приложении В (Таблица В4). Рис.29. Коробчатые диаграммы для самооценки. На Рис.29 приведены коробчатые диаграммы по самооценке для групп участников с вербальной агрессией ниже медианы и выше медианы. На Рис.30 приведены коробчатые диаграммы по вербальной агрессивности для групп участников с вербальной агрессией ниже медианы и выше медианы. Проверка соответствия распределения данных нормальному распределению приведена в Приложении С, Таблицы С8-С9. Гистограммы с нормальной кривой для визуального сравнения с нормальным распределением изображены на Рис.С17-С18, Приложение С. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 377 Рис.30. Коробчатые диаграммы для вербальной агрессивности. Распределения данных не соответствует нормальному распределению. Но по всем переменным «выбросы» отсутствуют («выброс» на Рис.29 для низкой вербальной агрессивности не может существенно исказить среднее значение). Но большая асимметрия (Таблица В4) по «Вербальной агрессивности», как для низких, так и для высоких ее значений не дает возможности использовать коэффициент корреляции Пирсона. Поэтому были вычислены непараметрические коэффициенты корреляции Спирмена и Кендалла. Вербальная агрессивность - Самооценка При низкой «Вербальной агрессивности»: В группе участников с низкой вербальной агрессией связь найдена тенденция к отрицательной нелинейной зависимости «Самооценки» от «Вербальной агрессивности». rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним, 95%CI = [-.025; .42]. τ ( 71) = .16, p = .082 . В группе участников с высокой вербальной агрессией связь найдена отрицательная нелинейная зависимость «Самооценки» от «Вербальной агрессивности». Коэффициент корреляции Спирмена rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим, 95%CI = [-.58; -.19]. τ ( 71) = −.28, p = .002 . Для всей группы участников корреляционная связь самооценки с вербальной агрессией не найдена. Корреляционная диаграмма с прямыми регрессии показана на Рис.31. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 378 Рисунок 31. Корреляционная диаграмма (Самооценка – Вербальная агрессивность) с прямыми регрессиями для всех участников, для участников с низкой вербальной агрессией, для участников с высокой вербальной агрессией. Выводы по корреляционному анализу «Самооценка» и «Физическая агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Физической агрессивности» от «Самооценки»: r (73) = -.77; p<.001, 95%CI = [-.85; -.66] - при увеличении «Самооценки» «Физическая агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .74; p<.001, 95%CI = [.61; .83] - - при увеличении «Самооценки» «Физическая агрессивность» увеличивается. Размер эффекта большой. При увеличении «Физической агрессивности», «Самооценка» меняется случайным образом. «Самооценка» и «Косвенная агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Косвенной агрессивности» от «Самооценки»: r (73) = -.70; p<.001, 95%CI = [-.80; -.56] - при увеличении «Самооценки» «Косвенная агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость r (72) = .69; p<.001, 95%CI = [.55; .80] - при увеличении «Самооценки» «Косвенная агрессивность» увеличивается. Размер эффекта большой. При увеличении «Косвенной агрессивности», «Самооценка» меняется случайным образом. «Самооценка» и «Раздражительность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Раздражения» от «Самооценки»: Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 379 r (73) = -.76; p<.001, 95%CI = [-.84; -.64] - при увеличении «Самооценки» «Раздражительность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .53; p<.001, 95%CI = [.34; .68] - при увеличении «Самооценки» «Раздражительность» увеличивается. Размер эффекта большой. Обнаружена тенденция уменьшения «Самооценки» при увеличении «Раздражения»: r(145) = -.15 р = .072, 95%CI = [-.31; .013]. Размер эффекта небольшой «Самооценка» и «Негативизм». В группе подростков с низкой «Самооценкой» обнаружена положительная зависимость «Негативизма» от «Самооценки»: r (73) = .32; p =.005, 95%CI = [.10; -.52] - при увеличении «Самооценки» «Негативизм» увеличивается. Размер эффекта средний. В группе подростков с высокой «Самооценкой» связь не обнаружена: при увеличении «Самооценки» «Негативизм» меняется случайным образом. При увеличении «Негативизма», «Самооценка» меняется случайным образом. «Самооценка» и «Обидчивость». Связь не обнаружена. «Самооценка» и «Подозрительность». Обнаружена положительная связь r(145) = .17; p = .046, 95%CI = [.007; .32]: «Самооценка» и «Подозрительность» согласованно возрастают. Размер эффекта небольшой. «Самооценка» и «Вербальная агрессивность». В группе подростков с низкой «Самооценкой» обнаружена отрицательная зависимость «Вербальной агрессивности» от «Самооценки»: rS (73) = - .54; p<.001, 95%CI = [-.69; -.35] - при увеличении «Самооценки» «Вербальная агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена положительная зависимость: rS (72) = .56; p<.001, 95%CI = [.38; .70] - при увеличении «Самооценки» «Вербальная агрессивность» увеличивается. Размер эффекта большой. В группе участников с низкой «Вербальной агрессией» обнаружена положительная зависимость «Самооценки» от «Вербальной агрессивности»: rS (100) = .30; p = .002, 95%CI = [.11; .47] - чем выше «Вербальная агрессивность», тем выше «Самооценка». Размер эффекта средний. В группе участников с высокой «Вербальной агрессией» обнаружена отрицательная зависимость: rS (45) = - .45; p = .002, 95%CI = [-.66; -.18]. Чем выше «Вербальная агрессивность», тем ниже «Самооценка». Размер эффекта ближе к большому. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 380 «Самооценка» и «Чувство вины». В группе подростков с низкой «Самооценкой» обнаружена положительная зависимость «Чувства вины» от «Самооценки»: r (73) = .23; p =.051, 95%CI = [-.002; .44], τ (73) = .17; p = .049: при увеличении «Самооценки» «Чувство вины» увеличивается. Размер эффекта небольшой, ближе к среднему. В группе подростков с высокой «Самооценкой» связь самооценки с «Чувством вины» не найдена: r (72) = -.14; p = .24, размер эффекта небольшой, 95%CI = [-.36; .095] - при увеличении «Самооценки» «Чувство вины» меняется случайным образом. Коэффициент корреляции Пирсона указывает на статистически незначимую отрицательную зависимость небольшого размера эффекта. При увеличении «Чувства вины» «Самооценка» меняется случайным образом. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 381 Частотный анализ Переход к низким, к высоким и к средним показателям Переход к низким, высоким и средним показателям был осуществлен по выборочным данным. Так как распределение выборочных данных не соответствует нормальному распределению, то разбивка данных на три группы была осуществлена с помощью квартилей Q1 и Q3 . Если баллы выше Q3 , то они были названы «высокими». Если баллы находятся в интервале от Q1 до Q3 , то для самооценки они названы «адекватными», а для других переменных «средними». Если ниже Q1 , то оценки названы «низкими». Из Таблицы В5 (Приложение В) находим, квартили Q1 и Q3 по всем переменным. Разбиение данных осуществлено автоматически, с помощью программы Syntax. Выходные данные частотного анализа с применением критерия «Хи-квадрат» Пирсона показаны в Приложении F (Таблицы F1-F) «Самооценка - Физическая агрессивность» При помощи критерия «Хи-квадрат» Пирсона проверена взаимная независимость переменных таблиц сопряженности. Таким образом, выявлена связь между переменными «Самооценка» и «Физическая агрессивность» (Бююль & Цеффель, 2002)2: Chi-Square (4, N=145) = 66.5, р <.001. Связь иллюстрируется Рис.32-33 и Таблицами F1-F2 Приложения F. Из Рис.32 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с высокой физической агрессией; 2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и средней физической агрессией; 3) Среди подростков с высокой самооценкой больше всего подростков с высокой физической агрессией. Из Рис.33 видно, что 2 Бююль А., Цефель П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Пер. с нем. СПб: ООО «ДиаСофтЮП». Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 382 1) Среди подростков с низкой физической агрессией преобладают подростки с адекватной самооценкой; 2) Среди подростков со средней физической агрессией преобладают подростки с адекватной самооценкой; 3) Среди подростков с высокой физической агрессией преобладают подростки с высокими и низкими самооценками. Рис.32. Распределение участников с высокой, Рис.33. Распределение участников с высокой, средней и низкой физической агрессией по адекватной и низкой самооценкой по физической агрессивности. самооценке. «Самооценка – Косвенная агрессивность» При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными «Самооценка» и «Косвенная агрессивность»: Chi-Square (4) = 65.0, р<.001. Связь иллюстрируется Рис.34-35 и Таблицами F3-F4 Приложения F. Из Рис.34 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с высокой косвенной агрессией; 2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и средней косвенной агрессией; 3) Среди подростков с высокой самооценкой больше всего подростков с высокой косвенной агрессией. Из Рис.35 видно, что Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 383 1) Среди подростков с низкой косвенной агрессией преобладают подростки с адекватной самооценкой; 2) Среди подростков со средней косвенной агрессией преобладают подростки с адекватной самооценкой; 3) Среди подростков с высокой косвенной агрессией преобладают подростки с высокими и низкими самооценками. Рис.34. Распределение участников с высокой, Рис.35. Распределение участников с высокой, средней и низкой косвенной агрессией по адекватной и низкой самооценкой по самооценке. косвенной агрессивности. «Самооценка – Раздражительность» При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными «Самооценка» и «Раздражительность»: Chi-Square (4) = 73.4, р<.001. Связь иллюстрируется Рис.36-37 и Таблицами F5-F6 Приложения F. Из Рис.36 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с высоким Раздражительностьм; 2) Среди подростков с адекватной самооценкой больше всего подростков с низким и средним Раздражительностьм; 3) Среди подростков с высокой самооценкой больше всего подростков с высоким Раздражительностьм. Из Рис.37 видно, что 1) Среди подростков с низким Раздражительностьм преобладают подростки с адекватной самооценкой; Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 384 2) Среди подростков со средним Раздражительностьм преобладают подростки с адекватной самооценкой; 3) Среди подростков с высоким Раздражительностьм преобладают подростки с высокими и низкими самооценками. Рис.36. Распределение участников с высоким, Рис.37. Распределение участников с высокой, средним и низким Раздражительностьм по адекватной и низкой самооценкой по самооценке. раздражению. «Самооценка – Негативизм» При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Негативизм» не выявлена: Chi-Square (4) = 5.26, р = .261, ns. Этот случай иллюстрируется Рис.38-39 и Таблицами F7-F8 Приложения F. Из Рис.38 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с низким негативизмом; 2) Среди подростков с адекватной самооценкой больше всего подростков с низким и высоким негативизмом; 3) Среди подростков с высокой самооценкой больше всего подростков с низким негативизмом. Из Рис.39 видно, что В каждой группе подростков с больше всего подростков с адекватной самооценкой. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 385 Рис.38. Распределение участников с высоким, Рис.39. Распределение участников с высокой, средним и низким негативизмом по самооценке. адекватной и низкой самооценкой по негативизму. Напомним, что в группе участников с высокой самооценкой связь самооценки с негативизмом не найдена. В группе участников с низкой самооценкой связь самооценки с негативизмом монотонная, положительная. Коэффициент корреляции Спирмена rS (73) = .28; p<.05 (Приложение D, Таблица D3). «Самооценка – Обидчивость» При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Обидчивость» не найдена: Chi-Square (4) = 8.46, р = .076, ns. Этот случай иллюстрируется Рис.40-41 и Таблицами F9-F10 Приложения F. Из Рис.40 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с низким уровнем обиды; 2) Среди подростков с адекватной самооценкой больше всего подростков со средним и с высоким уровнем обиды; 3) Среди подростков с высокой самооценкой присутствуют подростки с всеми уровнями обиды примерно в одинаковом количестве. Из Рис.41 видно, что В каждой группе подростков с больше всего подростков с адекватной самооценкой. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 386 Рис.40. Распределение участников с высокой, Рис.41. Распределение участников с высокой, средней и низкой обидой по самооценке. адекватной и низкой самооценкой по обиде. Напомним, что в группах участников с высокой самооценкой и с низкой самооценкой, и во всей группе связь самооценки с обидой не найдена. «Самооценка – Подозрительность» При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Подозрительность»не найдена: Chi-Square (4) = 8.46, р = .076, ns. Этот случай иллюстрируется Рис.42-43 и Таблицами F11-F12 Приложения F. Из Рис.42 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с низким уровнем подозрительности; 2) Среди подростков с адекватной самооценкой в одинаковой степени присутствуют подростки со всеми уровнями подозрительности; 3) Среди подростков с высокой самооценкой больше всего подростков с высоким и с адекватным уровнями подозрительности. Из Рис.43 видно, что В каждой группе подростков с больше всего подростков с адекватной самооценкой. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 387 Рис.42. Распределение участников с высокой, Рис.43. Распределение участников с высокой, средней и низкой Подозрительностью по адекватной и низкой самооценкой по самооценке. подозрительности. С помощью корреляционного анализа связь самооценки с Подозрительностью не найдена. Коэффициент корреляции Спирмена rS (145) = .15 (Таблица D1). «Самооценка – Вербальная агрессивность» При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными «Самооценка» и «Вербальная агрессивность»: Chi-Square (4) = 57.3, р<.001. Найденная связь иллюстрируется Рис.44-45 и Таблицами F13-F14 Приложения F. Из Рис.44 видно: 1) Среди подростков с низкой самооценкой больше всего подростков с высокой вербальной агрессией; 2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и средней вербальной агрессией; 3) Среди подростков с высокой самооценкой больше всего подростков с высокой и средней вербальной агрессией. Из Рис.45 видно, что 1) Среди подростков с низкой вербальной агрессией преобладают подростки с адекватной самооценкой; 2) Среди подростков со средней вербальной агрессией преобладают подростки с адекватной самооценкой; Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 388 3) Среди подростков с высокой вербальной агрессией преобладают подростки с высокими и низкими самооценками. Рис.44. Распределение участников с высокой, Рис.45. Распределение участников с высокой, средней и низкой вербальной агрессией по адекватной и низкой самооценкой по самооценке. вербальной агрессивности. «Самооценка – Чувство вины» При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Чувство вины» не выявлена: Chi-Square (4) = 2.75, р = .601, ns. Этот факт иллюстрируется Рис.46-47 и Таблицами F15-F16 Приложения F. Рис.44. Распределение участников с высоким, Рис.45. Распределение участников с высокой, средним и низким чувством вины по адекватной и низкой самооценкой по уровням самооценке. чувства вины. Очевидно, что различий в распределениях, а, следовательно, и связи между переменными нет. Хотя статистически значимых результатов не выявлено, ситуацию, на уровне выборки, можно описать так: Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 389 1) Среди подростков с низкой самооценкой больше всего подростков с высоким и низким уровнями чувства вины; 2) Среди подростков с адекватной самооценкой больше всего подростков с высоким уровнем чувства вины; 3) Среди подростков с высокой самооценкой больше всего подростков с высоким и низким уровнями чувства вины; 4) Среди подростков с низким уровнем чувства вины больше всего подростков с адекватной самооценкой; 5) Среди подростков с адекватным уровнем чувства вины больше всего подростков с адекватной самооценкой; 6) Среди подростков с высоким уровнем чувства вины больше всего подростков с адекватной самооценкой. Для уточнения можно сравнить процентные доли участников в разных категориях с помощью критерия Фишера ϕ ∗ . Исследование связи путем сравнения процентных долей с помощью критерия Фишера ϕ ∗ С помощью критерия «Угловое преобразование Фишера» - ϕ ∗ сравнивались доли (в процентах) участников по самооценке и агрессивности на основании таблиц сопряженности (Приложение F). Сравнение проводилось с помощью Excel. Результаты сравнения представлены в Приложении Н. Результаты значимы на уровне значимости р < .05, если 1.64 ≤ ϕ ∗ <2.31; Результаты значимы на уровне значимости р < .01, если 2.31 ≤ ϕ ∗ <3.09; Результаты значимы на уровне значимости р < .001, если ϕ ∗ ≥ 3.09. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 390 Выводы из частотного анализа: «Самооценка - Физическая агрессивность» Выявлена связь между переменными «Самооценка» и «Физическая агрессивность»: Chi-Square (4) = 66.5, р<.001. 1) Среди подростков с высокой физической агрессией в одинаковой степени большие доли составляют подростки с высокой и низкой самооценками (р<.001). 2) Среди подростков со средней и низкой физической агрессией преобладает доля подростков с адекватной самооценкой (р<.001). 3) Среди подростков с высокой самооценкой большую долю составляют подростки с высокой физической агрессией, затем со средней физической агрессией (р<.01) и, затем с низкой физической агрессией (р<.001). 4) Среди подростков с адекватной самооценкой большую долю составляют подростки со средней физической агрессией и с низкой физической агрессией (р<.001). 5) Среди подростков с низкой самооценкой доля подростков с высокой физической агрессией больше доли подростков со средней физической агрессией (р<.05) и больше доли подростков с низкой физической агрессией (р<.001). Доля подростков со средней физической агрессией больше доли подростков с низкой физической агрессией (р<.01) «Самооценка – Косвенная агрессивность» Выявлена связь между переменными «Самооценка» и «Косвенная агрессивность»: Chi-Square (4) = 65.0, р<.001. 1) Среди подростков с высокой косвенной агрессией в одинаковой степени большие доли составляют подростки с высокой и низкой самооценками (р<.001). 2) Среди подростков со средней и низкой косвенной агрессией преобладает доля подростков с адекватной самооценкой (р<.001). 3) Среди подростков с высокой самооценкой большую долю составляют подростки с высокой косвенной агрессией, затем со средней косвенной агрессией (р<.01) и, в меньшей степени, с низкой косвенной агрессией (р<.01, р<.001 соответственно). 4) Среди подростков с адекватной самооценкой большую долю составляют подростки со средней косвенной агрессией и с низкой косвенной агрессией (р<.001). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 391 5) Среди подростков с низкой самооценкой доля подростков с высокой косвенной агрессией больше доли подростков со средней косвенной агрессией (р<.01), которая больше доли подростков с низкой косвенной агрессией (р<.01). «Самооценка – Раздражительность» Выявлена связь между переменными «Самооценка» и «Раздражительность»: Chi-Square (4) = 73.4, р <.001. 1) Среди подростков с высоким Раздражительностьм большую долю составляют подростки низкой самооценкой, затем с высокой самооценкой (р<.05), затем с адекватной самооценкой (р<.001). 2) Среди подростков со средним Раздражительностьм преобладает доля подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001). затем с низкой самооценкой (р<.01). 3) Среди подростков с низким Раздражительностьм преобладает доля подростков с адекватной самооценкой (р<.001). 4) Среди подростков с высокой самооценкой большую долю составляют подростки с высоким Раздражительностьм, затем со средним Раздражительностьм (р<.05), затем с низким Раздражительностьм (р<.05). Доля подростков с высоким Раздражительностьм превышает долю подростков с низким Раздражительностьм (р<.001). 5) Среди подростков с адекватной самооценкой большую долю составляют подростки со средним и низким Раздражительностьм (р<.001). 6) Среди подростков с низкой самооценкой доля подростков с высоким Раздражительностьм самая большая (р<.001). «Самооценка – Негативизм» Связь между переменными «Самооценка» и «Негативизм» не найдена: Chi-Square (4) = 5.26, р = .261, ns. 1) Среди подростков с низкой самооценкой подростков с низким негативизмом больше, чем подростков с высоким негативизмом (р<.01). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 392 2) Среди подростков с адекватной самооценкой больше всего подростков с низким и высоким негативизмом, чем со средним негативизмом (р<.05) и (р<.01) соответсвенно. 3) Среди подростков с высокой самооценкой больше всего подростков с низким негативизмом (р<.05). 4) В группе подростков с высоким негативизмом больше всего подростков с адекватной самооценкой (р<.001). 5) В группе подростков со средним негативизмом больше подростков с адекватной самооценкой, чем с высокой самооценкой (р<.05). 6) В группе подростков с низком негативизмом больше подростков с адекватной самооценкой, чем с высокой самооценкой (р<.05). «Самооценка – Обидчивость» При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Обидчивость» не найдена: Chi-Square (4) = 8.46, р = .076, ns. 1) Среди подростков с низкой самооценкой подростков со средним уровнем обиды больше, чем подростков с высоким уровнем обиды (р<.05) и с низким уровнем обиды больше, чем с высоким уровнем обиды (р<.001). 2) Среди подростков с адекватной самооценкой подростков со средним уровнем обиды больше, чем подростков с низким уровнем обиды (р<.05); 3) Среди подростков с высокой самооценкой присутствуют подростки с всеми уровнями обиды примерно в одинаковом количестве. 4) В группе подростков с высокой обидой больше всего подростков с адекватной самооценкой (р<.001). 5) В группе подростков со средним уровнем обиды больше подростков с адекватной самооценкой, чем с высокой самооценкой (р<.001). 6) В группе подростков с низким уровнем обиды доли подростков по самооценке имеют случайные отличия. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 393 «Самооценка – Подозрительность» Связь между переменными «Самооценка» и «Подозрительность» не найдена: Chi-Square (4) = 8.46, р = .076, ns. 1) Среди подростков с низкой самооценкой больше подростков с низким уровнем подозрительности, чем с высоким (р<.05). 2) Среди подростков с адекватной самооценкой в одинаковой степени присутствуют подростки со всеми уровнями подозрительности. 3) Среди подростков с высокой самооценкой подростков с высоким уровнем подозрительности больше, чем с низким уровнем подозрительности (р<.01). 4) В группе подростков с высокой Подозрительностью подростков с адекватной самооценкой больше, чем подростков высоким уровнем самооценки (р<.05), что, в свою очередь, больше, чем с низким уровнем самооценки (р<.05). Доля подростков со средним уровнем самоооценки больше доли с низком уровнем (р<.001). 5) В группе подростков со средним уровнем подозрительности доля подростков с адекватной самооценкой, самая большая (р<.01). 6) В группе подростков с низким уровнем подозрительности доли подростков с адекватной самооценкой больше доли подростков с высокой самооценкой (р<.001). Доля подростков с низкой самооценкой больще доли подростков с высокой самооценкойй (р<.01). «Самооценка – Вербальная агрессивность» Выявлена связь между переменными «Самооценка» и «Вербальная агрессивность»: Chi-Square (4) = 57.3, р<.001. 1) Среди подростков с низкой самооценкой больше всего подростков с высокой вербальной агрессией (р<.001). 2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и средней вербальной агрессией (р<.001). 3) Среди подростков с высокой самооценкой больше всего подростков с высокой и средней вербальной агрессией (р<.001). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 394 4) Среди подростков с низкой вербальной агрессией преобладают подростки с адекватной самооценкой (р<.001). 5) Среди подростков со средней вербальной агрессией самая большая доля подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001), затем с низкой самооценкой (р<.05). 6) Среди подростков с высокой вербальной агрессией преобладают подростки с высокими и низкими самооценками (р<.001). «Самооценка – Чувство вины» Связь между переменными «Самооценка» и «Чувство вины» не выявлена: Chi-Square (4) = 2.75, р = .601, ns. 1) Среди подростков с высоким чувством вины большую долю составляют подростки с адекватной самооценкой (р<.001). 2) Среди подростков со средним уровнем чувством вины большую долю составляют подростки с адекватной самооценкой (р<.05). 3) Среди подростков с низким чувством вины, доли подростков с высокой, средней и адекватной самооценками различаются статистически незначимо. 4) Среди подростков с высокой самооценкой доли подростков с высоким, средним и низким чувством вины различаются статистически незначимо. 5) Среди подростков адекватной самооценкой доля подростков с высоким чувством вины больше доли подростков со средним и низким чувством вины (р<.001). 6) Среди подростков с низкой самооценкой доля подростков с высоким чувством вины больше, чем со средними (р<.05). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 395 Обобщение результатов Статистический анализ данных (корреляционный анализ с коэффициентами корреляции Пирсона, частотный анализ с помощью критерия «Хи-квадрат» Пирсона, сравнение долей с помощью критерия «Угловое преобразование Фишера») показал следующие результаты. 1. Самооценка – Физическая агрессивность Выявлена связь между переменными: Chi-Square (4) = 66.5, р <.001. 1.1. В группе подростков с высокой самооценкой связь самооценки с физической агрессией монотонная, положительная ( rS (72) = 0.70; р<.001). Чем выше самооценка, тем выше физическая агрессивность. Большую долю составляют подростки с высокой физической агрессией, затем со средней физической агрессией (р<.01) и, затем с низкой физической агрессией (р<.001). 1.2. В группе подростков с низкой самооценкой связь самооценки с физической агрессией монотонная, отрицательная ( rS (73) = - .72; р<.001). Чем выше самооценка, тем ниже физическая агрессивность. Доля подростков с высокой физической агрессией больше доли подростков со средней физической агрессией (р<.05) и больше доли подростков с низкой физической агрессией (р<.001). 1.3. Среди подростков с адекватной самооценкой большую долю составляют подростки со средней и с низкой физической агрессией (р<.001). 1.4. Среди подростков с высокой физической агрессией в одинаковой степени большие доли составляют подростки с высокой и низкой самооценками (р<.001). 1.5. Среди подростков со средней и с низкой физической агрессией доля подростков с адекватной самооценкой самая большая (р<.001). 2. Самооценка – Косвенная агрессивность Выявлена связь между переменными: Chi-Square (4) = 65.0, р<.001. 2.1. В группе подростков с высокой самооценкой связь самооценки с косвенной агрессией монотонная, положительная ( rS (72) = .69; р<.001). Чем выше самооценка, тем выше косвенная агрессивность. Большую долю составляют подростки с высокой косвенной Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 396 агрессией, затем со средней косвенной агрессией (р<.01) и, в меньшей степени, с низкой косвенной агрессией (р<.01, р<.001 соответственно). 2.2. В группе подростков с низкой самооценкой связь самооценки с косвенной агрессией монотонная, отрицательная ( rS (73) = - .68, р<.001). Чем выше самооценка, тем ниже косвенная агрессивность. Доля подростков с высокой косвенной агрессией больше доли подростков со средней косвенной агрессией (р<.01), которая больше доли подростков с низкой косвенной агрессией (р<.01). 2.3. Среди подростков с адекватной самооценкой большую долю составляют подростки со средней и с низкой косвенной агрессией (р<.001). 2.4. Среди подростков с высокой косвенной агрессией в одинаковой степени большие доли составляют подростки с высокой и низкой самооценками (р<.001). 2.5. Среди подростков со средней и низкой косвенной агрессией преобладает доля подростков с адекватной самооценкой (р<.001). 3. Самооценка – Раздражительность Выявлена связь между переменными: Chi-Square (4) = 73.4, р<.001. 3.1. В группе подростков с высокой самооценкой связь самооценки с Раздражительностьм монотонная, положительная ( rS (72) = .52, р<.001). Чем выше самооценка, тем выше Раздражительность. Большую долю составляют подростки с высоким Раздражительностьм, затем со средним Раздражительностьм (р<.05), затем с низким Раздражительностьм (р<.05). Доля подростков с высоким Раздражительностьм превышает долю подростков с низким Раздражительностьм (р<.001). 3.2. В группе подростков с низкой самооценкой связь самооценки с Раздражительностьм монотонная, отрицательная ( rS (73) = - .77, р<.001). Чем выше самооценка, тем ниже Раздражительность. Доля подростков с высоким Раздражительностьм самая большая (р<.001). 3.3. Среди подростков с высоким Раздражительностьм большую долю составляют подростки низкой самооценкой, затем с высокой самооценкой (р<.05), затем с адекватной самооценкой (р<.001). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 397 3.4. Среди подростков со средним Раздражительностьм преобладает доля подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001). затем с низкой самооценкой (р<.01). 3.5. Среди подростков с адекватной самооценкой большую долю составляют подростки со средним и низким Раздражительностьм (р<.001). 4. Самооценка – Негативизм 4.1. В группе подростков с высокой самооценкой связь самооценки с негативизмом не найдена. При увеличении самооценки негативизм меняется случайным образом. Среди подростков с высокой самооценкой больше всего подростков с низким негативизмом (р≤0.05). 4.2. В группе подростков с низкой самооценкой связь самооценки с негативизмом монотонная, положительная ( rS (73) = .28, р<.05).Чем выше самооценка, тем выше негативизм. Доля подростков с низким негативизмом больше, чем подростков с высоким негативизмом (р<.01). 4.3. Среди подростков с адекватной самооценкой больше всего подростков с низким и высоким негативизмом, чем со средним негативизмом (р<.05) и (р<.01) соответсвенно. 4.4. В группе подростков с высоким негативизмом больше всего подростков с адекватной самооценкой (р<.001). 4.5. В группе подростков со средним негативизмом больше подростков с адекватной самооценкой, чем с высокой самооценкой (р<.05). 4.6. В группе подростков с низким негативизмом больше доля подростков с адекватной самооценкой, чем с высокой самооценкой (р<.05). 5. Самооценка – Обидчивость Корреляционная связь самооценки с обидой не найдена. При помощи критерия «Хиквадрат» Пирсона связь между переменными «Самооценка» и «Обидчивость» не найдена. Сравнение долей показало: 5.1. Среди подростков с низкой самооценкой доля подростков с низким уровнем обиды больше, чем с высоким уровнем обиды (р<.001). Доля подростков со средним уровнем обиды больше, чем доля подростков с высоким уровнем обиды (р<.05). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 398 5.2. Среди подростков с адекватной самооценкой подростков со средним уровнем обиды больше, чем подростков с низким уровнем обиды (р<.05). 5.3. Среди подростков с высокой самооценкой присутствуют подростки с всеми уровнями обиды примерно в одинаковом количестве. 5.4. В группе подростков с высокой обидой больше всего доля подростков с адекватной самооценкой (р<.001). 5.5. В группе подростков со средним уровнем обиды больше доля подростков с адекватной самооценкой, чем с высокой самооценкой (р<.001). 5.6. В группе подростков с низким уровнем обиды доли подростков по самооценке имеют случайные отличия. 6. Самооценка – Подозрительность Корреляционная связь самооценки с Подозрительностью, найденая с помощью ркгрессионного анализа, линейная, положительная. Коэффициент корреляции Пирсона r (145) = .17 , p<.05. Использование коэффициента корреляции Пирсона возможно при наличии удовлетворительной интерпретации этой связи. По обеим переменным отсутствуют «выбросы» (Рис.2-3), асимметрия по переменной «Самооценка» по абсолютной величине не превышает свою стандартную ошибку, по переменной «Подозрительность» положительная асимметрия хоть и превышает свою стандартную ошибку, но не является очень большой (Таблица В1, Приложение В). Таким образом, при наличии интерпретации, можно считать, что самооценка и Подозрительность у подростков согласованно возрастают. При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка» и «Подозрительность» не найдена. Сравнение долей показало: 6.1. Среди подростков с низкой самооценкой больше доля подростков с низким уровнем подозрительности, чем с высоким (р<.05). 6.2. Среди подростков с адекватной самооценкой в одинаковой степени присутствуют подростки со всеми уровнями подозрительности. 6.3. Среди подростков с высокой самооценкой доля подростков с высоким уровнем подозрительности больше, чем с низким уровнем подозрительности (р<.01). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 399 6.4. В группе подростков с высокой Подозрительностью подростков с адекватной самооценкой больше, чем подростков высоким уровнем самооценки (р<.05), что, в свою очередь, больше, чем с низким уровнем самооценки (р<.05). Доля подростков с адекватным уровнем самоооценки больше доли с низком уровнем (р<.001). 6.5. В группе подростков со средним уровнем подозрительности доля подростков с адекватной самооценкой, самая большая (р<.01). 6.6. В группе подростков с низким уровнем подозрительности доли подростков с адекватной самооценкой больше доли подростков с высокой самооценкой (р<.001). Доля подростков с низкой самооценкой больше доли подростков с высокой самооценкой (р<.01). Таким образом, можно считать, что из сравнения долей также следует, что самооценка и Подозрительность у подростков согласованно возрастают. 7. Самооценка – Вербальная агрессивность Выявлена связь между переменными: Chi-Square (4) = 57.3, р<.001. 7.1. В группе подростков с высокой самооценкой связь самооценки с вербальной агрессией монотонная, положительная ( rS (72) = .56; p<.001). Чем выше самооценка, тем выше вербальная агрессивность. Больше всего доли подростков с высокой и средней вербальной агрессией (р<.001). 7.2. В группе подростков с низкой самооценкой связь самооценки с вербальной агрессией монотонная, отрицательная ( rS (73) = - .54; p<.001). Чем выше самооценка, тем ниже вербальная агрессивность. Больше всего доля подростков с высокой вербальной агрессией (р<.001). 7.3. Среди подростков с адекватной самооценкой больше всего доли подростков с низкой и средней вербальной агрессией (р<.001). 7.4. В группе подростков с высокой вербальной агрессией связь самооценки с вербальной агрессией монотонная отрицательная ( rS (45) = - .45; p<.01). Чем выше вербальная агрессивность, тем ниже самооценка. Самые большие доли подростков с высокими и низкими самооценками (р<.001). 7.5. В группе подростков с низкой вербальной агрессией связь самооценки с вербальной агрессией монотонная, положительная. ( rS (100) = .30; p<.01). Чем выше Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 400 вербальная агрессивность, тем выше самооценка. Самую большую долю составляют подростки с адекватной самооценкой (р<.001). 7.6. Среди подростков со средней вербальной агрессией самая большая доля подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001), затем с низкой самооценкой (р<.05). 8. Самооценка – Чувство вины Корреляционная связь самооценки с переменной «Чувство вины» не найдена. При помощи критерия «Хи-квадрат» Пирсона связь между переменными также не найдена. Сравнение долей показало: 8.1. В группе подростков с высокой самооценкой корреляционная связь самооценки с «чувством вины» не найдена. Доли подростков с высоким, средним и низким чувством вины различаются статистически незначимо. 8.2. В группе подростков с низкой самооценкой найдена положительная монотонная связь самооценки с чувством вины (р<.05). Доля подростков с высоким чувством вины больше, чем со средними (р<.05). 8.3. Среди подростков адекватной самооценкой доля подростков с высоким чувством вины больше доли подростков со средним и низким чувством вины (р<.001). 8.4. Среди подростков с высоким чувством вины большую долю составляют подростки с адекватной самооценкой (р<.001). 8.5. Среди подростков со средним уровнем чувства вины большую долю составляют подростки с адекватной самооценкой (р<.05). 8.6. Среди подростков с низким чувством вины, доли подростков с высокой, средней и адекватной самооценками различаются статистически незначимо. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 401 Литература Наследов Данные, обработанные в соответствии с ключами методик Дембо-Рубинштейна (Под ред. Корниловой, 2008) и Басса-Дарки (Батаршев, 2005, сс. 195-200) приведены в Таблице А1 (Приложение А). В настоящей работе приняты обозначения, используемые в таблицах и рисунках (“Questionnaire Bass-Darky”, n. d.; Buss & Durkee, 1957; Bakholdina, Bakholdina, Movsesiana, & Stupina, 2014.). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 402 Приложение А Исходные данные Таблица А1. Показатели агрессивности и самооценки Code 94 139 96 140 66 77 110 114 134 71 88 101 109 115 116 120 122 125 129 130 135 138 142 144 75 97 100 102 103 104 119 141 68 76 79 83 98 106 107 126 128 131 132 133 137 SE PhA IA I N R S VA G 62 61 66 55 63 51 66 62 55 54 70 69 54 62 66 59 56 59 62 60 54 70 54 61 66 71 47 58 59 66 64 61 74 74 74 70,16 71 70 61 65 63 59 55 60 64 1 2 5 2 1 2 2 4 3 3 2 2 4 2 4 2 2 2 4 5 2 3 2 4 3 2 2 3 3 4 5 2 4 2 2 2 3 2 3 4 3 4 2 5 2 4 3 2 6 3 2 1 1 4 4 5 3 4 4 2 2 4 3 2 3 4 2 4 2 3 5 5 2 2 3 2 5 3 2 1 3 2 6 2 5 5 5 2 3 1 2 4 1 6 4 5 4 2 4 2 5 5 4 4 4 6 5 2 3 3 3 2 5 2 5 5 5 3 2 4 1 5 2 4 4 5 5 5 5 6 4 6 4 4 5 4 5 5 1 4 1 5 5 2 3 2 4 4 2 2 3 4 2 2 5 2 5 3 4 3 4 5 4 1 2 5 5 4 2 2 3 4 1 4 3 3 3 2 5 5 3 2 2 5 2 4 3 3 2 5 4 5 3 3 1 1 5 1 3 5 2 5 2 4 3 2 6 3 3 4 5 2 1 4 2 6 2 5 4 2 5 4 2 4 5 2 4 2 4 2 4 3 5 5 3 3 4 3 2 2 5 3 5 5 5 3 2 2 5 4 2 2 5 5 2 2 5 4 5 5 2 5 5 4 2 5 2 2 4 5 5 2 2 1 4 2 3 3 3 5 3 3 2 4 2 2 3 6 3 2 5 5 3 5 3 4 4 5 6 3 5 5 6 6 6 5 4 5 4 2 5 2 6 3 6 5 5 5 7 5 2 9 2 1 5 4 4 2 1 5 5 5 2 4 2 5 2 5 2 5 1 1 2 5 5 2 5 7 2 9 8 2 5 4 4 6 6 3 4 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 403 145 33 62 63 65 69 70 74 78 82 85 87 91 95 99 108 143 64 81 89 93 111 112 118 127 61 67 72 73 80 105 113 117 123 124 90 92 136 84 86 121 12 2 3 4 7 8 23 26 34 1 9 10 71 35 72 58 49 51 74 74 70 65 52 59 63 70 71 60 70 62 70 65 70 70 47 61 62 61 70 74 68 55 66 70 71 57 58 62 60 71 63 54 55 88 85 77 91 66 80 78 80 43 81 80 83 5 6 4 4 2 3 3 4 4 2 5 2 1 6 5 2 2 4 3 4 5 5 4 4 5 5 2 4 5 5 3 4 4 5 4 6 6 5 5 6 4 7 8 9 7 8 8 9 7 8 9 9 7 2 8 5 5 2 6 5 3 3 1 5 5 1 3 3 6 1 2 1 4 2 2 2 4 2 5 5 2 2 2 2 4 4 3 2 1 2 2 1 5 6 6 7 8 7 7 8 7 8 7 7 8 8 4 6 2 5 5 4 6 2 4 6 2 5 6 5 2 5 5 5 5 4 4 5 5 4 4 4 6 6 4 5 5 5 6 5 5 5 5 6 8 7 6 5 6 4 5 5 6 5 8 7 5 7 7 3 3 5 5 3 3 2 5 2 2 4 3 2 5 2 2 5 2 3 3 2 2 3 2 3 4 4 3 5 3 2 4 3 5 4 3 2 4 4 2 2 3 3 4 5 1 2 2 3 2 3 3 1 2 2 6 4 2 3 3 5 4 1 3 3 3 1 5 2 5 8 5 3 5 5 2 2 1 5 4 5 4 6 4 3 3 6 8 5 5 4 4 5 4 5 4 3 3 4 3 8 4 4 5 3 3 5 4 4 4 4 2 4 8 3 3 2 5 4 9 5 4 2 2 2 5 3 5 2 2 2 3 5 3 2 4 5 5 2 5 3 2 5 2 4 4 5 3 2 4 5 1 5 2 5 4 5 3 6 3 1 7 4 6 6 4 7 5 5 6 6 6 2 6 6 6 5 6 6 5 4 5 6 5 6 7 5 6 5 7 6 5 5 6 5 5 5 4 4 7 6 5 6 7 7 6 6 5 5 7 5 7 5 2 5 4 8 6 4 4 6 7 1 7 2 5 5 4 4 6 4 6 6 2 2 5 4 4 4 5 4 5 6 1 2 5 4 5 5 4 1 5 5 6 6 2 2 5 4 2 2 5 4 4 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 404 13 18 20 24 29 31 38 11 16 21 22 30 32 35 47 48 55 5 14 27 36 37 40 44 56 58 17 25 28 39 41 42 43 53 54 57 60 15 19 46 49 50 51 45 52 59 6 77 80 83 82 83 45 44 84 82 92 75 79 31 41 38 49 42 79 78 87 43 42 31 43 43 44 79 75 84 36 42 51 41 40 41 42 43 88 81 43 43 42 41 42 42 41 85 9 8 7 9 9 8 9 8 7 7 8 8 9 7 7 8 7 9 10 8 9 8 9 7 8 7 8 9 9 7 9 8 8 8 8 9 8 9 9 9 9 8 8 8 9 9 10 7 5 4 9 7 7 8 7 9 8 9 8 7 8 4 5 8 8 5 7 6 7 8 5 8 5 4 8 5 8 7 6 7 7 9 7 8 8 5 9 1 4 8 8 9 7 6 5 5 7 7 7 8 7 8 7 8 9 8 9 8 7 7 8 8 6 9 9 7 7 7 7 7 8 8 8 8 8 9 8 8 9 7 8 9 9 8 7 8 9 9 9 8 9 2 2 2 2 5 4 3 1 3 4 1 2 4 2 1 1 1 1 2 3 1 4 3 1 3 2 5 1 1 1 2 4 3 2 3 3 1 3 2 1 2 2 3 3 2 4 5 2 2 5 2 2 2 6 1 2 3 4 4 4 2 5 2 3 4 4 2 2 3 4 3 5 1 1 3 3 1 1 5 4 2 2 1 2 4 2 5 4 5 2 5 5 5 4 5 2 2 2 3 4 2 3 2 2 4 4 5 2 3 5 5 5 4 3 2 6 4 2 8 5 2 2 5 4 2 2 5 3 3 8 2 2 2 5 3 5 6 2 7 8 7 5 5 5 5 6 8 7 5 6 4 7 8 7 7 6 7 6 5 8 7 9 8 9 8 7 7 9 7 7 8 8 7 8 8 7 7 8 9 9 8 9 8 9 8 5 8 2 2 6 5 4 4 2 2 7 5 6 3 5 2 5 4 4 5 6 4 5 5 7 5 4 5 3 2 1 3 4 5 4 4 5 2 2 1 5 1 2 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 405 Приложение В Описательные статистики В Таблицах В1-В3 отмечены случаи, когда показатели асимметрии и эксцесса по абсолютной величине превосходят свои стандартные ошибки. В этих случаях распределение данных отличается от нормального распределения. Таблица В1. 145 145 62.30 5.36 4.70 5.56 2.89 3.41 3.66 5.50 3.99 1.19 0.22 0.20 0.17 0.11 0.13 0.12 0.16 0.16 Median 62.33 5.00 5.00 5.00 3.00 3.00 4.00 6.00 4.00 Std. Deviation 14.27 2.66 2.42 2.06 1.28 1.58 1.50 1.88 1.94 Skewness, S -0.14 0.04 0.14 -0.12 0.17 0.31 0.64 -0.26 -0.04 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 -0.77 -1.38 -1.26 -0.64 -0.89 -0.02 0.52 -0.40 -0.32 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 Range 60.34 10.00 8.00 8.00 5.00 8.00 8.00 8.00 9.00 Minimum 31.16 0.00 1.00 1.00 0.00 0.00 1.00 1.00 0.00 Maximum 91.50 10.00 9.00 9.00 5.00 8.00 9.00 9.00 9.00 25 52.91 3.00 2.00 4.00 2.00 2.00 2.00 4.50 2.00 50 62.33 5.00 5.00 5.00 3.00 3.00 4.00 6.00 4.00 75 71.58 8.00 7.00 7.00 4.00 5.00 5.00 7.00 5.00 Mean Std. Error of Mean Std. Error of Skewness Kurtosis, K Std. Error of Kurtosis Percentiles Guilt 145 Verbal 145 Distrust 145 Missing Aggression Suspicion and Resentment Irritation 145 Negativism Aggression 145 Indirect 145 Valid Physical 145 N Aggression Self-Esteem Описательные статистики Замечание. В Таблице В1 отмечены случаи, когда показатели асимметрии S и эксцесса K превосходят свои стандартные ошибки (SES и SEK соответственно), умноженные на 1.96: 1.96 ⋅ SES = 0.39 , 1.96 ⋅ SES = 0.78 . В этих случаях соответствующие показатели считаются большими. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 406 Таблица В2 Описательные статистики для участников с самооценкой ниже медианы N Valid Missing Mean Median Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum SelfEsteem 73 50.8 53.8 8.96 -.30 .28 -1.19 .56 31.0 31.0 62.0 Physical Indirect Irritation Aggression Aggression 73 73 73 5.30 4.78 5.62 5.00 5.00 5.00 2.64 2.39 2.21 -.05 .079 -.243 .28 .28 .28 -1.34 -1.25 -.75 .56 .56 .56 9.00 8 8 0.000 1 1 9.00 9 9 Negativism 73 2.93 3.00 1.26 .047 .28 -.74 .56 5 5 Verbal Aggression 73 5.58 5.00 2.121 -.103 .28 -.81 .56 8 1 9 Guilt 73 3.89 4.00 1.87 -0.97 .28 -0.26 .56 9.00 0.000 9.00 a. Self-Esteem = Low Таблица В3 Описательные статистики для участников с самооценкой выше медианы N Valid Missing Mean Median Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum SelfEsteem 72 74.0 71.6 7.55 .43 .28 -.71 .56 29.0 63.0 92.0 Physical Indirect Irritation Aggression Aggression 72 72 72 5.42 4.61 5.50 5.00 4.00 5.00 2.70 2.45 1.91 .13 .21 .038 .28 .28 .28 -1.45 -1.26 -.48 .56 .56 .56 9.00 8.00 7.00 1.00 1.00 2.00 10.0 9.00 9.00 Negativism 72 2.85 3.00 1.30 .29 .28 -.99 .56 4.00 1.00 5.00 Verbal Guilt Aggression 72 72 5.43 4.08 6.00 4.00 1.61 2.01 -0.72 -0.021 0.28 .28 0.11 -0.35 0.56 .56 7.00 9.00 1.00 0.000 8.00 9.00 a. Self-Esteem = High Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 407 Таблица B4 Описательные статистики для участников с низкой и с высокой вербальной агрессией Verbal Aggression low Verbal Aggression high SelfEsteem 71 Verbal Aggression 71 SelfEsteem 74 Verbal Aggression 74 Mean 62.06 3.96 62.53 6.99 Median 62.16 4.00 65.58 7.00 Std. Deviation 10.57 1.22 17.16 0.99 Skewness N Valid Missing -0.42 -0.78 -0.09 0.64 Std. Error of Skewness 0.28 0.28 0.28 0.28 Kurtosis 0.66 -0.70 -1.39 -0.65 Std. Error of Kurtosis 0.56 0.56 0.55 0.55 Range 53.50 4.00 60.34 3.00 Minimum 31.33 1.00 31.16 6.00 Maximum 84.83 5.00 91.50 9.00 1.96*SES 0.56 0.56 0.55 0.55 1.96*SEK 1.10 1.10 1.08 1.08 Таблица В5 2.00 2.00 4.50 2.00 Q3 71.6 8.00 7.00 7.00 4.00 5.00 5.00 7.00 5.00 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 Guilt Suspicion 2.00 Aggression Resentment 4.00 Verbal Negativism 2.00 Aggression 3.00 Indirect 52.9 Aggression Q1 Physical Irritation Self-Esteem Квартили Q1 и Q3 408 Приложение С Проверка нормальности распределения данных В Таблице С1 показана проверка нормальности распределения данных для шкал агрессивности и самооценки c использованием трех тестов: асимметрии, эксцесса и D'Agostino-Pearson Omnibus Test со статистикой DP. Указаны случаи, в которых найдено статистически значимое отличие распределения данных от нормального распределения (“no”). В остальных случаях отличия от нормального распределения не выявлено. Таблица С1 Проверка нормальности распределения с помощью асимметрии, эксцесса и D'AgostinoPearson Omnibus Test Variables Self-Esteem Physical Aggression Indirect Aggression Irritation Negativism Resentment Suspicion Verbal Aggression Guilt S -0.14 0.04 0.14 -0.12 0.17 0.31 0.64 -0.26 -0.04 SES 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20 K -0.77 -1.38 -1.26 -0.64 -0.89 -0.02 0.52 -0.40 -0.32 SEK 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 0.40 Z(S) 0.68 0.21 0.71 0.60 0.84 1.52 3.20 1.29 0.22 Z(K) 1.91 3.45 3.14 1.60 2.23 0.04 1.29 1.01 0.80 DP 4.13 11.93 10.39 2.92 5.70 2.31 11.91 2.69 0.70 p .13 .003 .006 .23 .058 .31 .003 .26 .71 ND no no no Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 409 Таблица.С2 Результаты проверки соответствия распределения данных нормальному распределению по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino- SE PhA IA I N R S VA G Kolmogorov-Smirnov Shapiro-Wilk Statistic df Sig. Statistic df 0.08 145 .012 0.98 145 .009 0.16 145 .000 0.91 145 .000 0.14 145 .000 0.92 145 .000 0.15 145 .000 0.95 145 .000 0.18 145 .000 0.92 145 .000 0.14 145 .000 0.94 145 .000 0.19 145 .000 0.87 145 .000 0.15 145 .000 0.96 145 .000 0.17 145 .000 0.94 145 .000 Z(S) Z(K) DP p Normal Distribution Variables Pearson Omnibus Test 0.68 0.21 0.71 0.60 0.84 1.52 3.20 1.29 0.22 1.91 3.45 3.14 1.60 2.23 0.04 1.29 1.01 0.80 4.13 11.93 10.39 2.92 5.70 2.31 11.91 2.69 0.70 .13 .003 .006 .23 .058 .31 .003 .26 .71 no no no no no no no no no Sig. Замечание. Lilliefors Significance Correction Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Случаи значимого отличия распределения от нормального в таблице выделены. Таблица С3. Выбор коэффициентов корреляции SE SE SE SE SE SE SE SE Переменные и нормальное распределение X Y нет нет PhA нет нет IA нет нет I нет нет N нет нет R нет нет S нет нет VA нет нет G Коэффициенты корреляции Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла На рис. С1-С9 приведены гистограммы с нормальной кривой, позволяющие визуально сравнить эмпирическое распределение данных с нормальным распределением. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 410 Рисунок C1. Гистограмма с нормальной кривой. Cамооценка. Рисунок C2. Гистограмма с нормальной кривой. Физическая агрессивность. Рисунок C3. Гистограмма с нормальной кривой. Косвенная агрессивность. Рисунок C4. Гистограмма с нормальной кривой. Негативизм. Рисунок C5. Гистограмма с нормальной кривой. Раздражительность. Рисунок C6. Гистограмма с нормальной кривой. Обидчивость. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 411 Рисунок C7. Гистограмма с нормальной кривой. Подозрительность. Рисунок C8. Гистограмма с нормальной кривой. Вербальная агрессивность. Рисунок C9. Гистограмма с нормальной кривой. Чувство вины. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 412 Таблица С4 Проверка нормальности распределения с помощью асимметрии, эксцесса и D'Agostino- Self-Esteem above Mdn Self-Esteem below Mdn Groups Pearson Omnibus Test. Группы участников с самооценкой выше или ниже медианы Variables S SES Z(K) DP p ND Self-Esteem -0.30 0.28 -1.19 0.56 Physical Aggression -0.05 0.28 -1.34 0.56 1.05 2.14 5.68 0.058 no Indirect Aggression 0.08 0.28 -1.25 0.56 0.19 2.41 5.84 0.054 no 0.28 2.25 5.16 0.076 -0.24 0.28 -0.75 no 0.56 0.05 0.28 0.87 1.35 2.57 0.28 -0.74 0.56 Verbal Aggression -0.10 0.17 1.33 1.80 0.41 0.28 -0.81 0.56 Guilt 0.37 1.46 2.26 0.32 -0.10 0.28 -0.26 0.56 0.34 0.46 0.33 0.85 Self-Esteem .434 .283 -.709 .559 1.53 1.27 3.96 0.138 no Physical Aggression .132 .283 -1.452 .559 0.47 2.60 6.97 0.031 no Indirect Aggression .213 .283 -1.255 .559 0.75 2.25 5.61 0.061 Irritation .038 .283 -.479 .559 0.13 0.86 0.75 0.69 Negativism .292 .283 -.987 .559 1.03 1.77 4.19 0.12 Verbal Aggression -.717 .283 .106 .559 2.54 0.19 6.46 0.039 Guilt -.021 .283 -.354 .559 0.073 0.63 0.41 0.82 Irritation Negativism K SEK Z(S) no Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 413 Таблица.С5 Результаты проверки соответствия распределения данных нормальному распределению по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino- Self-Esteem above Mdn Self-Esteem below Mdn Variables Groups Kolmogorov-Smirnov SE PhA IA I N VA G SE PhA IA I N VA G Shapiro-Wilk Z(S) Statistic df Z(K) DP p Sig. Normal Distribution Pearson Omnibus Test. Группы участников с самооценкой выше или ниже медианы Statistic df Sig. 0.08 145 .012 0.98 145 .009 1.05 2.14 5.68 0.058 no 0.16 145 .000 0.91 145 .000 0.19 2.41 5.84 0.054 no 0.14 145 .000 0.92 145 .000 0.28 2.25 5.16 0.076 0.15 145 .000 0.95 145 .000 0.87 1.35 2.57 0.28 no no 0.18 145 .000 0.92 145 .000 0.17 1.33 1.80 0.41 no 0.15 145 .000 0.96 145 .000 0.37 1.46 2.26 0.32 no 0.17 0.08 145 145 .000 .012 0.94 0.98 145 145 .000 .009 0.34 0.46 0.33 0.85 no 1.53 1.27 3.96 0.138 no 0.16 145 .000 0.91 145 .000 0.47 2.60 6.97 0.031 no 0.14 145 .000 0.92 145 .000 0.75 2.25 5.61 0.061 no 0.15 145 .000 0.95 145 .000 0.13 0.86 0.75 0.69 no 0.18 145 .000 0.92 145 .000 1.77 145 .000 0.96 145 .000 0.19 4.19 6.46 0.12 0.039 no 0.15 1.03 2.54 0.17 145 .000 0.94 145 .000 0.073 0.63 0.41 0.82 no no Замечание. Lilliefors Significance Correction Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Таблица С6. Выбор коэффициентов корреляции для группы с самооценкой ниже медианы SE SE SE SE SE Переменные и нормальное распределение X Y нет PhA нет IA нет I нет N нет VA Коэффициенты корреляции нет нет нет нет нет Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 414 Таблица С7. Выбор коэффициентов корреляции для группы с самооценкой выше медианы SE SE SE SE SE Переменные и нормальное распределение X Y нет PhA нет IA нет I нет N нет VA Коэффициенты корреляции нет нет нет нет нет Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ Спирмена, τ -Кендалла -Кендалла -Кендалла -Кендалла -Кендалла На рис. С10-С16 приведены гистограммы с нормальной кривой, позволяющие визуально сравнить эмпирическое распределение данных с нормальным распределением. Рисунок С10. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Самооценка. Рисунок С11. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Физическая агрессивность. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 415 Рисунок С12. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Косвенная агрессивность. Рисунок С13. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Раздражительность. Рисунок С14. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Негативизм. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 416 Рисунок С15. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Вербальная агрессивность. Рисунок С16. Гистограммы с нормальной кривой. Группы с низкой и высокой самооценкой. Чувство вины. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 417 Таблица С8 Проверка нормальности распределения с помощью асимметрии, эксцесса и D'Agostino- VA VA above Mdn Mdn Groups Pearson Omnibus Test. Группы участников с вербальной агрессией выше или ниже медианы Variables S SES K SEK Z(S) Z(K) DP p ND Self-Esteem -0.25 0.24 0.43 0.48 1.05 0.90 1.90 0.39 Verbal Aggression -0.81 0.24 -0.37 0.48 3.36 0.78 11.89 0.003 no Self-Esteem 0.32 0.35 -1.65 0.69 0.92 2.37 6.46 0.040 no Verbal Aggression 0.76 0.35 -0.79 0.69 2.14 1.13 5.86 0.054 no Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Таблица.С9 Результаты проверки соответствия распределения данных нормальному распределению по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino- VA VA above below Mdn Mdn Variables Groups Kolmogorov-Smirnov SE VA SE VA Statistic df Sig. .063 .267 .266 .331 100 100 45 45 .200(*) .000 .000 .000 Shapiro-Wilk Statistic df .985 .854 .835 .743 100 100 45 45 DP p Z(S) Z(K) 1.05 0.90 1.90 0.39 3.36 0.78 2.37 11.89 0.003 no 6.46 0.040 no 1.13 5.86 0.054 no Sig. .334 .000 .000 .000 Normal Distribution Pearson Omnibus Test. Группы участников с вербальной агрессией выше или ниже медианы 0.92 2.14 Замечание. Lilliefors Significance Correction Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 418 На Рис.С17-С18 изображены гистограммы с нормальной кривой для визуального сравнения с нормальным распределением. Рисунок С17. Гистограммы с нормальной кривой. Группы с низкой и высокой вербальной агрессией. Вербальная агрессивность. Рисунок С18. Гистограммы с нормальной кривой. Группы с низкой и высокой вербальной агрессией. Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 419 Приложение D Корреляционный анализ Таблица D1 Коэффициенты ранговой корреляции Спирмена для всей выборки Таблица D2 Коэффициенты ранговой корреляции τ -Кендалла для всей выборки Таблица D3 Коэффициенты корреляции Пирсона для всей выборки Таблица D4 Correlation Coefficient Spearman's rho SelfEsteem Sig. (2-tailed) N Guilt N Verbal Aggression Sig. (2-tailed) Negativism SelfEsteem Irritation Kendall's tau_b Indirect Aggression Correlation Coefficient Physical Aggression Коэффициенты ранговой корреляции Спирмена и τ-Кендалла для участников с самооценкой ниже медианы -.520** -.513** -.584** .202* -.389** .171* .000 .000 .000 .022 .000 .049 73 73 73 73 73 73 -.724** -.681** -.765** .276* -.537** .229 .000 .000 .000 .018 .000 .052 73 73 73 73 73 73 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). a. Self-Esteem = Low Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 420 Таблица D5 Irritation Negativism Verbal Aggression Guilt SelfEsteem Indirect Aggression Kendall's tau_b Physical Aggression Коэффициенты корреляции τ-Кендалла и Спирмена для участников с самооценкой ниже медианы Correlation Coefficient .485** .496** .380** -.042 .427** -.085 Sig. (2-tailed) .000 .000 .000 .635 .000 .330 72 72 72 72 72 72 Correlation Coefficient .701** .686** .522** -.058 .555** -.114 Sig. (2-tailed) .000 .000 .000 .631 .000 .342 72 72 72 72 72 72 N Spearman's rho SelfEsteem N **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). a. Self-Esteem = High Таблица D6 Physical Aggression Indirect Aggression Irritation Negativism Verbal Aggression Guilt Self-Esteem Коэффициенты корреляции Пирсона -.772** -.699** -.757** .324** -.531** .229 .000 .000 .000 .005 .000 .051 73 73 73 73 73 73 Pearson Correlation .735** .691** .531** -.081 .565** -.140 Sig. (2-tailed) .000 .000 .000 .500 .000 .241 72 72 72 72 72 Low Pearson Correlation SelfEsteem Sig. (2-tailed) High N SelfEsteem N 72 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 421 Приложение Е Выбор нелинейной регрессионной модели Таблица Е1 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка - Физическая агрессивность Dependent Variable:Physical Aggression Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .001 .121 1 143 .728 5.697 -.005 Quadratic .502 71.538 2 142 .000 35.817 -1.044 .008 Cubic .502 47.363 3 141 .000 36.821 -1.097 .009 b3 -4.797E-6 The independent variable is Self-Esteem. Таблица Е2 Описание модели и параметры оценок (Model Summary and Parameter Estimates) Физическая агрессивность - Самооценка Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .001 .121 1 143 .728 63.137 -.156 Quadratic .002 .128 2 142 .880 64.894 -1.010 .079 Cubic .019 .921 3 141 .432 53.761 8.314 -2.007 b3 .133 The independent variable is Physical Aggression. Рисунок Е1. Корреляционная диаграмма с линиями линейной, квадратической и кубической регрессии. Самооценка физическая агрессивность. Рисунок Е2. Корреляционная диаграмма с линиями линейной, квадратической и кубической регрессии. Физическая агрессивность - самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 422 Таблица E3 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Косвенная агрессивность Dependent Variable:Indirect Aggression Equation R Square F Model Summary df1 df2 Sig. Constant Parameter Estimates b1 b2 b3 Linear .004 .572 1 143 .451 5.362 -.011 Quadratic .443 56.366 2 142 .000 30.953 -.893 .007 Cubic .443 37.437 3 141 .000 26.663 -.666 .003 2.051E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.E3). Таблица E4 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Косвенная агрессивность - Самооценка Dependent Variable: Self-Esteem Equation R Square F Model Summary df1 df2 Sig. Constant Parameter Estimates b1 b2 b3 Linear .004 .572 1 143 .451 64.050 -.373 Quadratic .006 .412 2 142 .663 61.878 .811 -.122 Cubic .007 .325 3 141 .807 58.794 3.587 -.781 .045 The independent variable is Indirect Aggression. При изменении косвенной агрессивности самооценка меняется случайным образом. (Рис.E4). Рисунок E3. Самооценка - Косвенная агрессивность. Рисунок E4. Косвенная агрессивность – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 423 Таблица Е5 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Раздражительность Dependent Variable: Irritation Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .022 3.288 1 143 .072 6.905 -.022 Quadratic .416 50.539 2 142 .000 27.546 -.733 .006 Cubic .417 33.652 3 141 .000 22.746 -.480 .002 2.295E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.Е5). Таблица Е6 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Раздражительность - Самооценка Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .022 3.288 1 143 .072 68.080 -1.040 Quadratic .034 2.470 2 142 .088 60.232 2.329 -.310 Cubic .039 1.900 3 141 .132 50.899 9.811 -1.950 b3 .105 The independent variable is Irritation. При изменении «раздражения» самооценка меняется случайным образом. (Рис.Е6). Рисунок Е5. Самооценка – Раздражительность. Рисунок Е6. Раздражительность – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 424 Таблица Е7 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Негативизм Dependent Variable: Negativism Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .003 .390 1 143 .534 2.599 .005 Quadratic .042 3.101 2 142 .048 -1.436 .144 -.001 Cubic .043 2.117 3 141 .101 -4.229 .291 -.004 b3 1.335E-5 The independent variable is Self-Esteem. Возможна квадратическая модель (Рис.Е7). Таблица Е8 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Негативизм - Самооценка Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .003 .390 1 143 .534 60.614 .583 Quadratic .004 .304 2 142 .739 63.073 -1.422 .335 Cubic .021 1.017 3 141 .387 50.581 17.105 -7.109 b3 .861 The independent variable is Negativism. При изменении негативизма самооценка меняется случайным образом. (Рис.Е8). Рисунок Е7. Самооценка – Негативизм. Рисунок Е8. Негативизм – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 425 Таблица Е9 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Обидчивость Dependent Variable: Resentment Equation Linear R Square .005 Model Summary F df1 .681 1 df2 Sig. 143 .411 Constant 2.931 Parameter Estimates b1 b2 .008 Quadratic .029 2.143 2 142 .121 -1.037 .144 Cubic .031 1.518 3 141 .212 3.338 -.087 b3 -.001 .003 -2.092E-5 The independent variable is Self-Esteem. При изменении самооценки «Обидчивость» меняется случайным образом. (Рис.Е9). Таблица Е10 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Обидчивость - Самооценка Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .005 .681 1 143 .411 60.185 .621 Quadratic .007 .516 2 142 .598 62.430 -.902 .209 Cubic .010 .474 3 141 .701 65.741 -4.647 1.297 b3 -.089 The independent variable is Resentment. При изменении «обиды» самооценка меняется случайным образом (Рис.Е10). Рисунок Е9. Самооценка – Обидчивость. Рисунок Е10. Обидчивость – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 426 Таблица Е11 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Подозрительность Dependent Variable: Suspicion and Distrust Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .028 4.061 1 143 .046 2.566 .017 Quadratic .029 2.110 2 142 .125 1.717 .047 Cubic .033 1.628 3 141 .186 8.035 -.287 b3 .000 .005 -3.02E-5 The independent variable is Self-Esteem. Возможна линейная модель (Рис.Е11). Таблица Е12 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Подозрительность - Самооценка Dependent Variable:Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .028 4.061 1 143 .046 56.527 1.579 Quadratic .029 2.149 2 142 .120 59.250 .038 .186 Cubic .031 1.486 3 141 .221 52.075 5.904 -1.176 b3 .093 The independent variable is Suspicion and Distrust. Возможна линейная модель (Рис.Е12). Рисунок Е11. Самооценка – Подозрительность. Рисунок Е12. Подозрительность – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 427 Таблица Е13 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Вербальная агрессивность Dependent Variable: Verbal Aggression Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .009 1.258 1 143 .264 6.269 -.012 Quadratic .239 22.352 2 142 .000 20.702 -.510 .004 Cubic .242 15.042 3 141 .000 14.327 -.173 -.002 b3 3.048E-5 The independent variable is Self-Esteem. Выбираем квадратическую модель (Рис.Е13). Таблица Е14 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Вербальная агрессивность - Самооценка Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .009 1.258 1 143 .264 66.204 -.710 Quadratic .151 12.676 2 142 .000 36.024 12.455 -1.251 Cubic .192 11.201 3 141 .000 67.375 -11.352 3.820 b3 -.322 The independent variable is Verbal Aggression. Выбираем квадратическую модель (Рис.Е14). Рисунок Е13. Самооценка - Вербальная агрессивность. Рисунок Е14. Вербальная агрессивность – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 428 Таблица Е15 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Самооценка – Чувство вины Dependent Variable: Self-Esteem Equation R Square Model Summary F df1 df2 Sig. Constant Parameter Estimates b1 b2 Linear .005 .757 1 143 .386 3.373 .010 Quadratic .037 2.742 2 142 .068 -2.160 .201 Cubic .043 2.087 3 141 .105 6.581 -.261 b3 -.002 .006 -4.179E-5 The independent variable is Guilt. При изменении самооценки «Чувство вины» меняется случайным образом (Рис.Е15). Таблица Е16 Описание модели и параметры оценок (Model Summary and Parameter Estimates). Чувство вины - Самооценка Dependent Variable: Self-Esteem Model Summary Equation R Square F df1 Parameter Estimates df2 Sig. Constant b1 b2 b3 Linear .005 .757 1 143 .386 60.167 .535 Quadratic .006 .441 2 142 .644 61.230 -.174 .090 Cubic .009 .428 3 141 .733 58.934 2.715 -.719 .062 The independent variable is Guilt. При изменении «Чувства вины» самооценка меняется случайным образом (Рис.Е16). Рисунок Е16. Самооценка - Чувство вины. Рисунок Е16. Чувство вины – Самооценка. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 429 Приложение F Частотный анализ Таблица F1 Self-Esteem * Physical Aggression Crosstabulation Count Physical Aggression Low Self-Esteem Low Medium High Medium 4 36 3 43 Total High 9 36 11 56 Total 23 1 22 46 36 73 36 145 Таблица F2 Chi-Square Tests Value df Asymp. Sig. (2-sided) 66.447a 4 .000 80.532 4 .000 Linear-by-Linear Association .000 1 1.000 N of Valid Cases 145 Pearson Chi-Square Likelihood Ratio a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.68. Таблица F3 Self-Esteem * Indirect Aggression Crosstabulation Count Indirect Aggression Low Self-Esteem Total Low Medium High Medium 3 34 2 39 11 38 13 62 High Total 22 1 21 44 36 73 36 145 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 430 Таблица F4 Chi-Square Tests Value df Asymp. Sig. (2-sided) 65.040a 79.219 .000 145 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases .000 4 4 1 .000 1.000 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.68. Таблица F5 Self-Esteem * Irritation Crosstabulation Count Irritation Low Self-Esteem Low Medium High Medium 3 34 5 42 Total High 4 37 12 53 Total 29 2 19 50 36 73 36 145 Таблица F6 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 73.384a Asymp. Sig. (2-sided) 4 4 1 85.181 3.146 145 .000 .000 .076 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.43. Таблица F7 Self-Esteem * Negativism Crosstabulation Count Negativism Low Self-Esteem Total Low Medium High Medium 17 28 17 62 12 16 9 37 High Total 7 29 10 46 36 73 36 145 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 431 Таблица F8 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided) 5.264a 4 4 1 5.382 .169 145 .261 .250 .681 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.19. Таблица F9 Self-Esteem * Resentment Crosstabulation Count Resentment Low Self-Esteem Low Medium High Medium 18 18 12 48 Total High 13 30 14 57 Total 5 25 10 40 36 73 36 145 Таблица F10 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided) 8.456a 8.654 2.764 145 4 4 1 .076 .070 .096 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.93. Таблица F11 Self-Esteem * Suspicion and Distrust Crosstabulation Count Suspiciont Low Self-Esteem Total Low Medium High Medium 17 23 7 47 11 24 13 48 High Total 8 26 16 50 36 73 36 145 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 432 Таблица F12 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided) 7.125a 4 4 1 7.276 6.685 145 .129 .122 .010 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11.67. Таблица F13 Self-Esteem * Verbal Aggression Crosstabulation Count Verbal Aggression Low Self-Esteem Low Medium High Medium 4 31 1 36 Total High 8 38 18 64 Total 24 4 17 45 36 73 36 145 Таблица F14 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df 57.289a Asymp. Sig. (2-sided) .000 4 4 1 65.614 .398 145 .000 .528 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.94. Таблица F15 Self-Esteem * Guilt Crosstabulation Count Guilt Low Self-Esteem Total Low Medium High Medium 13 18 13 44 8 17 9 34 High Total 15 38 14 67 36 73 36 145 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 433 Таблица F16 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 2.746a 2.762 .019 145 df Asymp. Sig. (2-sided) 4 4 1 .601 .598 .891 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.44. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 434 ПРИЛОЖЕНИЕ H. Исследование статистической значимости различий процентных долей с помощью критерия Фишера Таблица H1 Исследование различий процентных долей (Самооценка – SE; Физическая агрессивность – PhA; Косвенная агрессивность – IA;Раздражительность - I, Негативизм - N; Обидчивость - R; Подозрительность - S; Вербальная агрессивность - VA; Чувство вины – G). Размер эффекта h (0.2 - небольшой, 0.5 - средний, 0.8 – большой)3 k1 k2 n1 n2 p1 p2 ϕ1 ϕ2 ϕ∗ h p High SE Medium SE 22 1 46 46 47.8 2.2 1.53 0.30 5.91 1.23 .000 High SE Low SE 22 23 46 46 47.8 50.0 1.53 1.57 0.21 0.04 .84 Medium SE Low SE 1 23 46 46 2.2 50.0 0.30 1.57 6.11 1.27 .000 High SE Medium SE 11 36 56 56 19.6 64.3 0.92 1.86 4.99 0.94 .000 High SE Medium SE Low SE Low SE 11 36 9 9 56 56 56 56 19.6 64.3 16.1 16.1 0.92 1.86 0.82 0.82 0.49 5.48 0.09 1.04 .62 .000 High SE Medium SE 3 36 43 43 7.0 83.7 0.53 2.31 8.24 1.78 .000 Low SE 3 4 43 43 7.0 9.3 0.53 0.62 0.40 0.09 .69 Low SE 36 4 43 43 83.7 9.3 2.31 0.62 7.84 1.69 .000 High PhA Medium PhA 22 11 36 36 61.1 30.6 1.79 1.17 2.65 0.62 .008 Low PhA 22 3 36 36 61.1 8.3 1.79 0.59 5.13 1.21 .000 Medium PhA High PhA Low PhA Medium PhA 11 1 3 36 36 73 36 73 30.6 1.4 8.3 49.3 1.17 0.23 0.59 1.56 2.48 7.99 0.59 1.32 .013 .000 High PhA Low PhA 1 36 73 73 1.4 49.3 0.23 1.56 7.99 1.32 .000 Medium PhA Low PhA 36 36 73 73 49.3 49.3 1.56 1.56 0.00 0.00 1.00 High PHA Medium PHA 23 9 36 36 63.9 25.0 1.85 1.05 3.42 0.81 .001 High PHA Low PHA 23 4 36 36 63.9 11.1 1.85 0.68 4.97 1.17 .000 Medium PHA High SE Low PHA Medium SE 9 21 4 1 36 44 36 44 25.0 47.7 11.1 2.3 1.05 1.53 0.68 0.30 1.56 5.73 0.37 1.22 .12 .000 High SE Low SE 21 22 44 44 47.7 50.0 1.53 1.57 0.21 0.05 .83 Medium SE Low SE 1 22 44 44 2.3 50.0 0.30 1.57 5.95 1.27 .000 Medium IA High IA Low SE High SE High SE Medium SE High PHA Low IA 3 2 Mediu m SE Low PhA Mediu m PhA High PhA 1 High SE Medium SE 13 38 62 62 21.0 61.3 0.95 1.80 4.72 0.85 .000 High SE Low SE 13 11 62 62 21.0 17.7 0.95 0.87 0.45 0.08 .65 Medium SE Low SE 38 11 62 62 61.3 17.7 1.80 0.87 5.17 0.93 .000 High SE Medium SE 2 34 39 39 5.1 87.2 0.46 2.41 8.62 1.95 .000 High SE Low SE 2 3 39 39 5.1 7.7 0.46 0.56 0.46 0.11 .64 Medium SE Low SE 34 3 39 39 87.2 7.7 2.41 0.56 8.16 1.85 .000 ki – количество участников с исследуемым эффектом из группы объема ni, i = 1;2, pi = ϕi = 2 arcsin pī 100 , ϕ ∗ = ϕ1 − ϕ 2 ki ⋅100% , ni n1n2 - статистика теста «Угловое преобразование Фишера», n1 + n2 h = ϕ1 − ϕ2 - размер эффекта, p-value для ϕ ∗ -статистики (нормальное распределение с параметрами μ = 0, σ=1), two-tailed, H0: p1 и p2 имеют случайные различия. (Cohen, 1988, p.181). Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NY: Lawrence Earlbaum Associates. Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 435 High SE Medium SE 21 13 36 36 58.3 36.1 1.74 1.29 1.90 0.45 .06 Low IA 21 2 36 36 58.3 5.6 1.74 0.48 5.36 1.26 .000 Medium IA Low IA 13 3 36 36 36.1 8.3 1.29 0.59 2.99 0.70 .003 High IA Medium IA 1 38 73 73 1.4 52.1 0.23 1.61 8.32 1.38 .000 High IA Low IA 1 34 73 73 1.4 46.6 0.23 1.50 7.66 1.27 .000 Medium IA Low IA 38 34 73 73 52.1 46.6 1.61 1.50 0.66 0.11 .51 High IA Medium IA 22 11 36 36 61.1 30.6 1.79 1.17 2.65 0.62 .008 Low IA 22 3 36 36 61.1 8.3 1.79 0.59 5.13 1.21 .000 Medium IA Low IA 11 3 36 36 30.6 8.3 1.17 0.59 2.48 0.59 .013 High IA High SE Medium SE 19 2 50 50 38.0 4.0 1.33 0.40 4.63 0.93 .000 High SE Low SE 19 29 50 50 38.0 58.0 1.33 1.73 2.02 0.40 .044 Medium SE Low SE 29 2 50 50 58.0 4.0 1.73 0.40 6.64 1.33 .000 High SE Medium SE 12 37 53 53 22.6 69.8 0.99 1.98 5.08 0.99 .000 High SE Low SE 12 4 53 53 22.6 7.5 0.99 0.56 2.24 0.44 .025 Medium SE Low SE 37 4 53 53 69.8 7.5 1.98 0.56 7.32 1.42 .000 High SE Medium SE 5 34 42 42 11.9 81.0 0.70 2.24 7.03 1.53 .000 High SE Low SE 5 3 42 42 11.9 7.1 0.70 0.54 0.75 0.16 .45 Medium SE Low SE 34 3 42 42 81.0 7.1 2.24 0.54 7.78 1.70 .000 19 12 36 36 52.8 33.3 1.63 1.23 1.68 0.40 .093 19 5 36 36 52.8 13.9 1.63 0.76 3.66 0.86 .000 Medium I Low I 12 5 36 36 33.3 13.9 1.23 0.76 1.98 0.47 .047 High I Medium I 2 37 73 73 2.7 50.7 0.33 1.58 7.56 1.25 .000 Low I 2 34 73 73 2.7 46.6 0.33 1.50 7.07 1.17 .000 Medium I Low I 37 34 73 73 50.7 46.6 1.58 1.50 0.50 0.08 .62 High I High I High SE Medium SE 10 29 46 46 21.7 63.0 0.97 1.83 4.15 0.86 .000 High SE Low SE 10 7 46 46 21.7 15.2 0.97 0.80 0.81 0.17 .42 Medium SE Low SE 29 7 46 46 63.0 15.2 1.83 0.80 4.96 1.03 .000 High SE Medium SE 9 16 37 37 24.3 43.2 1.03 1.44 1.74 0.40 .082 Medium R High R Low SE Medium SE High SE Low N Medium N Medium SE Medium I Low I Low SE High I High I High N High SE Low I Medium I Low SE Medium IA High I High IA High IA High I Medium I 29 4 36 36 80.6 11.1 2.23 0.68 6.57 1.55 .000 Low I 29 3 36 36 80.6 8.3 2.23 0.59 6.97 1.64 .000 Medium I Low I 4 3 36 36 11.1 8.3 0.68 0.59 0.40 0.09 .69 High SE Low SE 9 12 37 37 24.3 32.4 1.03 1.21 0.78 0.18 .44 Medium SE Low SE 16 12 37 37 43.2 32.4 1.44 1.21 0.96 0.22 .34 High SE Medium SE 17 28 62 62 27.4 45.2 1.10 1.47 2.07 0.37 .039 High SE Low SE 17 17 62 62 27.4 27.4 1.10 1.10 0.00 0.00 1.00 Medium SE Low SE 28 17 62 62 45.2 27.4 1.47 1.10 2.07 0.37 .039 High N Medium N 10 9 36 36 27.8 25.0 1.11 1.05 0.27 0.06 .79 High N Low N 10 17 36 36 27.8 47.2 1.11 1.52 1.72 0.40 .086 Medium N Low N 9 17 36 36 25.0 47.2 1.05 1.52 1.99 0.47 .047 High N Medium N 29 16 73 73 39.7 21.9 1.36 0.97 2.35 0.39 .019 High N Low N 29 28 73 73 39.7 38.4 1.36 1.34 0.17 0.03 .87 Medium N Low N 16 28 73 73 21.9 38.4 0.97 1.34 2.18 0.36 .029 High N Medium N 7 12 36 36 19.4 33.3 0.91 1.23 1.35 0.32 .18 High N Low N 7 17 36 36 19.4 47.2 0.91 1.52 2.55 0.60 .011 Medium N Low N 12 17 36 36 33.3 47.2 1.23 1.52 1.21 0.28 .23 High SE Medium SE 10 25 40 40 25.0 62.5 1.05 1.82 3.47 0.78 .001 High SE Low SE 10 5 40 40 25.0 12.5 1.05 0.72 1.45 0.32 .15 Medium SE Low SE 25 5 40 40 62.5 12.5 1.82 0.72 4.92 1.10 .000 High SE Medium SE 14 30 57 57 24.6 52.6 1.04 1.62 3.13 0.59 .002 High SE Low SE 14 13 57 57 24.6 22.8 1.04 1.00 0.22 0.04 .83 Medium SE Low SE 30 13 57 57 52.6 22.8 1.62 1.00 3.35 0.63 .001 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 436 Low R High SE 12 18 48 48 25.0 37.5 1.05 1.32 1.33 0.27 .18 Low SE 12 18 48 48 25.0 37.5 1.05 1.32 1.33 0.27 .18 Medium SE Low SE 18 18 48 48 37.5 37.5 1.32 1.32 0.00 0.00 1.00 High R Medium R 10 14 36 36 27.8 38.9 1.11 1.35 1.00 0.24 .32 High R Low R 10 12 36 36 27.8 33.3 1.11 1.23 0.51 0.12 .61 Medium R Low R 14 12 36 36 38.9 33.3 1.35 1.23 0.49 0.12 .62 High R Medium R 25 30 73 73 34.2 41.1 1.25 1.39 0.85 0.14 .39 Low R 25 18 73 73 34.2 24.7 1.25 1.04 1.27 0.21 .20 Medium R Low R 30 18 73 73 41.1 24.7 1.39 1.04 2.13 0.35 .033 High R High R Medium R 5 13 36 36 13.9 36.1 0.76 1.29 2.23 0.53 .026 High R Low R 5 18 36 36 13.9 50.0 0.76 1.57 3.42 0.81 .001 Medium R Low R 13 18 36 36 36.1 50.0 1.29 1.57 1.19 0.28 .23 High SE Medium SE 16 26 50 50 32.0 52.0 1.20 1.61 2.04 0.41 .041 High SE Low SE 16 8 50 50 32.0 16.0 1.20 0.82 1.90 0.38 .058 Medium SE Low SE 26 8 50 50 52.0 16.0 1.61 0.82 3.94 0.79 .000 High SE Medium SE 13 24 48 48 27.1 50.0 1.09 1.57 2.33 0.48 .020 High SE Low SE 13 11 48 48 27.1 22.9 1.09 1.00 0.47 0.10 .64 Medium SE Low SE 24 11 48 48 50.0 22.9 1.57 1.00 2.80 0.57 .005 High SE Medium SE 7 23 47 47 14.9 48.9 0.79 1.55 3.67 0.76 .000 High SE Low SE 7 17 47 47 14.9 36.2 0.79 1.29 2.41 0.50 .016 Medium SE Low SE 23 17 47 47 48.9 36.2 1.55 1.29 1.26 0.26 .21 High S Medium S 16 13 36 36 44.4 36.1 1.46 1.29 0.72 0.17 .47 High S Low S 16 7 36 36 44.4 19.4 1.46 0.91 2.32 0.55 .021 Medium S Low S 13 7 36 36 36.1 19.4 1.29 0.91 1.60 0.38 .11 Medium S 26 24 73 73 35.6 32.9 1.28 1.22 0.35 0.06 .73 Low S 26 23 73 73 35.6 31.5 1.28 1.19 0.53 0.09 .60 Medium S Low S 24 23 73 73 32.9 31.5 1.22 1.19 0.18 0.03 .86 High S Medium S 8 11 36 36 22.2 30.6 0.98 1.17 0.80 0.19 .42 High S Low S 8 17 36 36 22.2 47.2 0.98 1.52 2.26 0.53 .024 Medium S Low S 11 17 36 36 30.6 47.2 1.17 1.52 1.46 0.34 .15 High SE Medium SE 17 4 45 45 37.8 8.9 1.32 0.61 3.41 0.72 .001 High SE Low SE 17 24 45 45 37.8 53.3 1.32 1.64 1.49 0.31 .14 Medium SE Low SE 4 24 45 45 8.9 53.3 0.61 1.64 4.90 1.03 .000 Medium SE 18 38 64 64 28.1 59.4 1.12 1.76 3.63 0.64 .000 Low SE 18 8 64 64 28.1 12.5 1.12 0.72 2.24 0.40 .025 Medium SE Low SE 38 8 64 64 59.4 12.5 1.76 0.72 5.86 1.04 .000 High SE Medium SE 1 31 36 36 2.8 86.1 0.33 2.38 8.67 2.04 .000 High SE Low SE 1 4 36 36 2.8 11.1 0.33 0.68 1.46 0.34 .14 Medium SE Low SE 31 4 36 36 86.1 11.1 2.38 0.68 7.20 1.70 .000 High VA Medium VA 17 18 36 36 47.2 50.0 1.52 1.57 0.24 0.06 .81 High G Low SE Medium SE High SE Medium VA High SE High SE Low VA High VA Medium SE High S High S Low SE High SE Low S Medium S High S Medium SE Medium SE Low SE High SE High SE High VA Low VA 17 1 36 36 47.2 2.8 1.52 0.33 5.01 1.18 .000 Medium VA Low VA 18 1 36 36 50.0 2.8 1.57 0.33 5.24 1.24 .000 High VA Medium VA 4 38 73 73 5.5 52.1 0.47 1.61 6.88 1.14 .000 High VA Low VA 4 31 73 73 5.5 42.5 0.47 1.42 5.72 0.95 .000 Medium VA Low VA 38 31 73 73 52.1 42.5 1.61 1.42 1.16 0.19 .25 High VA Medium VA 24 8 36 36 66.7 22.2 1.91 0.98 3.94 0.93 .000 High VA Low VA 24 4 36 36 66.7 11.1 1.91 0.68 5.22 1.23 .000 Medium VA Low VA 8 4 36 36 22.2 11.1 0.98 0.68 1.28 0.30 .20 High SE Medium SE 12 38 67 67 17.9 56.7 0.87 1.71 4.81 0.83 .000 High SE Low SE 14 15 67 67 20.9 22.4 0.95 0.99 0.21 0.04 .83 Medium SE Low SE 38 15 67 67 56.7 22.4 1.71 0.99 4.17 0.72 .000 Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 437 Medium G Medium SE 9 17 34 34 26.5 50.0 1.08 1.57 2.02 0.49 .043 Low SE 9 8 34 34 26.5 23.5 1.08 1.01 0.28 0.07 .78 Medium SE Low SE 17 8 34 34 50.0 23.5 1.57 1.01 2.30 0.56 .021 High SE Medium SE 13 18 44 44 29.5 40.9 1.15 1.39 1.12 0.24 .26 Low SE 13 13 44 44 29.5 29.5 1.15 1.15 0.00 0.00 1.00 Low SE 18 13 44 44 40.9 29.5 1.39 1.15 1.12 0.24 .26 High G Medium G 14 9 36 36 38.9 25.0 1.35 1.05 1.27 0.30 .20 Low G 14 13 36 36 38.9 36.1 1.35 1.29 0.24 0.06 .81 Medium G Low G 9 13 36 36 25.0 36.1 1.05 1.29 1.03 0.24 .30 High G High G Medium G 38 17 73 73 52.1 23.3 1.61 1.01 3.65 0.60 .000 High G Low G 38 18 73 73 52.1 24.7 1.61 1.04 3.46 0.57 .001 Medium G Low G 17 18 73 73 23.3 24.7 1.01 1.04 0.19 0.03 .85 High G Medium G 15 8 36 36 41.7 22.2 1.40 0.98 1.79 0.42 .074 High G Low G 15 13 36 36 41.7 36.1 1.40 1.29 0.48 0.11 .63 Medium G Low G 8 13 36 36 22.2 36.1 0.98 1.29 1.30 0.31 .19 Low SE High SE High SE Medium SE Medium SE Low G High SE High SE Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019 438

Авторы лекции