Компьютерная обработка данных психологического исследования
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Блюменау Нина Федоровна
Компьютерная обработка данных
психологического исследования
Конспект лекций
Рига, 2019
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
1
CОДЕРЖАНИЕ
Введение
7
1. Популяция и выборка
10
1.1. Популяция
10
1.2. Выборка
10
1.3. Выборочный метод
11
2. Измерение
11
2.1. Измерительные шкалы
12
2.1.1. Шкала наименований
12
2.1.2. Порядковая шкала
13
2.1.3. Шкала интервалов
16
2.14. Шкала отношений
16
2.2. Мощность шкалы
18
2.3. Особенности обработки данных в зависимости от шкал
20
2.4. Переменные величины
22
3. Основные показатели описательной статистики
22
3.1. Число наблюдений
23
3.2. Среднее арифметическое
23
3.3. Стандартная ошибка среднего
23
3.4. Медиана
24
3.5. Мода
24
3.6. Дисперсия
24
3.7. Стандартное отклонение
25
3.8. Размах
26
3.9. Асимметрия
27
3.10. Стандартная ошибка асимметрии
28
3.11. Эксцесс
28
3.12. Стандартная ошибка эксцесса
29
3.13. Квартили
30
3.14. Стандартизованные данные
31
4. Расчет описательных статистик с помощью компьютерной программы SPSS
32
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
2
5. Гендерные различия агрессии у подростков
5.1. Ввод данных
34
34
5.1.1. Описание переменных
36
5.1.2. Ввод данных
45
5.2. Описательные статистики
45
5.3. Графические иллюстрации уровней агрессии мальчиков и девочек
53
5.3.1. Коробчатые диаграммы
53
5.3.2. Построение и редактирование коробчатых диаграмм в SPSS
57
5.3.3. Диаграммы для средних значений
66
5.3.3.1. Построение с помощью Excel
66
5.3.3.2. Построение с помощью SPSS
67
6. Распределения
72
6.1. Случайные величины
72
6.2. Нормальное распределение
75
6.3. Распределение «Хи-квадрат» ( χ 2 )
77
6.4. Распределение Стьюдента или t-распределение
79
6.5. Распределение Фишера-Снедекора или f-распределение
80
7. Проверка статистических гипотез с помощью SPSS
81
7.1. Виды статистических гипотез
81
7.2. Ошибки 1-ого и 2-ого рода
84
7.3. Статистический критерий
85
7.4. Критическая область. Критические точки
85
7.5. Нахождение критических точек распределения χ 2 с помощью
компьютерной программы Excel
88
7.6. р-value
92
7.7. Вычисление р-value с помощью компьютерной программы Excel
94
7.8. Мощность критерия
98
7.9. Параметрические и непараметрические критерии
99
8. Проверка нормальности распределения данных
8.1. Проверка нормальности распределения данных с помощью SPSS
100
100
8.2. Гипотезы об асимметрии и эксцессе и о соответствии
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
3
распределения данных нормальному распределению
9. Гендерные различия агрессии у подростков. Продолжение
9.1.Проверка нормальности распределения данных
101
104
104
9.1.1. Стандартные ошибки асимметрии и эксцесса
104
9.1.2. Критерий Колмогорова-Смирнова
105
9.1.3. Критерий Колмогорова-Смирнова в модификации Лиллифора и
критерий Шапиро-Уилкса
107
9.1.4. Получение гистограмм с нормальной кривой
110
9.1.5. Выбор критерия для исследования гендерных различий
117
9.2. Исследование различия уровня агрессии с помощью U-критерия МаннаУитни
119
9.3. Представление результатов теста Манна-Уитни в отчетах.
Размер эффекта
121
9.4. Исследование различия средних уровней агрессии с помощью
параметрического t-теста
123
9.5. Представление результатов t-теста в отчетах. Размеры эффекта
Домашнее задание 1
127
130
10. Исследование связи
131
10.1. Корреляционная диаграмма
131
10.2. Коэффициент корреляции Пирсона
134
10.2.1. Вычисление коэффициента корреляции Пирсона
134
10.2.2. Размер эффекта для коэффициента корреляции Пирсона
135
10.2.3. Проверка статистической значимости коэффициента
корреляции Пирсона
136
10.2.4. Представление коэффициента корреляции Пирсона в отчетах
141
10.2.5. Сравнение корреляций Пирсона для двух независимых выборок
142
10.2.6. Размер эффекта для разности коэффициентов
корреляции Пирсона
143
10.2.7. Сравнение коэффициентов корреляции двух зависимых выборок 145
10.3 Коэффициенты корреляции Спирмена и Кендалла
147
10.3.1. Коэффициент ранговой корреляции Спирмена
147
10.3.2. Размер эффекта для коэффициента корреляции Спирмена
149
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
4
10.3.3. Проверка статистической значимости коэффициентов
корреляции Спирмена
10.3.4. Коэффициент ранговой корреляции τ-Кендалла
149
150
10.3.5. Проверка статистической значимости коэффициентов
корреляции τ-Кендалла
151
10.4. Коэффициент корреляции «Фи»
152
10.5. Точечно-бисериальный коэффициент корреляции
154
10.6. Размер эффекта для коэффициентов корреляции
157
10.7. Частная корреляция
157
10.8. Немонотонный характер связи
161
10.9. Частотный анализ
161
10.10. Исследование связи, когда коэффициентами одна переменная
количественная, а другая номинальная
162
10.11. Исследование связи между номинальными переменными
162
10.12. Схема исследования связи
163
11. Связь между самооценкой и агрессией подростков
11.1. Ввод данных
164
165
11.2. Описательная статистика и проверка нормальности
распределения данных
168
11.2.1. Показатели описательной статистики
169
11.2.2. Гистограммы с нормальной кривой
169
11.2.3. Критерий Колмогорова-Смирнова в модификации Лиллифора и
критерий Шапиро-Уилкса
172
11.2.4. Графическая иллюстрация: Boxplots
175
11.3. Вычисление коэффициентов корреляции
177
11.4. Корреляционные диаграммы
180
11.5. Нелинейный регрессионный анализ. Выбор вида связи
183
11.6. Графическая иллюстрация результатов регрессионного анализа
198
11.7. Переход к низким и к высоким показателям
203
11.7.1. Анализ двух групп самооценки
204
11.7.2. Анализ двух групп вербальной агрессии
229
11.8. Выводы по корреляционному анализу
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
236
5
12. Частотный анализ. Критерий «Хи-квадрат» Пирсона
12.1. Сравнение распределения с теоретическим: Goodness-of-Fit Test
238
238
12.1.1. Сравнение эмпирического распределения признака
с равномерным распределением
239
12.1.2. Пример 1. Без поправки на непрерывность
241
12.1.3. Пример 2. С поправкой на непрерывность
246
12.2. Связь номинальных переменных: Test of Independence
248
12.2.1. Пример 3. Без поправки на непрерывность
253
12.2.2. Пример 4. С поправкой на непрерывность
263
13. Исследование выборов терминальных ценностей по М. Рокичу
269
14. Частотный анализ. Тест «Угловое преобразования Фишера φ*»
283
Домашнее задание 2
289
15. Частотный анализ для примера исследования связи между самооценкой и
агрессией
290
Домашнее задание 3
311
Литература
312
Приложение 1. Методика Басса-Дарки
315
Приложение 2. Математическая часть работы «Исследование гендерных различий
агрессивности у подростков»
329
Приложение 3. Методика Дембо-Рубинштейна
353
Приложение 4. Математическая часть работы «Исследование связи между
самооценкой и агрессией в подростковом возрасте»
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
358
6
Введение
В ХХ веке в социальных науках стали активно использоваться математические
методы. С развитием вычислительной техники происходило совершенствование этих
методов. Наряду с математиками статистические методы, теорию вероятностей и
вычислительные методы развивали физики, биологи, генетики, психологи, политологи,
медики и ученые из других областей науки. Их именами названы многие статистические
термины. Например, теоретическое распределение Фишера-Снедекора. Рональд Фишер –
статистик, биолог, генетик, основатель дисперсионного анализа (ANOVA). Благодаря
работе Фишера, регрессионный анализ используется для того, чтобы сделать вывод о связи
между переменными. Известен статистический критерий Фишера.
В
настоящее
математическое
время
обоснование.
любые
По
исследования
требованиям
в
психологии
Американской
должны
иметь
Психологической
Ассоциации (АРА) в научных статьях обязательно должны быть представлены
статистические
методы
обработки
данных.
Существует
специальная
система
статистических сокращений, которые не нуждаются в пояснениях. Разработан комплекс
статистических компьютерных программ, который назвали «Statistical Package for Social
Sciences», сокращенно – SPSS. Сейчас SPSS используют не только в социальных науках.
Современному психологу необходимо уметь организовывать исследование так,
чтобы его результаты можно было бы обработать с применением математических
методов, уметь выбирать адекватные методы обработки данных, анализировать и
интерпретировать полученные результаты.
Без статистической обработки данных невозможно защитить бакалаврскую работу,
магистерскую работу и докторскую диссертацию по психологии.
Психологу необходимо уметь совершать переход от психологического языка к
языку математики. Определять математическую идентификацию исследовательской
ситуации, выбирать валидные методики для измерения переменных и адекватные методы
анализа данных. Обрабатывать данные, анализировать их математически, получать
результаты. А затем, поработав с математикой, необходимо переходить обратно, на
психологический язык, давать результатам психологическую интерпретацию.
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
7
Основной целью преподавания статистических методов студентам-психологам
является подготовка студентов к будущей научной работе, начальными этапами которой
служат курсовая, дипломная и магистерская работы.
Психолог должен знать возможности статистических программ и уметь их
применять. В данном учебном пособии рассматривается применение компьютерных
программ SPSS и MS Excel.
Для усвоения данного предмета требуется предварительное изучение курса
«Статистические методы в психологии» и умение пользоваться компьютером (MS Word,
Excel, Internet).
Все примеры, которые рассматриваются в данном конспекте лекций основаны на
реальных данных, взятых из курсовых, дипломных работ.
Конспект лекций содержит:
•
теоретическое описание основных понятий статистики,
•
руководство по использованию компьютерных программ Excel и SPSS
(версия 22.0) для решения конкретных психологических задач,
•
список основной и дополнительной литературы,
•
файлы данных в Excel, для примеров, разбираемых в конспекте,
•
файлы с вариантами домашних заданий,
•
некоторые методики психологических измерений,
•
приложения с примерами оформления домашних заданий.
Без самостоятельного выполнения домашних заданий освоение курса невозможно.
К
конспекту
лекций
прилагаются
файлы
данных,
предназначенные
для
самостоятельного освоения курса и для выполнения домашних заданий (Таблица 1).
Конспектом лекций могут пользоваться как студенты бакалаврской программы.
Выставляемая студенту оценка складывается из оценки выполнения домашних
заданий (50%) и из оценки, полученной при выполнении экзаменационной работы (50%).
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
8
Таблица 1
Файлы данных, предназначенные для самостоятельного освоения курса и для выполнения
домашних заданий
Файлы в фолдере
Aggression_Data.xlsx
Aggression_Data_Factor.xlsx
Aggression_Variants_(1-16).xlsx
Self-Esteem_Aggression_Data.xlsx
Self-Esteem_Aggression_Data-Factor.xlsx
Self-Esteem_Aggression_Variants._(1-24).xlsx
Home_Work_2_Chi_Square_Variants.docx
Data_Chi_Rokich.xlsx
Fishers_angular_transformation_2T.xlsx
Домашнее
задание
1
3
2
Замечание. Варианты домашних заданий 1-3 приведены в «Moodle» БМА.
© Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
9
1. Популяция и выборка
Математическая статистика – это наука о математических методах систематизации
и использования статистических данных для научных и практических выводов.
В математической статистике можно выделить две основные части:
1) Описательная статистика (Descriptive Statistics);
2) Теория статистического вывода (Inferential Statistics).
Освоение описательной статистики предусматривает знание математики в рамках
средней школы. Теория статистического вывода подразумевает знание высшей математики,
в том числе таких математических дисциплин, как теория вероятностей, математический
анализ. Теория статистического вывода всегда пользуется терминами теории вероятностей.
1.1. Популяция
Популяция (Генеральная совокупность) – Population - это все множество объектов, в
отношении которых формулируется исследовательская гипотеза (Наследов, 2004; с.19).
Если, все же, исследованию подвергаются все объекты популяции, то такое
исследование называют полным или сплошным.
Количество всех объектов популяции называют ее объемом (size).
Все показатели, вычисленные для популяции (например среднее значение), называют
параметрами. Параметры стараются обозначать буквами греческого алфавита. При этом в
соответствии с требованиями Американской Психологической Ассоциации (American
Psychological Association, APA), в научных отчетах греческие буквы не пишутся курсивом (not
Italic).
1.2. Выборка
Часть объектов популяции, отобранных для того, чтобы после их изучения, сделать
заключение о всей популяции, называют выборкой (Sample).
Количество всех объектов выборки называют объемом выборки (Sample size).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 10
Все показатели, вычисленные для выборки, называют статистиками. Статистики
стараются обозначать буквами латинского алфавита. Их обозначения, в соответствии с
требованиями APA, в научных отчетах пишутся курсивом (Italic).
1.3. Выборочный метод
Метод исследования, позволяющий делать заключение о характере изучаемых свойств
популяции на основе рассмотрения некоторой ее части (выборки), называется выборочным
методом.
Практически
все
исследования
являются
выборочными,
а
их
выводы
распространяются на популяцию.
Репрезентативность – это свойство выборки достаточно полно отражать изучаемое
свойство популяции. Чтобы выборка отражала свойства популяции, она должна быть
сформирована случайно. Неслучайный отбор может исказить истину и привести к ошибочным
выводам. Случайный отбор предполагает создание таких условий, чтобы каждый объект
популяции имел равные с другими объектами шансы попасть в выборку (Random Sample).
2. Измерение
Американский психолог-психофизик, автор теории психофизических измерений
Стивенс Стэнли Смит в середине ХХ века дал следующее определение измерению.
Под измерением понимают процедуру приписывания числовых форм объектам или
событиям в соответствии с определенными правилами.
Эти правила устанавливают соответствие между измеряемым свойством объекта и
результатом измерения (в частности - числом).
В результате измерения исследователь получает данные (data), которые могут быть
количественными (quantitative), либо категориальными (categorical).
Примеры количественных данных: вес, индекс массы тела, время реакции; значение
физической агрессии, определенное по ответам на вопросы специального теста в соответствии
с его специальными «ключами».
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 11
Примеры категориальных данных: профессия (учитель, продавец, портной, дворник,
врач), пол (мужской, женский).
2.1. Измерительные шкалы
Шкала (лат. scala – лестница) – это некоторая числовая структура, подобранная для
конкретной эмпирической структуры данных, т.е. результат числового представления
эмпирической структуры данных. Современная классификация шкал была предложена в 1946
году Стэнли Смитом Стивенсом (Stevens, 1946): номинальная шкала, шкала порядка, шкала
интервалов и шкала отношений.
Шкалы позволяют замещенать интересующие исследователя эмпирические объекты
числами, которые удобны в обращении.
Шкалы также разделяют на метрические и неметрические. Если есть или может быть
установлена единица измерения, то шкалу называют метрической. В противном случае –
неметрической.
2.1.1. Шкала наименований
Как правило, шкалу наименований (Nominal Scale) используют, когда приходится иметь
дело с категориальными переменными (variables).
1. Пример: категориальная
национальность:
переменная
латыш - 11
русский - 23
поляк – 34
еврей - 41
немец – 58
- 2. Пример: категориальная переменная
- пол:
мужской – 1
женский – 0.
Измерение в номинальной шкале предполагает группировку объектов по категориям.
Внутри категории объекты должны быть идентичны по измеряемому свойству. Категории
нумеруют произвольным способом. Создается так называемая категориальная или
номинальная переменная (categorical or nominal variable), значения которой равны числам,
присвоенным категориям этой переменной.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 12
То, что присвоенное число больше или меньше другого присвоенного числа никак не
связано со свойством объекта. Например, то, что 1 > 0 для Примера 2 (переменная - пол) не
говорит о том, что какого-то «полового свойства» в мужчине больше, а в женщине меньше.
Или, например, в Примере 1, не говорит о том, что немец, которому присвоили число 58, имеет
количество «свойства национальности больше», чем поляк, которому присвоили число 34.
Числа, присвоенные категориям в номинальной шкале, говорят только о том, что
качества этих категорий отличаются.
Разновидностью
номинальных
шкал
является
дихотомическая
или
бинарная
(dichotomous or binary) шкала наименований, в которой категориальная (номинальная)
переменная имеет всего две категории (Пример 2).
Результат измерения в номинальной шкале дает ответ на вопрос:
«К какой группе принадлежит результат измерения?»
2.1.2. Порядковая шкала
Порядковая шкала (Ordinal Scale) – неметрическая шкала.
Измерение в этой шкале предполагает приписывание свойствам объектов чисел, в
зависимости от степени выраженности измеряемого свойства.
Фиксируется различие степеней измеряемого свойства.
Баллы в порядковой шкале говорят только о месте свойства одного объекта, по
отношению к свойствам других объектов, но не отвечают на вопрос: на сколько одно значение
переменной одного объекта отличается от другого.
1.Пример. Переменная – внешняя красота. Местам, полученным в конкурсе красоты
можно поставить в соответствие значения переменной - баллы:
Света – 1, Маша – 2, Таня -3, Оля -4.
Присвоение баллов является измерением в порядковой шкале. Присвоенные баллы в
говорят о том, что Света самая красивая, а Оля самая некрасивая.
Но вовсе не следует, что Света красивее Маши ровно на столько же, насколько Таня
красивее Оли, хотя разности между соответствующими баллами равны: 2-1=4-3.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 13
Числа, приписанные объектам в порядковой шкале, говорят только о месте свойства
одного объекта, по отношению к свойствам других объектов, но не отвечают на вопрос: на
сколько больше или меньше выражено измеряемое свойство у одного объекта, чем у другого
объекта.
Пример 2. В Таблице 2.1.2.1 приведены результаты измерения памяти школьников по
специальному тесту в баллах (признак Х, столбец 3). В этом тесте большему баллу
соответствует лучшая память. Если нет дополнительных исследований эмпирических данных,
то можно считать, что данные измерения представлены в порядковой шкале. Таня запоминает
лучше всех, хуже всех запоминает Юра. У Марины память лучше чем Коли, но хуже чем у
Тани, и т.д.
При обработке данных, измеренных в порядковых шкалах, часто приходится
ранжировать данные.
Присвоим результатам теста ранги так, чтобы большему баллу соответствовал больший
ранг.
Упорядочим баллы в порядке убывания (Таблица 2.1.2.1, столбец 3). В первом столбце
запишем номера участников, начиная с 10 в убывающем порядке.
Если оценка встречается один раз, то ей присваивается обычный (несвязанный) ранг,
совпадающий с порядковым номером оценки. Если имеется группа одинаковых оценок, то
каждой из них присваивается один и тот же (связанный) ранг, который равен сумме
порядковых номеров этих одинаковых оценок, деленной на количество этих оценок.
Танин балл (15) встречается один раз. Танин ранг будет совпадать с ее порядковым
номером – 10. Запишем его в столбце 4. Это несвязанный ранг.
У Оли и Светы одинаковые баллы (по 14). Их ранги равны
8+9
= 8,5 Это связанные
2
ранги.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 14
Таблица 2.1.2.1
Присвоение рангов для Примера 3. Результаты измерения памяти школьников по
специальному тесту
Nr.
Имя
Оценка за тест
в баллах
(признак Х)
1
2
3
4
10
Таня
15
10
9
8
7
6
5
4
3
2
1
Оля
Света
Ася
Катя
Андрей
Марина
Миша
Коля
Юра
14
14
10
10
10
9
8
5
3
8,5
8,5
6
6
6
4
3
2
1
Ранг, присвоенный
оценке
Подсчет связанных рангов
5
8+9
= 8,5
2
5+6+7
=6
3
Правильность присвоения рангов можно проконтролировать - сумма всех рангов равна
сумме порядковых номеров и равна:
n (n + 1)
.
2
Объем выборки n = 10. n - совпадает с количеством участников тестирования.
Контроль правильности присвоения рангов:
Сумма всех рангов = 10 + 8, 5 + 8, 5 + 6 + 6 + 6 + 4 + 3 + 2 + 1 = 55 .
Сумма всех порядковых номеров в Таблице 1.1.2.1 равна
1 + 2 + L + n = 1 + 2 + 3 + L + 10 = 55 .
С другой стороны,
n (n + 1) 10 ⋅ (10 + 1)
=
= 55 .
2
2
55=55, следовательно, ранжирование выполнено верно.
3.Пример. Признак – способности по математике. Для выявления способностей по
математике использовался специальный тест, содержащий 60 вопросов. Каждый ответ
оценивался «правильно» - 1, «неправильно» - 0. В результате были получены баллы:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 15
Валерий – 45, Дмитрий -34, Антон – 15, Виталий – 22.
Результаты можно упорядочить по способностям к математике.
Самым способным оказался Валерий (45), затем Дмитрий (34), затем Виталий (22),
затем Антон (15). Пусть имеются нормы, например,
0-10 очень плохие способности;
11-20 плохие способности;
21-40 средние способности;
41-50 хорошие способности;
51-60 очень хорошие способности.
Тогда, Валерий относится к группе учеников с хорошими способностями по
математике, Дмитрий и Виталий относятся к группе учеников со средними способностями, а
Антон – к группе с плохими способностями.
Результат измерения в порядковой шкале дает ответы на вопросы:
1) «К какой группе принадлежит результат измерения?»
2) «Как можно упорядочить результаты измерения?»
2.1.3. Шкала интервалов
2.1.4. Шкала отношений
Это – метрические шкалы.
А. Общее для шкал интервалов и отношений
Шкала интервалов (Interval Scale) и Шкала отношений (Ratio Scale) предназначены для
признаков, которые могут быть выражены количественно.
При этом равные разности чисел, присвоенных объектам, соответствуют равным
различиям выраженности измеряемого свойства объектов.
Поэтому измерение в шкалах интервалов и отношений дает возможность применения
единицы измерения (метрики).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 16
Измерение в этих шкалах предполагает приписывание объектам чисел, которые
отражают не только различия в степени выраженности измеряемого свойства, но и то,
насколько больше или меньше выражено свойство.
Б. Различие между шкалами интервалов и отношений
Шкала интервалов: Нулевая точка выбрана условно.
Свойство, которое измеряется, не исчезает, если результат измерения равен нулю.
Условность выбора нулевой точки позволяет судить только о том, насколько больше
или меньше выражено свойство, но не дает ответа на вопрос, во сколько раз больше или
меньше выражено свойство.
Примеры:
Ø Исчисление времени в соответствии с Григорианским календарем. Нулевая точка
выбрана условна и связывается с рождеством Иисуса Христа. Она не говорит об
исчезновении времени.
Ø Температура, определяемая в физике через кинетическую энергию движения молекул1,
измеренная по шкале Цельсия. Температура 00С не говорит об остановке молекул. Она
принята условно, как температура, при которой замерзает вода.
Результат измерения в шкале интервалов дает ответы на вопросы:
1) К какой группе принадлежит результат измерения?
2) Как можно упорядочить результаты измерения?
3) Насколько один результат измерения больше другого результата измерения?
Шкала отношений: Нулевая точка указывает на полное отсутствие выраженности
измеряемого свойства.
Название шкалы связано с тем, что отношение присваиваемых при измерении чисел
можно интерпретировать как отношение выраженности измеряемых свойств объектов. Дает
ответ на вопрос насколько больше или меньше выражено свойство, а также на вопрос, во
сколько раз больше или меньше выражено свойство.
В молекулярно-кинетической теории температура определяется как величина, характеризующая приходящуюся
на одну степень свободы среднюю кинетическую энергию частиц макроскопической системы, находящейся в
состоянии термодинамического равновесия.
1
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 17
Примеры:
Ø Исчисление времени в соответствии с иудейским календарем. Нулевая точка указывает
на сотворение мира. Она говорит об отсутствии времени;
Ø Рост, равный нулю, говорит об исчезновении роста, как свойства;
Ø Вес, равный нулю, говорит об исчезновении веса, как свойства.
Ø Температура, измеренная по шкале Кельвина. Абсолютный ноль 00К соответствует
-2730С – есть наиболее низкая возможная температура, при которой в принципе
невозможно извлечь из вещества тепловую энергию, то есть соответствует
прекращению движения молекул.
Результат измерения в шкале интервалов дает ответы на вопросы:
1) К какой группе принадлежит результат измерения?
2) Как можно упорядочить результаты измерения?
3) Насколько один результат измерения больше другого результата измерения?
4) Во сколько раз один результат измерения больше другого результата
измерения?
2.2. Мощность шкалы
Мощность
шкалы
-
это
способность
шкалы
различать
свойства
или
дифференцирующая способность шкалы (Наследов, 2004; с.27).
Это подразумевает способность шкалы отвечать на вопросы (Таблица 2.2.1):
А. К какой группе принадлежит результат измерения?
B. Как можно упорядочить результаты измерения?
C. Насколько один результат измерения больше другого результата измерения?
D. Во сколько раз один результат измерения больше другого результата
измерения?
По мере возрастания мощности шкалы можно расположить следующим образом:
1) наименований, 2) порядковая, 3) интервалов, 4) отношений.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 18
Метрические шкалы оказываются более мощными, чем неметрические. Они лучше
дифференцируют испытуемых. Метрические шкалы не ограничивают исследователя в выборе
последующего анализа.
Таблица 2.2.1
Мощность шкал
Шкала
На какие вопросы отвечает результат измерения
Номинальная неметрическая
A
Порядковая
неметрическая
A
B
Интервалов
метрическая
A
B
C
Отношений
метрическая
A
B
C
D
Неметрические шкалы менее мощные, чем метрические. Они содержат меньше
информации о различии объектов (участников исследования) по измеренному свойству.
Переход к менее мощным шкалам от более мощных часто приводит к утрате
эмпирической информации об индивидуальных свойствах участников исследования.
Поэтому надо стараться по возможности при исследовании применять более мощные
измерительные шкалы. И только если нет выбора, тогда используется любая доступная
исследователю шкала.
Пример. В Таблице 2.2.2 приводится фрагмент таблицы данных для некоторого
исследования. Признаки «пол» и «темперамент» измерены в номинальной шкале,
«самооценка» - в порядковой шкале, «температура, ºС» - в шкале интервалов, «время реакции»,
«возраст», «рост» - в шкале отношений2.
Вопрос А (К какой группе принадлежит результат измерения?) имеет ответ для всех
указанных переменных. Например, результаты измерений для участника МП16 принадлежат к
По виду данных в психологии трудно бывает отличить данные, измеренные в порядковой шкале от метрических
данных. Если распределение неноминальных данных статистически значимо не отличается от нормального
распределения, можно говорить о том, что они метрические. В противном случае данные являются порядковыми:
«либо выборка не репрезентативна популяции, либо измерения произведены не в шкале равных интервалов»
(Наследов, 2004, с.51).
2
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 19
группам: мужчин, преклонного возраста, высокого роста, меланхоликов, с низкой
самооценкой, с быстрой реакцией, измеренния проводились в условиях холода.
Вопрос В (Как можно упорядочить результаты измерения?). Упорядочить по
возрастанию или по убыванию результаты измерения можно только для признаков
«самооценка», «возраст», «рост», «время реакции» и «температура, ºС». Например, признак
«возраст»: участник АВ11 моложе участника АЛ12, который моложе участника ДЛ8, который
моложе чем НГ11, который моложе чем МП16. Или
Вопрос С (Насколько один результат измерения больше другого результата
измерения?) имеет ответ только для признаков «возраст», «рост», «время реакции» и
«температура, ºС».
Вопрос D (Во сколько раз один результат измерения больше другого результата
измерения?) имеет ответ только для признаков «возраст», «рост» и «время реакции».
Таблица 2.2.2
Фрагмент таблицы данных для некоторого исследования
Код
участника
АВ11
НГ11
АЛ12
МП16
ДЛ8
Пол:
0-женский,
1-мужской
Возраст
(лет)
1
1
1
20
70
40
80
55
Рост
(см)
160
120
165
180
140
Темперамент:
1-сангвинник,
Время
Темпера2-меланхолик, Самооценка реакции
тура, ºС
3-холерик,
(мс)
4-флегматик
1
34
3030
32
1
56
1010
24
3
82
934
19
2
40
815
-4
4
20
455
2
2.3. Особенности обработки данных в зависимости от шкал
Номинальная шкала
Методы анализа: Частотный анализ. Таблицы сопряженности (Crosstabs). Критерий
«Хи-квадрат» - Chi-square test. Сравнение процентных долей по критерию ϕ ∗ -угловое
преобразование Фишера.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 20
Мера центральной тенденции: МОДА. То есть наиболее часто встречающийся
категория признака.
Исключение: Дихотомические переменные. Для дихотомических переменных можно
определять коэффициенты корреляции, значения которых можно интерпретировать.
Например, коэффициент корреляции «фи» для двух дихотомических переменных, точечнобисериальный коэффициент корреляции для дихотомической и метрической переменных
(Гласс & Стенли, 1976). Эти коэффициенты вычисляются по формуле для коэффициента
корреляции Пирсона.
Порядковая шкала
Методы анализа: Частотный анализ. Процентили. В задачах связи: коэффициенты
ранговой корреляции Спирмена и «Тау»-Кендалла ( τ -Кендалла). В задачах различия:
непараметрические критерии, у которых вычисление наблюдаемых значений основано на
рангах.
Мера центральной тенденции: МЕДИАНА.
Если объем выборки равен нечетному числу, то посередине упорядоченного в
возрастающем порядке ряда оценок находится одна оценка, которую называют МЕДИАНОЙ.
Если объем выборки равен четному числу, то посередине упорядоченного в возрастающем
порядке ряда оценок находятся две оценки. Их полусумму называют МЕДИАНОЙ.
50-% оценок не превышают оценку, равную медиане!
Иногда возможно вычисление среднего значения.
Метрические шкалы
В SPSS обработка данных, измеренных в метрических шкалах (интервальной и
отношений) не отличается. Поэтому, метрические переменные описываются как интервальные
(Scale).
Методы анализа: Переменные, измеренные в метрических шкалах (при наличии
нормального распределения) могут обрабатываться любыми статистическими методами.
Меры центральной тенденции: СРЕДНЕЕ.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 21
Замечание. На величину среднего значения влияет каждое значение признака. Если
имеются экстремальные значения - «выбросы», то лучше использовать непараметрическую
статистику, а в качестве меры центральной тенденции - медиану.
Пример. В некоторой фирме работают 10 человек. Их заработная плата (€ в неделю)
равна:
65;
75;
80;
80;
80;
80;
80;
80;
Средняя зарплата на фирме составляет M =
80;
10000
65 + 75 + 7 ⋅ 80 + 10000
= 1070 €.
10
Медиана равна Mdn = 80, что говорит о том, что 50% сотрудников фирмы получают
зарплату не выше 80 € в неделю. Таким образом, в данной ситуации медиана является более
объективной характеристикой уровня жизни работающих на фирме, чем среднее
арифметическое.
2.4. Переменные величины
Каждый признак можно рассматривать как переменную величину, значения которой
принимают в данном исследовании различные численные значения.
Различаются непрерывные и дискретные переменные.
Непрерывные переменные могут принимать любые значения из некоторого
определенного числового интервала. Например, вес, рост, время реакции, продолжительность
жизни и т.д.
Дискретные переменные могут принимать лишь отдельные значения. Например, число
детей в семье, число пользователей интернета и т.д.
3. Основные описательные статистики
Статистические показатели, рассчитанные для выборки, называются статистиками
(statistics). Основной набор этих статистик, большая часть которых будет рассмотрена в данной
главе, принято тазывать описательными статистиками (descriptive statistics). Статистики, как
правило, обозначаются буквами латинского алфавита. Аналогичные показатели для популяции
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 22
называют параметрами (parameters). Параметры, как правило, обозначаются буквами
греческого алфавита.
В данном конспекте будут даваться два типа обозначений: во-первых, в соответствии с
обозначениями, принятыми в математической статистике; во-вторых – обозначения в
соответствии с требованиями Американской Психологической Ассоциации (American
Psychological Association, APA)
3.1. Число наблюдений
Число наблюдений (Count): как правило – это число участников, анкеты которых
включены в обработку данных. Обозначение по требованиям АРА3: N – . общее число
участников
эксперимента,
n
-
число
баллов
или
наблюдений
для
конкретного
экспериментального условия.
Valid – имеющиеся в наличии данные; Missing – пропущенные данные.
3.2. Среднее арифметическое
Среднее арифметическое (Mean, average) - это сумма всех баллов, деленная на их
количество. Обозначение - x , обозначение по требованиям АРА : М - среднее для выборки; μ
– среднее для популяции.
3.3. Стандартная ошибка среднего. Standard Error of Mean
Стандартная ошибка среднего (Standard Error of Mean) - sx обозначение по АРА: SEM,
Standard Error of Mean. Если из популяции извлекать случайные выборки одинакового объема
и для каждой из них вычислять среднее значение некоторого признака, то получится
распределение выборочных средних этого признака. Согласно центральной предельной
теореме (Гласс & Стенли, 1976, сc. 221-225) распределение выборочных средних нормальное.
Стандартное отклонение этого распределения будет равно МSE. Примерно 68% выборочных
средних будет находиться в диапазоне М ± MSE , то есть в интервале ( M − SEM ; M + SEM ) .
3
APA – American Psychological Association. http://www.apa.org/.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 23
3.4. Медиана
Медиана (Median) - обозначения медианы по АРА: Mdn. Другие обозначения: Md, Me.
Определение. Если объем выборки равен нечетному числу, то посередине
упорядоченного в возрастающем порядке ряда оценок находится одна оценка, которую
называют МЕДИАНОЙ. Если объем выборки равен четному числу, то посередине
упорядоченного в возрастающем порядке ряда оценок находятся две оценки. Их полусумму
называют МЕДИАНОЙ.
50-% данных не превышают значения, равного медиане!
3.5. Мода
Мода (Mode) – это наиболее часто встречающаяся оценка.
Если существует несколько мод, то в SPSS принято показывать наименьшую моду.
СРЕДНЕЕ, МЕДИАНА и МОДА – это показатели центральной тенденции.
Если распределение данных не отличается от нормального распределения, то эти
показатели равны.
Моду обычно используют для номинальных измерений. Обозначение: Мо.
3.6. Дисперсия
Дисперсия (Variance) характеризует разброс данных относительно среднего. Чем выше
дисперсия, тем больше разброс данных. Слово «дисперсия» означает «рассеяние».
Определение. Пусть дан эмпирический4 ряд данных:
x1 , x2 , K, xn . Выборочная
дисперсия определяется как отношение суммы квадратов отклонений баллов от среднего
значения, деленная на n − 1 :
n
s X2 =
4
∑( x − x )
i =1
2
i
n −1
.
(3.6.1)
наблюдаемый
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 24
2
Обозначение по АРА: sx .
3.7. Стандартное отклонение
Стандартное отклонение (Standard Deviation) - это квадратный корень из дисперсии.
Характеризует разброс данных относительно среднего значения. Чем выше стандартное
отклонение, тем больше разброс данных.
Обозначение по sx . Обозначение по АРА: SD.
Стандартное отклонение иногда может быть использовано для разбивки данных по
уровню оценок. Самостоятельный процесс разбивки данных, как правило, возможен только
тогда, когда в соответствующих адаптированных психологических методиках она не
приводится. Разбивать данные с помощью среднего арифметического и стандартного
отклонения можно, если эмпирическое распределение данных не отличается от нормального
распределения.
Из теории вероятностей известно, что если распределение данных подчиняется
нормальному закону распределения, то:
1) Вероятность того, что оценки попадут в интервал ( x − s x ; x + s x ) равна 68. 3%5;
2) Вероятность того, что оценки попадут в интервал ( x − 2 s x ; x + 2 s x ) равна 95. 5%;
3) Вероятность того, что оценки попадут в интервал ( x − 3s x ; x + 3s x ) равна 99. 73%.
Вероятность того, что оценки окажутся вне интервала ( x − 3s x ; x + 3s x ) ничтожно мала:
.27%.
То есть для нормально распределенных данных должен выполняться так называемый
закон «трех сигма» (для нашего случая σ = SD= sx ):
Отклонения нормально распределенных данных от среднего значения не превышают
трех стандартных отклонений.
5
Максимальное возможное значение вероятности равно 1 или 100%. Минимальное значение – 0 или 0%.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 25
Если
эмпирическое
распределение
данных
не
отличается
от
нормального
распределения и в соответствующих методиках нет указаний, какие оценки считать высокими,
низкими и адекватными (средними), то можно поступать следующим образом (Рис.3.7.1).
Рисунок 3.7.1. Разбивка данных на уровни в случае нормального распределения.
При нормальном распределении данных вероятность оценки среднего уровня равна
68.3%;
Вероятность оценки высокого или низкого уровня равна
(95.5-68.3):2=13.6%;
Вероятность оценки очень высокого или очень низкого уровня равна
(99.73-95.5):2=2.115%;
Вероятность оценки очень высокого или очень низкого уровня равна
(100-99.73):2=.135%.
Если распределение данных подчиняется нормальному закону распределения, то за
пределами трех стандартных отклонений могут находиться оценки, не принадлежащие данной
популяции.
3.8. Размах
Размах (Range) – это разность между максимальной и минимальной оценками:
l = xmax − xmin .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 26
ДИСПЕРСИЯ, СТАНДАРТНОЕ ОТКЛОНЕНИЕ и РАЗМАХ – это основные меры
изменчивости.
3.9. Асимметрия
Асимметрия
(Skewness)
является
мерой
несимметричности
распределения
относительно среднего значения. Обозначение: S.
Если S = 0, то распределение имеет симметричную форму. При отрицательной
асимметрии левый «хвост» длиннее. При положительной асимметрии правый «хвост»
длиннее. Примеры приведены на Рис.3.9.1 (Гласс & Стенли, 1976).
При нормальном распределении данных асимметрия равна нулю. Поэтому, если
асимметрия сильно отличается от нуля, распределение данных не является нормальным.
Критерием отличия от нуля является стандартная ошибка асимметрии.
S=0
M = 17
S>0
M = 17.5
S<0
M = 15.2
Рисунок 3.9.1. Примеры распределений с нулевой ( S = 0 ), левосторонней ( S > 0 ) и
правосторонней ( S < 0 ) асимметриями (Гласс & Стенли, 1976).
Для вычисления асимметрии в SPSS и в Excel используется формула:
S=
n
n
( n −1)( n − 2) ∑
i =1
( xi − x )
s3
3
,
(3.9.1)
где s – стандартное отклонение.
Для оценки величины асимметрии можно использовать следующее правило:6
•
При -0.5 ≤ S ≤ .0.5 распределение можно считать симметричным;
•
При -1 ≤ S < -0.5 или при 0.5 < S ≤ 1 распределение умеренно асимметричное;
6
Are the Skewness and Kurtosis Useful Statistics? (2016). Retrieved in https://www.spcforexcel.com/knowledge/basicstatistics/are-skewness-and-kurtosis-useful-statistics
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 27
•
При S < -1 или при S > 1 распределение асимметрично.
3.10. Стандартная ошибка асимметрии
Стандартная ошибка асимметрии (Standard Error of Skewness) - обозначение по АРА:
SES. Если из популяции извлекать случайные выборки одинакового объема и для каждой из
них вычислять асимметрию некоторого признака, то получится распределение выборочных
асимметрий. Стандартное отклонение этого распределения будет равно SES. Близкие к нулю
значения SES указывают на симметричность распределения изучаемого признака популяции.
В этом случае можно считать, что изучаемый признак в выборке тоже имеет симметричное
распределение. Высокие значения SES указывают на более высокое отклонение распределения
признака в выборке от симметричного распределения.
Стандартная ошибка асимметрии вычисляется по объему выборки (Cramer, 1997; p.85):
SES =
6n ( n −1)
( n − 2)( n +1)( n + 3)
.
(3.10.1)
Если наблюдения подчиняются нормальному закону распределения, то асимметрия
равна нулю. Поэтому большое отличие асимметрии от нуля свидетельствует о том, что
распределение данных не соответствует нормальному распределению.
Если показатель асимметрии по абсолютной величине превышает свою стандартную
ошибку:
S ≥ SES ,
(3.10)
то распределение данных не соответствует нормальному распределению (Наследов, 2004;
с.60).
3.11. Эксцесс
Эксцесс (Kurtosis) – это показатель островершинности или плосковершинности кривой
распределения. За эталон принимают вершину кривой для нормального распределения (K = 0).
Примеры приведены на Рис.3.11.1 (Гласс & Стенли, 1976).
Обозначение: K.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 28
Нормальное
распределение: K = 0
K>0
K<0
Рисунок 3.11.1. Примеры распределений с нулевым ( K = 0 ), положительным ( K > 0 ) и отрицательным
( K < 0 ) эксцессами (Гласс & Стенли, 1976).
Для вычисления эксцесса в SPSS и в Excel используется формула:
K=
n ( n +1)
n
( n −1)( n − 2)( n − 3) ∑
i =1
( xi − x )
s4
4
−
3( n −1)
2
( n − 2)( n − 3)
,
(3.11.1)
где s – стандартное отклонение.
3.12. Стандартная ошибка эксцесса
Стандартная ошибка эксцесса (Standard Error of Kurtosis) – обозначение по АРА: SEK.
Если из популяции извлекать случайные выборки одинакового объема и для каждой из них
вычислять эксцесс некоторого признака, то получится распределение выборочных эксцессов.
Стандартное отклонение этого распределения будет равно SEК.
Если из популяции извлекать случайные выборки одинакового объема и для каждой из
них вычислять эксцесс некоторого признака, то получится распределение выборочных
эксцессов. Стандартное отклонение этого распределения будет равно SEK.
Близкие к нулю значения SEK говорят о том, что выборочные эксцессы мало
отличаются между собой и от нуля и поэтому распределение признака в данной выборке не
отклоняется от распределения с нулевым эксцессом.
Стандартная ошибка эксцесс вычисляется по объему выборки (Cramer, 1997; p.89):
n2 −1
SEK = 2 ∗ SES ∗
=
( n − 3)( n + 5)
24n ( n −1)
.
( n − 2)( n − 3)( n + 3)( n + 5)
2
(3.12.1)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 29
Если наблюдения подчиняются нормальному закону распределения, то эксцесс равен
нулю. Поэтому сильное отличие эксцесса от нуля свидетельствует о том, что распределение
данных не соответствует нормальному распределению.
Стандартная ошибка эксцесса – это одна из мер степени отличия эксцесса от нуля.
Если показатель эксцесса по абсолютной величине превышает свою стандартную
ошибку:
K ≥ SEK ,
(3.12.2)
то распределение данных не соответствует нормальному распределению.
3.13. Квартили
Квартиль (Quartile) – это один из видов процентилей (Percentile)
Квартили – это показатели, которые делят упорядоченный по возрастанию ряд
данных на четыре одинаковые части.
Существуют три квартили: Q1 , Q2 , Q3 .
Процентили – это показатели, которые делят упорядоченный по возрастанию ряд
данных на сто одинаковых частей
Существует 99 процентилей: P1 , P2 ,K, P99 .
P50 = Q2 = Mdn
P25 = Q1
P1
P10
P20 P25 P30
P75 = Q3
P40
P50
P60
P70 P75 P80
P90
P99
Рисунок 3.13.1. Процентили, квартили и медиана.
Справедливы соотношения (Рис.3.13.1): P25 = Q1 ; P50 = Q2 = Mdn; P75 = Q3 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 30
Процентиль Pk дает информацию о том, что k-% данных, не превышает значения,
совпадающего с Pk .
Таким образом,
25-% данных не превышают значения, равного квартили Q1 .
50-% данных не превышают значения, равного медиане и квартили Q2 .
75-% данных не превышают значения, равного квартили Q3 .
Довольно часто используют меру изменчивости – междуквартильный размах
(Interquartie Range, IQR):
Q = Q3 - Q1 .
(3.13.1)
50% данных меняется в пределах Q.
3.14. Стандартизованные данные
Если от данных баллов xi . переходят к другим баллам zi по формуле
zi =
xi − x
,
sx
(3.14.1)
то баллы zi называют стандартизованными (z-scores).
Стандартизованные оценки обладают следующими свойствами.
1. Среднее арифметическое равно нулю:
M (Z ) = z =
1 n
∑ zi = 0 .
n i =1
(3.14.2)
2. Дисперсия равна единице:
s z2 =
1
n −1
n
2
∑ (z i − z )
i =1
=
1
n −1
n
∑z
i =1
2
i
= 1.
(3.14.3)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 31
3. Стандартное отклонение равно единице:
SD ( Z ) = s z = s z2 = 1 .
(3.14.4)
Как можно стандартизовать переменные с помощью компьютерной
программы SPSS
Забегая вперед, покажем, как с помощью SPSS можно перевести переменные
X 1 , X 2 ,K , X m в стандартизованные переменные. Для этого нужно загрузить SPSS файл данных
с этими переменными.
Analyze
Descriptive Statistics
Descriptives…
Перенести переменные в окно «Variables»
Поставить галочку в окне Save standardized values as variable
OК
В файле данных появятся новые стандартизованные переменные, которые можно
назвать, например, Z1 , Z 2 ,K, Z m .
4. Расчет описательных статистик с помощью компьютерной
программы SPSS
SPSS английское название компьютерной программы: Statistical Package for Social
Sciences (Статистический пакет для социальных наук). Разработан специально для
социальных исследований. Ввод данных и статистический анализ соответствуют типам
данных, встречающихся в анкетах и методам аналаза, применяющихся в социальных науках.
С помощью программы SPSS показатели описательной статистики можно вычислить
разными способами. Основные из них показаны в Таблице 4.1.
Работу с программой SPSS рассмотрим на примерах.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 32
Таблица 4.1.
Frequencies
Explore
▲
▲
▲
▲
Median (Медиана)
▲
▲
▲
Mode (Мода)
▲
Quartiles (Квартили)
▲
Percentiles (Процентили)
▲
▲
Mean (Среднее)
Case
Summaries
Descriptives
Расчет показателей описательной статистики в SPSS7 (Бююль)
Variance (Дисперсия)
▲
▲
▲
▲
Standard Deviation (Стандартное отклонение)
▲
▲
▲
▲
Standard Error of Mean (Стандартная ошибка среднего)
▲
▲
▲
▲
Sum (Сумма)
▲
▲
Minimum (Минимум)
▲
▲
▲
▲
Maximum (Максимум)
▲
▲
▲
▲
Range (Размах)
▲
▲
▲
▲
▲
▲
Q=Q3-Q1
▲
▲
▲
▲
▲
▲
▲
▲
Kurtosis (Эксцесс)
▲
▲
▲
▲
Standard Error of Kurtosis (Стандартная ошибка эксцесса)
▲
▲
▲
▲
Skewness (Асимметрия)
Standard Error of Skewness (Стандартная ошибка
асимметрии)
Confidence Interval for Mean (Доверительный интервал для
▲
среднего)
▲
Outliers (Выбросы)
Стандартизация переменных: Z-преобразование
▲
Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и
восстановление скрытых закономерностей. СПб: ООО «ДиаСофтЮП». C. 164-165.
7
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 33
5. Гендерные различия агрессии у подростков
5.1. Ввод данных
Проверяется гипотеза о наличии гендерных различий агрессии у подростков.
Используется опросник Басса-Дарки (Бартышев, 2005; сс. 195-200) (Приложение 1). Данные8
находятся в файле Aggression_Data.xlsx.
Рисунок 5.1.1. Запуск программы SPSS.
Рисунок 5.1.2. Электронная таблица. Просмотр данных.
Данные взяты из курсовой работы студентки Высшей школы психологии (Сейчас Балтийская Международная
Академия - БМА) Наталии Баранчук, выполненной в 2003-2004 учебном году.
8
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 34
Рисунок 5.1.3. Электронная таблица. Просмотр переменных.
Фрагмент таблицы данных, которые надо ввести, находится в Таблице 4.1.1. Полная
таблица данных - в файле Agr_Data.xlsx.
Таблица 5.1.1
Показатели уровней агрессии подростков по методике Басса – Дарки
Code
m1
m2
m3
m4
Gender:
0-Female;
1-Male
PhA
IA
I
N
R
S
VA
G
5
5
5
6
8
8
7
6
6
8
7
7
3
3
1
4
6
5
3
3
6
7
4
5
7
4
5
7
4
3
5
5
Обозначения9:
Physical aggression (PhA)
Indirect Aggression (IA)
Irritation (I)
Negativism (N)
Resentment (R)
Suspicion and Distrust (S)
Verbal Aggression (VA)
Guilt (G)
9
Физическая агрессия
Косвенная агрессия
Раздражение
Негативизм
Обида
Подозрительность
Вербальная агрессия
Чувство вины
Questionnaire Bass-Darky. Retrieved from http://ecowoman-english.tk/articles.php?id=35667
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 35
5.1.1. Описание переменных
Ввод данных следует начать с описания переменных (Variable View).
Левой клавишей мыши щелкнуть на Variable View (Просмотр переменных).
В результате появится окно (Рис.5.1.3), в котором надо описать каждую из переменных.
1. Прежде всего необходимо дать имя переменной (Name). При выборе имени следует
соблюдать основные правила.
1) Имя каждой переменной должно быть единственным. Дублирование имени не
допускается.
2) Имена могут содержать:
- буквы латинского или русского алфавита;
- цифры;
- символ подчеркивания;
- точку;
- символы: @, $ и #.
3) Не разрешаются пробелы, знаки других алфавитов и специальные символы, такие как
!
?
«
*()-
4) Имя должно начинаться с буквы.
5) Последний символ имени не может быть точкой или знаком подчеркивания.
6) Недопустимо в названиях использовать слова:
all
and
or
not
with
by
eq
ne
lt
le
gt
ge
to
Если вводится неразрешенное имя переменной, то программа SPSS сообщает об этом.
В имена переменных для рассматриваемого примера приведены в Таблице 4.1.2.
Основой для наименования переменных послужили соответствующие термины на латышском
языке.
2. Тип переменной (Type). По умолчанию все переменные численные с максимальной
длиной 8 знаков, дробная часть состоит из 2 знаков. Если требуется что-то изменить,
необходимо встать мышью на соответствующую ячейку и щелкнуть по кнопке с тремя
точками:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 36
После чего откроется диалоговое окно (Рис.5.1.1.1) Define Variable Type – Определение типа
переменной.
Ввод данных в SPSS будет осуществлен на английском языке с использованием
терминологии авторов методики.10 Возможно использование других языков.
Таблица 5.1.1.2
Описание переменных. Имена переменных, метки и значения.
Переменная
Обозначение
Имя в SPSS
(Label)
Шифр участника
Пол (0-девочка; 1-мальчик)
Физическая агрессия
Косвенная агрессия
Раздражение
Негативизм
Обида
Подозрительность
Вербальная агрессия
Чувство вины
Gender
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
Code
sex
PhA
IA
I
N
R
S
VA
G
Метки значений
(Values)
(0-Female; 1-Male)
Рисунок 5.1.1.1. Диалоговое окно Define Variable Type.
10
Questionnaire Bass-Darky. Available at: http://ecowoman-english.tk/articles.php?id=35667
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 37
В нашем примере необходимо изменить тип переменной kod, так как это не численная
переменная, а строка символов. Поэтому для нее надо выбрать String.
С такими переменными нельзя выполнять никаких вычислений, но можно проводить
подсчеты ее повторяемости.
3. Формат столбца (Width) и количество десятичных разрядов (Decimals) меняется
по необходимости.
4. Метка переменной (Label) – это более подробное название переменной. Оно может
содержать 256 символов. Это то, что будет выдаваться в таблицах, на рисунках в выходной
информации. Например, если мы хотим, чтобы в выходной информации вместо символов PhA
на диаграмме было бы напечатано: «Physical Aggression», то в колонке Label надо написать:
Physical Aggression.
5. Метки значений (Values). Это более подробное описание переменной. Например,
переменную sex (Пол) для значения 1 можно задать название «Male» (мальчик), а для значения
0 – название «Female» (девочка). При этом эти же названия будут в выходной информации.
6. Пропущенные значения (Missing values). Допускаются два вида пропущенных
значений:
- Пропущенные значения, определяемые системой (System-defined missing values) – если
в матрице данных есть незаполненные ячейки, то SPSS идентифицирует их как пропущенные
значения. Тогда в ячейке, где пропущено значение, появляется запятая;
- Пропущенные значения, задаваемые пользователем (User-defined missing values). С
помощью кнопки Missing пользователь при желании может объявить эти значения
пропущенными. Пропущенные значения можно исключить из последующих вычислений.
7. Столбцы (Columns) – ширина столбца, которую будет иметь в таблице данный
столбец при отображении значений.
8. Выравнивание (Alignment). Можно задавать вид отображения значений в таблице:
выровненными по правому краю, по центру, или по левому краю.
9. Шкала измерения (Measure). Можно задать номинальную (Nominal), порядковую
(Ordinal) или метрическую шкалу (интервалов или отношений: Scale). Это будет иметь
значение только при создании интерактивных графиков – когда номинальная и порядковая
шкала измерений объединяются в «категориальный» тип.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 38
Начало работы
«Шифр испытуемого»
1. В ячейку Name 1 напишем слово Code
После этого в остальных ячейках строки 1 появится некоторая информация.
2. Type.
Встанем мышью на соответствующую ячейку Type-1 и щелкнем по кнопке с тремя точками:
Откроется диалоговое окно (Рис.5.1.1.2) Variable Type – Определение типа переменной.
Выберем String.
Рисунок 5.1.1.2. Диалоговое окно Variable Type.
OK
3. Width –
4. Decimals:
5. Label:
6. Values:
7. Missing:
8. Columns:
9. Align:
10. Measure:
8
None
None
None
8
Left
Nominal
«Пол»: sex
11. В ячейку Name 2 напишем sex
12. Decimals: 0
13. Width –
1
14. Label:
Gender
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 39
15. Values:
Нажмем кнопку:
Появится диалоговое окно (Рис.5.1.1.3):
Рисунок 5.1.1.3. Диалоговое окно Value Labels.
Value 0
Value Label
Female
Add
Value 1
Value Label
MaleAdd
В результате получаем (Рис.5.1.1.4):
Рисунок 5.1.1.4. Диалоговое окно Value Labels с введенными данными.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 40
OK
16. Missing:
None
17. Columns: 8
18. Align:
Right
19. Measure: Nominal
Сохранить данные!
(File, Save и т.д.). Дать имя файлу!
Например, «Data.sav».
В результате должен появиться новый файл (Output 1) с сообщением о том, что файл
сохранен по такому-то адресу. Например (Рис.5.1.1.5):
Рисунок 5.1.1.5. Новый файл Output 1 сообщением о файле с исходными данными.
«Физическая агрессия»
20. В ячейку Name 3 напишем PhA
21. Type
Numeric
22. Width –
8
23. Decimals: 2
24. Label:
Physical Aggression
25. Values:
None
26. Missing:
None
27. Columns: 8
28. Align:
Right
29. Measure: Scale
«Косвенная агрессия»
30. В ячейку Name 4 напишем IA
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 41
31. Type
Numeric
32. Width –
8
33. Decimals: 2
34. Label:
Indirect Aggression
35. Values:
None
36. Missing:
None
37. Columns: 8
38. Align:
Right
39. Measure: Scale
«Раздражение»
40. В ячейку Name 5 напишем I
41. Type
Numeric
42. Width –
8
43. Decimals: 2
44. Label:
Irritation
45. Values:
None
46. Missing:
None
47. Columns: 8
48. Align:
Right
49. Measure: Scale
«Негативизм»
50. В ячейку Name 6 напишем N
51. Type
Numeric
52. Width –
8
53. Decimals: 2
54. Label:
Negativism
55. Values:
None
56. Missing:
None
57. Columns: 8
58. Align:
Right
59. Measure: Scale
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 42
«Обида»
60. В ячейку Name 7 напишем R
61. Type
Numeric
62. Width –
8
63. Decimals: 2
64. Label:
Resentment
65. Values:
None
66. Missing:
None
67. Columns: 8
68. Align:
Right
69. Measure: Scale
«Подозрительность»
70. В ячейку Name 8 напишем S
71. Type
Numeric
72. Width –
8
73. Decimals: 2
74. Label:
Suspicion and Distrust
75. Values:
None
76. Missing:
None
77. Columns: 8
78. Align:
Right
79. Measure: Scale
«Вербальная агрессия»
80. В ячейку Name 9 напишем VA
81. Type
Numeric
82. Width –
8
83. Decimals: 2
84. Label:
Verbal Aggression
85. Values:
None
86. Missing:
None
87. Columns: 8
88. Align:
Right
89. Measure: Scale
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 43
«Чувство вины»
90. В ячейку Name 10 напишем G
91. Type
Numeric
92. Width –
8
93. Decimals: 2
94. Label:
Guilt
95. Values:
None
96. Missing:
None
97. Columns: 8
98. Align:
Right
99. Measure: Scale
В результате получится (Рис.5.1.1.6).
Рисунок 5.1.1.6. Описание переменных.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 44
5.1.2. Ввод данных
Перейти в окно Data View и ввести данные (их можно скопировать из Excel или из
Word). Фрагмент результата (Рис.5.1.2.1):
Рисунок 5.1.2.1. Ввод данных. Фрагмент.
5.2. Описательные статистики
Вариант I
После ввода данных начинается их обработка, в зависимости от сформулированной
исследователем гипотезы. Но, как правило, показатели описательной статистики вычисляются
всегда.
Для
вычисления
показателей
описательной
статистики
имеется
следующие
возможности (Таблица 4.1) (Бююль & Цефель, 2002; сс.164-165).
1)
Analyze (Анализ)
Descriptive Statistics (Описательная статистика)
Descriptives... (Описательная статистика)
2)
Analyze (Анализ)
Descriptive Statistics (Описательная статистика)
Frequencies (Частоты)
3)
Analyze (Анализ)
Descriptive Statistics (Описательная статистика)
Explore... (Исследовать)
4)
Analyze (Анализ)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 45
Reports (Отчеты)
Case Summaries... (Итоги по наблюдениям)
Для рассматриваемой задачи о гендерных различиях необходимо получить
показатели описательной статистики для мальчиков и для девочек по-отдельности, чтобы
потом их сравнить. Поэтому, в начале работы надо расщепить данные отдельно на мальчиков
и девочек, используя группирующую переменную «Dzimums» (sex).
Data
Split file...(Рис.5.2.1)
Рисунок 5.2.1. Анализ всех случаев, без создания групп.
Organize output by groups
Перенести переменную «Dzimums [sex]» в окно “Groups Based on” ...(Рис.5.2.2).
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 46
Рисунок 5.2.2. Организация выхода по группам.
В результате данные окажутся разбитыми на 2 группы: мальчиков и девочек.
Результаты будут выдаваться по группам мальчиков и девочек отдельно.
В выходном файле (Output) появится сообщение:
SORT CASES BY sex.
SPLIT FILE SEPARATE BY sex.
Новый файл с выходной информацией Output2 надо сохранить (в том же фолдере) под
каким-либо именем, например, Results. Точнее Results.spv.
Получение показателей описательной статистики
Analyze
Descriptive Statistics
Frequencies...
Перенести в окно “Variables” все переменные, за исключением “Code” и “Gender” (Рис.5.2.3).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 47
Рисунок 5.2.3. Перенос переменных для получения описательной статистики.
Галочку с “Display frequency tables” можно снять. При этом программа SPSS
предупредит о том, что никакой выходной информации не заказано.
Statistics
Рисунок 5.2.4. Заказ показателей описательной статистики.
Отметить статистики, значения которых надо получить (Рис.5.2.4).
Continue
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 48
Выходная информация
Выходная информация выдается в виде таблиц, в которых данные необходимо
округлить (до 2 знаков после запятой). Обработку таблиц удобно проводить с помощью
Компьютерной программы Excel (Файл Agr_Results.xls). В результате получаются таблицы
5.2.1 и 5.2.2.
В Таблицах 5.2.1-5.2.2 отмечены случаи, когда показатели асимметрии и эксцесса по
абсолютной величине превосходят свои стандартные ошибки. В этих случаях распределение
данных отличается от нормального распределения.
В Таблицах 5.2.1-5.2.2 использованы сокращенные названия переменных, вместо
полных названий, которые выдает SPSS.
Таблица 5.2.1.
Показатели описательной статистики для девочек
PhA
IA
I
N
R
S
VA
G
30
30
30
30
30
30
30
30
Mean
5.33
7.17
6.43
2.27
4.67
5.53
6.07
5.03
Std. Error of Mean
0.22
0.20
0.17
0.19
0.19
0.25
0.22
0.25
Median
5.00
7.00
6.00
2.00
5.00
6.00
6.00
5.00
Std. Deviation
1.21
1.12
0.94
1.01
1.06
1.38
1.23
1.38
Skewness
2.03
-0.03
0.61
0.05
-0.38
0.18
-0.61
0.19
Std. Error of Skewness
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
Kurtosis
6.66
-1.16
0.76
-1.20
-1.01
-0.83
-0.61
-0.59
Std. Error of Kurtosis
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Range
6.00
4.00
4.00
3.00
3.00
5.00
4.00
5.00
Minimum
4.00
5.00
5.00
1.00
3.00
3.00
4.00
3.00
N
Valid
Missing
Maximum
10.00
9.00
9.00
4.00
6.00
8.00
8.00
8.00
25
5.00
6.00
6.00
1.00
4.00
4.00
5.75
4.00
50
5.00
7.00
6.00
2.00
5.00
6.00
6.00
5.00
75
a Gender = Female
6.00
8.00
7.00
3.00
5.25
6.25
7.00
6.00
Percentiles
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 49
Таблица 5.2.2.
Показатели описательной статистики для мальчиков
PhA
IA
I
N
R
S
VA
G
30
30
30
30
30
30
30
30
Mean
8.03
5.00
6.27
4.33
4.07
5.10
9.60
5.20
Std. Error of Mean
0.30
0.38
0.24
0.19
0.22
0.19
0.37
0.21
Median
8.50
5.00
6.00
5.00
4.00
5.00
10.00
5.00
Std. Deviation
1.65
2.10
1.34
1.03
1.23
1.06
2.04
1.16
Skewness
-0.60
-0.41
0.31
-1.35
0.58
0.53
-0.61
0.58
Std. Error of Skewness
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
Kurtosis
-0.43
0.00
-0.49
0.54
-0.46
-0.93
0.33
0.05
Std. Error of Kurtosis
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Range
6.00
8.00
5.00
3.00
5.00
3.00
8.00
5.00
Minimum
5.00
1.00
4.00
2.00
2.00
4.00
5.00
3.00
N
Valid
Missing
Maximum
Percentiles
11.00
9.00
9.00
5.00
7.00
7.00
13.00
8.00
25
7.00
4.00
5.00
4.00
3.00
4.00
8.75
4.00
50
8.50
5.00
6.00
5.00
4.00
5.00
10.00
5.00
75
9.00
7.00
7.00
5.00
5.00
6.00
11.00
6.00
a Gender = Male
Вариант 2
Если данной процедуре предшествовало разбиение данных на группы, то необходимо
вернуться к исходной неразбитой группе.
Data
Split file...
Reset
OK
В файле с выходной информацией Results.spv появится сообщение:
SPLIT FILE OFF.
Начало новой процедуры:
Analyze
Descriptive Statistics
Explore
Перенести переменную «Gender [sex]» в окно “Factor List”.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 50
Перенести в окно “Dependent List” все переменные, за исключением “Code” и “Gender”
(Рис.5.2.5).
Поставить точку у Statistics (Рис.5.2.5).
OK
Рисунок 5.2.5. Получение показателей описательной статистики в Explore.
Выходная информация:
Таблица с информацией об обработанных наблюдениях (Таблица 5.2.3).
Таблица 5.2.3
Фрагмент таблицы «Case Processing Summary» (Обработанные наблюдения)
Gender
N
Physical Aggression
Indirect Aggression
Irritation
Valid
Percent
Cases
Missing
N
Percent
N
Total
Percent
Female
30
100.0%
0.0%
30
100.0%
Male
Female
Male
Female
Male
30
30
30
30
30
100.0%
100.0%
100.0%
100.0%
100.0%
0.0%
0.0%
0.0%
0.0%
0.0%
30
30
30
30
30
100.0%
100.0%
100.0%
100.0%
100.0%
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 51
Таблица 5.2.4
Описательные статистики (Descriptives). Фрагмент таблицы.
Gender
Statistic
Mean
95% Confidence Interval for
Mean
5.3333
Lower Bound
4.8804
Upper Bound
5.7863
5% Trimmed Mean
5.2037
Median
5.0000
Variance
Female
Physical Aggression
Std. Deviation
1.21296
Minimum
4.00
Maximum
10.00
Range
6.00
Interquartile Range
1.00
Skewness
2.033
.427
Kurtosis
6.661
.833
8.0333
.30127
95% Confidence Interval for
Mean
Lower Bound
7.4172
Upper Bound
8.6495
5% Trimmed Mean
8.0556
Median
8.5000
Variance
Std. Deviation
Minimum
•
.22145
1.471
Mean
Male
Std. Error
2.723
1.65015
5.00
Interquartile Range (Междуквартильный размах). Это разность между третьим и первым
квартилями: Q = Q3 − Q1 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект лекций. 52
5.3. Графические иллюстрации уровней агрессии
мальчиков и девочек
5.3.1. Коробчатые диаграммы
Коробчатые диаграммы (Boxplots) (Рис.5.3.1) состоят из прямоугольника,
занимающего пространство от первого до третьего квартиля.
Рисунок 5.3.1.1. Коробчатая диаграмма.
Линия внутри прямоугольника соответствует медиане.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
53
Значения, удаленные от границ более чем на три длины построенного
прямоугольника (экстремальные значения или «выбросы»), помечаются на диаграмме
звездочками с номером соответствующего наблюдения в программе SPSS (Extremes).
Значения, удаленные более, чем на полторы длины прямоугольника (экстремальные
значения или «выбросы»), помечаются кружкам с номером соответствующего наблюдения
в программе SPSS (Outliers).
На коробчатой диаграмме в виде «усов»1 отмечаются минимальное и максимальное
значения, если они не являются выбросами (Extremes и Outliers) (Бююль & Цефель, 2002
c.173).
Задание. Для переменных «Физическая агрессия» (PhA), «Косвенная агрессия»
(IA) и «Вербальная агрессия» (VA) в группах мальчиков (Male) и девочек (Female) даны
фрагменты частотных таблиц и квартили. По этим данным рекомендуется вручную
PhA
IA
VA
25
5.00
6.00
5.75
50
5.00
7.00
6.00
75
6.00
8.00
7.00
Percentiles
Percentiles
построить коробчатые диаграммы и сверить с диаграммами, полученными в SPSS.
VA
25
7.00
4.00
8.75
50
8.50
5.00
10.00
75
9.00
7.00
11.00
Frequency
IA
Frequency
5.00
1
1.00
4
5.00
14
6.00
2
6.00
10
4.00
7
6.00
7
7.00
3
7.00
5
5.00
8
7.00
2
8.00
6
8.00
11
6.00
10.00
1
9.00
11
9.00
3
7.00
Total
30
10.00
3
Total
30
8.00
11.00
1
Total
30
a
Пол
Female
a Пол = Male
=
Frequency
IA
4
VA
Frequency
5.00
Frequency
PhA
6
VA
Frequency
4.00
a Пол = Female
IA
a Пол = Male (мальчик)
PhA
a Пол = Female (девочка)
PhA
4.00
6
5.00
2
5.00
1
6.00
1
6.00
10
7.00
1
3
7.00
11
8.00
3
5
8.00
2
9.00
5
2
Total
30
9.00
1
Total
30
a
Пол
Female
10.00
11.00
12.00
13.00
9
4
3
2
Total
30
a Пол = Male
=
a Пол = Male
Для «Физической агрессии» построение изображено на Рис.5.3.1.2.
Из Рис.5.3.1.2 видно, что уровень физической агрессии выше у мальчиков.
В русскоязычной литературе коробчатые диаграммы часто называют «ящик с усами».
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
1
54
Среди девочек имеется девочка-драчунья (*24), у которой экстремально высокий
уровень физической агрессии. Информация о ней поволяет разыскать ее родителей, с тем,
чтобы принять меры относительно ее здоровья.
Рисунок 5.3.1.2. Коробчатая диаграмма для «Физической агрессии» девочек и мальчиков:
построение.
Если распределение данных не отличается от нормального распределения, то
разбивку данных на высокие, средние и низкие осуществляют по стандартным отклонениям
(п. 3.7).
В любых случаях разбивку данных на уровни можно осуществлять используя
квартили (Наследов, 2004; с.43):
Низкие показатели – ниже Q1 ; Средние показатели - ( Q1 ; Q3 ) ;
Высокие показатели - выше Q3 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
55
Рисунок 5.3.1.3. Разбивка данных на уровни по коробчатой диаграмме.
Очевидно, что более детальную разбивку можно осуществлять используя
коробчатые диаграммы (Рис.5.3.1.3).
В пределах «коробки» ( Q1 ; Q3 ) будут лежать средние показатели.
Ниже «коробки» (ниже Q1 ) – низкие показатели. Причем для (Q1 − 1,5Q ; Q1 ) - низкие;
для (Q1 − 3Q ; Q1 − 1,5Q ) - очень низкие показатели (зона Outliers); для показателей, которые
меньше, чем Q1 − 3Q - чрезвычайно низкие показатели (зона Extremes), для которых
соответствующие испытуемые могут быть уже представителями другой популяции
(«патологически недоразвитых», для признака «способности»).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
56
Выше «коробки» (выше Q3 ) – высокие показатели. Причем для (Q3 ; Q3 + 1,5Q ) высокие; для
(Q3 + 1,5Q; Q3 + 3Q )
- очень высокие показатели (зона Outliers); для
показателей, которые больше, чем Q3 + 3Q - чрезвычайно высокие показатели (зона
Extremes), для которых соответствующие испытуемые могут быть уже представителями
другой популяции («гениев», для признака «способности»).
5.3.2. Построение и редактирование коробчатых диаграмм в
SPSS
Data
Split file
Reset
OK
В файле Results.spv появится сообщение: SPLIT FILE OFF.
Analyze
Descriptive Statistics
Explore
Plots
Plots
Рисунок 5.3.2.1. Получение коробчатых диаграмм, где все переменные по-отдельности.
Continue
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
57
Рисунок 5.3.2.2. Коробчатые диаграммы для переменной «Физическая агрессия».
Неотредактированный рисунок.
Для получения рисунка, который займет гораздо меньше места и будет более
строгим (например, по вертикальной оси будут отложены целые числа, цвета на рисунке
будут
черно-серо-белыми),
рисунок,
полученный
в
файле
Results.spv,
надо
отредактировать. Для этого щелкнем два раза мышью по этому рисунку и войдем в редактор
рисунков (Chart Editor) (Рис.5.3.2.3), с диалоговым окном Properties.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
58
Рисунок 5.3.2.3. Редактор рисунков для переменной «FА» с диалоговым окном Properties.
Рисунок 5.3.2.4. Редактор рисунков. Мышь поставлена на произвольную точку серого поля
рисунка. При этом это поле выделяется. Задачей является сделать это поле белым. Для этого
надо щелкнуть мышью по белому прямоугольнику окна «Properties». Apply.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
59
Рисунок 5.3.2.5. Редактор рисунков. Мышь поставлена на левую «коробку» рисунка. Два
щелчка. При этом «коробка» выделяется. Задачей является сделать ее серой. Для этого надо
щелкнуть мышью по серому прямоугольнику окна «Properties». Apply.
Повторить это же действие с правой «коробкой», сделав ее белой (Рис.5.3.2.6).
Рисунок 5.3.2.6. Редактор рисунков. Мышь поставлена на левую «звездочку». При этом
«звездочка» выделяется. Задачей является сделать ее большой. Для этого в окне «Properties»
надо мышью выбрать Size 15. Apply.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
60
Рисунок 5.3.2.7. Редактор рисунков. Мышь поставлена на метку «24» «звездочки» - номер
девочки - драчуньи. При этом метка выделяется. Задачей является сделать метку большой.
Для этого в окне «Properties» надо мышью нажать на кнопку Text Style и в изменившемся
окне выбрать размеры шрифта. Наример, Prefered Size: 22, Minimum Size 22. Apply.
Аналогичным образом, поочередно вставая мышью на слова «Physical Aggression»
и «Gender» изменить размер их шрифта на Prefered Size: 22, Minimum Size 22. Apply.
Рисунок 5.3.2.8. Редактор рисунков. Мышь поставлена на горизонтальную ось. Например,
на «Female». При этом выделяются «Female» и «Male». Задачей является сделать эти буквы
большими. Для этого в окне «Properties», Text Style выбрать размеры шрифта. Prefered
Size: 20, Minimum Size 20. Apply.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
61
Аналогичным образом изменить размер шрифта на вертикальной оси, выбрав
Prefered Size: 18, Minimum Size 18. Apply.
Наконец, изменим формат числа на вертикальной оси, убрав нули после точки.
Рисунок 5.3.2.9. Редактор рисунков. Мышь поставлена на вертикальную ось. Например, на
«10.00». При этом выделяются все числа на оси. Задачей является сделать эти числа
целыми. Для этого в окне «Properties» нажимаем на кнопку Number Format и выбираем
Decimal Places: 0. Apply.
После чего закрываем редактор рисунков. Копируем рисунок в файле Results.spv,
переносим его в Word и уменьшаем. В результате получается Рис.5.3.2.10.
Все
дальнейшие
рисунки,
приведенные
в
данном
конспекте,
будут
отредактированными. Основные идеи редактирования были показаны при редактировании
рисунка 5.3.2.2. Дальнейшие ситуации, которые могут возникнуть в процессе
редактирования, придется осваивать читателю самостоятельно.
В результате получим коробчатые диаграммы для всех переменных (Рис.5.3.2.10) –
(5.3.2.17).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
62
Рисунок 5.3.2.10. Коробчатые диаграммы
для переменной «Physical Aggression»
(физическая агрессия).
Рисунок 5.3.2.11. Коробчатые диаграммы
для переменной «Indirect Аggression»
(косвенная агрессия).
Рисунок 5.3.2.12. Коробчатые диаграммы
для переменной «Irritation» (раздражение).
Рисунок 5.3.2.13. Коробчатые диаграммы
для переменной «Negativism»
(негативизм).
Рисунок 5.3.2.14. Коробчатые диаграммы
для переменной «Resentment» (обида).
Рисунок 5.3.2.15. Коробчатые диаграммы
для переменной «Suspicion»
(Подозрительность).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
63
Рисунок 5.3.2.16. Коробчатые диаграммы
для переменной «Verbal Аggression»
(вербальная агрессия).
Рисунок 5.3.2.17. Коробчатые диаграммы
для переменной «Guilt» (Чувство вины).
Коробчатую диаграмму для всех переменных на одном рисунке (Рис. 5.3.2.18)
можно получить так:
Analyze
Descriptive Statistics
Explore
Plots
Plots
Dependents Together
Continue
OK
Рисунок 5.3.2.18. Коробчатая диаграмма, для всех переменных вместе.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
64
Для получения информации о выбросах на коробчатых диаграммах (например, для
переменной “Physical Aggression”), надо выполнить следующие действия.
Analyze
Descriptive Statistics
Explore (оставит только переменную “Physical Aggression”)
Statistics
Statistics
Статистические показатели Descriptives уже вычислены, поэтому флажок для них
можно снять. Установим флажок для выбросов: Outliers.
Рисунок 5.3.2.19. Диалоговое окно Explore: Statistics
Outliers
Continue
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
65
Выходная информация
Таблица 5.3.2.1
Фрагмент выходной таблицы «Extreme Values»
Gender
Case Number
Value
1
24
10.00
2
19
7.00
Highest
3
22
7.00
4
4
6.00
5
7
6.00a
Female
1
28
4.00
2
25
4.00
Lowest
3
17
4.00
4
13
4.00
5
8
4.00b
Physical Aggression
1
38
11.00
2
31
10.00
Highest
3
36
10.00
4
50
10.00
5
32
9.00c
Male
1
58
5.00
2
54
5.00
Lowest
3
43
5.00
4
41
5.00
5
55
6.00d
a. Only a partial list of cases with the value 6.00 are shown in the table of upper extremes.
b. Only a partial list of cases with the value 4.00 are shown in the table of lower extremes.
c. Only a partial list of cases with the value 9.00 are shown in the table of upper extremes.
d. Only a partial list of cases with the value 6.00 are shown in the table of lower extremes.
Таблица 5.3.2.1 – это выходная таблица «Extreme Values»с информацией о
выбросах и других максимальных (highest) и минимальных (lowest) значениях
обрабатываемых данных. Выводятся по 5 наименьших и наибольших значений.
5.3.3. Диаграммы для средних значений
5.3.3.1. Построение с помощью Excel
По данным описательной статистики в Excel строится Таблица 5.3.3.1.1 для средних
значений:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
66
Таблица 5.3.3.1.1
Средние значения для мальчиков и для девочек
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal
Aggression
Female
5.33
7.17
6.43
2.27
4.67
5.53
6.07
5.03
Mean
8.03
5.00
6.27
4.33
4.07
5.10
9.60
5.20
Guilt
Затем строится график (Рис.5.3.3.1.1).
Рисунок 5.3.3.1.1. Диаграмма для средних значений.
5.3.3.2. Построение с помощью SPSS
Образуем новый файл с данными Data_Factor.sav, предварительно подготовив их в
Excel (Aggression_Data_Factor.xlsx).
Данные надо ввести по-другому: образовать новую переменную (factor) и
группирующую переменную для ее уровней fac_ind (1- Physical Aggression, 2- Indirect
Aggression, 3- Irritation, 4- Negativism, 5- Resentment, 6- Suspicion and Distrust, 7- Verbal
Aggression, 8- Guilt) (Рис.5.3.3.2.1-5.3.3.2.3).
Graphs
Legacy Dialogs2
Bar (Рис.5.3.3.2.4)
Clustered
Define
2
То, что взято из более старых версий SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
67
В появившемся окне «Define Clustered Bar: Summaries for Groups of Cases»
распределить переменные Factor[f_ind] в окно «Category Axis», группирующую
переменную «Gender» в окно «Define Clusters by», переменную Factor [f] в окно «Variable».
Получившийся вид окна изображен на Рис.5.3.3.2.5. OK.
Рисунок 5.3.3.2.1. Ввод данных с переменной «factor» и с группирующей переменной
«fac_ind».
Рисунок 5.3.3.2.2. Описание группирующей переменной «fac_ind».
Рисунок 5.3.3.2.3. Окно значений переменной «factor» и
«f_ind».
группирующей переменной
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
68
Рисунок 5.3.3.2.4. Окно «Bar Charts» для выбора построения кластерной диаграммы
средних значений.
Рисунок 5.3.3.2.5. Окно «Define Clustered Bar: Summaries for Groups of Cases». Все
переменные распределены по окнам.
Нажать на кнопку
Options
Появится окно – Рис.5.3.3.2.6.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
69
Display error bars
Standard deviation
Multiplier 1.0
Рисунок 5.3.3.2.5. Окно «Options».
OK
Рисунок 5.3.3.2.6. Диаграмма для средних значений, построенная и отредактированная с
помощью SPSS.
В файле Results.spv появится нужный график (Рис.5.3.3.2.6.), на котором изображен
отредактированный график для средних значений: изменен цвет фона и столбиков, числа
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
70
на вертикальной оси округлены до целых, все буквы увеличены для того, чтобы график
после сжатия был бы читаемым.
C тем же самым файлом можно получить коробчатую диаграмму, сгруппированную
также, как и диаграмма средних значений – по полу.
Graphs
Legacy Dialogs
Boxplot... (Рис.5.3.3.2.7)
Clustered
Define
Рисунок 5.3.3.2.7. Окно «Bar Charts» для выбора построения кластерной диаграммы
средних значений.
Рисунок 5.3.3.2.8. Окно « Define Clustered Boxplot: Summaries for Groups of Cases». Все
переменные распределены по окнам.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
71
В появившемся окне «Define Clustered Boxplot: Summaries for Groups of Cases»
распределить переменные Factor[f_ind] в окно «Category Axis», группирующую
переменную «Gender» в окно «Define Clusters by», переменную Factor [f] в окно «Variable».
Получившийся вид окна изображен на Рис.5.3.3.2.8.
OK
В файле Result_Aggression.spv появится нужный график (Рис.4.3.3.2.9.), на котором
изображена отредактированная коробчатая диаграмма.
Рисунок 5.3.3.2.9. Коробчатая диаграмма, построенная и отредактированная с помощью
SPSS.
6. Распределения
6.1. Случайные величины
Случайной величиной, называется переменная, которая в результате испытания
принимает одно из возможного множества своих значений, какое именно – заранее
неизвестно.
Случайные величины принято обозначать большими (прописными) буквами
латинского алфавита: X, Y, Z,..., а их значения - маленькими (строчными) буквами: x, y, z...
Случайные величины бывают двух видов:
1) дискретными (прерывными);
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
72
2) непрерывными.
Рассмотрим дискретные случайные величины.
Случайная величина называется дискретной, если значения которые она может
принимать образуют дискретный ряд чисел, конечный или бесконечный.
Например, дискретной случайной величиной можно считать:
- количество студентов на лекции;
- количество цыплят, вылупившихся за ночь;
- оценку, полученную на экзамене.
Соответствие между всеми возможными значениями дискретной случайной
величины и их вероятностями называется законом распределения вероятностей данной
случайной величины.
Непрерывной случайной величиной называют переменную, которая может принимать
все значения из некоторого конечного или бесконечного промежутка.
Например, непрерывной случайной величиной можно считать:
- продолжительность жизни;
- расход воды за месяц;
- дальность полета пули.
Значения дискретной случайной величины можно прогнозировать до испытания.
Например, количество студентов на лекции. А продолжительность жизни нельзя.
Непрерывная случайная величина может принимать все значения из некоторого
промежутка. Число ее возможных значений бесконечно. Однако, вероятность того, что
значение непрерывной случайной величины будет равняться в точности любому заданному
числу x равна нулю.
Поэтому находят вероятность того, что значение, принятое непрерывной случайной
величиной X в данном испытании окажется в некотором интервале [ a; b ] . Эту вероятность
обозначают P ( a ≤ X ≤ b ) или Р( a < X < b).
Распределением вероятностей непрерывной случайной величины называют закон,
с помощью которого можно найти вероятность того, что ее значение окажется после
испытания в интервале
[ a; b ] .
Этот закон задают с помощью функции плотности
распределения вероятностей y = f ( x ) (probability density function, PDF). Вероятность того,
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
73
что значение непрерывной случайной величины X окажется в интервале [ a; b ] вычисляют
по формуле:
b
P ( a ≤ X ≤ b ) = ∫ f ( x )dx .
(6.1.1)
a
Символ в правой части равенства (6.1.1) называют определенным интегралом от функции
y = f ( x ) по промежутку [ a; b ] . Определенные интегралы изучают в разделе высшей
математики «Математический анализ». Интегралы, которые используются в теории
вероятностей и в математической статистике, как правило, вычисляют с помощью
компьютерных программ.
Функция f ( x ) должна удовлетворять трем основным требованиям:
1) f ( x ) ≥ 0 - быть неотрицательной;
2) Быть такой, чтобы интеграл в правой части формулы (6.1.1) существовал;
3) P ( −∞ < X < +∞ ) =
+∞
∫ f ( x )dx = 1 как вероятность достоверного события, что после
−∞
испытания, случайная величина X примет одно значение x ∈ ( −∞; + ∞ ) .
График функции y = f ( x ) называют кривой распределения.
Определенный интеграл (6.1.1), равный вероятности P ( a ≤ X ≤ b ) равен площади
фигуры S, ограниченной сверху кривой распределения и опирающейся на отрезок [ a; b ]
(Рис.6.1.1). Поэтому
P ( a ≤ X ≤ b) = S .
(6.1.2)
Площадь между всей кривой распределения и осью Ох равна единице, так как она
совпадает с вероятностью достоверного события.
Рисунок 6.1.1 Площадь заштрихованного участка под кривой распределения совпадает с
вероятностью: S = P ( a ≤ X ≤ b ) .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
74
Наиболее
часто
в
математической
статистике
используют
нормальное
распределение, распределение «Хи-квадрат, t-распределение Стьюдента и f-распределение
Фишера-Снедекора. Рассмотрим их подробнее.
6.2. Нормальное распределение
Normal Distribution
Функция плотности распределения вероятностей для нормального распределения:
f ( x) =
1
σ 2π
e
−
( x−µ )
2σ
2
2
(6.2.1)
В формуле (6.2.1) присутствуют:
1) два знаменитых иррациональных числа (бесконечные непериодические
десятичные дроби) число «пи»: π = 3.141592653589790... и
число Эйлера «е»: e = 2.718281828459050... ;
2) параметр µ , в точности равный математическому ожиданию (выборочный
аналог которого – среднее арифметическое) непрерывной случайной величины Х,
вычисленному с помощью соответствующего интеграла;
3) параметр σ , в точности равный стандартному отклонению (выборочный аналог
которого – выборочное стандартное отклонение) непрерывной случайной величины Х,
вычисленному с помощью соответствующего интеграла.
Нормальное распределение описывается двумя параметрами: µ и σ .
Кривую нормального распределение (график функции y = f ( x ) ) называют кривой
Гаусса. Она имеет форму колокола (Рис.6.2.1).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
75
y
y=
1
1
σ 2π
e
−
( x − µ )2
2σ 2
σ 2π
x
µ − 3σ µ − 2σ
µ −σ
µ
µ +σ
µ + 2σ
µ + 3σ
Рисунок 6.2.1. Кривая Гаусса для нормального распределения с параметрами µ и σ .
Для нормального распределения справедлив закон «трех стандартных отклонений»
или закон «трех сигма» («3 σ »):
Отклонения
нормально
распределенной
случайной
величины
от
ее
математического ожидания µ не превышают 3σ .
Вероятность того, что значения нормально распределенной случайной величины Х,
попадут в интервал ( µ − σ ; µ + σ ) , равна .6827 или 68.27%.
Вероятность того, что значения нормально распределенной случайной величины Х,
попадут в интервал ( µ − 2σ ; µ + 2σ ) , равна .9545 или 95.45%.
Вероятность того, что значения нормально распределенной случайной величины Х,
попадут в интервал ( µ − 3σ ; µ + 3σ ) , равна .9973 или 99.73%.
Вероятность того, что значения нормально распределенной случайной величины
отклонятся от µ в обе стороны на величину меньше 3σ равна .9973. Вероятность того, что
отклонения от µ на величину больше 3σ ничтожно мала:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
76
1-.9973 = .0027 или 0.27%.
y
σ
1
2π
0.341 0.341
0.136
0.136
x
0.022
0.022
µ
µ −σ
0.6827
µ +σ
0.9545
µ − 2σ
µ + 2σ
0.9973
µ − 3σ
µ + 3σ
Рисунок 6.2.2. Иллюстрация к закону «трех сигма»
6.3. Распределение «Хи-квадрат» ( χ 2 )
Chi-Square Distribution or χ 2 - Distribution
Распределение «Хи-квадрат» впервые было описано немецким геодезистом,
математиком и астрономом Фридрихом Робертом Хельмертом (Friedrich Robert Helmert) в
1875-1876 годах (Айвазян, 1983)3,4. В Германии это распределение традиционно известно
как распределение Хельмерта. В связи с гауссовской теорией ошибок Хелмерт исследовал
суммы квадратов k независимых стандартно нормально распределенных случайных
величин. Распределение «Хи-квадрат» было независимо вновь открыто английским
Айвазян, С. А. (1983). Прикладная статистика. Основы моделирования и первичная обработка данных.
Москва: «Финансы и статистика». С.190.
4
https://en.wikipedia.org/wiki/Chi-squared_distribution
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
77
лекций.
3
математиком
Карлом
Пирсоном
в
контексте
критерия
согласия
«хи-квадрат»,
опубликованного им в 1900 году. Название "хи-квадрат" происходит от стенографии
Пирсона, который использовал букву греческого алфавита χ (русская транскрипция – «Хи»,
английская - Chi): χ 2 . Идея семейства "хи-квадрат распределений" была развита Рональдом
Фишером (см.п. 6.5) в 1920-е годы. Сейчас распределение "хи-квадрат" носит имя Пирсона.
0.9
y
Chi-square(1)
Chi-square(2)
Chi-square(3)
Chi-square(5)
Chi-square(10)
Chi-square(20)
y = Chi − square ( k )
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
x
5
10
15
20
25
Рисунок 6.3.1. Кривые распределения χ 2 (
30
35
40
y = Chi − square ( k ) ) для числа степеней
свободы 1, 2, 3, 5, 10, 20.
Функция плотности распределения вероятностей для распределения χ 2 5:
y=
1
k
2 Γ
2
k
2
k
−1 −
x
x2 e 2 ,
(6.3.1)
где Г(x) специальная (не элементарная) функция, которая определяется через
несобственный интеграл и называется гамма-функцией6;
5
В названии распределения использована греческая буква
χ - «хи».
Г( ) = ∫
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
6
78
k = df (degrees of freedom) – параметр распределения χ 2 , который называется числом
степеней свободы.
Распределение χ 2 описывается одним параметром - числом степеней свободы k =df.
Кривые распределения χ 2 для некоторых k=df показаны на Рис.6.3.17.
6.4. Распределение Стьюдента или t-распределение
Student’s Distribution or t- distribution
Распределение Стьюдента было разработано английским химиком и статистиком
Уильямом С. Госсетом (William S. Gosset), когда он работал сотрудником ирландского
отделения пивоваренной компании Guinness. Компания Guinness запрещала своим
сотрудникам публиковать работы под собственными именами. Поэтому свои публикации
Уильям С. Госсет начиная с 1908 года в журнале "Биометрика" писал под псевдонимом
"Student", что в переводе означает "Студент".
Функция плотности распределения вероятностей для t-распределения Стьюдента:
y=
Γ ( k + 1)
1
,
⋅
k +1
k
2
x
πk ⋅Γ
2 1 + k
(6.4.1)
где Г(x) специальная функция, которая определяется через несобственный интеграл и
называется гамма-функцией; k = df (degrees of freedom) – параметр распределения t,
который называется числом степеней свободы.
t-распределение Стьюдента описывается одним параметром - числом степеней
свободы k =df.
Кривые распределения t для некоторых k=df показаны на Рис.6.4.1.
Внешне t-распределение Стьюдента напоминает стандартизованное нормальное
распределение (частный случай нормального распределения, когда μ=0, σ=1). Оба
7
https://en.wikipedia.org/wiki/Chi-squared_distribution
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
79
распределения имеют колоколообразную форму и являются симметричными. Однако
хвосты в t-распределении «тяжелее» (т.е. ограничивают большую площадь), а площадь
фигуры в центре распределения меньше, чем у стандартизованного нормального
распределения (Рис.6.4.1).
Yjhvfkmyjt
0.4
Y
Нормальное
распределение
k = 16
k =4
0.3
k=2
k =1
0.2
0.1
X
-3
-2
-1
1
2
3
Рисунок 6.4.1. Кривая Гаусса (стандартизованное нормальное распределение) и кривые t-
распределения Стьюдента с числом степеней свободы k = 1 , k = 2 , k = 4 , k = 16 .
6.5. Распределение Фишера-Снедекора или f-распределение
Fisher-Snedecor’s Distribution or f-distribution
Два самых выдающихся статистика XX столетия непосредственно причастны к
получению f-распределения. Один - крупнейший английский статистик Рональд Фишер
(1890-1962), предложивший первые теоретические формулировки, которые были
опубликованы в середине 20-х годов (Fisher, 1925). Другой - Джордж Снедекор (1881-1974),
один из плеяды первых американских статистиков, разработавший способ сравнения двух
независимых выборок любого объема посредством вычисления отношения двух оценок
дисперсии. Он назвал это отношение f-отношением, в честь Фишера.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
80
Функция плотности распределения вероятностей для f-распределения ФишераСнедекора:
k1
k 2 k1 −1 k
y=
⋅ 1 x 2 1 + 1
k k k
k2
Β 1 , 2 2
2 2
1
x
−
k1 + k2
2
,
(6.5.1)
где B(x) - специальная функция, которая определяется через несобственный интеграл и
называется бета-функцией8; k1 = df1, k2 = df2 (degrees of freedom) – параметры
распределения f, которые называются степенями свободы.
Рисунок 6.5.1. Кривые f-распределения Фишера-Снедекора: F1,1, F2,1, F5,2, F10,1, F100,100,. На
рисунке обозначено: d1=k1, d2=k2.
Кривые распределения f для некоторых k1 = df1, k2 = df2 (
Рис.6.5.19.
,
) показаны на
7. Проверка статистических гипотез с помощью SPSS
7.1. Виды статистических гипотез
Гипотеза происходит от греческого слова hypothesis - основание, основа.
Статистической гипотезой называют предположение о свойствах популяции
совокупности. Статистическую гипотезу подтверждают или отвергают методами
математической статистики на основе выборочных данных.
( , )=∫
(1 − )
https://upload.wikimedia.org/wikipedia/commons/thumb/7/74/F-distribution_pdf.svg/1200px-Fdistribution_pdf.svg.png
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
8
9
81
Одновременно выдвигаются нулевая (основная) гипотеза H 0 и противоречащая ей
альтернативная гипотеза H 1 :
Нулевая гипотеза H 0 всегда о том, что различия в популяции нулевые. В выборке
статистически значимых или существенных отличий нет. Все имеющиеся различия
несущественны, их можно объяснить случайными обстоятельствами.
Альтернативная (конкур ирующая) гипотеза H 1 о том, что в популяции имеются
различия. В этом случае в выборке различия статистически значимые. Это закономерно и
не может быть объяснено случайными причинами.
Альтернативная гипотеза – это то, что очень часто исследователь хочет доказать,
поэтому ее иногда называют экспериментальной гипотезой.
Альтернативная гипотеза может быть направленной или ненаправленной.
В Примерах 1-3 выборочная дисперсия отличается от гипотетической10 дисперсии.
Возникает вопрос: являются ли эти различия случайными или закономерными? Случайные
различия в выборке означают отсутствие различий в популяции. Закономерные различия в
выборке говорят о различиях в популяции.
Пример 1
H 0 : Выборочная дисперсия
дисперсии σ 02 =15.00;
H 1 : Выборочная дисперсия
закономерно.
х =25.34
х =25.34
имеет случайное отличие от гипотетической
отличается от гипотетической дисперсии σ 02 =15.00
При справедливости H0 различие может быть объяснено случайными причинами.
При справедливости быть H1 различие закономерно и не может быть объяснено
случайными причинами.
В Примере 1 альтернативная гипотеза является ненаправленной (nondirectional).
предполагаемой
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
10
82
Пример 2
H0 : Выборочная дисперсия
дисперсии σ 02 =15.00;
H1 : Выборочная дисперсия
закономерно.
х =25.34
х =25.34
имеет случайное отличие от гипотетической
превышает от гипотетическую дисперсию σ 02 =15.00
Пример 3
H0 : Выборочная дисперсия
дисперсии σ 02 =15.00;
H1 : Выборочная дисперсия
закономерно.
х =12.51
имеет случайное отличие от гипотетической
х =12.51
меньше гипотетической дисперсии σ 02 =15.00
В Примерах 2 и 3 альтернативная гипотеза является направленной (directional).
Замечание. Те же самые гипотезы могут быть сформулированы для популяции.
Параметры популяции обычно обозначают буквами греческого алфавита.
Дисперсию популяции обозначим
записаны следующим образом.
. Тогда для Примеров 1-3 гипотезы могут быть
Пример 1.
Пример 2.
Пример 3.
H 0 : σ 2 = σ 02
H 0 : σ 2 = σ 02
H 0 : σ 2 = σ 02
H 1 : σ 2 ≠ σ 02 ,
H 1 : σ 2 > σ 02 ,
H1 : σ 2 < σ 02 ,
где σ 02 =15.00,
х =25.34.
где σ 02 =15.00,
х =25.34.
где σ 02 =15.00,
х =12.51.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
83
7.2. Ошибки 1-ого и 2-ого рода
Статистическая проверка гипотез, в основе которой лежат выборочные результаты,
неизбежно связана с риском принять ошибочное решение. Возможны два вида ошибок.
Ошибка 1-ого рода. Отклонить правильную нулевую гипотезу H 0 (α-error, type I
error ).
Ошибка 2-ого рода. Принять неправильную нулевую гипотезу H 0 (β-error, Type II
error).
Вероятность ошибки 1-ого рода называют уровнем значимости (significance level)
и обозначают буквой греческого алфавита α .
Обычно рассматривают уровни значимости α = .05 , α = .01 и α = .001. Если α = .05
- то это значит, что в 5 случаях из 100 имеется риск отвергнуть правильную нулевую
гипотезу.
Когда указывают, что различия достоверны на уровне значимости α = .01 , то имеют
в виду, что вероятность того, что они все-таки недостоверны, не превышает .01 (или 1%).
Вероятность ошибки 2-ого рода обозначают через β .
Возможны 4 случая (Таблица 7.2.1).
Таблица 7.2.1 (Howell, 1999; P.133)
Возможные результаты процесса принятия решений
Истинное состояние
H0 Верна
H 0 Неверна
Решение
Нет оснований отвергнуть
Отвергается
Правильное решение
Ошибка 1-ого рода
р = 1-α
p=α
Ошибка 2-ого рода
Правильное решение
p=β
p = 1-β=мощность (power)
Замечание. p – вероятность.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
84
Вероятность ошибки 1-ого рода называют уровнем значимости (significance level)
и обозначают буквой греческого алфавита α .
Обычно рассматривают уровни значимости α = .05 , α = .01 и α = .001. Если α = .05
- то это значит, что в 5 случаях из 100 имеется риск отвергнуть правильную нулевую
гипотезу.
Когда указывают, что различия достоверны на уровне значимости α = .01 , то имеют
в виду, что вероятность того, что они все-таки недостоверны, не превышает .01 (или 1%).
Вероятность ошибки 2-ого рода обозначают через β .
7.3. Статистический критерий
Критерий - от греческого слова criterion - средство для суждения - признак, на
основании которого производится оценка, средство проверки, - мерило оценки.
Для проверки нулевой гипотезы ( H 0 - гипотезы об отсутствии различий)
используют
специально
подобранную
случайную
величину,
которую
называют
статистическим критерием или просто критерием.
При справедливости нулевой гипотезы эта случайная величина имеет определенное
распределение
плотности
вероятностей
(стандартизованное
нормальное:
z-
распределение, распределение хи-квадрат (chi-square distribution), t-распределение
Стьюдента, f-распределение Фишера-Снедекора или другие распределения). Кривая
плотности распределения, как правило, имеет вид колокола – симметричного или
скошенного (Рисунки п.6).
Наблюдаемое или эмпирическое значение критерия – это значение критерия,
вычисленное по выборочным данным. Также принято критерий называть тестом, а его
эмпирическое значение - статистикой.
7.4. Критическая область. Критические точки
Множество всех возможных значений статистики делится на две области.
Критической областью (critical region, regection region) называют совокупность значений
статистики, при которой нулевую гипотезу отвергают. Областью областью принятия
гипотезы (acceptance region) называют совокупность значений статистики, при которых
нулевую гипотезу нет оснований отвергнуть.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
85
Критическими точками называют точки, отделяющие критическую область от
области принятия гипотезы (Рис.7.4.1).
Критической области соответствуют значения статистики, которые наименее
вероятны - так называемые, «хвосты» распределения.
Критические точки находятся по уровню значимости α
и по параметрам
соответствующих распределений из специальных таблиц или с помощью компьютерных
программ. Обычно их обозначают kα , или более конкретно, например:
.
при α = 0.05.
Вместо буквы k обычно пишут букву, соответствующую распределению случайной
величины ( z ; χ 2 ; t ; f и др.)
Рисунок 7.4.1. Кривая распределения. На горизонтальной оси отложены наблюдаемые
значения критерия К – статистики, kα – критические точки.
(a) – правоторонняя критическая область (one-tailed), площадь правого «хвоста» равна α;
(b) – левоторонняя критическая область (one-tailed), площадь левого «хвоста» равна α;
(с) – двухсторонняя критическая область (two-tailed), площадь каждого «хвоста» равна α/2.
В
зависимости
ненаправленной),
от
различают
вида
альтернативной
«односторонние
гипотезы
гипотезы»
(направленной
(one-tailed
test)
–
или
для
направленных гипотез и «двусторонние гипотезы» (two-tailed test) – для ненаправленных
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
86
гипотез. Односторонние гипотезы, бывают левосторонними (left-tailed) и правосторонними
(right-tailed).
В
соответствии
с
этим
определяются
правосторонняя
(one-tailed),
левосторонняя (one-tailed) и двухсторонняя (two-tailed) критические области (Рис.7.4.1).
После вычисления значения статистики для имеющейся выборки, смотрят, в какую
из этих двух областей попало это вычисленное значение. Если оно попало в критическую
область, то нулевая гипотеза отвергается.
Если значение статистики попало в «область принятия гипотезы Н0», то делается
вывод о том, что нет оснований отклонить нулевую гипотезу.
Пример 4. Выборка, объема n = 17 взята из популяции, в которой признак имеет
нормальное распределение. Выборочная дисперсия равна
х
=25.34. Гипотетическая
дисперсия равна σ 02 =15.00. Сравнить выборочную дисперсию с гипотетической
дисперсией.
Решение
Из математической статистики следует, что для сравнения выборочной дисперсии с
гипотетической дисперсией следует использовать критерий χ 2 , наблюдаемое значение
(статистика) которого вычисляется по формуле (Гласс & Стенли, 1976; сс.279-280).
χ 2 = (n − 1)
s x2
.
σ 02
(7.4.1)
Вычислим значение χ 2 - статистики:
Нулевая гипотеза:
=(17 − 1)
.
.
= 27.03.
H 0 : σ 2 = σ 02 ,
где
11
− дисперсия популяции11.
Эквивалентная формулировка нулевой гипотезы:
H0 : Выборочная дисперсия х =25.34 имеет случайное отличие от гипотетической дисперсии σ 02 =17.00;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
87
Случайная величина χ 2 при справедливости нулевой гипотезы распределение χ 2 с
df=n-1 степенями свободы.
Дальнейший ход решения задачи предполагает рассмотрение двух вариантов:
направленной и ненаправленной альтернативных гипотез.
Случай 1. (Направленная альтернативная гипотеза)
H 1 : σ 2 > σ 02 12
В этом случае рассматриваем правостороннюю критическую область, уровни
значимости α = .05, α = .01. α = .001 и число степеней свободы df = 17-1 = 16.
Дальнейшее решение задачи проведем с помощью компьютерной программы Excel.
7.5. Нахождение критических точек с помощью компьютерной
программы Excel
Получим критическую точку распределения χ 2 для уровня значимости р=.05 и
числа степеней свободы df = 16 c помощью Excel.
Встанем на ячейку, в которой хотим получить ответ. Например, в С3 (Рис.7.5.1).
Рисунок 7.5.1. Получение критических точек распределения χ 2 . Выбор ячейки
Formulas
fx
12
Insert Function …
H1 : Выборочная дисперсия х =25.34 превышает от гипотетическую дисперсию σ 02 =15.00 закономерно.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
88
В появившемся окне найдем функцию CHISQ.INV.RT (Рис.7.5.2).
В появившемся окне зададим уровень значимости α: р = 0.05 (Probability) и число
степеней свободы df = 16 (Deg_freedom) (Рис.7.5.3).
Таким образом, критическое значение для уровня значимости α = .05 и числа
степеней свободы 16 равно 26.2962276.
Округляя получаем:
Аналогично находим:
.
.
= 26.30.
Вычисленная статистика :
= 32.00,
.
= 39.25.
=27.03. Справедливо неравенство (Рис.7.4.2):
.
≤
<
.
Рисунок 7.5.2. Выбор функции CHISQ.INV.RT
OK
Рисунок 7.5.3. Задание уровня значимости (Probability) и числа степеней свободы
(Deg_freedom).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
89
OK
В ячейке С3 появится ответ (Рис.8.5.4).
Рисунок 7.5.4. Вычисленная в ячейке С3 критическая точка распределения χ 2 для
уровня значимости р = .05 и числа степеней свободы df = 16 .
Вычисленная статистика оказалась в критической области для уровня значимости
α=.05. Поэтому нулевая гипотеза отклоняется и принимается альтернативная гипотеза.
Рисунок 7.5.5. Правосторонняя критическая область для Примера 4.
Ответ: Была использована правосторонняя альтернативная гипотеза. Выборочная
дисперсия
х =25.34
статистически значимо превышает гипотетическую дисперсию σ 02 =
17.00. Значение статистики Chi-square (16) = 27.03. Уровень значимости α = .05.
Случай 2. (Ненаправленная альтернативная гипотеза)
H 1 : σ 2 ≠ σ 02
В этом случае рассматриваем двухстороннюю критическую область, уровни
значимости α = .05, α = .01, α = .001 и число степеней свободы df = 17-1 = 16.
Для того, чтобы найти левую критическую точку, перед которой площадь,
ограниченная кривой распределения и осью Ох (Рис.7.4.1 (с), критическая точка kα1), равна
α/2. Чтобы ее найти надо подставить Probability = 1- α/2 = 1-0.05/2 = 0.975 (Рис.7.5.6).
Результат вычисления
.
( )
= 6.91.
Для α = .01, Probability = 1- α/2 = 1-.01/2 = .995,
для α = .001, Probability = 1- α/2 = 1-.001/2 = .9995.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
90
Критические точки:
.
= 5.14,
( )
.
( )
= 3.54.
Для того, чтобы найти правую критическую точку, за которой площадь,
ограниченная кривой распределения и осью Ох (Рис.7.4.1 (с), критическая точка kα2), равна
α/2. Чтобы ее найти надо подставить в Probability = α/2 = .05/2 = .025 (как на Рис.7.5.5).
Результат вычисления
.
( )
= 28.85.
Для α = .01, Probability = α/2 = .01/2 = .005,
для α = .001, Probability = α/2=.001/2=.0005.
Критические точки:
.
( )
= 34.27,
.
( )
= 41.31.
Рисунок 7.5.6. Вычисление левой критической точки для двухсторонней критической
области.
Вычисленная статистика
=27.03 принадлежит области принятия нулевой
гипотезы, так как справедливо неравенство (Рис.7.5.5):
6.91 =
.
( )
<
<
.
( )
= 28.85
Поэтому нет основания отвергнуть нулевую гипотезу. Различия между выборочной
дисперсией и гипотетической дисперсией не найдены.
Рисунок 7.5.7. Двухсторонняя критическая область для Примера 4.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
91
Ответ: Была использована двухсторонняя альтернативная гипотеза. Статистически
значимых различий между выборочной дисперсией
σ 02 =17.00 не найдено.
х =25.34
и гипотетической дисперсией
Из Примера 4 видно, что «двухвостовый» тест является более строгим, чем
«однохвостовый».
Чтобы вычислить с помощью Excel критические точки для других распределений,
используют функции:
•
CHISQ.INV.RT(Probability, df) для распределения «Хи-квадрат», one-tailed;
•
F. INV.RT(Probability, df1, df2) для F-распределения, one-tailed;
•
T. INV.RT(Probability, df) для t-распределения, one-tailed;
•
T. INV.2T(Probability, df) для t-распределения, two-tailed;
•
Для стандартизованного нормального распределения критические точки
для правосторонней критической области равны:
z.05 = 1.64 , z.01 = 2.33 , z.001 = 3.09 ;
для двухсторонней критической области:
z.05 = 1.96 , z.01 = 2.58 , z.001 = 3.29 .
7.6. р-value
Для проверки стптистических гипотез можно использовать не только критические
области и критические точки, но также p-value (p-вероятность, р-значение), которая
вычисляется для конкретных значений статистики – наблюдаемого значения критерия.
Формально р-value определяется (и вычисляется) следующим образом.
Пусть случайная величина К является критерием, который используется для
проверки нулевой гипотезы. Предполагается, что при справедливости нулевой гипотезы
распределение этой случайной величины известно. Наблюдаемое значение критерия или Кстатистику обозначим через Кe.
Для правосторонней альтернативной гипотезы р-value определяется как вероятность
того, что значения случайной величины К будут либо равны вычисленной статистике Кe,
либо больше ее (Рис.7.6.1):
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
92
р-value = Р(K≥Ke).
(7.6.1)
Для левосторонней альтернативной гипотезы р-value определяется как вероятность
того, что значения случайной величины К будут либо равны вычисленной статистики Кe,
либо меньше ее: (Рис.7.6.2)
р-value = Р(K≤Ke).
(7.6.2)
Для двухсторонней альтернативной гипотезы р-value определяется как как
удвоенная наименьшая вероятность из двух вероятностей Р(K≤Ke) и Р(K≥Ke):
р-value = 2 min{Р(K≤Ke), Р(K≥Ke)}.
(7.6.3)
Таким образом, р-value – это вероятность того, что не следует отклонять нулевую
гипотезу, или вероятность ошибки при отклонении нулевой гипотезы.
р-value - это вероятность того, что обнаруженное различие носит случайный
характер.
Если эта вероятность большая, то различие случайное. Нет оснований отклонить
нулевую гипотезу. Например р = .68.
Если эта вероятность маленькая, то различия неслучайные, а закономерные. Нулевая
гипотеза отклоняется и принимается альтернативная гипотеза. Например, р = .002.
7.6.1.
Определение
p-value
(площадь заштрихованной области под
кривой распределения) для правосторонней
альтернативной гипотезы:
Рисунок
р-value = Р(K≥Ke).
7.6.2.
Определение
p-value
(площадь заштрихованной области под
кривой распределения) для левосторонней
альтернативной гипотезы:
Рисунок
р-value = Р(K≤Ke).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
93
Чем меньше р-value, тем надежнее найденное различие.
p-value сравнивают с общепринятыми уровнями значимости α = .05, α = .01 или α =
.001. Если в результате применения статистического теста p-value окажется меньше, чем
выбранный уровень значимости, то нулевая гипотеза отвергается и принимается
альтернативная гипотеза. А если p-значение окажется больше заданного уровня
значимости, то нет оснований отвергнуть нулевую гипотезу. Это не означает, что нулевая
гипотеза истинна, просто не хватает аргументов, чтобы ее отвергнуть.
Исторически сложилось так, что принято считать (Бююль & Цефель, 1976; сс. 8788):
1) p > .05 - различия случайны;
2) α = .05 (или p ≤ .05 ) – различия значимы;
3) α = .01 (или p ≤ .01 ) – различия очень значимы;
4) α = .001 (или p ≤ .001) – различия максимально значимы.
Чем меньше значение р, тем сильнее аргументы против нулевой гипотезы.
В некоторых статистических компьютерных программах (в том числе и в SPSS) pvalue обозначают через Sig. (significance).
7.7. Вычисление р-value с помощью компьютерной программы
Excel
Пример 4. (См. пп.7.4-7.5) Выборка, объема n = 17 взята из популяции, в которой
признак имеет нормальное распределение. Выборочная дисперсия равна
х
=25.34.
Гипотетическая дисперсия равна σ 02 =15.00. Сравнить выборочную дисперсию с
гипотетической дисперсией.
Решение
Из математической статистики следует, что для сравнения выборочной дисперсии с
гипотетической дисперсией следует использовать критерий χ 2 , наблюдаемое значение
(статистика) которого вычисляется по формуле (Гласс & Стенли, 1976. Сc. 279-280).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
94
χ 2 = (n − 1)
s x2
.
σ 02
(7.4.1)
Вычислим значение χ 2 - статистики:
.
=(17 − 1)
Нулевая гипотеза:
.
= 27.03.
H 0 : σ 2 = σ 02 ,
где
− дисперсия популяции13.
Случайная величина χ 2 при справедливости нулевой гипотезы распределение χ 2 с
df = 17-1 = 16 степенями свободы.
Дальнейший ход решения задачи предполагает рассмотрение двух вариантов:
направленной и ненаправленной альтернативных гипотез.
Случай 1. (Направленная альтернативная гипотеза)
H 1 : σ 2 > σ 02 14
Для вычисленной статистики
p-value.
Открываем
программу
= 27.03 , число степеней свободы df = 16. Находим
Excel.
На
верхней
панели
выбираем
функцию
СHISQ.DIST.RT, появляется окно, в которое вводим информацию
Х = 27.03, Deg_freedom = 16
(Рис.7.7.1), OK. В соответствующей ячейке появляется число, равное р-значению
(Рис.7.7.2): р = .041.
13
Эквивалентная формулировка нулевой гипотезы:
H0 : Выборочная дисперсия
х =25.34
дисперсии σ =17.00;
2
H1 : Выборочная дисперсия
=15.00 закономерно.
14
х
имеет случайное отличие от гипотетической
=25.34 превышает от гипотетическую дисперсию σ 02
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
95
Появляется окно gretl: p-value finder, на котором выбираем распределение chisquare, df = 16, value = 27.03 (Рис.7.7.2).
ОК
Имеет место неравенство р = .041 ≤ .05.
Поэтому нулевая гипотеза отклоняется и принимается альтернативная гипотеза.
Рисунок 7.7.1. Окно СHISQ.DIST.RT в Excel.
Рисунок 7.7.2. Найденное р-значение.
Ответ: Была использована правосторонняя альтернативная гипотеза. Выборочная
дисперсия
х =25.34
статистически значимо превышает гипотетическую дисперсию:
σ 02 = 17.00: χ2 (16) = 27.03, p = .041 ≤ .05.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
96
Случай 2. (Ненаправленная альтернативная гипотеза)
H 1 : σ 2 ≠ σ 02
Это ненаправленная альтернативная гипотеза. Воспользуемся уже найденной
информацией (Рис.7.7.3) .
Для статистики 27.03, распределения chi-square, df = 16, p-value = .041, площадь
справа от значения статистики (как на Рис.7.6.1). Площадь слева равна .959. р-value для
двухвостовой альтернативной гипотезы будет равно удвоенной наименьшей из этих двух
площадей:
p-value = .041∗ 2 = .082 > .05.
Поэтому нет оснований отклонить нулевую гипотезу.
Ответ: Была использована двухсторонняя альтернативная гипотеза. Статистически
значимых различий между выборочной дисперсией
σ 02 =17.00 не найдено: χ2(16) = 27.03, p = .082.
х =25.34
и гипотетической дисперсией
p-value для других распределений
Чтобы вычислить с помощью Excel p-value для других распределений, используют
функции:
•
CHISQ.DIST.RT(number,df) для распределения «Хи-квадрат», one-tailed;
•
F.DIST.RT(number,df1, df2) для F-распределения, one-tailed;
•
T.DIST.RT(number,df) для t-распределения, one-tailed;
•
T.DIST.2T(number,df) для t-распределения, two-tailed;
•
Для стандартизованного нормального распределения one-tailed p-value:
= 1 – NORM.S.DIST(number,TRUE)
ENTER
Это площадь под нормальной кривой справа от точки «number», то есть это one-tailed pvalue. Для нахождения two-tailed p-value, вычисленное значение one-tailed p-value надо
умножить на два:
two-tailed p-value = 2* one-tailed p-value
Примеры будут рассмотрены в дальнейших параграфах.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
97
7.8. Мощность критерия
Одни и те же задачи могут быть решены с помощью различных критериев. При этом
некоторые критерии позволяют выявлять отличия там, где другие критерии не способны их
выявить. Один из критериев может быть более мощным, чем другой (Сидоренко, 2000).
Мощность (Power) любого теста определяется как вероятность того, что будет
отвергнута ложная нулевая гипотеза.
Ошибку 2-го рода совершают тогда, когда не отвергают нулевую гипотезу, если она
ложна, и делают вывод, что нет эффекта (различия), тогда как в действительности эффект
существует. Шанс возникновения ошибки 2-го рода обозначается β; а величина (1-β) равна
мощности критерия.
Мощностью критерия (рower of the test) называют вероятность того, что нулевая
гипотеза H 0 будет отвергнута, если верна альтернативная гипотеза H1 .
«Мощность критерия – это способность критерия выявлять различия, если они
имеются», «это шанс обнаружить реальный эффект в выборке данного объема как
статистически значимый» (Сидоренко, 2000).
При планировании исследования, необходимо знать мощность критерия, которым
исследователь собирается воспользоваться. Можно начинать исследование, если есть
«хороший» шанс обнаружить эффект, если он существует.
Разработана «Теория мощностей», изложенная, например, в книгах Коуэна (Cohen,
1988), Эллиса (Ellis, 2010).
Мощность критерия увеличивается по мере увеличения объема выборки. Это
означает, что у большей выборки больше возможностей обнаружить эффект, если он
существует.
Мощность критерия больше для эффектов большего размера (понятие «размер
эффекта» будет рассмотрено в дальнейших параграфах). Эффекты больших размеров
легче обнаружить, чем эффекты меньших размеров.
Мощность критерия больше, если уровень значимости выше.
Мощность критерия увеличивается по мере того, как изменчивость наблюдений
уменьшается.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
98
Величина мощности используется для вычисления размера выборки, необходимой
для подтверждения гипотезы с необходимым размером эффекта.
7.9. Параметрические и непараметрические критерии
Существуют параметрические и непараметрические критерии.
Критерий называется параметрическим, если он основан на конкретном типе
распределения ГС.
Критерий называется непараметрическим, если он не базируется на типе
распределения ГС. (Критерий, свободный от распределения).
Параметрические
критерии
включают
в
расчетную
формулу
параметры
распределения (средние, стандартные отклонения, число степеней свободы и другие
параметры в зависимости от распределения). Например, t-критерий Стьюдента, F-критерий
Фишера и другие критерии.
Непараметрические не включают в формулу параметров распределения. Они
основаны на оперировании частотами или рангами (Сидоренко, 2000; с.27).
Как у параметрических критериев, так и у непараметрических критериев есть свои
преимущества и недостатки.
Если параметры распределения известны, то применяются параметрические
критерии как более мощные, чем непараметрические.
Если параметры распределения неизвестны, то ничего не остается, как использовать
непараметрические критерии.
Поэтому параметрические критерии следует применять всегда, когда это возможно.
Теорией
вероятности
установлен
общий
характер
нормального
закона
распределения. Поэтому разумно предполагать, что в обычных случаях многие случайные
величины имеют распределение вероятностей близкое к нормальному распределению.
Поскольку свойства нормального распределения всесторонне изучены – очень важно
понять, можем ли мы считать признак нормально распределенным.
Непараметрические критерии можно применять для порядковых и метрических
переменных независимо от распределения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
99
Параметричекие критерии в большинстве случаев корректно применять когда
распределение данных не отличается от нормального распределения. Бывают случаи, когда
распределение данных отличается от нормального распределения, но можно применять
параметрические критерии. Основное требование – это отсутствие «выбросов», которые
влияют на средние значения, дисперсии и на стандартные отклонения. Существуют и
другие требования. Каждый случай, когда нет нормального распределения, а мы хотим
воспользоваться параметрическим критерием следует рассматривать отдельно.
8. Проверка нормальности распределения данных
Параметрические критерии применяют только тогда, когда известно, что
распределение признака является нормальным.
Если выборочное распределение не отличается от нормального распределения, то
это значит, что измеряемое свойство удалось отразить в метрической шкале (Наследов,
2004; с.59).
Если при изучении некоторого свойства мы произвели его измерение на выборке
участников и получили распределение эмпирических данных, отличающееся от
нормального распределения, то это значит, что либо выборка не репрезентативна
популяции, либо измерения произведены не в шкале равных интервалов (Наследов, 2004;
с.51).
Общей причиной отклонения выборочного распределения признака от нормального
распределения чаще всего является особенность процедуры измерения: используемая
шкала может обладать неравномерной чувствительностью к измеряемому свойству в
разных частях диапазона его изменчивости (Наследов, 2004; с.61).
8.1. Проверка нормальности распределения данных с помощью
SPSS
Методы проверки соответствия распределения данных нормальному закону
распределения в SPSS которыми мы будем пользоваться в рамках данного конспекта - это:
1) Сравнение абсолютных величин показателей асимметрии и эксцесса с их
критическими значениями. Если хотя бы один из показателей асимметрии или эксцесса
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
100
превышает по абсолютной величине свою стандартную ошибку, то распределение данных
отличается от нормального распределения;
2) Критерий Колмогорова-Смирнова;
3) Критерий Колмогорова-Смирнова (модификация Лиллифора);
4) Критерий - Шапиро-Уилкса (если объем выборки меньше 50);
5) Визуальные сравнения:
- гистограммы с нормальной кривой,
- квантильные диаграммы Q-Q (Normal Q-Q Plots),
- Q-Q диаграммы с исключенным трендом (Detrended Normal Q-Q Plots).
В SPSS есть и другие методы сравнения распределения данных с нормальным
распределением.
Проверка
нормальности
распределения
данных
с
помощью
SPSS
для
рассматриваемого примера о гендерных рахличиях агрессии у подростков будет
рассмотрен в п.10.
8.2. Гипотезы об асимметрии и эксцессе и о соответствии
распределения данных нормальному распределению
Гипотезы об асимметрии
Нулевая гипотеза: Распределение признака в популяции не отличается от симметричного.
Альтернативная гипотеза: Распределение признака в популяции несимметричное.
Для проверки нулевой гипотезы используется критерий Z – случайная величина,
которая при справедливости нулевой гипотезы имеет стандартизованное нормальное
распределение с математическим ожиданием µ = 0 и стандартным отклонением σ = 1 .
Z – статистика вычисляется по формуле
ZS =
S
,
SES
(8.2.1)
где S – показатель асимметрии (Skewness), SES cтандартная ошибка асимметрии (3.10.1)
(Field, 2009; p.139).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
101
С помощью программы Excel (п.7.5) можно найти критическую точку для уровня
значимости α = .05. Она равна z.05 = 1.96 . Поэтому, при
ZS =
S
SES
≥ 1.96
или при
S ≥ 1.96 ∗ SES
(8.2.2)
выборочное распределение отличается от симметричного распределения статистически
значимо на уровне значимости α = .05.
Гипотезы об эксцессе
Нулевая гипотеза: Распределение признака в популяции не отличается от распределения с
нулевым эксцессом.
Альтернативная гипотеза: Распределение признака в популяции отличаается от
распределения с нулевым эксцессом.
Для проверки нулевой гипотезы используется критерий Z – случайная величина,
которая при справедливости нулевой гипотезы имеет стандартизованное нормальное
распределение с математическим ожиданием µ = 0 и стандартным отклонением σ = 1 .
Z – статистика вычисляется по формуле
ZK =
K
,
SEK
(8.2.3)
где K – показатель эксцесса (Kurtosis), SEK cтандартная ошибка эксцесса (3.12.1).
С помощью программы Excel (п.7.5) можно найти критическую точку для уровня
значимости α = .05. Она равна z.05 = 1.96 . Поэтому, при
ZK =
выборочное
K
SEK
≥ 1.96
распределение
или при
отличается
K ≥ 1.96 ∗ SEK
от
распределения
(8.2.4)
с
нулевым
эксцессом
статистически значимо на уровне значимости α = .05 (Field, 2009; p.139).
Гипотезы о соответствии нормальному распределению
Нулевая гипотеза: Распределение признака в популяции не отличается от нормального
распределения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
102
Альтернативная гипотеза: Распределение признака в популяции отличаается от
нормального распределения.
Для проверки гипотез используем Д'Агостино-Пирсона омнибуса тест (D'AgostinoPearson Omnibus Test) (D’Agostino & Stephens, 1986; pp.390-391). В названии теста
присутствует слово «омнибус» - двухэтажный автобус – так как тест использует оба
показателя: асимметрию и эксцесс. Статистика теста вычисляется по формуле
DP = ZS2 + ZK2 ,
(8.2.5)
для которой соответствующая случайная величина при справедливости нулевой гипотезы
подчиняется распределению «Хи-квадрат» (Chi-square) с числом степеней свободы df = 2.
Существует рекомендация (Moriarty, 2015) не использовать этот тест, если объем
выборки меньше 20.
Пример. S= 0.460, SES = 0.111, K = 0.638, SEK = 0.222.
1.
ZS =
0.460
= 4.14 ≥ 1.96 - распределение статистически значимо отличается от
0.111
симметричного распредления. Ассиметрия положительная (левосторонняя).
2.
ZK =
0.638
= 2.87 ≥ 1.96 - распределение статистически значимо отличается от
0.222
распределения
с
нулевым
эксцессом.
Оно
с
положительным
эксцессом
(островершинное).
3. DP = ( 4.14) + ( 2.87 ) = 25.38 .
2
2
С помощью программы Excel (п.8.7) находим p-value для двухсторонней
альтернативной гипотезы (Chi-square, df = 2). Получаем: p < .001. Распределение
статистически значимо отличается от нормального распределения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
103
9. Гендерные различия агрессии у подростков. Продолжение
9.1.Проверка нормальности распределения данных
9.1.1. Стандартные ошибки асимметрии и эксцесса
В таблицах показателей описательной статистики (Таблицы 5.2.1-5.2.2) были
вычислены показатели асимметрии S и эксцесса K и их стандартные ошибки SES и SEK.
В Таблице 9.1.1.1 показана проверка нормальности распределения с помощью
асимметрии и эксцесса у мальчиков и девочек для шкал агрессии c использованием трех
тестов: асимметрии (8.2.2), эксцесса (8.2.4) и D'Agostino-Pearson Omnibus Test со
статистикой (8.2.5).
Таблица 9.1.1.1
Проверка нормальности распределения с помощью асимметрии и эксцесса у мальчиков и
Gender = male
Gender = female
девочек для шкал агрессии
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
S
2.03
-0.03
0.61
0.05
-0.38
0.18
-0.61
0.19
-0.60
-0.41
0.31
-1.35
0.58
0.53
-0.61
0.58
SES
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
K
6.66
-1.16
0.76
-1.20
-1.01
-0.83
-0.61
-0.59
-0.43
0.00
-0.49
0.54
-0.46
-0.93
0.33
0.05
SEK
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Z(S)
Z(K)
DP
p
4.76
0.08
1.44
0.13
0.88
0.42
1.43
0.45
1.40
0.95
0.72
3.17
1.36
1.24
1.42
1.37
8.00
1.40
0.91
1.44
1.22
1.00
0.73
0.71
0.52
0.00
0.59
0.65
0.56
1.12
0.40
0.06
86.68
1.95
2.89
2.09
2.26
1.18
2.59
0.70
2.24
0.91
0.87
10.44
2.16
2.78
2.19
1.88
.000
.38
.24
.35
.32
.55
.27
.70
.33
.64
.65
.005
.34
.25
.33
.39
ND
no
no
no
Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error
of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K)
> 1.96 – то распределение данных отличается от нормального распределения.
DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует DP.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
104
9.1.2. Критерий Колмогорова-Смирнова
Критерий Колмогорова-Смирнова (K-S) позволяет оценить вероятность того, что
выборка принадлежит популяции с нормальным распределением.
Нулевая гипотеза. Распределение данных имеет случайное отличие от нормального
распределения.
Альтернативная гипотеза. Распределение данных имеет закономерное отличие от
нормального распределения.
Как получить:
Разбить данные на мальчиков и девочек по переменной Gender.
Analyze
Nonparametric Tests
Legacy Dialogs
1-Sample K-S...
Рисунок 9.1.2.1. Диалоговое окно для критерия Колмогорова-Смирнова.
Появится диалоговое окно для критерия Колмогорова-Смирнова проверки
нормальности распределения данных.
Перенести переменные (кроме Gender) в Test Variable List (Рис.9.1.2.1).
OK.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
105
Выходная информация
NPar Tests
Gender = Female
Таблица 9.1.2.1
One-Sample Kolmogorov-Smirnov Testc
PhA
N
Normal
Parametersa,,b
Mean
Std. Deviation
Most Extreme
Absolute
Differences
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
IA
30
30
5.3333 7.1667
1.21296 1.11675
.275
.239
.275
.219
-.192
-.239
1.506 1.308
.021
.065
I
30
6.4333
.93526
.245
.245
-.188
1.342
.054
N
30
2.2667
1.01483
.232
.194
-.232
1.269
.080
R
S
30
30
4.6667 5.5333
1.06134 1.38298
.257
.166
.143
.166
-.257
-.165
1.405
.910
.038
.378
VA
G
30
30
6.0667 5.0333
1.22990 1.37674
.245
.176
.157
.176
-.245
-.157
1.342
.966
.054
.309
a. Test distribution is Normal.
b. Calculated from data.
c. Gender = Female
Gender = Male
Таблица 9.1.2.2
One-Sample Kolmogorov-Smirnov Testc
PhA
N
Normal
Parametersa,,b
Mean
Std. Deviation
Most Extreme
Absolute
Differences
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
IA
30
30
8.0333 5.0000
1.65015 2.10090
.221
.184
.146
.133
-.221
-.184
1.210 1.006
.107
.263
I
30
6.2667
1.33735
.162
.162
-.142
.885
.414
N
30
4.3333
1.02833
.375
.258
-.375
2.054
.000
R
S
30
30
4.0667 5.1000
1.22990 1.06188
.240
.217
.240
.217
-.160
-.150
1.317 1.186
.062
.120
VA
G
30
30
9.6000 5.2000
2.04434 1.15669
.178
.269
.122
.269
-.178
-.165
.973 1.471
.026
.301
a. Test distribution is Normal.
b. Calculated from data.
c. Gender = Male
Если Asymp. Sig. (2-tailed) или р ≤ .05, то распределение существенно отличается от
нормального. Если р > .05, то отличие эмпирического распределения данных от
нормального распределения не выявлено.
Критерий Колмогорова-Смирнова оказался недостаточно мощным. Он выявил
отличие распределения данных от нормального распределения лишь в 4 случаях из 16. Он
не выявил отличия от нормального распределения по переменным, у которых асимметрия
или эксцесс превышают свои критические значения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
106
9.1.3. Критерий Колмогорова-Смирнова в модификации
Лиллифора и критерий Шапиро-Уилкса
Нулевая гипотеза. Распределение данных имеет случайное отличие от нормального
распределения.
Альтернативная гипотеза. Распределение данных имеет закономерное отличие от
нормального распределения.
Как получить:
(Можно не разбивать данные на мальчиков и девочек).
Analyze
Descriptive Statistics
Explore....
Появится диалоговое окно Explore, в котором перенести в Dependent List переменные –
шкалы агрессии, а переменную Dzimums[sex] перенести в окно Factor List (Рис.9.1.3.1):
Рисунок 9.1.3.1. Диалоговое окно Explore.
Plots
Normally plots with tests
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
107
Рисунок 9.1.3.2. Заказ критериев Колмогорова-Смирнова (K-S) и Шапиро-Уилкса (S-W) c
поправкой Лиллифора.
Continue
OK
ВЫХОДНАЯ ИНФОРМАЦИЯ:
Таблица 9.1.3.1
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Gender
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
Female
Statistic
.275
df
30
Sig.
.000
Statistic
.775
df
30
Sig.
.000
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
.221
.239
.184
.245
.162
.232
.375
.257
.240
.166
.217
.245
.178
.176
30
30
30
30
30
30
30
30
30
30
30
30
30
30
.001
.000
.011
.000
.044
.000
.000
.000
.000
.034
.001
.000
.017
.018
.897
.876
.923
.880
.933
.856
.681
.854
.887
.922
.841
.846
.938
.930
30
30
30
30
30
30
30
30
30
30
30
30
30
30
.007
.002
.032
.003
.061
.001
.000
.001
.004
.030
.000
.001
.082
.050
Male
.269
30
.000
.902
30
.009
a. Lilliefors Significance Correction
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
108
В Таблице 9.1.3.1 представлены результаты двух тестов на нормальное
распределение:
- Лиллифора (модификация критерия Колмогорова-Смирнова);
- Шапиро-Уилкса (если объем выборки меньше 50).
Statistics – наблюдаемое значение критерия;
df – число степеней свободы;
Sig. – это р-value.
При Sig. ≤ .05 распределение значимо отличается от нормального.
Рисунок 9.1.3.3. Диаграммы Normal Q-Q
plots. Физическая агрессия. Девочки.
Рисунок 9.1.3.4. Диаграммы Normal Q-Q
plots. Физическая агрессия. Мальчики.
Рисунок 9.1.3.5. Диаграммы Detrended
Normal Q-Q plots. Физическая агрессия.
Девочки.
Рисунок 9.1.3.6. Диаграммы Detrended
Normal Q-Q plots. Физическая агрессия.
Мальчики.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
109
Критерий Колмогорова-Смирнова с поправкой Лиллифора оказался самым мощным:
он выявил 16 отличий эмпирического распределения данных
от нормального
распределения данных в 16 случаях из 16 возможных. Критерий Шапиро-Уилкса нашел
только 15 различий.
Найденные различия выделены в таблице «Tests of Normality» в редакторе
программы SPSS, который появляется после двух щелчков мышью по таблице.
Вместе с таблицей «Tests of Normality» появляются Normal Q-Q Plots – (диаграммы
Q-Q), по которым визуально можно определить, достаточно ли близко заданное
распределение приближается к нормальному. Каждое наблюдаемое значение сравнивается
со значением, ожидаемым при нормальном распределении. При условии точного
выполнения нормального распределения все точки лежат на прямой. На Рис.9.1.3.3-9.1.3.4
эти диаграммы приведены для переменной PhA (физическая агрессия). По осям отложены
процентили эмпирические (Х) и теоретические (Y).
Также появляются Detrended Normal Q-Q Plots (Диаграммы с исключенным
трендом). На них изображены отклонения наблюдаемых значений от ожидаемых при
нормальном распределении значений в зависимости от наблюдаемых значений. В случае
нормального распределения все точки лежат на горизонтальной прямой, проходящей через
нуль. Все значения переведены в стандартизованные z-оценки.
На Рис.9.1.3.5-9.1.3.6 эти диаграммы приведены для переменной Physical Aggression
(физическая агрессия).
9.1.4. Получение гистограмм с нормальной кривой
Гистограммы с нормальной кривой позволяют визуально сравнить эмпирическое
распределение данных с нормальным распределением. Нормальная кривая строится по
выборочному среднему и выборочному нормальному отклонению. Если эмпирическое
распределение данных не отличается от нормального распределения, то столбики
гистограммы хорошо вписываются в нормальную кривую.
Как получить гистограммы с нормальной кривой?
Способ 1
Data
Split file...
Перенести переменную “Gender” в окно “Groups Based on”. OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
110
В результате данные окажутся разбитыми на 2 группы: мальчиков и девочек.
Результаты будут выдаваться по группам девочек и мальчиков отдельно.
Analyze
Descriptive Statistics
Frequencies...
Перенести в окно “Variables” все переменные, за исключением “Code” “Gender”.
Снять галочку с Display frequency tables.
Charts
В диалоговом окне Frequencies: Charts поставить галочки у Histograms и Show normal
curve on histogram (Рис.9.1.4.1).
Рисунок 9.1.4.1. Заказ гистограмм с нормальной кривой
Continue
OK
ВЫХОДНАЯ ИНФОРМАЦИЯ – гистограммы с нормальной кривой. На
Рис.9.1.4.2-9.1.4.3 приведены гистограммы с нормальными кривыми для переменной FA
(физическая агрессия) для мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 111
лекций.
Рисунок 9.1.4.2. Гистограмма с нормальной кривой для девочек.
Рисунок 9.1.4.3. Гистограмма с нормальной кривой для мальчиков.
Интересно отметить, что на Рис.9.1.4.2 для переменной «Физическая агрессия»
видна «девочка-драчунья», та же, что и на Рис.5.3.2 – «выбоос» типа Extreme, Nr.24.
Действительно, значения нормально распределенной случайной величины не должны
выходить за пределы трех стандартных отклонений от среднего значения. У девочек
среднее значение М = 5.33, а стандартное отклонение равно SD = 1.21. Тогда М + 3SD =
= 5.33 + 3*1.21 = 8.94 < 10. Последний правый столбик гистограммы соответствует FA =
10. Это та самая девочка «драчунья». Значение ее балла по «Физической агрессии»
превысило три стандартных отклонения. Очевидно, что эта девочка не совсем здорова.
Девочку надо найти и проверить, действительно ли этот факт имеет место. Если имеет,
то девочка нуждается в соответствующем лечении.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 112
лекций.
Способ 2
Для экономии места и для получения гистограмм для мальчиков и девочек в
одном и том же масштабе можно получить диаграммы с нормальной кривой для
мальчиков и для девочек на одном рисунке. Для этого нужно, чтобы файл данных не был
бы разбит на две группы:
Data
Split file...
Reset
OK.
После чего можно заказывать гистограммы:
Graphs
Legacy Dialogs
Histogram…
Появится диалоговое окно (Рис.9.1.4.4). Для построения гистограмм с
нормальной кривой по «Физической агрессии» переменную Physical Aggression надо
перенести в окно «Variable», переменную Gender – в окно «Rows:», а в окошке «Display
normal curve» надо поставить галочку и нажать кнопку ОК.
Рисунок 9.1.4.4. Построение гистограмм с нормальной кривой для мальчиков и девочек
на одном рисунке.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 113
лекций.
После чего появится рисунок с двумя гистограммами (Рис.10.1.4.5).
Рисунок 9.1.4.5. Гистограммы с нормальной кривой по переменной «Физическая
агрессия» для мальчиков и девочек.
Если переменную Gender перенести не в окно «Rows:» (Рис.9.1.4.4), а в окно
«Columns:», то получатся гистограммы с нормальной кривой в одной строке
(Рис.9.1.4.6).
Рисунок 9.1.4.6. Гистограммы с нормальной кривой по переменной «Физическая
агрессия» для мальчиков и девочек.
Ту же самую процедуру надо проделать для всех остальных переменных
(Рис.9.1.4.7-9.1.4.13.).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 114
лекций.
Рисунок 9.1.4.7. Гистограммы с нормальной кривой по переменной «Косвенная
агрессия» для мальчиков и девочек.
Рисунок 9.1.4.8. Гистограммы с нормальной кривой по переменной «Раздражение» для
мальчиков и девочек.
Рисунок 9.1.4.9. Гистограммы с нормальной кривой по переменной «Негативизм» для
мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 115
лекций.
Рисунок 9.1.4.10. Гистограммы с нормальной кривой по переменной «Обида» для
мальчиков и девочек.
Рисунок
9.1.4.11.
Гистограммы
с
нормальной
кривой
по
переменной
«Подозрительность» для мальчиков и девочек.
Рисунок 9.1.4.12. Гистограммы с нормальной кривой по переменной «Вербальная
агрессия» для мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 116
лекций.
Рисунок 9.1.4.13. Гистограммы с нормальной кривой по переменной «Чувство вины» для
мальчиков и девочек.
Из анализа полученных гистограмм видно, что распределения данных
отличаются от нормального распределения.
9.1.5. Выбор критерия для исследования гендерных различий
Если обе сравниваемые переменные имеют нормальное распределения, то с
помощью t-тестов сравнивают средние. Если распределение хотя бы одной из
переменных отличается от нормального распределения, то с помощью U-критерия
Манна-Уитни сравнивают уровни признака.
Для выбора критерия сравнения агрессии мальчиков и девочек строят Таблицу
9.1.5.1:
Таблица 9.1.5.1
Выбор критерия сравнения
Variable
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
Normal Distribution
Female
Male
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
Test
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 117
лекций.
9.2. Исследование различия уровня агрессии с помощью Uкритерия Манна-Уитни
Так как распределение данных отличается от нормального распределения, то для
исследования различия в агрессии у мальчиков и девочек следует применить
непараметрический U-критерий Манна-Уитни (Mann-Whitney U-test).
Замечание. Непараметрические тесты могут, конечно, применяться и в случае
нормального распределения. Но тогда они будут иметь лишь 95% эффективность по
сравнению с параметрическими тестами (Бююль & Цефель, 2002; С. 234.). Если выборки
частично подчиняются нормальному закону распределения, а частично нет, то
рекомендуется всегда применять U-критерий (тест) Манна-Уитни.
Data
Split File
Reset
OK
Analyze
Nonparametric Tests
Legacy Dialogs
2 Independent Samples....
Рисунок 9.2.1. Диалоговое окно Two Independent-Samples Tests с введенными переменными
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 118
лекций.
В появившемся диалоговом окне (Рис.9.2.1) Two Independent-Samples Tests
перенести в окно Test Variable List все переменные, кроме Code и Gender .
Переменную Gender перенести в окно GroupingVariable
Define Groups
Group 1:
Group 2:
1
Рисунок 9.2.2. Диалоговое окно Two Independent-Samples. Определение сравниваемых
групп
Continue
OK
Выходные данные. В файле RESULTS.spv появятся Таблиц 9.2.1-9.2.2.
Таблица 9.2.1
Суммы рангов для мальчиков и для девочек в объединенной группе (Ranks)
Gender
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
N
Mean Rank
Female
Male
30
30
Total
Female
Male
Total
Female
Male
Total
Female
Male
Total
Female
Male
Total
Female
Male
Total
Female
Male
Total
Female
Male
60
30
30
60
30
30
60
30
30
60
30
30
60
30
30
60
30
30
60
30
30
Total
60
Sum of Ranks
19.02
41.98
570.50
1259.50
40.13
20.87
1204.00
626.00
31.88
29.12
956.50
873.50
18.35
42.65
550.50
1279.50
34.98
26.02
1049.50
780.50
33.18
27.82
995.50
834.50
18.02
42.98
540.50
1289.50
29.58
31.42
887.50
942.50
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 119
лекций.
Таблица 9.2.2
Статистики тестов и р-вероятности (Test Statisticsa)
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
105.5
570.5
-5.196
161.0
626.0
-4.339
408.5
873.5
-.637
85.5
550.5
-5.542
.000
.000
.524
.000
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2tailed)
Resent
ment
Suspicion
and Distrust
Verbal
Aggression
315.5
780.5
-2.061
369.5
834.5
-1.229
75.5
540.5
-5.593
422.5
887.5
-.422
.039
.219
.000
.673
a. Grouping Variable: Gender
В Таблице 9.2.2 представлены U-статистика Манна-Уитни, W-статистика
Вилкоксона, равная наименьшей сумме рангов объединенной группы и Z-статистика для
стандартизованного нормального распределения ( z = 0, sz = 1 ).
Прежде всего нам необходима последняя строка Таблицы 9.2.2.
В соответствии с принятой в (Бююль & Цефель, 2002; с.88) терминологией, если
Sig. ≤ .05, то различие значимое,
Sig. ≤ .01, то различие очень значимое,
Sig. ≤ .001, то различие максимально значимое.
Максимально значимые различия имеются по переменным Physical Aggression,
Indirect Aggression, Negativism, Verbal Aggression. Значимые различия имеются по
переменной Resentment.
Для выяснения, чей же уровень агрессии выше: мальчиков или девочек,
обратимся к Таблице рангов 9.2.1. Группа, у которой при значимых различиях средний
ранг выше, агрессивнее.
Физическая агрессия (Physical Aggression)
Выше у мальчиков: U = 105.5, р < .001;
Косвенная агрессия (Indirect Aggression)
Выше у девочек U = 161.0, р < .001;
Негативизм (Negativism) Выше у мальчиков U = 85.5, р < .001;
Обида (Resentment) выше у девочек U = 315.5, р = .039;
Вербальная агрессия (Verbal Aggression)
Различия
по
переменным
Выше у мальчиков U = 75.5, р < .001.
Раздражение
(Irritation),
Подозрительность
(Suspicion and Distrust), и Чувство вины (Guilt) выявлены не были.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 120
лекций.
Guilt
9.3. Представление результатов теста Манна-Уитни в отчетах. Размер
эффекта
Для отчетов о результатах непараметрических тестов не приводят значения
средних значений и стандартных отклонений. Приводят значения медианы и размер
эффекта r. Это связано с тем, что размеры эффектов являются стандартизованными
показателями, которые можно сравнивать с размерами эффектов, полученными в других
исследованиях.
Размер эффекта может быть вычислен путем деления Z (из Таблицы 9.2.2) на
корень квадратный из числа всех наблюдений N (Fritz, Morris, & Richler, 2012, p.12):
r=
Z
N
.
(9.3.1)
Каждый статистический тест имеет свой индекс размера эффекта.
Коэн (Cohen, 1988) сделал несколько широко используемых предложений о том,
что составляет большой или малый эффект (Fritz et al. 2012, p.12):
•
r = .10 (небольшой эффект): в этом случае эффект объясняет 1% от общей
дисперсии,
•
r = .30 (средний эффект): эффект составляет 9% от общей дисперсии,
•
r = .50 (большой эффект): эффект составляет 25% от дисперсии.
Следует иметь в виду, что r не измеряется в линейном масштабе, поэтому эффект с r
= .6 не вдвое больше, чем с r = .3.
Данные рекомендации могут быть полезны для оценки важности эффекта на
практике (независимо от значимости тестовых статистик), но не следует забывать, что
эти «законсервированные» размеры эффекта не могут заменить оценку размера эффекта
в контексте конкретного исследования.
Размер эффекта мы вычисляем для конкретной выборки. Но нас интересует
размер эффекта для популяции. Исследуя один и тот же вопрос для получения размера
эффекта в популяции можно комбинировать размеры эффектов из разных исследований.
Это называется мета-анализом (Field, 2009; Pр.56-57).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 121
лекций.
По результатам теста Манна-Уитни можно сделать следующие выводы (Таблица
9.3.1).
Таблица 9.3.1
Результаты исследования гендерных различий по шкалам методики Басса-Дарки с
Девочки,
Mdn
Statistics, U
Statistics, Z
p-value
Variable
Мальчики,
Mdn
помощью теста Манна-Уитни
8.50
5.00
105.5
5.20
.000
.67
большой
5.00
7.00
161.0
4.34
.000
.56
большой
5.00
6.00
2.00
6.00
85.5
408.5
5.54
0.64
.000
.52, ns
.72
.08
большой
нет эффекта
5.00
6.00
369.5
2.06
.22, ns
.27
небольшой
4.00
5.00
315.5
1.23
.039
.16
небольшой
10.0
6.00
75.5
5.59
.000
.72
большой
5.00
5.00
422.5
0.42
.67, ns
.05
нет эффекта
Физическая агрессия (Physical
Aggression)
Косвенная агрессия (Indirect
Aggression)
Негативизм (Negativism)
Раздражение (Irritation)
Подозрительность (Suspicion
and Distrust)
Обида (Resentment)
Вербальная агрессия (Verbal
Aggression)
Чувство вины (Guilt)
Effect size, r
Пример вычисления размера эффекта. Для Физической агрессии размер
эффекта равен r =
5.196
= .67 .
60
Тест Манна-Уитни указывает на то, что физическая агрессия мальчиков (Mdn = 8.50)
превыает агрессию девочек (Mdn = 5.00), U = 105.5, (Z = -5.20), p < .001, различие
агрессии у мальчиков и девочек r = .67. Размер эффекта большой.
Интересно отметить, что для переменной «Подозрительность», статистической
значимости различий не найдено, хотя эффект малого размера (почти среднего, r = .27)
имеется. Для переменной «Обида» гендерные различия значимые, но размер эффекта
меньше: r = .16.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 122
лекций.
9.4. Исследование различия средних уровней агрессии с
помощью параметрического t-теста
Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест МаннаУитни не выявил различий. Было установлено, что можно воспользоваться более
мощным параметрическим t-тестом для сравнения средних двух независимых выборок,
так как только для переменной «Раздражение» (Рис.5.3.5.12) в группе девочек был всего
лишь один «выброс» типа «Outliers», который не оказывает существенного влияния на
среднее значение и абсолютная величина асимметрии распределений всех трех
переменных (Таблица 9.1.1.1) небольшая: в пределах
1.96*SES = 0.84,
где SES = 0.43 - стандартная ошибка асимметрии.
Таблица 9.4.1
Асимметрия для шкал «Раздражение» (I), «Подозрительность» (S) и «Чувство вины»
(G) в группах мальчиков и девочек
Девочки
Асимметрия, S
Мальчики
I
S
G
I
S
G
0.61
0.18
0.19
0.31
0.53
0.58
Примечание. В таблице выделены случаи, когда абсолютная величина асимметрии
превышает свою стандартную ошибку: S ≥ SES = 0.43 . Во всех случаях абсолютная
величина асимметрии меньше 1.96*SES = 0.84.
Следовательно, к переменным «Раздражение» (I), «Подозрительность» (S) и
«Чувство вины» (G) может быть применена параметрическая статистика (Наследов,
2004, с.43), а именно t-тест.
В качестве упражнения, ради того, чтобы понять, как работать на SPSS с tтестами для двух независимых выборок, мы применим t-тест ко всем шкалам методики
Басса-Дарки.
Analyze
Compare Means
Independent-Samples T Test....
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 123
лекций.
В диалоговом окне (Рис.9.4.1) Independent-Samples T Test надо перенести в окно
Test Variable(s) переменные:
Physical Aggression [PhA], Indirect Aggression [IA], Indirect Aggression [VA] и др.
Рисунок 9.4.1. Independent-Samples t-test с введенными переменными.
Переменную Пол [sex] перенести в окно GroupingVariable
Define Groups (Рис.9.4.2)
Group 1:
Group 2:
1
Continue
OK
Рисунок 9.4.2. Independent-Samples t-test с введенными переменными.
Выходные данные
В файле RESULTS.spv появятся Таблицы 9.4.1-9.4.2.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 124
лекций.
Таблица 9.4.1.
Статистики групп (Group Statistics)
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
N
Gender
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
Mean
5.3333
8.0333
7.1667
5.0000
6.4333
6.2667
2.2667
4.3333
4.6667
4.0667
5.5333
5.1000
6.0667
9.6000
5.0333
5.2000
Std. Deviation Std. Error Mean
1.21296
.22145
1.65015
.30127
1.11675
.20389
2.10090
.38357
.93526
.17075
1.33735
.24417
1.01483
.18528
1.02833
.18775
1.06134
.19377
1.22990
.22455
1.38298
.25250
1.06188
.19387
1.22990
.22455
2.04434
.37324
1.37674
.25136
1.15669
.21118
Таблица 9.4.2
t-тест для независимых выборок (Independent Samples Test). Фрагмент выходной
таблицы
Levene's Test for Equality of
Variances
F
Physical
Aggression
Equal variances assumed
Sig.
3.645
t-test for Equality of Means
t
.061
Equal variances not
assumed
df
Sig. (2-tailed)
-7.221
58
.000
-7.221
53.257
.000
Indirect
Aggression
Equal variances assumed
Equal variances not
assumed
4.134
.047
4.988
4.988
58
44.176
.000
.000
Equal variances assumed
Equal variances not
assumed
4.381
.041
Irritation
.559
.559
58
51.891
.578
.578
Equal variances assumed
Equal variances not
assumed
.089
.767
-7.835
-7.835
58
57.990
.000
Negativism
Equal variances assumed
Equal variances not
assumed
.664
2.023
2.023
58
56.784
.048
Resentment
Suspicion
and Distrust
Equal variances assumed
Equal variances not
assumed
3.091
.084
1.361
1.361
58
54.374
.179
.179
Equal variances assumed
4.768
.033
-8.112
58
.000
-8.112
47.561
.000
-.508
58
.614
-.508
56.326
.614
Verbal
Aggression
Equal variances not
assumed
Equal variances assumed
Guilt
.418
Equal variances not
assumed
.622
.433
.000
.048
В таблице (Independent Samples Test), фрагмент которой представлен в Таблице
9.4.2, имеются результаты двух тестов:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 125
лекций.
•
F-тест Ливена для сравнения дисперсий,
•
t-тест Стьюдента для сравнения средних.
Если выборочные дисперсии различаются статистически незначимо (Sig. >.05;
верхняя строка «Equal variances assumed»), то для сравнения средних используется tкритерий Стьюдента.
Если выборочные дисперсии различаются статистически значимо (Sig. ≤ .05;
нижняя строка «Equal variances not assumed»), то такая ситуация называется проблемой
Фишера-Беренса и для сравнения средних используется модификация t-критерия
Стьюдента.
Схема исследования:
1) Если дисперсии, проверенные с помощью теста Левена равны, то смотрят
результаты t-теста по строке Equal variances assumed.
2) Если дисперсии, проверенные с помощью теста Левена не равны, то смотрят
результаты t-теста по строке Equal variances not assumed.
Дисперсии не равны, если Sig. ≤ .05.
Случаи неравных дисперсий в Таблице 9.4.2 выделены.
В соответствующей строке для t-теста:
Sig. = – это p-value. Если (Бююль & Цефель, 1976, с.88):
Sig. > .05. то различие незначимое (ns).
Sig. ≤ .05. то различие значимое (уровень значимости α = .05).
Sig. ≤ .01. то различие очень значимое (уровень значимости α = .01).
Sig. ≤ .001. то различие максимально значимое (уровень значимости α = .001).
Максимально значимые различия имеются по переменным Physical Aggression, Indirect
Aggression, Negativism, Verbal Aggression.
Значимое различие имеется по переменной Resentment.
Незначимые различия имеются по переменным Irritation, Suspicion and Distrust, Guilt.
Для выяснения, у кого выше среднии значения: у мальчиков или у девочек,
обращаются к Таблице 9.4.1 (Group Statistics). У кого при значимых различиях среднее
значение выше, тот и агрессия выше.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 126
лекций.
Результаты исследования те же, что и с непараметрическими критериями.
Физическая агрессия (Physical Aggression) выше у мальчиков t(58) = -7.22, р < .001;
Косвенная агрессия (Indirect Aggression) выше у девочек t(44) = 4.99, р < .001;
Негативизм (Negativism) выше у юношей t(58) = -7.84, р < .001;
Обидчивость (Resentment) выше у девочек t(58) = 2.02, р = .048;
Вербальная агрессия (Verbal Aggression) выше у мальчиков t(48) = -8.11, р < .001.
Различия по переменным Irritation, Suspicion and Distrust, Guilt выявлены не
были.
Следует помнить, что на величину среднего влияет каждое значение признака. То
есть среднее чувствительно к экстремальным значениям («выбросам»).
Если нет нормального распределения, то сравнение средних значений возможно,
если: (1) Группы достаточно большие, чтобы можно было бы судить о форме
распределения; (2) Распределения симметричны; (3) Отсутствуют «выбросы».
Если хотя бы одно из этих условий не выполняется, то следует ограничиться
сравнением уровней признака (например, использовать тест Манна-Уитни).
9.5. Представление результатов t-теста в отчетах. Размеры
эффекта
Размер эффекта для t-теста можно выразить с помощью индексов: d Коэна
(Cohen's d, effect size). Размер эффекта d Коэна используется при сравнении двух средних.
Его используют при описании результатов t-теста.
Для t-теста для двух независимых выборок размер эффекта - Cohen's d находится
путем деления разности средних значений этих выборок на суммарное стандартное
отклонение «pooled standard deviation»:
d=
где SD pooled =
M1 − M 2
,
SDpooled
(9.5.1)
SD12 + SD22
.
2
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 127
лекций.
Значения размера эффекта меняются в том же диапазоне, что и три стандартных
отклонения для стандартизованных данных: от -3.0 до 3.0. Можно использовать
интерпретацию, предложенную Коэном (Cohen, 1988):
0.8 - большой размер эффекта (8/10 от стандартного отклонения),
0.5 - умеренный размер эффекта (1/2 от стандартного отклонения),
0.2 - маленький размер эффекта (1/5 от стандартного отклонения).
Иллюстрация для размера эффекта t-теста для двух независимых выборок
приводится на Рис.9.5.1.
Пример вычисления размера эффекта d. Для «Физической агрессии» размер
эффекта равен (см. Таблицу 9.5.1):
d=
8.0333 − 5.3333
(1.65015) + (1.21296 )
2
2
= 1.86 .
2
Индексы размеров эффекта d Коуэна по результатам t-теста (Таблицы 9.4.1-9.4.2)
вычислены в Таблице 9.5.1.
Рисунок 9.5.1. Иллюстрация для размера эффекта Cohen’s d = .6. Рисунок взят из
публикации в Интернете: Magnusson, K. (2014). Interpreting Cohen's d effect size an
interactive visualization. Retrieved in http://rpsychologist.com/d3/cohend/
Результаты t – теста для двух независимых выборок представлены в Таблице
9.5.1.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 128
лекций.
Таблица 9.5.1
Результаты исследования гендерных различий по шкалам методики Басса-Дарки с
Мальчики, M
Мальчики, SD
Девочки, M
Девочки, SD
Statistics, t
df
p-value
помощью t-теста
Физическая агрессия
8.03
1.65
5.33
1.21
-7.22
58
.000
1.86
большой
Косвенная агрессия
6.27
1.34
7.17
1.12
4.99
44
.000
0.73
средний
Негативизм
4.33
1.03
2.27
1.01
-7.84
58
.000
2.02
большой
Раздражение
6.27
1.34
6.43
0.94
0.60
52
.58, ns
0.14
нет эффекта
Подозрительность
5.10
1.06
5.53
1.38
1.36
58
.18, ns
0.35
небольшой
Обида
4.07
1.23
4.67
1.06
2.02
58
.048
0.52
средний
Вербальная агрессия
9.60
2.04
6.07
1.23
-8.11
48
.000
2.09
большой
Чувство вины
5.20
1.16
5.03
1.38
-0.51
58
.61
0.13
нет эффекта
Переменная
Размер эффекта, d
Примеры описания некоторых результатов. С помощью t-теста для
независимых выборок найдено:
•
Cреднее значение «Физической агрессии» в выборке девочек M = 5.33 (SD = 1.21)
статистически значимо меньше среднего значения в выборке мальчиков M = 8.03 (SD
= 1.65): t(58) = -7.22, p < .001, d = 1.86, размер эффекта большой;
•
Cреднее значение «Косвенной агрессии» в выборке девочек M = 7.17 (SD = 1.12)
статистически значимо больше среднего значения в выборке мальчиков M = 6.27 (SD
= 1.34): t(44) = 4.99, p < .001, d = 0.73, размер эффекта умеренный. Тест Левина
показал неравные дисперсии (F = 4.13, p = .047), поэтому число степеней свободы
было скорректировано от 58 до 44;
•
Cреднее значение по переменной «Обида» в выборке мальчиков M = 4.07 (SD = 1.23)
статистически значимо меньше среднего значение в выборке девочек M = 4.67 (SD =
1.06): t(58) = 2.02, p = .048, d = 0.52, размер эффекта умеренный.
Интересно отметить, что для переменной «Подозрительность», статистической
значимости различий не найдено, хотя эффект малого размера (d = 0.35) наблюдается).
Девочки (M = 5.53, SD = 1.38) оказались более подозрительными, чем мальчики (M =
5.10, SD = 1.06).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 129
лекций.
В Таблице 9.5.3 приводятся все вычисленные размеры эффекта.
Таблица 9.5.3
Размеры эффектов для U-теста и t-теста для исследования гендерных различий
по шкалам методики Басса-Дарки
Переменная
t-test
U-test
Размер эффекта, d
Размер эффекта, r
Физическая агрессия
1.86
большой
.67
большой
Косвенная агрессия
Негативизм
Раздражение
Подозрительность
Обида
Вербальная агрессия
Чувство вины
0.73
2.02
0.14
0.35
0.52
2.09
0.13
средний
большой
нет эффекта
небольшой
средний
большой
нет эффекта
.56
.72
.08
.27
.16
.72
.05
большой
большой
нет эффекта
небольшой
небольшой
большой
нет эффекта
Домашнее задание 1
1. Варианты данных для Домашнего задания 1 находятся в файле
Aggression_Variants_(1-16).xlsx
Номер варианта назначается преподавателем.
2. Требуется провести все необходимые вычисления и написать математическую часть
для работы с исследовательской гипотезой о наличии гендерных различий агрессивности
у подростков. Пример оформления находится в Приложении 2.
3. При написании математической части работы необходимо выполнять требования АРА
по написанию исследовательских отчетов1 2, некоторые из которых приводятся в
Приложении 5.
1
Purdue Online Writing Lab http://owl.english.purdue.edu/owl/resource/560/3/
Reporting Statistics in Psychology. Available at http://evc-cit.info/psych018/Reporting_Statistics.pdf http://evccit.info/psych018/Reporting_Statistics.pdf
2
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект 130
лекций.
10. Исследование связи
Две переменные могут быть связаны:
1. Функциональной связью, когда каждому значению переменной X соответствует
одно определенное значение переменной Y. В психологических задачах переменных,
связанных функциональной связью нет;
2. Стохастической или вероятностной связью, если одному значению признака X
соответствует распределение различных значений признака Y и наоборот. Например, связь
между ростом и весом людей (Наследов, 2004; с.66).
В частном случае, если вероятностная связь проявляется в том, что при изменении
одного из признаков изменяется среднее значение другого, то вероятностную связь
называют корреляционной (Гмурман, 1999; с.253).
10.1. Корреляционная диаграмма
Наглядной иллюстрацией характера связи является корреляционная диаграмма, или
диаграмма рассеивания (scattering diagram).
Пусть значения признака X равны x1 ; x2 ; K ; x n , а значения признака Y
соответственно равны y1 ;
y2 ; K ; yn .
Графическое изображение на плоскости всех точек с координатами
( xi ; y i ) ,
называется корреляционной диаграммой или диаграммой рассеивания.
Например, для данных Таблицы 10.1.1 корреляционная диаграмма изображена на
Рис.10.1.1. Для четырех наблюдений с кодами s6, s7, s8, s9 компьютерные программы
рисуют всего лишь одну точку. Поэтому для изучения связи требуются не только
корреляционные диаграммы, которые не совсем точно отражают реальную ситуацию, но и
другие статистические показателя.
Корреляционные диаграммы иногда позволяют выявить случаи, когда корреляция
обусловлена неоднородностью выборки по той или другой переменной, а также определить
характер связи: линейность и монотонность.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
131
8
7
s3
6
s10
Code
s1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s5
5
Y
Таблица 10.1.1.
Значения признаков Х и Y
4
s2
4
3
s6, s7, s8, s9
s1
2
s4
1
1
2
3
4
5
X
X
1
1
1
2
2
3
3
3
3
4
Y
2
4
6
1
5
4
4
4
4
6
Рисунок 10.1.1. Корреляционная диаграмма
для данных Таблицы 11.1.1.
Корреляционная диаграмма представляет собой некоторое скопление, "облако"
точек на плоскости. По форме и наклону этого "облака" по отношению к оси абсцисс можно
оценить наличие корреляционной связи и ее тип.
1. Если "облако" точек имеет приблизительно форму овала, вытянутого вдоль
некоторой воображаемой горизонтальной прямой (графика функции
y = const ), то
корреляционной связи между переменными нет (Рис.10.1.2).
2. Если "облако" точек вытянуто вдоль некоторой воображаемой наклонной прямой
(графика линейной функции y = ax + b,
(a ≠ 0) ), то между переменными имеется линейная
корреляционная связь (Рис.10.1.3-10.1.5).
3. Если "облако" точек распространяется вдоль некоторой воображаемой линии,
которая не является прямой (т.е. вдоль графика некоторой нелинейной функции y = f ( x ) ),
то корреляционная связь между переменными нелинейная (Рис. 10.1.3, 10.1.6, 10.1.7).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
132
Y
Y 55
8
7
45
6
5
35
4
3
2
25
1
15
50
100
150
50
100
150
X
Рисунок 10.1.2. Связи нет.
X
Рисунок 10.1.3. Нелинейная немонотонная
связь.
Y
Y 60
60
50
50
40
40
30
30
20
20
10
10
30
60
90
120
150
30
60
90
120
X
X
Рисунок 10.1.4. Линейная положительная связь.
Рисунок 10.1.5. Линейная отрицательная связь.
Y 70
Y 60
60
50
50
150
40
40
30
30
20
20
10
10
30
60
90
120
150
30
60
90
120
150
X
X
Рисунок 10.1.6. (Монотонная) нелинейная
Рисунок 10.1.7. (Монотонная) нелинейная
положительная связь.
отрицательная связь.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
133
4. Если функция y = f ( x ) монотонная (возрастающая или убывающая), то говорят о
монотонной связи (Рис. 10.1.4-10.1.7). При этом если y = f ( x ) - возрастающая функция, то
есть большим значениям одной переменной соответствуют большие значения другой
переменной, то связь называют положительной (Рис. 10.1.4, 10.1.6). Если y = f ( x ) убывающая функция, то есть большим значениям одной переменной соответствуют
меньшие значения другой переменной, то связь называют отрицательной (Рис. 10.1.5,
10.1.7). Монотонная связь может быть, в частности, линейной (Рис. 10.1.4-10.1.5).
10.2. Коэффициент корреляции Пирсона
Количественной мерой силы и направления корреляционной связи двух переменных
является коэффициент корреляции.
В этом параграфе мы рассмотрим коэффициенты корреляции Пирсона, Спирмена, τКендалла, бисериальный коэффициент корреляции и точечно-бисериальный коэффициент
корреляции.
Если данные представлены в порядковых шкалах или в метрических шкалах, то для
исследования связи используют коэффициенты корреляции Пирсона (Pearson), Спирмена
(Spearman) и «тау»-Кендалла ( τ − Kendall).
Если связь является немонотонной, то коэффициенты корреляции не подходят.
Коэффициенты корреляции также не подходят для номинальных переменных.
Исключение: дихотомические переменные.
10.2.1. Вычисление коэффициента корреляции Пирсона
Для оценки тесноты линейной связи используют коэффициент корреляции Пирсона
rxy = r (Pearson’s product-moment correlation coeffcient).
Коэффициент корреляции Пирсона вычисляется с помощью формулы (10.2.1.1),
которая содержит средние арифметические значения и отклонения от средних. Поэтому на
его значение оказывают влияние «выбросы» и отклонения распределения данных от
нормального распределения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
134
n
rXY =
∑ (x
i =1
n
∑ (x
i =1
i
− x )( y i − y )
i
n
− x ) ⋅ ∑ ( yi − y )
2
,
(10.2.1.1)
2
i =1
Коэффициент корреляции Пирсона принимает значения из интервала [-1;1].
Показателем силы связи является абсолютная величина коэффициента корреляции.
Направление связи определяется знаком коэффициента корреляции.
Если распределение данных по двум переменным не отличается от нормального
распределения, то вычисляют коэффициент корреляции Пирсона. Иногда его можно
использовать и в случае отсутствия нормального распределения, но при этом должны
выполняться условия (Наследов, 2004, С.89):
- обе переменные не должны иметь выраженной асимметрии,
- должны отсутствовать «выбросы»,
- связь между переменными предполагается линейной.
10.2.2. Размер эффекта для коэффициента корреляции Пирсона
Так как коэффициент корреляции Пирсона является безразмерной мерой связи, то его
также используют в качестве индекса размера эффекта. Он имеет следующую
интерпретацию (см., например, Field, 2009, p.173; Ellis, 2010, p.41):
.1 – малый размер эффекта, .3 – средний размер эффекта, .5 – большой размер эффекта.
Для определения силы связи можно использовать классификацию коэффициентов
корреляции Пирсона, приведенную в Таблице 10.2.5.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
135
Таблица 10.2.2.1
Классификация коэффициента корреляции Пирсона rxy
rxy
Характер связи
1
Функциональная, линейная, положительная
[ .5; 1 )
Сильная линейная, положительная
[ .3; .5 )
Умеренная линейная, положительная
[ .1; 3 )
Слабая линейная, положительная
( -.1; .1 )
Линейной связи нет. Может быть нелинейная связь
( -.3; -.1 ]
Слабая линейная, отрицательная
( -.5; -.3 ]
Умеренная линейная, отрицательная
( -1; -.5 ]
Сильная линейная, отрицательная
-1
Функциональная, линейная, отрицательная
10.2.3. Проверка статистической значимости коэффициента
корреляции Пирсона
Если переменные X и Y, нормально распределенные; выборка случайная, объема n и
выборочный коэффициент корреляции Пирсона: rxy = r, то встают вопросы: «Является ли
коэффициент корреляции Пирсона статистически значимым или его отличие от нуля
можно объяснить случайностями?», «Связаны ли признаки линейной корреляционной
связью?».
Ответ на эти вопросы дает проверка статистических гипотез.
H 0 : Выборочный коэффициент корреляции Пирсона r имеет случайное отличие от нуля.
H 1 : Выборочный коэффициент корреляции Пирсона r отличается от нуля закономерно.
Можно эти же гипотезы сформулировать и для популяции. Пусть ρ – коэффициент
корреляции Пирсона для популяции. Тогда:
H 0 : ρ = 0,
H 1 : ρ ≠ 0.
Если подтверждается нулевая гипотеза, то говорят, что линейная связь между
переменными не выявлена. Может быть, найдется другой способ ее выявить.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
136
Если принимается альтернативная гипотеза, то говорят, что выборочный
коэффициент корреляции Пирсона статистически значим, и что переменные в популяции
связаны линейной (положительной или отрицательной связью, в зависимости от знака
коэффициента корреляции).
Критерий:
T=
r
1− r2
n−2
.
(10.2.3.1)
При справедливости нулевой гипотезы случайная величина Т имеет t-распределение
Стьюдента с df = n – 2 степенями свободы.
Пример. Проверить, имеется ли линейная корреляционная связь между двумя
переменными, если известны коэффициенты корреляции Пирсона r и объемы выборок n.
Сформулировать гипотезы о связи. Рассмотреть ненаправленную альтернативную гипотезу
(случай two-tailed, двухвостовый).
Исходные данные:
r
.321
-.302
.278
.278
.461
n
22
44
115
30
40
Гипотезы:
H 0 : Выборочный коэффициент корреляции Пирсона r имеет случайное отличие от нуля.
H 1 : Выборочный коэффициент корреляции Пирсона r отличается от нуля закономерно.
Или
H 0 : ρ = 0,
H 1 : ρ ≠ 0.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
137
Случай 1. r = .351; n = 22.
Т-статистика:
t=
0.351
1 − ( 0.351)
22 − 2
2
= 1.5158 .
p-value находим с помощью Excel.
Открываем программу Excel. Выбираем функцию T.DIST.2T и в появившееся окно
вносим информацию:
Х = 1.5158, Deg_freedom = 20
(Рис.10.2.2.1), OK.
В соответствующей ячейке появляется число 0.145216394
Рисунок 10.2.3.1. Окно для функция T.DIST.2T.
Таким образом, two-tailed p-value = 0.145216.
Ответ: Нет оснований отклонить нулевую гипотезу. Линейная связь между
переменными не найдена, выборочный коэффициент корреляции Пирсона r = .35 отличается
от нуля статистически незначимо: t(20) = 1.52, p = .15 (two-tailed). Отличие r от нуля может
быть объяснено случайными причинами.
Можно также записать: r(22) = .35, p = .15 (two-tailed).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
138
Замечание. Для правосторонней альтернативной гипотезы: H 1 : ρ > 0 мы получили р
= .073 > .05. Также нет оснований отклонить нулевую гипотезу.
Случай 2. r = -.302; n = 44.
Т-статистика:
t=
−0.302
1 − ( −0.302 )
44 − 2
2
= −2.0530 .
p-value находим с помощью Excel. df = 42. Two-tailed p-value = .046 < .05.
Ответ: На уровне значимости α = .05 справедлива альтернативная гипотеза.
Переменные в популяции связаны между собой линейной отрицательной корреляционной
связью. Выборочный коэффициент корреляции Пирсона r = -.30 отличается от нуля
статистически значимо: t(42) = -2.05, p = .046 (two-tailed).
Можно также записать: r(44) = -.30, p = .046 (two-tailed).
Случай 3. r = .278; n = 115.
Т-статистика:
t=
0.278
1 − ( 0.278 )
115 − 2
2
= 3.0765 .
p-value находим с помощью Excel. df = 113. Two-tailed p-value = .003 < .01.
Ответ: На уровне значимости α = .01 справедлива альтернативная гипотеза.
Переменные в популяции связаны между собой линейной положительной корреляционной
связью. Выборочный коэффициент корреляции Пирсона r = .28 отличается от нуля
статистически значимо: t(113) = 3.08, p = .003 (two-tailed).
Можно также записать: r(115) = .28, p = .003 (two-tailed).
Случай 4. r = .278; n = 30.
Т-статистика:
t=
0.278
1 − ( 0.278 )
30 − 2
2
= 1.5314 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
139
p-value находим с помощью Excel. df = 28. Two-tailed p-value = .137 > .05.
Ответ: Нет оснований отклонить нулевую гипотезу. Линейная связь между переменными
не найдена, выборочный коэффициент корреляции Пирсона r = .28 отличается от нуля
статистически незначимо: t(28) = 1.53, p = .14 (two-tailed). Отличие r от нуля может быть
объяснено случайными причинами.
Можно также записать: r(30) = .28, p = .14 (two-tailed).
Случай 5. r = .461; n = 90.
Т-статистика:
t=
0.461
1 − ( 0.461)
90 − 2
2
= 4.8733 .
p-value находим с помощью Excel. df = 98. Two-tailed p-value = 0.0000048184 < .001.
Ответ: На уровне значимости α = .001 справедлива альтернативная гипотеза.
Переменные в популяции связаны между собой линейной положительной корреляционной
связью. Выборочный коэффициент корреляции Пирсона r = .46 отличается от нуля
статистически значимо: t(88) = 4.87, p < .001 (two-tailed).
Можно также записать: r(90) = .35, p < .001 (two-tailed).
Коэффициент корреляции Пирсона
Статистически значим
Статистически незначим
Выявлена линейная
корреляционная связь
Линейная корреляционная
связь не выявлена
Связь не выявлена
Есть нелинейная связь
Рисунок 10.2.3.2. Исследование связи с помощью коэффициента корреляции Пирсона.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
140
Таблица 10.2.3.1
Используемые обозначения при обработке данных с помощью SPSS и принятая
терминология (Бююль & Цефель, 2002; с.88)
Вероятность ошибки (p=Sig.)
Значимость коэффициентов корреляции
Обозначение
p > .05
Незначим
ns
p ≤ .05
Значим
*
p ≤ .01
Очень значим
**
p ≤ .001
Максимально значим
***
Если коэффициент корреляции Пирсона статистически значим, то выявлена линейная
корреляционная связь – положительная или отрицательная11. Если коэффициент
корреляции Пирсона статистически незначим, то возможны два варианта (Рис.10.2.3.2): или
линейная связь не выявлена, или связь нелинейная.
10.2.4. Представление коэффициента корреляции Пирсона в
отчетах
Для представления коэффициента корреляции Пирсона в научных отчетах по
рекомендациям АРА12 необходимо выполнять следующие правила.
Ноль в целой части значения коэффициента корреляции. Так как │r│≤ 1, то ноль в
целой части значения коэффициента корреляции не пишется. Например, значения
коэффициентов корреляции могут быть записаны как: .13, .84, -.23, -35.
Абсолютная величина коэффициента корреляции. При .1 ≤ │r│≤ 1 следует оставлять
два знака после запятой. При 0 ≤ │r│< .1 следует оставлять три знака после запятой.
Курсив и пробелы. Следует обратить внимание на написание курсивом и на пробелы.
Стиль APA очень точен. Для обозначения коэффициента корреляции Пирсона используется
11
12
Если, конечно, корреляция не является ложной. См. п.10.5.
http://evc-cit.info/psych018/Reporting_Statistics.pdf
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
141
буква латинского алфавита r, которая пишется курсивом. До и после знаков = , < , > должен
быть пробел.
Указание объема выборки. Объем выборки пишется в скобках, сразу за буквой r.
Например, r(50) = .67.
Указание статистической значимости. Для коэффициентов корреляции Пирсона
значение величины t-теста не указывается. Приводится только р-значение.
Запись p-значения. Но стиль APA требует предстивления в исследовательских
отчетов точного p-значения, в случаях, когда p ≥ .001.
При .1 ≤ р ≤ 1 следует оставлять два знака после запятой. При 0 ≤ р < .1 следует
оставлять три знака после запятой.
Например, р = .002, или р = .084, или р = .23. Если SPSS выдает .000, то пишут p <
.001. Часто дописывают «two tailed p-values are assumed» или «one tailed p-values are
assumed».
Примеры. Приведем примеры записи коэффициентов корреляции Пирсона в
научных отчетах:
r(60) = -.55, p < .001;
r(60) = -.073, p = .58;
r(60) = -.39, p = .002;
r(60) = -.16, p = .20.
Во всех примерах two tailed p-values are assumed.
10.2.5. Сравнение корреляций Пирсона для двух независимых
выборок
Рассмотрим сравнение коэффициентов корреляции для двух независимых выборок
(Гласс, & Стенли, 1976, сс.283-285; Field, 2009, p.191).
Признаки популяций: нормально распределенные;
Коэффициенты корреляции популяции: ρ1 , ρ 2 ;
Выборки: случайные, независимые, объемов n1 , n2 ;
Выборочные коэффициенты корреляции Пирсона: r1 , r2 ;
Гипотезы:
H 0 : ρ1 = ρ 2 ,
H 1 : ρ1 ≠ ρ 2 ,
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
142
H 0 : Выборочные коэффициенты корреляции r1 и r2 отличаются друг от друга случайно.
H 1 : Выборочные коэффициенты корреляции r1 и r2 отличаются друг от друга закономерно.
Критерий:
Z=
Z (r1 ) − Z (r2 )
,
(10.2.5.1)
1 1+ r
ln
2 1− r
(10.2.5.2)
1
1
+
n1 − 3 n 2 − 3
где
Z (r ) =
- это Z-преобразование Фишера.
Z (r1 ) и Z (r2 ) можно найти путем вычисления по данной формуле с помощью
калькулятора.
Случайная величина Z при справедливости нулевой гипотезы имеет нормальное
распределение с параметрами µ Z = 0 и σ Z = 1 .
Используя компьютерную программу Excel (см. п.7.7) можно найти p-value Z –
стандартизованного нормального распределения, когда μ=0, σ=1.
10.2.6. Размер эффекта для разности коэффициентов
корреляции Пирсона
Индексом размера эффекта, который оценивает разность коэффициентов корреляции
r1 и r2 является Cohen’s q, который определяется по формуле:
q = Z ( r1 ) − Z ( r2 ) .
(10.2.6.1)
Интерпретация Cohen’s q такая же, что и у коэффициентов корреляции:
± .10 представляют собой небольшой эффект, ± .30 - средний эффект, ± .50 - большой
эффект (Сohen, 1988; p.115).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
143
Пример. Выяснить: статистически значимо или незначимо отличается выборочный
коэффициент корреляции r1 = -.88 (объем выборки n1 =45) от выборочного коэффициента
корреляции r2 = - .91 другой случайной выборки объема n2 =64. Вычислить размер эффекта.
Дать интерпретацию.
Гипотезы:
H 0 : Выборочные коэффициенты корреляции r1 = - .88 и r2 = - .91 имеют случайное отличие.
H 1 : Выборочные коэффициенты корреляции r1 = - .88 и r2 = - .91 отличаются друг от друга
закономерно.
Преобразованные по Фишеру (11.2.6.2) коэффициенты корреляции равны:
1 1 + ( −0.88 )
Z(r1) = Z(-.88) = ln
= −1.3758 ;
2 1 − ( −0.88 )
Z(r2) = Z(-.91) =
1 1 + ( −0.91)
= −1.5275 .
ln
2 1 − ( −0.91)
Z-статистика:
z=
−1.3758 − ( −1.5275 )
1
1
+
45 − 3 64 − 3
= 0.76
Используя компьютерную программу Excel (см. п.7.7) находим p-value Z –
стандартизованного нормального распределения, когда μ=0, σ=1. Для этого набираем в
ячейке
= 1 – NORM.S.DIST(0.76,TRUE)
Enter
Получаем two-tailed p-value = 0.447254
p = .45 > .05.
Размер эффекта, который оценивает разность коэффициентов корреляции r1 и r2 является
Cohen’s q, который определяется по формуле (10.2.6.1):
q = Z ( r1 ) − Z ( r2 ) = −1.3758 − ( −1.5275) = 0.15 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
144
Ответ:
Нет
оснований
отклонить
Отличие
H0 :
между
выборочными
коэффициентами корреляции r1 (45)= -.88 и r2 (45) = -.91 друг от друга статистически
незначимо и может быть объяснено случайными причинами Z = 0.76, p = .45 (two-tailed).
Размер эффекта Cohen’s q = .15, небольшой.
10.2.7. Сравнение коэффициентов корреляции двух зависимых
выборок
Рассмотрим сравнение коэффициентов корреляции двух зав исимых выборок (Field,
2009, pp.191-192).
Признаки популяций (X, Y), (X, Z), (Y, Z): двумерные, нормально распределенные;
Коэффициенты корреляции популяций: ρ xy , ρ xz , ρ yz ;
Выборка: случайная объема n ;
Выборочные коэффициенты корреляции: rxy , rxz , ryz ;
H 0 : ρ xy = ρ xz ,
Гипотезы:
H 1 : ρ xy ≠ ρ xz ,
H 0 : Переменная Y имеет одинаковую корреляцию с переменными X и Z. Выборочные
коэффициенты корреляции rxy и ryz отличаются друг от друга статистически незначимо.
Отличие может быть объяснено случайными причинами.
H 1 : Переменная Y имеет неодинаковые корреляции с переменными X и Z. Выборочные
коэффициенты корреляции rxy и ryz отличаются друг от друга статистически значимо.
Отличие закономерно и не может быть объяснено случайными причинами.
Критерий:
t = ( rxy − ryz )
(
( n − 3)(1 + rxz )
2 1 − r − rxz2 − ryz3 + 2rxy rxz rzy
2
xy
)
.
(10.2.7.1)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
145
Случайная величина T при справедливости нулевой гипотезы имеет t- распределение
с df = n – 3 степенями свободы.
Используя компьютерную программу Excel (см. п.7.7) можно найти p-value.
Пример. Выяснить: имеет ли переменная «самооценка» (Y) одинаковую корреляцию
с «личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Исходные данные:
rxy = -.52; rxz = .75; ryz = -.28; объем выборки n = 64.
Гипотезы:
H 0 : Переменная «самооценка» (Y) имеет в популяции одинаковую корреляцию с
«личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Выборочные
коэффициенты корреляции rxy =.-52 и ryz =-.28 отличаются друг от друга статистически
незначимо. Отличие может быть объяснено случайными причинами.
H 1 : Переменная «самооценка» (Y) имеет в популяции неодинаковые корреляции с
«личностной тревожностью» (X) и с «ситуативной тревожностью» (Z). Выборочные
коэффициенты корреляции rxy =.-52 и ryz =-.28 отличаются друг от друга статистически
значимо. Отличие закономерно и не может быть объяснено случайными причинами.
Z-статистика:
t = ( ( −0.52 ) − ( −0.28 ) )
( 64 − 3) (1 + ( 0.75 ) )
= −2.67 .
2
2
2 (1 − ( −0.52 ) − ( 0.75 ) − ( −0.28 ) + 2 ( −0.52 )( 0.75 )( −0.28 ) )
2
Используя компьютерную программу Excel (см. п.7.7) находим p-value t –
распределения, когда df = n - 3 = 64 – 3 = 61, two-tailed. Откуда р-value:
p = .00970826 = .010.
Размер эффекта, который оценивает разность коэффициентов корреляции r1 и r2 является
Cohen’s q, который определяется по формуле (11.2.7.1):
q = Z ( −0.52 ) − Z ( −0.28 ) =
1 1 + ( −0.52 ) 1 1 + ( −0.28 )
ln
− ln
= −0.576 − ( −0.288 ) = 0.29 .
2 1 − ( −0.52 ) 2 1 − ( −0.28 )
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
146
Ответ:
H0
отклоняется:
различие
между
выборочными
коэффициентами
корреляции r1 (64)= -.52 и r2 (64) = -.28 статистически значимо и не может быть объяснено
случайными причинами: t(61) = -2.76, p = .010 (two-tailed). Размер эффекта Cohen’s q = .29,
почти средний. «Самооценка» теснее связана с «личностной тревожностью», чем с
«ситуативной тревожностью».
10.3. Коэффициенты корреляции Спирмена и Кендалла
Если распределение данных хотя бы для одной из переменных отличается от
нормального, то вычисляют коэффициенты ранговой корреляции Спирмена и «τ (тау)»Кендалла. Их используют для оценки тесноты монотонной связи. При вычислении все
значения переменных X и Y сначала переводятся в ранги. Поэтому «выбросы» не оказывают
столь заметного влияния на значения ранговых коэффициентов корреляции.
10.3.1. Коэффициент ранговой корреляции Спирмена
Для вычисления коэффициента ранговой корреляции Спирмена rS используется та
же самая формула (10.2.1.1), что и для коэффициента Пирсона, только уже для ранговых
переменных. В нее входят средние ранги и отклонения рангов от среднего ранга.
Пример. Для вычисления коэффициента корреляции Пирсона по формуле
(10.2.1.1) используется Таблица 10.3.1.1 и в результате получается rXY = .71 .
Для вычисления коэффициента корреляции Спирмена данные переводятся в ранги
(Таблицы 10.3.1.2 и 10.3.1.3).
Данные ранжируются таким образом, чтобы наименьшей оценке соответствовал
бы наименьший ранг, а наибольшей оценке – наибольший ранг.
По Таблицам 10.3.1.2 и 10.3.1.3 составляется Таблица 10.3.1.4 – исходные данные для
вычисления коэффициентов корреляции Спирмена по формуле (10.2.1.1). По этим данным
Таблицы 10.3.1.4 вычисляется коэффициент корреляции Спирмена. В результате получается
rS = .65 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
147
Таблица 10.3.1.2
Ранги по Х
Таблица 10.3.1.1
Исходные данные в баллах
xi
yi
Шифр
s1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
s13
s14
s15
145
137
125
124
122
116
113
111
109
102
87
82
79
55
45
Шифр
s15
s14
s13
s12
s11
s10
s9
s8
s7
s6
s5
s4
s3
s2
s1
49
30
45
33
40
44
28
33
35
24
39
35
10
23
11
Таблица 10.3.1.3
Ранги по Y
Шифр
s13
s15
s14
s10
s7
s2
s4
s8
s9
s12
s11
s5
s6
s3
s1
Nr
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Nr
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xi
rang xi
45
55
79
82
87
102
109
111
113
116
122
124
125
137
145
1
2
3
4
5
5
7
8
9
10
11
12
13
14
15
Таблица 10.3.1.4
Данные в рангах
yi
rang yi
Шифр
rang xi
rang yi
10
11
23
24
28
30
33
33
35
35
39
40
44
45
49
1
2
3
4
5
6
7.5
7.5
9.5
9.5
11
12
13
14
15
s15
s14
s13
s12
s11
s10
s9
s8
s7
s6
s5
s4
s3
s2
s1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2
3
1
9.5
11
4
9.5
7.5
5
13
12
7.5
14
6
15
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
148
10.3.2. Размер эффекта для коэффициента корреляции Спирмена
Так как коэффициент корреляции Спирмена является безразмерной мерой связи, то
его также используют в качестве индекса размера эффекта. Для коэффициентов корреляции
Спирмена интерпретация коэффициентов корреляции как индексов размеров эффекта такая
же, как и для коэффициента корреляции Пирсона (см., например, Ellis, 2010, p.41):
.1 – малый размер эффекта, .3 – средний размер эффекта, .5 – большой размер эффекта.
Для определения силы связи можно использовать такую же классификацию, как и
для коэффициентов корреляции Пирсона, приведенную в Таблице 10.2.2.1.
10.3.3. Проверка статистической значимости коэффициентов
корреляции Спирмена
Проверка значимости коэффициента корреляции Спирмена осуществляется с
помощью того же Т критерия, который используется для коэффициентов корреляции
Пирсона. Гипотезы для коэффициента корреляции Спирмена rS :
H 0 : Выборочный коэффициент корреляции Спирмена rS отличается от нуля статистически
незначимо. Отличие rS от нуля может быть объяснено случайными причинами.
Монотонная корреляционная связь не выявлена.
H 1 : Выборочный коэффициент корреляции Спирмена rS отличается от нуля статистически
значимо. Отличие rS от нуля закономерно и не может быть объяснено случайными
причинами. Между признаками имеется монотонная корреляционная связь.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
149
Коэффициент ранговой корреляции Спирмена
Статистически значим
Статистически незначим
Выявлена монотонная
корреляционная связь
Монотонная корреляционная связь
не выявлена
Связь не выявлена
Есть немонотонная связь
Рисунок 10.3.3.1. Исследование связи с помощью коэффициентов ранговой корреляции
Спирмена.
Если коэффициент ранговой корреляции Спирмена статистически значим, то
выявлена монотонная корреляционная связь – положительная или отрицательная. Если
коэффициент ранговой корреляции Спирмена статистически незначим, то возможны два
варианта (Рис.10.3.3.1): или монотонная связь не выявлена, или связь немонотонная.
10.3.4. Коэффициент ранговой корреляции τ-Кендалла
Для вычисления коэффициента ранговой корреляции τ -Кендалла используется
подсчет совпадений и инверсий: если у пары испытуемых изменение по Х совпадает по
направлению с изменением по Y, то это говорит о положительной связи («совпадение», p).
Если нет – то об отрицательной связи («инверсии», q). Коэффициент ранговой корреляции
τ -Кендалла есть разность относительных частот совпадений w( P) и инверсий w(Q) при
переборе всех пар испытуемых в выборке:
τ = w( P) − w(Q) =
P−Q
.
( N − 1) N 2
(10.3.4.1)
Пример вычисления коэффициента корреляции τ-Кендалла можно найти в книге
Гласса и Стенли (1976).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
150
Коэффициент ранговой корреляции τ-Кендалла по абсолютной
величине на 66-75% меньше, чем абсолютная величина коэффициента
корреляции Спирмена rS . Таким образом, если τ используется как размер
эффекта, то следует иметь в виду, что он не сопоставим с rS (Field, 2009;
pp.192-193).
10.3.5. Проверка статистической значимости коэффициентов
корреляции τ-Кендалла
Гипотезы для коэффициента корреляции τ-Кендалла:
H 0 : Выборочный коэффициент корреляции τ-Кендалла отличается от нуля статистически
незначимо. Отличие τ-Кендалла от нуля может быть объяснено случайными причинами.
Монотонная корреляционная связь не выявлена.
H 1 : Выборочный коэффициент корреляции τ-Кендалла отличается от нуля статистически
значимо. Отличие τ-Кендалла от нуля закономерно и не может быть объяснено случайными
причинами. Между признаками имеется монотонная корреляционная связь.
Коэффициент ранговой корреляции -Кендалла
Статистически значим
Статистически незначим
Выявлена монотонная
корреляционная связь
Монотонная корреляционная связь
не выявлена
Связь не выявлена
Есть немонотонная связь
Рисунок 10.3.5.1. Исследование связи с помощью коэффициентов ранговой корреляции τ Кендалла.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
151
Проверка статистической значимости коэффициент корреляции τ - Кендалла
осуществляется c помощью другого критерия (Z-критерия) (Гмурман, 1999; сс.341-343).
Z = S∗ ⋅
18
,
n ⋅ (n − 1) ⋅ (2n + 5)
(10.3.5.1)
где
P − Q + 1 , если P < Q ;
S∗ =
P − Q − 1 , если P > Q .
Р – число совпадений; Q – число инверсий.
Случайная величина Z при справедливости нулевой гипотезы имеет нормальное
распределение с параметрами µ Z = 0 и σ Z = 1 . Используя компьютерную программу Excel
(см. п.7.7) можно найти p-value.
Если коэффициент ранговой корреляции τ-Кендалла статистически значим, то
выявлена монотонная корреляционная связь – положительная или отрицательная. Если
коэффициент ранговой корреляции τ-Кендалла статистически незначим, то возможны два
варианта (Рис.10.3.5.1): или монотонная связь не выявлена, или связь немонотонная.
10.4. Коэффициент корреляции «Фи»
Если обе переменные Х и Y измеряются в дихотомических шкалах наименований, то
коэффициент корреляции Пирсона называют коэффициентом корреляции φ, «Фи».
Коэффициент корреляци φ можно вычислить по формуле для вычисления
коэффициента корреляции Пирсона (10.2.1.1).
Несмотря на то, что переменные измерены в номинальной шкале, коэффициент
корреляции φ можно интерпретировать. В книге Гласса и Стенли (1976) рассматривается
следующий пример.
На основании наблюдения за 12 студентами второго курса колледжа по переменным:
X – семейное положение ( x = 1 - женат; x = 0 - холост);
Y - исключение из колледжа ( y = 1 - исключен; y = 0 – не исключен),
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
152
был получен коэффициент корреляции φ = .51.
Коэффициент корреляции получился положительным. Обе переменных согласованно
возрастают. Для того, чтобы его интерпретировать, рассмотрим, что означает
согласованное возрастание переменных Х и Y.
x=0
холост
x=1
женат
y=0
не исключен
y=1
исключен
Возрастание переменной Х от 0 до 1 соответствует женитьбе.
Возрастание переменной Y от 0 до 1 соответствует исключению из колледжа.
Корреляционная связь между женитьбой и исключением из колледжа положительная. Из
чего можно сделать вывод:
Имеется тенденция: если студент женится, то его исключают из колледжа.
Обратное утверждение, очевидно, смысла не имеет.
Проверка значимости коэффициента корреляции ϕ
Если коэффициент корреляции популяции: ϕ P , выборка: случайная, объема n , ( n ≥ 20 ).
Гипотезы:
H0 : ϕP = 0 ,
H1 : ϕ P ≠ 0 ,
или
H 0 : Выборочный коэффициент корреляции ϕ отличается от нуля случайно.
H 1 : Выборочный коэффициент корреляции ϕ отличается от нуля закономерно.
Критерий:
Z = n ⋅ ϕ (Гласс & Стенли, 1976; c.287).
Случайная величина Z при справедливости нулевой гипотезы имеет нормальное
распределение с параметрами µ Z = 0 и σ Z = 1 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
153
Используя компьютерную программу Excel (см. п.7.7) можно найти p-value Z –
стандартизованного нормального распределения, когда μ=0, σ=1.
Другим подходом к исследованию связи между дихотомическими переменными
является
частотный
анализ
с
применением
тестов
«Хи-квадрат»
и
«Угловое
преобразование Фишера» (см. п.).
10.5. Точечно-бисериальный коэффициент корреляции
Если одна из переменных измерена в дихотомической шкале наименований, а другая
в шкале интервалов или в шкале отношений, то коэффициент корреляции Пирсона
называют точечным-бисериальным коэффициентом корреляции и обозначают rpb .
Бисериальный – потому что у одной переменной имеется две серии объектов при
наблюдении (дихотомическая шкала), на что указывает нижний индекс «b» - biserial в
обозначении rpb . Точечный – потому что вторая переменная метрическая, на что указывает
нижний индекс «p» - point.
Коэффициент корреляци rpb можно вычислить по формуле для вычисления
коэффициента корреляции Пирсона (10.2.1.1).
Проверка значимости точечно-бисериального коэффициента корреляции
Пусть коэфициент корреляции популяции: ρ pb ; выборка: случайная, объема n;
Гипотезы:
H 0 : ρ pb = 0 ,
H 1 : ρ pb ≠ 0 .
H 0 : Выборочный коэффициент корреляции rpb отличается от нуля случайно.
H 1 : Выборочный коэффициент корреляции rpb отличается от нуля закономерно.
Критерий такой же, как и для проверки значимости коэффициентов корреляции
Пирсона и Спирмена:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
154
T=
r
1− r2
n−2
.
(10.2.3.1)
При справедливости нулевой гипотезы случайная величина Т имеет t-распределение
Стьюдента с df = n – 2 степенями свободы. С помощью программы Excel находится p-value.
Например, с помощью точечно-бисериального коэффициента корреляции можно
исследовать связь между полом и агрессивностью подростков для данных п.4 (файл
Agr_Data.xlsx).
После загрузки данных в SPSS:
Analyze
Correlate
Bivariate
Рисунок 10.5.1. Диалоговое окно Bivariate Correlations с внесенными переменными для
вычисления точечно-бисериальных коэффициентов корреляции.
ОК
Выходная информация
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
155
Таблица 10.5.1
Фрагмент корреляционной матрицы13
Gender
Pearson
Correlation
Sig. (2tailed)
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
Resentment
Suspicion
and
Distrust
Verbal
Aggression
Guilt
.688**
-.548**
-.073
.717**
-.257*
-.176
.729**
.067
.000
.000
.578
.000
.048
.179
.000
.614
60
60
60
60
60
N
60
60
60
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
•
Физическая агрессия (Physical Aggression) связана с полом: rpb ( 60 ) = .69, p < .001 . У
мальчиков она выше, чем у девочек. Размер эффекта большой.
•
Косвенная агрессия (Indirect Aggression) связана с полом: rpb ( 60 ) = −.55, p < .001 . У
мальчиков она ниже, чем у девочек. Размер эффекта большой.
•
Связь между раздражением (Irritation) и полом не найдена:
rpb ( 60 ) = −.073, p = .58, ns . Эффекта нет.
•
Негативизм (Negativism) связан с полом: rpb ( 60 ) = .72, p < .001 . У мальчиков он
выше, чем у девочек. Размер эффекта большой.
•
Обида (Resentment) связана с полом: rpb ( 60 ) = −.26, p = .048 . У мальчиков она ниже,
чем у девочек. Размер эффекта средний.
•
Связь между подозрительностью (Suspicion and Distrust) и полом не найдена:
rpb ( 60 ) = −.18, p = .18, ns . Размер эффекта маленький. В данной выборке девочки
подозрительнее мальчиков.
•
Вербальная агрессия (Verbal Aggression) связана с полом: rpb ( 60 ) = .73, p < .001 . У
мальчиков она выше, чем у девочек. Размер эффекта большой.
•
Связь между чувством вины (Guilt) и полом не найдена: rpb ( 60 ) = .067, p = .61, ns .
Эффекта нет.
13
Отредактированная таблица.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
156
10.6. Размер эффекта для коэффициентов корреляции
Коэффициент корреляции является часто используемой мерой размера эффекта: его
значения для коэффициентов корреляции Пирсона, Спирмена и точечно-бисериального
коэффициентов корреляции ± .10 представляют собой небольшой эффект, ± .30 - средний
эффект, ± .50 - большой эффект (например, Field, 2009, p.173) или (Ellis, 2010, p.41):
При изучении простой регрессии (п.18) будет показано, что квадрат коэффициента
2
корреляции Пирсона rXY
равен доле дисперсии одной из переменных, которая объясняется
действием другой переменной.
Для квадрата коэффициента ранговой корреляции Спирмена rS2 интерпретация
отличается только тем, что переменные выражены в рангах и доля дисперсии относится к
рангам.
2
При наличии нормальных распределений переменных rS2 приблизительно равен rXY
.
Однако коэффициент ранговой корреляции τ-Кендалла по величине отличается от rS
Спирмена и τ 2 не имеет интерпретации «доли дисперсии». Коэффициент ранговой
корреляции τ-Кендалла по абсолютной величине на 66-75% меньше, чем абсолютная
величина каждого из коэффициентов rS и rXY . Таким образом, если τ используется как
размер эффекта, то следует иметь в виду, что он не сопоставим с rS и rXY и возведение его
в квадрат не имеет смысла для интерпретации (Field, 2009; pp.192-193).
Точечно-бисериальный коэффициент корреляции rpb и коэффициент корреляции φ
также различаются по размеру. В более общем плане, при использовании корреляций в
качестве размеров эффекта надо помнить (как при составлении собственного анализа, так и
при интерпретации исследований других авторов), что выбор коэффициента корреляции
может существенно повлиять на кажущийся размер эффекта.
10.7. Частная корреляция
Иногда переменные X и Y могут коррелировать между собой только за счет того, что
обе они согласованно меняются под влиянием некоторой третьей переменной Z. Связь
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
157
между X и Y может отсутствовать, но коэффициенты корреляции могут быть статистически
значимыми. Это - ложная корреляция между X и Y.
Для исключения такой «искажающей» третьей переменной, как Z, необходимо
вычисление коэффициента частной корреляции X и Y с учетом Z (Partial Correlation) rXY −Z
rXY − Z =
(
rXY − rXZ rYZ
)(
2
1 − rXZ
1 − rYZ2
)
.
(10.7.1)
Если частная корреляция X и Y с учетом Z ( rXY −Z ) по абсолютной величине существенно
меньше абсолютной величины rXY , то скорее всего, именно Z является истинной причиной
корреляции X и Y.
Пример. Исследовалась связь между ростом и длиной волос (Наследов, 2005, сс.86-87).
Корреляция оказалась отрицательной: r (15 ) = −.70**, p = .004 < .01 . Чем больше рост, тем
короче волосы (Таблица 10.7.1) и наоборот.
Таблица 10.7.1
Корреляционная матрица для признаков «Рост» – «Длина волос». Вся выборка
Correlations
Рост
Рост
Длина волос
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
1
.
15
-,700**
,004
15
Длина волос
-,700**
,004
15
1
.
15
**. Correlation is significant at the 0.01 level (2-tailed).
Таблица 10.7.2
Корреляционные матрицы для признаков «Рост» – «Длина волос». Выборки мужчин и
женщин
Correlationsa
Correlationsa
Рост
Рост
Длина волос
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
a. Пол = женский
1
.
8
-,113
,790
8
Длина волос
-,113
,790
8
1
.
8
Рост
Рост
Длина волос
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
1
.
7
-,238
,607
7
Длина волос
-,238
,607
7
1
.
7
a. Пол = мужской
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
158
При рассмотрении третьей переменной «Пол», оказалось что в группах мужчин и
женщин по-отдельности корреляции нет ни в одной из групп (Таблица 10.7.2).
Для получения частного коэффициента корреляции между переменными X и Y с
учетом переменной Z надо задать следующие команды:
Analyze
Correlate
Partial
После чего распределить переменные, как показаны на Рис.10.7.1, и ОК.
Рисунок 10.7.1. Диалоговое окно Partial Correlations с введенными переменными.
Выходная информация содержится в Таблице 10.7.3.
Таблица 10.7.3
Частная корреляция
Correlations
Control Variables
Rost
Correlation
Рост
Пол
Significance (2-tailed)
df
Correlation
Длина волос Significance (2-tailed)
df
Dlina volos
1.000
-.151
.
.607
12
-.151
1.000
.607
.
12
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
159
Коэффициент частной корреляции равен rXY −Z = -.15, р = .61 ns. Обнаруженная связь
между ростом и длиной волос оказалась ложной. Рост и длина волос коррелируют
исключительно за счет пола. Частная корреляция между ними с учетом переменной «пол»
оказалось малой и статистически незначимой (Рис.10.7.2).
Рисунок 10.7.2. Связь между ростом и длиной волос. Корреляционная диаграмма с прямыми
регрессии группы мужчин, группы женщин и объединенной группы. Пунктирная прямая
является линией регрессии для всей группы. Красная прямая относится только к женщинам,
синяя – только к мужчинам.
Действительно, средний рост мужчин больше среднего роста женщин. Рост связан с
полом. Средняя длина волос мужчин меньше средней длины волос женщин. Длина волос
связана с полом. Как в выборке мужчин, так и в выборке женщины корреляции между
ростом и длиной волос не наблюдается. Поэтому статистически значимая отрицательная
корреляция между ростом и длиной волос во всей выборке оказалась ложной.
«За редким исключением факт наличия или отсутствия корреляции может быть
объяснен влиянием некоторой «третьей» переменной, упущенной из поля зрения
исследователя.
Таким
образом,
всегда
остается
возможность
альтернативной
интерпретации обнаруженной корреляции» (Наследов, 2005, с.87).
Таким образом, если корреляция между переменными X и Y вызывает, с точки зрения
здравого смысла, сомнение, а также имеется некоторая переменная Z, которая может
«создать» эту корреляцию, то вычисляют коэффициент частной корреляции.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
160
Для выяснения того, оказывает ли переменная Z влияние на коэффициент корреляции
между переменными X и Y: rXY , надо вычислить частный коэффициент корреляции между
переменными X и Y с учетом переменной Z: rXY − Z . Если rXY − Z существенно меньше rXY и
меняется p-value, то корреляция между переменными X и Y оказывается ложной.
10.8. Немонотонный характер связи
Если коэффициент корреляции Пирсона или Спирмена, или Кендалла близок к
нулю, это означает либо отсутствие связи, либо наличие немонотонной связи.
Немонотонную связь иногда можно обнаружить при визуальном изучении
корреляционной диаграммы.
Первый способ. Если из теоретического анализа или из изучения корреляционных
диаграмм вид связи остается неясным, то можно применить нелинейный регрессионный
анализ. По величине и уровню значимости коэффициента детерминации можно выбрать
наиболее вероятный вид связи. Затем разбить соответствующую переменную на интервалы
монотонности (например, по методике, или по квартилям, или по корреляционным
диаграммам с линией регрессии). На каждом из участков монотонности надо вычислить
коэффициенты корреляции Пирсона или Спирмена, или Кендалла, которые могут оказаться
статистически значимыми.
Второй способ «предполагает отказ от коэффициентов корреляции. Необходимо
ввести дополнительную номинальную переменную, которая делит исследуемую выборку на
контрастные группы по одной из переменных. Далее можно изучать различия между этими
группами по уровню выраженности» (Наследов, 2004, с.88).
Третий способ. Разделить переменные на категории (например, по уровням
выраженности: низкий, средний, высокий) и применить частотный анализ. Пример будет
рассмотрен в п.16.
10.9. Частотный анализ
От метрических или порядковых переменных можно перейти к номинальным
переменным. Или с самого начала исходные данные могут быть измерены в номинальных
шкалах. Тогда можно проводить частотный анализ. Наиболее часто используют критерий
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
161
χ 2 («Хи-квадрат», Chi-Square) Пирсона для сравнения распределений и критерий «Угловое
преобразование Фишера» для сравнения долей Это позволяет сформулировать вывод о
связи. Более подробно этот вопрос будет рассмотрен в пп.13-16.
10.10.
Исследование
связи,
когда
одна
переменная
количественная, а другая номинальная
Если одна переменная количественная, а другая номинальная то для исследования
связи между ними коэффициент корреляции не подходит. Изучение такой связи возможно
при помощи сравнения групп, выделяемых по категориям номинальной переменной.
Группы сравниваются по уровню выраженности количественной переменной.
10.11. Исследование связи между номинальными переменными
Связь между переменными, измеренными в номинальной шкале (а также в
порядковой шкале, но не с очень большим количеством категорий), лучше всего
представить в форме таблиц сопряженности (Crosstabs).
Таблица сопряженности – это таблицы совместного распределения частот двух или
более номинальных признаков, измеренных на одной группе объектов. Например, таблица
для двух признаков: стратегии поведения старшеклассников в конфликтной ситуации и
самооценка (Таблица 10.11.1).
Статистическая значимость связи определяется с помощью критерия для сравнения
распределений – «Хи»-квадрат Пирсона (Pearson’s Chi-square Test). Этот тест проверяет,
есть ли значимое различие между наблюдаемыми и ожидаемыми частотами (Гласс &
Стенли, 1976; c.180).
Теоретические частоты nti вычисляются по формуле:
nti =
( Сумма частот строки ) ⋅ ( Сумма частот столбца ) ,
n
(10.11.1)
где суммы частот берутся из Таблицы 10.11.1:
Например, теоретическая частота для эмпирической частоты 22 (Заниженная
самооценка – Компромисс) будет равна
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
162
nei =
63*52
= 25.7953 .
127
Исследование связи с применением критерия – «Хи»-квадрат Пирсона будет
рассмотрено подробно в п.12.
Таблица 10.11.1
Таблица сопряженности. Связь между стратегиями поведения старшеклассников в
конфликтной ситуации и самооценкой
Соперничество
Заниженная
самооценка
Адекватная
самооценка
Суммы
Стратегия поведения
Сотрудничество
Компромисс
Избегание
Приспособление
Суммы
20
5
22
6
10
63
10
6
30
3
15
64
30
11
52
9
25
n=127
10.12. Схема исследования связи
В Таблице 10.12.1 классифицированы методы исследования связи в соответствии с
измерительными шкалами.
Таблица 10.12.1
Исследование связи (Наследов, 2004, с.113)
Типы
шкал
I. X, Y - количественные
II. X, Y – номинальные
Задачи:
Корреляционный анализ
Частотный анализ:
а) Коэффициент rПирсона для нормально
распределенных X,Y;
б) rS − Спирмена, τ −
Методы: Кендалла для
неноминальных X и Y.
в) частная корреляция и
сравнение корреляций;
Тесты χ 2 − Пирсона,
«Угловое преобразование
Фишера».
III. X - номинальный,
Y - количественный
Сравнения выборок по
уровню выраженности
признака
Методы сравнения
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
163
11. Связь между самооценкой и агрессией подростков
Рассмотрим пример, как решить задачу об исследовании связи между самооценкой и
агрессией подростков с применением компьютерных программ SPSS и Excel.
Агрессия подростков измерялась с помощью методики Басса-Дарки (Бартышев,
2005, сс.195-200).
Самооценка подростков измерялась с помощью методики Дембо-Рубинштейна
(2008)34.
Гипотеза работы: «Существует связь между самооценкой и агрессией в подростковом
возрасте».
Обозначения35, 36:
Self-Esteem (SE)
Самооценка
Physical aggression (PhA)
Физическая агрессия
Indirect (IA)
Косвенная агрессия
Irritation (I)
Раздражение
Negativism (N)
Негативизм
Resentment (R)
Обида
Suspicion (S)
Подозрительность
Verbal aggression (VA)
Вербальная агрессия
Guilt (G)
Чувство вины
34
Ярославский государственный педагогический университет им. К.Д. Ушинского. Отдел образовательных
информационных технологий. Измерение самооценки по методике Дембо-Рубинштейн. http://citoweb.yspu.org/link1/metod/met35/node33.html
35
Questionnaire Bass-Darky. Retrieved from http://ecowoman-english.tk/articles.php?id=35667
36
Bakholdina, V., Bakholdina, D.,Movsesiana, A.A., & Stupina, K.S. (2014). On Certain Aspects of DemboRubinstein Method of Self-Esteem Measurement. Procedia - Social and Behavioral Sciences 140, 547 – 552.
Retrieved from https://www.sciencedirect.com/science/article/pii/S1877042814033941
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
164
Таблица 11.1
Исходные данные. Фрагмент таблицы
Code
SE
PhA
IA
I
N
R
S
VA
G
1
81
9
7
5
3
5
5
7
5
2
85
8
7
6
3
4
2
5
6
3
77
9
8
4
4
3
4
6
2
4
91
7
7
5
5
3
5
7
2
5
79
9
8
8
1
3
3
6
2
и так далее... Полностью37 Таблица 11.1 приведена в файле:
Self-Esteem_Aggression_Data.xlsx.
11.1. Ввод данных
1. Загрузить SPSS
2. Type in data
ОК
3. Variable View
Введем описание всех переменных из Таблицы 11.1.
3.1. В ячейку Name 1 введем слово Code
После этого в остальных ячейках строки 1 появится некоторая информация.
3.2. Type – тип переменной
Numeric
String (Рис.11.1.1)
OK
3.3. Width – формат столбца:
8
3.4. Decimals: - количество знаков после запятой - 0
3.5. Label:
None
3.6. Values:
None
3.7. Missing:
None
37
Данные взяты из дипломной работы студентки Высшей школы психологии (Сейчас Балтийский институт
психологии и менеджмента- БИМП) Татьяны Инкиной, выполненной в 2003-2004 учебном году.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
165
3.8. Columns: 8
3.9. Align:
Left
3.10. Measure: Nominal
Рисунок 11.1.1. Тип переменной - строка
Сохранить файл под названием: Self-Esteem_Aggression.sav.
«Cамооценка» „SE”
3.11. В ячейку Name 2 напишем слово SE
3.12. Type
Numeric
3.13. Width –
8
3.14. Decimals:
3.15. Label:
Self-Esteem
3.16. Values:
None
3.17. Missing: None
3.18. Columns:
8
3.19. Align:
Right
3.20. Measure: Scale
«Физическая агрессия»
3.21. В ячейку Name 3 напишем слово PhA
3.22. Type
Numeric
3.23. Width –
8
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
166
3.24. Decimals:
3.25. Label:
Physical Aggression
3.26. Values:
None
3.27. Missing: None
3.28. Columns:
8
3.29. Align:
Right
3.30. Measure: Scale
«Косвенная агрессия»
3.31. В ячейку Name 4 напишем слово IA
3.32. Type
Numeric
3.33. Width –
8
3.34. Decimals:
3.35. Label:
Indirect Aggression
3.36. Values:
None
3.37. Missing: None
3.38. Columns:
8
3.39. Align:
Right
3.40. Measure: Scale
«Раздражение»
3.41. В ячейку Name 5 напишем слово I
3.42. Type
Numeric
3.43. Width –
8
3.44. Decimals:
3.45. Label:
Irritation
3.46. Values:
None
3.47. Missing: None
3.48. Columns:
8
3.49. Align:
Right
3.50. Measure: Scale
И так далее. В результате должно получиться (Рис.11.1.2):
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
167
Рисунок 11.1.2. Вид переменных. Фрагмент.
В окно Data View скопировать данные из Excel (Рис.11.1.3).
Рисунок 11.1.3. Вид данных (таблица далее продолжается).
11.2. Описательная статистика и проверка нормальности
распределения данных
Analyze
Descriptive Statistics
Frecuencies
Убрать галочку с “Display frequencies tables”
Перенести переменные (кроме Code) в окно “Variables”:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
168
Statistics...
Расставить соответствующие галочки:
Quartiles, Mean, Median, Std. deviation, Range, Minimum, Maximum, S.E. mean,
Skewness, Kurtosis.
Continue
Charts...
Расставить соответствующие галочки:
Histograms,
With normal curve
Continue
OK
11.2.1. Показатели описательной статистики
Полученную Таблицу 11.2.1.1 желательно перевести в Excel, округлить показатели
описательной статистики до двух знаков после запятой и выделить все случаи, когда
показатели асимметрии и эксцесса по абсолютной величине превосходят свои стандартные
ошибки. В этих случаях распределение данных не соответствует нормальному
распределению. В результате получится Таблица 11.2.1.2.
11.2.2. Гистограммы с нормальной кривой
В выходном файле также появятся гистограммы с нормальной кривой (Рис.11.2.2.111.2.2.9), позволяющие визуально сравнить эмпирическое распределение данных с
нормальным распределением. Все рисунки отредактированы в SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
169
Таблица 11.2.1.1
145
145
62.30
5.36
4.70
5.56
2.89
3.41
3.66
5.50
3.99
1.19
0.22
0.20
0.17
0.11
0.13
0.12
0.16
0.16
Median
62.33
5.00
5.00
5.00
3.00
3.00
4.00
6.00
4.00
Std. Deviation
14.27
2.66
2.42
2.06
1.28
1.58
1.50
1.88
1.94
Skewness
-0.14
0.04
0.14
-0.12
0.17
0.31
0.64
-0.26
-0.04
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
-0.77
-1.38
-1.26
-0.64
-0.89
-0.02
0.52
-0.40
-0.32
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
Range
60.34
10.00
8.00
8.00
5.00
8.00
8.00
8.00
9.00
Minimum
31.16
0.00
1.00
1.00
0.00
0.00
1.00
1.00
0.00
Maximum
91.50
10.00
9.00
9.00
5.00
8.00
9.00
9.00
9.00
25
52.91
3.00
2.00
4.00
2.00
2.00
2.00
4.50
2.00
50
62.33
5.00
5.00
5.00
3.00
3.00
4.00
6.00
4.00
75
71.58
8.00
7.00
7.00
4.00
5.00
5.00
7.00
5.00
Mean
Std. Error of Mean
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Percentiles
Guilt
145
Verbal
145
Distrust
145
Missing
Aggression
Suspicion and
Resentment
Irritation
145
Negativism
Aggression
145
Indirect
145
Valid
Physical
145
N
Aggression
Self-Esteem
Описательные статистики (после редактирования и округления)
Рисунок 11.2.2.1. Гистограмма с нормальной Рисунок 11 .2.2.2. Гистограмма с
кривой. Cамооценка.
нормальной кривой. Физическая агрессия.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
170
Рисунок 11.2.2.3. Гистограмма с
нормальной кривой. Косвенная агрессия.
Рисунок 11.2.2.4. Гистограмма с
нормальной кривой. Негативизм.
11.2.2.6.
Гистограмма
Рисунок 11.2.2.5. Гистограмма с нормальной Рисунок
нормальной кривой. Обида.
кривой. Раздражение.
Рисунок 11.2.2.7. Гистограмма с
нормальной кривой. Подозрительность.
с
Рисунок 11.2.2.8. Гистограмма с
нормальной кривой. Вербальная агрессия.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
171
Рисунок 11.2.2.9. Гистограмма с
нормальной кривой. Чувство вины.
11.2.3. Критерий Колмогорова-Смирнова
Лиллифора и критерий Шапиро-Уилкса
в
модификации
Analyze
Descriptive Statistics
Explore....
Рисунок 11.2.3.1. Диалоговое окно Explore.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
172
Перенести в Dependent List переменные (Рис.11.2.3.1)
Display Plots
Plots
Normally plots with tests (Рис. 11.2.3.2)
Continue
OK
Рисунок 11.2.2.2. Заказ тестов на нормальность распределения.
Сохранить выходной файл под именем S_A_Results.spv.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
173
Выходные данные
Таблица 11.2.3.1
«Case Processing Summary» - Обработанные наблюдения
Cases
Valid
N
Missing
Percent
N
Total
Percent
N
Percent
Self-Esteem
145
100.0%
0.0%
145
100.0%
Physical Aggression
145
100.0%
0.0%
145
100.0%
Indirect Aggression
145
100.0%
0.0%
145
100.0%
Irritation
145
100.0%
0.0%
145
100.0%
Negativism
145
100.0%
0.0%
145
100.0%
Resentment
145
100.0%
0.0%
145
100.0%
Suspicion and Distrust
145
100.0%
0.0%
145
100.0%
Verbal Aggression
145
100.0%
0.0%
145
100.0%
Guilt
145
100.0%
0.0%
145
100.0%
Таблица 11.2.3.2
Tests of Normality (Тесты на нормальность)
Kolmogorov-Smirnova
Statistic
df
Shapiro-Wilk
Sig.
Statistic
df
Sig.
Self-Esteem
.085
145
.012
.975
145
.009
Physical Aggression
.157
145
.000
.913
145
.000
Indirect Aggression
.137
145
.000
.925
145
.000
Irritation
.152
145
.000
.950
145
.000
Negativism
.185
145
.000
.916
145
.000
Resentment
.144
145
.000
.944
145
.000
Suspicion and Distrust
.189
145
.000
.866
145
.000
Verbal Aggression
.146
145
.000
.959
145
.000
Guilt
.172
145
.000
.945
145
.000
a. Lilliefors Significance Correction
Для ответа на вопрос, отличается ли распределение данных от нормального
распределения, необходимо проанализировать столбцы Таблицы 11.2.3.2 «Sig» – это р-value;
При Sig. < .05 распределение значимо отличается от нормального распределения.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
174
Из Таблицы 11.2.3.2 видно, что распределение всех данных отличается от
нормального распределения.
Вместе с таблицей «Tests of Normality» появляются Normal Q-Q Plots – (квантильные
диаграммы Q-Q), по которым визуально можно определить, достаточно ли близко заданное
распределение приближается к нормальному распределению. Каждое наблюдаемое
значение сравнивается со значением, ожидаемым при нормальном распределении. При
условии точного выполнения нормального распределения все точки лежат на прямой. На
Рис. 11.2.3.3 эти диаграммы приведены для переменной FA (физическая агрессия). По осям
отложены процентили эмпирические (Х) и теоретические (Y) (Наследов, 2004; сс.59-60).
Также появляются Detrended Normal Q-Q Plots (диаграммы с исключенным
трендом). На этих диаграммах изображены отклонения наблюдаемых значений от
ожидаемых значений при нормальном распределении в зависимости от наблюдаемых
значений. В случае нормального распределения все точки лежат на горизонтальной прямой,
проходящей через нуль. Все значения переведены в стандартизованные z-оценки. На Рис.
11.2.3.4 эти диаграммы приведены для переменной FA (физическая агрессия).
Рисунок 11.2.2.3. Диаграмма диаграммы
Q-Q. Физическая агрессия.
Рисунок 11.2.2.4. Диаграмма с
исключенным трендом. Физическая
агрессия.
11.2.4. Графическая иллюстрация: Boxplots
По переменной «Самооценка» и по шкалам агрессивности коробчатые диаграммы
заказываются отдельно. Процедура получения коробчатых диаграмм уже известная.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
175
Получение коробчатых диаграмм
Analyze
Descriptive Statistics
Explore
Из списка зависимых переменных убрать Self-Esteem [SE].
Plots
Plots
Рисунок 11.2.4.1. Заказ коробчатых диаграмм.
Continue (Рис. 11.2.4.2)
OK
Повторить заказ, вернув переменную Self-Esteem [SE] в список зависимых переменных и
убрав из него все остальные переменные.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
176
Рисунок 11.2.4.2. Коробчатые диаграммы для шкал агрессивности.
Рисунок 11.2.4.3. Коробчатая диаграмма для самооценки
11.3. Вычисление коэффициентов корреляции
Если распределение данных между двумя переменными не отличается от
нормального, то вычисляют коэффициент корреляции Пирсона. Если распределение данных
хотя бы для одной из переменных отличается от нормального распределения, то вычисляют
коэффициенты ранговой корреляции Спирмена и τ (Тау)-Кендалла. В нашем случае
распределения всех переменных отличаются от нормального распределения. Поэтому
выбираем коэффициенты Спирмена и «Тау»-Кендалла.
Analyze
Correlate
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
177
Bivariate...
Переносим в окно Variables переменные и ставим галочки у Kendall’s tau-b и
Spearman (Рис.11.3.1)
OK
Рисунок 11.3.1. Заказ коэффициентов корреляции
Выходные данные
В результате получаем корреляционную матрицу, состоящую из двух частей:
коэффициенты корреляции Спирмена и коэффициенты корреляции Кендалла (Таблица
11.3.1).
Корреляционные
таблицы
симметричны
относительно
главной
диагонали
корреляционной матрицы (из верхнего левого угла – в правый нижний). Для определения
связи с самооценкой достаточно рассмотреть или первую строчку, или первый столбец
корреляционных матриц (Таблица 11.3.1). Все коэффициенты корреляции в первой строке
(соответственно в первом столбце) являются статистически незначимыми, поскольку все
Sig. (2-tailed) > .05.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
178
Поэтому монотонной связи не обнаружено. Возможно, что есть немонотонная связь.
Таблица 11.3.1
Коэффициенты ранговой корреляции Спирмена и Кендалла для всей выборки
SelfEsteem
Kendall's Self-Esteem
tau_b
Physical
Aggression
Correlation Coefficient
Irritation
Resentment
Suspicion
and Distrust
Verbal
Aggression
Guilt
Spearma Self-Esteem
n's rho
Physical
Aggression
Irritation
Resentment
Suspicion
and Distrust
Verbal
Aggression
Guilt
Suspicion
Verbal
and
Aggression
Distrust
Guilt
.002
-.028
-.075
.013
.042
.112
-.011
.045
.979
.632
.213
.836
.490
.071
.851
.463
145
145
145
145
145
145
145
Correlation Coefficient
.002
1.000
**
**
-.181
.005
-.035
.013
**
.979
.487
.000
**
Sig. (2-tailed)
.461
.000
.589
.848
.388
.000
-.142
.026
Correlation Coefficient
*
145
145
145
145
145
145
145
145
145
-.028
**
1.000
.486
.000
**
-.188
.004
**
-.044
.011
**
-.088
Sig. (2-tailed)
.632
.461
.000
.498
.865
.319
.000
N
145
145
145
145
145
145
145
145
145
-.075
.487
.000
**
.486
.000
**
1.000
-.258
.000
**
-.104
-.030
**
.106
.648
.338
.000
-.145
.025
Correlation Coefficient
.213
.167
*
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.013
**
**
-.258
.000
1.000
.103
-.014
**
.121
.834
-.230
.000
-.054
.836
-.188
.004
**
Sig. (2-tailed)
-.181
.005
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.042
-.035
-.044
-.104
.103
1.000
-.019
-.045
.008
Sig. (2-tailed)
.490
.589
.498
.106
.121
.773
.487
.902
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.112
.013
.011
-.030
-.014
-.019
1.000
.066
-.038
Sig. (2-tailed)
.071
.848
.865
.648
.834
.773
.320
.572
N
145
145
145
145
145
145
145
145
145
-.011
**
.319
.000
**
.338
.000
**
-.230
.000
**
-.045
.066
1.000
-.006
Correlation Coefficient
.419
Sig. (2-tailed)
.851
.388
.000
.487
.320
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.045
*
-.088
*
.008
-.038
-.006
1.000
.463
.167
-.145
.025
-.054
Sig. (2-tailed)
-.142
.026
.419
.902
.572
.926
N
145
145
145
145
145
145
145
145
145
1.000
.018
-.027
-.111
.016
.060
.150
-.055
.060
.474
Correlation Coefficient
Sig. (2-tailed)
.926
.826
.746
.183
.845
.474
.071
.508
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.018
1.000
**
**
-.233
.005
-.048
.017
**
.826
.644
.000
**
Sig. (2-tailed)
.628
.000
.570
.840
.524
.000
-.183
.027
Correlation Coefficient
*
145
145
145
145
145
145
145
145
145
-.027
**
1.000
.627
.000
**
-.239
.004
**
-.060
.014
**
-.115
Sig. (2-tailed)
.746
.628
.000
.476
.869
.427
.000
N
145
145
145
145
145
145
145
145
145
-.111
.644
.000
**
.627
.000
**
1.000
-.324
.000
**
-.132
-.035
**
.112
.679
.451
.000
-.184
.026
Correlation Coefficient
Sig. (2-tailed)
Negativism
Resentment
145
N
Indirect
Aggression
Negativism
145
Sig. (2-tailed)
Negativism
Irritation
N
N
Indirect
Aggression
1.000
Sig. (2-tailed)
Physical
Indirect
Aggression Aggression
.183
.170
*
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.016
**
**
-.324
.000
1.000
.128
-.017
**
.126
.839
-.289
.000
-.069
.845
-.239
.004
**
Sig. (2-tailed)
-.233
.005
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.060
-.048
-.060
-.132
.128
1.000
-.023
-.063
.007
Sig. (2-tailed)
.474
.570
.476
.112
.126
.781
.453
.929
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.150
.017
.014
-.035
-.017
-.023
1.000
.083
-.047
Sig. (2-tailed)
.071
.840
.869
.679
.839
.781
.323
.573
N
145
145
145
145
145
145
145
145
145
-.055
**
.427
.000
**
.451
.000
**
-.289
.000
**
-.063
.083
1.000
-.009
Correlation Coefficient
.408
Sig. (2-tailed)
.508
.524
.000
.453
.323
N
145
145
145
145
145
145
145
145
145
Correlation Coefficient
.060
*
-.115
*
.007
-.047
-.009
1.000
.474
.170
-.184
.026
-.069
Sig. (2-tailed)
-.183
.027
.408
.929
.573
.910
N
145
145
145
145
145
145
145
145
.910
145
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
179
Если, все же, попробовать вычислить коэффициенты корреляции Пирсона (поставив
«галочку» у Pearson на Рис.11.3.1), то в результате получится корреляционная матрица
(Таблица 11.3.2). Коэффициент корреляции Пирсона для переменных «СамооценкаПодозрительность», равный .166 оказался статистически значимым р = .046 < .05. Но вряд
ли
эту
связь
можно
считать
выявленной:
ведь
асимметрия
по
переменной
«Подозрительность» равна 0.644, что более, чем в три раза превышает ее стандартную
ошибку, равную 0.201. Кроме того, по корреляционной диаграмме «Самооценка Подозрительность» также трудно предположить существование связи.
Таблица 12.3.2
Коэффициенты корреляции Пирсона для всей выборки
SelfEsteem
Self-Esteem
Pearson Correlation
Physical
Indirect
Aggression Aggression
1
N
Pearson Correlation
Sig. (2-tailed)
N
Indirect
Aggression
Negativism
Resentment
-.093
.073
.264
.386
145
145
145
145
-.065
.040
**
-.203*
.015
-.150
.052
.069
.728
.451
.072
.534
.411
145
145
145
145
145
-.029
1
**
**
**
.440
.634
.672
.000
.668
.000
-.265
.001
.535
.000
145
145
145
145
145
145
145
145
145
-.063
1
.632**
.000
-.261**
.002
-.069
.005
-.149
Sig. (2-tailed)
.451
.409
.948
N
145
145
145
145
145
145
145
145
145
-.150
.632**
.000
1
-.355**
.000
-.149
-.025
.073
.766
.426**
.000
-.186*
.025
.073
Sig. (2-tailed)
.072
.668**
.000
N
145
145
145
145
145
145
145
145
145
Pearson Correlation
.052
-.261**
.002
-.355**
.000
1
.119
.056
-.062
Sig. (2-tailed)
.534
-.265**
.001
.155
.502
-.272**
.001
N
145
145
145
145
145
145
145
145
145
Pearson Correlation
.069
-.065
-.069
-.149
.119
1
-.095
-.039
-.012
Sig. (2-tailed)
.411
.440
.409
.073
.155
.254
.641
.888
N
145
145
145
145
145
145
145
145
145
*
1
.042
-.057
.614
.499
N
Guilt
.166*
.046
-.063
.728
Guilt
.403**
.000
Suspicion and Pearson Correlation
Distrust
Sig. (2-tailed)
Verbal
Aggression
Suspicion
Verbal
and
Aggression
Distrust
.672**
.000
Pearson Correlation
Pearson Correlation
Irritation
Negativism Resentment
-.029
Sig. (2-tailed)
Physical
Aggression
Irritation
.455
.166
.046
.040
.005
-.025
.056
-.095
.634
.948
.766
.502
.254
145
145
145
145
145
145
145
145
145
-.093
.403**
.000
.426**
.000
-.272**
.001
-.039
.042
1
-.025
Sig. (2-tailed)
.264
.535**
.000
.641
.614
N
145
145
145
145
145
145
145
145
145
Pearson Correlation
.073
-.149
-.012
-.057
-.025
1
.386
.073
-.186*
.025
-.062
Sig. (2-tailed)
-.203*
.015
.455
.888
.499
.767
N
145
145
145
145
145
145
145
145
Pearson Correlation
.767
145
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
11.4. Корреляционные диаграммы
Любая задача, связанная с исследованием связи, нуждается в изучении
корреляционных диаграмм (Рис.11.4.3-11.4.10).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
180
Graphs
Legacy Dialogs
Scatter/Dot...
Рисунок 11.4.1. Заказ корреляционных диаграмм
Define
Появится диалоговое окно (Рис.11.4.2), в которое надо внести пару переменных,
связь между которыми изучается.
Рисунок 11.4.2. Заказ корреляционных диаграмм
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
181
На Рис.11.4.3-11.4.10 показаны полученные корреляционные диаграммы, которые
отредактированы в SPSS. Представление в научных отчетах корреляционных диаграмм при
изучении корреляционной связи является обязательным.
На некоторых корреляционных диаграммах (Рис.11.4.3-11.4.5, 11.4.9) видно, что
должна быть немонотонная (скорее всего квадратическая – виде параболы) связь. По
остальным рисункам трудно что-либо сказать о связи. Но надо помнить, что несколько
одинаковых пар наблюдений изображаются на корреляционной диаграмме одной точкой.
Поэтому необходимо провести дополнительное исследование.
Статистически
незначимые
коэффициенты
корреляции
и
корреляционные
диаграммы свидетельствуют в пользу того, что связь между самооценкой и агрессией может
оказаться нелинейной. Поэтому есть смысл исследовать нелинейные корреляционные связи.
В качестве «разведывательного» метода исследования целесообразно применить
нелинейный регрессионный анализ.
Рисунок 11.4.3. Самооценка – Физическая
агрессия.
Рисунок 11.4.4. Самооценка – Косвенная
агрессия.
Рисунок 11.4.5. Самооценка – Раздражение,
Рисунок 11.4.6. Самооценка – Негативизм.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
182
Рисунок 11.4.7. Самооценка – Обида.
Рисунок 11.4.8. Самооценка –
Подозрительность.
Рисунок 11.4.9. Самооценка – Вербальная
агрессия.
Рисунок 11.4.10. Самооценка – Чувство
вины.
11.5. Нелинейный регрессионный анализ. Выбор вида связи
регрессии
Настоящий параграф посвящен лишь одному из аспектов Регрессионного анализа выбору вида связи.
При корреляционной связи точки на корреляционной диаграмме группируются вдоль
некоторой линии, которая "наилучшим" образом приближена ко всем точкам в
совокупности. Эта линия является графиком некоторой функции
ŷ = f ( x ) .
(11.5.1)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
183
Уравнение (11.5.1) называют выборочным уравнением регрессии Y на Х, а график
функции ŷ = f ( x ) - выборочной линией регрессии Y на Х.
Если ŷ = f ( x ) линейная функция:
yˆ = f ( x ) = b0 + b1 x,
( b1 ≠ 0 ) ,
(11.5.2)
то уравнение (11.5.2) называют уравнением линейной регрессии, а график функции
ŷ = b0 + b1 x - прямой регрессии Y на Х.
Параметры линии регрессии определяют так, чтобы линия регрессии наилучшим
образом ложилась на полученную систему точек. Линию регрессии (Regression Line) обычно
строят «методом наименьших квадратов»: сумма квадратов отклонений (вычисленных по
оси Y) от каждой точки диаграммы рассеивания до линии является минимальной.
Например, отклонением от точки
( xi ; y i )
до прямой регрессии с уравнением
ŷ = b0 + b1 x называют разность:
ei = yi − yˆi = yi − ( b1 xi + b0 )
(11.5.3)
(Рис.11.5.1).
Фрагмент корреляционной диаграммы
Y
X
Рисунок 11.5.1. Фрагмент корреляционной диаграммы с прямой регрессии.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
184
С помощью компьютерной программы SPSS можно построить следующие линии
регрессии, которые наиболее часто встречаются на практике:
линейная модель (LIN):
ŷ = b0 + b1 x ,
(11.5.4)
квадратическая модель (QUA):
ŷ = b0 + b1 x + b2 x2 ,
(11.5.5)
кубическая модель (CUB):
ŷ = b0 + b1 x + b2 x2 + b3 x3 .
(11.5.6)
Y – зависимая переменная (Dependent Variable);
Х – независимая переменная (Independent Variable).
Доля вариации зависимой переменной, обусловленная влиянием независимой
переменной, называется коэффициентом детерминации (R-square).
Коэффициент детерминации показывает, в какой степени изменчивость одной
переменной обусловлена влиянием другой переменной, а не случайными факторами.
Чем ближе R-square к единице, тем меньше разброс значений Y относительно линии
регрессии, тем сильнее зависимость Y от Х.
В случае линейной модели коэффициент детерминации совпадает с квадратом
2
коэффициента корреляции Пирсона: R-square = rXY
и имеет смысл доли дисперсии
зависимой переменной, обусловленная влиянием независимой переменной.
Обработка на компьютере
Analyze
Regression
Curve Estimation (Оценка с помощью кривой, подгон кривых)
В появившемся окне надо выбрать переменные по соответствующим осям и
поставить галочки у предлагаемых моделей функций: линейной, квадратической и
кубической.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
185
Рисунок 11.5.2. Заказ регрессионного анализа: линейная, квадратическая и
кубическая модели.
OK
Выходные данные для выбора линии регрессии
Самооценка – Физическая агрессия
Таблица 11.5.1
Описание модели (Model Description)
Model Name
Dependent Variable
Equation
1
1
2
3
Independent Variable
Constant
Variable Whose Values Label Observations in Plots
Tolerance for Entering Terms in Equations
MOD_1
Physical Aggression
Linear
Quadratic
Cubic
Self-Esteem
Included
Unspecified
.0001
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
186
Таблица 11.5.2
Обработанные наблюдения (Case Processing Summary)
N
Total Cases
Excluded Casesa
Forecasted Cases
Newly Created Cases
145
a. Cases with a missing value in any variable are excluded from the analysis.
Таблица 11.5.3
Описание переменных (Variable Processing Summary)
Variables
Number of Positive Values
Number of Zeros
Number of Negative Values
Number of Missing Values
Dependent
Independent
Physical Aggression
Self-Esteem
User-Missing
144
1
145
System-Missing
Таблица 11.5.4
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Physical Aggression
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.001
.121
1
143 .728
5.697
-.005
Quadratic
.502
71.538
2
142 .000
35.817
-1.044
.008
Cubic
.502
47.363
3
141 .000
36.821
-1.097
.009
-4.797E-6
The independent variable is Self-Esteem.
Рисунок 11.5.3. Корреляционная диаграмма с линиями линейной, квадратической и
кубической регрессии. Самооценка - физическая агрессия.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
187
Замечания:
1. R-square - коэффициент детерминации. Коэффициенты детерминации равны:
для линейной модели: R-square = .000;
для квадратической модели: R-square = .502;
для кубической модели: R-square = .502.
2. В столбце «F» указаны наблюдаемые значения F-критерия для проверки
статистической значимости коэффициента детерминации R-square.
3. По столбцу «Sig.» проверяется статистическая значимость коэффициента
детерминации.
Если
Sig. ≤ .05, то R-square значим (уровень значимости α = .05),
Sig. ≤ .01, то R-square очень значим (уровень значимости α = .01),
Sig. ≤ .001, то R-square максимально значим (уровень значимости α = .001).
Максимально значимые коэффициенты детерминации R-square имеются для
квадратической и кубической моделей.
4. Столбцы b0, b1, b2, b3 – это значения параметров в соответствующих уравнениях
регрессии.
Таблица 11.5.5
Регрессионные модели в задаче связи независимой переменной – самооценки и зависимой
переменной – физической агрессии
Модели
Линейная
Уравнение в общем
виде
ŷ = b0 + b1 x
Полученное уравнение
yˆ = −0.005 + 5.697 ⋅ x
Квадратическая
ŷ = b0 + b1 x + b2 x 2
yˆ = 35.817 − 1.044 x + 0.008 x 2
Кубическая
ŷ = b0 + b1 x + b2 x2 + b3 x3
yˆ = 36.821 − 1.097 x + 0.009 x 2 − 0.000005x3
Переменная x- это самооценка, а переменная y- физическая агрессия.
В данном случае квадратическая модель мало отличается от кубической, но является
более простой, поэтому выбираем квадратическую модель.
5. Уравнение yˆ = 35.817 − 1.044 x + 0.008 x 2 может служить для прогноза агрессии по
самооценке. Например, если показатель самооценки некоторого подростка равен x=40, то
прогнозируемый показатель этой агрессии будет равен:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
188
yˆ = 35.817 − 1.044 ⋅ 40 + 0.008 ⋅1600 = 6.857 ≈ 6.9 , (Рис.11.5.3).
6. Как видно из графика, квадратическая линия и кубическая практически
неразличимы.
Физическая агрессия - Самооценка
Меняем переменные «Самооценка» и «Физическая агрессия» местами.
Analyze
Regression
Curve Estimation
Рисунок 11.5.4. Заказ регрессионного анализа: переменные меняются местами.
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
189
Таблица 11.5.6
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
Linear
.001
.121
1
143
.728
63.137
Quadratic
.002
.128
2
142
.880
64.894 -1.010
Cubic
.019
.921
3
141
.432
53.761
b2
b3
-.156
8.314
.079
-2.007
.133
The independent variable is Physical Aggression.
Статистически значимых отличий коэффициента детерминации от нуля не выявлено.
При изменении физической агрессии самооценка у подростков меняется случайным
образом.
Рисунок 11.5.5. Корреляционная диаграмма с линиями линейной, квадратической и
кубической регрессии. Физическая агрессия – самооценка.
Аналогичное исследование проводим для оставшихся случаев.
Самооценка – Косвенная агрессия
Таблица 11.5.7
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Indirect Aggression
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.004
.572
1
143
.451
5.362
-.011
Quadratic
.443
56.366
2
142
.000
30.953
-.893
.007
Cubic
.443
37.437
3
141
.000
26.663
-.666
.003 2.051E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.11.5.6).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
190
Косвенная агрессия - Самооценка
Таблица 11.5.8
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.004
.572
1
143
.451
64.050
-.373
Quadratic
.006
.412
2
142
.663
61.878
.811
-.122
Cubic
.007
.325
3
141
.807
58.794
3.587
-.781
.045
The independent variable is Indirect Aggression.
При изменении косвенной агрессии самооценка меняется случайным образом. (Рис.11.5.7).
Рисунок 11.5.6. Самооценка - Косвенная
агрессия.
Рисунок 11.5.7. Косвенная агрессия –
Самооценка.
Самооценка – Раздражение
Таблица 11.5.9
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Irritation
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.022
3.288
1
143
.072
6.905
-.022
Quadratic
.416
50.539
2
142
.000
27.546
-.733
.006
Cubic
.417
33.652
3
141
.000
22.746
-.480
.002 2.295E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.11.5.8).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
191
Раздражение - Самооценка
Таблица 11.5.10
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.022
3.288
1
143
.072
68.080
-1.040
Quadratic
.034
2.470
2
142
.088
60.232
2.329
-.310
Cubic
.039
1.900
3
141
.132
50.899
9.811
-1.950
b3
.105
The independent variable is Irritation
При изменении «раздражения» самооценка меняется случайным образом. (Рис.11.5.9).
Рисунок 11.5.8. Самооценка – Раздражение.
Рисунок 11.5.9. Раздражение – Самооценка.
Самооценка – Негативизм
Таблица 11.5.11
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Negativism
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.003
.390
1
143
.534
2.599
.005
Quadratic
.042
3.101
2
142
.048
-1.436
.144
-.001
Cubic
.043
2.117
3
141
.101
-4.229
.291
-.004 1.335E-5
The independent variable is Self-Esteem.
Возможна квадратическая модель (Рис.11.5.10).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
192
Негативизм - Самооценка
Таблица 11.5.12
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.003
.390
1
143
.534
60.614
Quadratic
.004
.304
2
142
.739
63.073 -1.422
.335
Cubic
.021
1.017
3
141
.387
50.581 17.105
-7.109
b3
.583
.861
The independent variable is Negativism.
При изменении негативизма самооценка меняется случайным образом. (Рис.12.5.11).
Рисунок 11.5.10. Самооценка – Негативизм.
Рисунок 11.5.11. Негативизм – Самооценка.
Самооценка – Обида
Таблица 11.5.13
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Resentment
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.005
.681
1
143
.411
2.931
.008
Quadratic
.029
2.143
2
142
.121
-1.037
.144
-.001
Cubic
.031
1.518
3
141
.212
3.338
-.087
.003
b3
-2.092E-5
The independent variable is Self-Esteem.
При изменении самооценки «обида» меняется случайным образом. (Рис.11.5.12).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
193
Обида - Самооценка
Таблица 11.5.14
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.005
.681
1
143
.411
60.185
.621
Quadratic
.007
.516
2
142
.598
62.430
-.902
.209
Cubic
.010
.474
3
141
.701
65.741 -4.647
1.297
b3
-.089
The independent variable is Resentment.
При изменении «обиды» самооценка меняется случайным образом (Рис.11.5.13).
Рисунок 11.5.12. Самооценка – Обида.
Рисунок 11.5.13. Обида – Самооценка.
Самооценка – Подозрительность
Таблица 11.5.15
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Suspicion and Distrust
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.028
4.061
1
143
.046
2.566
.017
Quadratic
.029
2.110
2
142
.125
1.717
.047
.000
Cubic
.033
1.628
3
141
.186
8.035
-.287
.005
b3
-3.020E-5
The independent variable is Self-Esteem.
Возможна линейная модель (Рис.11.5.14).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
194
Подозрительность - Самооценка
Таблица 11.5.16
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.028
4.061
1
143
.046
56.527
1.579
Quadratic
.029
2.149
2
142
.120
59.250
.038
.186
Cubic
.031
1.486
3
141
.221
52.075
5.904
-1.176
b3
.093
The independent variable is Suspicion and Distrust.
Возможна линейная модель (Рис.11.5.15).
Рисунок 11.5.14. Самооценка –
Подозрительность.
Рисунок 11.5.15. Подозрительность –
Самооценка.
Самооценка – Вербальная агрессия
Таблица 11.5.17
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Verbal Aggression
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.009
1.258
1
143
.264
6.269
-.012
Quadratic
.239
22.352
2
142
.000
20.702
-.510
.004
Cubic
.242
15.042
3
141
.000
14.327
-.173
-.002
b3
3.048E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.11.5.16).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
195
Вербальная агрессия - Самооценка
Таблица 11.5.18
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.009
1.258
1
143
.264
66.204
-.710
Quadratic
.151
12.676
2
142
.000
36.024
12.455
-1.251
Cubic
.192
11.201
3
141
.000
67.375 -11.352
3.820
b3
-.322
The independent variable is Verbal Aggression.
Выбираем квадратическую модель (Рис.11.5.17).
Рисунок 11.5.16. Самооценка - Вербальная
агрессия.
Рисунок 11.5.17. Вербальная агрессия –
Самооценка.
Самооценка – Чувство вины
Таблица 11.5.19
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Guilt
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
Linear
.005
.757
1
143
.386
3.373
Quadratic
.037
2.742
2
142
.068
-2.160
Cubic
.043
2.087
3
141
.105
6.581
b1
b2
b3
.010
.201 -.002
-.261
.006
-4.179E-5
The independent variable is Self-Esteem.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
196
При изменении самооценки «Чувство вины» меняется случайным образом
(Рис.11.5.18).
Чувство вины - Самооценка
Таблица 11.5.20
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
Linear
.005
.757
1
143
.386
60.167
.535
Quadratic
.006
.441
2
142
.644
61.230
-.174
.090
Cubic
.009
.428
3
141
.733
58.934
2.715
-.719
b3
.062
The independent variable is Guilt.
При изменении «Чувства вины» самооценка меняется случайным образом (Рис.12.5.19).
Рисунок 11.5.18. Самооценка - Чувство
вины.
Рисунок 11.5.19. Чувство вины –
Самооценка.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
197
11.6. Графическая иллюстрация результатов регрессионного
анализа
Отобразим линии регрессии на корреляционных диаграммах
для связей,
предполагаемых на основании результатов регрессионного анализа.
Graphs
Legacy Dialogs
Scatter/Dot...
Simple Scatter (Рис.11.6.1).
Define
Появится диалоговое окно, в которое надо внести пару переменных, связь между
которыми изучается. Continue
OK. Двойным щелчком левой клавиши мыши на
изображении графика, надо вызвать окно редактора диаграмм (Chart editor) (Рис.11.6.1).
Рисунок 11.6.1. Редактор графиков.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
198
На верхней панели инструментов нажать на
. Появится диалоговое окно, на
котором надо выбрать линию квадратической регрессии (Quadratic) (Рис. 11.6.2).
Рисунок 11.6.2. Выбор линии регрессии.
Apply
В редакторе диаграмм появится корреляционная диаграмма с квадратической линией
регрессии, наилучшим способом приближенная ко всем точкам в совокупности, с указанием
коэффициента детерминации Rsq=0.502.
Закрыв редактор диаграмм, мы должны получить корреляционную диаграмму с
параболой (Рис.11.6.3).
Рисунок 11.6.3. Корреляционная диаграмма с линией регрессии: самооценка – физическая
агрессия.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
199
Если данную связь подтвердить с помощью коэффициентов корреляции, то можно
будет сделать вывод:
•
для группы участников с низкой самооценкой при увеличении самооценки
физическая агрессия уменьшается;
•
для группы участников с адекватной самооценкой при увеличении самооценки
физическая агрессия меняется случайным образом;
•
для группы участников с высокой самооценкой при увеличении самооценки
физическая агрессия увеличивается;
Аналогичным образом получим остальные диаграммы (Рис.11.6.4-11.6.9)38.
Рисунок 11.6.4. Корреляционная диаграмма с линией регрессии: самооценка – косвенная
агрессия.
Рисунок 11.6.5. Корреляционная диаграмма с линией регрессии: самооценка –
раздражение.
38
Диаграммы отредактированы в SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
200
Рисунок 11.6.6. Корреляционная диаграмма с линией регрессии: самооценка – негативизм.
Рисунок 11.6.7. Корреляционная диаграмма с линией регрессии: самооценка –
подозрительность.
Рисунок 11.6.8. Корреляционная диаграмма с линией регрессии: самооценка – вербальная
агрессия.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
201
Рисунок 11.6.9. Корреляционная диаграмма с линией регрессии: вербальная агрессия самооценка.
Таким образом, с помощью регрессионного анализа показано, что в некоторых
случаях возможна нелинейная немонотонная связь квадратического типа. Для ее
обоснования можно поступать двояким образом:
1. По диаграмме рассеивания находятся точки интервалы монотонности. Выборка
делится на группы, различающиеся направлением связи между переменными. После этого
вычисляются коэффициенты корреляции для каждой группы.
2. От коэффициентов корреляции отказываются. Вводят номинативную переменную,
которая делит выборку на контрастные группы по одной из переменных. Далее изучаются
различия между группами по уровню выраженности другой переменной (Наследов, 2004,
с.89).
3. По одной из переменных переходят (1) к низким и высоким показателям или (2) к
низким, средним и высоким показателям.
Переход лучше всего осуществлять в соответствии с методикой, при условии, что эта
методика адаптирована к соответствующим участников.
В каждой из трех групп вычисляют коэффициенты корреляции.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
202
11.7. Переход к низким и к высоким показателям
Переход к низким, высоким и средним показателям правильнее всего осуществлять
с помощью методик измерения. Если, по каким-либо причинам в методике нормы не
указаны, или неясно, насколько методика адаптирована, то можно осуществлять разбивку
по выборочным данным.
Если
распределение
выборочных
данных
соответствует
нормальному
распределению, то разбивка данных на две группы может осуществляться с помощью
выборочного среднего x . Если оценки по тесту выше x , то их называют «выше среднего
уровня». Если ниже x , то «ниже среднего уровня» (Таблица 11.7.1).
Если
распределение
выборочных
данных
не
соответствует
нормальному
распределению, то разбивка данных на две группы может осуществляться с помощью
медианы Mdn. Если оценки по тесту выше Mdn, то их называют «выше среднего уровня».
Если ниже Mdn, то «ниже среднего уровня» (Таблица 11.7.1).
Таблица 11.7.1
Разбивка данных на две группы: «выше среднего уровня» и «ниже среднего уровня»
В случае нормального
распределения данных
В любых случаях
(Наследов, 2004, с.43)
Если
распределение
Показатели
ниже среднего уровня
Показатели
выше среднего уровня
Ниже x
Выше x
Ниже Mdn
Выше Mdn
выборочных
данных
соответствует
нормальному
распределению, то разбивка данных на три группы может осуществляться с помощью
выборочного среднего x и стандартного отклонения sX .
Если оценки по тесту выше x + sX , то их называют «высокими». Если они находятся
в интервале ( x − s X ; x − s X ) , то они считаются «средними». Если ниже x − sX , то оценки
«низкие» (Таблица 11.7.1).
Если
распределение
выборочных
данных
не
соответствует
нормальному
распределению, то разбивка данных на три группы может осуществляться с помощью
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
203
квартилей Q1 и Q3 Если оценки по тесту выше Q3 , то их называют «высокими». Если они
находятся в интервале от Q1 до Q3 , то они считаются «средними». Если ниже Q1 , то оценки
«низкие» (Таблица 11.7.2).
Таблица 12.7.2
Разбивка данных на три группы:«высокий», «средний» и «низкий» уровень
В случае нормального
распределения данных
В любых случаях39
Низкие
показатели
( x − 3sx ; x − sx )
Средние
показатели
( x − sx ; x + sx )
Высокие
показатели
( x + sx ; x + 3sx )
Ниже Q1 = P25
( Q1; Q3 )
Выше Q3 = P75
11.7.1. Анализ двух групп самооценки
В данном исследовании распределение всех данных статистически значимо
отличается от нормального распределения. Поэтому разбивка самооценки на две группы
будет осуществляться с помощью медианы. Из Таблицы 11.2.1.2 находим, что Mdn=62.33.
Это значит, что 50% оценок не превышает 62.33.
Ø Значение показателя, который меньше Mdn=62.33 будем считать показателем
самооценки ниже среднего уровня, «низкой самооценкой»;
Ø Значение показателя, который больше Mdn=62.33 будем считать показателем
самооценки выше среднего уровня, «высокой самооценкой»;
Низким показателям самооценки присвоим значение „1”. Высоким показателям
самооценки присвоим значение „2”.
Разбиение данных осуществляется автоматически, с помощью программы Syntax.
Откроем новое окно синтакса:
File
New
Syntax
и напишем здесь следующий текст программы (Рис.11.7.1.1):
39
Там же.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
204
if (SE<=62.33) SE1_ind=1 .
if (SE>62.33) SE1_ind=2 .
variable labels SE1_ind 'Self-Esteem'.
value labels p1_ind 1 'Low'
2 'High'.
execute.
Рисунок 11.7.1.1 Переход к низкому и высокому уровню самооценки. Ввод данных.
Сохраним полученный файл синтаксиса под именем Mdn_of_Syntax_SE_AGG.SPS.
Для того, чтобы программа выполнила необходимые действия необходимо
ВЫДЕЛИТЬ ВЕСЬ ТЕКСТ (Edit – Select All) и нажать «треугольник» (пуск), All (Рис.
11.7.1.2).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
205
Рисунок 11.7.1.2. Запуск программы.
После выполнения всех выше перечисленных действий в наш исходный файл “
Samoocenka_Agresija.sav” автоматически будет добавлен один столбец данных. Появится
новая переменная с названием р1_ind, меткой (Label) P и значениями 1 – zems (низкий
уровень самооценки) и 2 – augsts - высокий уровень. Останется только поставить число
знаков после запятой (Decimals) равным нулю и выбрать Nominal Measure. (Рис. 11.7.1.3).
Рисунок 11.7.1.3. Вид переменных с новой переменной SE1_ind.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
206
Рисунок 11.7.1.4. Вид данных с новой переменной SE1_ind.
Расщепление файла
Для того, чтобы выбрать правильные коэффициенты корреляции, повторим
исследование данных для каждого из уровней самооценки. Разобьем файл на две группы:
Data
Split File
Organize output by groups
Рисунок 11.7.1.5. Расщепление файла по группам самооценки.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
207
OK
Описательные статистики:
Analyze
Descriptive Statistics
Frequencies…
Рисунок 11.7.1.6. Ввод переменных.
Statistics
Рисунок 11.7.1.7. Заказ показателей описательной статистики.
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
208
Таблица 11.7.1.1
Описательные статистики для участников с низкой самооценкой
SelfEsteem
Valid
N
Missing
Mean
Std. Error of Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
Verbal
Aggression
73
73
73
73
73
73
50.78
1.049
53.82
8.961
-.296
.281
-1.187
.555
31
31
62
5.30
.309
5.00
2.644
-.053
.281
-1.337
.555
9
9
4.78
.280
5.00
2.394
.079
.281
-1.251
.555
8
1
9
5.62
.259
5.00
2.209
-.243
.281
-.749
.555
8
1
9
2.93
.148
3.00
1.262
.047
.281
-.739
.555
5
5
5.58
.248
5.00
2.121
-.103
.281
-.810
.555
8
1
9
a. Self-Esteem = Low
Таблица 11.7.1.2
Описательные статистики для участников с высокой самооценкой
SelfEsteem
Valid
N
Missing
Mean
Std. Error of Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
Verbal
Aggression
72
72
72
72
72
72
73.98
.890
71.58
7.552
.434
.283
-.709
.559
29
63
92
5.42
.318
5.00
2.695
.132
.283
-1.452
.559
9
1
10
4.61
.289
4.00
2.453
.213
.283
-1.255
.559
8
1
9
5.50
.225
5.00
1.906
.038
.283
-.479
.559
7
2
9
2.85
.153
3.00
1.296
.292
.283
-.987
.559
4
1
5
5.43
.190
6.00
1.608
-.717
.283
.106
.559
7
1
8
a. Self-Esteem = High
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
209
Получение гистограмм с нормальными кривыми
Для экономии места можно получить диаграммы с нормальной кривой для низкой и
высокой самооценки на одном рисунке. Для этого нужно, чтобы файл данных не был бы
разбит на две группы:
Data
Split file...
Reset
OK.
После чего можно заказывать гистограммы:
Graphs
Legacy Dialogs
Histogram…
Рисунок 11.7.1.8. Заказ гистограмм с нормальной кривой.
Появится диалоговое окно (Рис.11.7.1.8). Для построения гистограмм с нормальной
кривой по Self-Esteem [SE] переменную Self-Esteem [SE] надо перенести в окно «Variable»,
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
210
переменную Self-Esteem [SE1_ind] – в окно «Columns», а в окошке «Display normal curve»
надо поставить галочку и нажать кнопку ОК.
После чего появится рисунок с двумя гистограммами (Рис. 11.7.1.9).
Рисунок 11.7.1.9. Гистограммы с нормальной кривой по переменной «Самооценка» для
высокой и низкой самооценок.
Ту же самую процедуру надо проделать для всех остальных переменных (Рис.
11.7.1.10-11.7.1.14.). Все рисунки отредактированы в SPSS.
На Рис.11.7.1.9-11.7.1.14 изображены гистограммы с нормальной кривой для
визуального сравнения с нормальным распределением.
Рисунок 11.7.1.10. Гистограммы с нормальной кривой по переменной «Физическая
агрессия» для высокой и низкой самооценок.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
211
Рисунок 11.7.1.11. Гистограммы с нормальной кривой по переменной «Косвенная агрессия»
для высокой и низкой самооценок.
Рисунок 11.7.1.12. Гистограммы с нормальной кривой по переменной «Раздражение» для
высокой и низкой самооценок.
Рисунок 11.7.1.13. Гистограммы с нормальной кривой по переменной «Негативизм» для
высокой и низкой самооценок.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
212
Рисунок 11.7.1.14. Гистограммы с нормальной кривой по переменной «Вербальная
агрессия» для высокой и низкой самооценок.
Тесты на нормальность распределения:
Analyze
Descriptive Statistics
Explore…
Рисунок 11.7.1.15. Заказ тестов на нормальность распределения.
Plots
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
213
Рисунок 11.7.1.16. Заказ тестов на нормальность распределения.
Continue
OK
Таблица 11.7.1.3
Тесты на нормальность распределения (Tests of Normality)
Kolmogorov-Smirnova
Shapiro-Wilk
Self-Esteem
Statistic
df
Sig.
Statistic
df
Sig.
Low
.140
73
.001
.908
73
.000
High
.148
72
.001
.953
72
.009
Low
.161
73
.000
.915
73
.000
High
.159
72
.000
.900
72
.000
Low
.151
73
.000
.926
73
.000
High
.147
72
.001
.922
72
.000
Low
.145
73
.001
.944
73
.003
High
.159
72
.000
.941
72
.002
Low
.167
73
.000
.927
73
.000
High
.202
72
.000
.897
72
.000
Low
.127
73
.005
.951
73
.007
High
.180
72
.000
.922
72
.000
Self-Esteem
Physical Aggression
Indirect Aggression
Irritation
Negativism
Verbal Aggression
a. Lilliefors Significance Correction
Тесты Колмогорова-Смирнова с поправкой Лиллифора и Шапиро-Уилкса показали
несоответствие распределения данных нормальному распределению.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
214
Построение коробчатых диаграмм
Analyze
Descriptive Statistics
Explore…
Убрать самооценку Р из списка переменных (Dependent List).
Plots
Рисунок 11.7.1.17. Заказ коробчатых диаграмм.
Continue
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
215
Рисунок 11.7.1.18. Коробчатые диаграммы.
Аналогичным способом можно получить коробчатую диаграмму для самооценки
(Рис.11.7.1.19).
Рисунок 11.7.1.19. Коробчатая диаграмма для самооценки.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
216
Вычисление коэффициентов корреляции
Распределения данных не соответствует нормальному распределению Поэтому надо
вычислять непараметрические коэффициенты корреляции Спирмена и Кендалла.
Расщепление данных:
Data
Split File
Organize output by groups
В окно переменных ввести Self-Esteem [SE1_ind]
OK
Analyze
Correlate
Bivariate…
Рисунок 11.7.1.20. Заказ коэффициентов корреляции.
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
217
Таблица 11.7.1.4
Корреляционная матрица. Низкая самооценка
SelfEsteem
Kendall's
tau_b
Self-Esteem
Correlation
Coefficient
Sig.
(2-tailed)
Correlation
Coefficient
Sig.
(2-tailed)
Correlation
Coefficient
Sig.
(2-tailed)
Irritation
Correlation
Coefficient
Sig.
(2-tailed)
Negativism
Correlation
Coefficient
Sig.
(2-tailed)
Verbal
Aggression
Correlation
Coefficient
Sig.
(2-tailed)
.202*
.022
-.389**
.000
73
73
73
73
73
73
**
-.520
.000
1.000
**
.434
.000
**
.585
.000
**
-.304
.001
.413**
.000
73
73
73
73
73
73
**
-.513
.000
**
.434
.000
1.000
**
.582
.000
**
-.273
.003
.379**
.000
73
73
73
73
73
73
**
-.584
.000
**
.585
.000
**
.582
.000
1.000
**
-.371
.000
.431**
.000
73
73
73
73
73
73
*
.202
.022
**
-.304
.001
**
-.273
.003
**
-.371
.000
1.000
-.324**
.000
73
73
73
73
73
73
**
-.389
.000
**
.413
.000
**
.379
.000
**
.431
.000
**
-.324
.000
1.000
73
73
73
73
73
73
1.000
**
**
**
*
-.537**
.000
N
N
Correlation
Coefficient
Sig.
(2-tailed)
N
Correlation
Coefficient
Sig.
(2-tailed)
Indirect
Aggression
Correlation
Coefficient
Sig.
(2-tailed)
Irritation
Correlation
Coefficient
Sig.
(2-tailed)
-.765
.000
.276
.018
73
73
73
73
73
1.000
.587**
.000
.757**
.000
-.387**
.001
.569**
.000
73
73
73
73
73
73
-.681**
.000
.587**
.000
1.000
.730**
.000
-.339**
.003
.485**
.000
73
73
73
73
73
73
-.765**
.000
.757**
.000
.730**
.000
1.000
-.464**
.000
.580**
.000
73
73
73
73
73
73
*
.276
.018
**
-.387
.001
**
-.339
.003
**
-.464
.000
1.000
-.413**
.000
73
73
73
73
73
73
**
-.537
.000
**
.569
.000
**
.485
.000
**
.580
.000
**
-.413
.000
1.000
73
73
73
73
73
73
N
Correlation
Coefficient
Sig.
(2-tailed)
N
Correlation
Coefficient
Sig.
(2-tailed)
-.681
.000
73
N
Verbal
Aggression
-.724
.000
-.724**
.000
N
Negativism
Verbal
Aggression
-.584**
.000
N
Physical
Aggression
Negativism
-.513**
.000
N
Spearman's Self-Esteem
rho
Irritation
-.520**
.000
N
Indirect
Aggression
Indirect
Aggression
1.000
N
Physical
Aggression
Physical
Aggression
N
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
a. Self-Esteem = Low
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
218
Таблица 11.7.1.5
Корреляционная матрица. Высокая самооценка
SelfEsteem
Kendall's
tau_b
Self-Esteem
Correlation
Coefficient
Sig.
(2-tailed)
Correlation
Coefficient
Sig.
(2-tailed)
Correlation
Coefficient
Sig.
(2-tailed)
Correlation
Coefficient
Sig. (2-tailed)
-.042
.635
.427**
.000
72
72
72
72
72
72
**
.485
.000
1.000
**
.495
.000
**
.388
.000
-.063
.495
.358**
.000
72
72
72
72
72
72
**
.496
.000
**
.495
.000
1.000
**
.388
.000
-.120
.239**
.009
72
72
72
72
72
72
**
.380
.000
**
.388
.000
**
.388
.000
1.000
-.144
.178
.125
.055
72
72
72
72
72
72
-.042
-.063
-.120
-.144
1.000
-.123
.635
.495
.196
.125
72
72
72
72
72
72
**
.427
.000
**
.358
.000
**
.239
.009
.178
-.123
1.000
.055
.195
72
72
72
72
72
72
1.000
**
**
**
-.058
.555**
.000
Correlation
Coefficient
Sig.
(2-tailed)
N
Verbal
Aggression
Correlation
Coefficient
Sig.
(2-tailed)
N
Spearman's Self-Esteem
rho
Correlation
Coefficient
Sig.
(2-tailed)
N
Physical
Aggression
Correlation
Coefficient
Sig.
(2-tailed)
Indirect
Aggression
Correlation
Coefficient
Sig.
(2-tailed)
Irritation
Correlation
Coefficient
Sig. (2-tailed)
.522
.000
.631
72
72
72
72
72
1.000
.674**
.000
.515**
.000
-.085
.466**
.000
.476
72
72
72
72
72
72
.686**
.000
.674**
.000
1.000
.519**
.000
-.154
.341**
.003
.196
72
72
72
72
72
72
.522**
.000
.515**
.000
.519**
.000
1.000
-.181
.127
.233*
.049
72
72
72
72
72
72
-.058
-.085
-.154
-.181
1.000
-.148
.631
.476
.196
.127
72
72
72
72
72
72
**
**
**
*
1.000
N
Correlation
Coefficient
Sig.
(2-tailed)
N
Correlation
Coefficient
Sig.
(2-tailed)
.686
.000
.195
72
N
Verbal
Aggression
.701
.000
.196
.701**
.000
N
Negativism
Verbal
Aggression
.380**
.000
N
Negativism
Negativism
.496**
.000
N
Irritation
Irritation
.485**
.000
N
Indirect
Aggression
Indirect
Aggression
1.000
N
Physical
Aggression
Physical
Aggression
.213
.555
.000
.466
.000
.341
.003
.233
.049
-.148
72
72
72
72
72
N
.213
72
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
a. Self-Esteem = High
Построение корреляционных диаграмм с прямыми регрессии
Убрать расщепление файла:
Data
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
219
Split File
Reset
OK
Graphs
Legacy Dialogs
Scatter/Dot... (Рис.11.7.1.21):
Рисунок 11.7.1.21. Заказ корреляционных диаграмм.
Define
Появится диалоговое окно (Рис.11.7.22), в которое надо внести пару переменных,
связь между которыми изучается.
Рисунок 11.7.1.22. Заказ корреляционных диаграмм с учетом групп самооценки.
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
220
В результате появится корреляционная диаграмма, в которой точки, относящиеся к
наблюдениям из разных групп самооценки отличаются по цвету.
Щелкнув два раза мышью по корреляционной диаграмме, мы войдем в редактор
графиков – Chart Editor.
Рисунок 11.7.1.23. Редактор графиков. Корреляционная диаграмма с учетом групп
самооценки.
Для того, чтобы получить две регрессионные прямые для высокой и низкой
самооценок, надо нажать на
. По умолчанию появятся прямые регрессии (Рис.11.7.1.24).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
221
Самооценка – Физическая агрессия
Рисунок 11.7.1.24. Прямые регрессии для групп с низкой и с высокой самооценкой поотдельности
Для того, чтобы получить параболу – линию регрессии для всех наблюдений – надо
в редакторе графиков нажать на
.
Поставить точку у окошка квадратической регрессии (Quadratic) (Рис.11.7.1.25).
Apply
Рисунок 11.7.1.25. Выбор квадратической линии регрессии.
Закрыть редактор графика.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
222
Полученная корреляционная диаграмма и коэффициенты корреляции показывают
следующие результаты.
Самооценка – Физическая агрессия
Рисунок 11.7.1.26. Корреляционная диаграмма (Самооценка – Физическая агрессия) с
прямыми регрессиями для участников с низкой самооценкой и для участников с высокой
самооценкой и с линией квадратической регрессии для всех наблюдений (пунктиром).
В группе участников с высокой самооценкой связь самооценки с физической
агрессией монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .70;
p < .001 (Таблица 11.7.1.5).
В группе участников с низкой самооценкой связь самооценки с физической агрессией
монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.72; p < .001
(Таблица 11.7.1.4).
Для всей группы участников корреляционная связь самооценки с физической
агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = -.018, р = .83, ns
(Таблица 11.3.1).
Для остальных случаев схема получения корреляционных диаграмм с прямыми
регрессии сохраняется. Рассмотрим результаты.
На Рис.11.7.1.27-11.7.1.33 изображены корреляционные диаграммы с линиями
регрессии для двух групп самооценки. Все рисунки отредактированы в SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
223
Самооценка – Косвенная агрессия
Рисунок 11.7.1.27. Корреляционная диаграмма (Самооценка – Косвенная агрессия) с
прямыми регрессиями для участников с низкой самооценкой и для участников с высокой
самооценкой и с линией квадратической регрессии для всех наблюдений.
В группе участников с высокой самооценкой связь самооценки с косвенной агрессией
монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .69, p < .001
(Таблица 11.7.1.4).
В группе участников с низкой самооценкой связь самооценки с косвенной агрессией
монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.68, p < .001
(Таблица 11.7.1.4).
Для всей группы участников корреляционная связь самооценки с косвенной
агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = - .027, р = .75 (Таблица
11.3.1).
Корреляционная диаграмма с линиями регрессии показана на Рис.11.7.1.27.
Самооценка – Вербальная агрессия
В группе участников с высокой самооценкой связь самооценки с вербальной
агрессией монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .56;
p < .001 (Таблица 11.7.1.5).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
224
В группе участников с низкой самооценкой связь самооценки с вербальной агрессией
монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.54, p < .001
(Таблица 11.7.1.4).
Для всей группы участников корреляционная связь самооценки с вербальной
агрессией не найдена. Коэффициент корреляции Спирмена rS (145) = -.055, р = .51, ns
(Таблица 11.3.1).
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.28.
Рисунок 11.7.1.28. Корреляционная диаграмма (Самооценка – Вербальная агрессия) с
прямыми регрессиями для участников с низкой самооценкой и для участников с высокой
самооценкой и с линией квадратической регрессии для всех наблюдений.
Самооценка – Раздражение
В группе участников с высокой самооценкой связь самооценки с раздражением
монотонная, положительная. Коэффициент корреляции Спирмена rS (72) = .52, p < .001
(Таблица 11.7.1.5).
В группе участников с низкой самооценкой связь самооценки с раздражением
монотонная, отрицательная. Коэффициент корреляции Спирмена rS (73) = -.77, p < .001
(Таблица 11.7.1.4).
Для всей группы участников корреляционная связь самооценки с раздражением не
найдена. Коэффициент корреляции Спирмена rS (145) = - .11, р = .18, ns (Таблица 12.3.1).
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.29.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
225
Рисунок 11.7.1.29. Корреляционная диаграмма (Самооценка – Раздражение) с прямыми
регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой
и с линией квадратической регрессии для всех наблюдений.
Самооценка – Негативизм
В группе участников с высокой самооценкой связь самооценки с негативизмом не
найдена. Коэффициент корреляции Спирмена rS (72) = .058, р = .63, ns (Таблица 11.7.1.5).
В группе участников с низкой самооценкой связь самооценки с негативизмом
монотонная, положительная. Коэффициент корреляции Спирмена rS (73) = .28, р = .018, ns
(Таблица 11.7.1.4)
Для всей группы участников корреляционная связь самооценки с негативизмом не
найдена. Коэффициент корреляции Спирмена rS (145) = .016, р = .85, ns (Таблица 11.3.1).
Корреляционная диаграмма с линиями регрессии показана на Рис.11.7.1.30.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
226
Рисунок 11.7.1.30. Корреляционная диаграмма (Самооценка – Негативизм) с прямыми
регрессиями для участников с низкой самооценкой и для участников с высокой самооценкой
и с линией квадратической регрессии для всех наблюдений.
Самооценка – Обида
Рисунок 11.7.1.31. Корреляционная диаграмма (Самооценка – Обида) с прямыми
регрессиями для всех участников, для участников с низкой самооценкой, для участников с
высокой самооценкой.
В группе участников с высокой самооценкой связь самооценки с обидой не найдена.
Коэффициент корреляции Спирмена rS (72) = - .086, р = .47, ns (Таблица 11.7.1.5).
В группе участников с низкой самооценкой связь самооценки с обидой не найдена.
Коэффициент корреляции Спирмена rS (73) = .18, р = .13, ns (Таблица 12.1.1.4).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
227
Для всей группы участников корреляционная связь самооценки с обидой не найдена.
Коэффициент корреляции Спирмена rS (145) = .060, р = .47, ns (Таблица 11.3.1).
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.31.
Самооценка – Подозрительность
В группе участников с высокой самооценкой связь самооценки с подозрительностью
не найдена. Коэффициент корреляции Спирмена rS (72) = .055, р = .65, ns (Таблица 11.7.1.5).
В группе участников с низкой самооценкой связь самооценки с подозрительностью
не найдена. Коэффициент корреляции Спирмена rS (73) = .022, р = .85, ns (Таблица 11.7.1.4).
Для
всей
группы
участников
корреляционная
связь
самооценки
с
подозрительностью не найдена. Коэффициент корреляции Спирмена rS (145) = .15, р = .071,
ns (Таблица 11.3.1).
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.32.
Рисунок 11.7.1.32. Корреляционная диаграмма (Самооценка – Подозрительность) с
прямыми регрессиями для всех участников, для участников с низкой самооценкой, для
участников с высокой самооценкой.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
228
Самооценка – Чувство вины
В группе участников с высокой самооценкой связь самооценки с чувством вины не
найдена. Коэффициент корреляции Спирмена rS (72) = - .11, р = .34, ns (Таблица 11.7.1.5).
В группе участников с низкой самооценкой найдена положительная монотонная
связь самооценки с чувством вины. Коэффициент корреляции Спирмена rS (73) = .23, р =
.052. Коэффициент корреляции Кендалла τ (73) = .17; p = .049 (Таблица 11.7.1.4).
Для всей группы участников корреляционная связь самооценки с чувством вины не
найдена. Коэффициент корреляции Спирмена rS (145) = -.055, р = .51, ns (Таблица 11.3.1).
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.1.33.
Рисунок 11.7.1.33. Корреляционная диаграмма (Самооценка – Чувство вины) с прямыми
регрессиями для всех участников, для участников с низкой самооценкой, для участников с
высокой самооценкой.
11.7.2. Анализ двух групп вербальной агрессии
Одним из результатов регрессионного анализа оказалась возможная квадратическая
связь, когда независимой переменной является вербальная агрессивность, а зависимой –
самооценка.
Для «Вербальной агрессивности» Mdn = 6 . Эта переменная принимает всего лишь 9
значений (Таблица 11.7.2.1).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
229
Если присоединить значение медианы к «низкой» «Вербальной агрессивности», то в
этой группе окажется 69% данных (100 наблюдений), а в группе с «высокой» «Вербальной
агрессивностью будет всего лишь 31% данных (45 наблюдений). Группы получатся с очень
разными объемами.
Если присоединить значение медианы к «высокой» «Вербальной агрессивности», то
в этой группе окажется 51% данных (74 наблюдения), а в группе с «низкой» «Вербальной
агрессивностью будет 49% данных (71 наблюдение). Группы получатся с уравненными по
объему. Поэтому, будем рассматривать именно этот вариант разбивки:
Mdn < 6 - низкий уровень вербальной агрессивности (low);
Mdn ≥ 6 - высокий уровень вербальной агрессивности (high).
Таблица 11.7.2.1
Частотная таблица для «Вербальной агрессивности»
Frequency
Valid
Verbal Aggression
Percent
Valid Percent
Cumulative
Percent
1
2
1.4
1.4
1.4
2
10
6.9
6.9
8.3
3
12
8.3
8.3
16.6
4
12
8.3
8.3
24.8
5
35
24.1
24.1
49.0
6
29
20.0
20.0
69.0
7
24
16.6
16.6
85.5
8
14
9.7
9.7
95.2
9
7
4.8
4.8
100.0
145
100.0
100.0
Total
Откроем файл Mdn_of_Syntax_SE_AGG.SPS.
Допишем имеющуюся в нем программу:
if (VA<6) VA1_ind=1 .
if (VA>=6) VA1_ind=2 .
variable labels VA1_ind 'Verbal Aggression'.
value labels VA1_ind 1 'Low'
2 'High'.
Получится окно, изображенное на Рис.11.7.2.1.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
230
Рисунок 11.7.2.1. Добавление перехода к низкому и высокому уровням «Вербальной
агрессивности». Ввод данных в Syntax.
ВЫДЕЛИМ ВЕСЬ ТЕКСТ (Edit – Select All) и нажмем «треугольник» (пуск), All.
После выполнения всех выше перечисленных действий в наш исходный файл “SelfEsteem_Aggression.sav” автоматически будет добавлен еще один столбец данных. Появится
новая переменная с названием v1_ind, меткой (Label) Verbal Aggression и значениями 1 –
low (низкий уровень вербальной агрессивности) и 2 – high - высокий уровень. Поставим
число знаков после запятой (Decimals) равным нулю и выберем Nominal Measure.
Выходная информация
Таблице 11.7.2.2 является объединенной из двух выходных таблиц SPSS,
отредактированной, к ней добавлены две нижние строчки, вычисленные в Excel. Отмечены
случаи, когда показатели асимметрии и эксцесса превышают свои стандартные ошибки,
умноженные на 1.96. В этих случаях нормального распределения нет.
Таблица 11.7.2.2
Описательные статистики для участников с низкой вербальной агрессивностью
Verbal Aggression
low
N
Valid
Missing
SelfEsteem
71
Verbal Aggression
high
Verbal
Aggression
71
SelfEsteem
74
Verbal
Aggression
74
Mean
62.06
3.96
62.53
6.99
Median
62.16
4.00
65.58
7.00
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
231
Std. Deviation
10.57
1.22
17.16
0.99
Skewness
-0.42
-0.78
-0.09
0.64
0.28
0.28
0.28
0.28
-0.65
Std. Error of Skewness
Kurtosis
0.66
-0.70
-1.39
Std. Error of Kurtosis
0.56
0.56
0.55
0.55
Range
53.50
4.00
60.34
3.00
Minimum
31.33
1.00
31.16
6.00
Maximum
84.83
5.00
91.50
9.00
1.96*SES
0.56
0.56
0.55
0.55
1.96*SEK
1.10
1.10
1.08
1.08
На Рис. 11.7.2.1-11.7.2.2 изображены гистограммы с нормальной кривой для
визуального сравнения с нормальным распределением. Рисунки отредактированы в SPSS.
Рисунок 11.7.2.1. Гистограммы с нормальной кривой для самооценки в группах с низкой и
высокой вербальной агрессивностью.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
232
Рисунок 11.7.2.2. Гистограммы с нормальной кривой для вербальной агрессивности в
группах с низкой и высокой вербальной агрессивностью.
Тесты на нормальность распределения:
Таблица 11.7.2.3
Тесты на нормальность распределения (Tests of Normality)
Verbal
Aggression
Kolmogorov-Smirnova
Statistic
df
Sig.
Shapiro-Wilk
Statistic
df
Sig.
Low
.091
71
.200*
.976
71
.191
High
.159
74
.000
.921
74
.000
Low
.296
71
.000
.792
71
.000
High
.233
74
.000
.829
74
.000
Self-Esteem
Verbal Aggression
a. Lilliefors Significance Correction
Тесты Колмогорова-Смирнова и Шапиро-Уилкса нашли отличия распределения
данных от нормального распределения.
Коробчатые диаграммы (Рис. 11.7.2.3-11.7.2.4)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
233
Рисунок 11.7.2.3. Коробчатые диаграммы для самооценки. Низкая и высокая вербальная
агрессивность.
Рисунок 11.7.2.4. Коробчатые диаграммы для вербальной агрессивности. Низкая и высокая
вербальная агрессивность.
Вычисление коэффициентов корреляции
Распределения данных не соответствует нормальному распределению. Но по всем
переменным «выбросы» отсутствуют («выброс» на Рис.11.7.2.3 для низкой вербальной
агрессивности не может существенно исказить среднее значение). Но большая асимметрия
(Таблица 11.7.2.2) по «Вербальной агрессивности», как для низких, так и для высоких ее
значений не дает возможности использовать коэффициент корреляции Пирсона. Поэтому
надо вычислять непараметрические коэффициенты корреляции Спирмена и Кендалла.
Разобьем файл по переменной VA1_ind. Вычислим коэффициенты корреляции.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
234
При низкой «Вербальной агрессивности»:
rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним. τ ( 71) = .16, p = .082 .
При высокой «Вербальной агрессивности»:
rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим. τ ( 71) = −.28, p = .002 .
Вербальная агрессивность - Самооценка
Корреляционная диаграмма с прямыми регрессии показана на Рис.11.7.2.5.
Рисунок 11.7.2.5. Корреляционная диаграмма (Вербальная агрессивность – Самооценка) с
прямыми регрессиями для участников с низкой вербальной агрессивностью и для
участников с высокой вербальной агрессивностью и с линией квадратической регрессии для
всех наблюдений.
В группе участников с низкой вербальной агрессивностью связь найдена тенденция
к отрицательной нелинейной зависимости «Самооценки» от «Вербальной агрессивности».
Коэффициент корреляции Спирмена
rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним.
В группе участников с высокой вербальной агрессивностью связь найдена
отрицательная нелинейная зависимость «Самооценки» от «Вербальной агрессивности».
Коэффициент корреляции Спирмена
rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
235
11.8. Выводы по корреляционному анализу
«Самооценка» и «Физическая агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Физической агрессивности» от
«Самооценки»: r (73) = -.77; p<.001 - при увеличении «Самооценки» «Физическая
агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой
«Самооценкой» обнаружена положительная зависимость: r (72) = .74; p<.001 - при
увеличении «Самооценки» «Физическая агрессивность» увеличивается. Размер эффекта
большой. При увеличении «Физической агрессивности»,
«Самооценка» меняется
случайным образом.
«Самооценка» и «Косвенная агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Косвенной агрессивности» от
«Самооценки»: r (73) = -.70; p<.001 - при увеличении «Самооценки» «Косвенная
агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой
«Самооценкой» обнаружена положительная зависимость r (72) = .69; p<.001 - при
увеличении «Самооценки» «Косвенная агрессивность» увеличивается. Размер эффекта
большой. При увеличении «Косвенной агрессивности», «Самооценка» меняется случайным
образом.
«Самооценка»
и
«Раздражительность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Раздражения» от «Самооценки»:
r (73) = -.76; p<.001 - при увеличении «Самооценки» «Раздражительность» уменьшается.
Размер эффекта большой. В группе подростков с высокой «Самооценкой» обнаружена
положительная зависимость: r (72) = .53; p<.001 - при увеличении «Самооценки»
«Раздражительность» увеличивается. Размер эффекта большой.
Обнаружена
тенденция
уменьшения
«Самооценки»
при
увеличении
«Раздражения»: r(145) = -.15 р = .072. Размер эффекта небольшой
«Самооценка» и «Негативизм». В группе подростков с низкой «Самооценкой»
обнаружена положительная зависимость «Негативизма» от «Самооценки»: r (73) = .32; p
=.005 - при увеличении «Самооценки» «Негативизм» увеличивается. Размер эффекта
средний. В группе подростков с высокой «Самооценкой» связь не обнаружена: при
увеличении «Самооценки» «Негативизм» меняется случайным образом.
При увеличении «Негативизма», «Самооценка» меняется случайным образом.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
236
«Самооценка» и «Обидчивость». Связь не обнаружена.
«Самооценка» и «Подозрительность». Обнаружена положительная связь r(145) =
.17; p = .046: «Самооценка» и «Подозрительность» согласованно возрастают. Размер
эффекта небольшой.
«Самооценка» и «Вербальная агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Вербальной агрессивности» от
«Самооценки»: r (73) = -.53; p<.001 - при увеличении «Самооценки» «Вербальная
агрессивность» уменьшается. Размер эффекта большой. В группе подростков с высокой
«Самооценкой» обнаружена положительная зависимость: rS (72) = .56; p<.001 - при
увеличении «Самооценки» «Вербальная агрессивность» увеличивается. Размер эффекта
большой.
В группе участников с низкой «Вербальной агрессивностью» обнаружена положительная
зависимость «Самооценки» от «Вербальной агрессивности»: rS ( 71) = .21, p = .082 - чем
выше «Вербальная агрессивность», тем выше «Самооценка». Размер эффекта между
небольшим и средним. В группе участников с высокой «Вербальной агрессивностью»
обнаружена отрицательная зависимость: rS ( 74 ) = −.40, p < .001 . Чем выше «Вербальная
агрессивность», тем ниже «Самооценка». Размер эффекта размер эффекта между средним и
большим.
«Самооценка» и «Чувство вины». В группе подростков с низкой «Самооценкой»
обнаружена положительная зависимость «Чувства вины» от «Самооценки»: r (73) = .23; p
=.051, τ (73) = .17; p = .049: при увеличении «Самооценки» «Чувство вины» увеличивается.
Размер эффекта небольшой, ближе к среднему. В группе подростков с высокой
«Самооценкой» связь самооценки с «Чувством вины» не найдена: r (72) = -.14; p = .24,
размер эффекта небольшой - при увеличении «Самооценки» «Чувство вины» меняется
случайным образом. Коэффициент корреляции Пирсона указывает на статистически
незначимую отрицательную зависимость небольшого размера эффекта.
При увеличении «Чувства вины» «Самооценка» меняется случайным образом.
Отчет по оданному исследованию можно найти в Приложении 4.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
237
12. Частотный анализ. Критерий «Хи-квадрат» Пирсона
Критерий согласия «Хи-квадрат» Пирсона (χ2 – Пирсона, Chi-square, Pearson)
используют:
- Для сравнения распределения значений номинальной переменной по ее категориям с
теоретическим распределением (Goodness-of-Fit Test);
- Для исследования связи номинальных переменных (Test of Independence).
12.1. Сравнение распределения с теоретическим: Goodness-ofFit Test
Исследование отличия эмпирического распределения значений номинальной
переменной по ее категориям от теоретического распределения проведем с помощью
разновидности теста «Хи-квадрат» Пирсона: Goodness-of-Fit Test.
Гипотезы
H 0 : Отличие эмпирического распределения значений номинальной переменной по ее
категориям от теоретического распределения случайное.
H 1 : Отличие эмпирического распределения значений номинальной переменной по ее
категориям от теоретического распределения случайное закономерное.
Статистики теста «Хи-квадрат» для Goodness-of-Fit Test
Если число разрядов признака k>2, то статистику теста «Хи-квадрат» можно
вычислить по формуле:
k
( nei − nti )
i =1
nti
χ =∑
2
e
2
,
(12.1.1)
где k – число разрядов (групп); nei -эмпирические частоты; nti - теоретические частоты.
Если число разрядов признака k=2, то следует учитывать «поправку на
непрерывность» Йета (Yates’ Correction for Continuity) (Хили, 2005; С.341):
2
χ =∑
2
e
i =1
(n
ei
− nti − 0.5)
nti
2
.
(12.1.2)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
238
Степени свободы для Goodness-of-Fit Test
df = k − 1 .
(12.1. 3)
Ограничения критерия «Хи-квадрат»:
1. Точность критерия растет с увеличением числа наблюдений N.
2. Каждая теоретическая частота должна быть ntij ≥ 5 .
3. Если число категорий номинальных переменных равно двум, то необходимо
учитывать „поправку на непрерывность” Йета.
4. Если наблюдение относится к конкретной категории, то оно не должно
принадлежать ни к одной другой категории.
Размер эффекта для Goodness-of-Fit Test
Размер эффекта при сравнении эмпирического распределения с теоретическим
распределением с помощью критерия «Хи-квадрат» определяется w – статистикой (Cohen,
1988), которую вычисляют по формуле:
w=
χ2
,
N
(12.1.4)
где N – размер всей выборки.
Согласно (Cohen, 1988), значения w, равные .10 – соответствует небольшому размеру
эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта.
12.1.1. Сравнение эмпирического распределения признака с
равномерным распределением
В рассматриваемом случае всего одно эмпирическое распределение m=1. Если число
разрядов признака k>2, то наблюдаемое значение критерия можно вычислить по формуле
(12.1.1.1).
Для равномерного распределения теоретические частоты nti находятся по формуле:
nti =
N
,
k
(12.1.1.1)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
239
где N – число наблюдений.
Должны соблюдаться равенства:
N = ne1 + ne 2 +L nek и N = nt1 + nt 2 +L ntk ,
(12.1.1.2)
которые могут быть использованы для контроля.
Также справедливо равенство:
k
∑ (n
i =1
ei
− nti ) = 0 ,
(12.1.1.3)
которое также может быть использовано для контроля.
Если число разрядов признака k = 2 то теоретические частоты равны nti =
N
, и
2
следует учитывать „поправку на непрерывность” Йета (Yate) (Хили, 2005; с.341):
χ
2
e
(n
=
e1
− N 2 − 0.5)
2
N 2
(n
+
e2
− N 2 − 0.5)
2
N 2
.
(12.1.1.4)
Алгоритм применения критерия χ2
Гипотезы:
H 0 : Эмпирическое распределение признака имеет случайные отличия от равномерного
распределения.
H 1 : Эмпирическое распределение признака отличается от равномерного распределения
закономерно.
Если N – число наблюдений и количество разрядов k > 2, то строят таблицу с 5-ю
столбцами и k+2 строками, в соответствии с Таблицей 12.1.1.1, в которой nei - эмпирические
частоты; nti - теоретические частоты: nti =
N
. В последней строке вычисляют суммы
k
(12.1.1.2)-(12.1.1.3) для контроля. Сумма последнего столбца совпадает со статистикой χ e2 .
Если число наблюдений n и количество разрядов признака k=2, то строят таблицу с
6-ю столбцами и k+2 строками, по образцу Таблицы 12.1.1.2.
По числу степеней свободы df = k − 1 и по статистике χ e2 с помощью программы
Excel (CHISQ.DIST.RT) находят p-value для правостороннего (one-tailed) теста (п.7.7).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
240
В соответствии с найденным значением p-value формулируют ответ. При p > .05 нет
оснований отклонить нулевую гипотезу H 0 . Нулевая гипотеза отклоняется и принимается
альтернативная гипотеза H 1 , если p ≤ .05.
Таблица 12.1.1.1
Вычисление статистики - χ e2
Разряды
nei
nti
1
...
k
ne1
...
nek
N k
...
N k
Суммы
N
N
nei − nti
(nei − nti )2
(nei − nti )
2
nti
χ e2
Таблица 12.1.1.2.
Вычисление скорректированной статистики χ e2
Разряды
nei
nti
nei − nti
nei − nti − 0.5
1.
ne1
n2
ne1 − n 2
ne1 − n 2 − 0.5
2.
ne 2
n2
ne 2 − n 2
ne 2 − n 2 − 0.5
Суммы
N
N
(n
ei
− nti − 0.5)
2
(n
ei
− nti − 0.5)
nti
2
χ e2
12.1.2. Пример 1. Без поправки на непрерывность
На вопрос: „Какие эмоции и чувства вызывает у Вас реклама пива «ПИТ» были получены
ответы:
Таблица 12.1.2.1
Результаты опроса
Ответ
a) Раздражение
b) Безразличие
c) Восторг
Число ответов
30
27
9
Являются ли ответы случайными? Может быть нет различия в восприятии рекламы пива
«ПИТ»?
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
241
Решение
В данном примере речь идет о номинальной переменной, которую можно было бы
назвать «Восприятие рекламы» и которая имеет три категории: «Раздражение»,
«Безразличие» и «Восторг».
Теоретические частоты в данном случае равны nti =
N
, где k = 3 – число вариантов
k
ответов, N = 66 – число наблюдений.
В нашем случае nti =
66
= 22 .
3
Гипотезы:
H 0 : Распределение значений переменной «Восприятие рекламы» пива «ПИТ» имеет
случайные отличия от равномерного распределения.
H 1 : Распределение значений переменной «Восприятие рекламы» пива «ПИТ» отличается
от равномерного распределения закономерно.
Таблица 12.1.2.2
Вычисление статистики - χ e2
Разряды
nei
nti
nei − nti
(nei − nti )2
a)
b)
c)
Суммы
30
27
9
66
22
22
22
66
8
5
-13
64
25
169
(nei − nti )2
nti
2.90909
1.13636
7.68182
2
χ e =11.72727
Контроль:
1) N = 30 + 27 + 9 = 66;
2) N = 22 + 22 + 22 = 66;
k
3)
∑(n
i =1
ei
− nti ) = 8 + 5 − 13 = 0 .
Сумма последнего столбца совпадает со статистикой χ e2 = 11.72727.
Число степеней свободы равно df = 3 − 1 = 2 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
242
C
помощью
программы
Excel
(CHISQ.DIST.RT)
находим
p-value
для
правостороннего one-tailed теста
p = .003 < .01.
Размер эффекта вычисляется по формуле (12.1.4):
w=
χ2
11.72727
=
= .42
N
66
Размер эффекта w = .42 средний
Ответ. Распределение значений переменной «Восприятие рекламы» пива «ПИТ»
закономерно отличается от равномерного распределения: χ2(2, N = 66) = 11.7, p = .003.
Размер эффекта w = .42 средний.
Решение с помощью SPSS
Для решения данной задачи на SPSS исходные данные должны быть представлены
в виде двух столбцов: «шифр респондента [Code]» и номинальной переменной «Восприятие
[Perception]», для которой должны быть описаны разряды «Раздражение [Irritation]»,
«Безразличие [Disinterest]», «Восторг [Delight]» (Рис.12.1.2.1-12.1.2.2).
Данные должны быть в наличии с самого начала. По ним строится Таблица 12.1.2.1.
Но так как в данной задаче исходных данных нет, то их можно «восстановить»,
сконструировав Таблицу 12.1.2.3, используя данные Таблицы 12.1.2.1. Файл с данными
назовем Beer_PIT_Advertising.xlsx.
Рисунок 12.1.2.1. Описание переменных.
Рисунок 12.1.2.2. Ввод данных.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
243
Таблица 12.1.2.3
Результаты опроса
Code Perception
k1
1
k2
1
k3
1
k4
1
k5
1
k6
1
k7
1
k8
1
k9
1
k10
1
k11
1
k12
1
k13
1
k14
1
k15
1
k16
1
k17
1
k18
1
k19
1
k20
1
k21
1
k22
1
Code Perception
k23
1
k24
1
k25
1
k26
1
k27
1
k28
1
k29
1
k30
1
k31
2
k32
2
k33
2
k34
2
k35
2
k36
2
k37
2
k38
2
k39
2
k40
2
k41
2
k42
2
k43
2
k44
2
Code Perception
k45
2
k46
2
k47
2
k48
2
k49
2
k50
2
k51
2
k52
2
k53
2
k54
2
k55
2
k56
2
k57
2
k58
3
k59
3
k60
3
k61
3
k62
3
k63
3
k64
3
k65
3
k66
3
После ввода данных:
Analyze
Nonparametric Tests
Legacy Dialogs
Chi-Square …
В появившемся диалоговом окне перенести переменную Perception в окно Test
Variable List (Рис.12.1.2.3).
OK
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
244
Рисунок 12.1.2.3. Диалоговое окно теста Chi-Square – сравнение с равномерным
распределением.
Выходная информация:
Таблица 12.1.2.4
Построенная в SPSS таблица результатов опроса с теоретическими частотами и
разностями частот
Perception
Observed N
Irritation
Disinterest
Delight
30
27
9
Total
66
Expected N
Residual
22.0
22.0
22.0
8.0
5.0
-13.0
Таблица 12.1.2.5
Статистики теста χ 2 (Test Statistics)
Test Statistics
Perception
Chi-Square
df
Asymp. Sig.
11.727a
2
.003
a. 0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 22.0.
В верхней строчке - наблюдаемое значение критерия χ e2 = 11.727;
Во второй строке – число степеней свободы df=2;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
245
В третьей строке – р-value, равное .003 < .01, которое говорит о том, что выявлено
отличие от равномерного распределения: χ2(2, N = 66) = 11.7, p = .003.
Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая)
частота в ячейках равна 15, что нет ни одной ячейки с теоретической частотой, меньшей 5.
Результаты совпадают с результатами, полученными вручную.
12.1.3. Пример 2. С поправкой на непрерывность
Из опрошенных N = 101 респондентов: 77 респондентов категорически против
введения смертной казни, а 24 – за. Сравнить распределение ответов с равномерным
распределением.
Решение
В данном примере речь идет о номинальной переменной, которую можно было бы
назвать «Отношение к смертной казни» и которая имеет две категории: «За» и «Против».
Гипотезы:
H 0 : Распределение значений переменной «Отношение к смертной казни» имеет случайное
отличие от равномерного распределения.
H 1 : Распределение значений переменной «Отношение к смертной казни» отличается от
равномерного распределения закономерно.
В нашем случае количество разрядов признака k = 2, имеются лишь две группы
ответов. Поэтому надо учесть „поправку на непрерывность”.
Таблица 12.1.3.1
Вычисление наблюдаемого значения критерия- χ 2
Разряды
nei
n ti
nei − nti
nei − nti − 0.5
a) против
b) за
77
24
50.5
50.5
26.5
26.5
26
26
Суммы
101
101
(n
ei
− nti − 0.5)
2
676
676
(n
ei
− nti − 0.5)
nti
2
13.38614
13.38614
χ e2 =26.77228
В последней строке указаны суммы для контроля. Контроль:
1) N = 77 + 24 =101;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
246
2) N = 50.5 + 50.5 =101.
Сумма последнего столбца совпадает с наблюдаемым значением критерия- χ 2 : с χ e2
=26.77228.
Число степеней свободы равно df = 2 −1 = 1 .
C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста
p = .0000002 < .001.
Нулевая гипотеза отклоняется и принимается альтернативная гипотеза.
Размер эффекта (12.1.4):
w=
χ2
26.77228
=
= .51 .
101
N
Ответ. Распределение значений переменной «Отношение к смертной казни» отличается
от равномерного распределения закономерно. Число респондентов, которые «против»
введения смертной казни превышает число респондентов, которые «за». Распределение
ответов закономерно отличается от равномерного распределения: χ2(1, N = 101) = 26.8, p
< .001. Размер эффекта большой: w = .51 .
Решение с помощью SPSS
Для решения данной задачи на SPSS исходные данные должны быть представлены
в виде двух столбцов: «Code» и номинальной переменной «Отношение [Attitude]», для
которой должны быть описаны разряды «против [against]», «за [for]». Файл с данными
назовем Death_Penalty.xlsx. Ввод данных и заказ теста такие же, как и в Примере 1.
Выходная информация: В результате появляются Таблицы 12.1.3.2 – 12.1.3.3.
В верхней строчке - наблюдаемое значение критерия χ e2 =13.462;
Во второй строке – число степеней свободы df=1;
В третьей строке – р-value, равное .000 <. 001, которая говорит о том, что выявлено
максимально значимое отличие от равномерного распределения.
Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая)
частота в ячейках равна 45.5, что нет ни одной ячейки с теоретической частотой, меньшей
5.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
247
Таблица 12.1.3.2
Построенная в SPSS таблица результатов опроса с теоретическими частотами и
разностями частот
against
for
Total
Observed N
Expected N
Residual
77
24
91
50.5
50.5
26.5
-26.5
Таблица 12.1.3.4
Статистики теста χ 2 (Test Statistics)
Answer
27.812a
1
.000
Chi-Square
df
Asymp. Sig.
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 50.5.
Результаты немного отличаются от результатов, полученных вручную:
χ2(1, N = 101) = 27.8, p < .001.
Программа SPSS не учитывает «поправки на непрерывность».
Размер эффекта (12.1.4):
w=
27.812
= .52 .
101
Размер эффекта большой: w = .52 .
12.2. Связь номинальных переменных: Test of Independence
Для исследования связи между номинальными переменными сравниваются
распределения значений этих переменных по категориям с помощью критерия «Хиквадрат» (Test of Independence). Связь между переменными наблюдается при наличии
закономерного различия в распределениях этих переменных.
Гипотезы
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
248
H 0 : Две номинальные переменные связаны.
H 1 : Две номинальные переменные не связаны.
Пусть номинальная переменная Х имеет k категорий, а номинальная переменная Y
имеет m категорий.
Таблица сопряженности (контингентности)
Значения номинальных переменных, между которыми ищется связь, можно
представить в таблицах сопряженности (контингентности).
Например, в Таблица 12.1.1.1 – таблица контингентности для двух переменных:
«Темперамент» (холерик, сангвинник, флегматик, меланхолик) и «Стратегия поведения в
конфликтной ситуации» (соперничество, избегание, компромисс, приспособление,
сотрудничество). Таблица сконструирована по результатам измерений для случайной
выборки из 400 подростков, сформированной для изучения связи между темпераментом и
стратегиями поведения в конфликтной ситуации.
Число категорий переменной «Темперамент» m = 4, число категорий переменной
«Стратегия поведения в конфликтной ситуации» k = 5.
Таблица 12.2.1
Таблица сопряженности (контингентности)
Темперамент
Холерик
Сангвинник
Флегматик
Меланхолик
Суммы:
Избегание
15
9
15
20
59
Стратегия поведения в конфликтной ситуации
Компромисс Приспособление Сотрудничество Соперничество
16
17
32
18
25
22
34
12
27
20
30
7
25
25
23
8
93
84
119
45
Суммы:
98
102
99
101
400
Таблица контингентности позволяет увидеть соотношения участников с конкретным
темпераментом, выбирающими в конфликтной ситуации конкретную стратегию поведения
– эмпирические частоты neij . Индекс i указывает на номер строки (на категорию
переменной «Темперамент») и меняется от 1 до m = 4, а индекс j указывает на номер
столбца (на категорию переменной «Стратегия поведения в конфликтной ситуации») и
меняется от 1 до k = 5.
Например, количество холериков, выбирающих в конфликтной ситуации стратегию
избегания ne11 = 15 , выбирающих приспособление ne13 = 17 . Количество сангвинников,
выбирающих стратегию сотрудничества ne 24 = 34 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
249
Суммы по строкам и столбцам (по категриям переменных) называются
маргинальными суммами.
Для переменной «Темперамент»:
Количество холериков равно 98, количество сангвинников равно 102, количество
флегматиков равно 99, количество меланхоликов равно 101.
Для переменной «Стратегия поведения в конфликтной ситуации»:
Количество участников исследования, выбирающих в конфликтной ситуации
избегание равно 59, компромисс – 93, приспособление – 84, сотрудничество – 119,
соперничество – 45.
Общее количество наблюдений, представленных в таблице контингентности - это
число в правом нижнем углу, количество участников исследования, равное N = 400.
По таблице контингентности вычисляются ожидаемые (expected) частоты или
теоретические частоты ntij :
ntij =
( Сумма частот строки i ) ⋅ ( Сумма частот столбца j ) .
N
(12.2.1)
Например, количество холериков, выбирающих в конфликтной ситуации стратегию
приспособление ne13 = 17 - это эмпирическая частота, а nt13 =
98 ⋅ 84
= 20.6 ожидаемая или
400
теоретическая частота.
Статистическую значимость различий эмпирических частот и теоретических частот
можно найти с помощью критерия «Хи-квадрат» Пирсона (Pearson's Сhi-Squared test). Связь
между переменными наблюдается при наличии закономерных различий между
эмпирическими частотами neij и теоретическими частотами ntij .
Статистики теста «Хи-квадрат» для Test of Independence
Test of Independence. Если число разрядов признака k>2, то наблюдаемое значение
критерия можно вычислить по формуле:
m
k
χ = ∑∑
2
e
i =1 j =1
(n
eij
− ntij )
ntij
2
,
(12.2.2)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
250
где k – число категорий переменной Y; m – число категорий переменной X; neij эмпирические частоты; ntij - теоретические частоты.
Если число категорий обеих переменных равно m = k = 2, то следует учитывать
«поправку на непрерывность» Йета (Yates’ Correction for Continuity) (Хили, 2005; С.341):
2
2
χ = ∑∑
2
e
(n
eij
− ntij − 0.5
)
2
ntij
i =1 j =1
.
(12.2.3)
Степени свободы для Test of Independence
df = ( k − 1)( m − 1) .
(12.2.4)
Ограничения критерия «Хи-квадрат»:
1. Точность критерия растет с увеличением числа наблюдений N.
2. Каждая теоретическая частота должна быть ntij ≥ 5 .
3. Если число категорий номинальных переменных равно двум, то необходимо
учитывать „поправку на непрерывность” Йета.
4. Если наблюдение относится к конкретной категории, то оно не должно
принадлежать ни к одной другой категории.
Размер эффекта для Test of Independence
Размер эффекта в тесте «Хи-квадрат» для сравнения двух эмпирических
распределений может быть найден как коэффициент Phi (φ) для таблиц контингентности
2х2:
ϕ=
χ 2 (1)
N
,
(12.2.5)
где N – число наблюдений.
Для любых таблиц контингентности размер эффекта w (в SPSS обозначается Phi)
вычисляется по формуле:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
251
w=
χ2
.
N
(12.2.6)
Согласно (Cohen, 1988), значения φ и w, равные .10 – соответствует небольшому
размеру эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта.
Размером
эффекта для
любых
таблиц контингентности также является
коэффициент Cramer’s V1, который находится по формуле:
V=
χ2
,
N ( L − 1)
(12.2.7)
где L равно минимальному из чисел строк, или столбцов в таблице сопряженности.
Например, для Таблицы 12.2.1 размера 4 х 5, L = 4.
Для интерпретации Cramer’s V можно использовать Таблицу 12.2.2.
Для таблицы контингентности размера 4 х 5 будет следующая интерпретация
размера эффекта Cramer’s V:
.06 - небольшой, .17 – средний, .29 – большой.
Таблица 12.2.2
Интерпретация размера эффекта Cramer’s V в зависимости от минимального числа из
числа строк и столбцов (L)
Небольшой
Средний
Большой
размер эффекта
размер эффекта
размер эффекта
1
.10
.30
.50
2
.07
.21
.35
3
.06
.17
.29
4
.05
.15
.25
5
.04
.13
.22
L-1
Примечание. Таблица взята из
http://www.real-statistics.com/chi-square-and-f-distributions/effect-size-chi-square/
1
Chapter 12: Chi-Square tests of independence and goodness-of-fit.
http://geography.unt.edu/~wolverton/ChiSquare.pdf
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
252
Коэффициенты φ, w, V изменяются от 0 до 1. При размере эффекта, равном нулю
переменные не связаны (независимы), при размере эффекта, равном единице, максимально связаны (зависимы).
Размер эффекта для таблиц сопряженности может быть также вычислен как
коэффициент контингентности Пирсона (Pearson’s Contingency Coefficient, C):
C=
χ2
.
N + χ2
(12.2.8)
Максимальный коэффициент контингентности равен:
1 1
Cmax = 4 1 − 1 − < 1 ,
r c
(12.2.9)
где c – число столбцов, r – число строк.
Стандартизованный коэффициент контингентности равен (Tormakangas, 2014)2:
Cst =
С
.
Cmax
(12.2.10)
Коэффициент Pearson’s C изменяются от 0 до Cmax < 1 . При размере эффекта, равном
нулю переменные не связаны (независимы), при размере эффекта, равном Cmax , максимально связаны (зависимы).
Можно считать, что значения Cst , равные .10 – соответствует небольшому размеру
эффекта, .30 – среднему размеру эффекта, .50 – большому размеру эффекта.
12.2.1. Пример 3. Без поправки на непрерывность
Проверить, связан ли выборов фигур с тревожностью.
Исходные данные:
Низкая тревожность
Высокая тревожность
Треугольник
Круг
10
5
72
10
Выбираемые фигуры
Квадрат
Зигзаг
12
11
6
47
Прямоугольник
8
19
2
Tormakangas, T. (2014). Contingency coefficient. Available at http://users.jyu.fi/~tatima/TER/ContCoef.pdf
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
253
Решение
Для решения этой задачи можно выделить две группы участников: с высокой и
низкой тревожностью и с помощью Test of Independence проверить, различаются ли
распределения выборов фигур у участников с высокой и низкой тревожностью случайно
или закономерно. При закономерном различии можно сделать вывод о том, что тревожность
и выбор фигур связаны.
Построим таблицу контингентности (Таблица 12.2.1.1).
Таблица 12.2.1.1
Распределения выборов геометрических фигур старшеклассников и уровней тревожности
Низкая
тревожность
Высокая
тревожность
Суммы
Выбираемые фигуры
Квадрат
Зигзаг
Суммы
Треуголь
ник
Круг
Прямоуголь
1
2
3
4
5
1
10
72
12
6
8
108
2
5
10
11
47
19
92
15
82
23
53
27
N = 200
ник
Число всех наблюдений N = 200.
Количество категорий переменной «Выбор фигур» k = 5 > 2.
Число участников исследования с низкой тревожностью Σ1 =108;
Число участников исследования с высокой тревожностью Σ 2 =92. Контроль: Σ1 + Σ 2
=108+92=200.
Количество категорий переменной «Тревожность» m = 2.
Число выборов по фигурам:
треугольник: 10+5=15; круг: 72+10=82; квадрат: 12+11=23;
зигзаг: 6+47=53; прямоугольник: 8+19=27.
Контроль: 15+82+23+53+27=200.
Эмпирические частоты:
Число выборов в группе с низкой тревожностью:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
254
треугольник: n11 = 10 ; круг: n12 = 72 ; квадрат: n13 = 12 ; зигзаг: n14 = 6 ; прямоугольник:
n15 = 8 . Сумма 10+72+12+6+8=108= Σ1 ;
Число выборов в группе с высокой тревожностью:
треугольник: n21 = 5 ; круг: n22 = 10 ; квадрат: n23 = 11 ; зигзаг: n24 = 47 ; прямоугольник:
n25 = 19 . Сумма 5+10+11+47+19=92= Σ 2 .
80
Коичество выборов
70
60
50
40
30
20
10
Треугольник
Круг
Квадрат
Зигзаг
Прямоугольник
Выбираемые фигуры
Низкая тревожность
Высокая тревожность
Рисунок 12.2.1.1. Диаграмма pаспределения участников с высокой и низкой
тревожностями по выборам фигур, построенная в Excel.
80
Коичество выборов
70
60
50
40
30
20
10
Низкая тревожность
Высокая тревожность
Выбираемые фигуры
Треугольник
Круг
Квадрат
Зигзаг
Прямоугольник
Рисунок 12.2.1.2. Диаграмма распределения выборов фигур между участниками с
высокой и низкой тревожностями, построенная в Excel.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
255
Гипотезы:
H 0 : Выбор фигур и тревожность не связаны.
H 1 : Выбор фигур и тревожность связаны.
С помощью Таблицы 12.2.1.2 можно вычислить теоретические частоты:
ntij =
( Сумма частот строки , i ) ⋅ ( Сумма частот столбца, j ) .
N
(12.2.1.1)
Таблица 12.2.1.2
Вычисление теоретических частот
Ячейка
1-1
1-2
1-3
1-4
1-5
Теоретические частоты
15 ⋅108
nt11 =
= 8.1
200
82 ⋅108
nt12 =
= 44.28
200
23 ⋅108
nt13 =
= 12.42
200
53 ⋅108
nt14 =
= 28.62
200
27 ⋅108
= 14.58
nt15 =
200
Ячейка
Теоретические частоты
15 ⋅ 92
nt 21 =
= 6.9
200
82 ⋅ 92
nt 22 =
= 37.72
200
23 ⋅ 92
nt 23 =
= 10.58
200
53 ⋅ 92
nt 24 =
= 24.38
200
27 ⋅ 92
nt 25 =
= 12.42
200
2-1
2-2
2-3
2-4
2-5
Таблица 12.2.1.3
Вычисление наблюдаемого значения критерия- χ 2
Разряд
nei
nti
nei − nti
(nei − nti )
1-1
1-2
1-3
1-4
1-5
2-1
2-2
2-3
2-4
2-5
10
72
12
6
8
5
10
11
47
19
8.10
44.28
12.42
28.62
14.58
6.90
37.72
10.58
24.38
12.42
1.90
27.72
-0.42
-22.62
-6.58
-1.90
-27.72
0.42
22.62
6.58
3.6100
768.3984
0.1764
511.6644
43.2964
3.6100
768.3984
0.1764
511.6644
43.2964
Суммы
200
200
2
(nei − nti )2
nti
0.446
17.353
0.014
17.878
2.970
0.523
20.371
0.017
20.987
3.486
χ e2 =84.04
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
256
Контроль:
Сумма 2-ого столбца: N = ne11 + ne12 + ne13 + ne14 + ne15 + ne 21 + ne 22 + ne 23 + ne 24 + ne 25 = 200 ;
Сумма 3-его столбца: N = nt11 + nt12 + nt13 + nt14 + nt15 + nt 21 + nt 22 + nt 23 + nt 24 + nt 25 = 200 ;
∑∑ ( n
2
Сумма 4-ого столбца:
5
j =1 i =1
eij
− ntij ) = 0 .
Сумма последнего столбца совпадает со статистикой χ 2 : χ e2 = 84.04.
Число степеней свободы равно df = ( k − 1)( m − 1) = ( 5 − 1)( 2 − 1) = 4 .
C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста
p = .000 < .001.
Нулевая гипотеза отклоняется и принимается альтернативная гипотеза.
Коэффициенты размера эффектов (12.2.5)-(12.2.8):
w=
84.04
= .65 ,
200
V=
84.04
= .65 ,
200 ( 2 − 1)
C=
84.02
= .54
200 + 84.02
Размер эффекта большой.
Ответ. Распределения выборов фигур у участников с высокой и низкой
тревожностью друг от друга отличаются закономерно. χ2(4, N = 200) = 84.0, p < .001. Выбор
фигур связан с тревожностью. Размер эффекта большой: w = V = .65, C = .54.
Решение с помощью SPSS
Для решения данной задачи на SPSS исходные данные должны быть представлены
в виде трех столбцов: «шифр респондента [Code]», номинальной переменной «Тревожность
[Anxiety]», с двумя разрядами «низкая [low]», «высокая [high]», и номинальной переменной
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
257
«Фигура [Figure]» c пятью разрядами «треугольник [triangle]», «круг [circle]», «квадрат
[square]», «зигзаг [zigzag]», «прямоугольник [rectangle]» (Рис.12.2.1.3-12.2.1.4).
Данные должны быть в наличии с самого начала. По ним строится Таблица 12.2.1.1.
Но так как в данной задаче исходных данных нет, то их можно «восстановить»,
сконструировав Таблицу 12.2.1.4, используя данные Таблицы 12.2.1.1. Файл с данными
назовем Anxiety_Figures.xlsx.
Рисунок 12.2.1.3. Описание переменных.
Рисунок 12.2.1.4. Ввод данных.
После ввода данных:
Analyze
Descriptive Statistics
Crosstabs …
В появившемся диалоговом окне Crosstabs перенести переменную Figure в окно
Row(s), а переменную Anxiety - в окно Column(s). Поставить галочку в окошке Display
clustered bar charts (Рис.12.2.1.5).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
258
Таблица 12.2.1.4
Code
Anxiety
Figure
Code
Anxiety
Figure
Code
Anxiety
Figure
Code
Anxiety
Figure
Code
Anxiety
Figure
Результаты опроса
k1
1
1
k41
1
2
k81
1
2
k121
2
2
k161
2
4
k2
1
1
k42
1
2
k82
1
2
k122
2
2
k162
2
4
k3
1
1
k43
1
2
k83
1
3
k123
2
2
k163
2
4
k4
1
1
k44
1
2
k84
1
3
k124
2
3
k164
2
4
k5
1
1
k45
1
2
k85
1
3
k125
2
3
k165
2
4
k6
1
1
k46
1
2
k86
1
3
k126
2
3
k166
2
4
k7
1
1
k47
1
2
k87
1
3
k127
2
3
k167
2
4
k8
1
1
k48
1
2
k88
1
3
k128
2
3
k168
2
4
k9
1
1
k49
1
2
k89
1
3
k129
2
3
k169
2
4
k10
1
1
k50
1
2
k90
1
3
k130
2
3
k170
2
4
k11
1
2
k51
1
2
k91
1
3
k131
2
3
k171
2
4
k12
1
2
k52
1
2
k92
1
3
k132
2
3
k172
2
4
k13
1
2
k53
1
2
k93
1
3
k133
2
3
k173
2
4
k14
1
2
k54
1
2
k94
1
3
k134
2
3
k174
2
4
k15
1
2
k55
1
2
k95
1
4
k135
2
4
k175
2
4
k16
1
2
k56
1
2
k96
1
4
k136
2
4
k176
2
4
k17
1
2
k57
1
2
k97
1
4
k137
2
4
k177
2
4
k18
1
2
k58
1
2
k98
1
4
k138
2
4
k178
2
4
k19
1
2
k59
1
2
k99
1
4
k139
2
4
k179
2
4
k20
1
2
k60
1
2
k100
1
4
k140
2
4
k180
2
4
k21
1
2
k61
1
2
k101
1
5
k141
2
4
k181
2
4
k22
1
2
k62
1
2
k102
1
5
k142
2
4
k182
2
5
k23
1
2
k63
1
2
k103
1
5
k143
2
4
k183
2
5
k24
1
2
k64
1
2
k104
1
5
k144
2
4
k184
2
5
k25
1
2
k65
1
2
k105
1
5
k145
2
4
k185
2
5
k26
1
2
k66
1
2
k106
1
5
k146
2
4
k186
2
5
k27
1
2
k67
1
2
k107
1
5
k147
2
4
k187
2
5
k28
1
2
k68
1
2
k108
1
5
k148
2
4
k188
2
5
k29
1
2
k69
1
2
k109
2
1
k149
2
4
k189
2
5
k30
1
2
k70
1
2
k110
2
1
k150
2
4
k190
2
5
k31
1
2
k71
1
2
k111
2
1
k151
2
4
k191
2
5
k32
1
2
k72
1
2
k112
2
1
k152
2
4
k192
2
5
k33
1
2
k73
1
2
k113
2
1
k153
2
4
k193
2
5
k34
1
2
k74
1
2
k114
2
2
k154
2
4
k194
2
5
k35
1
2
k75
1
2
k115
2
2
k155
2
4
k195
2
5
k36
1
2
k76
1
2
k116
2
2
k156
2
4
k196
2
5
k37
1
2
k77
1
2
k117
2
2
k157
2
4
k197
2
5
k38
1
2
k78
1
2
k118
2
2
k158
2
4
k198
2
5
k39
1
2
k79
1
2
k119
2
2
k159
2
4
k199
2
5
k40
1
2
k80
1
2
k120
2
2
k160
2
4
k200
2
5
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
259
Рисунок 12.2.1.5. Диалоговое окно теста Crosstabs – сравнение двух эмпирических
распределений.
Statistics…
В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окошке
Chi-square (Рис.12.2.1.6).
Рисунок 12.2.1.6. Диалоговое окно теста Crosstabs: Statistics.
Continue
OK
Выходная информация:
Crosstabs
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
260
Таблица 12.2.1.5
Обработанные наблюдения (Case Processing Summary)
Cases
Valid
Figure * Anxiety
Missing
Total
N
Percent
N
Percent
N
Percent
200
100.0%
.0%
200
100.0%
Таблица 12.2.1.6
Построенная в SPSS таблица результатов опроса (Figure * Anxiety Crosstabulation)
Count
Figure
triangle
circle
Total
square
zigzag
rectangle
low
10
72
12
6
8
108
high
5
10
11
47
19
92
15
82
23
53
27
200
Anxiety
Total
Таблица 12.2.1.7
Статистики тестов χ 2 (Chi-Square Tests)
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
a
84.045
93.979
59.902
df
Asymp. Sig. (2-sided)
4
4
1
.000
.000
.000
200
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 6.90.
В верхней строчке (Pearson Chi-Square):
Value- наблюдаемое значение критерия χ e2 = 84.045; число степеней свободы df = 4;
р-value, равное .000 < .001, говорит о том, что распределения отличаются статистически
значимо. Выявлена связь между тревожностью и выбором фигур.
Под таблицей сообщение о том, что минимальная ожидаемая (теоретическая) часота
в ячейках равна 6.90, что нет ни одной ячейки с теоретической частотой, меньшей 5.
Таким образом, принимаем альтернативную гипотезу:
χ2(4, N = 200) = 84.0, p < .001.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
261
Таблица 12.2.1.8
Симметричные меры (Symmetric Measures)
Value
Nominal by Nominal
Approx. Sig.
Phi
.648
.000
Cramer's V
.648
.000
Contingency Coefficient
.544
.000
N of Valid Cases
200
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Из Таблицы 12.2.1.8 находим размеры эффектов:
w = φ = V = .65, p < .001,
C = .54, p < .001.
Размеры эффектов совпадают с размерами эффектов, рассчитанными вручную.
Графические иллюстрации, полученные в SPSS (Рис.12.2.1.7-12.2.1.8). Рисунки
отредактированы в SPSS.
Рисунок 12.2.1.7. Распределения участников с высокой и низкой тревожностями по
выборам фигур, построенная в SPSS.
Рисунок 12.2.1.8. Распределения выборов фигур между участниками с высокой и низкой
тревожностями, построенная в SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
262
Диаграмма распределения участников с высокой и низкой тревожностями по
выборам фигур (Рис.12.2.1.7) получается автоматически по заказу - галочка в окне Display
clustered bar charts (Рис.12.2.1.5).
Для получения диаграммы распределения выборов фигур испытуемыми с высокой
и низкой тревожностями (Рис.12.2.1.8) в диалоговом окне Crosstabs переменную Anxiety
надо перенести в окно Row(s), а переменную Figure - в окно Column(s) (Рис.12.2.1.5).
Результаты совпадают с результатами, полученными вручную.
12.2.2. Пример 4. С поправкой на непрерывность
Было опрошено N = 250 участников с низким и высоким уровнями интеллекта (IQ).
Им были предложены два вида рекламы: абстрактная и образная. Результаты опроса
представлены в Таблице 12.2.2.1. Сравнить распределения выборов рекламы у участников
с низким IQ и высоким IQ. Найти размер эффекта.
Таблица 12.2.2.1
Распределения выборов рекламы
Низкий IQ
Высокий IQ
Суммы
1
2
Реклама
Абстрактная Образная
1
2
12
82
93
63
105
145
Суммы
94
156
n=250
Число всех наблюдений N = 250.
Количество категорий номинальной переменной «IQ» k = 2.
Количество участников исследования с низким IQ: 94; количество участников
исследования с высоким IQ: 156. Контроль: 94+156=250.
Количество категорий номинальной переменной «Реклама» m = 2.
Количество участников исследования, которые предпочитают абстрактную рекламу:
105; количество участников исследования которые предпочитают образную
рекламу: 145. Контроль: 105+145=250.
Эмпирические частоты:
Количество выборов абстрактной рекламы участниками с низким IQ: ne11 = 12 ;
Количество выборов абстрактной рекламы участниками с высоким IQ: ne 21 = 93 ;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
263
Количество выборов образной рекламы участниками с низким IQ: ne12 = 82 ;
Количество выборов образной рекламы участниками с высоким IQ: ne 22 = 63 ;
Kонтроль: 12 + 93 + 82 + 63 = 250.
Гипотезы:
H 0 : Распределения выборов рекламы у участников с высоким IQ и низким IQ имеют
случайные отличия друг от друга.
H 1 : Распределения выборов рекламы у участников с высоким IQ и низким IQ друг от друга
отличаются закономерно.
С помощью Таблицы 12.2.2.2 можно вычислить теоретические частоты:
nti =
( Сумма частот строки ) ⋅ ( Сумма частот столбца ) .
n
Таблица 12.2.2.2
Вычисление теоретических частот
Ячейки
1-1
1-2
Теоретические частоты
105 ⋅ 94
nt11 =
= 39.48
250
145 ⋅ 94
nt12 =
= 54.52
250
Ячейки
2-1
Теоретические частоты
105 ⋅156
nt 21 =
= 65.52
250
145 ⋅156
nt 22 =
= 90.48
250
2-2
Количество категорий обеих номинальных переменных k = m = 2. Поэтому надо
учесть „поправку на непрерывность”.
Таблица 12.2.2.3
Вычисление наблюдаемого значения критерия- χ 2
Разряды
nei
nti
nei − nti
nei − nti − 0.5
1-1
1-2
2-1
2-2
Суммы
12
82
93
63
39.48
54.52
65.52
90.48
27.48
27.48
27.48
27.48
26.98
26.98
26.98
26.98
250
250
(n
− nti − 0.5)
2
ei
727.9204
727.9204
727.9204
727.9204
(n
ei
− nti − 0.5)
nti
2
18.438
13.351
11.110
8.045
2
χ e =50.94
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
264
В последней строке Таблицы 12.2.2.3 указаны суммы для контроля.
Контроль:
1) Сумма 2-ого столбца: N = ne11 + ne12 + ne 21 + ne22 = 12 + 82 + 93 + 63 = 250 ;
2) Сумма 3-ого столбца: N = nt11 + nt12 + nt 21 + nt 22 = 39.48 + 54.52 + 65.52 + 90.48 = 250 .
Сумма последнего столбца совпадает с наблюдаемым значением критерия- χ 2 :
χ e2 = 50.94 .
Число степеней свободы равно df = ( k − 1)( m − 1) = ( 2 − 1)( 2 − 1) = 1 .
C помощью программы Excel (CHISQ.DIST.RT) находим для правостороннего onetailed теста
p = .000 < .001.
Нулевая гипотеза отклоняется и принимается альтернативная гипотеза.
Размеры эффекта (12.2.5)-(12.2.8):
ϕ=
50.94
= .45 ,
250
V=
50.94
= .45 ,
250 ( 2 − 1)
C=
50.94
= .41 .
( 250 + 50.94)
Размер эффекта для φ и С средний (.1 – небольшой размер эффекта, .3 – средний размер
эффекта, .5 – большой размер эффекта). Размер эффекта для V определяется по Таблице
12.2.2.
Ответ. Распределения выборов рекламы у участников с высоким IQ и низким IQ друг от
друга отличаются закономерно. χ2(1, N = 250) = 50.9, p < .001. Выбор рекламы связан с IQ.
Размер эффекта средний: φ = V= .45, С = .41 .
Решение с помощью SPSS
Для решения данной задачи на SPSS исходные данные должны быть представлены
в виде трех столбцов: «шифр респондента [Code]», номинальной переменной «IQ [IQ]», с
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
265
двумя разрядами «low [1]», «high [2]» и номинальной переменной «Advertisement [AD]» c
двумя разрядами «abstraсt [1]», «imaginative [2]» (Рис.12.2.2.1-12.2.2.2).
Рисунок 12.2.1.1. Описание переменных.
Рисунок 12.2.2.2. Ввод данных.
Данные можно «восстановить», используя данные Таблицы 12.2.2.1, по аналогии с
Примером 3. Файл с данными назовем Advertisement_IQ.xlsx.
После ввода данных:
Analyze
Descriptive Statistics
Crosstabs …
В появившемся диалоговом окне Crosstabs перенести переменную IQ [IQ] в окно
Row(s), а переменную Advertisement [AD] - в окно Column(s). Поставить галочку в окошке
Display clustered bar charts.
Statistics…
В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окошке
Chi-square,
поставить галочку в окошке Phi and Cramer’s V
поставить галочку в окошке Сontingency
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
266
Continue
OK
Выходная информация:
Crosstabs
Таблица 12.2.2.4
Обработанные наблюдения (Case Processing Summary)
Cases
Valid
N
IQ * Advertisement
Missing
Percent
250
N
100.0%
Total
Percent
N
0.0%
Percent
250
100.0%
Таблица 12.2.2.5
Построенная в SPSS таблица результатов опроса (IQ * Advertisement Crosstabulation)
Count
Advertisement
abstract
IQ
Total
imaginative
low
12
82
94
high
93
105
63
145
156
250
Total
Таблица 12.2.2.6
Статистики тестов χ 2 (Chi-Square Tests)
Pearson Chi-Square
Continuity Correctionb
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value
df
Asymp. Sig.
(2-sided)
52.850a
50.944
57.890
1
1
1
.000
.000
.000
52.638
1
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
.000
.000
.000
250
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 39.48.
b. Computed only for a 2x2 table
В верхней строчке (Pearson Chi-Square):
Value- наблюдаемое значение критерия χ e2 = 52.850; число степеней свободы df = 1;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
267
р-вероятность, равная .000 < .001, которая говорит о том, что распределения отличаются
статистически значимо.
В следующей строчке (Continuity Correction - поправка на непрерывность Yate):
Value- наблюдаемое значение критерия χ e2 = 50.944; число степеней свободы df = 1;
р-вероятность, равная .000 < .001, которая говорит о том, что распределения выборов
рекламы отличаются статистически значимо.
Под таблицей находится сообщение о том, что минимальная ожидаемая
(теоретическая) частота в ячейках равна 39.48, что нет ни одной ячейки с теоретической
частотой, меньшей 5.
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная
гипотеза. Выявлена связь между IQ и выбором рекламы: χ2(1, N = 250) = 50.9, p < .001.
Таблица 12.2.2.7
Симметричные меры (Symmetric Measures)
Value
Phi
Nominal by Nominal
Approx. Sig.
-.460
.000
Cramer's V
.460
.000
Contingency Coefficient
.418
.000
N of Valid Cases
250
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Из Таблицы 12.2.2.7 находим размеры эффектов:
w = φ = V = .46, p < .001,
C = .42, p < .001.
Размеры эффектов немного завышенные по сравнению с размерами эффектов,
рассчитанными вручную. Это происходит вследствие того, что при их вычислении SPSS не
учитывает поправку Yate.
Графические иллюстрации, полученные в SPSS (Рис. 12.2.2.3-12.2.2.4). Рисунки
отредактированы в SPSS.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
268
Диаграмма распределения участников с высоким и низким IQ по выборам рекламы
(Рис. 12.2.2.3) получается строится автоматически по заказу - галочка в окошке Display
clustered bar charts.
Для получения диаграммы распределения выборов рекламы испытуемыми с высоким и
низким IQ (Рис. 12.2.2.4) в диалоговом окне Crosstabs переменную IQ [IQ] надо перенести в
окно Row(s), а переменную Advertisement [AD] - в окно Column(s).
Рисунок 12.2.2.3. Распределения
участников с высоким и низким IQ по
выборам рекламы.
Рисунок 12.2.2.4. Распределения выборов
рекламы испытуемыми с высоким и
низким IQ.
Результаты совпадают с результатами, полученными вручную, с помощью Excel.
13. Исследование выборов терминальных ценностей (ТЦ) по М.
Рокичу
Терминальными ценностями по М.Рокичу являются следующие 18 ценностей:
t1 активная, деятельная жизнь;
жизненная мудрость (зрелость суждений и здравый смысл, достигаемые
t2 жизненным опытом);
t3 здоровье (физическое и психическое здоровье);
t4 интересная работа;
t5 красота природы и искусства
t6 любовь (духовная и физическая близость)
t7 материально обеспеченная жизнь (отсутствие материальных затруднений)
t8 наличие хороших и верных друзей;
t9 общественное признание
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
269
познание (возможность расширения своего образования, кругозора, общей
t10 культуры, интеллектуальное развитие);
t11 продуктивная жизнь;
t12 развитие;
t13 развлечения;
t14 свобода;
t15 счастливая семейная жизнь;
t16 счастье других;
t17 творчество;
t18 уверенность в себе
Исследовалось, какие именно ценности предпочитают люди переживающие
одиночество (выборка G1, 30 участников) и не переживающие одиночество (выборка G2,
30 участников). Исходные данные представлены в файле Data_Chi_Rokich.xlsx.
Участникам было предложено проранжировать ценности по отношению их
важности для себя. Ранг 1 соответствовал наиболее важной ценности, а ранг 18 – наименее
важной.
Для решения данной задачи на SPSS исходные данные должны быть представлены
в виде 20 столбцов: «шифр участника [Code]», номинальной переменной «Group [gr]», с
двумя разрядами «G1 [1]», «G2 [2]» и порядковыми переменными t1, t2, …, t18 (Рис.13.1).
Рисунок 13.1. Описание переменных. Фрагмент.
Рисунок 13.2. Ввод данных. Фрагмент.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
270
Если разбить группу из 18 рангов на квартили, то точные значения квартилей
(Наследов, 2004; с.43) - Q1=4.75 и Q3=14.25. Значения рангов, меньших, чем 5, будет
составлять группу наиболее важных ценностей. Значения рангов от 5 до 14 составляют
группу ценностей средней важности, а значения рангов, больших, чем 14, будет составлять
группу наименее важных ценностей.
Сравнивались распределения ценностей, имеющих ранги от одного до четырех
(первая квартильная группа – наиболее важные ценности) в выборках G1 и G2.
Статистическая значимость полученных результатов проверялась с помощью критерия
«Хи-квадрат» Пирсона.
Analyze
Descriptive Statistics
Frequencies…
Рисунок 13.3. Заказ частотных таблиц
OK
С помощью полученных частотных таблиц были составлены Таблицы 13.1-13.2.
Распределение ценностей по первым четырем рангам представлены Таблицами 13.313.4.
Таблицы 13.3-13.4 объединены в Таблицу 13.5.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
271
Таблица 13.1
Распределения терминальных ценностей в выборке переживающих одиночество G1
t10 t11 t12 t13 t14 t15 t16 t17 t18
Суммы
G1
t1
t2
t3
t4
t5
t6
t7
t8
t9
1
1
2
1
8
5
4
1
1
1
6
1
31
2
3
3
3
5
2
5
2
2
3
1
4
33
3
2
1
2
1
5
2
3
2
2
1
1
3
1
1
27
4
1
5
2
2
2
1
5
1
1
2
2
5
3
32
5
1
3
1
1
2
3
2
3
1
1
3
1
2
3
2
29
6
1
2
2
1
1
2
2
2
8
2
2
2
1
3
31
7
4
3
1
1
1
2
2
2
3
4
2
2
1
28
8
3
1
2
3
1
2
2
1
4
2
4
2
2
1
1
5
36
9
5
3
2
1
1
2
2
1
3
3
2
1
3
29
10
4
2
1
2
3
2
2
2
4
1
2
1
26
11
1
3
2
1
1
2
1
2
6
4
1
1
3
1
3
32
12
3
2
1
1
1
3
1
3
3
1
3
1
1
1
1
26
13
2
2
5
1
1
1
5
2
3
1
2
3
3
31
14
7
6
1
2
1
2
4
1
8
2
1
2
37
15
1
3
1
3
1
2
2
2
1
2
1
2
2
1
24
16
2
1
1
6
1
2
2
5
6
4
30
17
1
8
2
1
8
3
2
5
6
36
18
2
1
2
2
5
10
22
Суммы
30
30
30 30
30
30
30
30
30
30
30 30 30
30
30
30
30 30
540
Таблица 13.2
Распределения терминальных ценностей в выборке непереживающих одиночество G2
t10 t11 t12 t13 t14 t15 t16 t17 t18
Суммы
G2
t1
t2
t3
t4
t5
t6
t7
t8
t9
1
8
2
5
1
1
6
1
2
1
2
1
30
2
2
6
8
2
2
2
1
1
1
1
1
1
2
30
3
8
3
6
3
3
1
1
1
2
3
31
4
5
4
2
2
8
2
2
1
2
1
1
30
5
1
1
3
3
3
1
1
1
3
1
1
3
3
1
5
31
6
3
1
1
4
2
2
4
3
1
4
3
1
3
32
7
4
3
1
5
3
3
4
1
2
1
3
30
8
1
1
2
1
4
1
2
1
5
3
1
1
5
2
30
9
1
4
3
3
3
3
2
1
1
5
1
1
2
30
10
1
1
3
1
2
1
1
2
2
7
1
3
2
2
29
11
1
1
1
1
1
1
8
1
5
3
2
3
1
29
12
1
1
1
1
1
1
3
4
2
4
2
3
2
1
4
31
13
3
3
4
2
4
3
1
3
6
1
2
32
14
1
4
1
3
6
4
1
2
3
1
1
1
28
15
1
5
1
8
1
1
1
1
2
2
4
3
5
1
1
37
16
1
2
1
7
1
1
3
2
3
5
1
27
17
1
1
3
2
3
6
9
25
18
3
1
1
1
3
5
14
28
Суммы
30
30
30 30
30
30
30
30
30
30
30 30 30
30
30
30
30 30
540
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
272
Таблица 13.3
Распределения терминальных ценностей, попавших на 1-4 место в выборке
переживающих одиночество G1
t10 t11 t12 t13 t14 t15 t16 t17 t18
Суммы
G1
t1
t2
t3
t4
t5
t6
t7
t8
t9
1
1
2
1
8
5
4
1
1
1
6
1
31
2
3
3
3
5
2
5
2
2
3
1
4
33
3
2
1
2
1
5
2
3
2
2
1
1
3
1
1
27
4
1
5
2
2
2
1
5
1
1
2
2
5
3
32
Суммы
6
5
12
3
3
20
10
17
3
3
2
4
1
6
17
1
1
9
123
Таблица 13.4
Распределения терминальных ценностей, попавших на 1-4 место, в выборке
непереживающих одиночество G2
t10 t11 t12 t13 t14 t15 t16 t17 t18
Суммы
G2
t1
t2
t3
t4
t5
t6
t7
t8
t9
1
8
2
5
1
1
6
1
2
1
2
1
30
2
2
6
8
2
2
2
1
1
1
1
1
1
2
30
3
8
3
6
3
3
1
1
1
2
3
31
4
5
4
2
2
8
2
2
1
2
1
1
30
Суммы
23
2
13 21
1
3
13
14
4
1
3
4
1
4
4
2
2
6
121
Таблица 13.5.
Распределения терминальных ценностей по М. Рокичу, попавших на 1-4 место, в
выборках людей, субъективно переживающих одиночество (G1) и
непереживающих одиночество (G2)
t1
t2
t3
t4
t5
t6
t7
t8
t9
G1
6
5
12
3
3
20
10
17
3
t10 t11 t12 t13 t14 t15 t16 t17 t18
3
2
4
1
G2
23
2
13 21
1
3
13
14
4
1
3
4
1
Суммы
29
7
25 24
4
23
23
31
7
4
5
8
2
6
Суммы
9
123
2
6
121
3
15
244
17
1
1
4
4
2
10
21
3
По Таблице 13.5 составим файл данных TermValues.sav.
Данные должны быть представлены в виде двух столбцов: номинальной переменной
«Group», с двумя разрядами «G1 [1]», «G2 [2]» и номинальной переменной «Terminal Values
[TV]» c 18 разрядами «t1 [1]», «t1 [2]» (Рис.13.4).
Данные для SPSS приведены в Таблице 13.6.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
273
Таблица 13.6
Выбираемые на 1-4 место терминальные ценности
Nr
Gr
TV
Nr
Gr
TV
Nr
Gr
TV
Nr
Gr
TV
Nr
Gr
TV
Nr
Gr
TV
1
1
1
42
1
6
83
1
11
124
2
1
165
2
4
206
2
8
2
1
1
43
1
6
84
1
11
125
2
1
166
2
4
207
2
8
3
1
1
44
1
6
85
1
12
126
2
1
167
2
4
208
2
8
4
1
1
45
1
6
86
1
12
127
2
1
168
2
4
209
2
8
5
1
1
46
1
6
87
1
12
128
2
1
169
2
4
210
2
8
6
1
1
47
1
6
88
1
12
129
2
1
170
2
4
211
2
8
7
1
2
48
1
6
89
1
13
130
2
1
171
2
4
212
2
8
8
1
2
49
1
6
90
1
14
131
2
1
172
2
4
213
2
8
9
1
2
50
1
7
91
1
14
132
2
1
173
2
4
214
2
9
10
1
2
51
1
7
92
1
14
133
2
1
174
2
4
215
2
9
11
1
2
52
1
7
93
1
14
134
2
1
175
2
4
216
2
9
12
1
3
53
1
7
94
1
14
135
2
1
176
2
4
217
2
9
13
1
3
54
1
7
95
1
14
136
2
1
177
2
4
218
2
10
14
1
3
55
1
7
96
1
15
137
2
1
178
2
4
219
2
11
15
1
3
56
1
7
97
1
15
138
2
1
179
2
4
220
2
11
16
1
3
57
1
7
98
1
15
139
2
1
180
2
4
221
2
11
17
1
3
58
1
7
99
1
15
140
2
1
181
2
4
222
2
12
18
1
3
59
1
7
100
1
15
141
2
1
182
2
4
223
2
12
19
1
3
60
1
8
101
1
15
142
2
1
183
2
5
224
2
12
20
1
3
61
1
8
102
1
15
143
2
1
184
2
6
225
2
12
21
1
3
62
1
8
103
1
15
144
2
1
185
2
6
226
2
13
22
1
3
63
1
8
104
1
15
145
2
1
186
2
6
227
2
14
23
1
3
64
1
8
105
1
15
146
2
1
187
2
7
228
2
14
24
1
4
65
1
8
106
1
15
147
2
2
188
2
7
229
2
14
25
1
4
66
1
8
107
1
15
148
2
2
189
2
7
230
2
14
26
1
4
67
1
8
108
1
15
149
2
3
190
2
7
231
2
15
27
1
5
68
1
8
109
1
15
150
2
3
191
2
7
232
2
15
28
1
5
69
1
8
110
1
15
151
2
3
192
2
7
233
2
15
29
1
5
70
1
8
111
1
15
152
2
3
193
2
7
234
2
15
30
1
6
71
1
8
112
1
15
153
2
3
194
2
7
235
2
16
31
1
6
72
1
8
113
1
16
154
2
3
195
2
7
236
2
16
32
1
6
73
1
8
114
1
17
155
2
3
196
2
7
237
2
17
33
1
6
74
1
8
115
1
18
156
2
3
197
2
7
238
2
17
34
1
6
75
1
8
116
1
18
157
2
3
198
2
7
239
2
18
35
1
6
76
1
8
117
1
18
158
2
3
199
2
7
240
2
18
36
1
6
77
1
9
118
1
18
159
2
3
200
2
8
241
2
18
37
1
6
78
1
9
119
1
18
160
2
3
201
2
8
242
2
18
38
1
6
79
1
9
120
1
18
161
2
3
202
2
8
243
2
18
39
1
6
80
1
10
121
1
18
162
2
4
203
2
8
244
2
18
40
1
6
81
1
10
122
2
18
163
2
4
204
2
8
41
1
6
82
1
10
123
2
18
164
2
4
205
2
8
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
274
Рисунок 13.4. Описание переменных.
Рисунок 13.5. Ввод данных. Фрагмент.
Данные можно «восстановить», сконструировав Таблицу 13.5, используя данные
Таблицы 13.6.
Сравнение двух эмпирических распределений с равномерным
распределением
Гипотезы:
1-ая группа
H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, переживающих одиночество, отличается от равномерного распределения
случайно.
H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, переживающих одиночество, отличается от равномерного распределения
закономерно.
2-ая группа
H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, непереживающих одиночество, отличается от равномерного распределения
случайно.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
275
H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, непереживающих одиночество, отличается от равномерного распределения
закономерно.
Data
Split file…
Рисунок 13.6. Создание выхода по группам.
ОК
Analyze
Nonparametric Tests
Legacy Dialogs
Chi-Square …
В появившемся диалоговом окне перенести переменную Terminal Values [TV] в окно Test
Variable List.
ОК
Выходная информация:
Таблица 13.7
Статистики теста χ 2 (Test Statistics). Группа G1
TC
Chi-Square
df
Asymp. Sig.
91.281a
17
.000
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 6.7.
b. Group = G1
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
276
Таблица 13.8
Построенная в SPSS таблица результатов опроса с теоретическими частотами и
разностями частот. Группа G1
Observed N
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10
t11
t12
t13
t14
t15
t16
t17
t18
Total
Expected N
6
5
12
3
3
20
10
17
3
3
2
4
1
6
17
1
1
7
121
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
6.7
Residual
-.7
-1.7
5.3
-3.7
-3.7
13.3
3.3
10.3
-3.7
-3.7
-4.7
-2.7
-5.7
-.7
10.3
-5.7
-5.7
.3
a. Group = G1
В Таблице 13.7 р = .000 <. 001, говорит о том, что распределение терминальных ценностей,
выдвигаемых на первые четыре места, у участников, переживающих одиночество,
максимально значимо (то есть на уровне значимости α = .001) отличается от равномерного
распределения:
χ2(17, N = 121) = 91.3, p < .001.
Размер эффекта (12.1.3) равен: w =
91.281
= .87 большой.
121
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
277
Таблица 13.9
Построенная в SPSS таблица результатов опроса с теоретическими частотами и
разностями частот. Группа G2
Observed N
t1
t2
t3
t4
t5
t6
t7
t8
t9
t10
t11
t12
t13
t14
t15
t16
t17
t18
Total
Expected N
23
2
13
21
1
3
13
14
4
1
3
4
1
4
4
2
2
8
123
Residual
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
6.8
16.2
-4.8
6.2
14.2
-5.8
-3.8
6.2
7.2
-2.8
-5.8
-3.8
-2.8
-5.8
-2.8
-2.8
-4.8
-4.8
1.2
a. Group = G2
Таблица 13.10
Статистики теста χ 2 (Test Statistics). Группа G2
TC
Chi-Square
df
Asymp. Sig.
120.659a
17
.000
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 6.8.
b. Group = G1
р = .000<.001, говорит о том, что распределение терминальных ценностей, выдвигаемых на
первые четыре места, у участников, непереживающих одиночество, максимально значимо
отличается от равномерного распределения:
χ2(17, N = 123) = 120, p < .001.
Размер эффекта (12.1.3) равен: w =
120.659
= .99 большой.
123
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
278
Сравнение двух эмпирических распределений
Гипотезы:
H 0 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, переживающих одиночество и у участников, непереживающих одиночество,
имеют случайные отличия друг от друга.
H 1 : Распределение терминальных ценностей, выдвигаемых на первые четыре места, у
участников, переживающих одиночество и у участников, непереживающих одиночество,
отличаются друг от друга закономерно.
Data
Split file…
Reset
OK
Analyze
Descriptive Statistics
Crosstabs …
В появившемся диалоговом окне Crosstabs перенести переменную Terminal Values
[TV] в окно Row(s), а переменную Group - в окно Column(s). Поставить галочку в окошке
Display clustered bar charts.
Statistics…
В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в оконах Chisquare, , Contingency Coefficient, Phi and Cramer’s V.
Continue
OK
Выходная информация:
Crosstabs
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
279
Таблица 13.11
Построенная в SPSS таблица результатов опроса (TC * Group Crosstabulation)
Count
Group
G1
TC
G2
Total
t1
6
23
29
t2
5
2
7
t3
12
13
25
t4
3
21
24
t5
3
1
4
t6
20
3
23
t7
10
13
23
t8
17
14
31
t9
3
4
7
t10
3
1
4
t11
2
3
5
t12
4
4
8
t13
1
1
2
t14
6
4
10
t15
17
4
21
t16
1
2
3
t17
1
2
3
t18
7
121
8
123
15
244
Total
Таблица 13.12
Статистики тестов χ 2 (Chi-Square Tests)
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
49.549a
54.176
7.309
244
df
Asymp. Sig. (2-sided)
17
17
1
.000
.000
.007
a. 19 cells (52.8%) have expected count less than 5. The minimum expected count is .99.
р-value, равное .000 <. 001, говорит о том, что распределения отличаются
статистически значимо: χ2(17, N = 244) = 49.6, p < .001.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
280
Таблица 13.13
Симметричные меры (Symmetric Measures)
Value
Nominal by Nominal
Approx. Sig.
Phi
.451
.000
Cramer's V
.451
.000
Contingency Coefficient
.411
.000
N of Valid Cases
244
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Размер эффекта (12.2.5)-(12.2.8) средний. Коэффициенты равны: w = V = .45 , p <
.001, C = .41, p < .001.
Выявлена связь между переживанием одиночества и выбором терминальных
ценностей.
Графические
иллюстрации,
полученные
в
SPSS
(Рис.13.7-13.8).
Рисунки
отредактированы в SPSS.
Для получения диаграммы (Рис.13.8) в диалоговом окне Crosstabs переменную Group
надо перенести в окно Row(s), а переменную Terminal Values [TV] - в окно Column(s).
Рисунок 13.7. Распределения участников переживающих одиночество (Группа 1) и
непереживающих одиночество (Группа 2) по выборам терминальных ценностей.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
281
Рисунок 13.8. Распределения выборов терминальных ценностей испытуемыми
переживающих одиночество (Группа 1) и непереживающих одиночество (Группа 2).
Так как распределения отличаются статистически значимо, то можно просто описать
рисунки.
Наиболее выраженными ценностями можно считать ценности, количество выборов
которых превышает 3-ий квартиль. Если рассмотреть все выборы, то это будет: Q3 = 11.5.
Значимые терминальные ценности у непереживающих одиночество (из Таблиц 14.5
или 14.11): t1, t3, t4, t7, t8. Это:
§
активная, деятельная жизнь;
§
здоровье (физическое и психическое здоровье);
§
интересная работа;
§
материально обеспеченная жизнь (отсутствие материальных затруднений);
§
наличие хороших и верных друзей.
Значимые ценности у переживающих одиночество: t3, t6, t8, t15. Это:
§
здоровье (физическое и психическое здоровье);
§
любовь (духовная и физическая близость);
§
наличие хороших и верных друзей;
§
счастливая семейная жизнь.
Таким образом, выбор терминальных
ценностей связан с переживанием
одиночества.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
282
14. Частотный анализ. Тест «Угловое преобразования Фишера φ*»
ϕ ∗ - угловое преобразование Фишера (Fisher's angular transformation). Применение теста
Фишера ϕ ∗ позволяет решать задачи, в которых можно перейти к сравнению долей или
процентов, с их последующим сравнением. Поэтому эмпирические данные могут быть
представлены в любой шкале, выборки могут быть как зависимыми, так и независимыми.
Критерий Фишера ϕ ∗ предназначен для сравнения двух выборок по частоте
встречаемости исследуемого эффекта и основан на сравнении долей. Доли могут также
быть выражены в процентах.
Ограничения: pi ≠ 0 , где через pi обозначены доли участников с исследуемым
эффектом в группе i.
Алгоритм применения критерия- ϕ ∗
Даны две выборки участников: 1 и 2. Объемы выборок n1 и n 2 .
Количество участников в выборке 1, у которых присутствует изучаемый эффект равно ne1
и доля этих участников равна p1 =
n e1
n
, или в процентах: p1 = e1 ⋅ 100% .
n1
n1
Аналогично, количество участников в выборке 2, у которых присутствует
изучаемый эффект равно ne2 и доля этих участников равна p 2 =
p2 =
ne 2
, или в процентах:
n2
ne 2
⋅ 100%
n2
Гипотезы:
H 0 : Доли участников, у которых проявляется исследуемый эффект в выборках 1 и 2 имеют
случайные отличия.
H 1 : Доли участников, у которых проявляется исследуемый эффект в выборках 1 и 2 имеют
закономерные отличия.
Вычислить ϕ1 и ϕ 2 по формуле:
ϕ = 2 ⋅ arcsin
( p ),
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
(14.1)
283
в которой p выражено в долях единицы: 0 < p ≤ 1 .
Вычислить наблюдаемое значение критерия ϕe∗ по формуле (Сидоренко, 2000) 3:
ϕe∗ = ϕ 2 − ϕ1 ⋅
n1n2
,
n1 + n2
(14.2)
n1 и n 2 - объемы выборок.
Способ 1. Исследование значимости различий с помощью критических точек
Критические точки φα (α - уровень значимости) для двухсторонней критической
области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны:
φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 .
Если φ∗e < 1.96, то различие долей не найдено: нет основания отклонить нулевую
гипотезу.
Нулевая
гипотеза
отклоняется
на
уровне
значимости
α
и
принимается
альтернативная гипотеза при φ∗e ≥ 1.96.
Если 1.96 ≤ φ∗e < 2.58, то различие статистически значимо на уровне значимости α = .05.
Если 2.58 ≤ φ∗e < 3.29, то различие статистически значимо на уровне значимости α = .01.
Если φ∗e ≥ 3.29, то различие статистически значимо на уровне значимости α = .001.
Способ 2. Исследование значимости различий с помощью p - value
Открываем программу Excel (п.7.7).
Для стандартизованного нормального распределения one-tailed p-value:
= 1 – NORM.S.DIST(number,TRUE)
ENTER
3
Tests for Two Proportions using Effect Size. In PASS Sample Size Software. Chapter 199. Pp. 1-2. NCSS, LLC.
Available at https://ncss-wpengine.netdna-ssl.com/wpcontent/themes/ncss/pdf/Procedures/PASS/Tests_for_Two_Proportions_using_Effect_Size.pdf
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
284
Это площадь под нормальной кривой справа от точки «number», то есть это one-tailed pvalue. Для нахождения two-tailed p-value, вычисленное значение one-tailed p-value надо
умножить на два:
two-tailed p-value = 2* one-tailed p-value
Замечание. Процесс вычисления ϕe∗ -статистики может быть организован в Excel (Смотрите
файл Fisher's_angular_transformation.xlsx).
Программирование формул:
1) ϕ = 2 ⋅ arcsin
( p)
=2*ASIN(SQRT(номер ячейки, где стоит р, вычисленное в долях единицы))
2) φ∗e = φ 2 − φ1 ⋅
n1n2
n1 + n2
=ABS( φ2 − φ1 )*SQRT( n1n2 /( n1 + n2 ))
где вместо φ2 , φ1 , n1 , n2 стоят номера их ячеек.
Размер эффекта Коуэна h для различий долей (ненаправленный) (Cohen, 1988, p.181)4:
h = ϕ1 − ϕ2 .
(14.3)
Принята классификация размеров эффекта: 0.2 - небольшой, 0.5 - средний, 0.8 – большой.
Пример 1
В ходе исследования установлено, что в конфликтной ситуации избегание, как
стратегию поведения, выбирают 83.7% взрослых (из 43 участников) с заниженной
самооценкой и 32.4% взрослых (из 37 участников) с адекватной самооценкой. Проверить,
является ли полученное различие статистически значимым? Использовать тест «Угловое
преобразование Фишера». Рассмотреть два варианта исследования статистической
значимости: с помощью критических точек и с помощью р-value. Найти размер эффекта.
4
Ramsay, R.F. (2010). Generating Cohen’s effect size “h” via/arcsin/arcsine transformations.
https://people.ucalgary.ca/~ramsay/cohen-effect-size-h-arcsin-transformation.htm.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
285
Решение
Даны две выборки участников: 1 (с адекватной самооценкой) и 2 (с заниженной
самооценкой). Объемы выборок n1 =37 и n2 =43.
Доля участников в выборке 1, которые выбирают избегание, как стратегию
поведения в конфликтной ситуации, равна p1 =32.4%;
Доля участников в выборке 2, которые выбирают избегание, как стратегию
поведения в конфликтной ситуации, равна p2 =83.7%.
Гипотезы:
H 0 : Доля участников с адекватной самооценкой, выбирающих избегание, как
стратегию поведения в конфликтной ситуации имеет случайное отличие, от доли
участников с заниженной самооценкой, выбирающих избегание.
H 1 : Доля участников с адекватной самооценкой, выбирающих избегание, как
стратегию поведения в конфликтной ситуации имеет закономерное отличие, от доли
участников с заниженной самооценкой, выбирающих избегание.
Находим:
(
)
(
)
φ1 = 2 ⋅ arcsin .324 = 1.211; φ2 = 2 ⋅ arcsin .837 = 2.310.
Вычисляем наблюдаемое значение критерия φ∗e :
φ∗e = ( 2.310 − 1.211) ⋅
37 ⋅ 43
= 4.90 .
37 + 43
Способ 1. Исследование значимости различий с помощью критических точек
Критические точки φα (α - уровень значимости) для двухсторонней критической
области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны:
φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 .
Нулевая
гипотеза
отклоняется
на
уровне
значимости
α
и
принимается
альтернативная гипотеза так как φ∗e = 4.90 ≥ 1.96.
φ∗e = 4.90 ≥ 3.29, поэтому различие статистически значимо на уровне значимости α = .001.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
286
Способ 2. Исследование значимости различий с помощью p - value
p-value находим с помощью программы Excel (п.7.7).
В результате получаем:
two-tailed value = p = 9.58367e-007 = .000000958367 < .001.
Оба способа проверки статистической значимости привели к одному и тому же
результату.
Размер эффекта Коуэна h для различий отношений (ненаправленный) равен (14.3):
h = 1.211 − 2.310 = 1.10 .
Ответ. Доля взрослых участников с адекватной самооценкой, выбирающих
избегание, как стратегию поведения в конфликтной ситуации ниже, чем доля участников
с заниженной самооценкой, выбирающих избегание ( φ∗e =4.90;
p < .001 , two-tailed).
Взрослые люди с заниженной самооценкой в конфликтной ситуации, как правило, в
качестве стратегии поведения выбирают избегание, для людей с адекватной самооценкой
не характерно выбирать именно эту стратегию поведения. Результат является
закономерным и не может быть объяснен случайными причинами. Выбор стратегии
поведения в конфликтной ситуации связан с самооценкой. Найти размер эффекта. Размер
эффекта Коуэна h =1.10 большой.
Пример 2.
В ходе исследования установлено, что из 35 молодых участников с высоким
социометрическим статусом (СС) высокий уровень субъективного контроля (УСК)
имеют 22 участника, а из 45 участников с низким социометрическим статусом высокий
уровень субъективного контроля лишь у 4. Проверить гипотезу: «Девушки и юноши с
высоким социометрическим статусом имеют интернальный (т.е. высокий) локус
контроля» Использовать тест «Угловое преобразование Фишера». Рассмотреть два
варианта исследования статистической значимости: с помощью критических точек и с
помощью р-value. Найти размер эффекта.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
287
Решение
Даны две выборки участников: 1 (с высоким СС) и 2 (с низким СС). Объемы выборок
n1 =35 и n 2 =45.
Количество участников с высоким СС, у которых высокий УСК, равно ne1 =22 и доля
таких участников равняется p1 =
22
= .6286 или p1 = 62.86% .
35
Количество участников с низким СС, у которых высокий УСК, равно ne2 =4 и доля
таких участников равняется p2 =
4
= .0889 или p2 = 8.89% .
45
При этом p1 > p2 .
Гипотезы:
H 0 : Доля участников с высоким социометрическим статусом, у которых высокий
уровень субъективного контроля, и доля участников с низким социометрическим статусом,
у которых высокий уровень субъективного контроля имеют случайное отличие.
H 1 : Доля участников с высоким социометрическим статусом, у которых высокий
уровень субъективного контроля, и доля участников с низким социометрическим статусом,
у которых высокий уровень субъективного контроля имеют закономерное отличие.
Находим:
(
)
(
)
φ1 = 2 ⋅ arcsin .6286 = 1.83; φ2 = 2 ⋅ arcsin .0889 = 0.61.
Вычисляем наблюдаемое значение критерия ϕe∗ :
φ∗e = (1.83 − 0.61) ⋅
35 ⋅ 45
= 5.44 .
35 + 45
Способ 1. Исследование значимости различий с помощью критических точек
Критические точки ϕα (α - уровень значимости) для двухсторонней критической
области (стандартизованное нормальное Z-распределение: μ = 0, σ = 1) - равны:
φ.05 = 1.96 ; φ.01 = 2.58 и φ.001 = 3.29 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
288
Нулевая
гипотеза
отклоняется
на
уровне
значимости
α
и
принимается
альтернативная гипотеза так как φ∗e = 5.44 ≥ 1.96.
φ∗e =5.44 ≥ 3.29, поэтому различие статистически значимо на уровне значимости α = .001.
Способ 2. Исследование значимости различий с помощью p - value
p-value находим с помощью программы Excel (п.8.7).
Для стандартизованного нормального распределения one-tailed p-value:
= 1 – NORM.S.DIST(ABS(number), TRUE)
В результате получаем:
two-tailed value = p = 5.32806e-008 = .0000000532806 < .001.
Оба способа проверки статистической значимости привели к одному и тому же
результату.
Размер эффекта Коуэна h для различий отношений (ненаправленный) равен:
h = 1.83 − 0.61 = 1.22 .
Ответ. Доля участников с высоким социометрическим статусом, у которых
высокий уровень субъективного контроля, выше, чем доля участников с низким
социометрическим статусом, у которых высокий уровень субъективного контроля ( φ∗e
=5.44;
p < .001 ). Результат является закономерным и не может быть объяснен
случайными причинами. Размер эффекта Коуэна h =1.22 большой.
Домашнее задание 2
Выполнить задания, которые находятся в файле
Home_Work_2_Chi_Square_Variants.pdf.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
289
15. Частотный анализ для примера исследования связи между
самооценкой и агрессией
Продолжим исследование связи между самооценкой и агрессией у подростков, которое
было начато в параграфе 11.
Переход к низким, к высоким и к средним показателям
Переход к низким, высоким и средним показателям правильнее всего осуществлять
с помощью методик измерения. Если, по каким-либо причинам в методике нормы не
указаны, или неясно, насколько методика адаптирована, то можно осуществлять разбивку
по выборочным данным.
Если
распределение
выборочных
данных
не
соответствует
нормальному
распределению, то разбивка данных на три группы может осуществляться с помощью
квартилей Q1 и Q3 . Если оценки по самооценке выше Q3 , то их называют «высокими»
(“augsts”). Если они находятся в интервале от Q1 до Q3 , то они считаются для самооценки
«адекватными» (“adekvāts”) и для других переменных «средними» (“vidējs”). Если ниже Q1
, то оценки «низкие» (“zems”) (Таблица 15.1).
Из Таблицы 15.1 находим, квартили Q1 и Q3 по всем переменным (берем их из
Таблицы 11.2.1.1).
Таблица 11.1
and Distrust
2.00
4.50
2.00
Q3
71.58
8.00
7.00
7.00
4.00
5.00
5.00
7.00
5.00
Guilt
2.00
Aggression
2.00
Verbal
Resentment
4.00
Suspicion
Negativism
2.00
Aggression
3.00
Indirect
52.91
Aggression
Q1
Physical
Irritation
Self-Esteem
Квартили Q1 и Q3
Разбиение данных осуществляется автоматически, с помощью программы Syntax.
Откроем файл Samoocenka_Agresija.sav
Откроем новое окно синтакса:
File
New
Syntax
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
290
и напишем в нем следующий текст программы:
if (SE<=52.91) SE_ind=1 .
if (SE>52.91 & SE<71.58 ) SE_ind=2 .
if (SE>=71.58) SE_ind=3 .
variable labels SE_ind 'Self-Esteem'.
value labels SE_ind 1 'Low'
2 'Medium'
3 'High'.
if (PhA<=3) PhA_ind=1 .
if (PhA>3 & PhA<8 ) PhA_ind=2 .
if (PhA>=8) PhA_ind=3 .
variable labels PhA_ind 'Physical Aggression'.
value labels PhA_ind 1 'Low'
2 'Medium'
3 'High'.
if (IA<=2) IA_ind=1 .
if (IA>2 & IA<7 ) IA_ind=2 .
if (IA>=7) IA_ind=3 .
variable labels IA_ind 'Indirect Aggression'.
value labels IA_ind 1 'Low'
2 'Medium'
3 'High'.
if (I<=4) I_ind=1 .
if (I>4 & I<7 ) I_ind=2 .
if (I>=7) I_ind=3 .
variable labels I_ind 'Irritation '.
value labels I_ind 1 'Low'
2 'Medium'
3 'High'.
if (N<=2) N_ind=1 .
if (N>2 & N<4 ) N_ind=2 .
if (N>=4) N_ind=3 .
variable labels N_ind 'Negativism'.
value labels N_ind 1 'Low'
2 'Medium'
3 'High'.
if (R<=2) R_ind=1 .
if (R>2 & R<5 ) R_ind=2 .
if (R>=5) R_ind=3 .
variable labels R_ind 'Resentment'.
value labels R_ind 1 'Low'
2 'Medium'
3 'High'.
if (S<=2) S_ind=1 .
if (S>2 & S<5 ) S_ind=2 .
if (S>=5) S_ind=3 .
variable labels S_ind 'Suspicion and Distrust'.
value labels S_ind 1 'Low'
2 'Medium'
3 'High'.
if (VA<=4.5) VA_ind=1 .
if (VA>4.5 & VA<7 ) VA_ind=2 .
if (VA>=7) VA_ind=3 .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
291
variable labels VA_ind 'Verbal Aggression'.
value labels VA_ind 1 'Low'
2 'Medium'
3 'High'.
if (G<=2) G_ind=1 .
if (G>2 & G<5 ) G_ind=2 .
if (G>=5) G_ind=3 .
variable labels G_ind 'Guilt'.
value labels G_ind 1 'Low'
2 'Medium'
3 'High'.
execute.
Сохраним файл под именем Q_of SyntaxSA.SPS (Рис.15.1).
Рисунок 15.1. Переход к низким, средним и высоким показателям.
Для того, чтобы программа выполнила необходимые действия необходимо
ВЫДЕЛИТЬ ВЕСЬ ТЕКСТ (Edit – Select All) и нажать «треугольник» (пуск), All
(Рис.15.2).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
292
Рисунок 15.2. Запуск программы.
После выполнения всех выше перечисленных действий в наш исходный файл SelfEsteem_Aggression.sav автоматически будут добавлены столбцы данных. Появятся новые
переменные. Останется только поставить число знаков после запятой (Decimals) равным
нулю и выбрать Nominal Measure (Рис.15.3).
Рисунок 15.3. Новые переменные
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
293
Рисунок 15.4. Новые данные
Analyze
Descriptive Statistics
Crosstabs …
В появившемся диалоговом окне Crosstabs перенести переменную SE[SE_ind] в окно
Row(s), а переменную Physical Aggression[PhA_ind] - в окно Column(s). Поставить галочку
в окне Display clustered bar charts (Рис.15.5).
Рисунок 15.5. Диалоговое окно теста Crosstabs – сравнение двух эмпирических
распределений
Statistics…
В появившемся диалоговом окне Crosstabs: Statistics поставить галочку в окне Chisquare (Рис.15.6).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
294
Рисунок 15.6. Диалоговое окно теста Crosstabs: Statistics
Continue
OK
Выходные данные:
«Самооценка – Физическая агрессия»
Таблица 15.2
Обработанные наблюдения
Cases
Valid
N
Self-Esteem * Physical Aggression
Missing
Percent
145
N
Total
Percent
100.0%
.0%
N
Percent
145
100.0%
Таблица 15.3
Self-Esteem * Physical Aggression Crosstabulation
Count
Physical Aggression
Low
Self-Esteem
Total
Low
Medium
High
Total
4
9
23
36
Medium
36
36
1
73
High
3
43
11
56
22
46
36
145
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
295
Таблица 15.4
Chi-Square Tests
Value
df
Asymp. Sig. (2-sided)
66.447a
4
.000
80.532
4
.000
Linear-by-Linear Association
.000
1
1.000
N of Valid Cases
145
Pearson Chi-Square
Likelihood Ratio
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.68.
Таблица 15.5
Cимметричные меры (Symmetric Measures)
Value
Nominal by Nominal
Approx. Sig.
Phi
.677
.000
Cramer's V
.479
.000
Contingency Coefficient
.561
.000
N of Valid Cases
145
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
При
помощи
критерия
«Хи-квадрат» проверена
выявлена
связь
между
переменными «Самооценка» и «Физическая агрессия» (Бююль & Цефель, 2002): χ2(4, N =
145) = 66.5, p < .001.
Размер эффекта (12.2.5)-(12.2.8) большой. Коэффициенты равны: w = .68 , p < .001; V
= .48, p < .001; C = .56, p < .001.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .35 размер эффекта считается большим.
Из полученных Таблицы 15.3 и диаграммы (Рис.15.7) видно, что
1) Среди подростков с низкой самооценкой больше всего подростков с высокой
физической агрессией;
2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и
средней физической агрессией;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
296
3) Среди подростков с высокой самооценкой больше всего подростков с высокой
физической агрессией.
Поменяв местами (Рис.15.5) переменные «Самооценка (Self-Esteem [SE_ind])» и
«Физическая агрессия («Physical Aggression [PhA_ind])», можно получить другую
диаграмму, относящуюся к той же таблице сопряженности (Рис.15.8).
Рисунок 15.7. Распределение участников с высокой, средней и низкой физической
агрессией по самооценке.
Рисунок 15.8. Распределение участников с высокой, адекватной и низкой самооценкой по
физической агрессии.
Из диаграммы (Рис.15.8) видно, что
1) Среди подростков с низкой физической агрессией больше всего подростков с
адекватной самооценкой;
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
297
2) Среди подростков со средней физической агрессией больше всего подростков с
адекватной самооценкой;
3) Среди подростков с высокой физической агрессией больше всего подростков с
высокими и низкими самооценками.
Аналогичным способом можно получить таблицы (Таблицы 15.6 – 15.26) и
диаграммы (отредактированные Рис.15.9 – 15.22) для остальных переменных.
«Самооценка – Косвенная агрессия»
Таблица 15.6
Self-Esteem * Indirect Aggression Crosstabulation
Count
Indirect Aggression
Low
Self-Esteem
Medium
Low
High
Total
3
11
22
36
Medium
34
38
1
73
High
2
39
13
62
21
44
36
145
Total
Таблица 15.7
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
65.040a
79.219
.000
145
Asymp. Sig. (2-sided)
.000
4
4
1
.000
1.000
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.68.
Таблица 15.8
Cимметричные меры (Symmetric Measures)
Nominal by Nominal
N of Valid Cases
Phi
Cramer's V
Contingency Coefficient
Value
.670
.474
.556
145
Approx. Sig.
.000
.000
.000
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Максимально значимая связь: χ2(4, N = 145) = 65.0, p < .001.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
298
Размер эффекта (12.2.5)-(12.2.8) большой. Коэффициенты равны: w = .67 , p < .001; V
= .47, p < .001; C = .56, p < .001.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .35 размер эффекта считается большим.
Рисунок 15.9. Распределение участников с
высокой, средней и низкой косвенной
агрессией по самооценке
Рисунок 15.10. Распределение участников
с высокой, адекватной и низкой
самооценкой по косвенной агрессии
«Самооценка – Раздражение»
Таблица 15.9
Self-Esteem * Irritation Crosstabulation
Count
Irritation
Low
Self-Esteem
Medium
Low
High
Total
3
4
29
36
Medium
34
37
2
73
High
5
42
12
53
19
50
36
145
Total
Таблица 15.10
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
73.384a
85.181
3.146
145
df
Asymp. Sig. (2-sided)
4
4
1
.000
.000
.076
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.43.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
299
Максимально значимая связь: χ2(4, N = 145) = 73.4, p < .001.
Таблица 15.11
Cимметричные меры (Symmetric Measures)
Nominal by Nominal
Value
.711
.503
.580
145
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Approx. Sig.
.000
.000
.000
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Размер эффекта (12.2.5)-(12.2.8) большой.
Коэффициенты равны: w = .71, p < .001; V = .50, p < .001; C = .58, p < .001.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .35 размер эффекта считается большим.
Рисунок 15.11. Распределение участников
с высоким, средним и низким
раздражением по самооценке
Рисунок 15.12. Распределение участников с
высокой, адекватной и низкой самооценкой
по раздражению
«Самооценка – Негативизм»
Таблица 15.12
Self-Esteem * Negativism Crosstabulation
Count
Negativism
Low
Self-Esteem
Total
Medium
High
Total
Low
17
12
7
36
Medium
28
16
29
73
High
17
62
9
37
10
46
36
145
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
300
Таблица 15.13
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
5.264a
5.382
.169
145
Asymp. Sig. (2-sided)
4
4
1
.261
.250
.681
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.19.
Таблица 15.14
Cимметричные меры (Symmetric Measures)
Nominal by Nominal
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Value
.191
.135
.187
145
Approx. Sig.
.261
.261
.261
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Связь не выявлена: χ2(4, N = 145) = 5.26, p = .26, ns.
Размер эффекта (12.2.5)-(12.2.8) небольшой.
Коэффициенты равны: w = .19, p = .26; V = .14, p = .26; C = .19, p = .26.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .07 размер эффекта считается небольшим.
Рисунок 15.13. Распределение участников с
высоким, средним и низким негативизмом
по самооценке
Рисунок 15.14. Распределение участников
с высокой, адекватной и низкой
самооценкой по негативизму
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
301
«Самооценка – Обида»
Таблица 15.15
Self-Esteem * Resentment Crosstabulation
Count
Resentment
Low
Self-Esteem
Medium
High
Total
Low
18
13
5
36
Medium
18
30
25
73
High
12
48
14
57
10
40
36
145
Total
Таблица 15.16
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
8.456a
8.654
2.764
145
Asymp. Sig. (2-sided)
4
4
1
.076
.070
.096
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
9.93.
Таблица 15.17
Cимметричные меры (Symmetric Measures)
Symmetric Measures
Nominal by Nominal
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Value
.241
.171
.235
145
Approx. Sig.
.076
.076
.076
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Связь не выявлена: χ2(4, N = 145) = 8.46, p = .076, ns. Имеется тенденция к связи.
Размер эффекта (12.2.5)-(12.2.8) небольшой.
Коэффициенты равны: w = .24, p = .076; V = .17, p = .076; C = .24, p = .076.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .07 размер эффекта считается небольшим.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
302
Рисунок 15.16. Распределение участников
с высокой, адекватной и низкой
самооценкой по обиде
Рисунок 15.15. Распределение участников
с высокой, средней и низкой обидой по
самооценке
«Самооценка – Подозрительность»
Таблица 15.18
Self-Esteem * Suspicion and Distrust Crosstabulation
Count
Suspicion and Distrust
Low
Self-Esteem
Medium
High
Total
Low
17
11
8
36
Medium
23
24
26
73
High
7
47
13
48
16
50
36
145
Total
Таблица 15.19
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
7.125a
7.276
6.685
145
df
Asymp. Sig. (2-sided)
4
4
1
.129
.122
.010
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
11.67.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
303
Таблица 15.20
Cимметричные меры (Symmetric Measures)
Symmetric Measures
Nominal by Nominal
Value
.222
.157
.216
145
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Approx. Sig.
.129
.129
.129
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Связь не выявлена: χ2(4, N = 145) = 7.13, p = .13, ns.
Размер эффекта (12.2.5)-(12.2.8) небольшой.
Коэффициенты равны: w = .22, p = .13; V = .16, p = .13; C = .22, p = .13.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .07 размер эффекта считается небольшим.
Рисунок 15.17. Распределение участников
с высокой, средней и низкой
подозрительностью по самооценке
Рисунок 15.18. Распределение участников с
высокой, адекватной и низкой самооценкой
по подозрительности
«Самооценка – Вербальная агрессия»
Таблица 15.21
Self-Esteem * Verbal Aggression Crosstabulation
Count
Verbal Aggression
Low
Self-Esteem
Total
Low
Medium
High
Total
4
8
24
36
Medium
31
38
4
73
High
1
36
18
64
17
45
36
145
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
304
Таблица 15.22
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
57.289a
65.614
.398
145
Asymp. Sig. (2-sided)
.000
4
4
1
.000
.528
a. 0 cells (.0%) have expected count less than 5. The minimum expected count
is 8.94.
Таблица 15.23
Cимметричные меры (Symmetric Measures)
Symmetric Measures
Nominal by Nominal
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Value
.629
.444
.532
145
Approx. Sig.
.000
.000
.000
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Максимально значимая связь: χ2(4, N = 145) = 57.3, p < .001.
Размер эффекта (15.2.5)-(15.2.8) большой.
Коэффициенты равны: w = .63, p < .001; V = .44, p < .001; C = .53, p < .001.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .35 размер эффекта считается большим.
Рисунок 15.19. Распределение участников
с высокой, средней и низкой вербальной
агрессией по самооценке
Рисунок 15.20. Распределение участников
с высокой, адекватной и низкой
самооценкой по вербальной агрессии
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
305
«Самооценка – Чувство вины»
Таблица 15.24
Self-Esteem * Guilt Crosstabulation
Count
Guilt
Low
Self-Esteem
Medium
High
Total
Low
13
8
15
36
Medium
18
17
38
73
High
13
44
9
34
14
67
36
145
Total
Таблица 15.25
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
2.746a
2.762
.019
145
Asymp. Sig. (2-sided)
4
4
1
.601
.598
.891
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
8.44.
Таблица 15.26
Cимметричные меры (Symmetric Measures)
Nominal by Nominal
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Value
.138
.097
.136
145
Approx. Sig.
.601
.601
.601
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Связь не выявлена: χ2(4, N = 145) = 2.75, p = .601, ns.
Размер эффекта (12.2.5)-(12.2.8) небольшой.
Коэффициенты равны: w = .14, p = .60; V = .10, p = .60; C = .14, p = .60.
Замечание. Согласно Таблице 12.2.2, для таблиц сопряженности размера 3х3 при Cramer’s
V > .07 размер эффекта считается небольшим.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
306
Рисунок 15.21. Распределение участников
с высокой, средней и низкой «чувством
вины» по самооценке
Рисунок 15.22. Распределение участников
с высокой, адекватной и низкой
самооценкой по «чувством вины»
Очевидно, что различий в распределениях, а, следовательно, и связи между
переменными нет.
Хотя статистически значимых результатов не выявлено, ситуацию, на уровне
выборки, можно описать так:
1) Среди подростков с низкой самооценкой больше всего подростков с высоким и
низким уровнем чувства вины;
2) Среди подростков с адекватной самооценкой больше всего подростков с высоким
уровнем чувства вины;
3) Среди подростков с высокой самооценкой больше всего подростков с высоким и
низким уровнями чувства вины;
4) Среди подростков с низким уровнем чувством вины больше всего подростков с
адекватной самооценкой;
5) Среди подростков с адекватным уровнем чувства вины больше всего подростков
с адекватной самооценкой;
6) Среди подростков с высоким уровнем чувства вины больше всего подростков с
адекватной самооценкой.
Для уточнения можно сравнить процентные доли участников в разных категориях с
помощью теста Фишера φ∗ .
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
307
Исследование связи путем сравнения процентных долей с помощью
∗
критерия Фишера φ
Перенесем в Excel таблицы сопряженности (например, 15.3 (СамооценкаФизическая агрессия) и 15.17 (Чувство вины)).
Сравним столбики по высоте внутри каждой группы. Для этого организуем в Excel
таблицу 15.19 (См. файл Fisher_angular_transformation_2T.xlsx, которую можно
продолжать, можно в нее записывать другие исходные данные).
Все формулы во второй строке таблицы программируются следующим образом.
ki - число из соответствующей ячейки таблицы сопряженности;
ni - объем соответствующей группы;
pi =
ki
⋅ 100% = ki / ni *100
ni
pi
ϕi = 2 ⋅ arcsin
= 2*asin(sqrt( pi /100))
100
ϕ ∗ = ϕ 2 − ϕ1
n1 n2
=abs( ϕ2 - ϕ1 )*sqrt( n1 * n2 /( n1 + n2 ))
n1 + n2
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
308
Таблица 15.27
Исследование различий процентных долей (Самооценка – SE; Физическая агрессия – PhA;
Чувство вины – G). Размер эффекта h (0.2 - небольшой, 0.5 - средний, 0.8 – большой)
1
High PhA
Medium PhA
Low PhA
High SE
Medium SE
Low SE
High G
Medium G
Low G
High SE
Medium SE
Low SE
2
k1
k2
n1
n2
p1
p2
ϕ1
ϕ2
ϕ∗
h
p
High SE
Medium SE
22
1
46
46
47.8
2.2
1.53
0.30
5.91
1.23
.000
High SE
Low SE
22
23
46
46
47.8
50.0
1.53
1.57
0.21
0.04
.84
Medium SE
Low SE
1
23
46
46
2.2
50.0
0.30
1.57
6.11
1.27
.000
High SE
Medium SE
11
36
56
56
19.6
64.3
0.92
1.86
4.99
0.94
.000
High SE
Low SE
11
9
56
56
19.6
16.1
0.92
0.82
0.49
0.09
.62
Medium SE
Low SE
36
9
56
56
64.3
16.1
1.86
0.82
5.48
1.04
.000
High SE
Medium SE
3
36
43
43
7.0
83.7
0.53
2.31
8.24
1.78
.000
High SE
Low SE
3
4
43
43
7.0
9.3
0.53
0.62
0.40
0.09
.69
Medium SE
Low SE
36
4
43
43
83.7
9.3
2.31
0.62
7.84
1.69
.000
High PhA
Medium PhA
22
11
36
36
61.1
30.6
1.79
1.17
2.65
0.62
.008
High PHA
Low PhA
22
3
36
36
61.1
8.3
1.79
0.59
5.13
1.21
.000
Medium PhA
High PhA
Low PhA
Medium PhA
11
1
3
36
36
73
36
73
30.6
1.4
8.3
49.3
1.17
0.23
0.59
1.56
2.48
7.99
0.59
1.32
.013
.000
High PhA
Low PhA
1
36
73
73
1.4
49.3
0.23
1.56
7.99
1.32
.000
Medium PhA
Low PhA
36
36
73
73
49.3
49.3
1.56
1.56
0.00
0.00
1.00
High PHA
Medium PHA
23
9
36
36
63.9
25.0
1.85
1.05
3.42
0.81
.001
High PHA
Low PHA
23
4
36
36
63.9
11.1
1.85
0.68
4.97
1.17
.000
Medium PHA
Low PHA
9
4
36
36
25.0
11.1
1.05
0.68
1.56
0.37
.12
High SE
Medium SE
12
38
67
67
17.9
56.7
0.87
1.71
4.81
0.83
.000
High SE
Low SE
14
15
67
67
20.9
22.4
0.95
0.99
0.21
0.04
.83
Medium SE
Low SE
38
15
67
67
56.7
22.4
1.71
0.99
4.17
0.72
.000
High SE
Medium SE
9
17
34
34
26.5
50.0
1.08
1.57
2.02
0.49
.043
High SE
Low SE
9
8
34
34
26.5
23.5
1.08
1.01
0.28
0.07
.78
Medium SE
Low SE
17
8
34
34
50.0
23.5
1.57
1.01
2.30
0.56
.021
High SE
Medium SE
13
18
44
44
29.5
40.9
1.15
1.39
1.12
0.24
.26
High SE
Low SE
13
13
44
44
29.5
29.5
1.15
1.15
0.00
0.00
1.00
Medium SE
Low SE
18
13
44
44
40.9
29.5
1.39
1.15
1.12
0.24
.26
High G
Medium G
14
9
36
36
38.9
25.0
1.35
1.05
1.27
0.30
.20
High G
Low G
14
13
36
36
38.9
36.1
1.35
1.29
0.24
0.06
.81
Medium G
Low G
9
13
36
36
25.0
36.1
1.05
1.29
1.03
0.24
.30
High G
Medium G
38
17
73
73
52.1
23.3
1.61
1.01
3.65
0.60
.000
High G
Low G
38
18
73
73
52.1
24.7
1.61
1.04
3.46
0.57
.001
Medium G
Low G
17
18
73
73
23.3
24.7
1.01
1.04
0.19
0.03
.85
High G
Medium G
15
8
36
36
41.7
22.2
1.40
0.98
1.79
0.42
.074
High G
Low G
15
13
36
36
41.7
36.1
1.40
1.29
0.48
0.11
.63
Medium G
Low G
8
13
36
36
22.2
36.1
0.98
1.29
1.30
0.31
.19
Замечание: Two-tailed Z-test.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
309
Некоторые выводы:
«Самооценка - Физическая агрессия»
1) Среди подростков с высокой физической агрессией в одинаковой степени
большие доли составляют подростки с высокой и низкой самооценками ( ϕ ∗ = 5.91, р<.001,
ϕ ∗ = 6.11, р<.001). Размеры эффектов большие: h = 1.23 и h = 1.27 соответственно.
2) Среди подростков со средней и низкой физическими агрессиями преобладает доля
подростков с адекватной самооценкой (р<.001). Размеры эффектов большие: h = 0.94 и h =
1.04, h = 1.78 и h = 1.69 соответственно.
3) Среди подростков с высокой самооценкой большую долю составляют подростки
с высокой физической агрессией, затем со средней физической агрессией ( ϕ ∗ = 2.65, р <
.001, размер эффекта h = 0.62 средний) затем с низкой физической агрессией ( ϕ ∗ = 2.48, р <
.001, размер эффекта h = 0.59 средний).
4) Среди подростков с адекватной самооценкой большую долю составляют
подростки со средней и низкой физической агрессией (р<.001, h = 1.32). Размер эффекта
большой.
5) Среди подростков с низкой самооценкой большую долю составляют подростки с
высокой физической агрессией, затем со средней физической агрессией ( ϕ ∗ = 3.42, р < .001,
размер эффекта h = 0.81 большой) затем с низкой физической агрессией ( ϕ ∗ = 1.56, р > .05,
ns, размер эффекта h = 0.37 небольшой).
«Самооценка- чувство вины»
1) Среди подростков с высоким чувством вины большую долю составляют
подростки с адекватной самооценкой (р<.001);
2) Среди подростков со средним чувством вины большую долю составляют
подростки с адекватной самооценкой (р<.05);
3) Среди подростков с низким чувством вины, доли подростков с высокой, средней
и адекватной самооценками различаются статистически незначимо;
4) Среди подростков с высокой самооценкой доли подростков с высоким, средним и
низким чувством вины различаются статистически незначимо.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
310
Домашнее задание 3
Провести исследование связи между самооценкой подростков, измеренной по
методике Дембо-Рубинштейна и агрессией, измеренной по методике Басса-Дарки.
Варианты данных находятся в файле
Samoocenka-Agressija_Varianti_(1-16).xlsx.
Результаты оформить по образцу Приложения 4.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
311
Литература
Основная:
Field, A. (2009). Discovering statistics using SPSS (3rd Edition). Los Angeles, London, New
Delhi, Singapore, Washington DC: Sage.
Available at http://fac.ksu.edu.sa/sites/default/files/ktb_lktrwny_shml_fy_lhs.pdf
Блюменау,
Н.Ф.
(2019).
Компьютерная
обработка
данных
психологического
исследования. Конспект лекций. Рига: БМА, «Moodle».
Наследов А. (2013) IBM SPSS Statistics 20 и AMOS: профессиональньй статистический
анализ данных. СПб.: Питер.
Дополнительная:
Aron, A., Coups, E.J., & Aron, E. (2013). Statistics for psychology. Sixth edition. Upper Sadle
River, NJ: Pearson Education.
Coolican, H. (2014). Research methods and statistics in psychology. Sixth edition. London and
New York: Psychology Press. Available in BIA “Moodle”.
Cramer, D. (1997). Basic Statistics for Social Research. Routledge.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ:
Lawrence Earlbaum Associates.
D’Agostino, R. B., & Stephens, M. A. (1986). Goodness-of-Fit Techniques. New York: Marcel
Dekker, Inc.
Ellis, P.D. (2010). The essential guide to effect sizes. Statistical power, meta-analysis, and the
interpretation of research results. Cambridge: University Press.
Heiman, G.W. (2011). Basic Statistics for the behavioural sciences. Sixth edition. Wadsworth:
Cengage Learning. Available in BIA “Moodle”.
Howell, D.С. (2010). Statistical methods for psychology. Seventh edition. Wadsworth: Cengage
Learning. Available in BIA “Moodle”.
Howell, D.С. (1999). Fundamental Statistics for Behavioural Sciences. USA: Duxbury Press.
http://www.psych.utoronto.ca/courses/c1/statstoc.htm.
312
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018
Howitt, D., & Cramer D. (2011). Introduction to statistics in psychology. Fifth edition. Harlow,
England, London and Associated Companies throughout the world: Pearson Prentice Hall.
Available in BIA library. Available at https://epdf.pub/queue/introduction-to-statistics-inpsychology-5th-editionb14c72a74e215cccb2c491108c1752ac82858.html.
Johnson, R.A., & Kam-Wah Tsui (1998). Statistical reasoning and methods. USA: J.Wiley& Sons,
Inc. Available in BIA library.
Krastiņš, O. (1998). Statistika un ekonometrija. Rīga: LR CSP. Available in BIA library
Langdridge, D. (2004). Introduction to Research Methods and Data Analysis in Psychology.
Edinburg Gate, Harlow, Essex CM20 2J.E., England London: Pearson Prentice Hall and
Associated Companies throughout the world. Available in BIA library.
Lasmanis A. (2002) Datu ieguves, apstrādes un analīzes metodes pedagoģijas un psiholoģijas
pētījumos. 1. grāmata. Rīga: “Izglītības soļi”.
Lasmanis A. (2002) Datu ieguves, apstrādes un analīzes metodes pedagoģijas un psiholoģijas
pētījumos. 2. grāmata. Rīga: “Izglītības soļi”.
Moriarty, D.J. (2015). Test for Normality. In BIO 2011 Biometrics Lab Statistical Tests. Stat Cat
version 3.7.1. California State Polytechnic University, Pomona. Retrieved from
https://www.cpp.edu/~djmoriarty/b211/index.html.
Raščevska, M., & Kristapsone, S. (2000). Statistika psiholoģijas pētījumos. Rīga: SIA
„Izglītības soļi”.
Stevens, S.S. (1946). On the theory of Scales of Measurement. Science, 103(2684), 677-680.
Retrieved in http://science.sciencemag.org/content/103/2684/677
Zaiontz, C. (2018). Real statistics using Excel. Available at http://www.real-statistics.com/.
Бартышев, А.В. (2005). Тестирование: Основной инструментарий практического
психолога. М.: Дело.
Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. СПб.:
ООО «ДиаСофтЮП». (Доступен в Интернете электронный учебник)
Гласс, Дж., Стенли, Дж. (1976). Статистические методы в педагогике и в психологии.
Москва: Прогресс. Available in BIA library and at https://www.studmed.ru/glass-dzhstenli-dzh-statisticheskie-metody-v-pedagogike-i-psihologii_b68abaad535.html.
313
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018
Ложников А. (2010). Исследование самооценки по методике Дембо - Рубинштейн.
http://newgoal.ru/issledovanie-samoocenki-po-metodike-dembo-rubinshtejn/
Наследов, А.Д. (2004). Математические методы психологического исследования. Анализ и
интерпретация данных. СПб.: Речь.
Наследов А.Д. (2005) SPSS: Компьютерный анализ данных в психологии и социальных
науках. СПб.: Питер.
Наследов, А.Д. (2011). SPSS 19: Профессиональный статистический анализ данных.
СПб.: Питер.
Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО
«Речь».
Хили, Д. (2005). Статистика. Социологические и маркетинговые исследования. Под ред.
Руденко А.А. Киев: ООО «ДиаСофтЮП».
Ярославский государственный педагогический университет им. К.Д. Ушинского. Отдел
образовательных информационных технологий. (2008). Измерение самооценки по
методике Дембо-Рубинштейн.
Available at http://cito-web.yspu.org/link1/metod/met35/node33.html
314
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2018
Приложение 1
Методика Басса-Дарки1
Описание методики
Опросник враждебности Басса - Дарки (англ. Buss - Durkee Hostility
Inventory, сокращенно: BDHI), опубликованный в 1957 году американскими
психологами Арнольдом Бассом и Энн Дарки (Arnold H. Buss, Ann Durkee),
предназначен для выявления уровня агрессивности и враждебности.
Опросник
состоит
из
75
утверждений.
На
русском
языке
стандартизирован А.А. Хваном, Ю.А. Зайцевым и Ю.А. Кузнецовой в 2005 году.
Конструируя опросник, Басс вначале провел разграничения между
враждебностью и агрессией. Враждебность была определена им как реакция
отношения, скрытно-вербальная реакция, которой сопутствуют негативные
чувства и негативная оценка людей и событий. Агрессию он определил как
ответ, содержащий стимулы, способные причинить вред другому существу.
Дальнейшая дифференциация проводилась в направлении выделения подклассов
внутри враждебности и агрессии. В результате Басс и Дарки выделили два вида
враждебности (обида и подозрительность) и пять видов агрессии (физическая
агрессия, косвенная агрессия, раздражение, негативизм и вербальная агрессия).
В литературе встречается несколько русскоязычных вариантов методики.
Теоретические основы
Различные авторы в своих исследованиях, монографиях по-разному
определяют агрессию и агрессивность:
1
Опросник уровня агрессивности Басса – Дарки. Материал Psylab.info - энциклопедии
психодиагностики
http://psylab.info/%D0%9E%D0%BF%D1%80%D0%BE%D1%81%D0%BD%D0%B8%D0%BA_%D1%83%D1%80%D0%B
E%D0%B2%D0%BD%D1%8F_%D0%B0%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B2%D0%BD%D0
%BE%D1%81%D1%82%D0%B8_%D0%91%D0%B0%D1%81%D1%81%D0%B0__%D0%94%D0%B0%D1%80%D0%BA%D0%B8
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
315
•
как врожденную реакцию человека для "защиты занимаемой территории"
(Лоренц, Ардри);
•
как установку к господству (Моррисон);
•
как
реакцию
личности
на
враждебную
человеку
окружающую
действительность (Хорни, Фромм).
Очень широкое распространение получили теории, связывающие агрессию и
фрустрацию (Миллер, Дуб, Доллард).
Под
агрессивностью
понимают
свойство,
качество
личности,
характеризующееся наличием деструктивных тенденций, в основном в области
субъектно-субъектных
отношений.
Вероятно,
деструктивный
компонент
человеческой активности является необходимым в созидательной деятельности,
так как потребности индивидуального развития с неизбежностью формируют в
людях способность к устранению и разрушению препятствий, преодолению того,
что противодействует этому процессу.
Агрессивность обладает качественной и количественной характеристикой.
Как и всякое свойство, она имеет различную степень выраженности: от почти
полного отсутствия до ее предельного развития. Каждая личность должна
обладать определенной степенью агрессивности. Отсутствие ее приводит к
пассивности, ведомости, конформности и т.д. Чрезмерное развитие ее начинает
определять весь облик личности, которая может стать конфликтной, неспособной
на сознательную кооперацию и т.д. Сама по себе агрессивность не делает
субъекта сознательно опасным, так как, с одной стороны, существующая связь
между агрессивностью и агрессией не является жесткой, а, с другой, сам акт
агрессии может не принимать сознательно опасные и неодобряемые формы. В
житейском сознании агрессивность является синонимом "злонамеренной
активности". Однако само по себе деструктивное поведение "злонамеренностью"
не обладает, таковой его делает мотив деятельности, те ценности, ради
достижения и обладания которыми активность разворачивается. Внешние
практические действия могут быть сходны, но их мотивационные компоненты
прямо противоположны.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
316
Исходя из этого, можно разделить проявления агрессии на два основных типа:
первый
мотивационная
–
агрессия,
как
самоценность,
второй
–
инструментальная, как средство (подразумевая при этом, что и та, и другая могут
проявляться как под контролем сознания, так и вне его, и сопряжены с
эмоциональными
переживаниями
(гнев,
враждебность).
Практических
психологов в большей степени должна интересовать мотивационная агрессия как
прямое проявление реализации присущих личности деструктивных тенденций.
Определив уровень таких деструктивных тенденций, можно с большой степенью
вероятности прогнозировать возможность проявления открытой мотивационной
агрессии. Одной из подобных диагностических процедур является опросник
Басса-Дарки.
Валидизация
Выборку стандартизации составили 646 подростков 16 – 17 лет,
проживающих в городе Новокузнецке, обучающихся в общеобразовательных
школах (400 человек), гимназиях (180 человек), детских домах-интернатах (66
человек).
Таким
подбором
испытуемых
мы
стремились
обеспечить
репрезентативность выборки.
Данная выборка была проверена на нормальность распределения. Значения
рассчитывались отдельно для каждой шкалы опросника, в двух вариантах:
1. Для «сырых» баллов, где за каждое совпадение с ключом начисляется 1
балл;
2. «Сырые» баллы умножены на предложенный коэффициент.
Оба показателя не превышают в три раза свою ошибку репрезентативности,
из чего мы можем заключить, что распределение не отличается от нормального.
Таким образом, можно утверждать, что введение коэффициента не приводит к
искажению данных.
Для проверки устойчивости распределения было проверено половинное
(полученное на половине выборки) распределение. Устойчивость распределения
проверяется с целью определения способности выборки моделировать
распределение генеральной совокупности. Предполагается, что если половинное
распределение хорошо моделирует конфигурацию целого распределения, то
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
317
целое распределение будет также хорошо моделировать распределение
генеральной совокупности. Из выборки случайным образом были отобраны 323
анкеты и просчитаны вышеописанным способом. Полученные результаты также
свидетельствуют о том, что распределение не отличается от нормального.
«Сырые» баллы переводятся в «стены». Среднее арифметическое в «сырых»
баллах принимается за точку отсчета. Вправо и влево отмеряются интервалы,
равные ½ стандартного отклонения.
При сопоставлении типов распределения обнаружилось, что распределения
шкал физическая агрессия, вербальная агрессия, негативизм и чувство вины
достоверно отличаются от распределений шкал косвенная агрессия, раздражение,
подозрительность, обида.
Кроме того провели корреляционное сравнение между всеми шкалами
опросника. Практически все шкалы между собой положительно коррелируют,
при уровне значимости p = 0,01 и p = 0,05. Отсутствие корреляции выявлено
между шкалами: физическая агрессия/чувство вины, вербальная агрессия/обида,
вербальная агрессия/чувство вины и негативизм/чувство вины. Наиболее сильная
положительная корреляционная связь обнаружена между шкалами: косвенная
агрессия/раздражение
(0,52),
подозрительность/обида
(0,48),
вербальная
агрессия/раздражение (0,45).
Внутренняя структура
Арнольд Басс, воспринявший ряд положений своих предшественников,
разделил понятия агрессии и враждебность и определил последнюю как:
"...реакцию, развивающую негативные чувства и негативные оценки людей и
событий". Создавая свой опросник, дифференцирующий проявления агрессии и
враждебности, А. Басс и А. Дарки выделили следующие виды реакций:
1. Физическая агрессия – использование физической силы против другого
лица.
2. Косвенная – агрессия, окольным путем направленная на другое лицо или
ни на кого не направленная.
3. Раздражение – готовность к проявлению негативных чувств при
малейшем возбуждении (вспыльчивость, грубость).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
318
4. Негативизм – оппозиционная манера в поведении от пассивного
сопротивления до активной борьбы против установившихся обычаев и
законов.
5. Обида – зависть и ненависть к окружающим за действительные и
вымышленные действия.
6. Подозрительность – в диапазоне от недоверия и осторожности по
отношению к людям до убеждения в том, что другие люди планируют и
приносят вред.
7. Вербальная агрессия – выражение негативных чувств как через форму
(крик, визг), так и через содержание словесных ответов (проклятия,
угрозы).
8. Чувство вины – выражает возможное убеждение субъекта в том, что он
является плохим человеком, что поступает зло, а также ощущаемые им
угрызения совести.
При составлении опросника использовались следующие принципы:
•
вопрос может относиться только к одной форме агрессии.
•
вопросы формулируются таким образом, чтобы в наибольшей степени
ослабить влияние общественного одобрения ответа на вопрос.
Процедура проведения
Инструкция
Внимательно
прослушайте
утверждения.
Если
вы
согласны
с
утверждением, то ставьте знак «+», если нет, ставьте знак «-».
Обработка результатов
Ответы оцениваются по восьми шкалам следующим образом:
1. Физическая агрессия:
•
«да» = 1, «нет» = 0: 1, 25, 33, 48, 55, 62, 68;
•
«нет» = 1, «да» = 0: 9, 17, 41.
•
Коэффициент 10 (по Хвану).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
319
2. Косвенная агрессия:
•
«да» = 1, «нет» = 0: 2, 18, 34, 42, 56, 63;
•
«нет» = 1, «да» = 0: 10, 26, 49.
•
Коэффициент 8 (по Хвану).
3. Раздражение:
•
«да» = 1, «нет» = 0: 3, 19, 27, 43, 50, 57, 64, 72;
•
«нет» = 1, «да» = 0: 11, 35, 69.
•
Коэффициент 11 (по Хвану).
4. Негативизм:
•
«да» = 1,
•
«нет» = 0: 4, 12, 20, 23, 36;
•
Коэффициент 20 (по Хвану).
5. Обида:
•
«да»= 1, «нет» = 0: 5, 13, 21, 29, 37, 51, 58.
•
«нет» = 1, «да» = 0: 44,
•
Коэффициент 9 (по Хвану).
6. Подозрительность:
•
«да» = 1, «нет» = 0: 6, 14, 22, 30, 38, 45, 52, 59;
•
«нет» = 1, «да» = 0: 65, 70.
•
Коэффициент 10 (по Хвану).
7. Вербальная агрессия:
•
«да» = 1, «нет» = 0: 7, 15, 28, 31, 46, 53, 60, 71, 73;
•
«нет» = 1, «да» = 0: 39, 66, 74, 75,
•
Коэффициент 13 (по Хвану).
8. Чувство вины:
•
«да» = 1,
•
«нет» = 0: 8, 16, 24, 32, 40, 47, 54, 61, 67,
•
Коэффициент 11 (по Хвану).
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
320
Индекс враждебности включает в себя 5 и 6 шкалу, а индекс агрессивности
(как прямой, так и мотивационной) включает в себя шкалы 1, 3, 7.
•
Враждебность = Обида + Подозрительность;
•
Агрессивность = Физическая агрессия + Раздражение + Вербальная
агрессия.
По Хвану А.А. с соавторами, значение этих показателей равно среднему
арифметическому составляющих показателей (так как максимальным уровнем во
всех случаях является 100 стандартных баллов):
Враждебность = (Обида + Подозрительность)/2,
Агрессивность = (Физическая агрессия + Раздражение + Вербальная агрессия)/3.
Интерпретация результатов
По Рогову Е.И., нормой агрессивности является величина ее индекса,
равная 21 ± 4, а враждебности – 6,5-7 ± 3. При этом обращается внимание на
возможность достижения определенной величины, показывающей степень
проявления агрессивности.
Хван А.А. с соавторами предлагают более сложную схему. Сырые баллы
по каждой шкале необходимо умножить на коэффициент, цель которого привести максимальное значение по каждой шкале к 100 баллам. Затем эти баллы
переводятся в стены:
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
321
Пользуясь данной методикой, необходимо помнить, что агрессивность,
как свойство личности, и агрессия, как акт поведения, могут быть поняты в
контексте психологического анализа мотивационно-потребностной сферы
личности.
Поэтому
опросником
Басса-Дарки
следует
пользоваться
в
совокупности с другими методиками: личностными тестами психических
состояний (Кеттел, Спилбергер), проективными методиками (Люшер) и т.д.
Стимульный материал
Опросник уровня агрессивности Басса - Дарки/Текст опросника
Материал Psylab.info - энциклопедии психодиагностики
1. Временами я не могу справиться с желанием причинить вред другим
2. Иногда сплетничаю о людях, которых не люблю
3. Я легко раздражаюсь, но быстро успокаиваюсь
4. Если меня не попросят по-хорошему, я не выполню
5. Я не всегда получаю то, что мне положено
6. Я не знаю, что люди говорят обо мне за моей спиной
7. Если я не одобряю поведение друзей, я даю им это почувствовать
8. Когда мне случалось обмануть кого-нибудь, я испытывал мучительные
угрызения совести
9. Мне кажется, что я не способен ударить человека
10. Я никогда не раздражаюсь настолько, чтобы кидаться предметами
11. Я всегда снисходителен к чужим недостаткам
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
322
12. Если мне не нравится установленное правило, мне хочется нарушить его
13. Другие умеют почти всегда пользоваться благоприятными
обстоятельствами
14. Я держусь настороженно с людьми, которые относятся ко мне несколько
более дружественно, чем я ожидал
15. Я часто бываю несогласен с людьми
16. Иногда мне на ум приходят мысли, которых я стыжусь
17. Если кто-нибудь первым ударит меня, я не отвечу ему
18. Когда я раздражаюсь, я хлопаю дверями
19. Я гораздо более раздражителен, чем кажется
20. Если кто-то воображает себя начальником, я всегда поступаю ему
наперекор
21. Меня немного огорчает моя судьба
22. Я думаю, что многие люди не любят меня
23. Я не могу удержаться от спора, если люди не согласны со мной
24. Люди, увиливающие от работы, должны испытывать чувство вины
25. Тот, кто оскорбляет меня и мою семью, напрашивается на драку
26. Я не способен на грубые шутки
27. Меня охватывает ярость, когда надо мной насмехаются
28. Когда люди строят из себя начальников, я делаю все, чтобы они не
зазнавались
29. Почти каждую неделю я вижу кого-нибудь, кто мне не нравится
30. Довольно многие люди завидуют мне
31. Я требую, чтобы люди уважали меня
32. Меня угнетает то, что я мало делаю для своих родителей
33. Люди, которые постоянно изводят вас, стоят того, чтобы их "щелкнули
по носу"
34. Я никогда не бываю мрачен от злости
35. Если ко мне относятся хуже, чем я того заслуживаю, я не расстраиваюсь
36. Если кто-то выводит меня из себя, я не обращаю внимания
37. Хотя я и не показываю этого, меня иногда гложет зависть
38. Иногда мне кажется, что надо мной смеются
39. Даже если я злюсь, я не прибегаю к "сильным" выражениям
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
323
40. Мне хочется, чтобы мои грехи были прощены
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
324
41. Я редко даю сдачи, даже если кто-нибудь ударит меня
42. Когда получается не по-моему, я иногда обижаюсь
43. Иногда люди раздражают меня одним своим присутствием
44. Нет людей, которых бы я по-настоящему ненавидел
45. Мой принцип: "Никогда не доверять "чужакам"
46. Если кто-нибудь раздражает меня, я готов сказать, что я о нем думаю
47. Я делаю много такого, о чем впоследствии жалею
48. Если я разозлюсь, я могу ударить кого-нибудь
49. С детства я никогда не проявлял вспышек гнева
50. Я часто чувствую себя как пороховая бочка, готовая взорваться
51. Если бы все знали, что я чувствую, меня бы считали человеком, с
которым нелегко работать
52. Я всегда думаю о том, какие тайные причины заставляют людей делать
что-нибудь приятное для меня
53. Когда на меня кричат, я начинаю кричать в ответ
54. Неудачи огорчают меня
55. Я дерусь не реже и не чаще чем другие
56. Я могу вспомнить случаи, когда я был настолько зол, что хватал
попавшуюся мне под руку вещь и ломал ее
57. Иногда я чувствую, что готов первым начать драку
58. Иногда я чувствую, что жизнь поступает со мной несправедливо
59. Раньше я думал, что большинство людей говорит правду, но теперь я в
это не верю
60. Я ругаюсь только со злости
61. Когда я поступаю неправильно, меня мучает совесть
62. Если для защиты своих прав мне нужно применить физическую силу, я
применяю ее
63. Иногда я выражаю свой гнев тем, что стучу кулаком по столу
64. Я бываю грубоват по отношению к людям, которые мне не нравятся
65. У меня нет врагов, которые бы хотели мне навредить
66. Я не умею поставить человека на место, даже если он того заслуживает
67. Я часто думаю, что жил неправильно
68. Я знаю людей, которые способны довести меня до драки
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
325
69. Я не огорчаюсь из-за мелочей
70. Мне редко приходит в голову, что люди пытаются разозлить или
оскорбить меня
71. Я часто только угрожаю людям, хотя и не собираюсь приводить угрозы в
исполнение
72. В последнее время я стал занудой
73. В споре я часто повышаю голос
74. Я стараюсь обычно скрывать свое плохое отношение к людям
75. Я лучше соглашусь с чем-либо, чем стану спорить
Литература
Практикум по психологии состояний Учебное пособие (2004). Под ред. проф. О.А.
Прохорова. СПб: Речь, 2004.
Практическая психодиагностика. Методики и тесты. Учебное пособие. (1998). Самара:
Издательский Дом «Бахрах».
Семенюк, Л.М. (1996). Психологические особенности агрессивного поведения
подростка. Москва-Воронеж.
Хван А.А., Зайцев Ю.А., & Кузнецова Ю.А. (2008). Стандартизация опросника А. Басса
и А. Дарки. Психологическая диагностика, 1, 35-58.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
326
Опросник уровня агрессивности Басса – Дарки (Бланк ответов)
Материал Psylab.info - энциклопедии психодиагностики
Ф.И.О.: _______________________________________________Возраст: _______
1
31
61
2
32
62
3
33
63
4
34
64
5
35
65
6
36
66
7
37
67
8
38
68
9
39
69
10
40
70
11
41
71
12
42
72
13
43
73
14
44
74
15
45
75
16
46
17
47
18
48
19
49
20
50
21
51
22
52
23
53
24
54
25
55
26
56
27
57
28
58
29
59
30
60
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
327
Названия шкал на английском языке
Physical aggression. This is a strong desire to use physical force against anyone.
Indirect. This aggression can be either not directed at an individual, or manifest
indirectly.
Irritation. It is an expression of negative feelings, with little excitement. Such people
are called short-tempered and rude.
Negativism. The so-called opposition demeanor. It is uncertain, because unstable -from
the non-resistance to an active struggle against the established laws and customs.
Resentment. sharp enough aggression. People who are prone to this type of aggression,
envy and hatred show.
Suspicion and distrust. Varies by excessive caution and forethought for others to
confidence in other people`s conscious intent to harm.
Verbal aggression. These people show their negative feelings through curses, threats,
shouting and squealing.
Guilt. Too expressed remorse, self-awareness bad man.
Questionnaire Bass-Darky. Retrieved from:
http://ecowoman-english.tk/articles.php?id=35667
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
328
Приложение 2
Математическая часть работы «Исследование гендерных
различий агрессивности у подростков»
Статистические методы обработки данных1
Обработка данных проводилась с помощью компьютерной программы SPSS 17.0.
Математический аппарат исследования выбирался в соответствии с гипотезой
исследования: «Существуют различия в агрессивности подростков: мальчиков и девочек».
Для определения: какими тестами пользоваться для выявления различий параметрическими или непараметрическими, было проверено соответствие распределений
эмпирических данных нормальному распределению. Для проверки были использованы
тесты асимметрии и эксцесса, тест Колмогорова-Смирнова с поправкой Лиллифора, тест
Шапиро-Уилкса. Также было проведено визуальное исследование гистограмм с
нормальной кривой и коробчатых диаграмм на наличие экстремальных значений
(«выбросов»). Оказалось, что распределения данных не соответствуют нормальному
распределению. Поэтому для исследования гендерных различий по шкалам методики
Басса-Дарки был выбран непараметрический тест Манна-Уитни, который основан на
исследовании рангов объединенной группы.
С помощью теста Манна-Уитни были найдены статистически значимые различия
для
«Физической
агрессии»,
«Косвенной
агрессии»,
«Вербальной
агрессии»,
«Негативизма» и «Обиды».
Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест Манна-Уитни
не выявил различий. Было установлено, что можно воспользоваться более мощным
параметрическим t-тестом для сравнения средних двух независимых выборок, так как
только для переменной «Раздражение» в группе девочек был всего лишь один «выброс»
типа «Outliers», который не оказывал существенного влияния на среднее значение и
абсолютная величина асимметрии распределений всех трех переменных была небольшая: в
пределах 1.96*SES (стандартной ошибки асимметрии).
Выпускная работа должна быть написана по форме статьи и содержать разделы «Метод» и «Результаты».
«Статистические методы обработки данных» это последняя часть раздела выпускной работы «Метод».
1
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
329
Результаты
Исходные данные
Данные, полученные в результате диагностирования состояния агрессии с
помощью опросника Басса-Дарки (Бартышев, 2005, сс. 195-200), были обработаны в
соответствии с ключами для каждого испытуемого и сведены в Таблицы А1 и А2
(Приложение А). В настоящей работе приняты обозначения, используемые в таблицах и
рисунках (Таблица 1):
Таблица 1
Описание переменных. Имена переменных, метки и значения.
Переменная
Шифр участника
Пол (0-девочка; 1-мальчик)
Физическая агрессия
Косвенная агрессия
Раздражение
Негативизм
Обида
Подозрительность
Вербальная агрессия
Чувство вины
Обозначение
Gender
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
Имя в SPSS
Code
sex
PhA
IA
I
N
R
S
VA
G
Метки значений
(0-Female; 1-Male)
Описательные статистики
Рисунок 1. Диаграмма средних значений по шкалам агрессии мальчиков и девочек.
С помощью компьютерной программы SPSS были получены показатели
описательной статистики, приведенные в Приложении В. Таблицах В1 и В2.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
330
На Рис.1. приведены средние значения по уровням агрессии у мальчиков и у
девочек. Видно, что средние показатели у мальчиков и у девочек отличаются. Необходимо
выяснить, являются ли полученные различия закономерными, или их можно объяснить
случайными причинами.
Полученные результаты также иллюстрируются коробчатыми диаграммами
(Boxplots), изображенными на Рис.2 (и в Приложении D, Рис.D1-D8). На коробчатой
диаграмме (Рис.2, Приложении D, Рис.D1) по шкале «Физическая агрессия» в группе
девочек имеется одно экстремальное значение – «выброс» типа «Extremes». Порядковый
номер девочки в программе SPSS – 24. Все остальные «выбросы» типа «Outliers». Их
немного, они не могут существенно влиять на средние значения. Из Рис.2 также видно, что
показатели по шкалам агрессивности у мальчиков и девочек отличаются. Так, например,
уровень физической агрессии мальчиков выше, чем уровень физической агрессии девочек.
Уровень вербальной агрессии выше у мальчиков, но у некоторых мальчиков он занижен
(Outliers). Имеются и девочки с заниженной вербальной агрессией. Показатели косвенной
агрессии мальчиков имеют больший разброс, чем у девочек. При этом уровень косвенной
агрессии выше у девочек. Уровень негативизма выше у мальчиков, несмотря на
испытуемого с заниженным негативизмом. Необходимо выяснить, являются ли
полученные различия закономерными, или их можно объяснить случайными причинами.
Рисунок 2. Коробчатые диаграммы по шкалам агрессии мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
331
Проверка нормальности распределения данных
Соответствие данных нормальному распределению проверялось следующими
методами (Приложение С):
- с помощью тестов для показателей асимметрии и эксцесса (Таблица С1
Приложения С) (Блюменау, 2019; с.105-108)2;
- с помощью теста Колмогорова-Смирнова в модификации Лиллифора (Таблица С2
Приложения С);
- с помощью теста Шапиро-Уилкса (Таблица С2 Приложения С);
- с помощью визуального исследования диаграмм с нормальной кривой (Рис. С1-С8,
Приложения С);
- с помощью исследования коробчатых диаграмм (Boxplots): наличия или отсутствия
экстремальных значений или «выбросов» (Рис. 2).
Результаты проверки соответствия данных нормальному распределению и выбор
критерия для сравнения агрессивности мальчиков и девочек иллюстрируются Таблицей С3
Приложения С. В настоящем исследовании эмпирические распределения всех данных не
соответствовали нормальному распределению. Поэтому для дальнейшего исследования
использовались методы непараметрической статистики: U-тест Манна-Уитни для двух
независимых выборок.
В Приложении С также приведены гистограммы с нормальной кривой (Рис. С1-С8),
по которым визуально можно определить, достаточно ли близко эмпирическое
распределение к нормальному распределению.
Исследование различий с помощью непараметрического критерия
Манна-Уитни
Так как распределение данных отличается от нормального распределения, то для
исследования различия в агрессивности у мальчиков и девочек был применен
непараметрический U-критерий Манна-Уитни (Приложение D, Таблицы D1 – D3), который
предназначен для оценки различий по уровню признака3. Размер эффекта вычислялся по
Блюменау, Н.Ф. (2019). Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического
исследования. Конспект лекций.
2
Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО «Речь». С.49-55.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
3
332
формуле (D1). Результаты исследования гендерных различий по шкалам агрессии у
мальчиков и девочек с помощью теста Манна-Уитни представлены в Таблице 1.
Для шкалы «Подозрительность», статистической значимости различий не найдено,
хотя эффект малого размера (почти среднего, r =.27) имеется: у девочек подозрительность
выше. Для переменной «Обида» гендерные различия значимые, но размер эффекта меньше:
r =.16.
На данном этапе можно сказать, что гипотеза работы: «Существуют различия в
агрессивности у подростков мальчиков и девочек» подтверждается.
Таблица 1.
Результаты исследования гендерных различий по шкалам методики Басса-Дарки с
помощью критерия Манна-Уитни
Переменные
Выявленные различия агрессии
Физическая агрессия
У девочек (Mdn = 5.00) ниже, чем у
мальчиков (Mdn = 8.50).
Косвенная агрессия
У девочек (Mdn = 7.00) выше, чем у
мальчиков (Mdn = 5.00).
Раздражение
Негативизм
Обида
Уровень статистической
значимости для отличий
Максимально значимые
различия: U = 106, p < .001, r =
.67, эффект большой.
Максимально значимые
различия: U = 161, p < .001,
r = .56, эффект большой.
Раздражение у мальчиков (Mdn = 6.00)
и девочек (Mdn = 6.00) имеет
случайное отличие.
Различия не выявлены: U =
409, p = .52, ns; r = .08, нет
эффекта.
У девочек (Mdn = 2.00) ниже, чем у
мальчиков (Mdn = 5.00).
Максимально значимые
различия: U = 86.5, p < .001,
r = .72, эффект большой.
Девочки (Mdn = 5.00) обидчивее
мальчиков (Mdn = 4.00).
Значимые различия: U = 316, p
= .039, r = .16, эффект
небольшой.
Подозрительность
Различия не выявлены U = 370,
Подозрительность мальчиков (Mdn =
p = .22, ns; r = .27, эффект
5.00) и девочек (Mdn = 6.00) имеет
небольшой: девочки
случайное отличие
подозрительнее.
Вербальная агрессия
У мальчиков (Mdn = 10.0) уровень
вербальной агрессии выше, чем у
девочек (Mdn = 6.00).
Чувство вины
У мальчиков (Mdn = 5.00) и девочек
Различия не выявлены U = 423,
(Mdn = 5.00) уровни чувства вины
p = .67, ns; r = .05, нет эффекта.
имеют случайное отличие
Максимально значимые
различия: U = 76, p < .001,
r = .72, эффект большой.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
333
Исследование
различий
средних
показателей
с
помощью
параметрических критериев
Для шкал «Раздражение», «Подозрительность» и «Чувство вины» тест Манна-Уитни
не выявил различий. Было установлено, что можно воспользоваться более мощным
параметрическим t-тестом для сравнения средних двух независимых выборок, так как
только для переменной «Раздражение» (Рис.2) в группе девочек был всего лишь один
«выброс» типа «Outliers», который не оказывает существенного влияния на среднее
значение. Также абсолютная величина асимметрии распределений всех трех переменных
(Таблица 2) небольшая: она меняется в пределах 1.96*SES = 0.84, где SES = 0.43 стандартная ошибка асимметрии.
Таблица 2
Асимметрия для шкал «Раздражение» (I), «Подозрительность» (S) и «Чувство вины» (G)
в группах мальчиков и девочек
Девочки
I
Асимметрия, S
0.61
S
0.18
Мальчики
G
0.19
I
0.31
S
G
0.53
0.58
Примечание. В таблице выделены случаи, когда абсолютная величина асимметрии
превышает свою стандартную ошибку: S ≥ SES = 0.43 . Во всех случаях абсолютная
величина асимметрии меньше 0.84.
Следовательно, к переменным «Раздражение» (I), «Подозрительность» (S) и
«Чувство вины» (G) может быть применена параметрическая статистика (Наследов, 2004,
с.43), а именно t-тест (Приложение Е, Таблицы Е1-Е2). Вычисление размеров эффектов для
теста проводилось по формуле (Е1, Приложение Е). По результатам t-теста можно сделать
следующие выводы (Таблица 3).
Cреднее значение по переменной «Раздражение» в выборке мальчиков M = 6.27 (SD
= 1.34) и среднее значение в выборке девочек M = 6.43 (SD = 0.94) различаются
статистически незначимо: t(52) = .56, p =.58, ns; d = 0.14, нет эффекта. Тест Левина показал
неравные дисперсии (F = 4.38, p = .041), поэтому число степеней свободы было
скорректировано от 58 до 52.
Cреднее значение по переменной «Подозрительность» в выборке мальчиков M =
5.20 (SD = 1.16) и среднее значение в выборке девочек M = 5.53 (SD = 1.38) различаются
статистически незначимо: t(58) = 1.36, p =.18, ns; d = 0.35, эффект небольшого размера.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
334
Девочки оказались более подозрительными, чем мальчики, хотя на популяцию это не
распространяется. Тест Манна-Уитни также нашел этот эффект.
Cреднее значение по переменной «Чувство вины» в выборке мальчиков M = 5.10 (SD
= 1.06) и среднее значение в выборке девочек M = 5.03 (SD = 1.38) различаются
статистически незначимо: t(58) = -.51, p =.61, ns; d = 0.13, эффекта нет.
Таблица 3.
Результаты исследования различий с помощью параметрических Т-критериев
Переменные
Раздражение
Подозрительность
Чувство вины
Выявленные различия в
средних значениях агрессии
Раздражение у девочек
(M=6.43, SD=0.94) и у
мальчиков (M=6.27,
SD=1.34) различаются
случайно.
Уровень статистической
значимости для отличий
Незначимые различия
t(52) = .56, p =.58, d = 0.14, нет
эффекта
Подозрительность у
девочек (M=5.53, SD=1.38)
и мальчиков (M=5.10,
SD=1.06) отличается
случайно
Незначимые различия
У мальчиков (M=5.20,
SD=1.16) и девочек
(M=5.03, SD=1.38) уровни
чувства вины имеют
случайные отличия
Незначимые различия
t(58) = 1.36, p =.18, d = 0.35,
небольшой эффект: девочки
подозрительнее.
t(58) = -.51, p =.61, d = 0.13, нет
эффекта
Общий вывод по результатам
§
Физическая агрессия у мальчиков (Mdn = 8.50) выше, чем у девочек (Mdn = 5.00): U =
106, p < .001. Размер эффекта r = .67, эффект большой.
§
Косвенная агрессия у мальчиков (Mdn = 5.00) ниже, чем у девочек (Mdn = 7.00): U = 161,
p < .001. Размер эффекта r = .56, эффект большой.
§
Статистически значимого различия в Раздражении мальчиков (Mdn = 6.00; M = 6.27, SD
= 1.34) и девочек (Mdn = 6.00; M = 6.43, SD = 0.94) не обнаружено: U = 409, p = .52; t(52)
= .56, p =.58. Размеры эффекта d = 0.14, r = .08 – эффект не наблюдается.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
335
§
Негативизм мальчиков (Mdn = 5.00) превышает негативизм девочек (Mdn = 2.00): U =
86.5, p < .001. Размер эффекта r = .72, эффект большой.
§
Обида у мальчиков (Mdn = 4.00) меньше, чем у девочек (Mdn = 5.00): U = 316, p = .039.
Размер эффекта r = .16, эффект небольшой.
§
Статистически значимого различия в Подозрительности мальчиков (Mdn = 5.00; М =
5.20, SD = 1.16) и девочек (Mdn = 6.00; M = 5.53, SD = 1.38) не обнаружено: U = 370, p =
.22; t(58) = 1.36, p =.18. Размеры эффекта d = 0.35, r = .27. Небольшой эффект
присутствует: девочки подозрительнее мальчиков.
§
Вербальная агрессия у мальчиков (Mdn = 10. 0) выше, чем у девочек (Mdn = 6.00): U =
76, p < .001. Размер эффекта r = .72, эффект большой.
§
Статистически значимого различия в Чувстве вины мальчиков (Mdn = 5.00; М = 5.10,
SD = 1.06) и девочек (Mdn = 5.00; M = 5.03, SD = 1.38) не обнаружено: U = 423, p = .67;
t(58) = -0.51, p =.61. Размеры эффекта d = 0.13, r = .07 – эффект не наблюдается.
Таким образом, гипотеза работы: «Существуют различия в агрессии у подростков
мальчиков и девочек» подтверждается.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
336
Приложение А
Исходные данные
Таблица А1
Показатели агрессии девочек
Сode
m1
m2
m3
m4
m5
m6
m7
m8
m9
m10
m11
m12
m13
m14
m15
m16
m17
m18
m19
m20
m21
m22
m23
m24
m25
m26
m27
m28
m29
m30
PhA IA
5
8
5
8
5
7
6
6
4
8
5
6
6
9
4
8
5
7
5
7
6
8
6
6
4
6
5
8
5
5
5
8
4
8
5
8
7
6
6
9
5
8
7
6
6
6
10
9
4
6
5
7
6
7
4
8
5
6
5
6
I
6
8
7
7
6
6
5
6
6
7
7
7
6
6
7
7
7
9
6
5
6
6
5
6
6
5
8
7
6
7
N
3
3
1
4
3
3
2
1
1
2
3
1
2
2
2
3
3
3
4
2
3
4
3
1
1
1
3
1
2
1
R
6
5
3
3
4
3
5
4
5
5
6
4
5
6
5
6
5
3
5
5
6
5
4
3
6
3
4
5
5
6
S
6
7
4
5
5
6
6
4
4
6
6
5
7
6
4
7
8
6
6
7
8
6
3
8
5
4
4
5
4
4
VA
7
4
5
7
7
6
6
4
4
8
7
7
6
7
6
7
7
4
7
6
6
7
8
4
7
6
6
6
4
6
G
4
3
5
5
6
7
5
5
3
4
6
5
3
3
5
5
5
6
7
7
8
7
4
6
3
4
6
5
4
5
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
337
Таблица А2
Показатели агрессии мальчиков
Сode
z1
z2
z3
z4
z5
z6
z7
z8
z9
z10
z11
z12
z13
z14
z15
z16
z17
z18
z19
z20
z21
z22
z23
z24
z25
z26
z27
z28
z29
z30
PhA IA
10
5
9
4
9
5
9
5
9
5
10
9
8
7
11
1
9
1
9
8
5
4
8
7
5
6
6
4
7
4
9
5
8
4
8
4
9
5
10
5
9
6
9
1
8
1
5
7
6
7
7
4
7
5
5
8
9
6
8
7
I
5
7
5
5
7
9
7
8
7
6
5
7
7
6
6
5
4
5
6
6
7
9
8
7
8
5
6
6
5
4
N
5
5
5
5
5
5
2
5
5
5
5
3
5
4
5
5
5
5
5
4
5
2
3
5
2
4
3
5
4
4
R
5
3
3
4
5
6
6
5
7
3
3
5
3
3
4
5
3
2
4
3
6
5
3
3
4
4
3
5
4
3
S
5
7
7
7
6
6
4
7
6
5
4
5
4
4
4
6
6
5
4
5
5
4
4
5
5
4
4
6
4
5
VA
10
12
13
12
11
11
10
13
9
11
10
10
10
9
8
7
5
8
10
10
8
9
9
6
5
10
9
10
11
12
G
6
5
5
5
7
7
7
6
8
5
5
4
6
4
5
5
5
4
4
5
3
4
4
5
6
7
5
4
5
5
В таблицах А1 и А2 обозначено:
Переменная
Шифр участника
Пол (0-девочка; 1-мальчик)
Физическая агрессия
Косвенная агрессия
Раздражение
Негативизм
Обида
Подозрительность
Вербальная агрессия
Чувство вины
Обозначение
Gender
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
Имя в SPSS
Code
sex
PhA
IA
I
N
R
S
VA
G
Метки значений
(0-Female; 1-Male)
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
338
Приложение В
Описательные статистики
Таблица В1
Описательные статистики для девочек
PhA
IA
I
N
R
S
VA
G
30
30
30
30
30
30
30
30
Mean
5.33
7.17
6.43
2.27
4.67
5.53
6.07
5.03
Std. Error of Mean
0.22
0.20
0.17
0.19
0.19
0.25
0.22
0.25
Median
5.00
7.00
6.00
2.00
5.00
6.00
6.00
5.00
Std. Deviation
1.21
1.12
0.94
1.01
1.06
1.38
1.23
1.38
Skewness
2.03
-0.03
0.61
0.05
-0.38
0.18
-0.61
0.19
Std. Error of Skewness
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
Kurtosis
6.66
-1.16
0.76
-1.20
-1.01
-0.83
-0.61
-0.59
Std. Error of Kurtosis
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Range
6.00
4.00
4.00
3.00
3.00
5.00
4.00
5.00
Minimum
4.00
5.00
5.00
1.00
3.00
3.00
4.00
3.00
Maximum
10.00
9.00
9.00
4.00
6.00
8.00
8.00
8.00
25
5.00
6.00
6.00
1.00
4.00
4.00
5.75
4.00
50
5.00
7.00
6.00
2.00
5.00
6.00
6.00
5.00
75
a Gender = Female
6.00
8.00
7.00
3.00
5.25
6.25
7.00
6.00
N
Percentiles
Valid
Missing
Таблица В2
Описательные статистики для мальчиков
PhA
IA
I
N
R
S
VA
G
30
30
30
30
30
30
30
30
Mean
8.03
5.00
6.27
4.33
4.07
5.10
9.60
5.20
Std. Error of Mean
0.30
0.38
0.24
0.19
0.22
0.19
0.37
0.21
Median
8.50
5.00
6.00
5.00
4.00
5.00
10.00
5.00
Std. Deviation
1.65
2.10
1.34
1.03
1.23
1.06
2.04
1.16
Skewness
-0.60
-0.41
0.31
-1.35
0.58
0.53
-0.61
0.58
Std. Error of Skewness
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
Kurtosis
-0.43
0.00
-0.49
0.54
-0.46
-0.93
0.33
0.05
Std. Error of Kurtosis
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Range
6.00
8.00
5.00
3.00
5.00
3.00
8.00
5.00
Minimum
5.00
1.00
4.00
2.00
2.00
4.00
5.00
3.00
Maximum
11.00
9.00
9.00
5.00
7.00
7.00
13.00
8.00
25
7.00
4.00
5.00
4.00
3.00
4.00
8.75
4.00
50
75
8.50
9.00
5.00
7.00
6.00
7.00
5.00
5.00
4.00
5.00
5.00
6.00
10.00
11.00
5.00
6.00
N
Percentiles
Valid
Missing
a Gender = Male
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
339
Приложение С
Проверка нормальности распределения данных
Таблица С1
Результаты проверки соответствия распределения данных нормальному распределению
Gender = male
Gender = female
с помощью асимметрии и эксцесса у мальчиков и девочек для шкал агрессии
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
S
2.03
-0.03
0.61
0.05
-0.38
0.18
-0.61
0.19
-0.60
-0.41
0.31
-1.35
0.58
0.53
-0.61
0.58
SES
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
0.43
K
6.66
-1.16
0.76
-1.20
-1.01
-0.83
-0.61
-0.59
-0.43
0.00
-0.49
0.54
-0.46
-0.93
0.33
0.05
SEK
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
0.83
Z(S)
Z(K)
DP
p
4.76
0.08
1.44
0.13
0.88
0.42
1.43
0.45
1.40
0.95
0.72
3.17
1.36
1.24
1.42
1.37
8.00
1.40
0.91
1.44
1.22
1.00
0.73
0.71
0.52
0.00
0.59
0.65
0.56
1.12
0.40
0.06
86.68
1.95
2.89
2.09
2.26
1.18
2.59
0.70
2.24
0.91
0.87
10.44
2.16
2.78
2.19
1.88
.000
.38
.24
.35
.32
.55
.27
.70
.33
.64
.65
.005
.34
.25
.33
.39
ND
no
no
no
Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error
of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K)
> 1.96 – то распределение данных отличается от нормального распределения.
DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует DP.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
340
Таблица С2
Tests of Normality
Gender
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Female
Male
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
Kolmogorov-Smirnova
Statistic
.275
.221
.239
.184
.245
.162
.232
.375
.257
.240
.166
.217
.245
.178
.176
.269
df
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
Sig.
.000
.001
.000
.011
.000
.044
.000
.000
.000
.000
.034
.001
.000
.017
.018
.000
Shapiro-Wilk
Statistic
.775
.897
.876
.923
.880
.933
.856
.681
.854
.887
.922
.841
.846
.938
.930
.902
df
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
Sig.
.000
.007
.002
.032
.003
.061
.001
.000
.001
.004
.030
.000
.001
.082
.050
.009
a. Lilliefors Significance Correction
df – число степеней свободы;
Sig. - р-вероятность.
При Sig. ≤ .05 распределение значимо отличается от нормального распределения.
Случаи значимого отличия распределения от нормального в таблице С2 выделены.
Таблица С3
Выбор критерия сравнения
Variable
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
Normal Distribution
Female
Male
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
Test
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
U-Mann-Whitney
На Pис. С1-С8 приведены гистограммы с нормальной кривой, позволяющие
визуально сравнить эмпирическое распределение данных с нормальным распределением.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
341
Рисунок C1. Гистограммы с нормальной кривой по переменной «Физическая агрессия» для
мальчиков и девочек.
Рисунок C2. Гистограммы с нормальной кривой по переменной «Косвенная агрессия» для
мальчиков и девочек.
Рисунок C3. Гистограммы с нормальной кривой по переменной «Раздражение» для
мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
342
Рисунок C4. Гистограммы с нормальной кривой по переменной «Негативизм» для
мальчиков и девочек.
Рисунок C5. Гистограммы с нормальной кривой по переменной «Обида» для мальчиков и
девочек.
Рисунок C6. Гистограммы с нормальной кривой по переменной «Подозрительность» для
мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
343
Рисунок C7. Гистограммы с нормальной кривой по переменной «Вербальная агрессия» для
мальчиков и девочек.
Рисунок C8. Гистограммы с нормальной кривой по переменной «Чувство вины» для
мальчиков и девочек.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
344
Приложение D
Исследование различий с помощью непараметрического критерия
Манна-Уитни
U-критерий Манна-Уитни предназначен для оценки различий по уровню признака4.
Гипотезы:
H 0 : Уровни признака в группах мальчиков и девочек имеют случайные отличия.
H 1 : Уровни признака в группах мальчиков и девочек имеют закономерные отличия.
Две сравниваемые группы объединяются в одну. Показатели ранжируются.
Вычисляются суммы рангов для каждой группы в отдельности. Эти суммы рангов входят в
расчетную формулу для эмпирического значения критерия (статистики) Манна-Уитни.
Таблица D1
Суммы рангов для мальчиков и для девочек в объединенной группе
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion and Distrust
Verbal Aggression
Guilt
4
Gender
Female
Male
N
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Female
Male
30
30
Total
60
Mean Rank
19.02
41.98
Sum of Ranks
570.50
1259.50
40.13
20.87
1204.00
626.00
31.88
29.12
956.50
873.50
18.35
42.65
550.50
1279.50
34.98
26.02
1049.50
780.50
33.18
27.82
995.50
834.50
18.02
42.98
540.50
1289.50
29.58
31.42
887.50
942.50
Сидоренко, Е. (2000). Методы математической обработки в психологии. СПб.: ООО «Речь». С.49-55.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
345
Таблица D2
Статистики тестов и р-вероятности (Test Statisticsa)
Physical
Indirect
Irritation Negativism
Aggression Aggression
105.5
161.0
408.5
85.5
570.5
626.0
873.5
550.5
-5.196
-4.339
-.637
-5.542
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2.000
tailed)
a. Grouping Variable: Gender
.000
.524
.000
Resent
Suspicion
Verbal
ment
and Distrust Aggression
315.5
369.5
75.5
780.5
834.5
540.5
-2.061
-1.229
-5.593
.039
.219
Guilt
422.5
887.5
-.422
.000
.673
В Таблице D2 представлены U-статистика Манна-Уитни, W-статистика Вилкоксона,
равная
наименьшей
сумме
рангов
объединенной
группы
и
Z-статистика
для
стандартизованного нормального распределения, которая используется для вычисления рvalue и для вычисления размера эффекта для теста Манна-Уитни:
r=
Z
,
N
(D1)
r = .10 (небольшой,эффект): в этом случае эффект объясняет 1% от общей дисперсии,
r = .30 (средний эффект): эффект составляет 9% от общей дисперсии,
r = .50 (большой эффект): эффект составляет 25% от дисперсии.
Sig. = – это p-value. Если (Бююль & Цефель, 1976, с.88)5
Sig. > .05. то различие незначимое (ns).
Sig. ≤ .05. то различие значимое (уровень значимости α = .05).
Sig. ≤ .01. то различие очень значимое (уровень значимости α = .01).
Sig. ≤ .001. то различие максимально значимое (уровень значимости α = .001).
Максимально значимые различия имеются по переменным Physical Aggression, Indirect
Aggression, Negativism, Verbal Aggression.
Значимое различие имеется по переменной Resentment.
Незначимые различия имеются по переменным Irritation, Suspicion and Distrust, Guilt.
Для выяснения. чей же уровень агрессии выше: мальчиков или девочек. обратимся к
таблице рангов. У кого при значимых различиях средний ранг выше. у того и агрессия выше.
Physical Aggression Выше у мальчиков (U = 105.5. p < .001);
Бююль, А., Цефель, П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и
восстановление скрытых закономерностей. СПб: ООО «ДиаСофтЮП». C. 88.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
346
лекций.
5
Indirect Aggression - Выше у девочек (U = 161.0. p < .001);
Irritation - Различия не выявлены (U = 408.5. p = .52);
Negativism - Выше у мальчиков (U = 85.5. p < .001);
Resentment - У девочек выше (U = 315.5. p = .039);
Suspicion and Distrust - Различия не выявлены (U = 369.5. p = .22);
Verbal Aggression - Выше у мальчиков (U = 75.5. p < .001);
Guilt - Различия не выявлены (U = 422.5. p = .67).
Те же выводы можно сделать анализируя коробчатые диаграммы (Рис.D1-D8)6.
Рисунок D1. Коробчатые диаграммы для
переменной «Physical Aggression»
(физическая агрессия).
Рисунок D2. Коробчатые диаграммы для
переменной «Indirect Аggression»
(косвенная агрессия).
Рисунок D3. Коробчатые диаграммы для
переменной «Irritation» (раздражение).
Рисунок D4. Коробчатые диаграммы для
переменной «Negativism» (негативизм).
На Рис.D1-D8 вместо Z (мальчик) стоит puika, что также означает – мальчик.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
6
347
Рисунок D5. Коробчатые диаграммы для
переменной «Resentment» (обида).
Рисунок D6. Коробчатые диаграммы для
переменной «Suspicion and Distrust»
(Подозрительность).
Рисунок D7. Коробчатые диаграммы для
переменной «Verbal Аggression»
(вербальная агрессия).
Рисунок D8. Коробчатые диаграммы для
переменной «Guilt» (Чувство вины).
Таблица D3
Male,
Mdn
Female,
Mdn
Statistics, U
Statistics, Z
p-value
Вычисление размеров эффектов по формуле (D1)
Физическая агрессия
8.50
5.00
105.5
5.20
.000
.67
большой
Косвенная агрессия
5.00
7.00
161.0
4.34
.000
.56
большой
Негативизм
Раздражение
5.00
6.00
2.00
6.00
85.5
408.5
5.54
0.64
.000
.52, ns
.72
.08
большой
нет эффекта
Подозрительность
5.00
6.00
369.5
2.06
.22, ns
.27
небольшой
Обида
4.00
5.00
315.5
1.23
.039
.16
небольшой
Вербальная агрессия
Чувство вины
10.0
5.00
6.00
5.00
75.5
422.5
5.59
0.42
.000
.67, ns
.72
.05
большой
нет эффекта
Переменная
Размер эффекта, r
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
348
Пример вычисления размера эффекта. Для Физической агрессии размер эффекта
равен r =
5.196
= 0.67 .
60
Тест Манна-Уитни указывает на то, что физическая агрессия мальчиков (Mdn = 8.50)
превыает агрессию девочек (Mdn = 5.00), U = 105.5, (Z = -5.20), p < .001, различие агрессии
у мальчиков и девочек r = .67. Размер эффекта большой.
Интересно отметить, что для переменной «Подозрительность», статистической
значимости различий не найдено, хотя эффект малого размера (почти среднего, r = .27)
имеется. Для переменной «Обида» гендерные различия значимые, но размер эффекта
меньше: r = .16.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
349
Приложение Е
Исследование различий средних показателей с помощью
параметрических критериев
Проверка однородности выборочных дисперсий в программе SPSS проводится с
помощью теста Левена (аналог F-критерия Фишера: F-Test Two-Sample for Variances). В
Таблице Е2 приведены результаты проверки однородности дисперсий можно увидеть в
колонке «Sig.». Гипотеза о равенстве дисперсий не принимается. если Sig. ≤ .05. Только
для переменной «Раздражение» (Irritation) дисперсии неоднородны.
Если выборочные дисперсии различаются статистически незначимо (Sig. > 0.05;
верхняя строка «Equal variances assumed»), то для сравнения средних используется t-тест
Стьюдента.
Если выборочные дисперсии различаются статистически значимо (Sig. ≤ 0.05;
нижняя строка «Equal variances not assumed»), то такая ситуация называется проблемой
Фишера-Беренса и для сравнения средних используется модификация t-теста Стьюдента.
В соответствующей строке для t-теста: Sig. = – это p-value.
Таблица Е1.
Статистики групп (Group Statistics)
Gender
Irritation
Suspicion and Distrust
Guilt
N
Mean
Std. Deviation
Std. Error Mean
Female
30
6.4333
.93526
.17075
Male
30
6.2667
1.33735
.24417
Female
30
5.5333
1.38298
.25250
Male
30
5.1000
1.06188
.19387
Female
30
5.0333
1.37674
.25136
Male
30
5.2000
1.15669
.21118
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
350
Таблица Е2
t-тест для независимых выборок (Independent Samples Test). Фрагмент выходной таблицы
Levene's Test for Equality of
t-test for Equality of Means
Variances
F
Irritation
Suspicion and
Distrust
Guilt
Equal variances
assumed
Equal variances not
assumed
Equal variances
assumed
Equal variances not
assumed
Equal variances
assumed
Equal variances not
assumed
Sig.
4.381
3.091
.622
t
.041
.084
.433
df
Sig. (2-tailed)
.559
58
.578
.559
51.891
.578
1.361
58
.179
1.361
54.374
.179
-.508
58
.614
-.508
56.326
.614
По переменным Irritation, Suspicion and Distrust, SP имеются незначимые различия
средних значений.
Для t-теста для двух независимых выборок размер эффекта - Cohen's d находится
путем деления разности средних значений этих выборок на суммарное стандартное
отклонение «pooled standard deviation»:
d=
где SD pooled
M1 − M 2
,
SDpooled
(E1)
SD12 + SD22
=
.
2
Значения размера эффекта меняются в том же диапазоне, что и три стандартных
отклонения для стандартизованных данных: от -3.00 до 3.00. Интерпретация размера
эффекта зависит от исследовательского вопроса. Можно использовать классификацию,
предложенную Коэном (Cohen, 1988)7:
0.8 - большой размер эффекта (8/10 от стандартного отклонения),
0.5 - умеренный размер эффекта (1/2 от стандартного отклонения),
0.2 - небольшой размер эффекта (1/5 от стандартного отклонения)
7
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Earlbaum
Associates.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
351
Таблица Е3
Male, M
Male, SD
Female, M
Female, SD
Statistics, t
df
p-value
Вычисление размеров эффектов по формуле (Е1)
Раздражение
6.27
1.34
6.43
0.94
0.60
52
0.58, ns
0.14
нет эффекта
Подозрительность (
5.10
1.06
5.53
1.38
1.36
58
0.18, ns
0.35
небольшой
Чувство вины
5.20
1.16
5.03
1.38
-0.51
58
0.61
0.13
нет эффекта
Variable
Размер эффекта, d
Пример вычисления размера эффекта d. Для «Раздражения» (К) размер эффекта
равен (см. Таблицу Е1):
d=
6.2667 − 6.4333
(1.33735) + ( 0.93526 )
2
2
= −0.14 .
2
Результаты t-тестов соответствуют результатам теста Манна-Уитни.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования. Конспект
лекций.
352
Приложение 3
Исследование самооценки по методике ДембоРубинштейн в модификации А. М. Прихожан
http://psylist.net/praktikum/15.htm
Данная
методика
основана
на
непосредственном
оценивании
(шкалировании) школьниками ряда личных качеств, таких как здоровье,
способности, характер и т. д. Обследуемым предлагается на вертикальных
линиях отметить определенными знаками уровень развития у них этих качеств
(показатель самооценки) и уровень притязаний, т. е. уровень развития этих же
качеств, который бы удовлетворял их. Каждому испытуемому предлагается
бланк методики, содержащий инструкцию и задание.
Тамара Дембо (1902-1993; родилась в Баку, Россия; работала в Германии,
затем в США) - известная исследовательница в области психологии, в свое
время предложила использовать эту методику. Сусанна Яковлевна Рубинштейн
(1911 - 1990) - советский психолог, модифицировала методику Дембо для
исследования самооценки (Ложников, 2010).
Проведение исследования
На листе бумаги проводится вертикальная черта, обозначающая одно из
свойств, например, счастье. Верхний край соответствует состоянию, где, по
вашему мнению находится самый счастливый человек, которого можно
представить, а нижнему соответствует состояние самого несчастного человека.
То есть внизу находятся отрицательные ценности, которых человек старается
избежать, а вверху наоборот положительные, к которым человек стремится.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
353
Инструкция
“Любой человек оценивает свои способности, возможности, характер и
др. Уровень развития каждого качества, стороны человеческой личности можно
условно изобразить вертикальной линией, нижняя точка которой будет
символизировать самое низкое развитие, а верхняя — наивысшее. Вам
предлагаются семь таких линий. Они обозначают:
1. здоровье;
2. ум, способности;
3. характер;
4. авторитет у сверстников;
5. умение многое делать своими руками, умелые руки;
6. внешность;
7. уверенность в себе.
На каждой линии чертой (-) отметьте, как вы оцениваете развитие у себя
этого качества, стороны вашей личности в данный момент времени. После этого
крестиком (х) отметьте, при каком уровне развития этих качеств, сторон вы
были бы удовлетворены собой или почувствовали гордость за себя”.
Испытуемому выдается бланк, на котором изображено семь линий,
высота каждой — 100 мм, с указанием верхней, нижней точек и середины
шкалы. При этом верхняя и нижняя точки отмечаются заметными чертами,
середина — едва заметной точкой.
Методика может проводиться как фронтально — с целым классом (или
группой), так и индивидуально. При фронтальной работе необходимо
проверить, как каждый ученик заполнил первую шкалу. Надо убедиться,
правильно ли применяются предложенные значки, ответить на вопросы. После
этого испытуемый работает самостоятельно. Время, отводимое на заполнение
шкалы вместе с чтением инструкции, 10—12 мин.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
354
Обработка и интерпретация результатов
Обработка проводится по шести шкалам (первая, тренировочная —
«здоровье» — не учитывается). Каждый ответ выражается в баллах. Как уже
отмечалось ранее, длина каждой шкалы 100мм, в соответствии с этим ответы
школьников получают количественную характеристику (например, 54мм = 54
баллам).
По каждой из шести шкал определить:
•
уровень притязаний — расстояние в мм от нижней точки шкалы («0») до
знака «х»;
•
высоту самооценки — от «о» до знака «—»;
•
значение расхождения между уровнем притязаний и самооценкой —
расстояние от знака «х» до знака «-», если уровень притязаний ниже
самооценки, он выражается отрицательным числом.
Рассчитать среднюю величину каждого показателя уровня притязаний и
самооценки по всем шести шкалам.
Уровень притязаний
Норму, реалистический уровень притязаний, характеризует результат от
60 до 89 баллов. Оптимальный — сравнительно высокий уровень — от 75 до 89
баллов, подтверждающий оптимальное представление о своих возможностях,
что является важным фактором личностного развития. Результат от 90 до 100
баллов обычно удостоверяет нереалистическое, некритическое отношение детей
к собственным возможностям. Результат менее 60 баллов свидетельствует о
заниженном уровне притязаний, он — индикатор неблагоприятного развития
личности.
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
355
Высота самооценки
Количество баллов от 45 до 74 («средняя» и «высокая» самооценка)
удостоверяют реалистическую (адекватную) самооценку.
Количество баллов от 75 до 100 и выше свидетельствует о завышенной
самооценке и указывает на определенные отклонения в формировании
личности.
Завышенная
самооценка
может
подтверждать
личностную
незрелость, неумение правильно оценить результаты своей деятельности,
сравнивать себя с другими; такая самооценка может указывать на существенные
искажения
в
формировании
личности
—
«закрытости
для
опыта»,
нечувствительности к своим ошибкам, неудачам, замечаниям и оценкам
окружающих.
Количество баллов ниже 45 указывает на заниженную самооценку
(недооценку себя) и свидетельствует о крайнем неблагополучии в развитии
личности. Эти ученики составляют «группу риска», их, как правило, мало. За
низкой самооценкой могут скрываться два совершенно разных психологических
явления: подлинная неуверенность в себе и «защитная», когда декларирование
(самому себе) собственного неумения, отсутствия способности и тому
подобного позволяет не прилагать никаких усилий.
В Таблице 1 даны количественные характеристики уровня притязаний и
самооценки, полученные для учащихся 7-10 классов городских школ (около 900
чел.).
Таблица 1
Количественные характеристики уровня притязаний и самооценки учащихся 710 классов городских школ.
Количественная характеристика (балл)
Параметр
низкий
средний
высокий
Очень
высокий
Уровень притязаний
Менее 60
60-74
75-89
90-100
Уровень самооценки
Менее 45
45-59
60-74
75-100
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
356
Более подробно про этот тест можно прочитать в интернете по ссылке:
Измерение самооценки по методике Дембо-Рубинштейн (2008). В книге (С.Б.
Корнилова и др. Ред.) Содержание и организация психолого-педагогического
сопровождения индивидуального развития воспитанников детских домов и
школ-интернатов. Выпуск 1. Теоретическое обоснование психолого-медикопедагогического сопровождения воспитанников детских домов и школинтернатов. Комплекс методик для изучения воспитанников детских домов и
школ-интернатов на разных возрастных этапах развития. Компьютерная база
психодиагностических данных Методические материалы для специалистов
сопровождения. Ярославль: ГОУ ЯО «Центр помощи детям». http://citoweb.yspu.org/link1/metod/met35/node33.html
Блюменау Н.Ф. (2019). Компьютерная обработка данных психологического исследования.
Конспект лекций.
357
Приложение 4
Математическая часть работы «Исследование связи между
самооценкой и агрессией в подростковом возрасте»
Статистические методы обработки данных1
Обработка данных проводилась с помощью компьютерной программы SPSS 17.0.
Математический аппарат исследования выбирался в соответствии с гипотезой
исследования: «Существует связь между самооценкой и агрессией в подростковом
возрасте».
Чтобы определить: какими тестами пользоваться для выявления связи параметрическими или непараметрическими, было проверено соответствие распределений
эмпирических данных нормальному распределению. Для проверки были использованы тест
Колмогорова-Смирнова с поправкой Лиллифора, тест Шапиро-Уилкса, тест асимметрии,
тест эксцесса и D'Agostino-Pearson Omnibus Test. Также было проведено визуальное
исследование гистограмм с нормальной кривой и коробчатых диаграмм на наличие
экстремальных значений («выбросов»). Оказалось, что распределения данных не
соответствуют нормальному распределению. Поэтому для исследования связи между
самооценкой и шкалами методики Басса-Дарки были выбраны непараметрические
коэффициенты ранговой корреляции Спирмена и τ-Кендалла.
Известно, что при отсутствии нормального распределения можно использовать
коэффициент корреляции Пирсона, если нет «выбросов», асимметрия небольшая (
S ≤ 1.96 ⋅ SES ) и связь предполагается линейной (Наследов, 2004, с.89). Поэтому было
также проведено исследование связи с помощью коэффициентов корреляции Пирсона.
Монотонной связи для всей выборки и для всех шкал агрессивности не обнаружено:
коэффициенты
корреляции
оказались
статистически
незначимыми.
Анализ
корреляционных диаграмм позволил сделать предположение о возможности нелинейной
связи между переменными.
Выпускная работа должна быть написана по форме статьи и содержать разделы «Метод» и «Результаты».
«Статистические методы обработки данных» это последняя часть раздела выпускной работы «Метод».
1
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
358
Для выявления нелинейной связи был проведен нелинейный регрессионный анализ.
Были рассмотрены линейная, квадратическая и кубическая модели. Вычислялись
коэффициенты детерминации и проверялась их статистическая значимость. Исследование
проводилось в двух направлениях: зависимая и независимая переменные менялись
местами. В результате были выявлены возможные немонотонные связи.
Наличие немонотонных связей уточнялось путем разбиения данных по одной из
переменных на интервалы монотонности (по медиане) и вычисления на каждом из них
коэффициентов корреляции. Были выполнены следующие процедуры.
1. Данные по «Самооценке» были разбиты на две группы по медиане. В каждой из
групп были вычислены коэффициенты корреляции Спирмена, Кендалла и, где возможно Пирсона.
2. Данные по «Вербальной агрессивности» были разбиты на две группы по медиане.
В каждой из групп были вычислены коэффициенты корреляции Спирмена и Кендалла.
3. По всем переменным данные были разбиты на три группы по квартилям. С
помощью критерия «Хи-квадрат» (The Test of Independence) и критерия «Угловое
преобразование Фишера» для сравнения долей были установлены те же связи, что и в пп.12.
Для всех полученных результатов были вычислены размеры эффектов и
доверительные интервалы для размеров эффектов.
Результаты
Исходные данные
Данные, обработанные в соответствии с ключами методик Дембо-Рубинштейна
(Под ред. Корниловой, 2008) и Басса-Дарки (Батаршев, 2005, сс. 195-200) приведены в
Таблице А1 (Приложение А).
В настоящей работе приняты обозначения, используемые в таблицах и рисунках
(“Questionnaire Bass-Darky”, n. d.; Buss & Durkee, 1957; Bakholdina, Bakholdina, Movsesiana,
& Stupina, 2014.).
Обозначения:
Self-Esteem (SE)
Самооценка
Physical aggression (PhA)
Физическая агрессивность
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
359
Indirect (IA)
Косвенная агрессивность
Irritation (I)
Раздражительность
Negativism (N)
Негативизм
Resentment (R)
Обидчивость
Suspicion (S)
Подозрительность
Verbal aggression (VA)
Вербальная агрессивность
Guilt (G)
Чувство вины
Описательные статистики
С помощью компьютерной программы SPSS были получены показатели
описательной статистики, приведенные в Приложении В, в Таблице В1.
В Таблице В1 отмечены случаи, когда показатели асимметрии и эксцесса по
абсолютной величине превосходят свои стандартные ошибки, умноженные на 1.96. В этих
случаях соответствующие показатели считаются большими и распределения данных не
соответствует нормальному распределению. Большая асимметрия наблюдается только для
переменной «Подозрительность».
Рисунок 1. Средние значения и стандартные отклонения по шкалам агрессивности методики
Басса-Дарки.
На Рис.1. приведены средние значения и стандартные отклонения по шкалам
агрессивности (методика Басса-Дарки).
По самооценке М = 62.3, SD = 14.3.
Для шкал агрессивности и самооценки, приведены коробчатые диаграммы
(Boxplots), (Рис.2 и Рис.3).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
360
«Выбросы» (Outliers) присутствуют только для показателей по шкале вербальной
агрессивности (VA) – имеется два участника с заниженными показателями вербальной
агрессивности.
Рисунок 2. Коробчатые диаграммы по шкалам агрессивности методики Басса-Дарки.
Рисунок 3. Коробчатая диаграмма показателей самооценки методики ДембоРубинштейна.
Большая асимметрия ( S ≤ 1.96 ⋅ SES = 0.39) наблюдается только по переменной
«Подозрительность».
Проверка нормальности распределения данных
Чтобы определить: какими тестами пользоваться для выявления связи параметрическими или непараметрическими, было проверено соответствие распределений
эмпирических данных нормальному распределению. Для проверки были использованы тест
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
361
Колмогорова-Смирнова с поправкой Лиллифора, тест Шапиро-Уилкса, тест асимметрии,
тест эксцесса и D'Agostino-Pearson Omnibus Test (Приложение С, Таблицы С1-С2). Также
было проведено визуальное исследование гистограмм с нормальной кривой (Приложение
С, Рис.С1-С9) и коробчатых диаграмм на наличие экстремальных значений - «выбросов»
(Рис.2-3). Оказалось, что распределения данных не соответствуют нормальному
распределению. Поэтому для исследования связи между самооценкой и шкалами методики
Басса-Дарки были выбраны непараметрические коэффициенты ранговой корреляции
Спирмена и τ-Кендалла.
Результаты проверки соответствия данных нормальному распределению и выбор
коэффициентов корреляции иллюстрируется Таблицей С3 Приложения С. Эмпирические
распределения всех данных не соответствуют нормальному распределению.
Корреляционный анализ
Так как распределения всех переменных отличаются от нормального распределения,
то для исследования связи были выбраны коэффициенты Спирмена и «Тау»-Кендалла
(Приложение С, Таблица С3). Все вычисленные коэффициенты корреляции оказались
статистически незначимыми (Приложение D, Таблицы D1-D2).
Есть тенденция к положительной связи «Самооценки» с «Подозрительностьм»:
rS (145) = .15, p = .071, размер эффекта небольшой, 95%CI = [-.013; .31].
Также найдена статистически незначимая отрицательная связь «Самооценки» с
«Раздражительностьм»: rS (145) = -.11, p = .18, ns, размер эффекта небольшой, 95%CI = [.27; .054].
Если нет нормального распределения, но отсутствуют выбросы, асимметрия
небольшая ( S ≤ 1.96 ⋅ SES ) и предполагается линейная связь, то можно использовать
коэффициент корреляции Пирсона (Наследов, 2004; с.89). В нашем случае только у
переменной «Вербальная агрессивность» имеется два выброса типа “Outliers”, которые не
могут существенно повлиять на среднее значение (Рис.2). Большая асимметрия имеется
только по переменной «Подозрительность». Были вычислены коэффициенты корреляции
Пирсона (Приложение D, Таблица D3).
Была
найдена
положительная
линейная
связь
«Самооценки»
с
«Подозрительностьм»: r (145) = .17, p = .046, размер эффекта небольшой, 95%CI = [.007;
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
362
.32]. Из-за большой асимметрии эта связь может быть поставлена под сомнение, но в случае
хорошей психологической интерпретации может быть признанной.
Также найдена тенденция к отрицательной линейной связи «Самооценки» с
«Раздражительностьм»: r (145) = -.15, p = .072, размер эффекта небольшой, 95%CI = [-.31;
.013].
Кроме этих двух случаев монотонной связи не обнаружено. Возможно, что есть
немонотонная связь.
Корреляционные диаграммы. Для иллюстрации приведены корреляционные
диаграммы (Рис.4-11). Все рисунки отредактированы в SPSS. Статистически незначимые
коэффициенты корреляции, у которых размер эффекта меньше минимального и
корреляционные диаграммы свидетельствуют в пользу того, что связь между самооценкой
и агрессивностью может оказаться нелинейной.
Рисунок 4. Самооценка – Физическая
агрессивность.
Рисунок 5. Самооценка – Косвенная
агрессивность.
Рисунок 7. Самооценка – Негативизм.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
363
Рисунок 6. Самооценка –
Раздражительность.
Рисунок 8. Самооценка – Обидчивость.
Рисунок 10. Самооценка – Вербальная
агрессивность.
Рисунок 9. Самооценка –
Подозрительность.
Рисунок 11. Самооценка – Чувство вины.
Нелинейный регрессионный анализ. Выбор линии регрессии
Анализ корреляционных диаграмм, также как и сами коэффициенты корреляции,
позволил сделать предположение о возможности нелинейной связи между самооценкой и
шкалами агрессивности. Для выявления нелинейной связи был проведен нелинейный
регрессионный анализ. Были рассмотрены линейная, квадратическая и кубическая модели
(Приложение Е, Таблицы Е1-Е16, Рис.Е1-Е16). Вычислялись коэффициенты детерминации
R 2 и проверялась их статистическая значимость. Исследование проводилось в двух
направлениях: зависимая и независимая переменные менялись местами. В результате были
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
364
выявлены возможные немонотонные связи. В качестве размера эффекта рассматривался
коэффициент детерминации. Использовалась интерпретация размера эффекта: .02 небольшой, .13 средний, .26 большой. Вычислялись доверительные интервалы для размера
эффекта. Результаты исследавания отражены в Таблице 1.
Таблица 1.
Самооценка
Самооценка
Самооценка
Зависимая
Физическая
агрессивност
ь
Косвенная
агрессивност
ь
Раздражител
ьность
Самооценка
Негативизм
Самооценка
Вербальная
агрессивност
ь
Вербальная
агрессивност
ь
Самооценка
Самооценка
Чувство вины
95% CI
.50
[.35; .65]
F(2, 142) = 71.5,
.44
Самооценка
Самооценка
Подозрительность
[.29; .60]
большой
.15
[.012; .29]
F(2, 142) = 12.7,
p < .001
[-.022; .096]
небольшой, тенденция
[-.039; .083]
небольшой, тенденция
отрицательная
.028
F(2, 142) = 50.5,
p < .001
F(2, 142) = 3.10,
p =.048
F(2, 142) = 22.4,
p < .001
средний
.037
F(2, 142) = 56.4,
p < .001
.42
[.26; .57]
большой
.042
[-.041; .13]
небольшой
.24
[.083; .40]
[-.041; .099]
небольшой,
положительная
.028
Самооценка
p < .001
большой
.022
Раздражител
ьность
Подозрительность
R2
Статистическая
значимость
модели
Размер эффекта
большой
Линейная
Независимая
Квадратическая
Переменные, N = 145
Модель
связи
Результаты выбора вида связи
[-.041; .099]
небольшой
положительная
F(2, 142) = 2.74,
p = .068
F(1, 143) = 3.29,
p = .072
F(1, 143) = 4.06,
p = .046
F(1, 143) = 2.15,
p = .046
На Рис.12-20 приведены корреляционные диаграммы с выбранными статистически
значимыми линиями регрессии. Данные связи необходимо подтвердить с помощью
коэффициентов корреляции. Можно сделать следующие предварительные выводы.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
365
Самооценка – Физическая агрессивность (Рис.12)
•
Для группы участников с низкой самооценкой при увеличении самооценки
физическая агрессивность уменьшается;
•
Для группы участников с высокой самооценкой при увеличении самооценки
физическая агрессивность увеличивается.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
366
Самооценка – Косвенная агрессивность (Рис.13)
•
Для группы участников с низкой самооценкой при увеличении самооценки
косвенная агрессивность уменьшается;
•
Для группы участников с высокой самооценкой при увеличении самооценки
косвенная агрессивность увеличивается.
Рисунок 12. Корреляционная диаграмма с Рисунок 13. Корреляционная диаграмма с
линией
регрессии:
самооценка
– линией регрессии: самооценка – косвенная
физическая агрессивность.
агрессивность.
Самооценка – Раздражительность (Рис.14)
•
Для группы участников с низкой самооценкой при увеличении самооценки
Раздражительность уменьшается;
•
Для группы участников с высокой самооценкой при увеличении самооценки
Раздражительность увеличивается.
Рисунок 14. Корреляционная диаграмма с
линией регрессии: самооценка –
Раздражительность.
Рисунок 15. Корреляционная диаграмма с
линией регрессии: Раздражительность самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
367
Раздражительность - Самооценка (Рис.15)
Для всей группы при уваеличении раздражения самооценка уменьшается.
Самооценка – Негативизм (Рис.16)
•
Для группы участников с низкой самооценкой при увеличении самооценки
негативизм увеличивается;
•
Для группы участников с высокой самооценкой при увеличении самооценки
негативизм уменьшается.
Рисунок 16. Корреляционная диаграмма с Рисунок 17. Корреляционная диаграмма с
регрессии:
самооценка
–
линией
регрессии:
самооценка
– линией
Подозрительность.
негативизм.
Самооценка – Подозрительность (Рис.17)
•
Самооценка и Подозрительность согласованно увеличиваются.
Самооценка – Вербальная агрессивность (Рис.18)
•
Для группы участников с низкой самооценкой при увеличении самооценки
вербальная агрессивность уменьшается;
•
Для группы участников с высокой самооценкой при увеличении самооценки
вербальная агрессивность увеличивается.
Вербальная агрессивность - Самооценка (Рис.19)
•
Для группы участников с низкой вербальной агрессией при увеличении вербальной
агрессивности самооценка увеличивается;
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
368
•
Для группы участников с высокой вербальной агрессией при увеличении
самооценки вербальная агрессивность увеличивается.
Рисунок 18. Корреляционная диаграмма с Рисунок 19. Корреляционная диаграмма с
линией
регрессии:
самооценка
– линией
регрессии:
самооценка
–
вербальная агрессивность.
вербальная агрессивность.
Рисунок 20. Корреляционная диаграмма с
линией регрессии: самооценка – чувство
вины.
Самооценка – Чувство вины (Рис.20)
•
Для группы участников с низкой самооценкой при увеличении самооценки чувство
вины увеличивается;
•
Для группы участников с высокой самооценкой при увеличении самооценки чувство
вины уменьшается.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
369
Таким образом, с помощью регрессионного анализа показано, что в некоторых случаях
возможна нелинейная немонотонная связь квадратического типа (Таблица 1). Для
обоснования этой связи разобьем выборку на две группы монотонности по медиане
независимой переменной (Наследов, 2004, с. 43) и вычислим коэффициенты корреляции в
каждой из групп.
Для исследования квадратической связи с помощью коэффициентов корреляции,
осуществим разбивку по медиане для переменных:
•
«Самооценка» (чтобы вычислить коэффициенты корреляции в группах подростков с
высокой самооценкой или с низкой самооценкой) с переменными «Физическая
агрессивность», «Косвенная агрессивность», «Раздражительность», «Негативизм»,
«Вербальная агрессивность», «Чувство вины»;
•
«Вербальная агрессивность» (чтобы вычислить коэффициенты корреляции в группах
подростков с высокой самооценкой или с низкой самооценкой) с переменной
«Самооценка».
Анализ двух групп самооценки
Распределение данных по самооценке статистически значимо отличается от
нормального распределения. Поэтому разбивка самооценки на две группы осуществлялась
с помощью медианы. Из таблицы В1 (Приложение В) находим, что Mdn = 62.3. Это значит,
что 50% оценок не превышает 62.3.
Ø Значение показателя, который меньше Mdn = 62.3 будем считать показателем
самооценки ниже среднего уровня, «низкой самооценкой»;
Ø Значение показателя, который больше Mdn = 62.3 будем считать показателем
самооценки выше среднего уровня, «высокой самооценкой»;
Описательные статистики приведены в Приложении В (Таблицы В2-В3).
На Рис.21 приведены коробчатые диаграммы по шкалам агрессивности для групп
участников с самооценкой ниже медианы и выше медианы.
На Рис.22 приведены коробчатые диаграммы по самооценке для групп участников с
самооценкой ниже медианы и выше медианы.
Проверка соответствия распределения данных нормальному распределению
приведена в Приложении С, Таблицы С4-С5. Выбор коэффициентов корреляции в
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
370
Приложении С, Таблицы С6-С7. Гистограммы с нормальной кривой для визуального
сравнения с нормальным распределением изображены на Рис.С10-С18, Приложение С.
Рисунок 21. Коробчатые диаграммы по шкалам агрессивности для групп участников с
самооценкой ниже медианы (Low) и выше медианы (High).
Рисунок 22. Коробчатая диаграмма для самооценки для групп участников с самооценкой
ниже медианы (Low) и выше медианы (High).
Распределение всех данных отличается от нормального распределения. Поэтому
были вычисены непараметрические коэффициенты корреляции Спирмена и Кендалла, а
также коэффициенты корреляции Пирсона (Приложение D, Таблицы D4-D6).
Для иллюстрации квадратическоц связи на Рис.23-28 изображены корреляционные
диаграммы с прямыми регрессии.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
371
Корреляционные диаграммы и коэффициенты корреляции показывают следующие
закономерности.
Самооценка – Физическая агрессивность
В группе участников с низкой самооценкой найдена линейная отрицательная
зависимость «Физической агрессивности» от «Самооценки» (Таблица D6):
r (73) = -.77; p<.001, размер эффекта большой, 95%CI = [-.85; -.66].
В группе участников с высокой самооценкой найдена линейная положительная
зависимость «Физической агрессивности» от «Самооценки»:
r (72) = .74; p<.001, размер эффекта большой, 95%CI = [.61; .83].
Корреляционная диаграмма с линиями регрессии показана на Рис.23.
Для всей группы участников корреляционная связь «Самооценки» с «Физической
агрессией» не найдена.
При увеличении «Физической агрессивности» «Самооценка» меняется случайным
образом (Таблица D1-D3).
Рисунок 23. Корреляционная диаграмма («Самооценка» – «Физическая агрессивность») с
прямыми регрессиями для участников с низкой самооценкой и для участников с высокой
самооценкой. Пунктиром изображена парабола, отображающая нелинейный характер
связи.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
372
Самооценка – Косвенная агрессивность
В группе участников с низкой самооценкой найдена линейная отрицательная
зависимость «Косвенной агрессивности» от «Самооценки» (Таблица D6):
r (73) = -.70; p<.001, размер эффекта большой, 95%CI = [-.80; -.56].
В группе участников с высокой самооценкой найдена линейная положительная
зависимость «Косвенной агрессивности» от «Самооценки»:
r (72) = .69; p<.001, размер эффекта большой, 95%CI = [.55; .80].
Для всей группы участников корреляционная связь «Самооценки» с «Косвенной
агрессией» не найдена.
При увеличении «Косвенной агрессивности» «Самооценка» меняется случайным
образом (Таблицы D1-D3).
Корреляционная диаграмма с линиями регрессии показана на Рис.24.
Рисунок 24. Корреляционная диаграмма (Самооценка – Косвенная агрессивность) с
прямыми регрессиями для всех участников, для участников с низкой самооценкой, для
участников с высокой самооценкой.
Самооценка – Раздражительность
В группе участников с низкой самооценкой найдена линейная отрицательная
зависимость «Раздражения» от «Самооценки» (Таблица D6):
r (73) = -.76; p<.001, размер эффекта большой, 95%CI = [-.84; -.64].
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
373
В группе участников с высокой самооценкой найдена монотонная положительная
зависимость «Раздражения» от «Самооценки»:
r (72) = .53; p<.001, размер эффекта большой, 95%CI = [.34; .68].
При увеличении «Раздражения» «Самооценка» имеет тенденцию уменьшаться
(Таблица D3):
r(145) = -.15 р = .072. Размер эффекта небольшой, 95%CI = [-.31; .013].
Корреляционная диаграмма с прямыми регрессии показана на Рис.25.
Рисунок 25. Корреляционная диаграмма (Самооценка – Раздражительность) с прямыми
регрессиями для всех участников, для участников с низкой самооценкой, для участников с
высокой самооценкой.
Самооценка – Негативизм
В группе участников с низкой самооценкой найдена линейная положительная
зависимость «Негативизма» от «Самооценки» (Таблица D6):
r (73) = .32; p =.005, размер эффекта средний, 95%CI = [.10; -.52].
В группе участников с высокой самооценкой В группе участников с высокой
самооценкой связь «Самооценки» с «негативизмом» не найдена. При увеличении
«Самооценки» «Негативизм» меняется случайным образом.
При увеличении «Негативизма» «Самооценка» меняется случайным образом.
Корреляционная диаграмма с линиями регрессии показана на Рис.26.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
374
Рисунок 26. Корреляционная диаграмма (Самооценка – Негативизм) с прямыми
регрессиями для всех участников, для участников с низкой самооценкой, для участников с
высокой самооценкой.
Самооценка – Вербальная агрессивность
Рисунок 27. Корреляционная диаграмма (Самооценка – Вербальная агрессивность) с
прямыми регрессиями для всех участников, для участников с низкой самооценкой, для
участников с высокой самооценкой.
В группе участников с низкой самооценкой найдена линейная отрицательная
зависимость «Вербальной агрессивности» от «Самооценки» (Таблица D6):
r (73) = -.53; p<.001, размер эффекта большой, 95%CI = [-.68; -.34].
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
375
В группе участников с высокой самооценкой найдена монотонная положительная
зависимость «Вербальной агрессивности» от «Самооценки» (Таблица D5): коэффициент
корреляции Спирмена
rS (72) = .56; p<.001, размер эффекта большой, 95%CI = [.61; .83].
Корреляционная диаграмма с прямыми регрессии показана на Рис.27.
Самооценка – Чувство вины
Рисунок 28. Корреляционная диаграмма (Самооценка – Чувство вины) с прямыми
регрессиями для всех участников, для участников с низкой самооценкой, для участников с
высокой самооценкой.
В группе участников с низкой самооценкой найдена тенденция к линейной
положительной зависимости «Чувства вины» от «Самооценки» (Таблица D6):
r (73) = .23; p =.051, размер эффекта между небольшим и средним, 95%CI = [-.002; .44].
Коэффициент корреляции Кендалла τ (73) = .17; p = .049 (Таблица D4)
В группе участников с высокой самооценкой статистически значимой зависимости
«Чувства вины» от «Самооценки» не найдено. Но коэффициент корреляции Пирсона
указывает на статистически незначимую отрицательную зависимость небольшого размера
эффекта «Чувства вины» от «Самооценки» (Таблица D5):
r (72) = -.14; p =.24, размер эффекта небольшой, 95%CI = [-.36; .095].
При увеличении «Чувства вины» «Самооценка» меняется случайным образом.
Корреляционная диаграмма с прямыми регрессии показана на Рис.28.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
376
Анализ двух групп вербальной агрессивности
Одним из результатов регрессионного анализа оказалась возможная квадратическая
связь, когда независимой переменной является «Вербальная агрессивность», а зависимой –
«Самооценка».
В данном исследовании распределение данных по вербальной агрессивности
статистически значимо отличается от нормального распределения. Поэтому разбивка
вербальной агрессивности на две группы осуществлялась с помощью медианы. Из таблицы
В1 (Приложение В) находим, что Mdn = 6. Это значит, что 50% оценок не превышает 6.
Разбиение:
Mdn < 6 - низкий уровень вербальной агрессивности (Low);
Mdn ≥ 6 - высокий уровень вербальной агрессивности (High).
Описательные статистики приведены в Приложении В (Таблица В4).
Рис.29. Коробчатые диаграммы для самооценки.
На Рис.29 приведены коробчатые диаграммы по самооценке для групп участников с
вербальной агрессией ниже медианы и выше медианы.
На Рис.30 приведены коробчатые диаграммы по вербальной агрессивности для
групп участников с вербальной агрессией ниже медианы и выше медианы.
Проверка соответствия распределения данных нормальному распределению
приведена в Приложении С, Таблицы С8-С9. Гистограммы с нормальной кривой для
визуального сравнения с нормальным распределением изображены на Рис.С17-С18,
Приложение С.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
377
Рис.30. Коробчатые диаграммы для вербальной агрессивности.
Распределения данных не соответствует нормальному распределению. Но по всем
переменным «выбросы» отсутствуют («выброс» на Рис.29 для низкой вербальной
агрессивности не может существенно исказить среднее значение). Но большая асимметрия
(Таблица В4) по «Вербальной агрессивности», как для низких, так и для высоких ее
значений не дает возможности использовать коэффициент корреляции Пирсона. Поэтому
были вычислены непараметрические коэффициенты корреляции Спирмена и Кендалла.
Вербальная агрессивность - Самооценка
При низкой «Вербальной агрессивности»:
В группе участников с низкой вербальной агрессией связь найдена тенденция к
отрицательной нелинейной зависимости «Самооценки» от «Вербальной агрессивности».
rS ( 71) = .21, p = .082 . размер эффекта между небольшим и средним, 95%CI = [-.025; .42].
τ ( 71) = .16, p = .082 .
В группе участников с высокой вербальной агрессией связь найдена отрицательная
нелинейная зависимость «Самооценки» от «Вербальной агрессивности». Коэффициент
корреляции Спирмена
rS ( 74 ) = −.40, p < .001 , размер эффекта между средним и большим, 95%CI = [-.58; -.19].
τ ( 71) = −.28, p = .002 .
Для всей группы участников корреляционная связь самооценки с вербальной
агрессией не найдена.
Корреляционная диаграмма с прямыми регрессии показана на Рис.31.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
378
Рисунок 31. Корреляционная диаграмма (Самооценка – Вербальная агрессивность) с
прямыми регрессиями для всех участников, для участников с низкой вербальной агрессией,
для участников с высокой вербальной агрессией.
Выводы по корреляционному анализу
«Самооценка» и «Физическая агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Физической агрессивности» от
«Самооценки»: r (73) = -.77; p<.001, 95%CI = [-.85; -.66] - при увеличении «Самооценки»
«Физическая агрессивность» уменьшается. Размер эффекта большой. В группе подростков
с высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .74; p<.001,
95%CI = [.61; .83] -
- при увеличении «Самооценки» «Физическая агрессивность»
увеличивается. Размер эффекта большой. При увеличении «Физической агрессивности»,
«Самооценка» меняется случайным образом.
«Самооценка» и «Косвенная агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Косвенной агрессивности» от
«Самооценки»: r (73) = -.70; p<.001, 95%CI = [-.80; -.56] - при увеличении «Самооценки»
«Косвенная агрессивность» уменьшается. Размер эффекта большой. В группе подростков с
высокой «Самооценкой» обнаружена положительная зависимость r (72) = .69; p<.001,
95%CI = [.55; .80] - при увеличении «Самооценки» «Косвенная агрессивность»
увеличивается. Размер эффекта большой. При увеличении «Косвенной агрессивности»,
«Самооценка» меняется случайным образом.
«Самооценка» и «Раздражительность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Раздражения» от «Самооценки»:
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
379
r (73) = -.76; p<.001, 95%CI = [-.84; -.64] - при увеличении «Самооценки»
«Раздражительность» уменьшается. Размер эффекта большой. В группе подростков с
высокой «Самооценкой» обнаружена положительная зависимость: r (72) = .53; p<.001,
95%CI = [.34; .68] - при увеличении «Самооценки» «Раздражительность» увеличивается.
Размер эффекта большой.
Обнаружена
тенденция
уменьшения
«Самооценки»
при
увеличении
«Раздражения»: r(145) = -.15 р = .072, 95%CI = [-.31; .013]. Размер эффекта небольшой
«Самооценка» и «Негативизм». В группе подростков с низкой «Самооценкой»
обнаружена положительная зависимость «Негативизма» от «Самооценки»: r (73) = .32; p
=.005, 95%CI = [.10; -.52] - при увеличении «Самооценки» «Негативизм» увеличивается.
Размер эффекта средний. В группе подростков с высокой «Самооценкой» связь не
обнаружена: при увеличении «Самооценки» «Негативизм» меняется случайным образом.
При увеличении «Негативизма», «Самооценка» меняется случайным образом.
«Самооценка» и «Обидчивость». Связь не обнаружена.
«Самооценка» и «Подозрительность». Обнаружена положительная связь r(145) =
.17; p = .046, 95%CI = [.007; .32]: «Самооценка» и «Подозрительность» согласованно
возрастают. Размер эффекта небольшой.
«Самооценка» и «Вербальная агрессивность». В группе подростков с низкой
«Самооценкой» обнаружена отрицательная зависимость «Вербальной агрессивности» от
«Самооценки»: rS (73) = - .54; p<.001, 95%CI = [-.69; -.35] - при увеличении «Самооценки»
«Вербальная агрессивность» уменьшается. Размер эффекта большой. В группе подростков
с высокой «Самооценкой» обнаружена положительная зависимость: rS (72) = .56; p<.001,
95%CI = [.38; .70] - при увеличении «Самооценки» «Вербальная агрессивность»
увеличивается. Размер эффекта большой.
В группе участников с низкой «Вербальной агрессией» обнаружена положительная
зависимость «Самооценки» от «Вербальной агрессивности»: rS (100) = .30; p = .002, 95%CI
= [.11; .47] - чем выше «Вербальная агрессивность», тем выше «Самооценка». Размер
эффекта средний.
В группе участников с высокой «Вербальной агрессией» обнаружена отрицательная
зависимость: rS (45) = - .45; p = .002, 95%CI = [-.66; -.18]. Чем выше «Вербальная
агрессивность», тем ниже «Самооценка». Размер эффекта ближе к большому.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
380
«Самооценка» и «Чувство вины». В группе подростков с низкой «Самооценкой»
обнаружена положительная зависимость «Чувства вины» от «Самооценки»: r (73) = .23; p
=.051, 95%CI = [-.002; .44], τ (73) = .17; p = .049: при увеличении «Самооценки» «Чувство
вины» увеличивается. Размер эффекта небольшой, ближе к среднему. В группе подростков
с высокой «Самооценкой» связь самооценки с «Чувством вины» не найдена: r (72) = -.14; p
= .24, размер эффекта небольшой, 95%CI = [-.36; .095] - при увеличении «Самооценки»
«Чувство вины» меняется случайным образом. Коэффициент корреляции Пирсона
указывает на статистически незначимую отрицательную зависимость небольшого размера
эффекта.
При увеличении «Чувства вины» «Самооценка» меняется случайным образом.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
381
Частотный анализ
Переход к низким, к высоким и к средним показателям
Переход к низким, высоким и средним показателям был осуществлен по
выборочным данным. Так как распределение выборочных данных не соответствует
нормальному распределению, то разбивка данных на три группы была осуществлена с
помощью квартилей Q1 и Q3 . Если баллы выше Q3 , то они были названы «высокими». Если
баллы находятся в интервале от Q1 до Q3 , то для самооценки они названы «адекватными»,
а для других переменных «средними». Если ниже Q1 , то оценки названы «низкими». Из
Таблицы В5 (Приложение В) находим, квартили Q1 и Q3 по всем переменным. Разбиение
данных осуществлено автоматически, с помощью программы Syntax.
Выходные данные частотного анализа с применением критерия «Хи-квадрат»
Пирсона показаны в Приложении F (Таблицы F1-F)
«Самооценка - Физическая агрессивность»
При помощи критерия «Хи-квадрат» Пирсона проверена взаимная независимость
переменных таблиц сопряженности. Таким образом, выявлена связь между переменными
«Самооценка» и «Физическая агрессивность» (Бююль & Цеффель, 2002)2: Chi-Square (4,
N=145) = 66.5, р <.001. Связь иллюстрируется Рис.32-33 и Таблицами F1-F2 Приложения F.
Из Рис.32 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с высокой
физической агрессией;
2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и
средней физической агрессией;
3) Среди подростков с высокой самооценкой больше всего подростков с высокой
физической агрессией.
Из Рис.33 видно, что
2
Бююль А., Цефель П. (2002). SPSS: искусство обработки информации. Анализ статистических данных и
восстановление скрытых закономерностей. Пер. с нем. СПб: ООО «ДиаСофтЮП».
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
382
1) Среди подростков с низкой физической агрессией преобладают подростки с
адекватной самооценкой;
2) Среди подростков со средней физической агрессией преобладают подростки с
адекватной самооценкой;
3) Среди подростков с высокой физической агрессией преобладают подростки с
высокими и низкими самооценками.
Рис.32. Распределение участников с высокой, Рис.33. Распределение участников с высокой,
средней и низкой физической агрессией по адекватной и низкой самооценкой по
физической агрессивности.
самооценке.
«Самооценка – Косвенная агрессивность»
При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными
«Самооценка» и «Косвенная агрессивность»: Chi-Square (4) = 65.0, р<.001. Связь
иллюстрируется Рис.34-35 и Таблицами F3-F4 Приложения F.
Из Рис.34 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с высокой
косвенной агрессией;
2) Среди подростков с адекватной самооценкой больше всего подростков с низкой
и средней косвенной агрессией;
3) Среди подростков с высокой самооценкой больше всего подростков с высокой
косвенной агрессией.
Из Рис.35 видно, что
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
383
1) Среди подростков с низкой косвенной агрессией преобладают подростки с
адекватной самооценкой;
2) Среди подростков со средней косвенной агрессией преобладают подростки с
адекватной самооценкой;
3) Среди подростков с высокой косвенной агрессией преобладают подростки с
высокими и низкими самооценками.
Рис.34. Распределение участников с высокой, Рис.35. Распределение участников с высокой,
средней и низкой косвенной агрессией по адекватной и низкой самооценкой по
самооценке.
косвенной агрессивности.
«Самооценка – Раздражительность»
При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными
«Самооценка» и «Раздражительность»: Chi-Square (4) = 73.4, р<.001. Связь иллюстрируется
Рис.36-37 и Таблицами F5-F6 Приложения F.
Из Рис.36 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с высоким
Раздражительностьм;
2) Среди подростков с адекватной самооценкой больше всего подростков с низким
и средним Раздражительностьм;
3) Среди подростков с высокой самооценкой больше всего подростков с высоким
Раздражительностьм.
Из Рис.37 видно, что
1) Среди подростков с низким Раздражительностьм преобладают подростки с
адекватной самооценкой;
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
384
2) Среди подростков со средним Раздражительностьм преобладают подростки с
адекватной самооценкой;
3) Среди подростков с высоким Раздражительностьм преобладают подростки с
высокими и низкими самооценками.
Рис.36. Распределение участников с высоким, Рис.37. Распределение участников с высокой,
средним и низким Раздражительностьм по адекватной и низкой самооценкой по
самооценке.
раздражению.
«Самооценка – Негативизм»
При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка»
и «Негативизм» не выявлена: Chi-Square (4) = 5.26, р = .261, ns.
Этот случай иллюстрируется Рис.38-39 и Таблицами F7-F8 Приложения F.
Из Рис.38 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с низким
негативизмом;
2) Среди подростков с адекватной самооценкой больше всего подростков с низким
и высоким негативизмом;
3) Среди подростков с высокой самооценкой больше всего подростков с низким
негативизмом.
Из Рис.39 видно, что
В каждой группе подростков с больше всего подростков с адекватной самооценкой.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
385
Рис.38. Распределение участников с высоким, Рис.39. Распределение участников с высокой,
средним и низким негативизмом по самооценке. адекватной и низкой самооценкой по
негативизму.
Напомним, что в группе участников с высокой самооценкой связь самооценки с
негативизмом не найдена. В группе участников с низкой самооценкой связь самооценки с
негативизмом монотонная, положительная. Коэффициент корреляции Спирмена
rS (73) = .28; p<.05 (Приложение D, Таблица D3).
«Самооценка – Обидчивость»
При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка»
и «Обидчивость» не найдена:
Chi-Square (4) = 8.46, р = .076, ns.
Этот случай иллюстрируется Рис.40-41 и Таблицами F9-F10 Приложения F.
Из Рис.40 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с низким
уровнем обиды;
2) Среди подростков с адекватной самооценкой больше всего подростков со
средним и с высоким уровнем обиды;
3) Среди подростков с высокой самооценкой присутствуют подростки с всеми
уровнями обиды примерно в одинаковом количестве.
Из Рис.41 видно, что
В каждой группе подростков с больше всего подростков с адекватной самооценкой.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
386
Рис.40. Распределение участников с высокой, Рис.41. Распределение участников с высокой,
средней и низкой обидой по самооценке.
адекватной и низкой самооценкой по обиде.
Напомним, что в группах участников с высокой самооценкой и с низкой
самооценкой, и во всей группе связь самооценки с обидой не найдена.
«Самооценка – Подозрительность»
При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка»
и «Подозрительность»не найдена: Chi-Square (4) = 8.46, р = .076, ns.
Этот случай иллюстрируется Рис.42-43 и Таблицами F11-F12 Приложения F.
Из Рис.42 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с низким
уровнем подозрительности;
2) Среди подростков с адекватной самооценкой в одинаковой степени
присутствуют подростки со всеми уровнями подозрительности;
3) Среди подростков с высокой самооценкой больше всего подростков с высоким и с
адекватным уровнями подозрительности.
Из Рис.43 видно, что
В каждой группе подростков с больше всего подростков с адекватной самооценкой.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
387
Рис.42. Распределение участников с высокой, Рис.43. Распределение участников с высокой,
средней и низкой Подозрительностью по адекватной и низкой самооценкой по
самооценке.
подозрительности.
С помощью корреляционного анализа связь самооценки с Подозрительностью не
найдена. Коэффициент корреляции Спирмена rS (145) = .15 (Таблица D1).
«Самооценка – Вербальная агрессивность»
При помощи критерия «Хи-квадрат» Пирсона выявлена связь между переменными
«Самооценка» и «Вербальная агрессивность»: Chi-Square (4) = 57.3, р<.001.
Найденная связь иллюстрируется Рис.44-45 и Таблицами F13-F14 Приложения F.
Из Рис.44 видно:
1) Среди подростков с низкой самооценкой больше всего подростков с высокой
вербальной агрессией;
2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и
средней вербальной агрессией;
3) Среди подростков с высокой самооценкой больше всего подростков с высокой и
средней вербальной агрессией.
Из Рис.45 видно, что
1) Среди подростков с низкой вербальной агрессией преобладают подростки с
адекватной самооценкой;
2) Среди подростков со средней вербальной агрессией преобладают подростки с
адекватной самооценкой;
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
388
3) Среди подростков с высокой вербальной агрессией преобладают подростки с
высокими и низкими самооценками.
Рис.44. Распределение участников с высокой, Рис.45. Распределение участников с высокой,
средней и низкой вербальной агрессией по адекватной и низкой самооценкой по
самооценке.
вербальной агрессивности.
«Самооценка – Чувство вины»
При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка»
и «Чувство вины» не выявлена: Chi-Square (4) = 2.75, р = .601, ns.
Этот факт иллюстрируется Рис.46-47 и Таблицами F15-F16 Приложения F.
Рис.44. Распределение участников с высоким, Рис.45. Распределение участников с высокой,
средним и низким чувством вины по адекватной и низкой самооценкой по уровням
самооценке.
чувства вины.
Очевидно, что различий в распределениях, а, следовательно, и связи между
переменными нет.
Хотя статистически значимых результатов не выявлено, ситуацию, на уровне
выборки, можно описать так:
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
389
1) Среди подростков с низкой самооценкой больше всего подростков с высоким и
низким уровнями чувства вины;
2) Среди подростков с адекватной самооценкой больше всего подростков с высоким
уровнем чувства вины;
3) Среди подростков с высокой самооценкой больше всего подростков с высоким и
низким уровнями чувства вины;
4) Среди подростков с низким уровнем чувства вины больше всего подростков с
адекватной самооценкой;
5) Среди подростков с адекватным уровнем чувства вины больше всего подростков
с адекватной самооценкой;
6) Среди подростков с высоким уровнем чувства вины больше всего подростков с
адекватной самооценкой.
Для уточнения можно сравнить процентные доли участников в разных категориях с
помощью критерия Фишера ϕ ∗ .
Исследование связи путем сравнения процентных долей с помощью
критерия Фишера ϕ ∗
С помощью критерия «Угловое преобразование Фишера» - ϕ ∗ сравнивались доли (в
процентах)
участников
по
самооценке
и
агрессивности
на
основании
таблиц
сопряженности (Приложение F). Сравнение проводилось с помощью Excel. Результаты
сравнения представлены в Приложении Н.
Результаты значимы на уровне значимости р < .05, если 1.64 ≤ ϕ ∗ <2.31;
Результаты значимы на уровне значимости р < .01, если 2.31 ≤ ϕ ∗ <3.09;
Результаты значимы на уровне значимости р < .001, если ϕ ∗ ≥ 3.09.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
390
Выводы из частотного анализа:
«Самооценка - Физическая агрессивность»
Выявлена связь между переменными «Самооценка» и «Физическая агрессивность»:
Chi-Square (4) = 66.5, р<.001.
1) Среди подростков с высокой физической агрессией в одинаковой степени
большие доли составляют подростки с высокой и низкой самооценками (р<.001).
2) Среди подростков со средней и низкой физической агрессией преобладает доля
подростков с адекватной самооценкой (р<.001).
3) Среди подростков с высокой самооценкой большую долю составляют подростки
с высокой физической агрессией, затем со средней физической агрессией (р<.01) и, затем с
низкой физической агрессией (р<.001).
4) Среди подростков с адекватной самооценкой большую долю составляют
подростки со средней физической агрессией и с низкой физической агрессией (р<.001).
5) Среди подростков с низкой самооценкой доля подростков с высокой физической
агрессией больше доли подростков со средней физической агрессией (р<.05) и больше доли
подростков с низкой физической агрессией (р<.001). Доля подростков со средней
физической агрессией больше доли подростков с низкой физической агрессией (р<.01)
«Самооценка – Косвенная агрессивность»
Выявлена связь между переменными «Самооценка» и «Косвенная агрессивность»:
Chi-Square (4) = 65.0, р<.001.
1) Среди подростков с высокой косвенной агрессией в одинаковой степени большие
доли составляют подростки с высокой и низкой самооценками (р<.001).
2) Среди подростков со средней и низкой косвенной агрессией преобладает доля
подростков с адекватной самооценкой (р<.001).
3) Среди подростков с высокой самооценкой большую долю составляют подростки
с высокой косвенной агрессией, затем со средней косвенной агрессией (р<.01) и, в меньшей
степени, с низкой косвенной агрессией (р<.01, р<.001 соответственно).
4) Среди подростков с адекватной самооценкой большую долю составляют
подростки со средней косвенной агрессией и с низкой косвенной агрессией (р<.001).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
391
5) Среди подростков с низкой самооценкой доля подростков с высокой косвенной
агрессией больше доли подростков со средней косвенной агрессией (р<.01), которая
больше доли подростков с низкой косвенной агрессией (р<.01).
«Самооценка – Раздражительность»
Выявлена связь между переменными «Самооценка» и «Раздражительность»:
Chi-Square (4) = 73.4, р <.001.
1) Среди подростков с высоким Раздражительностьм большую долю составляют
подростки низкой самооценкой, затем с высокой самооценкой (р<.05), затем с адекватной
самооценкой (р<.001).
2) Среди подростков со средним Раздражительностьм преобладает доля подростков
с адекватной самооценкой, затем с высокой самооценкой (р<.001). затем с низкой
самооценкой (р<.01).
3) Среди подростков с низким Раздражительностьм преобладает доля подростков с
адекватной самооценкой (р<.001).
4) Среди подростков с высокой самооценкой большую долю составляют подростки
с высоким Раздражительностьм, затем со средним Раздражительностьм (р<.05), затем с
низким Раздражительностьм (р<.05). Доля подростков с высоким Раздражительностьм
превышает долю подростков с низким Раздражительностьм (р<.001).
5) Среди подростков с адекватной самооценкой большую долю составляют
подростки со средним и низким Раздражительностьм (р<.001).
6) Среди подростков с низкой самооценкой доля подростков с высоким
Раздражительностьм самая большая (р<.001).
«Самооценка – Негативизм»
Связь между переменными «Самооценка» и «Негативизм» не найдена:
Chi-Square (4) = 5.26, р = .261, ns.
1) Среди подростков с низкой самооценкой подростков с низким негативизмом
больше, чем подростков с высоким негативизмом (р<.01).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
392
2) Среди подростков с адекватной самооценкой больше всего подростков с низким
и высоким негативизмом, чем со средним негативизмом (р<.05) и (р<.01) соответсвенно.
3) Среди подростков с высокой самооценкой больше всего подростков с низким
негативизмом (р<.05).
4) В группе подростков с высоким негативизмом больше всего подростков с
адекватной самооценкой (р<.001).
5) В группе подростков со средним негативизмом больше подростков с адекватной
самооценкой, чем с высокой самооценкой (р<.05).
6) В группе подростков с низком негативизмом больше подростков с адекватной
самооценкой, чем с высокой самооценкой (р<.05).
«Самооценка – Обидчивость»
При помощи критерия «Хи-квадрат» Пирсона связь между переменными «Самооценка»
и «Обидчивость» не найдена:
Chi-Square (4) = 8.46, р = .076, ns.
1) Среди подростков с низкой самооценкой подростков со средним уровнем обиды
больше, чем подростков с высоким уровнем обиды (р<.05) и с низким уровнем обиды
больше, чем с высоким уровнем обиды (р<.001).
2) Среди подростков с адекватной самооценкой подростков со средним уровнем
обиды больше, чем подростков с низким уровнем обиды (р<.05);
3) Среди подростков с высокой самооценкой присутствуют подростки с всеми
уровнями обиды примерно в одинаковом количестве.
4) В группе подростков с высокой обидой больше всего подростков с адекватной
самооценкой (р<.001).
5) В группе подростков со средним уровнем обиды больше подростков с адекватной
самооценкой, чем с высокой самооценкой (р<.001).
6) В группе подростков с низким уровнем обиды доли подростков по самооценке
имеют случайные отличия.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
393
«Самооценка – Подозрительность»
Связь между переменными «Самооценка» и «Подозрительность» не найдена:
Chi-Square (4) = 8.46, р = .076, ns.
1) Среди подростков с низкой самооценкой больше подростков с низким уровнем
подозрительности, чем с высоким (р<.05).
2) Среди подростков с адекватной самооценкой в одинаковой степени присутствуют
подростки со всеми уровнями подозрительности.
3) Среди подростков с высокой самооценкой подростков с высоким уровнем
подозрительности больше, чем с низким уровнем подозрительности (р<.01).
4) В группе подростков с высокой Подозрительностью подростков с адекватной
самооценкой больше, чем подростков высоким уровнем самооценки (р<.05), что, в свою
очередь, больше, чем с низким уровнем самооценки (р<.05). Доля подростков со средним
уровнем самоооценки больше доли с низком уровнем (р<.001).
5) В группе подростков со средним уровнем подозрительности доля подростков с
адекватной самооценкой, самая большая (р<.01).
6) В группе подростков с низким уровнем подозрительности доли подростков с
адекватной самооценкой больше доли подростков с высокой самооценкой (р<.001). Доля
подростков с низкой самооценкой больще доли подростков с высокой самооценкойй
(р<.01).
«Самооценка – Вербальная агрессивность»
Выявлена связь между переменными «Самооценка» и «Вербальная агрессивность»:
Chi-Square (4) = 57.3, р<.001.
1) Среди подростков с низкой самооценкой больше всего подростков с высокой
вербальной агрессией (р<.001).
2) Среди подростков с адекватной самооценкой больше всего подростков с низкой и
средней вербальной агрессией (р<.001).
3) Среди подростков с высокой самооценкой больше всего подростков с высокой и
средней вербальной агрессией (р<.001).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
394
4) Среди подростков с низкой вербальной агрессией преобладают подростки с
адекватной самооценкой (р<.001).
5) Среди подростков со средней вербальной агрессией самая большая доля
подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001), затем с
низкой самооценкой (р<.05).
6) Среди подростков с высокой вербальной агрессией преобладают подростки с
высокими и низкими самооценками (р<.001).
«Самооценка – Чувство вины»
Связь между переменными «Самооценка» и «Чувство вины» не выявлена: Chi-Square
(4) = 2.75, р = .601, ns.
1) Среди подростков с высоким чувством вины большую долю составляют
подростки с адекватной самооценкой (р<.001).
2) Среди подростков со средним уровнем чувством вины большую долю составляют
подростки с адекватной самооценкой (р<.05).
3) Среди подростков с низким чувством вины, доли подростков с высокой, средней
и адекватной самооценками различаются статистически незначимо.
4) Среди подростков с высокой самооценкой доли подростков с высоким, средним и
низким чувством вины различаются статистически незначимо.
5) Среди подростков адекватной самооценкой доля подростков с высоким чувством
вины больше доли подростков со средним и низким чувством вины (р<.001).
6) Среди подростков с низкой самооценкой доля подростков с высоким чувством
вины больше, чем со средними (р<.05).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
395
Обобщение результатов
Статистический анализ данных (корреляционный анализ с коэффициентами
корреляции Пирсона, частотный анализ с помощью критерия «Хи-квадрат» Пирсона,
сравнение долей с помощью критерия «Угловое преобразование Фишера») показал
следующие результаты.
1. Самооценка – Физическая агрессивность
Выявлена связь между переменными: Chi-Square (4) = 66.5, р <.001.
1.1. В группе подростков с высокой самооценкой связь самооценки с физической
агрессией монотонная, положительная ( rS (72) = 0.70; р<.001). Чем выше самооценка, тем
выше физическая агрессивность. Большую долю составляют подростки с высокой
физической агрессией, затем со средней физической агрессией (р<.01) и, затем с низкой
физической агрессией (р<.001).
1.2. В группе подростков с низкой самооценкой связь самооценки с физической
агрессией монотонная, отрицательная ( rS (73) = - .72; р<.001). Чем выше самооценка, тем
ниже физическая агрессивность. Доля подростков с высокой физической агрессией больше
доли подростков со средней физической агрессией (р<.05) и больше доли подростков с
низкой физической агрессией (р<.001).
1.3. Среди подростков с адекватной самооценкой большую долю составляют
подростки со средней и с низкой физической агрессией (р<.001).
1.4. Среди подростков с высокой физической агрессией в одинаковой степени
большие доли составляют подростки с высокой и низкой самооценками (р<.001).
1.5. Среди подростков со средней и с низкой физической агрессией доля подростков
с адекватной самооценкой самая большая (р<.001).
2. Самооценка – Косвенная агрессивность
Выявлена связь между переменными: Chi-Square (4) = 65.0, р<.001.
2.1. В группе подростков с высокой самооценкой связь самооценки с косвенной
агрессией монотонная, положительная ( rS (72) = .69; р<.001). Чем выше самооценка, тем
выше косвенная агрессивность. Большую долю составляют подростки с высокой косвенной
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
396
агрессией, затем со средней косвенной агрессией (р<.01) и, в меньшей степени, с низкой
косвенной агрессией (р<.01, р<.001 соответственно).
2.2. В группе подростков с низкой самооценкой связь самооценки с косвенной
агрессией монотонная, отрицательная ( rS (73) = - .68, р<.001). Чем выше самооценка, тем
ниже косвенная агрессивность. Доля подростков с высокой косвенной агрессией больше
доли подростков со средней косвенной агрессией (р<.01), которая больше доли подростков
с низкой косвенной агрессией (р<.01).
2.3. Среди подростков с адекватной самооценкой большую долю составляют
подростки со средней и с низкой косвенной агрессией (р<.001).
2.4. Среди подростков с высокой косвенной агрессией в одинаковой степени
большие доли составляют подростки с высокой и низкой самооценками (р<.001).
2.5. Среди подростков со средней и низкой косвенной агрессией преобладает доля
подростков с адекватной самооценкой (р<.001).
3. Самооценка – Раздражительность
Выявлена связь между переменными: Chi-Square (4) = 73.4, р<.001.
3.1. В группе подростков с высокой самооценкой связь самооценки с
Раздражительностьм монотонная, положительная ( rS (72) = .52, р<.001). Чем выше
самооценка, тем выше Раздражительность. Большую долю составляют подростки с
высоким Раздражительностьм, затем со средним Раздражительностьм (р<.05), затем с
низким Раздражительностьм (р<.05). Доля подростков с высоким Раздражительностьм
превышает долю подростков с низким Раздражительностьм (р<.001).
3.2.
В
группе
подростков
с
низкой
самооценкой
связь
самооценки
с
Раздражительностьм монотонная, отрицательная ( rS (73) = - .77, р<.001). Чем выше
самооценка,
тем
ниже
Раздражительность.
Доля
подростков
с
высоким
Раздражительностьм самая большая (р<.001).
3.3. Среди подростков с высоким Раздражительностьм большую долю составляют
подростки низкой самооценкой, затем с высокой самооценкой (р<.05), затем с адекватной
самооценкой (р<.001).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
397
3.4. Среди подростков со средним Раздражительностьм преобладает доля
подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001). затем с
низкой самооценкой (р<.01).
3.5. Среди подростков с адекватной самооценкой большую долю составляют
подростки со средним и низким Раздражительностьм (р<.001).
4. Самооценка – Негативизм
4.1. В группе подростков с высокой самооценкой связь самооценки с негативизмом
не найдена. При увеличении самооценки негативизм меняется случайным образом. Среди
подростков с высокой самооценкой больше всего подростков с низким негативизмом
(р≤0.05).
4.2. В группе подростков с низкой самооценкой связь самооценки с негативизмом
монотонная, положительная ( rS (73) = .28, р<.05).Чем выше самооценка, тем выше
негативизм. Доля подростков с низким негативизмом больше, чем подростков с высоким
негативизмом (р<.01).
4.3. Среди подростков с адекватной самооценкой больше всего подростков с низким
и высоким негативизмом, чем со средним негативизмом (р<.05) и (р<.01) соответсвенно.
4.4. В группе подростков с высоким негативизмом больше всего подростков с
адекватной самооценкой (р<.001).
4.5. В группе подростков со средним негативизмом больше подростков с адекватной
самооценкой, чем с высокой самооценкой (р<.05).
4.6. В группе подростков с низким негативизмом больше доля подростков с
адекватной самооценкой, чем с высокой самооценкой (р<.05).
5. Самооценка – Обидчивость
Корреляционная связь самооценки с обидой не найдена. При помощи критерия «Хиквадрат» Пирсона связь между переменными «Самооценка» и «Обидчивость» не найдена.
Сравнение долей показало:
5.1. Среди подростков с низкой самооценкой доля подростков с низким уровнем
обиды больше, чем с высоким уровнем обиды (р<.001). Доля подростков со средним
уровнем обиды больше, чем доля подростков с высоким уровнем обиды (р<.05).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
398
5.2. Среди подростков с адекватной самооценкой подростков со средним уровнем
обиды больше, чем подростков с низким уровнем обиды (р<.05).
5.3. Среди подростков с высокой самооценкой присутствуют подростки с всеми
уровнями обиды примерно в одинаковом количестве.
5.4. В группе подростков с высокой обидой больше всего доля подростков с
адекватной самооценкой (р<.001).
5.5. В группе подростков со средним уровнем обиды больше доля подростков с
адекватной самооценкой, чем с высокой самооценкой (р<.001).
5.6. В группе подростков с низким уровнем обиды доли подростков по самооценке
имеют случайные отличия.
6. Самооценка – Подозрительность
Корреляционная связь самооценки с Подозрительностью, найденая с помощью
ркгрессионного анализа, линейная, положительная. Коэффициент корреляции Пирсона
r (145) = .17 , p<.05. Использование коэффициента корреляции Пирсона возможно при
наличии удовлетворительной интерпретации этой связи. По обеим переменным
отсутствуют «выбросы» (Рис.2-3), асимметрия по переменной «Самооценка» по
абсолютной величине не превышает свою стандартную ошибку, по переменной
«Подозрительность» положительная асимметрия хоть и превышает свою стандартную
ошибку, но не является очень большой (Таблица В1, Приложение В). Таким образом, при
наличии интерпретации, можно считать, что самооценка и Подозрительность у подростков
согласованно возрастают.
При помощи критерия «Хи-квадрат» Пирсона связь между переменными
«Самооценка» и «Подозрительность» не найдена.
Сравнение долей показало:
6.1. Среди подростков с низкой самооценкой больше доля подростков с низким
уровнем подозрительности, чем с высоким (р<.05).
6.2. Среди подростков с адекватной самооценкой в одинаковой степени
присутствуют подростки со всеми уровнями подозрительности.
6.3. Среди подростков с высокой самооценкой доля подростков с высоким уровнем
подозрительности больше, чем с низким уровнем подозрительности (р<.01).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
399
6.4. В группе подростков с высокой Подозрительностью подростков с адекватной
самооценкой больше, чем подростков высоким уровнем самооценки (р<.05), что, в свою
очередь, больше, чем с низким уровнем самооценки (р<.05). Доля подростков с адекватным
уровнем самоооценки больше доли с низком уровнем (р<.001).
6.5. В группе подростков со средним уровнем подозрительности доля подростков с
адекватной самооценкой, самая большая (р<.01).
6.6. В группе подростков с низким уровнем подозрительности доли подростков с
адекватной самооценкой больше доли подростков с высокой самооценкой (р<.001). Доля
подростков с низкой самооценкой больше доли подростков с высокой самооценкой (р<.01).
Таким образом, можно считать, что из сравнения долей также следует, что
самооценка и Подозрительность у подростков согласованно возрастают.
7. Самооценка – Вербальная агрессивность
Выявлена связь между переменными: Chi-Square (4) = 57.3, р<.001.
7.1. В группе подростков с высокой самооценкой связь самооценки с вербальной
агрессией монотонная, положительная ( rS (72) = .56; p<.001). Чем выше самооценка, тем
выше вербальная агрессивность. Больше всего доли подростков с высокой и средней
вербальной агрессией (р<.001).
7.2. В группе подростков с низкой самооценкой связь самооценки с вербальной
агрессией монотонная, отрицательная ( rS (73) = - .54; p<.001). Чем выше самооценка, тем
ниже вербальная агрессивность. Больше всего доля подростков с высокой вербальной
агрессией (р<.001).
7.3. Среди подростков с адекватной самооценкой больше всего доли подростков с
низкой и средней вербальной агрессией (р<.001).
7.4. В группе подростков с высокой вербальной агрессией связь самооценки с
вербальной агрессией монотонная отрицательная ( rS (45) = - .45; p<.01). Чем выше
вербальная агрессивность, тем ниже самооценка. Самые большие доли подростков с
высокими и низкими самооценками (р<.001).
7.5. В группе подростков с низкой вербальной агрессией связь самооценки с
вербальной агрессией монотонная, положительная. ( rS (100) = .30; p<.01). Чем выше
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
400
вербальная агрессивность, тем выше самооценка. Самую большую долю составляют
подростки с адекватной самооценкой (р<.001).
7.6. Среди подростков со средней вербальной агрессией самая большая доля
подростков с адекватной самооценкой, затем с высокой самооценкой (р<.001), затем с
низкой самооценкой (р<.05).
8. Самооценка – Чувство вины
Корреляционная связь самооценки с переменной «Чувство вины» не найдена. При
помощи критерия «Хи-квадрат» Пирсона связь между переменными также не найдена.
Сравнение долей показало:
8.1. В группе подростков с высокой самооценкой корреляционная связь самооценки
с «чувством вины» не найдена. Доли подростков с высоким, средним и низким чувством
вины различаются статистически незначимо.
8.2. В группе подростков с низкой самооценкой найдена положительная монотонная
связь самооценки с чувством вины (р<.05). Доля подростков с высоким чувством вины
больше, чем со средними (р<.05).
8.3. Среди подростков адекватной самооценкой доля подростков с высоким
чувством вины больше доли подростков со средним и низким чувством вины (р<.001).
8.4. Среди подростков с высоким чувством вины большую долю составляют
подростки с адекватной самооценкой (р<.001).
8.5. Среди подростков со средним уровнем чувства вины большую долю составляют
подростки с адекватной самооценкой (р<.05).
8.6. Среди подростков с низким чувством вины, доли подростков с высокой, средней
и адекватной самооценками различаются статистически незначимо.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
401
Литература
Наследов
Данные, обработанные в соответствии с ключами методик Дембо-Рубинштейна
(Под ред. Корниловой, 2008) и Басса-Дарки (Батаршев, 2005, сс. 195-200) приведены в
Таблице А1 (Приложение А).
В настоящей работе приняты обозначения, используемые в таблицах и рисунках
(“Questionnaire Bass-Darky”, n. d.; Buss & Durkee, 1957; Bakholdina, Bakholdina, Movsesiana,
& Stupina, 2014.).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
402
Приложение А
Исходные данные
Таблица А1.
Показатели агрессивности и самооценки
Code
94
139
96
140
66
77
110
114
134
71
88
101
109
115
116
120
122
125
129
130
135
138
142
144
75
97
100
102
103
104
119
141
68
76
79
83
98
106
107
126
128
131
132
133
137
SE
PhA
IA
I
N
R
S
VA
G
62
61
66
55
63
51
66
62
55
54
70
69
54
62
66
59
56
59
62
60
54
70
54
61
66
71
47
58
59
66
64
61
74
74
74
70,16
71
70
61
65
63
59
55
60
64
1
2
5
2
1
2
2
4
3
3
2
2
4
2
4
2
2
2
4
5
2
3
2
4
3
2
2
3
3
4
5
2
4
2
2
2
3
2
3
4
3
4
2
5
2
4
3
2
6
3
2
1
1
4
4
5
3
4
4
2
2
4
3
2
3
4
2
4
2
3
5
5
2
2
3
2
5
3
2
1
3
2
6
2
5
5
5
2
3
1
2
4
1
6
4
5
4
2
4
2
5
5
4
4
4
6
5
2
3
3
3
2
5
2
5
5
5
3
2
4
1
5
2
4
4
5
5
5
5
6
4
6
4
4
5
4
5
5
1
4
1
5
5
2
3
2
4
4
2
2
3
4
2
2
5
2
5
3
4
3
4
5
4
1
2
5
5
4
2
2
3
4
1
4
3
3
3
2
5
5
3
2
2
5
2
4
3
3
2
5
4
5
3
3
1
1
5
1
3
5
2
5
2
4
3
2
6
3
3
4
5
2
1
4
2
6
2
5
4
2
5
4
2
4
5
2
4
2
4
2
4
3
5
5
3
3
4
3
2
2
5
3
5
5
5
3
2
2
5
4
2
2
5
5
2
2
5
4
5
5
2
5
5
4
2
5
2
2
4
5
5
2
2
1
4
2
3
3
3
5
3
3
2
4
2
2
3
6
3
2
5
5
3
5
3
4
4
5
6
3
5
5
6
6
6
5
4
5
4
2
5
2
6
3
6
5
5
5
7
5
2
9
2
1
5
4
4
2
1
5
5
5
2
4
2
5
2
5
2
5
1
1
2
5
5
2
5
7
2
9
8
2
5
4
4
6
6
3
4
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
403
145
33
62
63
65
69
70
74
78
82
85
87
91
95
99
108
143
64
81
89
93
111
112
118
127
61
67
72
73
80
105
113
117
123
124
90
92
136
84
86
121
12
2
3
4
7
8
23
26
34
1
9
10
71
35
72
58
49
51
74
74
70
65
52
59
63
70
71
60
70
62
70
65
70
70
47
61
62
61
70
74
68
55
66
70
71
57
58
62
60
71
63
54
55
88
85
77
91
66
80
78
80
43
81
80
83
5
6
4
4
2
3
3
4
4
2
5
2
1
6
5
2
2
4
3
4
5
5
4
4
5
5
2
4
5
5
3
4
4
5
4
6
6
5
5
6
4
7
8
9
7
8
8
9
7
8
9
9
7
2
8
5
5
2
6
5
3
3
1
5
5
1
3
3
6
1
2
1
4
2
2
2
4
2
5
5
2
2
2
2
4
4
3
2
1
2
2
1
5
6
6
7
8
7
7
8
7
8
7
7
8
8
4
6
2
5
5
4
6
2
4
6
2
5
6
5
2
5
5
5
5
4
4
5
5
4
4
4
6
6
4
5
5
5
6
5
5
5
5
6
8
7
6
5
6
4
5
5
6
5
8
7
5
7
7
3
3
5
5
3
3
2
5
2
2
4
3
2
5
2
2
5
2
3
3
2
2
3
2
3
4
4
3
5
3
2
4
3
5
4
3
2
4
4
2
2
3
3
4
5
1
2
2
3
2
3
3
1
2
2
6
4
2
3
3
5
4
1
3
3
3
1
5
2
5
8
5
3
5
5
2
2
1
5
4
5
4
6
4
3
3
6
8
5
5
4
4
5
4
5
4
3
3
4
3
8
4
4
5
3
3
5
4
4
4
4
2
4
8
3
3
2
5
4
9
5
4
2
2
2
5
3
5
2
2
2
3
5
3
2
4
5
5
2
5
3
2
5
2
4
4
5
3
2
4
5
1
5
2
5
4
5
3
6
3
1
7
4
6
6
4
7
5
5
6
6
6
2
6
6
6
5
6
6
5
4
5
6
5
6
7
5
6
5
7
6
5
5
6
5
5
5
4
4
7
6
5
6
7
7
6
6
5
5
7
5
7
5
2
5
4
8
6
4
4
6
7
1
7
2
5
5
4
4
6
4
6
6
2
2
5
4
4
4
5
4
5
6
1
2
5
4
5
5
4
1
5
5
6
6
2
2
5
4
2
2
5
4
4
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
404
13
18
20
24
29
31
38
11
16
21
22
30
32
35
47
48
55
5
14
27
36
37
40
44
56
58
17
25
28
39
41
42
43
53
54
57
60
15
19
46
49
50
51
45
52
59
6
77
80
83
82
83
45
44
84
82
92
75
79
31
41
38
49
42
79
78
87
43
42
31
43
43
44
79
75
84
36
42
51
41
40
41
42
43
88
81
43
43
42
41
42
42
41
85
9
8
7
9
9
8
9
8
7
7
8
8
9
7
7
8
7
9
10
8
9
8
9
7
8
7
8
9
9
7
9
8
8
8
8
9
8
9
9
9
9
8
8
8
9
9
10
7
5
4
9
7
7
8
7
9
8
9
8
7
8
4
5
8
8
5
7
6
7
8
5
8
5
4
8
5
8
7
6
7
7
9
7
8
8
5
9
1
4
8
8
9
7
6
5
5
7
7
7
8
7
8
7
8
9
8
9
8
7
7
8
8
6
9
9
7
7
7
7
7
8
8
8
8
8
9
8
8
9
7
8
9
9
8
7
8
9
9
9
8
9
2
2
2
2
5
4
3
1
3
4
1
2
4
2
1
1
1
1
2
3
1
4
3
1
3
2
5
1
1
1
2
4
3
2
3
3
1
3
2
1
2
2
3
3
2
4
5
2
2
5
2
2
2
6
1
2
3
4
4
4
2
5
2
3
4
4
2
2
3
4
3
5
1
1
3
3
1
1
5
4
2
2
1
2
4
2
5
4
5
2
5
5
5
4
5
2
2
2
3
4
2
3
2
2
4
4
5
2
3
5
5
5
4
3
2
6
4
2
8
5
2
2
5
4
2
2
5
3
3
8
2
2
2
5
3
5
6
2
7
8
7
5
5
5
5
6
8
7
5
6
4
7
8
7
7
6
7
6
5
8
7
9
8
9
8
7
7
9
7
7
8
8
7
8
8
7
7
8
9
9
8
9
8
9
8
5
8
2
2
6
5
4
4
2
2
7
5
6
3
5
2
5
4
4
5
6
4
5
5
7
5
4
5
3
2
1
3
4
5
4
4
5
2
2
1
5
1
2
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
405
Приложение В
Описательные статистики
В Таблицах В1-В3 отмечены случаи, когда показатели асимметрии и эксцесса по
абсолютной величине превосходят свои стандартные ошибки. В этих случаях
распределение данных отличается от нормального распределения.
Таблица В1.
145
145
62.30
5.36
4.70
5.56
2.89
3.41
3.66
5.50
3.99
1.19
0.22
0.20
0.17
0.11
0.13
0.12
0.16
0.16
Median
62.33
5.00
5.00
5.00
3.00
3.00
4.00
6.00
4.00
Std. Deviation
14.27
2.66
2.42
2.06
1.28
1.58
1.50
1.88
1.94
Skewness, S
-0.14
0.04
0.14
-0.12
0.17
0.31
0.64
-0.26
-0.04
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
-0.77
-1.38
-1.26
-0.64
-0.89
-0.02
0.52
-0.40
-0.32
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
Range
60.34
10.00
8.00
8.00
5.00
8.00
8.00
8.00
9.00
Minimum
31.16
0.00
1.00
1.00
0.00
0.00
1.00
1.00
0.00
Maximum
91.50
10.00
9.00
9.00
5.00
8.00
9.00
9.00
9.00
25
52.91
3.00
2.00
4.00
2.00
2.00
2.00
4.50
2.00
50
62.33
5.00
5.00
5.00
3.00
3.00
4.00
6.00
4.00
75
71.58
8.00
7.00
7.00
4.00
5.00
5.00
7.00
5.00
Mean
Std. Error of Mean
Std. Error of Skewness
Kurtosis, K
Std. Error of Kurtosis
Percentiles
Guilt
145
Verbal
145
Distrust
145
Missing
Aggression
Suspicion and
Resentment
Irritation
145
Negativism
Aggression
145
Indirect
145
Valid
Physical
145
N
Aggression
Self-Esteem
Описательные статистики
Замечание. В Таблице В1 отмечены случаи, когда показатели асимметрии S и эксцесса K
превосходят свои стандартные ошибки (SES и SEK соответственно), умноженные на 1.96:
1.96 ⋅ SES = 0.39 , 1.96 ⋅ SES = 0.78 . В этих случаях соответствующие показатели считаются
большими.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
406
Таблица В2
Описательные статистики для участников с самооценкой ниже медианы
N
Valid
Missing
Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
SelfEsteem
73
50.8
53.8
8.96
-.30
.28
-1.19
.56
31.0
31.0
62.0
Physical
Indirect
Irritation
Aggression
Aggression
73
73
73
5.30
4.78
5.62
5.00
5.00
5.00
2.64
2.39
2.21
-.05
.079
-.243
.28
.28
.28
-1.34
-1.25
-.75
.56
.56
.56
9.00
8
8
0.000
1
1
9.00
9
9
Negativism
73
2.93
3.00
1.26
.047
.28
-.74
.56
5
5
Verbal
Aggression
73
5.58
5.00
2.121
-.103
.28
-.81
.56
8
1
9
Guilt
73
3.89
4.00
1.87
-0.97
.28
-0.26
.56
9.00
0.000
9.00
a. Self-Esteem = Low
Таблица В3
Описательные статистики для участников с самооценкой выше медианы
N
Valid
Missing
Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
SelfEsteem
72
74.0
71.6
7.55
.43
.28
-.71
.56
29.0
63.0
92.0
Physical
Indirect
Irritation
Aggression
Aggression
72
72
72
5.42
4.61
5.50
5.00
4.00
5.00
2.70
2.45
1.91
.13
.21
.038
.28
.28
.28
-1.45
-1.26
-.48
.56
.56
.56
9.00
8.00
7.00
1.00
1.00
2.00
10.0
9.00
9.00
Negativism
72
2.85
3.00
1.30
.29
.28
-.99
.56
4.00
1.00
5.00
Verbal
Guilt
Aggression
72
72
5.43
4.08
6.00
4.00
1.61
2.01
-0.72 -0.021
0.28
.28
0.11 -0.35
0.56
.56
7.00
9.00
1.00 0.000
8.00
9.00
a. Self-Esteem = High
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
407
Таблица B4
Описательные статистики для участников с низкой и с высокой вербальной
агрессией
Verbal Aggression
low
Verbal Aggression
high
SelfEsteem
71
Verbal
Aggression
71
SelfEsteem
74
Verbal
Aggression
74
Mean
62.06
3.96
62.53
6.99
Median
62.16
4.00
65.58
7.00
Std. Deviation
10.57
1.22
17.16
0.99
Skewness
N
Valid
Missing
-0.42
-0.78
-0.09
0.64
Std. Error of Skewness
0.28
0.28
0.28
0.28
Kurtosis
0.66
-0.70
-1.39
-0.65
Std. Error of Kurtosis
0.56
0.56
0.55
0.55
Range
53.50
4.00
60.34
3.00
Minimum
31.33
1.00
31.16
6.00
Maximum
84.83
5.00
91.50
9.00
1.96*SES
0.56
0.56
0.55
0.55
1.96*SEK
1.10
1.10
1.08
1.08
Таблица В5
2.00
2.00
4.50
2.00
Q3
71.6
8.00
7.00
7.00
4.00
5.00
5.00
7.00
5.00
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
Guilt
Suspicion
2.00
Aggression
Resentment
4.00
Verbal
Negativism
2.00
Aggression
3.00
Indirect
52.9
Aggression
Q1
Physical
Irritation
Self-Esteem
Квартили Q1 и Q3
408
Приложение С
Проверка нормальности распределения данных
В Таблице С1 показана проверка нормальности распределения данных для шкал
агрессивности и самооценки c использованием трех тестов: асимметрии, эксцесса и
D'Agostino-Pearson Omnibus Test со статистикой DP. Указаны случаи, в которых найдено
статистически значимое отличие распределения данных от нормального распределения
(“no”). В остальных случаях отличия от нормального распределения не выявлено.
Таблица С1
Проверка нормальности распределения с помощью асимметрии, эксцесса и D'AgostinoPearson Omnibus Test
Variables
Self-Esteem
Physical Aggression
Indirect Aggression
Irritation
Negativism
Resentment
Suspicion
Verbal Aggression
Guilt
S
-0.14
0.04
0.14
-0.12
0.17
0.31
0.64
-0.26
-0.04
SES
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
K
-0.77
-1.38
-1.26
-0.64
-0.89
-0.02
0.52
-0.40
-0.32
SEK
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
0.40
Z(S)
0.68
0.21
0.71
0.60
0.84
1.52
3.20
1.29
0.22
Z(K)
1.91
3.45
3.14
1.60
2.23
0.04
1.29
1.01
0.80
DP
4.13
11.93
10.39
2.92
5.70
2.31
11.91
2.69
0.70
p
.13
.003
.006
.23
.058
.31
.003
.26
.71
ND
no
no
no
Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error
of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K)
> 1.96 – то распределение данных отличается от нормального распределения. DP – это
статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
409
Таблица.С2
Результаты проверки соответствия распределения данных нормальному распределению
по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino-
SE
PhA
IA
I
N
R
S
VA
G
Kolmogorov-Smirnov
Shapiro-Wilk
Statistic
df
Sig.
Statistic df
0.08
145
.012
0.98
145
.009
0.16
145
.000
0.91
145
.000
0.14
145
.000
0.92
145
.000
0.15
145
.000
0.95
145
.000
0.18
145
.000
0.92
145
.000
0.14
145
.000
0.94
145
.000
0.19
145
.000
0.87
145
.000
0.15
145
.000
0.96
145
.000
0.17
145
.000
0.94
145
.000
Z(S)
Z(K)
DP
p
Normal
Distribution
Variables
Pearson Omnibus Test
0.68
0.21
0.71
0.60
0.84
1.52
3.20
1.29
0.22
1.91
3.45
3.14
1.60
2.23
0.04
1.29
1.01
0.80
4.13
11.93
10.39
2.92
5.70
2.31
11.91
2.69
0.70
.13
.003
.006
.23
.058
.31
.003
.26
.71
no
no
no
no
no
no
no
no
no
Sig.
Замечание. Lilliefors Significance Correction
Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то
распределение данных отличается от нормального распределения.
DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Случаи значимого отличия распределения от нормального в таблице выделены.
Таблица С3.
Выбор коэффициентов корреляции
SE
SE
SE
SE
SE
SE
SE
SE
Переменные и нормальное
распределение
X
Y
нет
нет
PhA
нет
нет
IA
нет
нет
I
нет
нет
N
нет
нет
R
нет
нет
S
нет
нет
VA
нет
нет
G
Коэффициенты
корреляции
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
На рис. С1-С9 приведены гистограммы с нормальной кривой, позволяющие
визуально сравнить эмпирическое распределение данных с нормальным распределением.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
410
Рисунок C1. Гистограмма с нормальной
кривой. Cамооценка.
Рисунок C2. Гистограмма с нормальной
кривой. Физическая агрессивность.
Рисунок C3. Гистограмма с нормальной
кривой. Косвенная агрессивность.
Рисунок C4. Гистограмма с нормальной
кривой. Негативизм.
Рисунок C5. Гистограмма с нормальной
кривой. Раздражительность.
Рисунок C6. Гистограмма с нормальной
кривой. Обидчивость.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
411
Рисунок C7. Гистограмма с нормальной
кривой. Подозрительность.
Рисунок C8. Гистограмма с нормальной
кривой. Вербальная агрессивность.
Рисунок C9. Гистограмма с нормальной
кривой. Чувство вины.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
412
Таблица С4
Проверка нормальности распределения с помощью асимметрии, эксцесса и D'Agostino-
Self-Esteem above Mdn
Self-Esteem below Mdn
Groups
Pearson Omnibus Test. Группы участников с самооценкой выше или ниже медианы
Variables
S
SES
Z(K)
DP
p
ND
Self-Esteem
-0.30
0.28
-1.19
0.56
Physical Aggression
-0.05
0.28
-1.34
0.56
1.05
2.14
5.68
0.058
no
Indirect Aggression
0.08
0.28
-1.25
0.56
0.19
2.41
5.84
0.054
no
0.28
2.25
5.16
0.076
-0.24
0.28
-0.75
no
0.56
0.05
0.28
0.87
1.35
2.57
0.28
-0.74
0.56
Verbal Aggression
-0.10
0.17
1.33
1.80
0.41
0.28
-0.81
0.56
Guilt
0.37
1.46
2.26
0.32
-0.10
0.28
-0.26
0.56
0.34
0.46
0.33
0.85
Self-Esteem
.434
.283
-.709
.559
1.53
1.27
3.96
0.138
no
Physical Aggression
.132
.283
-1.452
.559
0.47
2.60
6.97
0.031
no
Indirect Aggression
.213
.283
-1.255
.559
0.75
2.25
5.61
0.061
Irritation
.038
.283
-.479
.559
0.13
0.86
0.75
0.69
Negativism
.292
.283
-.987
.559
1.03
1.77
4.19
0.12
Verbal Aggression
-.717
.283
.106
.559
2.54
0.19
6.46
0.039
Guilt
-.021
.283
-.354
.559
0.073
0.63
0.41
0.82
Irritation
Negativism
K
SEK
Z(S)
no
Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard Error
of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K)
> 1.96 – то распределение данных отличается от нормального распределения. DP – это
статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
413
Таблица.С5
Результаты проверки соответствия распределения данных нормальному распределению
по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino-
Self-Esteem above
Mdn
Self-Esteem below Mdn
Variables
Groups
Kolmogorov-Smirnov
SE
PhA
IA
I
N
VA
G
SE
PhA
IA
I
N
VA
G
Shapiro-Wilk
Z(S)
Statistic df
Z(K)
DP
p
Sig.
Normal
Distribution
Pearson Omnibus Test. Группы участников с самооценкой выше или ниже медианы
Statistic
df
Sig.
0.08
145
.012
0.98
145
.009
1.05
2.14
5.68
0.058
no
0.16
145
.000
0.91
145
.000
0.19
2.41
5.84
0.054
no
0.14
145
.000
0.92
145
.000
0.28
2.25
5.16
0.076
0.15
145
.000
0.95
145
.000
0.87
1.35
2.57
0.28
no
no
0.18
145
.000
0.92
145
.000
0.17
1.33
1.80
0.41
no
0.15
145
.000
0.96
145
.000
0.37
1.46
2.26
0.32
no
0.17
0.08
145
145
.000
.012
0.94
0.98
145
145
.000
.009
0.34
0.46
0.33
0.85
no
1.53
1.27
3.96
0.138
no
0.16
145
.000
0.91
145
.000
0.47
2.60
6.97
0.031
no
0.14
145
.000
0.92
145
.000
0.75
2.25
5.61
0.061
no
0.15
145
.000
0.95
145
.000
0.13
0.86
0.75
0.69
no
0.18
145
.000
0.92
145
.000
1.77
145
.000
0.96
145
.000
0.19
4.19
6.46
0.12
0.039
no
0.15
1.03
2.54
0.17
145
.000
0.94
145
.000
0.073
0.63
0.41
0.82
no
no
Замечание. Lilliefors Significance Correction
Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то
распределение данных отличается от нормального распределения.
DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Таблица С6.
Выбор коэффициентов корреляции для группы с самооценкой ниже медианы
SE
SE
SE
SE
SE
Переменные и нормальное
распределение
X
Y
нет
PhA
нет
IA
нет
I
нет
N
нет
VA
Коэффициенты
корреляции
нет
нет
нет
нет
нет
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
414
Таблица С7.
Выбор коэффициентов корреляции для группы с самооценкой выше медианы
SE
SE
SE
SE
SE
Переменные и нормальное
распределение
X
Y
нет
PhA
нет
IA
нет
I
нет
N
нет
VA
Коэффициенты
корреляции
нет
нет
нет
нет
нет
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
Спирмена, τ
-Кендалла
-Кендалла
-Кендалла
-Кендалла
-Кендалла
На рис. С10-С16 приведены гистограммы с нормальной кривой, позволяющие
визуально сравнить эмпирическое распределение данных с нормальным распределением.
Рисунок С10. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Самооценка.
Рисунок С11. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Физическая агрессивность.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
415
Рисунок С12. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Косвенная агрессивность.
Рисунок С13. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Раздражительность.
Рисунок С14. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Негативизм.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
416
Рисунок С15. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Вербальная агрессивность.
Рисунок С16. Гистограммы с нормальной кривой. Группы с низкой и высокой
самооценкой. Чувство вины.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
417
Таблица С8
Проверка нормальности распределения с помощью асимметрии, эксцесса и D'Agostino-
VA
VA
above Mdn
Mdn
Groups
Pearson Omnibus Test. Группы участников с вербальной агрессией выше или ниже медианы
Variables
S
SES
K
SEK
Z(S)
Z(K)
DP
p
ND
Self-Esteem
-0.25
0.24
0.43
0.48
1.05
0.90
1.90
0.39
Verbal Aggression
-0.81
0.24
-0.37
0.48
3.36
0.78
11.89
0.003
no
Self-Esteem
0.32
0.35
-1.65
0.69
0.92
2.37
6.46
0.040
no
Verbal Aggression
0.76
0.35
-0.79
0.69
2.14
1.13
5.86
0.054
no
Замечание. S – Skewness, K – Kurtosis, SES – Standard Error of Skewness, SEK – Standard
Error of Kurtosis, Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96
или Z(K) > 1.96 – то распределение данных отличается от нормального распределения. DP
– это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Таблица.С9
Результаты проверки соответствия распределения данных нормальному распределению
по тестам Колмогорова-Смирнова, Шапиро-Уилкса, асимметрии, эксцесса и D'Agostino-
VA
VA
above below
Mdn Mdn
Variables
Groups
Kolmogorov-Smirnov
SE
VA
SE
VA
Statistic
df
Sig.
.063
.267
.266
.331
100
100
45
45
.200(*)
.000
.000
.000
Shapiro-Wilk
Statistic df
.985
.854
.835
.743
100
100
45
45
DP
p
Z(S)
Z(K)
1.05
0.90
1.90
0.39
3.36
0.78
2.37
11.89
0.003
no
6.46
0.040
no
1.13
5.86
0.054
no
Sig.
.334
.000
.000
.000
Normal
Distribution
Pearson Omnibus Test. Группы участников с вербальной агрессией выше или ниже медианы
0.92
2.14
Замечание. Lilliefors Significance Correction
Z(S) – Z-статистика для S, Z(K) – Z- статистика для K. Если Z(S) > 1.96 или Z(K) > 1.96 – то
распределение данных отличается от нормального распределения.
DP – это статистика D'Agostino-Pearson Omnibus Test, p – value соответствует для DP.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
418
На Рис.С17-С18 изображены гистограммы с нормальной кривой для визуального
сравнения с нормальным распределением.
Рисунок С17. Гистограммы с нормальной кривой. Группы с низкой и высокой
вербальной агрессией. Вербальная агрессивность.
Рисунок С18. Гистограммы с нормальной кривой. Группы с низкой и высокой
вербальной агрессией. Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
419
Приложение D
Корреляционный анализ
Таблица D1
Коэффициенты ранговой корреляции Спирмена для всей выборки
Таблица D2
Коэффициенты ранговой корреляции τ -Кендалла для всей выборки
Таблица D3
Коэффициенты корреляции Пирсона для всей выборки
Таблица D4
Correlation Coefficient
Spearman's
rho
SelfEsteem
Sig. (2-tailed)
N
Guilt
N
Verbal
Aggression
Sig. (2-tailed)
Negativism
SelfEsteem
Irritation
Kendall's
tau_b
Indirect
Aggression
Correlation Coefficient
Physical
Aggression
Коэффициенты ранговой корреляции Спирмена и τ-Кендалла для участников с
самооценкой ниже медианы
-.520**
-.513**
-.584**
.202*
-.389**
.171*
.000
.000
.000
.022
.000
.049
73
73
73
73
73
73
-.724**
-.681**
-.765**
.276*
-.537**
.229
.000
.000
.000
.018
.000
.052
73
73
73
73
73
73
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
a. Self-Esteem = Low
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
420
Таблица D5
Irritation
Negativism
Verbal
Aggression
Guilt
SelfEsteem
Indirect
Aggression
Kendall's
tau_b
Physical
Aggression
Коэффициенты корреляции τ-Кендалла и Спирмена для участников с самооценкой ниже
медианы
Correlation Coefficient
.485**
.496**
.380**
-.042
.427**
-.085
Sig. (2-tailed)
.000
.000
.000
.635
.000
.330
72
72
72
72
72
72
Correlation Coefficient
.701**
.686**
.522**
-.058
.555**
-.114
Sig. (2-tailed)
.000
.000
.000
.631
.000
.342
72
72
72
72
72
72
N
Spearman's
rho
SelfEsteem
N
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
a. Self-Esteem = High
Таблица D6
Physical
Aggression
Indirect
Aggression
Irritation
Negativism
Verbal
Aggression
Guilt
Self-Esteem
Коэффициенты корреляции Пирсона
-.772**
-.699**
-.757**
.324**
-.531**
.229
.000
.000
.000
.005
.000
.051
73
73
73
73
73
73
Pearson Correlation
.735**
.691**
.531**
-.081
.565**
-.140
Sig. (2-tailed)
.000
.000
.000
.500
.000
.241
72
72
72
72
72
Low
Pearson Correlation
SelfEsteem
Sig. (2-tailed)
High
N
SelfEsteem
N
72
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
421
Приложение Е
Выбор нелинейной регрессионной модели
Таблица Е1
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка - Физическая агрессивность
Dependent Variable:Physical Aggression
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.001
.121
1
143 .728
5.697
-.005
Quadratic
.502
71.538
2
142 .000
35.817
-1.044
.008
Cubic
.502
47.363
3
141 .000
36.821
-1.097
.009
b3
-4.797E-6
The independent variable is Self-Esteem.
Таблица Е2
Описание модели и параметры оценок (Model Summary and Parameter Estimates)
Физическая агрессивность - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.001
.121
1
143 .728
63.137
-.156
Quadratic
.002
.128
2
142 .880
64.894
-1.010
.079
Cubic
.019
.921
3
141 .432
53.761
8.314
-2.007
b3
.133
The independent variable is Physical Aggression.
Рисунок Е1. Корреляционная диаграмма с
линиями линейной, квадратической и
кубической регрессии. Самооценка физическая агрессивность.
Рисунок Е2. Корреляционная диаграмма с
линиями линейной, квадратической и
кубической регрессии. Физическая
агрессивность - самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
422
Таблица E3
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Косвенная агрессивность
Dependent Variable:Indirect Aggression
Equation
R Square
F
Model Summary
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
b3
Linear
.004
.572
1
143
.451
5.362
-.011
Quadratic
.443
56.366
2
142
.000
30.953
-.893
.007
Cubic
.443
37.437
3
141
.000
26.663
-.666
.003
2.051E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.E3).
Таблица E4
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Косвенная агрессивность - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
F
Model Summary
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
b3
Linear
.004
.572
1
143
.451
64.050
-.373
Quadratic
.006
.412
2
142
.663
61.878
.811
-.122
Cubic
.007
.325
3
141
.807
58.794
3.587
-.781
.045
The independent variable is Indirect Aggression.
При изменении косвенной агрессивности самооценка меняется случайным образом.
(Рис.E4).
Рисунок E3. Самооценка - Косвенная
агрессивность.
Рисунок E4. Косвенная агрессивность –
Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
423
Таблица Е5
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Раздражительность
Dependent Variable: Irritation
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.022
3.288
1
143 .072
6.905
-.022
Quadratic
.416
50.539
2
142 .000
27.546
-.733
.006
Cubic
.417
33.652
3
141 .000
22.746
-.480
.002
2.295E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.Е5).
Таблица Е6
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Раздражительность - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.022
3.288
1
143 .072
68.080
-1.040
Quadratic
.034
2.470
2
142 .088
60.232
2.329
-.310
Cubic
.039
1.900
3
141 .132
50.899
9.811
-1.950
b3
.105
The independent variable is Irritation.
При изменении «раздражения» самооценка меняется случайным образом. (Рис.Е6).
Рисунок Е5. Самооценка –
Раздражительность.
Рисунок Е6. Раздражительность –
Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
424
Таблица Е7
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Негативизм
Dependent Variable: Negativism
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.003
.390
1
143 .534
2.599
.005
Quadratic
.042
3.101
2
142 .048
-1.436
.144
-.001
Cubic
.043
2.117
3
141 .101
-4.229
.291
-.004
b3
1.335E-5
The independent variable is Self-Esteem.
Возможна квадратическая модель (Рис.Е7).
Таблица Е8
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Негативизм - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.003
.390
1
143 .534
60.614
.583
Quadratic
.004
.304
2
142 .739
63.073
-1.422
.335
Cubic
.021
1.017
3
141 .387
50.581
17.105
-7.109
b3
.861
The independent variable is Negativism.
При изменении негативизма самооценка меняется случайным образом. (Рис.Е8).
Рисунок Е7. Самооценка – Негативизм.
Рисунок Е8. Негативизм – Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
425
Таблица Е9
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Обидчивость
Dependent Variable: Resentment
Equation
Linear
R Square
.005
Model Summary
F
df1
.681
1
df2
Sig.
143 .411
Constant
2.931
Parameter Estimates
b1
b2
.008
Quadratic
.029
2.143
2
142 .121
-1.037
.144
Cubic
.031
1.518
3
141 .212
3.338
-.087
b3
-.001
.003 -2.092E-5
The independent variable is Self-Esteem.
При изменении самооценки «Обидчивость» меняется случайным образом. (Рис.Е9).
Таблица Е10
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Обидчивость - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.005
.681
1
143 .411
60.185
.621
Quadratic
.007
.516
2
142 .598
62.430
-.902
.209
Cubic
.010
.474
3
141 .701
65.741
-4.647
1.297
b3
-.089
The independent variable is Resentment.
При изменении «обиды» самооценка меняется случайным образом (Рис.Е10).
Рисунок Е9. Самооценка – Обидчивость.
Рисунок Е10. Обидчивость – Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
426
Таблица Е11
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Подозрительность
Dependent Variable: Suspicion and Distrust
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.028
4.061
1
143 .046
2.566
.017
Quadratic
.029
2.110
2
142 .125
1.717
.047
Cubic
.033
1.628
3
141 .186
8.035
-.287
b3
.000
.005 -3.02E-5
The independent variable is Self-Esteem.
Возможна линейная модель (Рис.Е11).
Таблица Е12
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Подозрительность - Самооценка
Dependent Variable:Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.028
4.061
1
143 .046
56.527
1.579
Quadratic
.029
2.149
2
142 .120
59.250
.038
.186
Cubic
.031
1.486
3
141 .221
52.075
5.904
-1.176
b3
.093
The independent variable is Suspicion and Distrust.
Возможна линейная модель (Рис.Е12).
Рисунок Е11. Самооценка –
Подозрительность.
Рисунок Е12. Подозрительность –
Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
427
Таблица Е13
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Вербальная агрессивность
Dependent Variable: Verbal Aggression
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.009
1.258
1
143 .264
6.269
-.012
Quadratic
.239
22.352
2
142 .000
20.702
-.510
.004
Cubic
.242
15.042
3
141 .000
14.327
-.173
-.002
b3
3.048E-5
The independent variable is Self-Esteem.
Выбираем квадратическую модель (Рис.Е13).
Таблица Е14
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Вербальная агрессивность - Самооценка
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.009
1.258
1
143 .264
66.204
-.710
Quadratic
.151
12.676
2
142 .000
36.024
12.455
-1.251
Cubic
.192
11.201
3
141 .000
67.375
-11.352
3.820
b3
-.322
The independent variable is Verbal Aggression.
Выбираем квадратическую модель (Рис.Е14).
Рисунок Е13. Самооценка - Вербальная
агрессивность.
Рисунок Е14. Вербальная агрессивность –
Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
428
Таблица Е15
Описание модели и параметры оценок (Model Summary and Parameter Estimates).
Самооценка – Чувство вины
Dependent Variable: Self-Esteem
Equation
R Square
Model Summary
F
df1
df2
Sig.
Constant
Parameter Estimates
b1
b2
Linear
.005
.757
1
143 .386
3.373
.010
Quadratic
.037
2.742
2
142 .068
-2.160
.201
Cubic
.043
2.087
3
141 .105
6.581
-.261
b3
-.002
.006 -4.179E-5
The independent variable is Guilt.
При изменении самооценки «Чувство вины» меняется случайным образом (Рис.Е15).
Таблица Е16
Описание модели и параметры оценок (Model Summary and Parameter Estimates). Чувство
вины - Самооценка
Dependent Variable: Self-Esteem
Model Summary
Equation
R Square
F
df1
Parameter Estimates
df2
Sig.
Constant
b1
b2
b3
Linear
.005
.757
1
143 .386
60.167
.535
Quadratic
.006
.441
2
142 .644
61.230
-.174
.090
Cubic
.009
.428
3
141 .733
58.934
2.715
-.719
.062
The independent variable is Guilt.
При изменении «Чувства вины» самооценка меняется случайным образом (Рис.Е16).
Рисунок Е16. Самооценка - Чувство вины.
Рисунок Е16. Чувство вины – Самооценка.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
429
Приложение F
Частотный анализ
Таблица F1
Self-Esteem * Physical Aggression Crosstabulation
Count
Physical Aggression
Low
Self-Esteem
Low
Medium
High
Medium
4
36
3
43
Total
High
9
36
11
56
Total
23
1
22
46
36
73
36
145
Таблица F2
Chi-Square Tests
Value
df
Asymp. Sig. (2-sided)
66.447a
4
.000
80.532
4
.000
Linear-by-Linear Association
.000
1
1.000
N of Valid Cases
145
Pearson Chi-Square
Likelihood Ratio
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.68.
Таблица F3
Self-Esteem * Indirect Aggression Crosstabulation
Count
Indirect Aggression
Low
Self-Esteem
Total
Low
Medium
High
Medium
3
34
2
39
11
38
13
62
High
Total
22
1
21
44
36
73
36
145
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
430
Таблица F4
Chi-Square Tests
Value
df
Asymp. Sig. (2-sided)
65.040a
79.219
.000
145
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
.000
4
4
1
.000
1.000
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.68.
Таблица F5
Self-Esteem * Irritation Crosstabulation
Count
Irritation
Low
Self-Esteem
Low
Medium
High
Medium
3
34
5
42
Total
High
4
37
12
53
Total
29
2
19
50
36
73
36
145
Таблица F6
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
73.384a
Asymp. Sig. (2-sided)
4
4
1
85.181
3.146
145
.000
.000
.076
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.43.
Таблица F7
Self-Esteem * Negativism Crosstabulation
Count
Negativism
Low
Self-Esteem
Total
Low
Medium
High
Medium
17
28
17
62
12
16
9
37
High
Total
7
29
10
46
36
73
36
145
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
431
Таблица F8
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
Asymp. Sig. (2-sided)
5.264a
4
4
1
5.382
.169
145
.261
.250
.681
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.19.
Таблица F9
Self-Esteem * Resentment Crosstabulation
Count
Resentment
Low
Self-Esteem
Low
Medium
High
Medium
18
18
12
48
Total
High
13
30
14
57
Total
5
25
10
40
36
73
36
145
Таблица F10
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
Asymp. Sig. (2-sided)
8.456a
8.654
2.764
145
4
4
1
.076
.070
.096
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
9.93.
Таблица F11
Self-Esteem * Suspicion and Distrust Crosstabulation
Count
Suspiciont
Low
Self-Esteem
Total
Low
Medium
High
Medium
17
23
7
47
11
24
13
48
High
Total
8
26
16
50
36
73
36
145
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
432
Таблица F12
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
Asymp. Sig. (2-sided)
7.125a
4
4
1
7.276
6.685
145
.129
.122
.010
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
11.67.
Таблица F13
Self-Esteem * Verbal Aggression Crosstabulation
Count
Verbal Aggression
Low
Self-Esteem
Low
Medium
High
Medium
4
31
1
36
Total
High
8
38
18
64
Total
24
4
17
45
36
73
36
145
Таблица F14
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
57.289a
Asymp. Sig. (2-sided)
.000
4
4
1
65.614
.398
145
.000
.528
a. 0 cells (.0%) have expected count less than 5. The minimum expected count
is 8.94.
Таблица F15
Self-Esteem * Guilt Crosstabulation
Count
Guilt
Low
Self-Esteem
Total
Low
Medium
High
Medium
13
18
13
44
8
17
9
34
High
Total
15
38
14
67
36
73
36
145
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
433
Таблица F16
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
2.746a
2.762
.019
145
df
Asymp. Sig. (2-sided)
4
4
1
.601
.598
.891
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is
8.44.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
434
ПРИЛОЖЕНИЕ H. Исследование статистической значимости
различий процентных долей с помощью критерия Фишера
Таблица H1
Исследование различий процентных долей (Самооценка – SE; Физическая агрессивность –
PhA; Косвенная агрессивность – IA;Раздражительность - I, Негативизм - N;
Обидчивость - R; Подозрительность - S; Вербальная агрессивность - VA; Чувство вины –
G). Размер эффекта h (0.2 - небольшой, 0.5 - средний, 0.8 – большой)3
k1
k2
n1
n2
p1
p2
ϕ1
ϕ2
ϕ∗
h
p
High SE
Medium SE
22
1
46
46
47.8
2.2
1.53
0.30
5.91
1.23
.000
High SE
Low SE
22
23
46
46
47.8
50.0
1.53
1.57
0.21
0.04
.84
Medium SE
Low SE
1
23
46
46
2.2
50.0
0.30
1.57
6.11
1.27
.000
High SE
Medium SE
11
36
56
56
19.6
64.3
0.92
1.86
4.99
0.94
.000
High SE
Medium SE
Low SE
Low SE
11
36
9
9
56
56
56
56
19.6
64.3
16.1
16.1
0.92
1.86
0.82
0.82
0.49
5.48
0.09
1.04
.62
.000
High SE
Medium SE
3
36
43
43
7.0
83.7
0.53
2.31
8.24
1.78
.000
Low SE
3
4
43
43
7.0
9.3
0.53
0.62
0.40
0.09
.69
Low SE
36
4
43
43
83.7
9.3
2.31
0.62
7.84
1.69
.000
High PhA
Medium PhA
22
11
36
36
61.1
30.6
1.79
1.17
2.65
0.62
.008
Low PhA
22
3
36
36
61.1
8.3
1.79
0.59
5.13
1.21
.000
Medium PhA
High PhA
Low PhA
Medium PhA
11
1
3
36
36
73
36
73
30.6
1.4
8.3
49.3
1.17
0.23
0.59
1.56
2.48
7.99
0.59
1.32
.013
.000
High PhA
Low PhA
1
36
73
73
1.4
49.3
0.23
1.56
7.99
1.32
.000
Medium PhA
Low PhA
36
36
73
73
49.3
49.3
1.56
1.56
0.00
0.00
1.00
High PHA
Medium PHA
23
9
36
36
63.9
25.0
1.85
1.05
3.42
0.81
.001
High PHA
Low PHA
23
4
36
36
63.9
11.1
1.85
0.68
4.97
1.17
.000
Medium PHA
High SE
Low PHA
Medium SE
9
21
4
1
36
44
36
44
25.0
47.7
11.1
2.3
1.05
1.53
0.68
0.30
1.56
5.73
0.37
1.22
.12
.000
High SE
Low SE
21
22
44
44
47.7
50.0
1.53
1.57
0.21
0.05
.83
Medium SE
Low SE
1
22
44
44
2.3
50.0
0.30
1.57
5.95
1.27
.000
Medium
IA
High
IA
Low SE
High SE
High SE
Medium SE
High PHA
Low IA
3
2
Mediu
m SE
Low
PhA
Mediu
m PhA
High
PhA
1
High SE
Medium SE
13
38
62
62
21.0
61.3
0.95
1.80
4.72
0.85
.000
High SE
Low SE
13
11
62
62
21.0
17.7
0.95
0.87
0.45
0.08
.65
Medium SE
Low SE
38
11
62
62
61.3
17.7
1.80
0.87
5.17
0.93
.000
High SE
Medium SE
2
34
39
39
5.1
87.2
0.46
2.41
8.62
1.95
.000
High SE
Low SE
2
3
39
39
5.1
7.7
0.46
0.56
0.46
0.11
.64
Medium SE
Low SE
34
3
39
39
87.2
7.7
2.41
0.56
8.16
1.85
.000
ki – количество участников с исследуемым эффектом из группы объема ni, i = 1;2, pi =
ϕi = 2 arcsin pī 100 , ϕ ∗ = ϕ1 − ϕ 2
ki
⋅100% ,
ni
n1n2
- статистика теста «Угловое преобразование Фишера»,
n1 + n2
h = ϕ1 − ϕ2 - размер эффекта, p-value для ϕ ∗ -статистики (нормальное распределение с параметрами μ = 0,
σ=1), two-tailed, H0: p1 и p2 имеют случайные различия. (Cohen, 1988, p.181).
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NY: Lawrence Earlbaum
Associates.
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
435
High SE
Medium
SE
21
13
36
36
58.3
36.1
1.74
1.29
1.90
0.45
.06
Low IA
21
2
36
36
58.3
5.6
1.74
0.48
5.36
1.26
.000
Medium IA
Low IA
13
3
36
36
36.1
8.3
1.29
0.59
2.99
0.70
.003
High IA
Medium IA
1
38
73
73
1.4
52.1
0.23
1.61
8.32
1.38
.000
High IA
Low IA
1
34
73
73
1.4
46.6
0.23
1.50
7.66
1.27
.000
Medium IA
Low IA
38
34
73
73
52.1
46.6
1.61
1.50
0.66
0.11
.51
High IA
Medium IA
22
11
36
36
61.1
30.6
1.79
1.17
2.65
0.62
.008
Low IA
22
3
36
36
61.1
8.3
1.79
0.59
5.13
1.21
.000
Medium IA
Low IA
11
3
36
36
30.6
8.3
1.17
0.59
2.48
0.59
.013
High IA
High SE
Medium SE
19
2
50
50
38.0
4.0
1.33
0.40
4.63
0.93
.000
High SE
Low SE
19
29
50
50
38.0
58.0
1.33
1.73
2.02
0.40
.044
Medium SE
Low SE
29
2
50
50
58.0
4.0
1.73
0.40
6.64
1.33
.000
High SE
Medium SE
12
37
53
53
22.6
69.8
0.99
1.98
5.08
0.99
.000
High SE
Low SE
12
4
53
53
22.6
7.5
0.99
0.56
2.24
0.44
.025
Medium SE
Low SE
37
4
53
53
69.8
7.5
1.98
0.56
7.32
1.42
.000
High SE
Medium SE
5
34
42
42
11.9
81.0
0.70
2.24
7.03
1.53
.000
High SE
Low SE
5
3
42
42
11.9
7.1
0.70
0.54
0.75
0.16
.45
Medium SE
Low SE
34
3
42
42
81.0
7.1
2.24
0.54
7.78
1.70
.000
19
12
36
36
52.8
33.3
1.63
1.23
1.68
0.40
.093
19
5
36
36
52.8
13.9
1.63
0.76
3.66
0.86
.000
Medium I
Low I
12
5
36
36
33.3
13.9
1.23
0.76
1.98
0.47
.047
High I
Medium I
2
37
73
73
2.7
50.7
0.33
1.58
7.56
1.25
.000
Low I
2
34
73
73
2.7
46.6
0.33
1.50
7.07
1.17
.000
Medium I
Low I
37
34
73
73
50.7
46.6
1.58
1.50
0.50
0.08
.62
High I
High I
High SE
Medium SE
10
29
46
46
21.7
63.0
0.97
1.83
4.15
0.86
.000
High SE
Low SE
10
7
46
46
21.7
15.2
0.97
0.80
0.81
0.17
.42
Medium SE
Low SE
29
7
46
46
63.0
15.2
1.83
0.80
4.96
1.03
.000
High SE
Medium SE
9
16
37
37
24.3
43.2
1.03
1.44
1.74
0.40
.082
Medium
R
High R
Low SE
Medium
SE
High SE
Low N
Medium
N
Medium
SE
Medium I
Low I
Low SE
High I
High I
High N
High SE
Low I
Medium
I
Low SE
Medium IA
High I
High IA
High IA
High I
Medium I
29
4
36
36
80.6
11.1
2.23
0.68
6.57
1.55
.000
Low I
29
3
36
36
80.6
8.3
2.23
0.59
6.97
1.64
.000
Medium I
Low I
4
3
36
36
11.1
8.3
0.68
0.59
0.40
0.09
.69
High SE
Low SE
9
12
37
37
24.3
32.4
1.03
1.21
0.78
0.18
.44
Medium SE
Low SE
16
12
37
37
43.2
32.4
1.44
1.21
0.96
0.22
.34
High SE
Medium SE
17
28
62
62
27.4
45.2
1.10
1.47
2.07
0.37
.039
High SE
Low SE
17
17
62
62
27.4
27.4
1.10
1.10
0.00
0.00
1.00
Medium SE
Low SE
28
17
62
62
45.2
27.4
1.47
1.10
2.07
0.37
.039
High N
Medium N
10
9
36
36
27.8
25.0
1.11
1.05
0.27
0.06
.79
High N
Low N
10
17
36
36
27.8
47.2
1.11
1.52
1.72
0.40
.086
Medium N
Low N
9
17
36
36
25.0
47.2
1.05
1.52
1.99
0.47
.047
High N
Medium N
29
16
73
73
39.7
21.9
1.36
0.97
2.35
0.39
.019
High N
Low N
29
28
73
73
39.7
38.4
1.36
1.34
0.17
0.03
.87
Medium N
Low N
16
28
73
73
21.9
38.4
0.97
1.34
2.18
0.36
.029
High N
Medium N
7
12
36
36
19.4
33.3
0.91
1.23
1.35
0.32
.18
High N
Low N
7
17
36
36
19.4
47.2
0.91
1.52
2.55
0.60
.011
Medium N
Low N
12
17
36
36
33.3
47.2
1.23
1.52
1.21
0.28
.23
High SE
Medium SE
10
25
40
40
25.0
62.5
1.05
1.82
3.47
0.78
.001
High SE
Low SE
10
5
40
40
25.0
12.5
1.05
0.72
1.45
0.32
.15
Medium SE
Low SE
25
5
40
40
62.5
12.5
1.82
0.72
4.92
1.10
.000
High SE
Medium SE
14
30
57
57
24.6
52.6
1.04
1.62
3.13
0.59
.002
High SE
Low SE
14
13
57
57
24.6
22.8
1.04
1.00
0.22
0.04
.83
Medium SE
Low SE
30
13
57
57
52.6
22.8
1.62
1.00
3.35
0.63
.001
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
436
Low R
High SE
12
18
48
48
25.0
37.5
1.05
1.32
1.33
0.27
.18
Low SE
12
18
48
48
25.0
37.5
1.05
1.32
1.33
0.27
.18
Medium SE
Low SE
18
18
48
48
37.5
37.5
1.32
1.32
0.00
0.00
1.00
High R
Medium R
10
14
36
36
27.8
38.9
1.11
1.35
1.00
0.24
.32
High R
Low R
10
12
36
36
27.8
33.3
1.11
1.23
0.51
0.12
.61
Medium R
Low R
14
12
36
36
38.9
33.3
1.35
1.23
0.49
0.12
.62
High R
Medium R
25
30
73
73
34.2
41.1
1.25
1.39
0.85
0.14
.39
Low R
25
18
73
73
34.2
24.7
1.25
1.04
1.27
0.21
.20
Medium R
Low R
30
18
73
73
41.1
24.7
1.39
1.04
2.13
0.35
.033
High R
High R
Medium R
5
13
36
36
13.9
36.1
0.76
1.29
2.23
0.53
.026
High R
Low R
5
18
36
36
13.9
50.0
0.76
1.57
3.42
0.81
.001
Medium R
Low R
13
18
36
36
36.1
50.0
1.29
1.57
1.19
0.28
.23
High SE
Medium SE
16
26
50
50
32.0
52.0
1.20
1.61
2.04
0.41
.041
High SE
Low SE
16
8
50
50
32.0
16.0
1.20
0.82
1.90
0.38
.058
Medium SE
Low SE
26
8
50
50
52.0
16.0
1.61
0.82
3.94
0.79
.000
High SE
Medium SE
13
24
48
48
27.1
50.0
1.09
1.57
2.33
0.48
.020
High SE
Low SE
13
11
48
48
27.1
22.9
1.09
1.00
0.47
0.10
.64
Medium SE
Low SE
24
11
48
48
50.0
22.9
1.57
1.00
2.80
0.57
.005
High SE
Medium SE
7
23
47
47
14.9
48.9
0.79
1.55
3.67
0.76
.000
High SE
Low SE
7
17
47
47
14.9
36.2
0.79
1.29
2.41
0.50
.016
Medium SE
Low SE
23
17
47
47
48.9
36.2
1.55
1.29
1.26
0.26
.21
High S
Medium S
16
13
36
36
44.4
36.1
1.46
1.29
0.72
0.17
.47
High S
Low S
16
7
36
36
44.4
19.4
1.46
0.91
2.32
0.55
.021
Medium S
Low S
13
7
36
36
36.1
19.4
1.29
0.91
1.60
0.38
.11
Medium S
26
24
73
73
35.6
32.9
1.28
1.22
0.35
0.06
.73
Low S
26
23
73
73
35.6
31.5
1.28
1.19
0.53
0.09
.60
Medium S
Low S
24
23
73
73
32.9
31.5
1.22
1.19
0.18
0.03
.86
High S
Medium S
8
11
36
36
22.2
30.6
0.98
1.17
0.80
0.19
.42
High S
Low S
8
17
36
36
22.2
47.2
0.98
1.52
2.26
0.53
.024
Medium S
Low S
11
17
36
36
30.6
47.2
1.17
1.52
1.46
0.34
.15
High SE
Medium SE
17
4
45
45
37.8
8.9
1.32
0.61
3.41
0.72
.001
High SE
Low SE
17
24
45
45
37.8
53.3
1.32
1.64
1.49
0.31
.14
Medium SE
Low SE
4
24
45
45
8.9
53.3
0.61
1.64
4.90
1.03
.000
Medium SE
18
38
64
64
28.1
59.4
1.12
1.76
3.63
0.64
.000
Low SE
18
8
64
64
28.1
12.5
1.12
0.72
2.24
0.40
.025
Medium SE
Low SE
38
8
64
64
59.4
12.5
1.76
0.72
5.86
1.04
.000
High SE
Medium SE
1
31
36
36
2.8
86.1
0.33
2.38
8.67
2.04
.000
High SE
Low SE
1
4
36
36
2.8
11.1
0.33
0.68
1.46
0.34
.14
Medium SE
Low SE
31
4
36
36
86.1
11.1
2.38
0.68
7.20
1.70
.000
High VA
Medium VA
17
18
36
36
47.2
50.0
1.52
1.57
0.24
0.06
.81
High G
Low SE
Medium
SE
High SE
Medium
VA
High SE
High SE
Low
VA
High
VA
Medium
SE
High S
High S
Low SE
High SE
Low S
Medium
S
High S
Medium
SE
Medium SE
Low SE
High SE
High SE
High VA
Low VA
17
1
36
36
47.2
2.8
1.52
0.33
5.01
1.18
.000
Medium VA
Low VA
18
1
36
36
50.0
2.8
1.57
0.33
5.24
1.24
.000
High VA
Medium VA
4
38
73
73
5.5
52.1
0.47
1.61
6.88
1.14
.000
High VA
Low VA
4
31
73
73
5.5
42.5
0.47
1.42
5.72
0.95
.000
Medium VA
Low VA
38
31
73
73
52.1
42.5
1.61
1.42
1.16
0.19
.25
High VA
Medium VA
24
8
36
36
66.7
22.2
1.91
0.98
3.94
0.93
.000
High VA
Low VA
24
4
36
36
66.7
11.1
1.91
0.68
5.22
1.23
.000
Medium VA
Low VA
8
4
36
36
22.2
11.1
0.98
0.68
1.28
0.30
.20
High SE
Medium SE
12
38
67
67
17.9
56.7
0.87
1.71
4.81
0.83
.000
High SE
Low SE
14
15
67
67
20.9
22.4
0.95
0.99
0.21
0.04
.83
Medium SE
Low SE
38
15
67
67
56.7
22.4
1.71
0.99
4.17
0.72
.000
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
437
Medium
G
Medium SE
9
17
34
34
26.5
50.0
1.08
1.57
2.02
0.49
.043
Low SE
9
8
34
34
26.5
23.5
1.08
1.01
0.28
0.07
.78
Medium SE
Low SE
17
8
34
34
50.0
23.5
1.57
1.01
2.30
0.56
.021
High SE
Medium SE
13
18
44
44
29.5
40.9
1.15
1.39
1.12
0.24
.26
Low SE
13
13
44
44
29.5
29.5
1.15
1.15
0.00
0.00
1.00
Low SE
18
13
44
44
40.9
29.5
1.39
1.15
1.12
0.24
.26
High G
Medium G
14
9
36
36
38.9
25.0
1.35
1.05
1.27
0.30
.20
Low G
14
13
36
36
38.9
36.1
1.35
1.29
0.24
0.06
.81
Medium G
Low G
9
13
36
36
25.0
36.1
1.05
1.29
1.03
0.24
.30
High G
High G
Medium G
38
17
73
73
52.1
23.3
1.61
1.01
3.65
0.60
.000
High G
Low G
38
18
73
73
52.1
24.7
1.61
1.04
3.46
0.57
.001
Medium G
Low G
17
18
73
73
23.3
24.7
1.01
1.04
0.19
0.03
.85
High G
Medium G
15
8
36
36
41.7
22.2
1.40
0.98
1.79
0.42
.074
High G
Low G
15
13
36
36
41.7
36.1
1.40
1.29
0.48
0.11
.63
Medium G
Low G
8
13
36
36
22.2
36.1
0.98
1.29
1.30
0.31
.19
Low SE
High SE
High SE
Medium SE
Medium
SE
Low G
High SE
High SE
Анализ данных в психологии и социальных науках. Конспект лекций. © Блюменау Н.Ф., 2019
438