Корреляции и взаимосвязи в педагогических экспериментах
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция №9.
Корреляции и взаимосвязи в педагогических экспериментах
Связь между признаками.
Анализ связей между признаками – главный вид задач, встречающийся
практически в любом эмпирическом исследовании. Изучение связей между
переменными, интересует исследователя не само по себе, а как отражение
соответствующих причинно-следственых отношений.
При изучении корреляций стараются установить, существует ли какаято связь между двумя показателями в одной выборке (например, между
ростом и весом детей или между уровнем IQ и школьной успеваемостью)
либо между двумя различными выборками (например, при сравнении пар
близнецов), и если эта связь существует, то сопровождается ли увеличение
одного
показателя
возрастанием
(положительная
корреляция)
или
уменьшением (отрицательная корреляция) другого.
Иными словами, корреляционный анализ помогает установить, можно
ли предсказывать возможные значения одного показателя, зная величину
другого.
Первоначальное значение термина «корреляция» – взаимная связь
(Oxford Advanced Learner's Dictionary of Current English, 1982). Когда говорят
о
корреляции,
используют
термины
«корреляционная
связь»
и
«корреляционная зависимость».
Корреляционная связь – это согласованные изменения двух признаков
или большего количества признаков (множественная корреляционная связь).
Корреляционная связь отражает тот факт, что изменчивость одного признака
находится
в
некотором
соответствии
с
изменчивостью
другого.
«Стохастическая» связь имеется тогда, когда каждому из значений одной
случайной величины соответствует специфическое (условное) распределение
вероятностей значений другой величины, и наоборот, каждому из значений
этой
другой
величины
соответствует
специфическое
(условное)
распределение вероятностей значений первой случайной величины".
Корреляционная зависимость – это изменения, которые вносят
значения одного признака в вероятность появления разных значений другого
признака.
Стохастическая означает вероятностная. Связи между случайными
явлениями называют вероятностными или стохастическими связями. Этот
термин
подчеркивает
их
отличие
от
детерминированных
или
функциональных связей в физике или математике. В функциональных связях
каждому значению первого признака всегда соответствует (в идеальных
условиях)
совершенно
корреляционных
связях
определенное
значение
другого
каждому значению одного
признака.
признака
В
может
соответствовать определенное распределение значений другого признака, но
не определенное его значение.
Оба термина – корреляционная связь и корреляционная зависимость –
часто используются как синонимы. Между тем, согласованные изменения
признаков и отражающая это корреляционная связь между ними может
свидетельствовать не о зависимости этих признаков между собой, а
зависимости обоих этих признаков от какого-то третьего признака или
сочетания признаков, не рассматриваемых в исследовании.
Зависимость подразумевает влияние, связь – любые согласованные
изменения, которые могут объясняться сотнями причин. Корреляционные
связи не могут рассматриваться как свидетельство причинно-следственной
связи, они свидетельствуют лишь о том, что изменениям одного признака,
как правило, сопутствуют определенные изменения другого, но находится ли
причина изменений в одном из признаков или она оказывается за пределами
исследуемой пары признаков, нам неизвестно.
Корреляционные связи различаются по форме, направлению и степени
(силе).
По форме корреляционная связь может быть прямолинейной или
криволинейной.
Прямолинейной может быть, например, связь между количеством
тренировок на тренажере и количеством правильно решаемых задач в
контрольной сессии.
Криволинейной может быть, например, связь между уровнем
мотивации и
эффективностью выполнения
задачи.
При повышении
мотивации эффективность выполнения задачи сначала возрастает, затем
достигается оптимальный уровень мотивации, которому соответствует
максимальная эффективность выполнения задачи; дальнейшему повышению
мотивации сопутствует уже снижение эффективности.
По направлению корреляционная связь может быть положительной
(прямой) и отрицательной (обратной).
Прямая связь показывает, что более высоким значениям одного
признака соответствуют более высокие значения другого, а более низким
значениям одного признака – низкие значения другого (рис. 1).
Обратная связь, напротив, демонстрирует, что наиболее высоким
значениям первой величины соответствуют наиболее низкие значения второй
измеряемой величины (рис. 2).
При положительной корреляции коэффициент корреляции имеет
положительный знак, при отрицательной корреляции – отрицательный знак.
Рис. 1
Рис. 2.
Степень, сила или теснота корреляционной связи определяется по
величине коэффициента корреляции. Сила связи не зависит от ее
направленности и определяется по абсолютному значению коэффициента
корреляции. Коэффициент корреляции – это величина, которая может
варьировать в пределах от +1 до –1. В случае полной положительной
корреляции этот коэффициент равен плюс 1, а при полной отрицательной –
минус 1.
В случае же если эти точки не выстраиваются по прямой линии, а
образуют «облако», коэффициент корреляции по абсолютной величине
становится
меньше единицы
и
по
приближается к нулю (рис. 3).
Рис. 3.
мере округления
этого
облака
В случае если коэффициент корреляции равен 0, обе переменные
полностью независимы друг от друга.
Используется две системы классификации корреляционных связей по
их силе: общая и частная.
Общая классификация корреляционных связей:
1) сильная, или тесная при коэффициенте корреляции r>0,70;
2) средняя при 0,500,70, а не просто корреляция высокого уровня значимости.
В педагогических исследованиях чаще всего применяется коэффициент
линейной корреляции Пирсона и методы ранговой корреляции Спирмена и
Кендала. Однако метод Пирсона является параметрическим и поэтому не
лишен недостатков, свойственных параметрическим методам (необходимо,
чтобы данные были измерены в интервальных шкалах или распределение не
отличалось от нормального).
Метод ранговой корреляции Спирмена, является непараметрическим
методом, он является универсальным и работает с данными измеренными в
любых шкалах и прост в применении.
Коэффициент корреляции Пирсона
Линейный корреляционный анализ позволяет установить прямые связи
между переменными величинами по их абсолютным значениям. Формула
расчета коэффициента корреляции построена таким образом, что если связь
между признаками имеет линейный характер, коэффициент Пирсона точно
устанавливает
тесноту
этой
связи.
Поэтому
он
называется
также
коэффициентом линейной корреляции Пирсона.
Формула для подсчета коэффициента корреляции такова:
𝑛 × ∑(𝑥𝑖 × 𝑦𝑖 ) − (∑ 𝑥𝑖 × ∑ 𝑦𝑖 )
𝑟𝑥 =
√[𝑛 × ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ] × [𝑛 × ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 ]
где 𝑥𝑖 -
значения,
принимаемые
переменной
X,
𝑦𝑖 -
значения,
принимаемые переменой Y, 𝑥̅ - средняя по X, 𝑦̅ - средняя по Y.
Расчет
коэффициента
корреляции
Пирсона
предполагает,
что
переменные X и Y распределены нормально.
Пример 1. 20 школьникам были даны тесты на наглядно-образное и
вербальное мышление. Измерялось среднее время решения заданий теста в
секундах. Психолога интересует вопрос: существует ли взаимосвязь между
временем решения этих задач? Переменная X - обозначает среднее время
решения наглядно-образных, а переменная Y - среднее время решения
вербальных заданий тестов.
Для решения данной задачи представим исходные данные в виде табл.
1, в которой введены дополнительные столбцы, необходимые для расчета по
формуле. В табл. 1 даны индивидуальные значения переменных X и Y,
построчные произведения переменных X и Y, квадраты переменных всех
индивидуальных значений переменных X и Y, а также суммы всех
вышеперечисленных величин.
Таблица 1
№
испытуемых
X×Y
X×X
Y×Y
17
323
361
289
32
7
224
1024
49
3
33
17
561
1089
289
4
44
28
1232
1936
784
5
28
27
756
784
729
6
35
31
1085
1225
961
7
39
20
780
1521
400
8
39
17
663
1521
289
9
44
35
1540
1936
1225
10
44
43
1892
1936
1849
11
24
10
240
576
100
12
37
28
1036
1369
784
13
29
13
377
841
169
14
40
43
1720
1600
1849
15
42
45
1890
1764
2025
16
32
24
768
1024
5760
17
48
45
2160
2304
2025
18
42
26
1092
1764
676
19
33
16
528
1089
256
20
47
26
1222
2209
676
Сумма
731
518
20089
27873
16000
X
Y
Среднее время
решения нагляднообразных заданий
Среднее время
решения вербальных
заданий
1
19
2
Рассчитываем эмпирическую величину коэффициента корреляции по
формуле:
𝑟𝑥𝑦 эмп =
20 × 20089 − 731 × 518
√(20 × 27873 − 731 × 731) × (20 × 16000 − 518 × 518)
= 0,669
Следовательно имеет место прямая связь средней силы.
Теперь определим критические значения для полученного коэффициента
корреляции по специальной таблице.
Отметим,
что
в
таблице
величины
критических
значений
коэффициентов линейной корреляции Пирсона даны по абсолютной
величине. Следовательно, при получении как положительного, так и
отрицательного коэффициента корреляции по формуле оценка уровня
значимости этого коэффициента проводится по той же таблице приложения
без учета знака, а знак добавляется для дальнейшей интерпретации характера
связи между переменными X и Y.
При
нахождении
коэффициента
критических
корреляции
значений
Пирсона 𝑟𝑥𝑦 эмп число
для
вычисленного
степеней
свободы
рассчитывается как k=n-2.
В нашем случае k = 20, поэтому n - 2 = 20 - 2 = 18. В первом столбце
табл. приложения в строке, обозначенной числом 18, находим 𝑟кр :
0,44 для P ≤ 0,05
0,56 для P ≤ 0,01
Строим соответствующую «ось значимости»:
Ввиду того, что величина расчетного коэффициента корреляции попала
в зону значимости - 𝐻0 отвергается и принимается гипотеза 𝐻1 . Иными
словами, связь между временем решения наглядно-образных и вербальных
задач статистически значима на 1% уровне и положительна. Полученная
прямо пропорциональная зависимость говорит о том, что чем выше среднее
время решения наглядно-образных задач, тем выше среднее время решения
вербальных и наоборот.
Для применения коэффициента корреляции Пирсона, необходимо
соблюдать следующие условия: Сравниваемые переменные должны быть
получены в интервальной шкале или шкале отношений.
Распределения переменных X и Y должны быть близки к нормальному.
Число варьирующих признаков в сравниваемых переменных X и Y
должно быть одинаковым.
Таблицы уровней значимости для коэффициента корреляции Пирсона
рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам
осуществляется при числе степеней свободы k = n - 2.
Коэффициент ранговой корреляции Спирмена
Коэффициент корреляции рангов, предложенный К. Спирменом,
относится к непараметрическим показателям связи между переменными,
измеренными в ранговой шкале. При расчете этого коэффициента не
требуется никаких предположений о характере распределений признаков в
генеральной совокупности. Этот коэффициент определяет степень тесноты
связи порядковых признаков, которые в этом случае представляют собой
ранги сравниваемых величин.
Величина коэффициента корреляции Спирмена также лежит в
интервале +1 и -1. Он, как и коэффициент Пирсона, может быть
положительным и отрицательным, характеризуя направленность связи между
двумя признаками, измеренными в ранговой шкале.
В принципе число ранжируемых признаков (качеств, черт и т.п.) может
быть любым, но сам процесс ранжирования большего, чем 20 числа
признаков - затруднителен. Возможно, что именно поэтому таблица
критических значений рангового коэффициента корреляции рассчитана лишь
для сорока ранжируемых признаков (n < 40, табл. приложения).
Ранговый коэффициент корреляции Спирмена подсчитывается по
формуле:
6 (d 2 )
rs 1
n (n 2 1)
где n - количество ранжируемых признаков (показателей, испытуемых);
d - разность между рангами по двум переменным для каждого
испытуемого;
(d
2
) - сумма квадратов разностей рангов.
Пример
2.
Психолог
выясняет,
как
связаны
между
собой
индивидуальные показатели готовности к школе, полученные до начала
обучения в школе у 11 первоклассников и их средняя успеваемость в конце
учебного года.
Для решения этой задачи были проранжированы, во-первых, значения
показателей школьной готовности, полученные при поступлении в школу, и,
во-вторых, итоговые показатели успеваемости в конце года у этих же
учащихся в среднем. Результаты представим в табл. 2.
Таблица 2
№ учащихся
1
2
3
4
5
6
7
8
9
10
11
Ранги
показателей
школьной
готовности
3
5
6
1
4
11
9
2
8
7
10
Ранги
среднегодовой
успеваемости
2
7
8
3
4
6
11
1
10
5
9
d
1
-2
-2
-2
5
-2
1
-2
2
1
1
4
4
4
25
4
1
4
4
1
(d
2
)
Подставляем полученные данные в формулу и производим расчет.
Получаем:
rs 1
6 52
0,76
11 (112 1)
Следовательно имеет место сильная прямая связь
Для
нахождения
уровня
значимости
обращаемся
к
таблице
приложения, в которой приведены критические значения для коэффициентов
ранговой корреляции.
Подчеркнем, что как и в таблице для линейной корреляции Пирсона,
все величины коэффициентов корреляции даны по абсолютной величине.
Поэтому, знак коэффициента корреляции учитывается только при его
интерпретации.
Нахождение уровней значимости в данной таблице осуществляется по
числу n, т. е. по числу испытуемых. В нашем случае n = 11. Для этого числа
находим 𝑟кр :
0,61 для P ≤0,05
0,76 для P ≥ 0,01
Строим соответствующую «ось значимости»':
Полученный
коэффициент
корреляции
совпал
с
критическим
значением для уровня значимости в 1%. Следовательно, можно утверждать,
что показатели школьной готовности и итоговые оценки первоклассников
связаны положительной корреляционной зависимостью - иначе говоря, чем
выше показатель школьной готовности, тем лучше учится первоклассник. В
терминах статистических гипотез психолог должен отклонить нулевую
(Н0 гипотезу о сходстве и принять альтернативную (Н1 о наличии различий,
которая говорит о том, что связь между показателями школьной готовности и
средней успеваемостью отлична от нуля.
Случай одинаковых (равных) рангов
При наличии одинаковых рангов формула расчета коэффициента
линейной корреляции Спирмена будет несколько иной. В этом случае в
формулу вычисления коэффициентов корреляции добавляются два новых
члена, учитывающие одинаковые ранги. Они называются поправками на
одинаковые ранги и добавляются в числитель расчетной формулы.
𝑛3 − 𝑛
𝐷1 =
12
𝑘3 − 𝑘
12
где n - число одинаковых рангов в первом столбце, k - число
𝐷2 =
одинаковых рангов во втором столбце.
Модификация формулы в общем случае такова:
6 (d 2 ) D1 D 2
rs 1
n (n 2 1)
Для применения коэффициента корреляции Спирмена, необходимо
соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в порядковой
(ранговой) шкале, но могут быть измерены также в шкале интервалов и
отношений.
2. Характер распределения коррелируемых величин не имеет значения.
3. Число варьирующих признаков в сравниваемых переменных X и Y
должно быть одинаковым.