Меры связи между переменными. Коэффициент Пирсона для дихотомических показателей
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ЛЕКЦИЯ
2:
Меры
связи
между
переменными.
Коэффициент
Пирсонадля дихотомических показателей
Связи (зависимости) между двумя или более переменными в
статистике называют корреляцией. Она оценивается с помощью значения
коэффициента корреляции. Коэффициент корреляции является мерой
степени и величины этой связи. Например, мы можем поставить вопрос: "Существует ли зависимость в конкретной группе успеваемости от уровня
развития в ней межличностных отношений?".
Коэффициентов корреляций очень много. Мы рассмотрим лишь часть
из них, которые учитывают наличие линейной связи между переменными. Их
выбор зависит от шкал измерения переменных, зависимость между которыми
мы хотим оценить. Наиболее часто применяются коэффициенты корреляции
Пирсона и Спирмена.
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА
Пусть две сравниваемые переменные X (семейное положение) и У
(исключение из института) измеряются в дихотомической шкале (Х=1человек семейный, Х=0- человек не семейный; У=1- продолжает учится, У=0
–
исключили
из
института).
Для
определения
связи
используется
коэффициент Пирсона (обозначим R) для дихотомических данных.
Например, имеем такие данные
семейное положение
исключение из института
Испытуемый 1
1
1
Испытуемый 2
1
1
Испытуемый 3
Испытуемый 4
1
Испытуемый 5
1
Испытуемый 6
Испытуемый 7
1
Испытуемый 8
1
1
1
Испытуемый 9
1
Испытуемый 10
1
1
Удобно проводить вычисления значения коэффициента корреляции с
помощью таблицы сопряженности, показывающей количество совместных
появлений пар значений по двум переменным (признакам).
Пусть А — количество случаев, когда переменная Х имеет значение, равное
нулю, и, одновременно, переменная У имеет значение, равное единице; В —
количество случаев, когда переменные Х и У имеют одновременно значения,
равные единице; С — количество случаев, когда переменные Х и У имеют
одновременно значения, равные нулю; D — количество случаев, когда
переменная Х имеет значение, равное единице, и, одновременно, переменная
У имеет значение, равное нулю.
Общая форма таблицы сопряженности
Признак X
Признак У
Всего
1
1
А
В
А +В
С
D
С+ D
А+С
B+D
N
Итого:
В общем виде формула коэффициента корреляции Пирсона (обозначается R)
для дихотомических данных имеет вид
R = (ВС — AD) /
(А + С)*(В + D)*(А+ В)*(С + D)
Где Р-коэффициент корреляции Пирсона
Создадим таблицу сопряженности для рассматриваемого случая
2
Признак X
Признак У
Всего
1
1
А=2
В=4
А +В=6
С=2
D=2
С+ D=4
Итого:
А + С=4
B + D=6
N
Подставим в формулу данные из таблицы сопряженности, соответствующей
нашему примеру:
R = (8 — 4) /
Определяем
4*6*6*4 = 4/24=0,16
критические
значения
для
полученного
коэффициента
корреляции по таблице «Критические значения корреляции Пирсона».
Для этого нам надо знать значение k-число степеней свободы, где k=n-2, где
n- количество испытуемых. В нашем случае k=10-2=8
ТАБЛИЦА: Критические значения корреляции Пирсона
k=n-2
P
k=n-2
0,05
0,01
5
0,75
0,87
6
0,71
7
P
0,05
0,01
27
0,37
0,47
0,83
28
0,36
0,046
0,67
0,80
29
0,36
0,046
8
0,63
0,77
30
0,35
0,045
9
0,60
0,74
35
0,33
0,42
10
0,58
0,71
40
0,30
0,39
11
0,55
0,68
45
0,29
0,37
12
0,53
0,66
50
0,27
0,35
13
0,51
0,64
60
0,25
0,33
14
0,50
0,62
70
0,23
0,30
15
0,48
0,61
80
0,22
0,28
16
0,47
0,59
90
0,21
0,27
17
0,46
0,58
100
0,20
0,25
3
18
0,44
0,56
125
0,17
0,23
19
0,43
0,55
150
0,16
0,21
20
0,42
0,54
200
0,14
0,18
21
0,41
0,53
300
0,11
0,15
22
0,40
0,52
400
0,10
0,13
23
0,40
0,51
500
0,09
0,12
24
0,39
0,50
700
0,07
0,10
25
0,38
0,49
900
0,06
0,09
26
0,37
0,48
1000
0,06
0,09
По таблице при k=8 получаем 0,63 при Р≤0,05 и получаем 0,77 при Р≤0,01
Обычно в психологии и социологии принято использовать пятипроцентный
(р = 0,05) и однопроцентный (р = 0,01) уровни достоверности. Чем выше
значение Р-критерия (по таблице), тем выше значимость различий.
Так как наш расчетный R=0,16 и это меньше, чем 0,63 и меньше, чем
0,77, то делаем вывод о незначимой корреляции, что позволяет говорить об
отсутствии
зависимости
между
семейным
положением
человека
и
возможностью или невозможностью его исключения из института.
Если бы наш расчетный R был по значению больше, чем 0,63 и
больше, чем 0,77, то мы могли бы сделать вывод о значимой корреляции.
Для применения коэффициента корреляции Пирсона, необходимо
соблюдать следующие условия:
Сравниваемые переменные должны быть
получены в интервальной
4
шкале или шкале отношений.
Число варьирующих признаков в сравниваемых переменных X и Y
должно быть одинаковым.
Оценка уровня значимости по таблицам осуществляется при числе
степеней свободы k = n - 2.
При получении как положительного, так и отрицательного
коэффициента корреляции по формуле оценка уровня значимости этого
коэффициента проводится по той же таблице приложения без учета
знака
5