Меры связи двух случайных величин
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
6. МЕРЫ СВЯЗИ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН
6.1. Виды связей двух случайных величин. Существуют два вида связей между двумя переменными: функциональные и статистические. При функциональных связях каждому значению одной переменной соответствует только одно значение другой переменной, что особенно характерно для точных наук. Особенностью статистических связей является то, что каждому значению одной переменной может соответствовать множество значений другой переменной. Например, одному и тому же росту разных людей может соответствовать различный их вес, и наоборот. Такие связи имеют еще одно название – корреляционные, а мера таких связей – коэффициент корреляции.
6.2. Особенности коэффициента корреляции. Коэффициент корреляции показывает сразу два параметра статистической связи – ее направление и тесноту. Направление связи может быть положительным, когда большему значению одной переменной соответствует большее значение другой переменной и отрицательным, когда большему одной переменной соответствует меньшее значение другой переменной. Коэффициент корреляции всегда находится в пределах от – 1 до +1. При этом, если он оказывается положительным, то говорят о положительной корреляции между двумя переменными, а если отрицательным – то, соответственно об отрицательной. Абсолютное значение коэффициента корреляции показывает тесноту или степень выраженности такой связи. При коэффициенте корреляции равном нулю признается отсутствие связи, но даже тогда, когда он оказывается больше нуля, еще не следует делать вывод о наличии корреляционной связи. О связи между двумя переменными можно говорить лишь в том случае, если значение коэффициента корреляции оказывается выше критического для соответствующего числа наблюдений, если речь идет о положительной связи, и ниже критического, если – об отрицательной.
Необходимо подчеркнуть, что коэффициент корреляции предназначен лишь для измерения линейных связей между переменными. По этой причине в реальных условиях почти невозможно получить коэффициент корреляции равный единице. Например, если расчитать коэффициент корреляции между расстоянием планет Солнечной системы от Солнца и их периодом обращения, то коэффициент корреляции окажется равным 0.998, несмотря на то, что связь здесь прямая: чем дальше планета удалена от Солнца, тем больше ее период обращения. Причина этого заключается в том, что связь между расстоянием от Солнца и периодом обращения для планет Солнечной системы на графике отображается не прямой, а слегка изогнутой линией, следуя известным законам небесной механики И. Кеплера.
Что касается психологических измерений, то здесь коэффициент корреляции равный 0.8 – 0.9 признается достаточно высоким, а связь статистически значимой (достоверной) даже для небольшого числа наблюдений. Например, если при первичном и повторном тестировании большая часть испытуемых показала один и тот же результат по тесту X, и коэффициент корреляции оказался в указанных пределах, то тест может быть признан надежным несмотря на то, что у части испытуемых результат повторного тестирования отличался от первичного. В реальных экспериментальных условиях наличие небольшого разброса данных может свидетельствовать не об отсутствии связи, а о некоторой ошибке измерения, или влиянии неучтеного фактора на исход эксперимента.
6.3. Виды коэффициентов корреляции. Наиболее известным и часто применяемым в психологических исследованиях является коэффициент корреляции rxy - К.Пирсона для двух переменных, измеренных в шкалах интервалов или отношений:
, или
, или
Вторым часто используемым в психологии коэффициентом корреляции является коэффициент ранговой корреляции Ч.Спирмена, который обозначается греческой буквой '''' (ро):
,
где - квадрат разности между соответствующими парами рангов.
Он предназначен для определения связи между двумя переменными, измеренными в шкалах порядка. Достоинством -Спирмена является то, что он нетруден в вычислениях и применим для первичной оценки связи, так как множество переменных легко поддается ранжированию. Однако, оценка такой связи будет более грубая, чем при применении r-Пирсона, так как при переходе от шкалы более высокого порядка к шкале более низкого порядка информативность данных снижается.
Кроме коэффициентов корреляции Пирсона и Спирмена существуют и другие меры связи, которые применяются в зависимости от того, в каких шкалах были измерены переменные: коэффициент ассоциации Пирсона, четырехпольный (тетрахорический) коэффициент ассоциации, рангово-бисериальный и точечно-бисериальный коэффициенты корреляции, -Кендалла. В таблице 6.1 приведены все варианты соотношений измерительных шкал и соответствующих им коэффициентов корреляции (расчеты см. в п.6.6.).
Типы
Шкал
Наименований
Порядка
Интервалов
Отношений
Наименований
Коэфф.ассо-циации, 4-х- польный к.а.
Рангово-бисе-риальный к.к.
Точечно-бисе-риальный к.к.
Точечно-бисе-риальный к.к.
Порядка
Рангово-бисе-риальный к.к.
Спирмена
Кендалла
r-Пирсона с учетом знака
r-Пирсона с учетом знака
Интервалов
Точечно-бисе-риальный к.к.
r-Пирсона с учетом знака
r-Пирсона
r-Пирсона
Отношений
Точечно-бисе-риальный к.к.
r-Пирсона с учетом знака
r-Пирсона
r-Пирсона
Таблица 6.1. Соотношения типов шкал и соответствующих им коэффициентов корреляции
Особенным случаем является тот, когда одна переменная измерена в шкале порядка, а другая в шкале интервалов или отношений. Для измерения связи между ними можно воспользоваться коэффициентом корреляции Пирсона, но необходимо учитывать, что в шкале порядка большее числовое значение ранга соответствует меньшей степени выраженности признака, а в шкалах интервалов и отношений, как правило, наоборот. Поэтому положительная связь между переменными будет выражаться отрицательным коэффициентом корреляции, а отрицательная – положительным. Это обстоятельство необходимо учитывать при интерпретации полученного значения r-Пирсона. В другом случае можно проранжировать значения переменной, измеренной в шкале интервалов или отношений и воспользоваться коэффициентом ранговой корреляции.
6.4. Особенности интерпретации коэффициента корреляции. В отношении коэффициента корреляции рядом авторов часто употребляется понятие зависимости между переменными. В действительности, говоря о корреляции можно говорить лишь о статистической связи. Например, если обнаруживается положительная корреляция между успехами учеников по математике и английскому языку, то из этого не следует, что оценки по одному предмету зависят от оценок по другому, так как они выставляются независимо друг от друга. Скорее всего, за всеми этими оценками стоят факторы интеллекта и мотивации, проявлениями которых и являются успехи по учебным предметам. Также неправомерно, в таких случаях, говорить о причинной связи между двумя переменными, если коэффициент корреляции оказывается высоким. Связь между уровнем дохода в семье и величиной IQ у детей вполне может оказаться достоверной, так как дети из обеспеченных семей имеют больше шансов на получение хорошего образования, но из этого не следует, что количество денег положительно влияет на умственные способности. Статистические методы не могут заменить собой логику и здравый смысл, и констатация причинной связи или зависимости на основе вычислений коэффициента корреляции лежит исключительно на совести исследователя.
При интерпретации нулевого значения коэффициента корреляции необходимо учитывать, что ноль не всегда означает отсутствие связи. Если связь между переменными носит нелинейный характер и на графике отображается кривой, то коэффициент корреляции получится близким или равным нулю несмотря на очевидный характер связи. Действительное отсутствие связи на графике будет отображаться множеством рассеянных точек.
6.5. Сфера применения коэффициента корреляции. Использование коэффициентов корреляции в психологических исследованиях насчитывает уже почти столетнюю историю, и в основном они применяются в следующих случаях:
1. Для проверки гипотезы о связи различных явлений и переменных: социальных и социально-психологических, социально-психологических и психологических, психических и психофизиологических, психофизиологических и физиологических. Результаты таких исследований помогают составить системную картину психических явлений и явлений окружающего мира.
2. В психодиагностике для определения надежности и валидности теста, при создании и адаптации психологических методик.
3. В методе репертуарных решеток Келли для определения связей между конструктами индивидуального сознания.
4. В факторном анализе – методе исследования латентной структуры сложных психологических явлений и переменных, таких как интеллект, личность и т.д.
5.
6.6. Примеры расчетов коэффициентов корреляции
6.6.1. Обе переменные измерены в шкале интервалов (отношений). Мера связи – коэффициент корреляции Пирсона.
n
X
Y
xiyi
1
38
5
190
1444
25
2
44
8
352
1936
64
3
54
8
432
2916
64
4
31
5
155
961
25
5
44
6
264
1936
36
6
62
6
372
3844
36
7
40
6
240
1600
36
8
34
7
238
1156
49
9
31
8
248
961
64
10
35
6
210
1225
36
Суммы
413
65
2701
17979
435
Квадраты Сумм
170569
4225
,
Вывод: статистическая связь недостоверна, т.к.
6.6.2. Обе переменные измерены в шкале порядка. Мера связи – коэффициент корреляции Спирмена.
n
Rx
Ry
1
4
4
2
3
2
1
1
3
7
8
-1
1
4
5
1
4
16
5
2
3
-1
1
6
1
5
-4
16
7
8
9
-1
1
8
9
6
3
9
9
10
10
10
6
7
-1
1
Сумма
46
,
Вывод: достоверна положительная статистическая связь т.к.
6.6.3. Обе переменные измерены в шкале наименований. Мера связи – коэффициент ассоциации Пирсона или четырехпольный коэффициент ассоциации Пирсона.
6.6.3.1. Расчет коэффицента ассоциации Пирсона
n
X
Y
Совпадения
1
2
1
1
1
3
1
1
1
4
5
1
6
1
7
1
8
1
1
1
9
10
1
P
0.6
0.4
0.3
Q
0.4
0.6
,
Вывод: статистическая связь недостоверна, т.к.
6.6.3.2. Расчет четырехпольного коэффициента ассоциации
Переменная X
Да
Нет
Суммы
Переменная
Да
3
1
4
Y
Нет
3
3
6
Суммы
6
4
10
В этом примере использованы те же данные, что и в случае с коэффициентом ассоциации, и видно, что оба коэффициента дают одинаковую оценку связи.
6.6.4. Одна переменная измерена в шкале наименований, а другая – в шкале порядка. Мера связи – рангово-бисериальный коэффициент корреляции.
Сущность этого коэффициента корреляции заключается в том, что после сведения в одну таблицу результатов эксперимента необходимо отдельно выписать ранги ранжированной переменной имеющие единицу по другой переменной, а также ранги имеющие ноль, и после подсчета средних арифметических этих рангов подставить их в формулу рангово-бисериального коэффициента корреляции.
n
X
Y
РангиY1
РангиY0
1
6
6
2
1
10
10
3
4
4
4
1
9
9
5
3
3
6
2
2
7
1
8
8
8
1
7
7
9
1
5
5
10
1
1
Суммы
7.8
3.2
Вывод: здесь можно констатировать значимую отрицательную связь между наличием признака X и порядком проявления признака Y, однако в отличии от других коэффициентов корреляции, рангово-бисериальный имеет неоднозначную интерпретацию. Так в некоторых пособиях приводится другая его формула:
В таком случае можно констатировать значимую положительную связь между отсутствием признака X и порядком проявления признака Y.
6.6.5. Одна переменная измерена в шкале наименований, а другая – в шкале интервалов (или отношений). Мера связи – точечно-бисериальный коэффициент корреляции.
Сущность этого коэффициента корреляции, также как и рангово-бисериального, заключается в том, что после сведения в одну таблицу результатов эксперимента необходимо отдельно выписать значения переменной измеренной по шкале интервалов, имеющие единицу по другой переменной, а также значения имеющие ноль, и после подсчета средних арифметических этих значений подставить их в формулу точечно-бисериального коэффициента корреляции.
Необходимо учитывать, что как и , этот коэффициент корреляции имеет неоднозначную интерпретацию.
n
X
Y
Значения Y1
Значения Y0
1
51
51
2
1
52
52
3
38
38
4
1
35
35
5
44
44
6
42
42
7
1
50
50
8
1
46
46
9
1
47
47
10
53
53
Суммы
46
45,6
6,07
Вывод: в данном случае не обнаружено значимой статистической связи между величиной признака Y и наличием признака X, или, наличие признака X не говорит статистически достоверно том, что значения Y окажутся больше.