Коэффициент линейной корреляции Пирсона
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 10. Коэффициент линейной корреляции Пирсона
Коэффициент линейной корреляции является параметрическим
показателем, то есть позволяет оценить различия и требует расчета
средних и дисперсий, употребляется для количественных данных.
Характеризует наличие только линейной связи между признаками Х и У и
устанавливает тесноту этой связи.
Величина Коэффициент линейной корреляции Пирсона не может
превышать +1 и быть меньше-1. Это и есть границы для коэффициента
корреляции. Если при вычислении получается величина больше +1 или
меньше -1, то произошла ошибка в вычислении!!!!!!!
Коэффициент линейной корреляции Пирсона вычисляется по формуле:
Число степеней свободы df = n − 2.
где r — коэффициент корреляции, n — объем выборки. При увеличении
объема выборки n статистическая ошибка Sr 0, r 0.
Cвое название линейного коэффициент кореляции Пирсона получил в
силу того, что он измеряет линейный аспект взаимосвязи переменных,
которая вполне может быть нелинейной. Однако предположение о
линейности взаимосвязи вполне разумно, поскольку линейная функция
является простейшей и часто встречающейся математической моделью
эмпирических взаимосвязей.
При расчете коэффициента корреляции Пирсона важно соблюдать
следующие условия для эмпирических данных:
1. Нормальность распределения переменных в выборке.
2. Связь между переменными должна быть линейной.
3. Для получения представительной оценки генерального параметра
необходим достаточный объем выборки: n > 30.
Однако в дальнейших иллюстративных примерах для экономии
времени будут использоваться выборки из 10 человек.
Важно знать хотя бы несколько граничных значений коэффициента
корреляции.
Граничные значения коэффициента корреляции Пирсона
Объем выборrb
n=10
n=15
n=30
Граничные значения коэффициентов
α =5%
α = 1%
0,63
0,77
0,51
0,64
0,36
0,46
Статистическая проверка для коэффициента корреляции производится
следующим образом. Исследователь сам принимает решение о допустимой
вероятности ошибки. В исследовательской практике в качестве граничного
обычно принимается табличное значение на 5% уровне значимости rгр
(5%), с которым сравнивается фактическое значение критерия.
В случае, когда абсолютное значение rф < rгр (5%), принимается
нулевая гипотеза, это означает, что выборочный коэффициент корреляции
недостоверно отличается от 0, т. е. является выборочной оценкой
генерального коэффициента корреляции, равного 0 ( = 0).
В противоположном случае, т. е. при rф > rгр(5%) , принимается
альтернативная
гипотеза
H1,
согласно
которой
фактический
(эмпирический) коэффициент корреляции достоверно отличается от 0.
Альтернативная гипотеза принимается уже при равенстве фактического и
граничного значений. Принято также фиксировать в выводах случаи, когда
происходит превышение граничного значения rгр (1%), в этом случае
принятие альтернативной гипотезы происходит с меньшим риском ошибки.
Однако при применении пакета прикладных статистических программ
типа «Statistica» или SPSS для фактического значения рассчитывается его
уровень значимости.
ЗАДАЧА
10 школьникам были даны тесты на наглядно образное
мышление. Измерялось среднее время решения заданий теста в
секундах.
Вопрос: Существует ли ВЗАИМОСВЯЗЬ между временем
решения этих задач?
Х – среднее время решения наглядно образных задач.
У – среднее время решения вербальных заданий и тестов.
Как всегда разносим формулу в таблицу для удобства решения!
Прошу вас самостоятельно закончить решение в таблице!!!!!!!!!!!!
№
Х
У
Хi- x
1
2
3
4
5
6
7
8
9
19
32
44
28
35
39
39
44
44
17
7
28
27
31
20
17
35
43
-16,7
-3,7
8,3
10
33
17
Ʃ
357 242
среднее 35,7 24,2
x
278,89
13,69
68,89
(Хi- x )(У- y )
У- y
-7,2
-17, 2
3,8
51,84
295,84
14,44
80
90
75
80
1007,6
588,1
120,24
63,64
31,54
416,6
=
Фактическое значение rф = 0,54 . Поскольку при n = 10 rгр (5%) = 0,71
выполняется неравенство rф = 0,54 < rгр (5%) = 0,71. Эти данные могут
быть перенесены на график, где по оси х откладывается r :
Н1 — наличие
различий
H0 — отсутствие
различий
rф = 0,54 (
r гр.(5% ) =0,71
r гр.(1% ) = 0,83
r
Cтатистический вывод. Поскольку фактическое значение rф = 0,54,
что меньше, чем rгр (5%) = 0,71, принимается нулевая гипотеза Н0, согласно
которой наш фактический коэффициент корреляции rф = 0,54
статистически недостоверно отличается от 0.
Психологический вывод. Не существует достоверной корреляционной
связи между временем решения наглядно-образных и вербальных заданий
теста
Однако следует отметить условность (конвенциональность)
статистических выводов в отношении выбора пороговых значений,
которые приводят к смене принимаемой гипотезы. В нашем примере
очевидна близость фактического значения коэффициента корреляции к 5%
граничному значению, в этом случае говорят о наличии тенденции и
принято рекомендовать увеличить выборку, предпринять меры по ее
рандомизации и повторить вычисления.