Корреляционный анализ. Многомерный корреляционный анализ
Выбери формат для чтения
Загружаем конспект в формате ppt
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Корреляционный анализ
Выборочный коэффициент корреляции
Задача двумерного анализа признаков (Х, Y) состоит, во-первых, в оценке
пяти параметров, определяющих генеральную совокупность M X a X ,
M Y aY , X , Y , XY .
В качестве точечных оценок начальных и центральных моментов первого и
второго порядка генеральной совокупности берут соответствующие
выборочные оценки (см. гл. 1). Таким образом, будем иметь:
X - оценка для a X ,
Y - оценка для aY ,
X 2 - оценка для M ( X 2 ) ,
Y 2 - оценка для M (Y 2 ) ,
XY - оценка для M ( XY ) .
Откуда:
S X2 X 2 ( X ) 2 - оценка для X2 ,
n 2
Sˆ X2
S X - исправленная оценка для X2 ,
n 1
SY2 Y 2 (Y ) 2 - оценка для Y2 ,
n 2
SˆY2
SY - исправленная оценка для Y2 ,
n 1
XY X Y
- оценка для парного
r rXY
S X SY
корреляции.
коэффициента
Многомерный корреляционный
анализ
Если число исследуемых признаков больше двух, то оценку частных коэффициентов корреляции, множественного коэффициента детерминации, коэффициентов уравнения регрессии и др. целесообразно осуществлять с помощью
выборочных аналогов формул (4.11 – 4.15). Для этого на основе выборочных
данных представленных в виде матрицы типа объект – свойство - выборочной
матрицы Х "наблюденных" значений признаков X1…Xn для объектов O1…ON
отобранных из генеральной совокупности
x11 x12 ... x1n
x 22 ... x 2 N
x
(1)
X 21
.
. ...
.
x N 1 x n 2 ... x Nn
находим оценки X j , j 1, n компонент a X j вектора генеральных средних
(a X1 ...a X n )T
1
Xj
N
N
X ij .
i 1
(2)
Многомерный корреляционный
анализ
Для оценки ̂ ковариационной матрицы строим матрицу центрированных
значений Y yij i 1, N , где yij X ij X j , i 1, N , j 1, n и затем оценку ̂ коj 1,n
вариационной матрицы
1
(3)
ˆ Y T Y
N
или неисправленную оценку ̂ u для
1
(3а)
ˆ u
Y TY
N1
Оценку R̂ для корреляционной матрицы R можно построить либо, разделив элементы i-ой строки и i-го столбца на элемент S ii этой же матрица, либо
(если оценка для не строилась) строим матрицу центрированонормированных наблюденных значений признаков:
X ij X j
Z Z ij i 1, N , где Z ij
, i 1, N , j 1, n
j 1,n
S ii
и затем оценку R̂ для R
1
Rˆ Z T Z
N
(4)
Многомерный корреляционный
анализ
оценка rij /(...) для частных коэффициентов корреляции ij /(...)
Rˆ ij
rij /(...)
Rˆ ii Rˆ jj
(5)
оценка S 2j /(...) остаточной дисперсии 2j /(...)
S 2j /(...)
S 2j
Rˆ
(6)
Rˆ jj
оценка R 2j /(...) множественного коэффициента детерминации R 2j /(...)
R 2j /(...)
1
S 2j /(...)
S 2j
1
Rˆ n
Rˆ jj
(7)
Проверки значимости множественного коэффициента
детерминации
Пусть рассматривается оценка R 2j /(..l ..) коэффициента детерминации
2j /(..l ..) , где "l" – указывает количество факторных признаков, связь Xj с
которыми мы желаем исследовать.
Выдвигаем ненулевую гипотезу Н0: 2j /(..l ..) 0 , (факторные признаки
(..l..) не оказывают значимого влияния на Xj), при альтернативной гипотезе
Н1: 2j /(..l ..) 0 . Для проверки гипотезы рассмотрим статистику
F
R 2j / l
(1 R 2j ) /(n l 1)
распределенную, в случае справедливости Н0 по закону ФишераСнедекора с числом степеней свободы 1 l и 2 n l 1 . Если гипотеза
Н0 отвергнута, то будем говорить о том, что множественный коэффициент
детерминации (множественный коэффициент корреляции) значимо
отличен от нуля.
Проверка значимости частных (парных) коэффициентов
корреляции
Выдвигаем нулевую гипотезу Н0: ji /(..l ..) 0 , при альтернативной
гипотезе Н1: ji /(..l ..) 0 .
Используем статистику
r
t ij /(...l2...) n l 2 ,
1 rij /(...l ...)
которая, в случае справедливости Н 0, распределена по закону Стьюдента с
n l 2 степенями свободы.
Для проверки значимости парного коэффициента
используется статистика t , с n 2 степенями свободы:
t
rij
2
ij
1 r
корреляции
n 2.
Если гипотеза Н0 отвергнута, то будем говорить о том, что частный
(парный) коэффициент корреляции значимо отличен от нуля.
Доверительные интервалы для значимо отличных от
нуля характеристик линейной зависимости
Если частный коэффициент корреляции ij /(...) значимо отличен от нуля и
имеет выборочную оценку rij /(...) , то для построения доверительного интервала
осуществим над rij /(...) Z – преобразование Фишера
1 1 rij /(...)
Z r ln
2 1 rij /(...)
1 1
1
Статистика Z r N ( ln
,
).
2 1 n l 3
Следовательно, статистика t
Из уравнения
интервал для Z
Zr Z
1/(n l 3)
N (0,1) .
P ( t ) , находим Ф 1 ( )
2
Zr
n l 3
Z Z r
и доверительный
n l 3
zmin z zmax
Осуществив преобразование обратное Z – преобразованию Фишера
получим доверительный интервал для ij /(...)
rmin rmax .