Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
4 Статистические методы изучения взаимосвязи социально-экономических явлений: корреляционный, регрессионный
анализ
Виды взаимосвязей между показателями
Признаки по их сущности и значению для изучения взаимосвязи делятся на два класса. Признаки, обусловливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называются результативными.
Виды связей:
По характеру:
1) функциональная - такая связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.
2) стохастическая связь – причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем, при большом числе наблюдений.
По степени тесноты связи различают:
Таблица 4.1 – Количественные критерии оценки тесноты связи
Величина показателя связи
Характер связи
1
2
-1
функциональная
от -1 до -0,7
обратная сильная
от -0,7 до -0,5
обратная умеренная
от -0,5 до -0,3
обратная слабая
от -0,3 до 0
практически отсутствует
отсутствует
от 0 до 0,3
практически отсутствует
от 0,3 до 0,5
прямая слабая
от 0,5 до 0,7
прямая умеренная
от 0,7 до 1
прямая сильная
1
функциональная
По направлению:
1) прямая – это связь, при которой с увеличением (с уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного признака. Так, рост объемов производства способствует увеличению прибыли предприятия.
2) обратная – это связь, при которой с увеличением (с уменьшением) значений одного признака происходит уменьшение (увеличение) значений другого признака. Так, снижение себестоимости единицы производимой продукции влечет за собой рост рентабельности.
По аналитическому выражению выделяют связи:
1) прямолинейные (линейные);
В этом случае статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии:
2) нелинейные (криволинейные).
В этом случае связь может быть выражена уравнением какой-либо кривой, например:
параболы –
гиперболы – ; и т.д.
Методы изучения взаимосвязей
1) Графический метод – позволяет получить предварительное представление о зависимости между случайными величинами X и Y.
Графически взаимосвязь двух признаков изображается с помощью поля корреляции (или диаграммы рассеяния). В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначают точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
Возможны различные варианты расположения «облака» точек, по которым можно судить о виде и степени взаимосвязи между признаками X и Y (см. Рис. 4.1).
Количественной характеристикой степени линейной зависимости между случайными величинами X и Y является коэффициент корреляции ρ.
Рис. 4.1 – Варианты расположения «облака» точек
В случае, когда между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость |ρ|>0, ее можно аппроксимировать уравнением линейной регрессии Y на X:
где – коэффициенты линейной регрессии; – независимая переменная (фактор, предиктор); - зависимая переменная (результат, отклик).
2) Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
3) Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой переменной, или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).
Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии (a0, a1, и a2 – в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.
Изучение связи между тремя и более связанными между собой признаками осуществляется с помощью множественной (многофакторной) регрессии:
Линейное уравнение множественной регрессии имеет вид:
,
где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
x1, x2, …, xk - факторные признаки;
a1, a2, …, ak - параметры модели (коэффициенты регрессии).
Параметры модели определяются методом наименьших квадратов.
Например, система нормальных уравнений для двухфакторной регрессионной модели имеет следующий вид:
Интерпретация результатов корреляционно-регрессионного
анализа
1) Линейный коэффициент корреляции (К. Пирсона) характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости:
Линейный коэффициент корреляции изменяется в пределах от -1 до 1: [−1≤r≤1]. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно осуществлять следующим образом (см. табл. 4.2).
Таблица 4.2 – Оценка линейного коэффициента корреляции
Значение линейного
коэффициента связи
Характеристика
связи
Интерпретация связи
1
2
3
r = 0
отсутствует
–
0Fтабл.
Табличные значения F-критерия представлены в Приложении (см. табл. 1 Приложения).
2) p-критерий.
Используется как для оценки значимости регрессионной модели в целом, так и для оценки значимости включенных в модель факторов.
Расчетное значение p-критерия должно быть не больше (т.е. меньше или равно) принятого уровня значимости α (как правило, меньше или равно 0,05): p≤0,05.
Если данное условие выполняется для модели в целом, то уравнение регрессии считается значимым. Если данное условие выполняется для переменной, то она считается значимой для модели. В противном случае переменная может быть исключена из модели как незначимая.
3) Для оценки значимости коэффициентов регрессии используется t-критерий Стьюдента.
Значимость линейного коэффициента корреляции r и параметра a1 в уравнении Y = a0 + a1x оценивается как
значимость параметра a0 определяется по формуле:
Расчетное значение t-критерия сравнивается по абсолютной величине (т.е. по модулю) с граничным (табличным) при (n-m-1) степенях свободы и заданном уровне значимости (чаще всего принимают α = 0,01 или 0,05). Если фактическое значение t-критерия больше табличного, то данный параметр считается значимым: tрасч.>tтабл..
Табличные значения t-критерия представлены в Приложении (см. табл. 2 Приложения).
Приложение
Таблица 1 – Значения F-критерия Фишера при уровне значимости α =0,05
k1
1
2
3
4
5
6
8
12
24
∞
k2
1
161,45
199,50
215,72
224,57
230,17
233,97
238,89
243,91
249,04
254,32
2
18,51
19,00
19,16
19,25
19,30
19,33
19,37
19,41
19,45
19,50
3
10,13
9,55
9,28
9,12
9,01
8,94
8,84
8,74
8,64
8,53
4
7,71
6,94
6,59
6,39
6,26
6,16
6,04
5,91
5,77
5,63
5
6,61
5,79
5,41
5,19
5,05
4,95
4,82
4,68
4,53
4,36
6
5,99
5,14
4,76
4,53
4,39
4,28
4,15
4,00
3,84
3,67
7
5,59
4,74
4,35
4,12
3,97
3,87
3,73
3,57
3,41
3,23
8
5,32
4,46
4,07
3,84
3,69
3,58
3,44
3,28
3,12
2,93
9
5,12
4,26
3,86
3,63
3,48
3,37
3,23
3,07
2,90
2,71
10
4,96
4,10
3,71
3,48
3,33
3,22
3,07
2,91
2,74
2,54
11
4,84
3,98
3,59
3,36
3,20
3,09
2,95
2,79
2,61
2,40
12
4,75
3,88
3,49
3,26
3,11
3,00
2,85
2,69
2,50
2,30
13
4,67
3,80
3,41
3,18
3,02
2,92
2,77
2,60
2,42
2,21
14
4,60
3,74
3,34
3,11
2,96
2,85
2,70
2,53
2,35
2,13
15
4,54
3,68
3,29
3,06
2,90
2,79
2,64
2,48
2,29
2,07
16
4,49
3,63
3,24
3,01
2,85
2,74
2,59
2,42
2,24
2,01
17
4,45
3,59
3,20
2,96
2,81
2,70
2,55
2,38
2,19
1,96
18
4,41
3,55
3,16
2,93
2,77
2,66
2,51
2,34
2,15
1,92
19
4,38
3,52
3,13
2,90
2,74
2,63
2,48
2,31
2,11
1,88
20
4,35
3,49
3,10
2,87
2,71
2,60
2,45
2,28
2,08
1,84
21
4,32
3,47
3,07
2,84
2,68
2,57
2,42
2,25
2,05
1,81
22
4,30
3,44
3,05
2,82
2,66
2,55
2,40
2,23
2,03
1,78
23
4,28
3,42
3,03
2,80
2,64
2,53
2,38
2,20
2,00
1,76
Продолжение таблицы 1
k1
1
2
3
4
5
6
8
12
24
∞
k2
24
4,26
3,40
3,01
2,78
2,62
2,51
2,36
2,18
1,98
1,73
25
4,24
3,38
2,99
2,76
2,60
2,49
2,34
2,16
1,96
1,71
26
4,22
3,37
2,98
2,74
2,59
2,47
2,32
2,15
1,95
1,69
27
4,21
3,35
2,96
2,73
2,57
2,46
2,30
2,13
1,93
1,67
28
4,20
3,34
2,95
2,71
2,56
2,44
2,29
2,12
1,91
1,65
29
4,18
3,33
2,93
2,70
2,54
2,43
2,28
2,10
1,90
1,64
30
4,17
3,32
2,92
2,69
2,53
2,42
2,27
2,09
1,89
1,62
35
4,12
3,26
2,87
2,64
2,48
2,37
2,22
2,04
1,83
1,57
40
4,08
3,23
2,84
2,61
2,45
2,34
2,18
2,00
1,79
1,51
45
4,06
3,21
2,81
2,58
2,42
2,31
2,15
1,97
1,76
1,48
50
4,03
3,18
2,79
2,56
2,40
2,29
2,13
1,95
1,74
1,44
60
4,00
3,15
2,76
2,52
2,37
2,25
2,10
1,92
1,70
1,39
70
3,98
3,13
2,74
2,50
2,35
2,23
2,07
1,89
1,67
1,35
80
3,96
3,11
2,72
2,49
2,33
2,21
2,06
1,88
1,65
1,31
90
3,95
3,10
2,71
2,47
2,32
2,20
2,04
1,86
1,64
1,28
100
3,94
3,09
2,70
2,46
2,30
2,19
2,03
1,85
1,63
1,26
125
3,92
3,07
2,68
2,44
2,29
2,17
2,01
1,83
1,60
1,21
150
3,90
3,06
2,66
2,43
2,27
2,16
2,00
1,82
1,59
1,18
200
3,89
3,04
2,65
2,42
2,26
2,14
1,98
1,80
1,57
1,14
300
3,87
3,03
2,64
2,41
2,25
2,13
1,97
1,79
1,55
1,10
400
3,86
3,02
2,63
2,40
2,24
2,12
1,96
1,78
1,54
1,07
500
3,86
3,01
2,62
2,39
2,23
2,11
1,96
1,77
1,54
1,06
1000
3,85
3,00
2,61
2,38
2,22
2,10
1,95
1,76
1,53
1,03
3,84
2,99
2,60
2,37
2,21
2,09
1,94
1,75
1,52
1,00
Таблица 2 – Критические значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01
Число степеней свободы d.f.
α
0,10
0,05
0,01
1
2
3
4
1
6,3138
12,706
63,657
2
2,9200
4,3027
9,9248
3
2,3534
3,1825
5,8409
4
2,1318
2,7764
4,6041
5
2,0150
2,5706
4,0321
6
1,9432
2,4469
3,7074
7
1,8946
2,3646
3,4995
8
1,8595
2,3060
3,3554
9
1,8331
2,2622
3,2498
10
1,8125
2,2281
3,1693
11
1,7959
2,2010
3,1058
12
1,7823
2,1788
3,0545
13
1,7709
2,1604
3,0123
14
1,7613
2,1448
2,9768
15
1,7530
2,1315
2,9467
16
1,7459
2,1199
2,9208
17
1,7396
2,1098
2,8982
18
1,7341
2,1009
2,8784
19
1,7291
2,0930
2,8609
20
1,7247
2,0860
2,8453
21
1,7207
2,0796
2,8314
Продолжение таблицы 2
1
2
3
4
22
1,7171
2,0739
2,8188
23
1,7139
2,0687
2,8073
24
1,7109
2,0639
2,7969
25
1,7081
2,0595
2,7874
26
1,7056
2,0555
2,7787
27
1,7033
2,0518
2,7707
28
1,7011
2,0484
2,7633
29
1,6991
2,0452
2,7564
30
1,6973
2,0423
2,7500
40
1,6839
2,0211
2,7045
60
1,6707
2,0003
2,6603
120
1,6577
1,9799
2,6174
∞
1,6449
1,9600
2,5758