Справочник от Автор24
Поделись лекцией за скидку на Автор24

Статистические методы изучения взаимосвязи социально-экономических явлений: корреляционный, регрессионный анализ

  • 👀 573 просмотра
  • 📌 530 загрузок
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Статистические методы изучения взаимосвязи социально-экономических явлений: корреляционный, регрессионный анализ» docx
4 Статистические методы изучения взаимосвязи социально-экономических явлений: корреляционный, регрессионный анализ Виды взаимосвязей между показателями Признаки по их сущности и значению для изучения взаимосвязи делятся на два класса. Признаки, обусловливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называются результативными. Виды связей: По характеру: 1) функциональная - такая связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. 2) стохастическая связь – причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем, при большом числе наблюдений. По степени тесноты связи различают: Таблица 4.1 – Количественные критерии оценки тесноты связи Величина показателя связи Характер связи 1 2 -1 функциональная от -1 до -0,7 обратная сильная от -0,7 до -0,5 обратная умеренная от -0,5 до -0,3 обратная слабая от -0,3 до 0 практически отсутствует отсутствует от 0 до 0,3 практически отсутствует от 0,3 до 0,5 прямая слабая от 0,5 до 0,7 прямая умеренная от 0,7 до 1 прямая сильная 1 функциональная По направлению: 1) прямая – это связь, при которой с увеличением (с уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного признака. Так, рост объемов производства способствует увеличению прибыли предприятия. 2) обратная – это связь, при которой с увеличением (с уменьшением) значений одного признака происходит уменьшение (увеличение) значений другого признака. Так, снижение себестоимости единицы производимой продукции влечет за собой рост рентабельности. По аналитическому выражению выделяют связи: 1) прямолинейные (линейные); В этом случае статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии: 2) нелинейные (криволинейные). В этом случае связь может быть выражена уравнением какой-либо кривой, например: параболы – гиперболы – ; и т.д. Методы изучения взаимосвязей 1) Графический метод – позволяет получить предварительное представление о зависимости между случайными величинами X и Y. Графически взаимосвязь двух признаков изображается с помощью поля корреляции (или диаграммы рассеяния). В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначают точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Возможны различные варианты расположения «облака» точек, по которым можно судить о виде и степени взаимосвязи между признаками X и Y (см. Рис. 4.1). Количественной характеристикой степени линейной зависимости между случайными величинами X и Y является коэффициент корреляции ρ. Рис. 4.1 – Варианты расположения «облака» точек В случае, когда между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость |ρ|>0, ее можно аппроксимировать уравнением линейной регрессии Y на X: где – коэффициенты линейной регрессии; – независимая переменная (фактор, предиктор); - зависимая переменная (результат, отклик). 2) Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). 3) Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой переменной, или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков). Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия. Оценка параметров уравнений регрессии (a0, a1, и a2 – в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии: Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид: В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения. Изучение связи между тремя и более связанными между собой признаками осуществляется с помощью множественной (многофакторной) регрессии: Линейное уравнение множественной регрессии имеет вид: , где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии; x1, x2, …, xk - факторные признаки; a1, a2, …, ak - параметры модели (коэффициенты регрессии). Параметры модели определяются методом наименьших квадратов. Например, система нормальных уравнений для двухфакторной регрессионной модели имеет следующий вид: Интерпретация результатов корреляционно-регрессионного анализа 1) Линейный коэффициент корреляции (К. Пирсона) характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости: Линейный коэффициент корреляции изменяется в пределах от -1 до 1: [−1≤r≤1]. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно осуществлять следующим образом (см. табл. 4.2). Таблица 4.2 – Оценка линейного коэффициента корреляции Значение линейного коэффициента связи Характеристика связи Интерпретация связи 1 2 3 r = 0 отсутствует – 0Fтабл. Табличные значения F-критерия представлены в Приложении (см. табл. 1 Приложения). 2) p-критерий. Используется как для оценки значимости регрессионной модели в целом, так и для оценки значимости включенных в модель факторов. Расчетное значение p-критерия должно быть не больше (т.е. меньше или равно) принятого уровня значимости α (как правило, меньше или равно 0,05): p≤0,05. Если данное условие выполняется для модели в целом, то уравнение регрессии считается значимым. Если данное условие выполняется для переменной, то она считается значимой для модели. В противном случае переменная может быть исключена из модели как незначимая. 3) Для оценки значимости коэффициентов регрессии используется t-критерий Стьюдента. Значимость линейного коэффициента корреляции r и параметра a1 в уравнении Y = a0 + a1x оценивается как значимость параметра a0 определяется по формуле: Расчетное значение t-критерия сравнивается по абсолютной величине (т.е. по модулю) с граничным (табличным) при (n-m-1) степенях свободы и заданном уровне значимости (чаще всего принимают α = 0,01 или 0,05). Если фактическое значение t-критерия больше табличного, то данный параметр считается значимым: tрасч.>tтабл.. Табличные значения t-критерия представлены в Приложении (см. табл. 2 Приложения). Приложение Таблица 1 – Значения F-критерия Фишера при уровне значимости α =0,05 k1 1 2 3 4 5 6 8 12 24 ∞ k2 1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32 2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61 2,40 12 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50 2,30 13 4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,42 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,24 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,08 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,05 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,03 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,00 1,76 Продолжение таблицы 1 k1 1 2 3 4 5 6 8 12 24 ∞ k2 24 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 1,98 1,73 25 4,24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 1,96 1,71 26 4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,30 2,13 1,93 1,67 28 4,20 3,34 2,95 2,71 2,56 2,44 2,29 2,12 1,91 1,65 29 4,18 3,33 2,93 2,70 2,54 2,43 2,28 2,10 1,90 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,09 1,89 1,62 35 4,12 3,26 2,87 2,64 2,48 2,37 2,22 2,04 1,83 1,57 40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,00 1,79 1,51 45 4,06 3,21 2,81 2,58 2,42 2,31 2,15 1,97 1,76 1,48 50 4,03 3,18 2,79 2,56 2,40 2,29 2,13 1,95 1,74 1,44 60 4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,70 1,39 70 3,98 3,13 2,74 2,50 2,35 2,23 2,07 1,89 1,67 1,35 80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,88 1,65 1,31 90 3,95 3,10 2,71 2,47 2,32 2,20 2,04 1,86 1,64 1,28 100 3,94 3,09 2,70 2,46 2,30 2,19 2,03 1,85 1,63 1,26 125 3,92 3,07 2,68 2,44 2,29 2,17 2,01 1,83 1,60 1,21 150 3,90 3,06 2,66 2,43 2,27 2,16 2,00 1,82 1,59 1,18 200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,80 1,57 1,14 300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79 1,55 1,10 400 3,86 3,02 2,63 2,40 2,24 2,12 1,96 1,78 1,54 1,07 500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,54 1,06 1000 3,85 3,00 2,61 2,38 2,22 2,10 1,95 1,76 1,53 1,03  3,84 2,99 2,60 2,37 2,21 2,09 1,94 1,75 1,52 1,00 Таблица 2 – Критические значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01 Число степеней свободы d.f. α 0,10 0,05 0,01 1 2 3 4 1 6,3138 12,706 63,657 2 2,9200 4,3027 9,9248 3 2,3534 3,1825 5,8409 4 2,1318 2,7764 4,6041 5 2,0150 2,5706 4,0321 6 1,9432 2,4469 3,7074 7 1,8946 2,3646 3,4995 8 1,8595 2,3060 3,3554 9 1,8331 2,2622 3,2498 10 1,8125 2,2281 3,1693 11 1,7959 2,2010 3,1058 12 1,7823 2,1788 3,0545 13 1,7709 2,1604 3,0123 14 1,7613 2,1448 2,9768 15 1,7530 2,1315 2,9467 16 1,7459 2,1199 2,9208 17 1,7396 2,1098 2,8982 18 1,7341 2,1009 2,8784 19 1,7291 2,0930 2,8609 20 1,7247 2,0860 2,8453 21 1,7207 2,0796 2,8314 Продолжение таблицы 2 1 2 3 4 22 1,7171 2,0739 2,8188 23 1,7139 2,0687 2,8073 24 1,7109 2,0639 2,7969 25 1,7081 2,0595 2,7874 26 1,7056 2,0555 2,7787 27 1,7033 2,0518 2,7707 28 1,7011 2,0484 2,7633 29 1,6991 2,0452 2,7564 30 1,6973 2,0423 2,7500 40 1,6839 2,0211 2,7045 60 1,6707 2,0003 2,6603 120 1,6577 1,9799 2,6174 ∞ 1,6449 1,9600 2,5758
«Статистические методы изучения взаимосвязи социально-экономических явлений: корреляционный, регрессионный анализ» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ

Тебе могут подойти лекции

Смотреть все 634 лекции
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot