Статистические методы изучения взаимосвязей
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 5. Статистические методы изучения взаимосвязей
5.1. Понятие корреляционной связи и методы ее выявления
Все
социально-экономические
явления
находятся
в
причинно-
следственных взаимных связях и взаимной обусловленности. Статистика
неизбежно
сталкивается
с
различными
зависимостями,
как
между
количественными, так и между качественными показателями, признаками.
Все многообразие связей можно свести к двум видам: функциональным
и стохастическим (корреляционным). При обоих видах связи одни признаки
выступают в качестве факторных, другие - в качестве результативных.
Корреляционную связь условно можно рассматривать как своего рода
функциональную связь средней величины одного признака (результативного)
со значением другого (или других).
Изучение корреляционных связей осуществляется по этапам:
1) выявление наличия (отсутствия) корреляционной связи между
изучаемыми признаками;
2) измерение тесноты связи между двумя (и более) признаками с
помощью специальных коэффициентов (корреляционный анализ);
3) определение уравнения регрессии - математической модели, в
которой среднее значение результативного признака у рассматривается как
функция одной или нескольких переменных - факторных признаков
(регрессионный анализ).
Чтобы
выявить
наличие
корреляционной
связи
между
двумя
признаками, проводится группировка единиц совокупности по факторному
признаку х и для каждой выделенной группы рассчитывается среднее
значение результативного признака у. Если результативный признак у
зависит от факторного х, то в изменении среднего значения у будет
прослеживаться определенная закономерность.
5.2. Показатели тесноты связи между двумя качественными
признаками
Для определения тесноты связи двух качественных признаков, каждый
из которых состоит только из двух групп, применяются коэффициент
ассоциации и коэффициент контингенции.
Таблица для вычисления коэффициентов ассоциации и контингенции
a
c
a+c
b
d
b+d
a+b
c+d
a+b+ c+d
Коэффициент ассоциации вычисляется по формуле:
Ка=(ad-bc)/(ad+bc)
Если в одно из значений частоты равно 0, то Ка = 1, в этом случае
преувеличена степень действительной связи.
Коэффициент контингенции всегда меньше коэффициента ассоциации.
Связь считается подтвержденной, если | Ка | > 0,5 или | Кк | > 0,3.
Если каждый из качественных признаков состоит более чем из двух
групп, то теснота связи измеряется с помощью коэффициента взаимной
сопряженности
Пирсона
и
коэффициента
Чупрова.
Коэффициенты
принимают значения от 0 до 1, и чем ближе к 1, тем теснее связь.
Коэффициент Чупрова более точен, и всегда меньше, чем коэффициент
Пирсона.
5.3. Показатели тесноты связи между двумя количественными
признаками
Связь между количественными признаками измеряется через их
вариацию. В качестве показателей тесноты связи между количественными
признаками может быть использован коэффициент Фехнера.
Коэффициент корреляции знаков, или коэффициент Фехнера, основан
на
оценке
степени
согласованности
направлений
отклонений
индивидуальных значений факторного и результативного признаков от
соответствующих средних. Вычисляется по формуле:
Кф= (па-пв)/(па+пв)
где
па - число совпадений знаков отклонений индивидуальных величин от
средней;
пв - число несовпадений.
Коэффициент Фехнера может принимать значения от -1 до +1. Кф = 1
свидетельствует о
возможном наличии
прямой
связи, К ф
=
-1
свидетельствует о возможном наличии обратной связи.
Линейный коэффициент корреляции - измеритель тесноты линейной
связи между двумя количественными признаками х и у, основанный на
предположении, что при полной независимости признаков х и у отклонения
значений факторного признака от средней носят случайный характер и
должны случайно сочетаться с различными отклонениями. При наличии
значительного перевеса совпадений или несовпадений таких отклонений
делается предположение о наличии связи между х и у.
В теории статистики разработаны и на практике применяются
различные модификации формул расчета коэффициента корреляции Пирсона
(rxy).
Значения
коэффициента
корреляции
Пирсона
интерпретируются
исходя из его абсолютных значений. Возможные значения коэффициента
корреляции варьируют от 0 до ±1.
Чем больше абсолютное значение rху , тем выше теснота связи между
двумя величинами.
rху = 0 говорит о полном отсутствии связи.
rxy = 1 — свидетельствует о наличии абсолютной (функциональной)
связи. Для оценки тесноты или силы корреляционной связи обычно
используют
общепринятые
критерии,
согласно
которым
абсолютные
значения rху < 0,3 свидетельствуют о слабой связи, значения rху от 0,3 до 0,7 о
связи средней тесноты, значения rху > 0,7 - о сильной связи.
Более точную оценку силы корреляционной связи можно получить,
если воспользоваться таблицей Чеддока:
Абсолютное значение rху /Теснота (сила) корреляционной связи
менее 0,3 /слабая
0,3 - 0,5 /умеренная
0,5 - 0,7 /заметная
0 ,7 - 0 ,9 /высокая
более 0,9 весьма высокая
Оценка статистической значимости коэффициента корреляции rху
осуществляется при помощи t-критерия Стьюдента.
Полученное значение tr сравнивается с критическим значением при
определенном уровне значимости и числе степеней свободы п-2, (п количество исследуемых единиц). Если tr превышает tкрит, то делается вывод
о статистической значимости выявленной корреляционной связи.
Коэффициент
корреляции
рангов
Спирмена
является
непараметрическим показателем связи между переменными, измеренными в
ранговой шкале. При расчете этого коэффициента не требуется никаких
предположений о характере распределений признаков в генеральной
совокупности. Этот коэффициент определяет степень тесноты связи
порядковых признаков, которые в этом случае представляют собой ранги
сравниваемых величин.
При использовании коэффициента ранговой корреляции условно
оценивают тесноту связи между признаками, считая значения коэффициента
равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,3,
но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более
- показателями высокой тесноты связи.
Коэффициент конкордации Кендалла (коэффициент множественной
ранговой корреляции) определяется для того, чтобы выявить согласованность
мнений экспертов по нескольким факторам.
Если W< 0,2 - 0,4, значит согласованность мнений экспертов слабая,
если W> 0,6 - 0,8, то согласованность мнений экспертов сильная.
Слабая согласованность обычно является следствием следующих
причин:
• в рассматриваемой группе экспертов действительно отсутствует
общность мнений;
• внутри группы существуют коалиции с высокой согласованностью
мнений, однако, обобщенные мнения коалиций противоположны.
При отклонении парной статистической зависимости от линейной
коэффициент корреляции теряет свой смысл как характеристика тесноты
связи. В этом случае можно воспользоваться таким измерителем связи, как
индекс корреляции (корреляционное отношение). Различают эмпирическое и
теоретическое корреляционное отношение.
Эмпирическое
корреляционное
отношение
рассчитывается
по
аналитической группировке (или корреляционной таблице) как корень
квадратный из отношения межгрупповой дисперсии результативного
признака к общей дисперсии результативного признака.
Теоретическое корреляционное отношение определяется на основе
выровненных
(теоретических)
значений
результативного
признака,
рассчитанных по уравнению регрессии (для любой формы связи).
Величина корреляционного отношения изменяется от 0 до 1. Если
значение корреляционного отношения близко к нулю, то связь отсутствует, а
если к единице - то связь тесная. Корреляционное отношение, равное
единице (ɳ= 1), свидетельствует о наличии функциональной связи между
факторным и результативным признаком.