Общие понятия о статистике. Предмет статистики
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1. ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ
1.1. ПРЕДМЕТ И МЕТОД СТАТИСТИКИ
Общие понятия о статистике. Предмет статистики.
Слово «статистика» происходит от латинского слова «status», что означает состояние, положение явлений. От этого корня возникли слова «stato»
(государство), «statista» – (статистик – знаток государства), «statistica»
(статистика определенная сумма знаний, сведений о государстве). Термин
«статистика» пережил столетия, хотя содержание его неоднократно менялось.
Готфрид Ахенваль вместе с другим учеными-статистами Геттингенского университета Г. Конрингом основали немецкую описательную школу, практикующую статистику как государствоведение.
Одновременно в Англии существовала и другая научная школа «политических арифметиков», основанная статистом В. Петти. По сути статистика сложилась на базе этих двух школ. От государствоведения она получила систему количественного описания социально-экономических явлений, а от «политических арифметиков» – статистическое обобщение количественных характеристик массовых явлений, с целью познания их закономерностей.
В настоящее время термин «статистика» употребляется в трех значениях:
– отрасль практической деятельности, которая имеет своей целью
сбор, обработку, анализ и публикацию массовых данных о различных явлениях общественной жизни;
– цифровой материал, служащий для характеристики какой-либо области общественных явлений;
– отрасль знания, особая научная дисциплина.
Предметом статистики является изучение с количественной стороны
качественного содержания массовых социально-экономических явлений
в конкретных условиях места и времени. Она устанавливает количественные характеристики развития, определяет соотношения между отдельными
показателями, дает цифровую оценку проявляющимся при этом закономерностям. Статистика изучает также влияние природных и технических
факторов на изменение количественных характеристик социально-экономических явлений и влияние жизнедеятельности общества на среду обитания.
Статистическая методология. Статистические показатели.
Метод статистики – это совокупность специальных статистических
приемов, обеспечивающих научно-обоснованный сбор, обработку и анализ
статистической информации. К таким методам относятся методы массового наблюдения статистических группировок, обобщающих статистических
1
показателей (абсолютных, относительных, средних величин, статистических коэффициентов и др.), табличный, графический и т. д. В то же время
статистика – методологическая наука, что отличает ее от других экономических наук.
Общей основой разработки и применения статистической методологии являются общенаучные, формально-логические и диалектические приемы познания мира. Положение о том, что теоретической базой статистики
являются экономическая теория и исторический материализм, далеко не
бесспорно.
Количественная сторона массовых общественных явлений и процессов проявляется в их конкретных размерах и соотношениях и выражается
в статистических показателях. Статистический показатель – это количественная мера общественных явлений, имеющая качественную определенность. Статистические показатели следует отличать от статистических
данных, под которыми понимают конкретные численные значения статистических показателей. Различают два их основных вида:
– учетно-оценочные показатели – это статистическая характеристика размера качественно определенных социально-экономических явлений
в конкретных условиях места и времени;
– аналитические показатели, которые применяют для анализа статистической информации и характеристики особенностей развития изучаемого явления.
– система статистических показателей – это их совокупность, отражающая взаимосвязи, которые объективно существуют между явлениями.
Системы статистических показателей носят исторический характер, методология их расчета непрерывно совершенствуется.
Организация государственной статистики Российской Федерации.
Одной из важнейших задач статистики является всестороннее освещение социально-экономического положения Российской Федерации, происходящих изменений, связанных с переходом к рыночным отношениям.
Особое место в механизме управления экономикой принадлежит статистике, поскольку состав информации, ее качество и актуальность определяют
качественный уровень принимаемых управленческих решений.
В основу организации статистической работы в России положены
следующие принципы:
– централизованное руководство статистикой;
– единое организационное строение и методология;
– неразрывная связь статистических органов с органами государственного управления.
Методология статистических показателей, метод сбора и обработки
статистических данных, устанавливаемых Госкомстатом России, являются
официальными статистическими стандартами РФ.
2
Система государственной статистики находится в ведении Правительства РФ и ему подотчетна, что обеспечивает неразрывную связь с органами государственного управления. Она имеет иерархическую структуру, включающую федеральный, республиканский, краевой, областной, городской и районный уровни.
Низовыми органами государственной статистики являются городские и районные управления, руководящим организационным и методологическим центром – Госкомстат РФ.
При Председателе Госкомстата России действует Совет руководителей органов государственной статистики, созданный для координации деятельности региональных органов. В состав Госкомстата РФ входят такие
управления, как аналитических, информационных ресурсов и регистров,
статистических стандартов и классификаций, организации статистического
наблюдения, СНС и балансов, статистики финансов, цен и платежного баланса и т. д.
Структура госкомитетов и статистических управлений в основном
повторяет структуру Госкомстата РФ.
1.2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
Статистическое наблюдение, этапы его проведения.
Исследование массовых общественных явлений включает этапы сбора
статистической информации и ее первичной обработки, сведения и группировки результатов наблюдения в определенные совокупности, обобщения и анализа полученных материалов.
Статистическое наблюдение – это первая стадия всякого статистического исследования, представляющая собой научно организованный по
единой программе учет фактов о явлениях и процессах общественной жизни и сбор полученных на основе этого учета массовых первичных данных.
К статистическому наблюдению предъявляются требования полноты
статистических данных, их достоверности и точности, а также единообразия и сопоставимости.
Процесс проведения статистического наблюдения включает следующие этапы:
– подготовка;
– проведение массового сбора данных;
– подготовка данных к автоматизированной обработке;
– разработка предложений по совершенствованию.
Программно-методические и организационные вопросы статистического наблюдения.
Статистическое наблюдение всегда надо проводить по строго определенному плану, включающему как программные, так и организационные
3
вопросы. Программа наблюдения определяется задачами всего статистического исследования. Поэтому, прежде всего, необходимо сформулировать
цели и задачи всей работы, а затем определить объект наблюдения, установить единицу наблюдения и отчетную единицу, определить систему показателей, составляющих содержание программы статистического наблюдения.
Объектом статистического наблюдения называется совокупность единиц изучаемого явления, о которых должны быть собраны сведения. Для
того, чтобы исследуемая совокупность была более однородной, прибегают
к цензу. Цензом в статистике называют ограничительный признак, которому должны удовлетворять все единицы обследуемой совокупности.
Единица наблюдения – это первичный элемент объекта статистического наблюдения, являющийся носителем признаков, подлежащих регистрации, и основой ведущегося при обследовании счета. Отчетная единица –
это та первичная ячейка, от которой должны быть получены необходимые
статистические сведения.
Программа наблюдения представляет co6oй перечень четко сформулированных вопросов, на которые должны быть получены ответы при данном статистическом наблюдении. Вопросы программы должны быть
сформулированы таким образом, чтобы их содержание по возможности
понимали все одинаково. При составлении программы наблюдения важно
соблюдать правила, которые в свое время были сформулированы прогрессивным бельгийским статистиком А. Кетле (1796–1874):
1. В программе не должно быть лишних вопросов, нужно включать
только те, ответы на которые необходимы для решения поставленной задачи.
2. Должны содержаться вопросы, на которые могут быть даны правдивые, достоверные ответы.
3. Не должно быть вопросов, которые могут вызвать подозрение
у опрашиваемых лиц, так как ответы могут быть использованы во вред.
Организационные вопросы статистического наблюдения включают
в себя определение субъекта, места, времени, формы и способа наблюдения.
Ответы на вопросы программы наблюдения собирают в документах,
называемых статистическими формулярами.
В статистической практике применяют два вида статистических
формуляров: списочный и индивидуальный. В списочных формулярах содержатся сведения о двух и более единицах совокупности, в индивидуальных – только об одной. Применение вычислительных машин предъявляет
свои требования к статистическим формулярам.
Формы, виды и способы наблюдения.
В статистической практике используются две организационные формы наблюдения: отчетность и специальное статистическое обследование.
4
C точки зрения полноты охвата фактов, статистическое наблюдение
может быть сплошным и несплошным. Сплошное представляет собой полный учет всех единиц изучаемой совокупности. Несплошное наблюдение
заранее организуют как учет части этих единиц, но достаточно массовый,
чтобы иметь возможность на его основе получить достоверные и надежные обобщающие статистические характеристики.
Несплошное наблюдение организуют по-разному. Выборочным наблюдением называется такое, при котором характеристика всей совокупности дается по некоторой ее части, отобранной в случайном порядке.
Вторым видом несплошного наблюдения является способ основного массива. При этой форме наблюдения отбирают наиболее крупные единицы
наблюдения, в которых сосредоточена значительная часть всех подлежащих изучению фактов. Особым способом статистического наблюдения является способ монографического описания, который применяют для подробного изучения единичных, но типичных объектов.
Статистическое наблюдение может основываться на непосредственном учете фактов в процессе обследования, либо на документальном учете,
либо на опросе респондентов.
При непосредственном учете фактов сведения получают путем личного учета единиц совокупности: пересчета, взвешивания, измерения и т. д.
Документальный способ сбора статистической информации базируется на систематических записях в первичных документах, подтверждающих тот или иной факт.
В ряде случаев для заполнения статистических формуляров прибегают к опросу населения. В свою очередь, опрос может быть организован
по-разному.
При экспедиционном способе специально выделенное лицо (регистратор) опрашивает обследуемое лицо и с его слов заполняет бланк обследования.
При анкетном наблюдении определенному кругу лиц вручают специальные анкеты. Их заполнение носит добровольный характер и осуществляется анонимно. Анкетный способ может дать недостоверные результаты, т. к. правильность заполнения трудно проверить и от их заполнения
обычно уклоняются заинтересованные лица. Поэтому к нему прибегают
тогда, когда нет другого, более надежного способа получения данных или
в обследованиях, где не требуется высокая точность результатов.
При корреспондентском способе статистическая организация рассылает бланки обследования и указания к их заполнению с просьбой ответить
на поставленные вопросы. Иногда организуют постоянную сеть корреспондентов, периодически информирующую статистические органы об определенных фактах.
При саморегистрации обследуемому лицу вручают бланк обследования и разъясняют вопросы, бланк заполняется самостоятельно.
5
Учет фактов во времени можно проводить систематически, постоянно охватывая их по мере возникновения, – это будет текущее наблюдение.
Наблюдение можно проводить регулярно, но не постоянно, а через определенные промежутки времени, – это будет периодическое наблюдение.
И, наконец, наблюдение можно проводить в порядке единовременного, разового наблюдения.
1.3. СВОДКА И ГРУППИРОВКА ДАННЫХ
СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
Сводка статистических данных. Содержание сводки, ее программа и предварительный контроль.
Вторая стадия статистического исследования состоит в том, что первичные материалы сводятся вместе, образуя статистические совокупности,
которые характеризуются итоговыми обобщающими показателями. Сводка –
это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт
и закономерностей, присущих изучаемому явлению в целом.
По глубине обработки материала сводка бывает простая и сложная.
Простой называется операция по подсчету общих итогов по совокупности
единиц наблюдения. Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по
каждой группе и по всему объекту. Представление результатов сводки
и группировки оформляется в виде статистических таблиц.
Составными элементами сводки являются:
– программа, определяющая группировки и систему показателей, характеризующих совокупность в целом и ее отдельные группы;
– подсчет групповых и общих итогов;
– оформление конечных результатов сводки в статистических таблицах.
Статистическую сводку проводят по строго определенной программе. Она содержит перечень групп, на которые должна быть расчленена совокупность по отдельным признакам, а также перечень показателей, которые следует подсчитать для характеристики каждой группы. Программа
сводки имеет вид макетов сводных статистических таблиц, которые должны быть заполнены на основе сводки статистических материалов.
Статистической сводке должен предшествовать предварительный
контроль данных статистического наблюдения. Обрабатываемый материал
необходимо проверить с точки зрения полноты охвата обследуемых единиц и качества полученных от них сведений. Для этого применяют арифметический и логический контроль.
Статистические группировки и их виды.
Группировка в статистике – это процесс образования однородных
групп на основе расчленения статистической совокупности на части или
6
объединение изучаемых единиц в частные совокупности по существенным
для них признакам.
В зависимости от числа положенных в их основание признаков различают простые и многомерные группировки. Группировка, выполненная
по одному признаку, называется простой, а многомерная производится по
двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации.
Из всего многообразия задач, решаемых с помощью группировок, можно выделить основные:
– разделение всей совокупности на качественно однородные, т. е. выделение социально-экономических типов; такие группировки называются
типологическими;
– изучение состава совокупности по тем или иным варьирующим
признакам – структурные группировки;
– изучение взаимосвязанного изменения варьирующих признаков
в пределах той или иной совокупности – аналитические группировки.
Особо следует выделить классификации. Классификация может быть
определена как устойчивая фундаментальная группировка по атрибутивному признаку, которая содержит номенклатуру групп и подгрупп.
Принципы построения статистических группировок.
Признак по которому происходит объединение отдельных единиц
совокупности в однородные группы называется группировочным. По характеру варьирования группы разделяются на атрибутивные, не имеющие
количественного варьирования, и количественные, у которых варьирование осуществляется в изменении количественного признака у отдельных
единиц совокупности.
При группировке по количественным признакам возникают вопросы
о числе групп и величине интервала. Кроме этого нужно принять во внимание размах варьирования, который представляет собой разность между
максимальным и минимальным значениями признака и численность изучаемой совокупности.
Зависимость между числом групп (n) и численностью единиц совокупности (N) выражена в формуле американского ученого Стерджесса
n = I + 3,322 lg N.
Эта зависимость дает хорошие результаты: если совокупность состоит из большого числа единиц, то распределение единиц совокупности по
данному признаку приближается к нормальному и применяются равные
интервалы в группах.
Следующий способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ).
7
Если величина интервала равна 0,5σ, то совокупность разбивается на
12 групп, а когда величина интервала равна 2/3σ и σ – 9 и 6 групп.
Интервал – это значения варьирующего признака, лежащее в определенных пределах. Величина интервала представляет собой разность между
верхней и нижней границами. Открытые интервалы – это те, у которых
указана только одна граница: верхняя – у первого, нижняя – у последнего.
Ширина открытого интервала принимается равной ширине смежного с ним
интервала.
Интервалы применяются равными или неравными в зависимости от
характера распределения единиц совокупности по данному признаку. Если
вариация признака осуществляется в сравнительно узких пределах и распределение носит более или менее равномерный характер, то устанавливают равные интервалы. Величина интервала в этом случае определяется
путем деления размаха вариации на число групп и вычисляется по следующей формуле:
i=
X max − X min
.
число групп
Если в результате деления получится дробное число, то округлять
нужно в большую, а не в меньшую сторону.
Неравные интервалы применяют тогда, когда варьирование осуществляется неравномерно и в очень широких пределах. Эти интервалы могут быть прогрессивно возрастающие или убывающие в арифметической
или геометрической прогрессии.
При изучении социально-экономических явлений на макроуровне
применяют группировки с произвольными интервалами. Такая группировка может быть построена с помощью коэффициента вариации. Для этого
сначала строят ранжированный ряд, а затем единицы совокупности объединяются в группу до тех пор, пока коэффициент вариации не станет равным 33 %. Это будет свидетельствовать об образовании первой группы.
Оставшаяся часть принимается за новую совокупность, для которой применяется тот же алгоритм.
Ряды распределения.
Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному признаку.
Ряды распределения, образованные по качественным признакам, называют атрибутивными (распределение работников по должности, образованию, профессии и т. п.). При группировке ряда по количественному признаку получаются вариационные ряды, которые по способу построения
бывают дискретными (прерывными) и интервальными (непрерывными).
8
Вариационные ряды состоят из двух элементов: варианты и частот.
Варианта – это отдельное значение варьирующего признака, которое он
принимает в ряду распределения. Числа, показывающие как часто та или
иная варианта встречается в данном вариационном ряду, называются частотами. Частоты, выраженные в долях единицы или в процентах к итогу,
называются частостями.
Ряды распределения удобнее всего изучать при помощи графиков
в виде полигона или гистограммы.
Полигоном называется график, на котором ряд распределения выражается в виде линейной диаграммы. По оси абсцисс откладывают значения
варьирующего признака в порядке возрастания или убывания, а по оси ординат – частоты. Соответствующие точки пересечения соединяют прямыми линиями. Полигон применяется обычно для дискретных рядов. Если
ряд интервальный, то в полигоне частоты выражаются через точки, соответствующие серединам интервалов.
Гистограмма – это график, на котором ряд распределения изображается в виде смежных друг с другом столбиков. Их высота рассчитывается
так, чтобы результат был пропорционален частотам. Ширина столбиков
при равных интервалах одинакова, при неравных – неодинакова. Гистограмма применяется для интервальных рядов распределения.
В практике экономической работы возникает потребность в преобразовании рядов распределения в кумулятивные, строящиеся по накопленным частотам, которые получают путем последовательного их суммирования. Используя данные накопленного ряда, строят график в виде кумуляты. Ордината кумуляты показывает сколько единиц или какая часть совокупности имеет значение признака, не превосходящее указанного на оси
абсцисс.
Статистические таблицы.
Результаты статистической сводки материала даются в виде статистических таблиц. Статистическая таблица – это форма рационального изложения цифрового материала, представляющая собой ряд взаимопересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки). Таким образом, получаются таблицы, внутри которых записываются цифры. Каждая
строка и графа имеет свое наименование, соответствующее содержанию
показателей, помещенных в таблице. Таблица имеет общее заглавие, определяющее ее содержание.
В статистической таблице есть подлежащее и сказуемое. Подлежащим называется объект изучения. Это могут быть единицы статистической
совокупности, их группы, которые характеризуются числовыми показателями. Сказуемое – называется перечень числовых показателей, которыми
характеризуется объект изучения, т. е. подлежащее таблицы.
9
Обычно наименование единиц или групп, образующих подлежащее
даются в левой части таблицы в заголовках строк, а наименование показателей, которыми они характеризуются, – в верхней части таблицы в заголовках граф. Однако, подлежащее и сказуемое могут быть расположены
и наоборот.
Виды статистических таблиц.
В зависимости от построения подлежащего статистические таблицы
подразделяются на три вида: простые, групповые и комбинационные.
Простыми называются такие статистические таблицы, в подлежащем
которых нет группировок, они бывают следующих видов:
– перечневые (подлежащее – перечень единиц, составляющих объект
изучения);
– территориальные (дается перечень территорий, стран, областей и пр.);
– хронологические (в подлежащем приводятся периоды времени или
даты).
Групповыми называются таблицы, в подлежащем которых изучаемый объект разделен на группы по какому-либо признаку.
Комбинационной таблицей называется такая, где в подлежащем дана
группировка единиц совокупности по двум и более признакам, взятым
в комбинации.
Основные правила составления статистических таблиц.
Практикой выработаны следующие основные правила составления
статистических таблиц:
1) таблица должна быть по возможности небольшой по размерам, так
как краткую таблицу легче проанализировать;
2) название таблицы, заглавия строк подлежащего и сказуемого
должны быть сформулированы точно, кратко и ясно и, если это требуется,
должны иметь единицы измерения;
3) строки подлежащего и графы сказуемого обычно размещаются по
принципу от частного к общему, т. е. сначала показывают слагаемые,
а в конце подлежащего и сказуемого подводят итоги;
4) строки в подлежащем и графы в сказуемом часто нумеруют для
того, чтобы удобнее было ссылаться на цифры таблицы. При этом в сказуемом нумеруются только графы, в которые вписываются цифры;
5) при заполнении таблицы пользуются следующими условными
обозначениями: если данное явление совсем не имеет места, ставят тире;
сведения о данном явлении отсутствуют, ставят многоточие или пишут
«нет сведений»; сведения имеются, но числовые значения меньше принятой в таблице точности, ставят 0,0;
6) округленные числа приводятся в отдельных графах таблиц с одинаковой степенью точности;
10
7) если приводятся не только отчетные данные, но и данные, полученные в результате расчетов, целесообразно сделать об этом оговорку
в таблице или в примечании к ней;
8) таблица может сопровождаться примечаниями, в которых указываются источники данных, более подробное содержание показателей и другие необходимые пояснения.
1.4. СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ
Сущность и виды абсолютных величин, единицы измерения.
Данные, полученные в результате статистического наблюдения, и сводки, выражающие численность совокупностей, групп или размеры, объемы,
уровни их первичных признаков, называются абсолютными статистическими величинами или абсолютными статистическими показателями.
Абсолютные статистические величины выражают либо уровни, характеризующие состояние явления на определенный момент, либо результаты процессов за какой-то период. В зависимости от этого различают моментные и интервальные абсолютные показатели. Последние обладают
свойством суммарности.
Различают два вида абсолютных величин: индивидуальные и суммарные. Индивидуальные – это показатели, выражающие размеры количественных признаков у отдельных единиц исследуемых совокупностей. Они
получаются непосредственно в результате статистического наблюдения
и являются объектом статистического исследования.
Суммарные абсолютные величины – это показатели, которые получаются суммированием либо количества единиц изучаемой совокупности,
либо значений варьирующего признака всех единиц совокупности. Первые
суммарные величины называются численностью совокупности, вторые –
объемом варьирующего признака.
Суммарные абсолютные величины называются подсистемными или
групповыми, если они относятся к отдельным подсистемам или группам,
и системными или общими, если они относятся к системе или совокупности в целом.
Статистические абсолютные показатели являются всегда именованными числами. Они отражают размеры качественно определенных общественных явлений в присущих им единицах измерения, которые могут
быть натуральными (численность, вес, меры длины, объема и т. д.) или денежными. Кроме того, в статистике применяют условные натуральные
единицы измерения. Например, широко известно исчисление топлива
в единицах условного топлива (единица условного топлива равна 7 000 килокалорий).
В случаях, когда учет в одной из возможных единиц намерения не
дает достаточного представления об объеме, размере явления, оно учиты11
вается в двух единицах измерения. Например, учет тракторов и электромоторов в штуках и по мощности. Или как произведение двух показателей,
например, тонно-километры в грузоперевозках.
Денежная оценка используется для характеристики разнородных явлений в едином стоимостном выражении.
Понятие об относительных величинах и формах их выражения.
В ряде случаев, абсолютных величин недостаточно для выяснения
характерных черт и особенностей изучаемых явлений. Тогда их дополняют
относительными и средними показателями. Расчеты относительных величин – первый шаг на пути статистического анализа. Относительные величины получают в результате сравнения двух показателей. Знаменатель
отношения, т. е. та величина, с которой сравнивают другую, называется
основанием или базой сравнения. Если его принять за единицу, то относительная величина выразится в форме коэффициента, она покажет во
сколько раз сравниваемая величина больше или меньше основания. Данная величина может быть выражена в процентах, если основание принято
за 100 и в промилле, если основание принять за 1 000.
В зависимости от размерности сравниваемых величин выбирают
наиболее удобные формы выражения относительных величин. Если сравниваемая величина на много превосходит основание, то отношение лучше
выражать коэффициентом. В процентах относительные величины выражаются тогда, когда величина сравнения не очень сильно отличается по
размерности от основания. Если же она очень мала, то относительную величину выражают в промилле. Промилле широко применяют в демографической статистике, где рождаемость и смертность исчисляются на 1 000 душ
населения.
При исчислении относительных величин наиболее часто сравнивают
две абсолютные величины, но можно сравнивать как средние так и относительные величины. Вообще говоря, относительная величина в статистике –
это обобщающий показатель, который дает числовую меру соотношения
двух сопоставимых статистических величин.
Основное условие правильного расчета относительных показателей –
это их сопоставимость, которая предусматривает единую методику расчета
показателей, сравнение показателей за равные периоды времени.
Виды и взаимосвязи относительных величин.
Все используемые на практике относительные статистические показатели можно подразделить на следующие виды: динамика, план и реализация плана, структура, координация, интенсивность и уровень экономического развития, сравнения.
Относительные величины динамики характеризуют изменение одноименных явлений во времени и получаются в результате сопоставления
показателей каждого последующего периода с предыдущим, первоначаль12
ным или средним за ряд лет. В первом случае получаем относительные величины динамики с переменной базой сравнения – цепные, во втором
и третьем – с постоянной базой сравнения, т. е. базисные. Они могут быть
выражены в виде коэффициентов или в процентах.
Относительные величины планового задания (ОВП) рассчитываются
как отношение уровня, запланированного на предстоящий период, к уровню, фактически сложившемуся в предшествующем периоде.
Относительные величины реализации плана (выполнения, ОВРП)
рассчитываются как отношение фактически достигнутого в данном периоде уровня к запланированному.
Между относительными показателями плана, его реализации и динамики существует следующая взаимосвязь:
ОВП · OВРП = относительный показатель динамики.
Относительные величины структуры характеризуют состав изучаемой совокупности и показывают, какой удельный вес в общем итоге составляет каждая ее часть. Они получаются в результате деления значения
объема признака для каждой части совокупности на его общий итог, принятый за базу сравнения. Сумма относительных величин структуры изучаемой совокупности, всегда равна 100 %, в долях – 1.
Изменение во времени относительных величин структуры может
быть отражено в показателях динамики.
Относительные показатели координации характеризуют соотношение отдельных частей целого между собой. При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или
является приоритетной с экономической, социальной или какой-либо другой точки зрения. В результате получают сколько единиц каждой структурной части приходится на 1 единицу (иногда на 100, 1 000 и т. д.) базисной структурной части. Относительные величины координации могут рассчитываться и по абсолютным показателям и по показателям структуры.
Относительные величины интенсивности показывают степень распространенности данного явления в определенной среде. Обычно это отношение двух разноименных абсолютных величин.
Разновидностью относительных величин интенсивности являются
относительные показатели уровня экономического развития, характеризующие производство продукции в расчете на душу населения.
Относительные величины сравнения характеризуют соотношение
одноименных показателей, относящихся к различным объектам или территориям, но за один и тот же период или момент времени.
Сущность и значение средней в статистике. Виды средних величин.
Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо варьирующему признаку, которая показывает уровень признака, отнесенный к единице
совокупности.
13
Важно, чтобы средние характеристики были основаны на массовом
обобщении фактов. Только при этом условии они выявят общую тенденцию, лежащую в основе процесса в целом. И второе условие, необходимое
для того, чтобы средняя была типичной характеристикой – это качественная однородность единиц совокупности в отношении осередняемого признака.
Важнейшее свойство средней величины заключается в том, что она
отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности могут колебаться
в ту или иную сторону под влиянием множества факторов, среди которых
могут быть как основные, так и случайные.
Средние величины делятся на два больших класса: степенные средние и структурные средние.
Общая формула степенной средней имеет вид
xm
x=m∑ ,
n
где x – степенная средняя; х – меняющиеся величины признака (варианты); n – число вариант; m – показатель степени средней.
Изменение значения показателя степени средней (m) определяет вид
средней: если m = 1, получается средняя арифметическая, при m = 2 –
средняя квадратическая; при m = –1 – средняя гармоническая; при m → 0 –
средняя геометрическая.
Из степенных средних в статистике наиболее часто применяется
средняя арифметическая, реже – средняя гармоническая, средняя геометрическая применяется только при исчислении средних темпов динамики,
а средняя квадратическая – при исчислении показателей вариации.
Разные виды средних при одном и том же исходном материале имеют не одинаковое значение. Чем больше показатель степени в степенной
средней, тем больше величина средней. Это правило называется правилом
мажорантности средних. Поэтому для правильной характеристики совокупности очень важен выбор вида средней.
Вопрос о том, какой вид средней необходимо применить в отдельном случае, разрешается путем конкретного анализа изучаемой совокупности, определяется материальным содержанием изучаемого явления, а также исходя из принципа осмысленности результатов при суммировании или
при взвешивании.
Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по
несгруппированным данным, взвешенная – по сгруппированным.
Помимо степенныx средних в статистической практике также используются описательные характеристики распределения варьирующего
признака – средние структурные, среди которых наиболее распространены
мода и медиана.
14
Средняя арифметическая, ее свойства и виды.
Средняя арифметическая исчисляется в тех случаях, когда объем
осередняемого признака образуется как сумма его значений у отдельных
единиц изучаемой статистической совокупности.
Средняя арифметическая простая (невзвешенная) используется тогда, когда расчет осуществляется по несгруппированным данным. Формула средней арифметической простой имеет вид
X
x=∑ .
n
Использовать среднюю арифметическую невзвешенную можно только тогда, когда точно установлено отсутствие весов или их равенство.
На практике, для упрощения расчетов объединяют (группируют)
единицы совокупности, имеющие одно и то же значение признака, указывая частоту их возникновения ( f ) . В этом случае применяют среднюю
арифметическую взвешенную, вычисление которой можно записать следующим образом:
Χ ⋅ f x ⋅ f + x ⋅ f + .... + xn ⋅ f n
x=∑ i i = 1 1 2 2
.
f1 + f 2 + .... + f n
∑fi
Частоты отдельных вариантов могут быть выражены не только абсолютными, но и относительными величинами – частостями.
При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам интервалов, примыкающих к ним.
Средняя арифметическая обладает некоторыми математическими
свойствами, более полно раскрывающими ее сущность и в ряде случаев
используемыми для ее расчетов. Важнейшие из них следующие:
1) произведение средней на сумму частот равно сумме произведений
отдельных вариант на соответствующие им частоты и имеет вид
x ⋅ ∑ f i = ∑ xi ⋅ f i ;
2) сумма отклонений индивидуальных значений признака от средней
арифметической равна нулю и рассчитывается по формуле
∑ ( xi − x ) ⋅ fi = 0;
3) если все осередняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится
или увеличится на ту же величину;
4) если все варианты значений признака уменьшить или увеличить
в А раз, то средняя также соответственно уменьшится или увеличится в А раз;
5) если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится.
15
Средняя гармоническая.
Средняя гармоническая – это величина обратная средней арифметической из обратных значений признака. Ее применяют для расчетов тогда,
когда в качестве весов используются не отдельные единицы совокупности – носители признака, а произведения этих единиц на значения признака (т. е. ω = x · f). Когда статистическая информация не содержит частот по
отдельным вариантам совокупности, а представлена как их произведение,
применяется формула средней гармонической взвешенной
x=
Σωi
.
1
∑ ωi
xi
В том случае, если объемы явлений, т. е. произведения ω = x · f по
каждому признаку равны, применяется средняя гармоническая простая, которая находится по формуле
x=
n
,
1
∑
x
Средняя гармоническая является превращенной формой арифметической средней. Вместо гармонической всегда можно рассчитать арифметическую, но для этого вначале нужно определить веса отдельных значений признака.
Структурные средние.
Особый вид средних величин – структурные средние – применяются
для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины, если по имеющимся статистическим данным ее расчет не может быть выполнен. Важнейшими из этих показателей являются мода и медиана.
Мода отражает типичный, наиболее распространенный вариант значения признака. Медиана выполняет функцию средней для неоднородной,
не подчиняющейся нормальному закону распределения совокупности.
Модой называется чаще всего встречающаяся варианта. Медиана –
это величина, которая делит численность упорядоченного вариационного
ряда на две равные части: одна часть имеет значения признака меньшие
чем медиана, а другая – большие. Главное свойство медианы заключается
в том, что сумма абсолютных отклонений значений признака меньше, чем
от любой другой величины.
В дискретном ряду мода – это варианта, имеющая наибольшую частоту. Могут быть распределения, где все варианты встречаются одинаково
часто, в этом случае моды нет. В других случаях не одна, а две варианты
могут иметь наибольшие частоты. Тогда будет две моды и распределение
будет бимодальным.
16
Чтобы найти медиану в дискретном вариационном ряду, нужно сумму частот разделить пополам и к полученному результату прибавить 0,5.
Затем путем накопления частот определить варианту, накопленная частота
которой будет равна или больше этой цифры. Она и будет медианой.
В интервальном вариационном ряду модой приближенно считают центральный вариант так называемого модального интервала, т. е. того, который
имеет наибольшую частоту. В его пределах моду определяют по формуле
M O = X MO + iMO
( f MO − f MO−1 )
,
( f MO − f MO−1 ) + ( f MO − f MO+1 )
ХМО – нижняя граница модального интервала; iMO – величина модального
интервала; fMO, fMO–1, fMO+1 – частота, соответственно, модального, предшествующего модальному и следующему за модальным интервалов.
Для нахождения медианы в интервальном ряду сначала определяют
медианный интервал. Таким будет тот, накопленная частота которого равна или превышает полусумму частот. Затем рассчитывают конкретное значение медианы по выражению
∑ f −S
ме −1
М е = Х ме + iме 2
,
fме
где Xме – нижняя граница медианного интервала; iме – величина медианного интервала; Σf – сумма частот ряда; fме – частота медианного интервала;
Sме–1 – накопленная частота в интервалах, предшествующих медианному.
Моду можно определить графически при помощи гистограммы. Для
этого выбираем самый высокий столбик – он будет модальным. Затем правый верхний угол его соединяем с верхним правым углом предыдущего.
А верхний левый угол модального – с верхним левым последующего. Из
точки пересечения опускается перпендикуляр на ось абсцисс и указанная
варианта и будет модой.
Медиану графически можно определить с помощью кумуляты. Для
этого, из точки на оси ординат, соответствующей половине совокупности,
проводится прямая горизонтальная линия до пересечения с кумулятой. Из
точки пересечения опускается перпендикуляр на ось абсцисс. Указанная
варианта будет медианой.
1.5. ПОКАЗАТЕЛИ ВАРИАЦИИ
Абсолютные показатели вариации.
Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называется вариацией.
По степени вариации можно судить о процессах развития изучаемых
явлений, в частности, об однородности совокупности, устойчивости индивидуальных значений признака, типичности средней, о взаимосвязи между
признаками различных явлений.
17
Показатели вариации делятся на две группы: абсолютные и относительные.
Абсолютные – это размах вариации, среднее линейное отклонение,
дисперсия и среднее квадратическое отклонение. Относительные показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической. Относительными показателями вариации являются коэффициенты осциляции, вариации, относительное линейное отклонение и др.
Самым простым абсолютным показателем является размах вариации (R), который рассчитывается как разность между максимальным и минимальным значениями признака.
Чтобы дать обобщающую характеристику распределению отклонений исчисляют среднее линейное отклонение d , определяемое как средняя
арифметическая из отклонений индивидуальных значений от средней, без
учета знака этих отклонений, и находят его по следующим формулам:
d=
∑ X −X
или
n
d=
∑X−X ⋅f
.
∑f
На практике меру вариации более объективно отражает показатель
дисперсии (σ2), определяемый как средняя из отклонений, возведенных
в квадрат:
(
)
σ =∑ X−X
2
n
2
( X − X )2 ⋅ f
∑
или σ =
∑f
2
Корень квадратный из дисперсии представляет собой среднее квадратическое отклонение. Оно выражается в тех же единицах измерения, что
и признак.
Эти показатели являются общепринятыми мерами вариации и широко используются в отечественной и зарубежной практике.
Относительные показатели вариации.
Чтобы иметь возможность для сравнения вариационных рядов с разными уровнями, часто применяют относительные показатели вариации.
Базой для их сравнения должна служить средняя арифметическая. Чаще
всего они выражаются в процентах и дают к тому же характеристику однородности совокупности:
R
коэффициент осциляции VR = 100 %;
X
d
линейный коэффициент вариации Vd = 100 %;
X
σ
коэффициент вариации Vσ = 100 %.
X
18
Наиболее часто из указанных показателей применяется коэффициент
вариации. Как относительная величина он абстрагирует различия абсолютных величин и дает возможность сравнивать степень вариации различных признаков, разных совокупностей. Совокупность считается однородной, если этот показатель не превышает 33 %.
Анализ вариационных рядов.
Основная задача анализа вариационных рядов – выявление подлинной закономерности распределения путем исключения влияния второстепенных, случайных для данного распределения факторов. Это достигается
увеличением объема исследуемой совокупности при одновременном
уменьшении интервала ряда.
Под кривой распределения понимается графическое изображение
в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.
Теоретической кривой распределения называется кривая, выражающая общую закономерность данного типа распределения в чистом виде,
исключающего влияние случайных для закономерностей факторов.
В статистике широко используются различные виды теоретических
распределений: нормальное, биномиальное, распределение Пуассона и др.
Каждое из теоретических распределений имеет специфику и свою область
применения в разных отраслях знаний.
Чаще всего в качестве теоретического распределения используется
нормальное, которое находиться по формуле
1
I
− t2
Yt =
e 2 ,
2π
где Yt – ордината кривой нормального распределения; e ≈ 2,718 2 – матеx−x
матическая постоянная; π ≈ 3,141 5 – математическая постоянная; t =
–
σ
стандартизированное отклонение.
Большое значение имеет проверка на сколько фактическое распределение признака соответствует нормальному. Математическая статистика
дает для этого несколько показателей, которые называются критериями согласия. Известны критерии согласия Пирсона, Романовского, Колмогорова
и Ястремского. Например, критерий согласия А. Н. Колмогорова определяется по формуле
λ=
D
,
n
где D – максимальная разность между накопленными эмпирическими
и теоретическими частотами; n – число наблюдений.
19
Затем, по специальной таблице критерия согласия, находим соответствующую вероятность отклонений фактических частот от теоретических.
При сравнении фактического распределения с нормальным важно
констатировать не только согласие этих распределений, но и характер их
расхождений. Этому служат показатели асимметрии и эксцесса.
Нормальное распределение характеризуется симметричностью по
отношению к точке, соответствующей значению х . В симметричном распределении средняя арифметическая равна моде и медиане. Если этого равенства нет, значит, распределение асимметрично. Этим можно воспользоваться для наиболее простого измерения асимметрии. Оно производится
с помощью коэффициента асимметрии / Αs /, который есть отношение разности между средней и модой к среднему квадратическому отклонение записывается в виде уравнения
As =
X − Mo
,
σ
если Аs > 0, это свидетельствует о правосторонней ассимметрии /Мo < Me < X/,
Аs < 0 – о левосторонней /Мo > Me > X/.
Для симметричных распределений может быть рассчитан показатель
эксцесса /Ек/. Под эксцессом распределения понимается высоковершинность или, наоборот, низковершинность фактической кривой распределения по сравнению с нормальным распределением. Высоковершинность означает положительный эксцесс и характеризует скопление частот в середине. Низковершинностъ означает отрицательный эксцесс и характеризует
большую разбросанность частот. Наиболее точно эксцесс определяется
с использованием центрального момента четвертого порядка следующим
образом:
Ек =
µ4
−3
σ4
Σ / x − x /4
µ
=
4
.
n
1.6. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Понятие выборочного наблюдения, отбор единиц в выборочную
совокупность.
Выборочное наблюдение – это наиболее совершенный научно обоснованный способ несплошного наблюдения, при котором обследуется не
вся совокупность, а лишь часть ее, отобранная по определенным правилам
выборки, и, обеспечивающая получение данных, характеризующих всю
совокупность в целом. Выборочное наблюдение имеет ряд преимуществ
перед сплошным, т. к. требует намного меньше сил и средств, позволяет
проводить обследование и подводить итоги в более короткие сроки, иногда
является единственно возможным. Результаты выборочного наблюдения
иногда точнее, чем сплошного.
20
Для производства выборочного наблюдения необходимо решить следующие вопросы: определить какая часть совокупности подлежит выборочному наблюдению; установить, как провести отбор части совокупности; определить как на основе результатов выборочного наблюдения получить необходимые характеристики всей совокупности.
Вся совокупность единиц, о которой необходимо получить сведения,
называется генеральной, а та часть совокупности единиц, которая подвергается выборочному обследованию, называется выборочной совокупностью.
Во всех случаях, когда речь идет о вариации альтернативных признаков, имеют дело с обобщающим показателем в виде относительной доли единиц, составляющих какую-то часть совокупности. Этот сводный показатель для генеральной совокупности называется генеральной долей или
долей в генеральной совокупности, для выборочной совокупности – выборочной долей или частостью.
Среднее значение варьирующего признака по всей совокупности называется генеральной средней, а среднее значение у-единиц, которые подвергались выборочному наблюдению, – выборочной средней. Задача выборочного наблюдения в данном случае заключается в том, чтобы на основе
выборочной средней дать правильное представление о генеральной средней.
Отбор единиц в выборочную совокупность может быть следующим:
1. Нерайонированным и районированным. Нерайонированным отбор
будет тогда, когда производится из всей генеральной совокупности, не
разделенной на части. В этом случае отбор может быть повторным и бесповоротным. Районированный – это когда единицы отбираются из отдельных частей (групп), на которые предварительно разбивается вся генеральная совокупность. Данный отбор всегда бесповоротный.
2. Собственно-случайный отбор или случайная выборка, осуществляется с помощью жеребьевки либо по таблице случайных чисел.
3. Типический отбор с механической выборкой.
4. Многоступенчатая выборка (сочетание типического отбора с несколькими стадиями).
5. Серийная выборка (когда в выборку попадают не отдельные единицы, а целые серии).
6. Комбинирование выборочного наблюдения со сплошным.
Определение ошибок выборки. Расчет необходимой численности
выборки.
Возможные пределы отклонений выборочной доли, выборочной
средней от доли и средней в генеральной совокупности носят название
ошибки выборки или ошибки репрезентативности. Закономерности изменения случайных ошибок выборки изучает математическая теория вероятности в теоремах закона больших чисел, которые доказывают, что с увеличением численности выборки размеры случайных ошибок сокращаются.
21
Зависимость величины ошибки выборки от ее абсолютной численности и от степени варьирования признака находит выражение в формулах
средней ошибки выборки. Есть две формулы определения средней ошибки
выборки. Первую применяют в том случае, когда выборочное обследование имеет задачу измерить среднее значение количественно варьирующего
признака. Другую применяют в случае измерения доли альтернативного
признака. Выглядят они следующим образом:
µх =
δ02
,
n
где µx – средняя ошибка выборки; δ02 – дисперсия варьирующего признака
в генеральной совокупности; n – численность единиц выборочной совокупности;
µр =
р (1 − р )
,
n
где р – доля признака в генеральной совокупности.
В этих формулах δ02 и р(р – 1) – это дисперсии признаков в генеральной совокупности, которые при выборочном наблюдении неизвестны. На
практике их заменяют аналогичными характеристиками выборочной совокупности [ δ 2 и w(1 − w)] на основании закона больших чисел, по которому
выборочная совокупность при достаточно большом объеме довольно точно
воспроизводит характеристики генеральной совокупности.
Полученные по формулам значения средней ошибки выборочной
доли (w) и выборочной средней ( x% ) необходимы для установления генеральной доли (р) и генеральной средней ( x ) , т. е.:
p = w ± µ p ; x = x% ± µ x .
Но такое суждение можно гарантировать не с абсолютной достоверностью, а лишь с вероятностью 0,683, которого можно повысить, если
принять среднюю ошибку выборки увеличенной в t-раз. Так при t = 2 вероятность суждения достигает 0,954, при t = 3 – вероятность 0,997, т. е.:
p = w ± tµ p ; x = x% ± tµ x .
Множитель t в статистике называется коэффициентом доверия или
коэффициентом кратности ошибки.
Путем несложных преобразований формул средней ошибки выборочной доли и выборочной средней можно получить формулы для определения необходимой численности выборки:
n=
σ2
w (1 − w )
; n=
.
µ ч2
µ 2p
22
При случайном бесповторном отборе ошибки выборки корректируются и найти их можно по следующим выражениям:
σ2
n
µх =
1 − ;
n N
µp =
ω(1 − ω)
n
1 − ,
n
N
где N – численность генеральной совокупности.
Распространение выборочных результатов.
Распространение выборочных оценок на генеральную совокупность
состоит в определении характеристик генеральной совокупности на основе
характеристик выборочной. Применяются два способа распространения
выборочных данных: прямого пересчета и поправочных коэффициентов.
Первый способ заключается в том, что частости выборочной совокупности умножаются на число единиц генеральной. Например, для определения качества продукции проверено 500 изделий из 10 000, т. е. 5 %.
В результате проверки установлено с вероятностью 0,997, что средний
процент изделий второго сорта всей партии составил 10 %, а пределы возможных отклонений ±1,2 %. Способом прямого пересчета определим, что
общее количество изделий второго сорта всей партии будет в 10 раз больше и составит 1 000 ± 120 изделий.
Когда выборочное наблюдение проводится с целью уточнения данных сплошного наблюдения, применяется способ коэффициентов. В этом
случае по кругу объектов выборочного наблюдения абсолютные данные
этого наблюдения сопоставляются с данными сплошного и устанавливается поправочный коэффициент, которым и пользуются для внесения поправок в материалы сплошных наблюдений.
1.7. ДИНАМИКА СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ
Ряды динамики, их классификация.
Рядами динамики в статистике называются ряды последовательно
расположенных в хронологическом порядке показателей, характеризующих развитие явления. Всякий ряд динамики включает, следовательно, два
обязательных элемента: показатель времени и конкретное значение показателя, т. е. уровень ряда. Кроме этого могут также приводиться производные аналитические показатели.
Существуют различные виды рядов динамики. Их можно классифицировать по следующим признакам.
1. В зависимости от способа выражения уровней ряды динамики
подразделяются на ряды абсолютных, относительных и средних величин.
Исходными, первоначальными являются ряды динамики абсолютных величин, а относительных и средних величин – производными.
23
2. В зависимости от того, как выражают уровни ряда состояние явления, различают моментные и интервальные ряды. В моментных рядах
уровни характеризуют состояние явления на определенный момент времени, в интервальных – за определенный период времени. Показатели интервальных рядов динамики обладают свойством суммарности, а показатели
моментных рядов такого свойства не имеют.
3. В зависимости от расстояния между уровнями, ряды динамики
подразделяются на ряды с равноотстоящими и неравноотстоящими уровнями во времени.
4. В зависимости от числа показателей выделяются изолированные
и комплексные многомерные ряды динамики.
Правила построения рядов динамики. Сопоставимость уровней
ряда.
Чтобы о развитии явления можно было получить объективное представление при помощи числовых уровней, при составлении ряда динамики
должны выполняться следующие требования:
– периодизация развития, т. е. расчленение его во времени на однородные этапы, в пределах которых показатель подчиняется одному закону
развития. Это, по существу, типологическая группировка во времени;
– статистические данные должны быть сопоставимы по территории,
кругу охватываемых объектов, единицам измерения, времени регистрации,
ценам, методологии расчета;
– величины временных интервалов должны соответствовать интенсивности изучаемых процессов. Чем больше вариация уровней во времени,
тем чаще следует делать замеры;
– числовые уровни рядов динамики должны быть упорядоченными
во времени. Не допускается анализ рядов с пропусками отдельных уровней. Если же такие пропуски неизбежны, то их восполняют условными
расчетными значениями.
Для того, чтобы привести уровни ряда динамики к сопоставимому
виду, часто прибегают к приему, который называется «смыкание рядов динамики». Для этого необходимы данные, исчисленные по одной методологии, или в одних границах, а затем те же данные по другой методологии
или в других границах. Используя коэффициенты пересчета, полученные
по этим данным, получают сопоставимые ряды.
Другой способ называется процентным. Суть его состоит в том, что
данные периода времени, в котором произошли изменения, принимаются
за 100 %, а все остальные уровни пересчитываются в процентах к этому
уровню.
Показатели анализа рядов динамики.
Анализу подвергаются уровни ряда динамики. Различают начальный
уровень (Y1), показывающий величину первого члена ряда, конечный (Yп),
показывающий величину конечного члена ряда, и средний (Y ) .
24
Методы расчета среднего уровня в интервальном и моментном ряду
различны. В интервальном ряду, если все интервалы равны, средний уровень ряда исчисляется по формуле простой средней арифметической
Y
Y =∑
n
где ∑ Y – сумма уровней ряда; п – их число.
Если же ряд имеет разные интервалы, то нужно сначала привести его
к равным интервалам, а затем исчислять среднюю.
В моментном ряду динамики, имеющем равные интервалы, средний
уровень ряда определяют по выражению
1
1
Y1 + Y2 + Y3 + ... + Yn−1 + Yn
2 .
Y=2
n −1
Если в моментном ряду интервалы неравные, то необходимо применять среднюю взвешенную. Для этого сначала определяют средние за интервалы, ограниченные двумя датами, а затем из них определяют общую
среднюю с весами, кратными длинам интервалов.
Для того, чтобы облегчить анализ рядов динамики определяют следующие показатели: темпы роста, абсолютные приросты, темпы прироста,
абсолютную величину одного процента прироста.
Темпы роста – это отношение уровней ряда одного периода к другому. Они могут быть определены как базисные, если все уровни ряда относятся к уровню одного какого-либо периода, и как цепные, когда уровень
каждого периода относится к уровню предыдущего. Темпы роста показывают во сколько раз увеличивается или уменьшается размер какого-либо
явления и могут выражаться в процентах или в коэффициентах.
Если темпы роста выражены в коэффициентах, то легко можно перейти от цепных к базисным и обратно, если пользоваться следующими
двумя правилами: произведение предыдущих цепных темпов равно базисному; частное от деления базисных темпов равно промежуточному цепному.
При расчете средних темпов роста применяют формулу средней геометрической и выглядит она следующим образом:
Т = n−1 Т 2 Т 3 ... Т n ,
где Т – цепные темпы роста, а так как их произведение равно базисному, то
средний темп роста можно определить по уравнению
Т = n−1
Yn
.
Y1
Абсолютный прирост показывает на сколько единиц увеличивается
или уменьшается размер какого-либо явления и рассчитывается как разность уровней ряда. Он также может быть цепным, если из каждого уровня
25
вычитать предыдущий, и базисным, если из всех уровней вычитать начальный, т. е. как накопленные итоги:
∆Yц = Yi – Yi–1; ∆Yб =Yi – Y1.
Средний абсолютный прирост можно определить по следующим
формулам:
∆Υ =
Σ ∆Υ ц
n −1
или ∆Υ =
∆Υ бп Υ п −Υ 1
=
.
n −1
п −1
Абсолютный прирост выражается в единицах измерения членов ряда.
Темп прироста показывает на сколько процентов увеличиваются или
уменьшаются размеры явления за изучаемый период времени. Он определяется путем деления абсолютного прироста на величину первоначального
или предыдущего уровня по формулам:
∆Τб =
∆Υ бi
Υ1
⋅ 100 % или ∆Τц =
∆Υ цi
Υ i−1
⋅ 100 %.
Его можно получить также и из темпа роста, выраженного в процентах, если от него отнять 100 %.
Средний темп прироста определяют только путем вычитания 100 %
из среднего темпа роста в процентах.
Показатель абсолютного значения 1 % прироста (α) определяют делением абсолютного прироста на темп прироста. Он имеет смысл только для
цепных приростов и темпов прироста, т. к. для базисных этот показатель
будет для всех периодов один и тот же, выглядит следующим образом:
α=
∆Yц
∆Т ц
или ∆Т ц =
∆Yц
∆Y ⋅ Y
⋅ 100 %, то α = ц i −1 = 0,01Yi −1.
Yi −1
∆Yц100
Все показатели динамики нужно анализировать комплексно, совместно.
Проверка ряда динамики на наличие тренда.
Любые изменения, определяющие некое эволюционное направление
развития ряда, называются тенденцией развития или трендом. Тренд – это
долговременная компонента ряда динамики. Она характеризует основную
тенденцию его развития, при этом остальные компоненты рассматриваются только как мешающие процедуре его определения.
Проверка на наличие тренда в ряду динамики может быть осуществлена по нескольким критериям.
Метод средних. Изучаемый ряд динамики разбивается на несколько
интервалов (обычно на два), для каждого из которых определяется средняя
величина. Выдвигается гипотеза о существенном развитии средних. Если
эта гипотеза подтверждается, то признается наличие тренда.
Фазочастотный критерий знаков первой разности Валлиса и Мура.
Суть его заключается в следующем: наличие тренда в динамическом ряду
26
утверждается в том случае, если этот ряд не содержит либо содержит в приемлемом количестве фазы – изменение знака абсолютного цепного прироста.
Критерий Кокса и Стюарта. Весь анализируемый ряд динамики
разбивают на три равные по числу уровней группы (в том случае, если количество уровней ряда динамики не делится на три, недостающие уровни
нужно добавить) и сравнивают между собой уровни первой и последней
групп.
Метод серий. По этому способу каждый конкретный уровень временного ряда считается принадлежащим к одному из двух типов: например, если уровень ряда меньше медианного, то считается, что он имеет тип
А, в противном случае – В.
Теперь последовательность уровней ряда выступает как последовательность типов, в которой определяется число серий. Серией называется
любая последовательность элементов одинакового типа, граничащая с элементами другого типа.
Если закономерности в изменениях уровней нет, то число серий (R)
оказывается в доверительном интервале и рассчитывается по формуле
R − tσ R ≤ R ≤ R + tσ R ,
где R – среднее число серий R =
клонение числа серий σ R =
n +1
; σ R – среднее квадратическое от2
n −1
; t – коэффициент доверия; n – число
4
уровней ряда.
Методы анализа основной тенденции в рядах динамики. После
того как установлено наличие тенденции в ряду динамики, производится
ее описание с помощью методов сглаживания, которые разделяются на две
большие группы:
– сглаживание или механическое выравнивание отдельных членов
ряда динамики с использованием фактических значений соседних уровней;
– выравнивание с применением прямой или кривой линии, согласно
уравнению функции, которая отображает тенденцию, присущую ряду, и одновременно освобождает его от незначительных колебаний.
К основным методам первой группы относятся: усреднения по левой
и правой половине, укрупнения интервалов, простой и взвешенной скользящей средней.
При использовании метода усреднения по левой и правой половине
ряд динамики разделяют на две части, находят для каждой из них среднее
арифметическое значение и проводят через полученные точки линию тренда на графике.
При методе укрупнения интервалов ряд динамики разделяют на некоторое достаточно большое число равных интервалов. Если средние
27
уровни по интервалам не позволяют увидеть тенденцию развития явления,
переходят к расчету уровней за большие промежутки времени, увеличивая
длину каждого интервала.
При методе скользящих средних исходные уровни ряда заменяются
средними величинами, которые получают из данного уровня и нескольких
симметрично его окружающих путем сдвига на один период или момент
времени. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Он может быть четным или нечетным.
К основным методам второй группы можно отнести: аналитическое
выравнивание, дисперсионный и корреляционный анализы.
Целью аналитического выравнивания динамического ряда является
определение аналитической или графической зависимости уt. На практике
по имеющемуся временному ряду задают вид и находят параметры функции, а затем анализируют поведение отклонений от тенденции. Функцию
выбирают таким образом, чтобы она давала содержательное объяснение
изучаемого процесса.
Линейная зависимость (yt = ao + a1t) выбирается в тех случаях, когда
в исходном временном ряду наблюдается более или менее постоянные абсолютные цепные приросты, не проявляющие тенденции ни к увеличению,
ни к снижению.
Параболическая зависимость (yt = ao + a1t + a2t2) используется если
абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных
приростов (разности второго порядка) никакой тенденции развития не
проявляют.
Экспоненциальные зависимости (у = ехр/а0 + а1t) применяются, если
в исходном временном ряду наблюдается либо более или менее постоянный относительный прирост (устойчивость цепных темпов роста, темпов
прироста), либо, при отсутствии такого постоянства, – устойчивость в изменении показателей относительного роста (цепных темпов роста цепных
же темпов роста).
Оценка параметров зависимости может быть сделана методами избранных точек, наименьших расстояний, наименьших квадратов. В большинстве расчетов используют метод наименьших квадратов, рассматриваемый в курсе математической статистики. По этому методу, например,
для нахождения параметров прямой линии необходимо решить следующую систему уравнений:
na0 + a1Σt = Σy
.
2
a0Σt + a1Σt = Σy ⋅ t
Для линейной зависимости параметр а0 обычно интерпретации не
имеет, но иногда его рассматривают как обобщенный начальный уровень
28
ряда; а1 – сила связи, т. е. параметр, показывающий на сколько изменится
результат при изменении времени на единицу.
Выравниванием рядов динамики пользуются также для того, чтобы
найти значение недостающего члена ряда. Такой способ называется интерполяцией рядов динамики. Другой прием, основанный на выравнивании
рядов динамики, называется экстраполяцией рядов динамики и заключается в том, что продолжая найденные математические линии, тем самым мы
как бы предсказываем дальнейшее развитие явлений.
Анализ сезонных колебаний.
В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонные колебания» или «сезонные волны», а динамический
ряд в этом случае называют тренд-сезонным или просто сезонным рядом
динамики.
Сезонные колебания характеризуются специальными показателями,
которые называются индексами сезонности (Js). Совокупность этих показателей образует сезонную волну. Индексами сезонности являются процентные отношения фактических внутригодовых уровней к постоянной
или переменной средней.
Для выявления сезонных колебаний обычно берут данные за несколько лет (n = не менее трех), распределенные по месяцам. Для вычисления индексов сезонности применяют различные методы. Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их
предварительного выравнивания.
Для каждого месяца рассчитывается средняя величина уровня ( yi ) ,
затем из них вычисляется среднемесячный уровень для всего ряда ( y ) , и в
заключение определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда:
Js =
yi
⋅ 100 %.
y
Если же ряд динамики содержит определенную тенденцию в развитии, то, прежде чем вычислить сезонную волну, фактические данные
должны быть обработаны так, чтобы была выявлена общая тенденция.
Обычно для этого прибегают к аналитическому выравниванию. В общем
виде формулу расчета индекса сезонности данным способом можно выразить так:
Σ
Js =
yi
⋅ 100 %
yt
.
n
29
1.8. ИНДЕКСЫ
Понятие индекса.
В статистике под индексом понимается относительный показатель,
который выражает соотношение величин какого-либо явления во времени,
в пространстве или сравнение фактических данных с любым эталоном
(план, прогноз, норматив и т. д.).
С помощью индексов обычно сравниваются совокупности, состоящие из элементов, непосредственно не поддающихся суммированию. С такого рода совокупностями мы сталкиваемся, когда хотим охарактеризовать
изменение объемов продукции в натурально-вещественной форме или дать
сводную характеристику изменения общего уровня цен.
Важной особенностью индексов является то, что они обладают синтетическими и аналитическими свойствами. Синтетические свойства индексов состоят в том, что посредством индексного метода производится
соединение в целое (агрегирование) разнородных единиц статистической
совокупности. Аналитические свойства определяются тем, что с помощью
индексного метода можно оценить влияние отдельных факторов на изменение изучаемого показателя. В этом случае применяют не отдельные индексы, а системы взаимосвязанных индексов и основная теоретическая
проблема здесь состоит в принципах построения таких индексных систем.
Индексные системы применяют также для сравнительного анализа
средних показателей, на изменение которых влияют структурные сдвиги
внутри совокупности.
В международной практике индексы принято обозначать буквой i (индивидуальные индексы) и J (общие индексы). Знак внизу справа означает
период: 0 – базисный; 1 – отчетный. Помимо этого используются определенные символы для обозначения индексируемых показателей: q – количество (объем) продукции в натуральном выражении; р – цена единицы продукции; z – себестоимость единицы продукции и т. д.
Индекс как относительный показатель может быть выражен в виде
коэффициентов или процентов. Если индекс больше 1 (100 %), то уровень
изучаемого явления растет, если меньше 1 – снижается.
Классификация индексов.
Все экономические индексы можно классифицировать по следующим признакам: степень охвата явления, база сравнения, вид весов, форма
построения, характер объекта исследования.
По степени охвата явления индексы бывают индивидуальные (однотоварные), общие и групповые. Индивидуальные индексы дают сравнительную характеристику отдельных элементов той или иной совокупности.
Общие индексы характеризуют изменение совокупности в целом. Если индексы охватывают не все элементы совокупности, а только какую-то часть,
группу, то они называются групповыми или субъиндексами.
30
По базе сравнения все индексы можно разделить на две группы: динамические и территориальные. Первая группа отражает изменение явления во времени. Динамические индексы бывают базисные и цепные. Территориальные индексы применяются для региональных сравнений.
По виду весов (соизмерителей) индексы бывают с постоянными
и переменными весами. В зависимости от этого различают индексы постоянного (фиксированного) и переменного состава, которые используются
для анализа динамики средних показателей.
В зависимости от формы построения различают общие индексы, агрегатные и средние из индивидуальных индексов. Последние делятся на
арифметические и гармонические. Агрегатная форма общих индексов является основной формой экономических индексов. Средние индексы –
производные, они получаются в результате преобразования агрегатных
индексов.
По характеру объекта исследования различают индексы количественных (объемных) и качественных показателей. В основе такого деления
лежит вид индексируемой величины.
Общие индексы и их применение в экономическом анализе.
Если известно, что изучаемое явление неоднородно, то для того,
чтобы рассчитать общий индекс, необходимо прежде всего преодолеть несуммарность отдельных элементов совокупности. Это достигается путем
введения в индекс какого-то дополнительного и при том неизменного показателя, экономически тесно связанного с индексируемым. Он называется
показателем соизмерения или весами индекса. Тогда в числителе и знаменателе будет стоять сумма произведений индексируемой величины на ее
соизмеритель. Такие индексы называются агрегатными.
При определении агрегатного индекса цен существует два подхода
при выборе соизмерителя индексируемой величины:
1) в качестве веса принимается физический объем работ и услуг отpq
четного периода I p = ∑ 1 1 , такой агрегатный индекс цен называется ин∑ p0 q1
дексом Паше;
2) в качестве веса принимается физический объем работ и услуг баpq
зисного периода I p = ∑ 1 0 , такой агрегатный индекс цен называется ин∑ p0 q0
дексом Ласпейреса.
Во внутригосударственной практике наиболее распространен индекс
цен Пааше как более универсальный. Индекс цен Ласпейреса широко применяется в международной практике.
При выборе веса агрегатного индекса принято руководствоваться
следующим правилом: если строится индекс количественного показателя,
31
то веса берутся за базисный период, при построении индекса качественного показателя используются веса отчетного периода.
Таким образом агрегатные индексы будут иметь следующий вид:
Σp q
– стоимости I pq = 1 1 ;
Σp0 q0
Σp q
– цен I p = 1 1 ;
Σp0 q1
pq
– физического объема продукции I q = ∑ 0 1 .
∑ p0 q0
Агрегатный индекс стоимости показывает во сколько раз возросла
(уменьшилась) стоимость продукции (товарооборота) отчетного периода
по сравнению с базисным, или сколько процентов составляет рост (снижение) стоимости продукции. Если из значения индекса стоимости, выраженного в процентах, вычесть 100 %, то разность покажет на сколько процентов возросла (уменьшилась) стоимость продукции в текущем периоде
по сравнению с базисным. Разность числителя и знаменателя показывает,
на сколько рублей увеличилась (уменьшилась) стоимость продукции в текущем периоде по сравнению с базисным.
В индексе цен в числителе дроби – фактическая стоимость продукции текущего периода, а в знаменателе – условная стоимость тех же товаров в ценах базисного периода. Индекс показывает, во сколько раз возросла (уменьшилась) стоимость продукции из-за изменения цен, или сколько
процентов составляет рост (снижение) стоимости продукции в результате
изменения цен. Если из значения индекса вычесть 100 %, то разность покажет, на сколько процентов возросла (уменьшилась) стоимость продукции из-за изменения цен, а разность числителя и знаменателя – на сколько рублей изменилась стоимость продукции в результате роста (снижения) цен.
Аналогично строятся и анализируются индексы других экономических показателей, которые являются произведением двух сомножителей:
издержек производства, затрат времени на производство всей продукции.
Общие индексы как средние из индивидуальных.
Помимо агрегатных индексов в статистике применяется другая их
форма – средневзвешенные индексы из индивидуальных. К их исчислению
прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать общий агрегатный индекс. Так, если отсутствуют данные
о ценах, но имеется информация о стоимости продукции в текущем периоде и известны индивидуальные индексы цен по каждому товару, то нельзя
определить общий индекс цен как агрегатный, но возможно его вычислить
как средний из индивидуальных.
32
Агрегатный индекс является основной формой общего, поэтому
средний индекс должен быть тождественен исходному агрегатному индексу. При исчислении средних индексов используют две формы средних:
арифметическую и гармоническую.
Средний арифметический индекс тождественен исходному агрегатному, если весами индивидуальных индексов будут слагаемые знаменателя
агрегатного индекса. Средний гармонический индекс тождественен, если
индивидуальные индексы будут взвешены с помощью слагаемых числителя агрегатного индекса.
Средние арифметические индексы чаще всего применяются на практике для расчета сводных индексов количественных показателей, а средние гармонические – качественных.
Формулы для расчета средних индексов получают путем несложных
алгебраических преобразований, например, индекс общего объема товарооборота может быть преобразован в средний арифметический следующим
образом:
pq
∑ i p ⋅ po ⋅ iq ⋅ qo ∑ i pq ⋅ po ⋅ qo
I pq = ∑ 1 1 =
=
.
∑ po qo
∑ po qo
∑ po qo
Тот же индекс может быть записан в форме средней гармонической
величины, которая находится по формуле
pq
∑ i pq ⋅ p1 ⋅ q1
∑ p1 ⋅ q1
I pq = ∑ 1 1 =
=
.
p1 ⋅ q1
∑ po qo ∑ ( p1 / i p ) ⋅ ( q1 / iq )
∑
i pq
Средний арифметический индекс физического объема продукции
рассчитывается по уравнению
p ⋅ q ∑i ⋅ p ⋅ q
Iq = ∑ o 1 = q o o .
∑ po ⋅ qo
∑ po ⋅ qo
Средний гармонический индекс цен имеет вид
p ⋅q
p ⋅q
Ip = ∑ 1 1 = ∑ 1 1 .
∑ po ⋅ q1 ∑ 1 ⋅ p1 ⋅ q1
ip
Индексный метод анализа факторов динамики.
Индексный метод широко применяется для анализа роли отдельных
факторов в динамике какого-либо сложного явления, изменение которого
обусловлено действием нескольких факторов, выступающих как множители совокупного результата. Если, например, величина объема товарообо33
рота равна произведению количества продажи товаров на их цены, то индекс товарооборота равен произведению индекса физического объема на
индекс цен и находится по выражению
I pq = I p ⋅ I q .
Отсюда индекс товарооборота разложенный на компоненты имеет вид
∑ p1 ⋅ q1 = ∑ p1 ⋅ q1 ⋅ ∑ po ⋅ q1 .
∑ po ⋅ qo ∑ po ⋅ q1 ∑ po ⋅ qo
Индексный метод позволяет также представить абсолютный прирост
стоимости как результат влияния отдельных факторов: изменения цен и количества которые рассчитываются по формулам:
∆pq p = ∑ p1 ⋅ q1 − ∑ po ⋅ q1;
∆pq q = ∑ po ⋅ q1 − ∑ po ⋅ qo .
Общее изменение стоимости равно алгебраической сумме изменений
за счет каждого фактора и находится следующим образом:
∆pq = ∆pq p + ∆pq q .
Чтобы образовать систему индексов, необходимо соизмерители
брать на разных уровнях, если индекс цен соизмерен по количествам отчетного периода, то индекс объема должен быть соизмерен по ценам базисного периода.
Индексной системой часто пользуются для расчета третьего показателя, если известны два других, входящих в систему.
В общем виде, если а = b · c · d · e, то
Iа = Iб · Iс · Iд · Iе
∆a = (b1 – b0)·с1 · d1 · е1 + b0·(с1 – с0)·d1 · с1 + b0 · с0·(d1 – d0)·с1 + b0 · с0 · d0(е1 – е0).
Индексы при анализе структурных изменений.
В ряде случаев приходится изучать динамику явлений, уровни которых выражены средними величинами. Динамика средней величины индексируемого показателя обусловлена взаимодействием двух факторов: изменением значения индексируемого показателя у отдельных единиц (вариант); изменением структуры, т. е. удельных весов этих вариант. Определение степени влияния каждого из факторов на общую динамику средней
определяется в статистике при помощи системы взаимосвязанных индексов, в которую включаются индексы: переменного, постоянного составов
и структурных сдвигов.
Индексом переменного состава называется индекс, выражающий соотношение средних уровней изучаемого явления, относящихся к разным
34
периодам времени. Он отражает изменение не только индексируемой величины, но и структуры совокупности.
Индекс постоянного (фиксированного) состава – это индекс, исчисленный с весами, зафиксированными на уровне одного какого-либо периода, и показывающий изменение только индексируемой величины.
Индекс структурных сдвигов отражает влияние изменения структуры изучаемого явления на динамику среднего уровня и в общем виде рассчитывается отношением индексов переменного и постоянного состава.
Например, индексы цен определяются следующим образом:
p
p ⋅q
p ⋅q
– переменного состава I p = 1 = ∑ 1 1 ∑ 0 0 ;
p0
∑ q1
∑ q0
p ⋅q
p ⋅q
p ⋅q
– постоянного состава I p = ∑ 1 1 ∑ 0 1 = ∑ 1 1 ;
∑ q1
∑ q1
∑ p0 ⋅ q1
I
p ⋅q
p ⋅q
– структурных сдвигов I стр = ∑ 0 1 ∑ 0 0 = p .
Ip
∑ q1
∑ q0
Территориальные индексы.
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, областям, т. е. в исчислении территориальных индексов. При построении которых приходится решать вопрос, какие веса
использовать при их исчислении. Например, если стоит задача сравнить
цены двух регионов (А и Б), то можно построить два индекса, которые рассчитываются по формулам:
рА ⋅ qА
∑ рБ ⋅ q А
IБ = ∑
А
и
р ⋅q
IБ = ∑ Б Б .
∑ рА ⋅ qБ
А
Эти формулы могут дать совершенно различные представления о соотношении уровней явления. Причина заключается в различии структуры
явлений в отдельных регионах.
В теории и практике статистики предлагаются различные методы
построения территориальных индексов, в том числе метод стандартных весов. Этот метод заключается в том, что значения индексируемой величины
взвешиваются не по весам какого-либо одного региона, а по весам области,
экономического района, республики, в которых находятся сравниваемые
регионы.
В нашем примере в качестве весов можно использовать количество
продукции, проданной в регионах А и Б, т. е.:
Ip =
∑ pA ( qA + qБ ) .
∑ рБ ( qA + qБ )
35
1.9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ
Виды и формы корреляционных взаимосвязей между явлениями.
Прежде чем приступить к изучению связи между явлениями, необходимо выяснить вид связи между факторным и результативным признаками. В статистике различают функциональную связь и стохастическую
зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует только одно значение результативного признака. Если причинная зависимость проявляется
не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная, при которой изменение среднего значения результативного признака обусловлено изменением
факторных признаков.
Важная особенность корреляционных связей состоит в том, что они
обнаруживаются не в единичных случаях, а в массе и требуют для своего
исследования массовых статистических данных.
Проявление корреляционных зависимостей подвержено действию
закона больших чисел: лишь в достаточно большом числе фактов индивидуальные особенности и второстепенные факторы сгладятся и зависимость, если она имеет существенную силу, проявится достаточно отчетливо.
В зависимости от направления действия выделяют связь прямую и обратную. При прямой – направление изменения результативного признака
совпадает с направлением признака-фактора, т. е. с увеличением факторного признака увеличивается и результативный и, наоборот.
По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной с возрастанием величины факторного признака происходит непрерывное возрастание или убывание величин результативного признака. Математически такая связь представляется уравнением прямой линии у = а0 + а1х, а графически – прямой.
При криволинейной связи с возрастанием величины факторного
признака возрастание (или убывание) результативного признака происходит неравномерно или направление его меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т. д.).
Еще одна важная характеристика связей, если характеризуется связь
двух признаков (с точки зрения взаимодействующих факторов), то ее принято называть парной, если изучаются более чем две переменные – множественной.
Взаимосвязи между явлениями, установленные на основе теоретического анализа, могут быть изучены, измерены и количественно выражены
с помощью различных статистических методов. Для исследования функциональных связей применяются балансовый и индексный методы. Для
36
изучения корреляционных связей между атрибутивными признаками – метод взаимной сопряженности, для количественно варьирующих признаков –
метод параллельных рядов, графический, аналитических группировок,
корреляционно-регрессионный анализ.
Парная корреляция и парная регрессия. В наиболее общем виде
задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы
и формы влияния одних факторов на другие. Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценки
факторов, оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для
оценки неизвестных значений зависимой переменной.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитическая связь между ними описывается следующими уравнениями:
– прямой ух = а0 + а1х;
1
– гиперболы у х = а0 + а1 ;
х
– параболы у х = а0 + а1 х + а2 х 2 и т. д.
Определить тип уравнения можно, исследуя зависимость графически.
Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению: если результативные
и факторные признаки возрастают одинаково, примерно в арифметической
прогрессии, то это свидетельствует о том, что связь между ними линейная,
а при обратной – гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативные – значительно быстрее,
то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии осуществляется методом
наименьших квадратов. Его сущность заключается в нахождении параметров модели, при которых минимизируется сумма квадратов отклонений
эмпирических значений результативного признака от теоретических.
Системы нормальных уравнений для нахождения параметров регрессии имеют вид:
na0 + a1Σx = Σy
– для линейной зависимости
;
2
a0Σx + a1Σx = Σyx
1
na0 + a1 ∑ x = Σy
– гиперболы
;
a ∑ 1 + a ∑ 1 = ∑ y
0 x 1 x 2
x
37
na0 + a1 ∑ x + a2 ∑ x 2 = ∑ y
– параболы a0 ∑ x + a1 ∑ x 2 + a2 ∑ x3 = ∑ yx .
a x 2 + a x3 + a x 4 = yx 2
∑
1∑
2∑
0∑
Параметр а0 в уравнениях регрессии – постоянная величина и, как
правило, экономического смысла не имеет. Другие параметры при х называются коэффициентами регрессии, которые показывают, на сколько единиц в среднем изменится у при изменении х на одну единицу.
Количественно зависимость изменения теоретического значения ух
от изменения х, которую выражают коэффициенты регрессии, часто бывает удобнее выразить в относительных величинах. Для этого исчисляют коэффициент эластичности (Э). Он характеризует на сколько процентов увеличивается ух при увеличении х на один процент и рассчитывается по формуле
Э = а1
х
.
ух
Для количественной оценки тесноты связи при линейной форме широко используют линейный коэффициент корреляции, который находиться
по выражению
r=
∑ yx − ∑ x ⋅
∑y
n
(∑ x) ⋅ y2 − ( ∑ y )
∑ x2 −
∑
n
n
2
2
,
где n – число наблюдений.
Коэффициент корреляции принимает значения в интервале от –1 до +1.
Принято считать, что если r< 0,3, то связь слабая; при r= (0,3 – 0,7) –
средняя; при r> 0,7 – сильная или тесная. Когда r= 1 – связь функциональная.
В случае наличия линейной и нелинейной зависимости между двумя
признаками для измерения тесноты связи применяют так называемое корреляционное отношение или индекс корреляции (η). Он построен на сравнении разницы двух дисперсий σ 2у − ух и σ 2у . σ 2у − ух – дисперсия, измеряющая
отклонения фактических (эмпирических) значений (у) от теоретических
(ух), и характеризует остаточную вариацию, обусловленную прочими факторами. Дисперсия σ 2у измеряет вариацию, обусловленную фактором х.
η=
σ 2у − σ 2у − ух
σ 2у
у2
2
; σ 2у = ∑ − ( у ) ;
п
38
σ 2у − ух = ∑
( у − ух )2
.
п
Индекс корреляции изменяется в пределах от 0 до 1 и пригоден для
измерения тесноты связи при любой ее форме. Более того, выравнивая
значения у по разным функциям, можно по величине дисперсии, характеризующей остаточную вариацию (σ 2у − ух ) судить о том, какая функция в наилучшей степени выравнивает эмпирическую линию связи.
Множественная регрессия и корреляция.
Изучение связи между двумя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При
исследовании зависимостей методами множественной регрессии задача
формулируется также, как и при использовании парной регрессии, т. е. требуется определить аналитическое выражение связи между результативным
и факторными признаками.
Наиболее сложной проблемой представляется выбор формы связи.
Сложность заключается в том, что из бесконечного множества функций
требуется найти такую, которая лучше других будет выражать реально существующие связи между изучаемыми показателями и факторами. Выбор
типа функции может опираться на теоретические знания об изучаемом явлении или на опыт предыдущих аналогичных исследований. Форму связи
можно определить путем перебора функций разных типов. Но в большинстве практических случаев любую функцию многих переменных можно
свести к линейному виду, т. е. уравнение множественной регрессии можно
строить в линейной форме:
yx = a0 + a1x1 + a2x2 + ... + anxn.
Каждый коэффициент данного уравнения показывает степень влияния соответствующего фактора на анализируемый показатель при фиксированном положении (на среднем уровне) остальных: с изменением каждого фактора на единицу показатель изменяется на соответствующий коэффициент регрессии.
В случае неадекватности линейного уравнения множественной регрессии рекомендуется повышать порядок уравнения.
Проблема отбора факторных признаков для построения моделей
взаимосвязи может быть решена на основе эвристических или многомерных статистических методов анализа.
Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и т. д. Например, для двухфакторной
линейной регрессии по методу наименьших квадратов необходимо решить
следующую систему нормальных уравнений:
na0 + a1Σx1 + a2Σx2 = Σy
a0Σx1 + a1Σx12 + a2Σx1 ⋅ x2 = Σy ⋅ x1 .
a Σx + a Σx ⋅ x + a Σx 2 = Σy ⋅ x
2
2
2
0 2 1 1 2
39
С помощью многофакторного корреляционного анализа находятся
различного рода характеристики тесноты связи между изучаемым показателем и факторами: парные, частные и множественные коэффициенты
корреляции, множественный коэффициент детерминации.
Для изучения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов аналогична линейному коэффициенту корреляции.
Частные коэффициенты корреляции характеризуют степень влияния
одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается, они могут быть первого порядка (если исключается влияние одной переменной), второго порядка (если исключено влияние двух переменных) и т. д. Например, частный коэффициент корреляции первого порядка между признаками у и х1
при исключении влияния х2 вычисляется по формуле
ryx1 ( x2 ) =
ryx1 − ryx2 ⋅ rx1x2
(1 − r )(1 − r )
2
yx2
,
2
x1 x2
где r – парные коэффициенты корреляции между соответствующими признаками.
Показателем тесноты связи, устанавливаемой между результативным
и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции. В случае линейной двухфакторной связи он может быть рассчитан по формуле
R=
ryx2 1 + ryx2 2 − 2ryx1 ⋅ ryx2 ⋅ rx1x2
1 − rx21x2
.
Величина R2 называется совокупным коэффициентом множественной детерминации. Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии.
Значения R и R2 находятся в пределах от 0 до 1.
Для того, чтобы определить какой из факторов оказывает наибольшее влияние на исследуемый показатель, вычисляются частные коэффициенты эластичности (Эi), с помощью которых устраняется различие в единицах измерения. Они находятся с помощью уравнения
Эi = ai
xi
.
y
Непараметрические методы оценки связи.
Методы корреляционного и дисперсионного анализа можно применять, когда все изучаемые признаки являются количественными. Между
40
тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками.
Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. При исследовании связи числовой материал располагают в виде таблиц сопряженности (табл. 1).
Таблица 1
Таблица для вычисления коэффициентов ассоциации и контингенции
а
с
а+с
в
d
в+d
а+б
с+d
а+в+с+d
Коэффициенты определяются по следующим формулам:
аd − вс
;
– ассоциация К а =
аd + вс
аd − вс
– контингенция К к =
.
(а + в )(в + d )(а + с)(с + d )
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка ≥ 0,5 или Кк ≥ 0,3.
Когда каждый из качественных признаков состоит более чем из двух
групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона (С) и Чупрова (К):
С=
К=
ϕ2
;
1 + ϕ2
ϕ2
,
( К1 − 1)( К 2 − 1)
где ϕ2 – показатель средней квадратической сопряженности, определяемый
путем вычитания единицы из суммы отношений квадратов частот каждой
клетки таблицы к произведению частот соответствующего столбца и строки; К – число групп по каждому из признаков.
Величина коэффициентов С и К колеблется в пределах от 0 до 1. Коэффициент Чупрова обычно дает более осторожную оценку связи.
КОНТРОЛЬНЫЕ ВОПРОСЫ ЗАДАНИЯ
1. Что является предметом исследования статистической науки? Приведите примеры явлений общественной жизни, изучаемых статистикой.
2. Дайте определение статистического показателя и укажите его виды.
3. Каковы принципы организации статистики в России в настоящее
время?
41
4. Назовите основные программно-методологические вопросы статистического наблюдения.
5. Какие конкретные виды статистического наблюдения используют
для сбора данных?
6. Какие основные задачи решаются исследованием с помощью метода группировок?
7. Какова роль и значение классификаций? Приведите примеры важнейших классификаций.
8. Как выполняется группировка, если группировочный признак является дискретным?
9. Как устанавливаются интервалы в группах?
10. Какие могут быть выделены виды статистических таблиц?
11. Постройте график, характеризующий структуру студентов вашей
группы по успеваемости в последнюю сессию.
12. Назовите виды относительных величин и охарактеризуйте их значение.
13. Охарактеризуйте состав студентов группы по полу и возрасту
и рассчитайте относительные величины структуры.
14. Что представляет собой средняя величина и в чем состоит ее определяющее свойство?
15. Назовите основные свойства средней арифметической.
16. В чем различие между степенными и структурными средними?
17. Какие системы показателей используют для характеристики особенностей рядов распределения?
18. Что представляет собой вариация признака и в чем заключается
значение ее изучения?
19. Какие показатели вариации находят наиболее широкое применение?
20. Какие критерии согласия используют наиболее часто?
21. В чем преимущества выборочного метода в сравнении с другими
видами статистических наблюдений?
22. Что означает ошибка репрезентативности и какие факторы определяют ее величину?
23. Какие показатели применяются для характеристики изменений
уровней ряда динамики?
24. Как может быть выявлена основная тенденция в изменениях
уровней ряда динамики?
25. Назовите преимущества и роль аналитического выравнивания
уровней временного ряда.
26. Как рассчитать скользящую среднюю и для каких целей она может быть использована?
27. Как рассчитать индексы сезонности и осуществить экстраполяцию с учетом сезонной составляющей?
42
28. На каких принципах базируется расчет агрегатных индексов объемных и качественных показателей?
29. Какие виды средних индексов используются в статистической
практике и для решения каких проблем?
30. Чем объяснить различия в величине индекса цен переменного
и фиксированного состава?
31. Что характеризует разность числителя и знаменателя агрегатных
индексов физического объема продукции и цен?
32. Как определить долю влияния различных факторов на изменение
результативного показателя?
33. В чем состоит отличие между корреляционной и функциональной связями?
34. Какие показатели являются мерой тесноты связи между двумя
признаками?
35. В чем состоит значение уравнения регрессии?
36. Какое значение имеет расчет индекса корреляции?
37. Что означает величина коэффициента эластичности 0,58?
38. Для чего рассчитываются частные коэффициенты корреляции?
39. Какие показатели используют для измерения тесноты связи между качественными признаками?
43