Сводка, классификация и группировка статистических данных
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
3. СВОДКА, КЛАССИФИКАЦИЯ И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ
3.1 Суть и организация статистической сводки
Зарегистрированный в процессе массового статнаблюдения материал представляет собой разрозненные начальные данные об отдельных единицах совокупности исследуемого явления. Такие данные еще не характеризуют явление в целом: не дают представления о о величине (численности) явления, его составе, размере характерных признаков, связи с другими явлениями. В одиночных сведениях теряется общее и отсутствует закономерное. Например, при изучении состояния торговли в районе города собранные статистически данные о коммерческой деятельности отдельных торговых предприятий дают соответствующую оценку работы каждого из них. Обобщающую характеристику по торговым предприятиям в целом по району можно получить путем систематизации и обобщения полученной информации. Переход от единичных данных статистич. наблюдения как первого этапа стат. исследования к получению обобщенного материала о явлении в целом происходит через сводку.
Сводка как второй этап статистического наблюдения – это научная обработка данных наблюдения для последующего описания статистической совокупности по обобщающим показателям. Суть статистической сводки заключается в объединении единиц совокупности в группы, классы, типы и агрегирования информации о них как в границах групп, так и в целом по совокупности.
Основная задача сводки статистических данных заключается в выявлении типичных черт и закономерностей в совокупности.
Статистическую сводку можно рассматривать двояко. С одной стороны (в узком понимании) сводка представляет собой операцию по подсчету итоговых данных, характеризующих совокупность. С другой стороны, (в широком понимании), сводка есть целый комплекс статистических операций: объединение зарегистрированных при наблюдении начальных данных в группы, подобные в том или ином отношении, подсчет результатов по выделенным группам, и по всей совокупности в целом; получение на основе этих результатов системы взаимосвязанных показателей, которые характеризуют исследуемое явление, и оформление результатов в виде статистических таблиц, графиков, рядов распределения
Работа по стат. сводке состоит из следующих этапов:
1. формирование целей и задач статистической сводки
2. Формирование групп из единиц наблюдения, определение группировочных признаков, количества групп и величины интервала, выделение существенных признаков
3. Осуществление технической стороны сводки, т.е. проверка полноты и качества собранного материала, подсчет результатов и определение необходимых показателей для характеристики всей совокупности и ее части.
Программа статистической сводки устанавливает следующие виды работ:
• выбор группировочных признаков
• установление порядка формирования групп
• разработка системы статистических показателей для характеристики групп и объекта в целом
• разработка макета статистических таблиц для представления результатов сводки
• выбор способа сводки данных статистического наблюдения.
План статистической сводки заключает в себе указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке представления результатов.
Сегодня обработка данных наблюдения осуществляется в основном автоматизировано с использованием ПК.
Статистические сводки различаются по ряду признаков: сложности построения, организации работы, степени обработки данных.
3.2 Классификация в статистике
Если разграничение элементов совокупности на группы осуществляется по атрибутивным признакам, то такой вид группировки наз. классификацией, или номенклатурой. Классификаторы разрабатываются международными и национальными статистическими органами и рекомендуются как статистический стандарт.
Классификаторы в статистике – это систематизированное распределение по атрибутивным признакам объектов на определенные группы, классы, разряды на основании их совпадения или различия.
Различают следующие виды статистических классификаций:
экономические, которые используются с целью изучения экономических аспектов развития общества
Социальные, которые предназначены для изучения населения, жилья и охраны здоровья
экологические, используемые для изучения земле- и водопользования, отходов производства, расходов на ООС
другие классификации (грузов, названий стран, рабочих профессий и проч.)
Для каждого вида классификации разработаны Классификаторы – это такая категория классификации, когда каждому значению группировочного признака присваивается код, т.е. условное цифровое обозначение. Использование классификаторов значительно упрощает обработку социально-экономической информации.
Всего в России разработаны и находятся в действии 29 видов общероссийских классификаторов.
Основные виды классификаторов:
• Общероссийский классификатор основных фондов (ОКОФ)
• Общероссийский классификатор единиц измерения (ОКЕИ)
• Общероссийский классификатор объектов административно-территориального деления (ОКАТО)
• Общероссийский классификатор предприятий и организаций (ОКПО)
• Общероссийский классификатор форм собственности (ОКФС)
• Общероссийский классификатор видов экономической деятельности (ОКВЭД)
• Общероссийский классификатор органов государственной власти и управления (ОКОГУ)
• Общероссийский классификатор организационно-правовых форм (ОКОПФ) и проч.
Рассмотрим систему создания классификаторов на примере Общероссийского классификатора видов экономической деятельности (ОКВЭД), который входит в состав Единой системы классификации и кодирования технико - экономической и социальной информации (ЕСКК) Российской Федерации.
ОКВЭД построен на основе гармонизации с официальной версией Статистической классификации видов экономической деятельности в Европейском экономическом сообществе.
Используется ОКВЭД при проведении всероссийского экономического обследования хозяйствующих субъектов и разработке базовых таблиц "затраты-выпуск", и применяется при решении задач, связанных с:
• осуществлением государственного статистического наблюдения по видам деятельности за развитием экономических процессов;
• подготовкой статистической информации для сопоставления на международном уровне.
Кроме того, ОКВЭД используется при решении задач, связанных с:, заявляемых хозяйствующими субъектами при регистрации;
классификацией и кодированием видов экономической деятельности
• определением основного и других фактически осуществляемых видов экономической деятельности хозяйствующих субъектов;
• разработкой нормативных правовых актов, касающихся государственного регулирования отдельных видов экономической деятельности;
• кодированием информации о видах экономической деятельности в информационных системах и ресурсах, едином государственном регистре предприятий и организаций, других информационных регистрах;
• обеспечением потребностей органов государственной власти и управления в информации о видах экономической деятельности при решении аналитических задач.
Объектами классификации в ОКВЭД являются виды экономической деятельности. Экономическая деятельность имеет место тогда, когда ресурсы (оборудование, рабочая сила, технологии, сырье, материалы, энергия, информационные ресурсы) объединяются в производственный процесс, имеющий целью производство продукции (оказание услуг). Экономическая деятельность характеризуется затратами на производство, процессом производства и выпуском продукции (оказанием услуг).
ОКВЭД включает перечень классификационных группировок видов экономической деятельности и их описание (приложение А).
В ОКВЭД использованы иерархический метод классификации и последовательный метод кодирования. Код группировок видов экономической деятельности состоит из двух - шести цифровых знаков и его структура может быть представлена в следующем виде:
XX. - класс;
ХХ.Х - подкласс;
ХХ.ХХ - группа;
ХХ.ХХ.Х - подгруппа;
ХХ.ХХ.ХХ - вид.
Ниже приводится в качестве примера выписка из ОКВЭД по классу Добыча сырой нефти и природного газа.
11
класс
Добыча сырой нефти и природного газа; предоставление услуг в этих областях
11.1
подкласс
Добыча сырой нефти и природного газа
11.10
группа
Добыча сырой нефти и природного газа
11.10.1
подгруппа
Добыча сырой нефти и нефтяного (попутного) газа; извлечение фракций из нефтяного (попутного) газа
11.10.11
вид
Добыча сырой нефти
11.10.12
Добыча нефтяного (попутного) газа
11.10.13
Разделение и извлечение фракций из нефтяного (попутного) газа
11.10.14
Добыча горючих (битуминозных) сланцев, битуминозного песка и озокерита
11.10.2 подгруппа
Добыча природного газа и газового конденсата
11.10.3 подгруппа
Сжижение и регазификация природного газа для транспортирования
11.2 подкласс
Предоставление услуг по добыче нефти и газа
11.20 группа
Предоставление услуг по добыче нефти и газа
11.20.1 подгруппа
Предоставление услуг по бурению, связанному с добычей нефти, газа и газового конденсата
11.20.2 подгруппа
Предоставление услуг по монтажу, ремонту и демонтажу буровых вышек
11.20.3 подгруппа
Предоставление услуг по доразведке месторождений нефти и газа на особых экономических условиях (по соглашению о разделе продукции - СРП)
11.20.4 подгруппа
Предоставление прочих услуг, связанных с добычей нефти и газа
12 класс
Добыча урановой и ториевой руд
3.3 Группировка статистических данных
На втором этапе статистического исследования осуществляется распределение совокупности по группам, однородном в том или ином отношении. При этом используются следующие принципы: в одну группу объединяются элементы совокупности, в известной мере подобные между собой. Мера подобия между элементами одной группы значительно выше, чем между элементами, которые принадлежат другим группам. При этом решаются следующие вопросы: что взять в основу группировки? сколько групп необходимо сформировать, как распределить группы?
Основой разграничения элементов в совокупности на группы может быть любой признак (атрибутивный или количественный), который имеет качественную отличительную характеристику.
Такой признак наз. группировочный признак.
Группировка в широком смысле как основной элемент статистической сводки – это распределение элементов совокупности на типы и группы по наиболее характерным признакам. Если признаками выступают количественные показатели, то такой вид работ (в отличии от классификаций) называют в узком смысле статистической группировкой.
Целью статистической группировки явл. деление совокупности на однородные типичные группы по существующим для них количественным признакам с целью всесторонней характеристики их состояния, развития и взаимодействия.
Задачи группировки заключаются в следующем:
• выделение различных социально-экономических типов явлений и всесторонняя их характеристика
• исследование структуры массовой совокупности
• изучение взаимодействия между различными признаками совокупности.
В зависимости от цели группировки бывают следующих видов:
• типологические,
• структурные,
• аналитические.
Типологические – это группировки, которые проводят с целью выделения в составе всей совокупности отдельных совокупностей, типов, частей, однородных по качеству и условиям развития, в которых действуют одни и те же закономерности. Например, группировка предприятий по форме собственности, населения по возрасту. Построение этих группировок длительное время позволяет проследить процесс развития общества, форм собственности.
В России в демографических исследованиях используются следующие возрастные группировки:
1) от 0 до 3 лет – ясельный возраст (дети до 1 года – младенцы);
2) от 3 до 7 лет – дошкольники;
3) от 7 до 16 лет – школьники (школьники от 13 до 16 лет – подростки);
4) от 16 до 60 лет – трудоспособный возраст (16–59 – мужчины, 16–55 – женщины);
5) от 60 и старше (для мужчин) или от 55 и старше (для женщин) – пенсионеры.
Структурные - это группировки, которые характеризуют состав однородной совокупности по любым признакам. С помощью таких группировок анализируют структуру совокупности и структурные сдвиги в развитии соц-экономических явлений. Например, группировка населения по полу, возрасту, в производстве – группировка рабочих по производственному стажу, квалификации и т.п.
Аналитические – это группировки направленные на выявление взаимосвязи между отдельными признаками изучаемого явления. Например, взаимосвязь между затратами и факторами их обуславливающими, производительности труда и ее факторами.
По количеству группировочных признаков различают простую и сложную (комбинированную) группировки.
Простой называют группировку, которая производится по одному признаку.
В случае сочетания двух и более признаков группировки называют сложными или комбинированными. В таких группировках группы с одним признаком разделяются на подгруппы по другому признаку. Например, группировка предприятий по форме собственности, размеру прибыли, уровню рентабельности классифицируются еще и по другим признакам – производительность труда, фондоотдача др.
Совместно с первичной группировкой в статистике применяют вторичную группировку, которая проводится на основе ранее проведенной группировки в случае, когда первичная группировка не дает возможности четко определить характер распределения единиц совокупности.
По отношению между признаками различают иерархическую или неиерархическую группировки
Классификация группировок
Действия, проводимые в процессе группировки:
• выбор группировочного признака
• определение количества групп и величины интервала
• установление перечня показателей, которыми должны характеризоваться выделенные группы
• составление макетов результативных таблиц
• вычисление абсолютных, относительных и средних величин
• табличное и графическое оформление результатов
Принципиальное значение при построении группировки имеет выбор группировочного признака. В качестве группировочных принимаются наиболее существенные признаки, которые могут быть атрибутивными (качественными) или количественными.
Если группировка осуществляется по атрибутивному признаку, то выделяется столько групп, сколько имеется наименований признаков. Например, в табл. показано распределение городских земельных площадей по видам застройки (атриб. признак)
Табл.
Вид городской застройки
Площадь, га
% от итога
Промышленная площадь
670
22,1
Жилищная
1920
63,5
Общественная
315
10,4
Другая
120
4,0
Всего
3025
100
Такой вид группировки наз. структурной, т.к. показывает масштабность и весомость отдельных видов застройки на территории города.
При составлении группировок на основе количественных признаков (дискретных или непрерывных) определяют количество групп и интервалы группировок.
Для определения количества групп необходимо придерживаться двух важных условий
построения группировок:
1 - выделенные группы должны отличаться качественной однородностью
2 - количество единиц в каждой группе должно быть достаточно большим, чтобы отвечать требованию закона больших чисел. В массовой совокупности оптимальное количество групп с равными интервалами приблизительно можно определить по формуле американского ученого Стерджесса:
m = 1 + 3.322 lg n
где m – количество групп√√
n – объем совокупности.
Формула Стерджеса может быть использована при условии, что распределение единиц совокупности по данному признаку приближается к нормальному закону распределения.
При малом количестве единиц совокупности используется формула: m = √n
Интервалы, т.е. промежутки между значениями признака в группе единиц, бывают равные, неравные, открытые и закрытые. Выбор вида интервала зависит от характера распределения единиц исследуемой совокупности.
Равные интервалы используют в случаях, когда значение варьируемого признака изменяется плавно, постепенно, равномерно. Ширина интервала h определяется по формуле:
h =X маx – X min / m
где Xmax и Xmin – наибольшее и наименьшее значение признака совокупности.
Например, прибыльность активов коммерческих банков колеблется в пределах от 5 до 45%. При принятии количества групп m=4, ширина интервала h = (45 – 5) / 4 = 10. Тогда границы интервала составляются соответственно: 5-15, 15-25, 25-35, 35-45.
Поскольку границы интервалов совпадают, то для исключения неопределенности отнесения граничных значений признака к той или другой группе используют следующие правила:
1. Если в основании интервала лежит непрерывный признак, то левое одинаковое число не включает в себя значение признака, правое – включает. Тогда, например, интервалы 5-15 (15 – левое), 15 (правое) -25, число 15 должно быть отнесено ко второй группе, а не к первой. Все интервалы в данном примере наз. закрытыми.
2. Если в основании интервала лежит дискретный признак, то нижняя граница i-го интервала равна верхней границы i-1 интервала, увеличенной на 1. Тогда интервалы записываются следующим образом: 5-15, 16-25, 26-35, 36-45.
Приведенное распределение прибыльности активов банка может быть представлено в другом виде: до 15%, 15-25%, 25-35%, 35% и более. Первый и последний интервалы имеют лишь одну границу и наз. открытыми.
Неравные интервалы используются в случае, когда диапазон значений признака слишком широкий и распределение совокупности по этому признаку неравномерно. Например, распределение поселков городского типа по количеству жителей (тыс. чел.): до 3; 3-4,9; 5-9,9; 10-49,9.
Неравные интервалы могут быть прогрессивно возрастающими или убывающими в арифметической или геометрической прогрессии. Величина интервала, изменяющаяся в арифметической прогрессии, определяется по формуле:
hi+1 = h1+a (a- константа,(+)(-),
в геометрической прогрессии:
hi+1 = h1*q (q- константа, больше, равна 1),
При небольшом объеме совокупности не следует образовывать большое число групп, т.к. группы будут малочисленными, и, следовательно, не позволят получить объективную характеристику исследуемого явления.
Часто задачей группировки по количественному признаку является отражение распределения единиц совокупности по этому признаку. Тогда количество групп зависит в первую очередь от колеблемости: чем больше колеблемость, тем больше требуется образовывать групп.
Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» наз. группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.
При изучении социально-экономических явлений на макроуровне, когда вариационность ряда весьма высокая, часто применяют произвольные интервалы. Группировка с произвольными интервалами может быть построена с помощью коэффициента вариации (V) представляющего собой отношение среднеквадратического отклонения (σ) к средней величине признака (хср):
V = σ/ Xср*100%.
При построении группировки с такими интервалами сначала исходная информация ранжируется. Далее первые значения объединяются в группу до тех пор, пока окажется, что коэффициент вариации равен или близок по значению к 33 % и присоединение следующей единицы наблюдения приводит к значительному росту коэффициента вариации.
Принято считать, что при коэффициенте вариации менее 33% совокупность является однородной, если более 33%, то неоднородной. Для повышения однородности статистической совокупности допускается удаление части единиц совокупности ( до 10% от имеющего количества объектов) со значениями группировочного признака, наиболее отклоняющегося от средней величины - аномальные значения. Аномальные – это значения, у которых наблюдается максимальное отклонение от средней величины:
(Хi – Xср)→max.
Возможно, если мы уберем аномальные наблюдения из анализа, у нас все равно останется значительный разброс, а провести группировку по какому-либо качественному показателю нет возможности. В таком случае проводят «принудительную» группировку, то есть задают некоторые границы, которые разбивают исходную совокупность на части.
Простые способы группировки – это разделение на равные по размеру группы либо через равные интервалы значений.
Более сложные виды группировки связаны со структурой данных и часто базируются на принципе Парето (закон Парето).
В качестве самого яркого примера можно привести ABC-анализ, который делит данные таким образом, что они разбиваются на три группы в зависимости от их вклада в общую сумму.
В группу А попадают примерно 20% единиц наблюдения, дающих 80% общего итога количественного показателя,
в группу B – еще 30%, дающих 15% итога и
в группу C – оставшиеся 50% значений, дающих всего 5% общего итога.
Однако и классический ABC-анализ далеко не всегда решает проблему однородности. Тогда данные детализируют еще больше. Часто в качестве групп или границ выступают значения, которые просто удобны или следуют некоторой логике.
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
1.4.1. РЯДЫ РАСПРЕДЕЛЕНИЯ
Особый вид группировок в статистике представляют собой ряды распределения, которые являются самым простым способом обобщения статистических данных.
Рядом распределения наз. группировку, характеризующую состав (структуру) явления в данный момент времени.
В зависимости от того, какой признак заложен в основу группировки (качественный или количественный), ряды распределения бывают атрибутивными (качественными) или вариационными (количественными).
Примером атрибутивных рядов может быть распределение населения по национальности, профессии, занятости в сфере производства и услуг, и т.д.
В табл. 3.2 приведен атрибутивный ряд распределения студентов университета по экономическим специальностям.
Таблица 3.2
Распределение студентов экономического факультета университета
по специальностям на 01.09.2011 г.
Наименование специальности
Число студентов, чел., fi
В % от общего количества, qi
Финансы
262
27,3
Бухучет и аудит
279
29,0
Менеджмент организаций
246
25,6
Маркетинг
174
18,1
ВСЕГО
961
100
Элементами (характеристиками) этого ряда являются: значения атрибутивного признака (первая графа табл.),
частоты fi – численные характеристики отдельного значения признака, т.е. числа, которые показывают, как часто встречается то или иное значение признака в ряду (вторая графа), частности qi – это частоты, выраженные в относительных величинах (коэфф. или %) - третья графа табл.
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариационные ряды распределения бывают дискретными и интервальными.
Дискретные вариационные ряды основаны на величинах признака, которые имеют целые значения (например, тарифный разряд рабочих, количество марок автомобилей и т.п.). Табл. 3.3 иллюстрирует дискретный ряд распределение семей по количеству детей в населенном пункте.
Таблица 3.3
Распределение семей по количеству детей в N-ом населенном пункте
по состоянию на 01.01.2011г.
Количество детей, Xi (группировочный признак)
Количество семей, fi
В % от общего количества семей, qi
1
63
56,2
2
48
42,8
3
1
1
ВСего
112
100
В интервальных вариационных рядах группировочный признак может принимать любое значение (целое, дробное) в пределах каждого интервала (например, распределение заработной платы работающих в организации, распределение основным фондов предприятия, и.т.д.). В табл. 3.4. приведен интервальный ряд распределения коммерческих банков в населенном пункте по величине капитала.
Таблица 3.4
Распределение коммерческих банков по величине капитала на 01.07.15 г.
(в основе - количественный признак, ряд интервальный с равными интервалами
Размер капитала, млн. д.е., Xi
Число банков, fi
В% от общего количества, qi
3 - 6
9
34.6
6 - 9
13
50.0
9 - 12
4
15.4
Всего
26
100.0
При анализе рядов распределения с неравными интервалами используются такие показатели как: плотность частоты и накопленная частность (табл.3.5).
Плотность частоты (распределения) – это частота, рассчитанная на единицу ширины интервала в вариационном ряду распределения. Позволяет привести в сопоставимый вид данные при неравных интервалах. Рассчитывается по формуле:
F = fi/h, где h – ширина интервала.
Накопленная частность определяется путем последовательного суммирования частностей по группам и показывает, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. Рассчитывается по формуле:
F = ∑qi, %
Анализ рядов распределения сопровождается графическим изображением. Для этой цели строят полигон, кумуляту, гистограмму и огиву распределения.
Полигон - ломанная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладывают значение варьирующего признака, а по оси У – частоты. Полигон используется при изображении дискретных вариационных рядов.
При помощи кумуляты (кумулятивная кривая) изображают ряд накопленных частот, которые определяют путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое значение.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву.
Таблица 3.5
Распределение малых предприятий по объемам выпуска продукции
(в основе - количественный признак, ряд интервальный с неравными интервалами)
Объем выпуска продукции, шт., Xi
Количество предприятий, fi
(частота)
Доля в общем количестве, %
(Частность, qi)
Шаг интервала, h
Плотность распределения,
fi/h
Накопленная частность,
∑ qi, %
До 300
44
4,4
300
0,15
4,4
300-600
113
11,3
300
0,38
15,7
600-1000
245
24,5
400
0,61
40,2
1000-3000
537
53,7
2000
0,27
93,9
Более 3000
61
6,1
2000
0,03
100,0
Всего
1000
100
х
х
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс отмечают величины интервалов, а частоты изображают прямоугольниками, построенными на соответствующих интервалах. При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение и получения возможности сравнить интервалы.