Сводка, группировка и способы представления статистических данных
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1
Лекция 2. Сводка, группировка и способы представления статистических
данных
1. Сводка: сущность и виды
2. Сущность и виды группировок
3. Статистические таблицы
4. Графическое представление статистических данных
1. Сводка: сущность и виды
Сводка статистических данных – это научно организованная обработка
данных статистического наблюдения, включающая систематизацию и группировку данных, подсчет групповых и общих и итоговых статистических данных.
Цель сводки – сведение воедино материалов статистического наблюдения и получение обобщающих статистических показателей, раскрывающих сущность
социально-экономических явлений и процессов и отражающих определенные
статистические закономерности.
Сводка статистических данных проводится по заранее составленной программе, содержание которой определяется задачами исследования. Программа
должна содержать перечень объектов и показателей для изучения объекта, перечень признаков группировки, систему макетов таблиц, в которые в определенном порядке заносятся сведения об объекте исследования, группы и подгруппы данных и характеризующие их промежуточные и итоговые показатели.
Различают централизованную и децентрализованную сводку статистических материалов.
Централизованная сводка проводится в одном центральном органе
(например, в Федеральной службе Государственной статистики РФ), куда поступают материалы статистических наблюдений со всех территорий страны.
Децентрализованная сводка – обобщение материалов статистического
наблюдения на местах их сбора – территориальных органах статистики по единому плану. Сводные итоги передаются вышестоящему органу для дальнейшего их обобщения.
2. Сущность и виды группировок
Группировка предполагает определенную классификацию явлений и процессов, а также причин и факторов их обуславливающих. Группировка в статистике – это научно обоснованное разделение единиц изучаемого общественного
явления на однородные группы по одному или нескольким существенным для
него признакам. В тоже время это метод объединения единиц изучаемой сово-
2
купности в однородные группы, по которым рассчитываются статистические
показатели. Между сводкой и группировкой существует тесная связь. Без сводки нельзя провести группировку единиц изучаемой совокупности, а сводка без
группировки не позволяет выявить характерные черты отдельных типов явлений, установить закономерности исследуемых явлений и взаимосвязи между
ними.
Основу метода группировок составляет всесторонний, глубокий анализ
сущности и природы изучаемого явления или процесса, позволяющий определить его отличительные черты. Любая исследуемая совокупность может быть
разбита на однородные группы, объединяющие отдельные единицы совокупности с учетом присущих им отличительных черт и свойств. Отличительная
черта или особенность, по которой происходит объединение отдельных единиц
изучаемой совокупности в однородные группы, называется группировочным
признаком.
Виды группировок.
В зависимости от цели исследования:
1. Типологическая – группировка, позволяющая выделить социальноэкономический тип явлений. Например, объединение предприятий по формам
собственности (государственная, федеральная, субъектов федерации, муниципальная, частная, смешанная, собственность общественных организаций) или
по размерам (микро-, малые, средние, крупные).
2. Структурная – группировка, которая позволяет определить структуру
явления или процесса, т.е. выявить однородный (в качественном отношении)
состав изучаемой статистической совокупности. Например, все население страны в зависимости от места проживания делится на городское и сельское (Таблица 1). При этом, если в такой группировке сопоставить данные за ряд временных промежутков (лет, месяцев), то можно получить представление о
структурных сдвигах в изучаемом явлении.
Таблица 1 – Численность населения Российской Федерации в 2007–2013 гг.
В млн чел.
Показатель
2007 2008 2009 2010 2011 2012 2013
Все население
142,8 142,8 142,7 142,9 142,9 143,0 143,3
В том числе
городское
104,7 104,9 104,9 105,3 105,4 105,7 106,1
сельское
38,1 37,9 37,8 37,6 37,5 37,3 37,2
Источник: Официальный сайт Федеральной службы государственной статистики, 2013 г.
3
Данные таблицы 1 свидетельствуют о том, что в стране с 2009 г. имеет
место тенденция роста численности населения , при этом численность городского населения растет, а сельского – сокращается, начиная с 2007 г.
3. Аналитическая – группировка, применяемая для выявления связей и
зависимостей между отдельными признаками общественных явлений. При этом
выделяются признак-фактор и признак-результат. Признак-результат (зависимый признак) – признак, значение которого изменяется под влиянием других
признаков. Признак-фактор – признак, оказывающий влияние на значения других признаков. Обычно в основе аналитической группировки лежит признакфактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками.
Выделяют четыре случая сочетаний признаков-факторов и признаковрезультатов:
факторным показателем является количественный признак, а результативным – качественный (например, стаж работы рабочего и качество выполняемой им работы);
факторным показателем является качественный признак, а результативным – количественный (например, квалификация рабочего и объем производимой им продукции);
факторным и результативным показателями являются количественные
признаки (например, стаж работы рабочего и объем производимой им продукции);
факторным и результативным показателями являются качественные
признаки (например, квалификация рабочего и качество выполняемой им работы).
В зависимости от числа положенных в основание группировки признаков:
Простая – группировка, в которой группы образованы по какому-либо
одному признаку. Например, группировка работников предприятия по возрасту.
Сложная – группировка, в которой группы образуются на основе двух или
более признаков взятых в сочетании друг с другом. Существенные признаки, на
основе которых производится группировка, могут быть атрибутивными – они
характеризуют качество явления и количественными – вариации данного признака выражаются числами. Например, распределение занятых в экономике по
полу и возрасту. Это комбинационная группировка: атрибутивный признак – пол
(мужчины и женщины), количественный признак – возраст (моложе трудоспособного возраста, трудоспособного возраста, старше трудоспособного возраста).
По отношению между признаками:
Иерархическая – группировка, проводимая по двум и более признакам, при
этом область значений второго признака определяется областью значений первого.
Например, классификация видов экономической деятельности (ВЭД) по подвидам:
4
ВЭД 45 – Строительство
45.1 Подготовка строительного участка
45.2 Строительство зданий и сооружений
45.3 Монтаж инженерного оборудования зданий и сооружений
45.4 Производство отделочных работ
45.5 Аренда строительных машин и оборудования с оператором.
Неиерархическая группировка строится тогда, когда строгой зависимости
значений второго признака от первого не существует. Например, группировка
предприятий по форме собственности (Таблица 2).
Таблица 2 – Группировка предприятий по форме собственности
Форма собственности
Объем выпуска продукции, млн. руб.
Государственная
Собственность субъектов федерации
Муниципальная
Частная
По виду признака:
Качественная (группировка по атрибутивным признакам) – группировка,
в которой группировочный признак отражает определенные свойства объекта
исследования и записывается в виде текста (например, группировка населения
по уровню образования.
Пример: С 1 сентября 2013 г. в Российской Федерации в соответствии с
Федеральным законом «Об образовании в Российской Федерации» устанавливаются следующие уровни общего образования:
1) дошкольное образование;
2) начальное общее образование;
3) основное общее образование;
4) среднее общее образование.
Число групп в группировках по атрибутивным признакам ограничено количеством разновидностей признаков. В нашем примере число групп – 4.
Количественная – группировка, в которой группировочный признак выражается числом (например, группировка мигрантов по возрасту).
Если в качестве группировочного признака выступает количественная величина, то обязательно определяется интервал группировки – промежуток (разность)
между максимальным (верхней границей интервала) и минимальным (нижней
границей интервала) значениями признака в группе. Интервалы бывают:
Равные – интервалы, в которых величина интервала, в каждой группе одна и та же. Величина равного интервала рассчитывается по формуле:
5
i
xmax xmin R
,
k
k
(1)
где i – величина интервала;
xmax – наибольшее значение признака в изучаемой совокупности;
xmin – наименьшее значение признака в изучаемой совокупности;
R – размах вариации;
k – число образуемых групп. Число образуемых групп определяется в соответствии с целями и задачами исследования. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле (Стэрджесса):
k 1 3,321lg n ,
(2)
где n – число единиц в изучаемой совокупности. Число групп может быть только целым.
Пример: Сгруппировать работников (Таблица 3) по величине месячной
заработной платы.
Таблица 3 – Месячная заработная плата работников
В рублях
Номер
1
2
3
4
5
6
7
8
9
10
Заработная плата
8400
17200
16500
9100
9400
8700
10200
10140
12450
8200
Номер
11
12
13
14
15
16
17
18
19
20
Заработная плата
15860
14150
9800
11150
14850
15200
13650
13800
12600
9560
Номер
21
22
23
24
25
26
27
28
29
30
Заработная плата
15000
12650
14500
11150
13980
15400
13650
13340
11700
13750
Число групп с равными интервалами, на которое может быть разбита
данная совокупность, рассчитывается по формуле 2:
k 1 3,321lg 30 5.9 6 .
Величина интервала, рассчитанная по формуле 1, составит:
i
17200 8200
1500 .
6
С учетом полученных данных таблицу 3 можно представить в более компактном виде (Таблица 4)
6
Таблица 4 – Группировка работников по величине месячной заработной платы
В рублях
Месячная заработная плата, руб.
Число работников, чел.
8200 – 9700
4
9700 – 11200
5
11200 – 12700
6
12700 – 14200
7
14200 – 15700
5
15700 – 17200
3
Неравные – интервалы, в которых величина интервала в группах отличается, например, постепенно увеличивается (Таблица 5).
Таблица 5 – Распределение населения региона по величине среднедушевых
денежных доходов
В процентах
Все население
в том числе со среднедушевыми доходами в месяц, руб.
до 2000,0
2000,1 – 4000,0
4000,1 – 6000,0
6000,1 – 8000,0
8000,1 – 10000,0
10000,1 – 15000,0
15000,1 – 25000,0
Свыше 25000,0
100
1,7
10,5
15,2
14,6
12,3
20,6
16,7
8,4
Закрытые – интервалы, в которых четко определены верхняя и нижняя
границы интервала. В таблице 2 такие интервалы находятся в строках 2–6.
Открытые – интервалы, в которых отсутствует одна из границ интервала, верхняя или нижняя. Примером таких интервалов являются первая и последняя строка таблицы 5.
При проведении исследования для получения сопоставимых данных может возникнуть необходимость изменить полученную группировку путем объединения относительно мелких групп в более крупные или выделить наиболее
типичные из них. Такая процедура получила название перегруппировки или
вторичной группировки исходных данных.
Этапы группировки:
1) определяется цель исследования;
2) проводится сбор данных по совокупности объектов;
3) совокупность ранжируется по выбранному для группировки признаку;
4) выбирается интервал распределения совокупности и проводится ее деление
на группы;
7
5) определяются среднегрупповые показатели по группировочным и факторным признакам;
6) проводится анализ полученных средних величин, определяются взаимосвязь
и направления воздействия факторных показателей на исследуемый результат.
3. Статистические таблицы
Собранные и сгруппированные данные, полученные при проведении статистического наблюдения, обычно представляют в виде статистических таблиц.
Статистическая таблица – форма наглядного представления числовых
характеристик исследуемой статистической совокупности, позволяющая характеризовать размеры, структуру и динамику изучаемых явлений и процессов.
Основными элементами статистических таблиц являются:
Подлежащее таблицы – перечень отдельных или всех единиц совокупности либо их групп, которые количественно характеризуются в сказуемом.
Сказуемое таблицы – это показатели, с помощью которых дается характеристика явления или процесса.
В зависимости от строения подлежащего выделяют три вида статистических таблиц:
Простые таблицы – таблицы, в подлежащем которых содержится простой перечень отдельных единиц изучаемой совокупности (каких-либо объектов, хронологических дат или территориальных единиц). Например, список
групп факультета с указанием численности студентов, или данные о численности населения на определенную дату, численности населения по субъектам РФ.
Групповые таблицы – таблицы, в подлежащем которых исследуемая совокупность разделена на группы по какому-либо одному признаку. Групповой
является таблица 5, где население делится на группы по величине среднедушевых доходов.
Комбинационные таблицы – таблицы, в которых исследуемая совокупность разделена на группы по нескольким признакам (Таблица 6).
По построению сказуемого различают:
Простые таблицы – таблицы, сказуемое которых содержит расположенные друг за другом показатели (Таблицы 4-6).
Сложные таблицы – таблицы, сказуемое которых содержит показатели,
разделенные на группы по одному или нескольким признакам в определенном
сочетании Таблица 7).
8
Таблица 6 – Численность населения РФ по месту проживания и возрастным
группам в 2008–2012 гг.
В млн чел.
Показатель
2008
2009
2010
2011
2012
Все население
142748 142737 142857 142865 143056
В том числе:
Городское население
104865 104915 105314 105421 105742
Из общей численности – население в возрасте:
Моложе трудоспособного
15934
15903
16108
16182
16472
трудоспособном
66891
66613
65764
65725
65275
старше трудоспособного
22040
22399
23408
23514
23995
Сельское население
37883
37822
37543
37444
37314
Из общей численности – население в возрасте:
Моложе трудоспособного
6908
6951
7018
7027
7096
трудоспособном
22854
22729
22218
22122
21780
старше трудоспособного
8121
8142
8306
8295
8438
Источник: Официальный сайт Федеральной службы государственной статистики, 2013 г.
Таблица 7 – Наличие основных фондов в РФ в 2006–2011 гг. по формам
собственности на конец года по полной учетной стоимости
Год
все основные фонды
2006
2007
2008
2009
2010
2011*
47489498
60391454
74441095
82302969
93185612
108001247
Млн. руб.
в том числе
по формам собственности
государственная
10447690
14493949
15632630
16460594
18637122
19440224
негосударственная
37041808
45897505
58808465
65842375
74548490
88561023
все основные
фонды
100
100
100
100
100
100
В процентах к итогу
в том числе
по формам собственности
государственная
22
24
21
20
20
18
негосударственная
78
76
79
80
80
82
*) с учетом переоценки, проведенной коммерческими организациями на конец отчетного года
Источник: Официальный сайт Федеральной службы государственной статистики, 2013 г.
Статистические таблицы составляются учетом ряда правил:
1. Статистическая таблица должна быть компактной и содержать только те
данные, которые характеризуют исследуемое социально-экономическое явление или процесс в статике и динамике.
2. Таблица должна иметь название, отражающее объект, признак, время и место
совершения события.
9
3. Наименования строк и граф должны быть лаконичными. Графы желательно
нумеровать. Это позволяет показывать способ расчета чисел в графах, облегчает использование таблицы при ее расположении на нескольких листах.
4. Графы и строки должны содержать единицы измерения, для которых существуют общепринятые сокращения. Единицы измерения указываются в названии таблицы, если они одинаковы для всей таблицы.
5. Необходим логический порядок расположения данных, как в подлежащем,
так и в сказуемом.
6. Для удобства чтения и работы числа в статистической таблице следует проставлять в середине граф, строго одно под другим: единицы под единицами, запятая под запятой.
7. Округление чисел следует производить с одинаковой степенью точности (до
целого знака, до десятой доли).
8. При заполнении таблицы нужно использовать следующие условные обозначения:
(–) – при отсутствии явления пишется прочерк;
многоточие (…) или "нет сведений" – если нет информации о явлении;
знак Х – если изучаемое значение признака не имеет осмысленного содержания.
9. Для отображения очень малых чисел используют обозначение 0.0 или 0.00.
При необходимости дополнительной информации статистические таблицы сопровождаются сносками и примечаниями, в которых разъясняются,
например, сущность специфического показателя, примененной методологии и
т. д. Сносками пользуются для того, чтобы указать на ограничивающие обстоятельства, которые следует принять во внимание при чтении таблицы.
4. Графическое представление статистических данных
Наглядным способом представления статистических данных наряду со
статистическими таблицами являются графики.
Статистический график – это условное изображение статистических
данных в виде различных геометрических образов (точек, линий, фигур и т.д.).
Каждый график состоит из следующих элементов:
1) графический образ (основа графика) – это геометрические знаки, совокупность точек, линий, фигур, с помощью которых изображаются статистические величины;
2) поле графика – это то место, где расположены графические образы;
3) пространственные ориентиры, определяющие размещение геометрических
знаков на поле;
10
4) масштабные ориентиры, дающие этим знакам количественную определенность;
5) экспликация графика, включающая в себя его название и соответствующие
пояснения отдельных его частей (единицы измерения, территория, время.
Масштабные ориентиры статистического графика определяются масштабом и системой масштабных шкал. Масштаб статистического графика – это
мера перевода числовой величины в графическую. Масштабная шкала – это
линия, отдельные точки которой могут быть в соответствии с принятым масштабом прочитаны как определенное значение статистического показателя.
В зависимости от поставленных задач можно выделить следующие виды
статистических графиков:
1) графики сравнения статистических показателей;
2) графики структуры и структурных сдвигов;
3) графики динамики;
4) графики контроля выполнения плана;
5) графики пространственного размещения и пространственной распространенности (картограммы и картодиаграммы);
6) графики вариационных рядов;
7) графики зависимости варьирующих признаков.
По способу построения графики делятся на диаграммы и статистические
карты.
Виды диаграмм:
1. Линейные диаграммы используются для представления количественных переменных: характеристики вариации значений признака, для оценки динамики и выполнения плана, взаимосвязей между переменными.
Линейные диаграммы строятся в прямоугольной оси координат. Если они
строятся с целью анализа динамики, то по оси абсцисс (Х) откладываются отрезки, соответствующие датам или периодам или периодам времени, а по оси
ординат (У) – уровни ряда динамики или темпы их изменения. Каждая точка
линейной диаграммы соответствует уровню динамического ряда или темпу его
изменения на определенный момент времени. На одном графике может быть
размещено несколько диаграмм. Это позволяет динамику нескольких показателей, либо одного показателя по разным объектам исследования (странам, регионам, муниципальным образованиям и т.д.) (Рисунок 5).
Вариация данных анализируется с помощью полигона частот и гистограммы распределения, кумуляты (кривой «не меньше, чем») и огивы (кривой
«больше, чем»). Линейные графики используются в решении задач классификации данных, анализе динамики связей.
11
Различают одномерные и двумерные линейные графики. Одномерные
строятся для одной переменной (например, полигон распределения). Двумерные строят по двум переменным (например, линия регрессии).
ВРП на душу населения, тыс. руб
800
700
600
500
ВРП на душу населения,
ДФО
400
300
ВРП на душу населения
, Хабаровского края
200
100
2007
2008
2009
2010
2011
2012
Год
Рисунок 5 – Динамика ВРП на душу населения Хабаровского края и
ДФО в 2007–2012 гг.
Пример линейного графика с одной переменной приведен на рисунке 5.
2. Плоскостные диаграммы:
Столбиковые диаграммы, на которых показатель представляется в виде
столбика, высота которого соответствует значению показателя (Рисунок 6).
Столбики могут располагаться вплотную или на одинаковом расстоянии друг
от друга. По высоте столбиков определяют соотношение между уровнями различных показателей.
Чел.
3000
2000
Естественный
прирост,
убыль
1000
2007
-1000
2008
2009
2010
2011
2012 Год
Миграционны
й прирост,
отток
-2000
-3000
-4000
Рисунок 6 – Динамика естественного и механического движения населения
в Хабаровском крае в 2007-2012 гг.
12
страны - инвесторы
Часто на столбиковой диаграмме показываются относительные величины:
при сравнении показателей по группам, по разным совокупностям, одна из которых может быть принята за 100%. Пропорциональность площади той или
иной геометрической фигуры величине показателя лежит в основе других видов плоскостных диаграмм: треугольных, квадратных, прямоугольных. В треугольной диаграмме нужно так выбрать стороны и высоту треугольника, чтобы
его площадь отвечала величине показателя. Для построения квадратной диаграммы нужно задать размер одной стороны, прямоугольной – двух сторон.
Можно использовать и сравнение площадей круга; в этом случае задается радиус окружности.
Ленточная диаграмма представляет показатели в виде горизонтально вытянутых прямоугольников (Рисунок 9). Как столбиковые, так и ленточные диаграммы можно применять не только для сравнения самих величин, но и для
сравнения их частей. Особый тип ленточных диаграмм применяется для представления данных с разным характером изменений: положительным и отрицательным.
Германия
Виргинские острова…
Венесуэла
Япония
Вьетнам
Уганда
Канада
Швейцария
Сент-Китс и Невис
Китай
США
Корея, республика
Малайзия
Багамские острова
Кипр
20000
40000
60000
80000
100000
тыс. долл. США
Рисунок 9 – Объем поступивших инвестиций в экономику Хабаровского края
от стран-инвесторов в 2012г.
Из плоскостных диаграмм часто используется секторная диаграмма. Она
применяется для иллюстрации структуры изучаемой совокупности. Вся совокупность принимается за 100%, ей соответствует общая площадь круга, площади секторов соответствуют частям круга.
13
Наглядность изображения усиливают фигурные или картинные диаграммы (Рисунок 10).
рыболовство и
рыбоводство 7%
обрабатывающ
ие
производства
16%
оптовая и
розничная
торговля
5%
добыча
полезных
ископаемых и
геологоразведоч
ные работы
24%
сельское и
лесное хозяйство
24%
транспорт и
связь
24%
Рисунок 10 – Структура иностранных инвестиций по видам экономической
деятельности в 2012 г.
Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений. Они показывают размещение
изучаемого явления, его интенсивность на определенной территории – в республике, области, экономическом или административном районе и т.д. На картограмме распределение изучаемого признака по территории изображается
условными знаками (точками, штриховкой, цветом и т.д.), соответствующими
определенным интервалам значений величины этого признака. Эти знаки покрывают контур каждого района.
Картограмма применяется в тех случаях, когда возникает необходимость
показать территориальное распределение какого-нибудь одного статистического признака между отдельными районами для выявления закономерностей этого распределения.
Картограммы бывают фоновые и точечные. На фоновых картограммах
распределение изучаемого явления на территории изображается различной раскраской территориальных единиц с разной густотой цвета. Часто вместо раскраски применяется штриховка различной интенсивности. Такие картограммы
обычно используются для изображения уровня относительных и средних величин по территориям.
Точечная картограмма применяется для изображения абсолютных величин. Каждой точке, нанесенной на картограмму, придается числовое значение,
что позволяет использовать ее для прямого счета.