Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
СОДЕРЖАНИЕ
РАЗДЕЛ 1. СТАТИСТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ И ИХ
ОСНОВНЫЕ ХАРАКТЕРИСТИКИ 4
Глава 1.1. Ряды распределения 4
Глава 1.2. Графическое изображение вариационного ряда 8
Глава 1.3. Показатели вариации 11
Глава 1.4. Структурные средние 23
Глава 1.5. Показатели вариации качественных признаков 28
РАЗДЕЛ 2. РЯДЫ ДИНАМИКИ 34
Глава 2.1. Характеристика и классификация
динамических рядов 34
Глава 2.2. Показатели изменения уровней ряда динамики 36
Глава 2.3. Расчет среднего уровня ряда динамики 39
Глава 2.4. Смыкание рядов динамики 46
Глава 2.5. Анализ основной тенденции рядов динамики 47
3
РАЗДЕЛ 1. СТАТИСТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ И
ИХ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
Глава 1.1. Ряды распределения
Мы уже упоминали, что составной частью сводной обработки данных статистического наблюдения является построение рядов рас-пределения. С какой целью это делается?
Естественно, чтобы выявить основные свойства и закономерно-сти исследуемой статистической совокупности.
Вы встретили новое понятие – ряды распределения. Выясним, что это означает? Это статистический ряд, который представляет собой упорядоченное распределение единиц изучаемой совокупно-сти на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают: атрибутивные (качественные) и ва-риационные (количественные – по возрастанию или убыванию) ряды.
Например, распределение персонала предприятия по уровню образования – это атрибутивный ряд.
Все другие ряды, содержащие числовые показатели называют вариационными.
Вариационный ряд распределения состоит из двух элементов: вариант и частот. Количественные значения признака в вариацион-ном ряду распределения называются вариантами и обозначаются x .
Частоты – это числа, показывающие сколько раз в совокупности встречается данное значение признака, и обозначаются f .
Например, зарплаты четырех сотрудников фирмы соответствен-но равны 300; 400; 300; 500 долл. Получается, что x принимает зна-чения: 300; 400; 300; 500. А частота f соответственно принимает значения: 2;1;1.
Сумма всех частот равна численности всей совокупности. В на-шем случае численность всей совокупности – сотрудников фирмы равна четырем и она же равна сумме частот (2+1+1)=4.
4
◦ вариационных рядах используют понятие частости – это ча-стоты, выраженные в процентах к итогу или в долях. Сумма всех ча-стостей, выраженных в процентах, равна 100%, в долях она равна 1. В нашем примере частость 2 равна 50% или 1/2.
◦ зависимости от характера вариации признака вариационные ряды распределения подразделяются на дискретные и интерваль-ные.
Дискретным называют такой вариационный ряд, который пред-ставлен целыми числами (например, число детей в семье).
Когда значения признака выражены в виде интервалов – это интервальный ряд.
Вариационные ряды распределения представляют в виде табли-цы, состоящей из двух колонок. В первой колонке приводятся отдель-ные значения варьирующего признака, т. е. варианты. Во второй – числа, показывающие, сколько раз в совокупности встречается данная варианта, т. е. частоты.
Например, проведя обследование 20 семей сотрудников фирмы, выяснялось, что количество детей в этих семьях представляет собой следующий ряд: 0 1 2 3 1 2 3 4 1 0 1 2 1 1 0 3 1 2 1 4.
Какой вариационный ряд мы здесь можем построить, дискрет-ный или интервальный?
Поскольку значения признака представлены в виде целых чисел, построим дискретный ряд распределения. А мы ранее говорили, что это значит, нам необходимо построить таблицу, состоящую из двух ко-лонок. В первой колонке будет число детей, а во второй мы подсчетом определяем сколько раз это число встречается, т. е. частоту этого чис-ла. Например, подсчитав, в скольких семьях нет детей из всей рассмат-риваемой совокупности в 20 человек, мы определили, что это три се-мьи. Аналогично поступаем со всеми остальными количествами детей.
• результате получаем такой дискретный ряд распределения, который задан таблицей 1.1.
5
Таблица 1.1. Распределение 20 семей по количеству детей
Число детей
Число семей
3
1
8
2
4
3
3
4
2
Итого:
20
Для графического изображения дискретного вариационного ряда применяется полигон распределения, который можно построить вручную, а лучше, если воспользоваться возможностями электронных таблиц Excel. Полигон (от греч. – «многоугольник») применяется для изображения как дискретных, так и интервальных рядов (если предва-рительно привести его к дискретному).
При этом по оси абсцисс откладываются варианты, а по оси ор-динат – частоты или частости. Т.е., на плоскости необходимо по-строить точки с координатами (0;3), (1;8), (2;4), (3;3), (4;2) и соеди-нить эти точки отрезками. В результате, полученная ломаная называ-ется полигоном.
Естественно, строить полигон вручную уже неэтично. Восполь-зуемся возможностями информационных технологий, в частности приложением Excel.
После загрузки программы Excel, вводите последовательно все элементы предыдущей таблицы в ячейки программы Excel вместе с заголовком (не вводите строку «Итого»). Затем выделяете эту таблицу вместе с заголовком, и в меню Вставка программы Excel выбираете команду Диаграмма. В загрузившемся диалоговом окне Мастера диаграмм, на вкладке Нестандартные, выбираете Графики (2 оси) и, кликнув на команду Готово в этом диалоговом окне, получаете по-лигон, представленный на рис. 1.1.
6
Рисунок 1.1. Полигон распределения
В качестве интервального вариационного ряда рассмотрим рас-пределение 30 рабочих хлебокомбината по размеру зарплаты (см. табл. 1.2). В эту таблицу внесли зарплату рабочих с интервалом в 5 тыс. руб. и число таких рабочих для каждого интервала. Для графического изображения интервального вариационного ряда применяется гисто-грамма – график, на котором ряд распределения изображен в виде смежных друг с другом столбиков. Гистограмму можно построить как вручную, так и уже рассмотренным методом с помощью программы Ex-cel. Только на этапе выбора типа диаграммы нужно указать Гистограм-ма. При ручном способе построения на оси Ox откладываются величи-ны интервалов, а частоты изображаются прямоугольниками, построен-ными на соответствующих интервалах. В случае равных интервалов вы-сота столбиков должна быть пропорциональна частотам. Гистограмма применяется для наглядности изображения. Обратите внимание на стол-бец (графу) «накопленные частоты». Накопление – добавление к тому, что было ранее того, что получили. Например, почему в строке с зарпла-той от 5 до 10 тыс. руб. накопленная частота равна 15?
Потому, что количество вариант со значением от 5 до 10 тыс. руб. равно 12, а предыдущая частота равна 3. Тогда накопленная ча-стота и получается равной 15. Аналогично пройдитесь по всему столбцу «накопленные частоты» и увидите, что рассуждения ко всем
7
его остальным строкам аналогичны тем, что мы с вами только что провели.
Построив гистограмму самостоятельно, вы убедитесь, что ее вид совпадает с тем, что представлен на рис. 1.2.
Таблица 1.2. Распределение 30 рабочих по размеру месячной заработной платы
Заработная плата,
Число рабочих,
Накопленные частоты,
руб. в месяц, x
чел., f
S
До 5 000
3
3
5 000 – 10 000
12
15
10 000 – 15 000
10
25
15 000 – 20 000
5
30
Итого:
30
-
30
25
20
15
Число рабочих, чел., f
Накопленные частоты, S
10
5
До 5000
5000 – 10000
10000 – 15000
15000 – 20000
Рисунок 1.2. Гистограмма
Глава 1.2. Графическое изображение вариационного ряда
Естественно, для статистики наибольший интерес представляют вариационные ряды. Например, фирма занимается изготовлением мо-дулей для мебели. Численность фирмы и выработка продукции за ме-сяц представлена таблицей 1.3.
8
Таблица 1.3. Распределение рабочих по выработке
Выработка, м (x)
Число рабочих (f)
Накопленные частоты (S)
до 200
3
3
200 – 220
12
15
220 – 240
50
65
240 – 260
56
121
260 – 280
47
168
280 – 300
23
191
300 – 320
7
198
свыше 320
2
200
Итого:
200
-
Проанализируем эту таблицу, предлагая вам самостоятельно по-
строить по ней гистограмму. Ее вид должен совпадать с тем, что пред-
ставлен на рис. 1.3.
Норма выработки рабочих
60
50
40
30
20
10
до 200
200 – 220
220 – 240 240 – 260 260 – 280 280 – 300 300 – 320 свыше 320
Рисунок 1.3. Гистограмма «Норма выработки рабочих»
Если вы попытаетесь ее сравнить с предыдущей гистограммой, то последняя гистограмма имеет большую тенденцию перехода в плавную кривую, которую в статистике так и называют кривой распределения. Что характеризует кривая распределения?
9
Она характеризует вариацию признака и закономерности распреде-ления частот внутри однокачественной совокупности (речь идет о норме выработки модулей рабочими за один и тот же период).
В ряде случаев для изображения вариационных рядов использу-ется кумулятивная кривая (кумулята).
Для ее построения необходимо вычислить накопленные частоты и частости. В нашем примере накопленные частоты уже вычислены (вто-рой столбец табл. 1.3). Мы рассматриваем интервальный ряд, а при по-строении кумуляты интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней – вся частота данного интервала (в нашем случае она равна 200). Верхней гра-нице второго интервала соответствует накопленная частота, равная сум-ме частот первых двух интервалов, и т. д. Построим кумуляту, пользуясь приложением Еxcel по той же схеме, которой мы пользовались при по-строении гистограммы. Но только теперь нам ее надо строить по двум крайним столбцам таблицы 1.3. Загружаете Еxcel, вводите по двум со-седним столбцам те данные, которые составляют первый и последний столбцы таблицы 1.3 без строки «Итого». Затем выделяете эту таблицу вместе с заголовком, и в меню Вставка программы Excel выбираете ко-манду Диаграмма. В загрузившемся диалоговом окне Мастера диа-грамм на вкладке Нестандартные выбираете Графики (2 оси) и, клик-нув на команду Готово в этом диалоговом окне, получаете ту кривую, которую называют кумулята. Ее вид представлен на рис 1.4. Естествен-но у вас возник вопрос: «Как часто используют изображение вариаци-онного ряда в виде кумуляты?» Ответ: «При необходимости анализа концентрации производства».
10
Кумулята
210
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
до 200
200 – 220
220 – 240
240 – 260
260 – 280
280 – 300
300 – 320
свыше 320
Рисунок 1.4. Кумулята
Глава 1.3. Показатели вариации
Читая и разбирая курс, у вас, возможно, возник вопрос: «Почему необходимо измерять вариацию, разве недостаточно тех средних, ко-торые мы очень подробно рассмотрели?»
В этой главе мы попытаемся на этот вопрос ответить.
И хотим этот ответ проиллюстрировать с помощью рассказа Глеба Успенского «Четверть лошади».
«В деревне Присухине школа имеет тридцать учеников, в де-ревне Засухине – 20, а в деревне Оплеухине – 2. Из этого изволите ви-деть, следует средний вывод, что средним числом на школу – по 17 человек. Это все равно, ежели бы я взял миллионщика Колотушки-на, присоединил бы к нему просвирню Кукушкину, у которой в карма-не гроши, – тогда в среднем выводе на каждого и вышло бы по полу-миллиону».
Из этого примера видно, как важно оценить типичность средней для изучаемых единиц совокупности. Средняя величина характеризу-
11
ет совокупность по изучаемому признаку и такой характеристики со-вокупности будет достаточно, если разброс индивидуальных значений невелик.
Если же ряд характеризуется значительным рассеиванием инди-видуальных значений, то применение средней величины ограничено. А как быть в таких ситуациях?
При значительном рассеивании индивидуальных значений необходимо рассчитать специальную систему показателей, характе-ризующих средний размер отклонений индивидуальных значений от средней величины и степень колеблемости признака в совокупности,
• е. показателей вариации.
◦ снова, как и для любых показателей статистики, показатели вариации используют двух типов (групп): абсолютные и относитель-ные. Какие показатели относят к абсолютным показателям вариации?
К абсолютным показателям вариации относят – размах вариа-ции, среднее линейное отклонение, дисперсия, среднеквадратическое отклонение.
Какие относят к относительным показателям вариации?
Это – коэффициент осцилляции, линейный коэффициент и ко-эффициент вариации.
Попытаемся разобраться с этими показателями. Начнем с рассмотрения абсолютных показателей, в частности – с размаха вариа-ции.
В самом названии этого показателя кроется его смысл. Ведь размах – это разность. Но разность между чем и чем? В случае пока-зателей вариации – разность между экстремальными значениями признака в совокупности. Например, по таблице 1.3 размах вариации относительно выработки модулей равен 120, т.к. (320-200=120). А что собой представляет единица измерения этого показателя?
Но и с этим должно быть все ясно. Ведь если из стульев вычи-тать стулья, то и в ответе получатся стулья. Т. е. единица измерения размаха вариации совпадает с единицей измерения признака у единиц совокупности. (В нашем примере, из модулей вычитаем модули, в ре-
12
зультате снова получим модули). И если мы запишем наши мысли в виде формулы, то она будет иметь вид:
R= xmax−x min , (1.1)
где R – размах вариации;
• max – максимальное значение признака в совокупности;
• min – минимально значение признака в совокупности.
Безусловным достоинством этого показателя является простота расчета. Однако размах вариации зависит от величины только крайних значений признака и не учитывает промежуточные значения, поэтому область его применения ограничена достаточно однородны-ми совокупностями. В чем и заключается недостаток размаха вариа-ции.
В частности, на практике он находит применение в предупреди-тельном контроле качества продукции.
Недостаток размаха вариации устраняет показатель среднего линейного отклонения. Среднее линейное отклонение вычисляется как средняя арифметическая из абсолютных значений отклонений ва-риант xi и среднего x . Среднее линейное отклонение рассчитывает-ся по двум формулам простой и взвешенной. Еще раз вспомним, когда мы пользуемся простой средней арифметической, а в каких случаях взвешенной?
Если данные не сгруппированы, то используем простую сред-нюю арифметическую (сумму индивидуальных показателей делим на количество таких показателей), и тогда формула среднего линейного отклонения примет вид
d = ∑∣xi− x∣ . (1.2) n
Если данные сгруппированы, то пользуемся средней арифмети-ческой взвешенной.
d = ∑∣xi− x∣⋅f i . (1.3)
∑ f i
13
Мы выяснили, что в числителе этих двух формул присутствует одно и то же общее выражение – разность конкретного индивидуаль-ного значения исследуемой величины и среднего значения этой сово-купности. Но почему эта разность взята по модулю (вертикальные скобки)? Дело в том, что сумма отклонений значений признака от средней величины равна нулю. Поэтому вынуждены разность брать по модулю.
По поводу значения f i – мы уже много раз говорили, что это вес i -ого варианта. Тогда знаменатель – сумма таких весов.
У среднего линейного отклонения есть единица измерения, она совпадает с единицей измерения индивидуальных показателей – вари-ант. Значит, если мы из килограммов будем вычитать килограммы, то и среднее линейное отклонение будет измеряться в килограммах.
Среднее линейное отклонение обладает серьезным недостатком: в числителе нет минуса, а сам показатель – положительное число. Эта проблема решается третьим и четвертым показателями вариации – дис-персией и среднеквадратическим отклонением.
Переходим к рассмотрению третьего абсолютного показателя вариации – дисперсии. Слово это вам известно из курса школьной фи-зики как рассеивание света, из высшей математики (теории вероятно-стей) – как числовая характеристика математического ожидания (среднего значения).
И в статистике, как и в теории вероятностей, эта величина слу-жит для характеристики показателя среднего значения. Остановимся на его рассмотрении.
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Она рас-считывается по простой и взвешенной формулам. Для ее обозначения используется греческая буква сигма. Но раз мы сказали, что диспер-сия – это средний квадрат отклонений, то и берется сигма в квад-рате.
Простая дисперсия определяется формулой 1.4.
σ 2= ∑ xi− x 2 . (1.4) n
14
Взвешенная дисперсия определяется формулой 1.5.
• 2= ∑ xi − x 2⋅f i . (1.5)
◦ f i
Еще раз обращаем ваше внимание на совершенную простоту вычисления этого показателя – дисперсии. Мы разобрались с вычис-лением среднего линейного отклонения – это разность индивидуаль-ного и среднего значений. Но теперь вы каждую разность индивиду-ального и среднего значений возводите в квадрат. Суммируете все
квадраты полученных разностей – это вы вычислили ∑ xi−x 2 , т. е.
числитель формулы (1.4), а теперь разделив получившееся число на количество показателей – вариант, мы найдем дисперсию. Для сгруп-пированных данных мы вычисляем дисперсию взвешенную, т.е. поль-зуемся формулой (1.5). А по этой формуле мы уже вычисленную
∑ xi−x 2 умножаем на значение веса и делим результат на сумму та-
ких весов.
Чуть позже мы произведем расчет всех рассмотренных показа-телей на примере таблицы 1.3.
Недостаток дисперсии состоит в том, что она имеет размерность вариант, возведенную в квадрат (рублей в квадрате, человек в квадра-те). Чтобы устранить этот недостаток, используется среднее квадра-тическое отклонение.
Итак, дисперсия есть средняя величина квадратов отклонений. В данном случае варианты признака выражены в первой степени, зна-чит, и мера их вариации должна быть взята в первой степени. Для это-го достаточно извлечь из дисперсии корень второй степени, получится среднее квадратическое отклонение ( σ ) – сигма. А, значит, и форму-лы для вычисления среднего квадратического отклонения будут отли-чаться от формул (1.4) и (1.5) только тем, что извлекается из них ко-рень квадратный. Естественно, что среднее квадратическое отклоне-ние вычисляют простое и взвешенное, что задается соответственно формулами (1.6) и (1.7). Еще раз обращаем ваше внимание на тот
15
факт, что в расчетах эти формулы не столь «страшны», как в их напи-сании. И Вы скоро в этом убедитесь.
◦ = ∑ xni−x 2 . (1.6)
• = ∑ xi−x 2⋅ f i . (1.7)
▪ f i
Значит, для вычисления среднего квадратического отклонения необходимо извлечь квадратный корень из величины дисперсии, учи-тывая, по простой или взвешенной мы считали дисперсию. Все не сложно, несмотря на величественность и кажущуюся непонятность расчетных формул.
Итак, среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Сред-нее квадратическое отклонение выражается в тех же единицах изме-рения, что и признак (в метрах, тоннах, рублях, процентах, модулях, как в таблице 1.3).
Нужны ли эти показатели меры вариации и где они применяют-
ся?
Да, они являются общепринятыми и часто используются в ста-тистических исследованиях. Они широко используются в междуна-родной практике учета и статистического анализа, в частности в си-стеме национального счетоводства.
А теперь рассмотрим практически вычисление всех четырех рассмотренных абсолютных показателей вариации на примере задачи. Мы уже говорили, что в Курске действует предприятие по выпуску упа-ковочного материала: пленка, пакеты и т. д. При предприятии существу-ет магазин по продаже его продукции и ряд торговых точек, которые есть во многих супермаркетах города. В бухгалтерию предприятия по-ступают сведения и деньги от этих торговых точек. Пусть таких пред-приятий будет 20. Выручка от каждого из них разная: от 3,7 до 8,2 млн. руб. за месяц (смотри первый столбец табл. 1.4). Эти сведения пришли в бухгалтерию, и вы пытаетесь с ними разобраться, чтобы доло-
16
жить на совещании о результатах работы этих торговых точек. Мы ска-зали, что выручки торговых точек разные, и первое, что вы сделали, это осуществили группировку предприятий по размерам выручки. Вы созда-ете сводную таблицу, в которую помещаете сгруппированные данные по размеру выручки и указываете столбец с числом торговых точек, у кото-рых размер выручки из выбранного вами интервала. Теперь дополняете таблицу теми столбцами, которые нам помогут выполнить расчет всех рассмотренных нами показателей вариации. Зададим столбец 3, назовем
его x 'i . В него мы поместим середины интервалов по исходным дан-
ным. Так как для первой рабочей строки таблицы размер выручки в ин-тервале от 3,7 до 4,6 млн. руб., то средина этого интервала найдется как сумма этих значений, деленная пополам, т.е. (3,7+4,6):2=4,15. Значение признака, совпадающее с верхней границей, включается в следующий интервал. Это связано с тем, что верхняя граница последнего интервала 5,5 больше максимального значения в данной совокупности.
Аналогично вычислим середины всех остальных промежутков. В следующий столбец мы поместим произведение середины интерва-ла на число вариант (торговых точек). Для первой рабочей строки это произведение найдется как 4,15х2=8,30. И заполним весь этот столбец по такой же схеме до конца. Теперь мы можем определить среднее значение выручки, пользуясь средней арифметической взвешенной. А значит, вам нужно просуммировать столбец 4, т. е. тот, где мы опреде-ляли произведения середин интервалов выручки на число торговых точек из этого интервала. А значит, вам понадобится строка «Итого» в вашей таблице. В результате суммирования мы получили значение
x 'i⋅f i=121 , 70 . Число вариант – количество торговых точек (у нас их
20). Разделив по формуле (1.3) средней арифметической взвешенной 121,70 на 20 , получим среднюю выручку торговой точки за месяц.
В нашем случае x =12120 ,70 =6,085 млн. руб.
Чтобы вычислить среднее линейное отклонение, нужно найти разность между значением каждого индивидуального признака и сред-
17
ним значением. А это означает, что нам необходим еще один столбец
– пятый, в него мы и поместим x 'i−x .
Для первой рабочей строки таблицы получим x 'i−x=4,15−6,085=−1,935 .
Аналогично вычисляем все остальные строки этого столбца. При вычислении среднего линейного отклонения по формуле 1.3 нужно взять получившиеся в пятом столбце разности по модулю, т. е. они все будут положительными, и умножить каждую строку пя-того столбца на число вариант в соответствующей строке. Итак,
необходим шестой столбец, в него мы будем заносить
∣x'
−x∣⋅f
i .
i
Теперь осталось просуммировать столбец
∣x '
−x∣⋅f
i
и по форму-
i
ле 1.3 разделить получившуюся сумму на число вариант, т. е. 20.
В результате получилась величина среднего линейного откло-нения
d =1720 , 640 =0,882 млн. руб.
Что нам показывает эта величина? Она говорит нам, на сколько в среднем колеблется величина признака у единиц исследуемой сово-купности. В данном примере средняя величина колеблемости разме-ра выручки по среднему линейному отклонению 0,882 млн. руб.
Далее мы будем определять дисперсию. А это значит, нужно в
таблицу добавить столбец
x '
− x
2
– появляется седьмой стол-
⋅f
i
i
бец таблицы. Как мы уже говорили, здесь все просто. Нужно взять разность, которая нами уже определена по пятому столбцу, возвести ее в квадрат и умножить на число вариант этой строки, т. е. −1,935 2⋅2=7,489 – это значение получится в первой строке седь-мого столбца. Аналогично вычисляем все остальные строки этого столбца.
Вспоминаем, что дисперсия – это средняя из квадратов отклоне-ний. Квадраты отклонений мы вычислили. А чтобы найти среднюю, мы
18
все значения столбца 7 суммируем и делим на число вариант, т. е. на число 20. В результате у нас получается значение дисперсии
σ2=2320 , 126 =1,156 млн. руб. в квадрате.
Значит, сама процедура вычислений не сложна. Нужно просто очень внимательно вчитываться в текст и работать на листе с каран-дашом, проводя все рассуждения вслед за нами. Ничего не будет сложного, если Вы хотя бы один раз вычислите самостоятельно все показатели вариации.
А теперь все наши рассуждения оформим в таблицу 1.4. Для компактности заголовка таблицы столбцы 3 – 7 мы оформили под об-щим заголовком – расчетные показатели.
Таблица 1.4. Расчет показателей вариации
Размер
Число
Расчетные показатели
прибыли,
торговых
x
'
'
x
'
− x
∣x
'
− x∣⋅ f
'
2
x ⋅ f
i
i
x − x
⋅ f
млн. руб.
точек
i
i
i
i
i
i
1
2
3
4
5
6
7
3,7
– 4,6
2
4,15
8,30
-1,935
3,870
7,489
4,6
– 5,5
4
5,05
20,20
-1,035
4,140
4,285
5,5
– 6,4
6
5,95
35,70
-0,135
0,810
0,109
6,4
– 7,3
5
6,85
34,25
0,765
3,825
2,926
7,3
– 8,2
3
7,75
23,25
1,665
4,995
8,317
Итого:
20
-
121,70
-
17,640
23,126
Но мы не вычислили еще один абсолютный показатель вариации – среднее квадратическое отклонение. Вычислим его извлечением квадрат-ного корня из дисперсии, т. е. σ = 1,156=1,075 млн. руб.
Среднее квадратическое, как и среднее линейное отклонение, показывает на сколько в среднем колеблется величина признака у еди-ниц исследуемой совокупности – 1, 075 млн. руб.
Среднее квадратическое отклонение показывает как располо-жена основная масса единиц совокупности относительно средней арифметической. Следует заметить, что среднее квадратическое от-клонение всегда больше среднего линейного отклонения. Еще раз от-носительно нашего примера: средняя величина колеблемости разме-ра выручки по среднему линейному отклонению составляет
19
0,882 млн. руб., а по среднему квадратическому отклонению она со-ставляет 1, 075 млн. руб.
Перейдем к рассмотрению относительных показателей вариа-
ции.
В начале этой главы мы уже сказали о том, что к относительным показателям вариации относят коэффициент осцилляции, линейный коэффициент и коэффициент вариации.
Относительные показатели вариации применяются для решения следующих задач:
• сравнение степени вариации различных вариационных рядов;
• характеристика степени однородности совокупности. Относительные показатели вариации вычисляются как отноше-
ние абсолютных показателей к среднему арифметическому.
Итак, начнем с рассмотрения коэффициента осцилляции. Он ра-вен отношению размаха вариации к среднему арифметическому и вы-ражается в процентах.
Если вспомнить, что размах вариации мы обозначали как R , среднее значение как x , то обозначив коэффициент осцилляции как K R , получим формулу для его вычисления.
K R= Rx⋅100% . (1.8)
Коэффициент осцилляции отражает относительную колебле-мость крайних значений признака относительно среднего значения.
Относительное линейное отклонение представляет собой отно-шение среднего линейного отклонения к среднему значению и выра-жается в процентах.
Так как среднее линейное отклонение мы обозначали через d , то формула относительного линейного отклонения примет вид:
K d = dx ⋅100% . (1.9)
Наиболее часто применяемый показатель относительной колеб-лемости – коэффициент вариации. Он равен отношению среднего квадратического отклонения к среднему значению и выражается в
20
процентах. С учетом наших обозначений формула для подсчета коэф-фициента вариации примет вид:
v= σx⋅100% . (1.10)
Коэффициент вариации характеризует долю усредненного зна-чения отклонений от средней величины.
Коэффициент вариации используют не только для сравнитель-ной оценки вариации, но и для характеристики однородности сово-купности.
Принято считать, совокупность считается однородной, если ко-эффициент вариации не превышает 33%. В противном случае либо ис-ключаются крайние значения признака, либо разбивают совокупность на однородные группы.
В случае рассмотренного нами примера с торговыми точками (табл. 1.4) по реализации упаковочных пакетов коэффициент вариа-
ции будет равен v= 1,0756,085⋅100 %=17,7 % Основываясь на получен-ном значении коэффициента вариации можно сделать вывод, что по размеру выручки совокупность торговых точек является однородной.
Вычислим и другие относительные показатели вариации на при-мере табл. 1.4.
Коэффициент осцилляции будет равен
K R=
R
8,2−3,7
⋅100 %=
6,085 ⋅100 %=73,95 % .
x
Обратите внимание на выражение, стоящее в числителе коэффи-
циента осцилляции – оно представляет собой размах вариации. Как мы его определяем в нашем случае (табл. 1.4)?
Так как размах – это разность между экстремальными (макси-мальными и минимальными) значениями, то по табл. 1.4 максималь-ная выручка составила 8,2 млн. руб., а минимальная выручка состави-ли 3,7 млн. руб.
Относительное линейное отклонение будет равно K d = dx⋅100 %= 0,8826,085⋅100 %=14,5 % .
21
• условиях нормального распределения существует зависимость между величиной σ и количеством наблюдений, эта зависимость выра-жается в статистике в правиле трех сигм. Рассмотрим его.
Правило трех σ
• пределах x±σ располагается 68,3% наблюдений.
• пределах x±2σ располагается 94,5% наблюдений.
• пределах x±3σ располагается 99,7% наблюдений.
На практике почти не встречаются отклонения, которые превы-шают 3σ . Отклонение в 3σ может считаться максимальным. При по-мощи этого правила можно получить примерную оценку σ .
σ = xmax−xmin . (1.11) 6
Если статистическая совокупность разбита на группы по како-му-либо признаку, то для оценки влияния различных факторов, опре-деляющих колеблемость индивидуальных значений признака, можно воспользоваться разложением дисперсии на составляющие: на меж-групповую и внутригрупповую дисперсии.
Если рассчитать дисперсию признака по всей изучаемой сово-купности, т. е. общую дисперсию σ 2 , то полученный показатель бу-дет характеризовать вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокуп-ности. Если же поставить дальнейшую задачу – выделить в составе общей дисперсии ту ее часть, которая обусловлена влиянием како-го-либо определенного фактора, то следует разбить изучаемую сово-купность на группы, положив в основу группировки интересующий нас фактор. Затем нужно изучить раздельно вариацию признака вну-три однородных в отношении данного фактора групп и изменения в величине признака от группы к группе. Выполнение такой группиров-ки позволяет разложить общую дисперсию признака на две диспер-сии, одна из которых будет характеризовать часть вариации, обуслов-ленную влиянием фактора, положенного в основу группировки, а вто-рая – вариацию, происходящую под влиянием прочих факторов (кро-ме фактора, положенного в основу группировки).
22
Межгрупповая дисперсия (дисперсия групповых средних или факторная дисперсия) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием одного фактора, положенного в основание группировки. Межгрупповая дисперсия является мерой колеблемости частных сред-них по группам x j вокруг общей средней x 0 и вычисляется по фор-муле:
2
x
− x
2⋅n
j
σ
=
∑ j
, (1.12)
∑ n j
где n – число групп;
n j
– число единиц в j -й группе;
j
– частная средняя по j
-й группе;
x
– общая средняя по совокупности единиц.
x
Давайте поговорим по поводу формулы межгрупповой диспер-сии. Она не сложна, если вы разобрались, как мы вычисляли взвешен-ную дисперсию по всей совокупности признака. В случае межгруппо-вой дисперсии находится разность между средней конкретной группы и средним значением совокупности. Для взвешенной дисперсии мы нахо-дили разности между конкретным значением совокупности и средним значением. В обоих случаях разности, найденные для каждой группы или для каждого индивидуального значения после возведения в квад-рат, мы суммируем. Затем для взвешенной дисперсии мы получившую-ся сумму умножаем на вес и делим на сумму весов всей совокупности. А для межгрупповой дисперсии мы получившиеся суммы умножаем на число единиц в конкретной группе и делим на сумму таких групп. Важ-но помнить, что ∑ n j =∑ f i .
Вариацию, обусловленную влиянием прочих факторов, характе-ризует в каждой группе внутригрупповая дисперсия σ 2j .
Внутригрупповая (средняя из групповых или остаточная) диспер-сия характеризует случайную вариацию, т. е. ту часть вариации, кото-рая вызвана действием других неучтенных факторов, и не зависящую от фактора, положенного в основание группировки.
23
σ 2
= ∑
x
− x 2
ij
i
. (1.13)
j
n j
Но если вести речь о совокупности в целом, то вариация значе-ний признака под влиянием прочих факторов характеризуется средней из внутригрупповых дисперсий, которая находится по формуле сред-ней взвешенной.
−
2
2
∑ σ j⋅n j
σ
=
. (1.14)
∑ n j
Между общей дисперсий σ 20 , средней из внутригрупповых дис-
−
персий σ2 и межгрупповой σ2 дисперсиями существует соотношение,
определяемое правилом сложения дисперсий. Согласно этому прави-лу, общая дисперсия равна сумме средней из внутригрупповых и меж-групповой дисперсий:
−
σ 20=σ2 σ2 . (1.15)
Глава 1.4. Структурные средние
Для характеристики среднего значения признака в вариацион-ном ряду используются средняя арифметическая, мода и медиана. Мода и медиана – вспомогательные характеристики изучаемой ста-тистической совокупности. Напомним, что для дискретного ряда рас-пределения средняя арифметическая рассчитывается по формуле
(1.3) x= ∑ xi⋅ f i .
∑ f i
В интервальном вариационном ряду значение средней величины рассчитывается по формуле внешне мало отличающейся от формулы (1.3).
В числителе формулы вместо xi – варианты значений признака берется середина соответствующего интервала. Вспомните пример с торговыми точками, сдающими разные выручки от реализации упако-
24
вочного материала. Рассмотрим расчет показателей центра распреде-ления для вариационных рядов.
Вычисляя среднюю арифметическую для дискретного или вариа-ционного ряда, мы берем в рассмотрение все значения или середины всех интервалов. Мода и медиана – это характеристика исследуемой ве-личины в конкретной ее точке. Мы неоднократно подчеркивали, что ма-тематика является инструментом исследования статистики. И в этом случае проведем параллель с математикой.
В частности, медианой треугольника в математике называют от-резок, проведенный из вершины угла к середине противоположной стороны, т. е. ключевым словом здесь выступает середина стороны треугольника.
◦ в статистике медиана (Me) соответствует варианту, стоящему
• середине ранжированного ряда. Слово ранжированный вам долж-но быть понятно – расположены элементы ряда (варианты значений) по порядку (рангу), например, по возрастанию.
Положение медианы определяется ее номером.
N Me=
n 1
,
(1.16)
2
где n – число единиц в совокупности.
Например, в одном из цехов предприятия по выпуску упако-вочного материала, трудится 190 человек – это рабочие разной ква-лификации, и соответственно, разных тарифных разрядов. Это рас-пределение рабочих предприятия по тарифному разряду представле-но табл. 1.5.
Таблица 1.5. Распределение рабочих предприятия по тарифному разряду
Тарифный разряд
Численность рабочих,
человек
2
12
3
48
4
56
5
60
6
14
Всего:
190
25
Найдем номер медианной единицы ряда по формуле (1.16). В соответствии с табл. 1.5 получим
N Me= n 1 =190 1 =95 ,5 . 2 2
Полученное дробное значение, которое всегда получается при четном числе вариант (единиц совокупности) указывает, что середина находится между 95 и 96 рабочими. Необходимо определить, к какой группе относятся рабочие с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты, очевидно, что рабочих с этими номерами нет в первой группе, где всего лишь 12 человек, нет их и во второй группе (12+48=60). Рабочие с номерами 95 и 96 нахо-дятся в третьей группе, т. к. 12+48+56=116, следовательно, медиан-ным является 4 разряд.
Если вернуться к понятию «мода» в том смысле, в каком мы при-выкли его определять, то это что-то наиболее часто встречающееся. Ана-логично и в статистике. Мода ( M o )– наиболее часто встречающееся (по-вторяющееся) значение признака в совокупности.
Если вернуться к примеру в табл. 1.5, то наибольшая числен-ность рабочих равна 60. Т.е. наибольшая частота равна 60, и она со-ответствует рабочим с пятым разрядом. Следовательно, пятый разряд
• является модальным.
◦ этих примерах мы показали, как найти моду и медиану для сгруппированных данных в дискретных вариационных рядах.
Если ряд не является сгруппированным, то определяют в этом ряду, какое значение индивидуального признака чаще встречается. Это значение и будет модальным.
Например, в одном из отделов фирмы трудится 7 человек. Стаж работы сотрудников этого отдела задается следующим рядом: 2; 4; 4; 5; 2; 4; 6. Так как в этом отделе больше всего сотрудников со стажем рабо-ты в 4 года, то это значение и будет модальным.
Чтобы определить медиану в этом ряду необходимо ранжиро-вать ряд: 2; 2; 4; 4; 4; 5; 6. Центральным в этом ряду будет сотрудник со стажем работы в 4 года. Этот ряд и будет медианным.
26
Если в ранжированном ряду четное число единиц, то медиана определяется как средняя из двух центральных значений. Пусть, к при-меру, уволился из отдела фирмы сотрудник со стажем работы в 4 года. Тогда, ранжированный ряд будет иметь вид: 2; 2; 4; 4; 5; 6. Вычислим медианное значение стажа, оно будет равно (4+4):2=4.
В интервальном ряду мода и медиана рассчитываются на основе
формул:
M o=x0 i⋅ f M o − f M o−1 f M o − f M o 1 , (1.17)
где x o – нижняя граница модального интервала (модальным на-зывается интервал, имеющий наибольшую частоту);
i – величина модального интервала;
• M o – частота модального интервала;
• M o −1 – частота интервала, предшествующего модальному;
• M o 1 – частота интервала, следующего за модальным.
1
∑ f i −SMe −1
Me= x0 i⋅
2
,
(1.18)
f Me
где x o – нижняя граница медианного интервала (медианным на-зывается первый интервал, накопленная частота которого превышает половину общей суммы частот);
i – величина медианного интервала;
– накопленная частота интервала, предшествующего ме-
дианному;
f Me – частота медианного интервала.
Вычислим медиану и моду для интервального ряда, задаваемого таблицей 1.4 – «Расчет показателей вариации».
Так как наибольшая частота равна 6, и она соответствует интер-валу 5,5 – 6,4, то, рассуждая по формуле (1.18), замечаем, что нижняя граница медианного интервала xo=5,5 . Величина интервала равна
27
разности 6,4, и 5,5, т. е. 0,9. Подставив значения в формулу (1.18), по-лучим:
20 1 −6
Me=5,5 0,9⋅ 2 =6,175 . 6
Какой вывод мы можем сделать по вычисленному значению ме-дианы?
Вывод такой: 50% торговых точек имеют выручку менее 6,175 млн. руб., а 50% торговых точек имеет выручку более 6,175 млн. руб.
Пользуясь формулой (1.17) вычислим моду по таблице 1.4 – «Расчет показателей вариации».
M o=5,5
0,9⋅
6−4
=6,10 млн. руб .
6−4 6−5
Итак, в данной совокупности торговых точек, наиболее часто встречается размер выручки в 6,10 млн. руб.
Но помимо аналитических способов определения медианы и моды существует и графический способ.
Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности со-вокупности, делят пополам. Через полученную точку проводят пря-мую, параллельную оси абсцисс, до пересечения ее с кумулятой. Аб-сцисса точки пересечения является медианой. Мы строили кумуляту на рис. 1.4, определите самостоятельно значение медианы.
Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину мо-дального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения. Гистограмму мы строили на рис. 1.3, определи-те значение моды по рисунку.
Итак, подводя итог, можно заключить, что основной характе-ристикой центра распределения является средняя арифметическая,
опирающаяся на всю информацию об изучаемой совокупности еди-ниц.
28
Однако в ряде случаев средняя арифметическая должна быть до-полнена и даже заменена модальным значением или медианой.
Например, в статистическом контроле качества продукции удоб-нее пользоваться медианой, а не средней арифметической, так как определение медианы для ранжированного ряда данных не требует специального расчета. Кроме того, она не чувствительна к крайним значениям взятой контрольной пробы.
В рядах с открытыми интервалами также целесообразнее поль-зоваться в качестве характеристики центра распределения модой и ме-дианой. Мода применяется при изучении спроса населения на товары народного потребления (например, на обувь, одежду и т. д.), когда ин-терес представляет определение модального размера, т.е. размера, пользующегося наибольшим спросом.
Если сформулировать общие правила для выбора средней ариф-метической, моды или медианы в качестве показателя центpa распре-деления, то можно сказать, что в симметричных рядах все названные показатели равноправны, поскольку x =Me=M o , но предпочтение отдается средней арифметической.
Для асимметричных рядов распределения медиана часто являет-ся предпочтительной характеристикой центра распределения, по-скольку занимает положение между средней арифметической и мо-дой.
Итак, в отличие от средней арифметической, рассчитываемой на основе использования всех вариантов значений признака, мода и ме-диана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.
Глава 1.5. Показатели вариации качественных признаков
Выше был рассмотрен расчет показателей вариации для коли-чественных признаков. Но наряду с вариацией количественных при-знаков может ставиться задача оценки вариации качественных при-знаков. При наличии двух взаимоисключающих вариантов значений признака говорят о наличии альтернативной изменчивости каче-ственных признаков. Например, при изучении качества изготовлен-
29
ной продукции можно разделить ее на две группы: годную и брако-ванную. В таком случае будем иметь дело с альтернативным призна-ком. Можно считать, что эквивалентом качественного признака бу-дет переменная, которая принимает значение 1 или 0, причем значе-ние 1 она принимает в том случае, когда обследуемая единица обла-дает данным признаком, а значение 0, когда не обладает им.
Итак, признаки, которыми обладают одни единицы совокупно-сти и не обладают другие, называются альтернативными.
Допустим, общее число единиц совокупности равно n . Число единиц, обладающих данным признаком будет f , тогда число еди-ниц, не обладающих данным признаком, будет равно n− f . Учиты-вая изложенное, построим ряд распределения по качественному при-знаку.
Таблица 1.6. Ряд распределения по качественному признаку
Значение переменной
Частота повторений
1
f
n f
Средняя
Итого:
n
арифметическая такого ряда равна
x=
1⋅f 0⋅ n− f
=
f
n
n ,
т. е. равна относительной частоте (частости), которую можно
обозначить через p , тогда
x= p .
Таким образом, доля единиц, обладающих данным признаком,
равна p ; соответственно доля единиц, не обладающих данным призна-
ком, равна q ;
p q=1 . Тогда дисперсия альтернативного признака
определяется по формуле
2
∑
x
i
− x
2⋅f
2
2
i0− p ⋅q 1− p ⋅p
σ
=∑ f i
=
=
p q
=
p2⋅q q2⋅p
= pq⋅ p q = pq⋅1= pq .
1
Мы получили, что дисперсия альтернативного признака равна
σ2=pq . (1.19)
30
Обратите внимание, что для вычисления дисперсии альтерна-тивного признака мы пользовались формулой взвешенной диспер-сии (1.5).
Но так как среднее квадратическое отклонение равно корню квадратному из дисперсии, то и для альтернативного признака мы по-лучим формулу среднего квадратического отклонения альтернативно-го признака.
σ = pq . (1.20)
Максимальное значение дисперсии альтернативного признака
0,25.
Например, в результате контроля качества при приемке из 1 000 готовых изделий (пусть это будут упаковочные пакеты) 20 ока-
зались бракованными. Применяя вышеуказанную символику, строим ряд распределения (1 соответствует бракованным изделиям, а 0 – годной продукции) с помощью таблицы 1.7.
Таблица 1.7. Ряд распределения по качественному признаку
Значение переменной
Частота повторений
1
20
980
Итого:
1 000
Чтобы найти долю брака по данным примера, нужно количество бракованных изделий разделить на общее количество изделий и умно-
жить на 100. Тогда доля брака равна
20
⋅100 %=2 %
(или 0,02).
1000
Найдем величину дисперсии, пользуясь формулой (1.16). Для этого необходимо найти долю продукции, относящейся к годным из-делиям. А для этого из единицы вычтем долю брака, получим 0,98. Теперь, перемножив по формуле (1.9) найденные доли, определим дисперсию
σ 2=pq=0,02⋅0,98=0,0196 .
Для вычисления среднего квадратического отклонения извлечем из результата дисперсии квадратный корень (по формуле 1.17) и
31
σ= pq= 0,0196=0,14 .
Нужны ли практически показатели вариации альтернативных признаков?
Да, они широко используются в статистике, в частности при проектировании выборочного наблюдения, т. е. когда из совокупности выбирается некоторая группа (выборка) и подвергается статистиче-скому обследованию.
Показатели вариации широко используют при обработке дан-ных социологических обследований, статистическом контроле каче-ства продукции и в ряде других случаев.
Например, возвращаясь к таблице 1.4, из 20 торговых точек, за-нимающихся реализацией упаковочного материала, в 5 из них налого-вой инспекцией обнаружены финансовые нарушения. Тогда
5
1
p=
=
4
– доля торговых точек, в которых обнаружены финансо-
20
вые нарушения, а доля торговых точек, в которых финансовых нару-шений не обнаружено равна:
q=1− p=1− 14 = 34 .
Найдем дисперсию для торговых точек, в которых обнаружены финансовые нарушения
◦ 2=pq= 14⋅34 =163 =0,1875 ,
• найдем среднее квадратическое отклонение для этого же слу-
чая
σ = pq= 0,1875=0,433 .
Обобщенной характеристикой различий внутри ряда может cлу-жить энтропия распределения.
Применительно к статистике – энтропия – это мера неопреде-ленности данных наблюдения, которая может иметь различные ре-зультаты.
Энтропия зависит от числа градаций признака и от вероятности каждой из них. Онa показывает, имеет ли закономерность в сосредото-чении отдельных градаций наименьшее количество позиций или,
напротив, заполненность распределения одинаковая. При этом сумма 32
вероятностей всех возможных исходов равна единице. Энтропия изме-ряется в битах. Из курса информатики вы помните, что бит – наи-меньшая единица измерения информации.
Как же характеризуется энтропия?
Показатель энтропии H x представляет собой отрицательную сумму произведения вероятностей различных значений случайной величины pi на логарифмы по основанию два этих вероятностей, т.е.
H x =−∑ pi⋅log2 pi . (1.21)
Если все варианты равновероятны, то энтропия максимальна. Если же все варианты, за исключением одного, равны нулю, то энтро-пия равна нулю.
Энтропия альтернативного признака ( n=2 ) при равновероятном распределении ( p= 12 ) равна единице. Давайте убедимся в этом пу-тем вычислений по формуле (1.21).
H x =−∑ pi⋅log2 pi =− 12⋅log2 12 12⋅log2 12 = =−2⋅12⋅log2 12 =−log2 12 =−1⋅ −1 =1.
В процессе предыдущих расчетов мы пользовались логарифмом числа по основанию 2. Напомним, что логарифмом называют показа-тель степени, в которую надо возвести основание, чтобы получить
подлогарифмическое выражение, т. е. 12 .
Так как основание логарифма равно двум, то в какую степень его надо возвести, чтобы получить 12 ? Естественно, в минус первую сте-пень. Ведь два в минус первой степени равно 12 . Вот почему логарифм
числа 12 по основанию два равен минус единице.
Произведем вычисление энтропии на примере выпуска продук-ции различных сортов на одном из предприятий, занимающихся выпус-
33
ком электротоваров. Продукция, выпускаемая предприятием, трех сор-тов, среди продукции возможен брак. В таблице 1.8 указаны вероятно-сти каждого из сортов и вероятность брака.
Таблица 1.8. Вероятность различных сортов продукции
Сорт
1-й
2-й
3-й
Брак
Итого:
Вероятность
0,90
0,04
0,05
0,01
1,00
Энтропия данного распределения равна:
H x =−∑ pi⋅log2 pi =− 0,9⋅log2 0,9 0,04⋅log2 0,04
0,05⋅log2 0,05 0,01⋅log2 0,01 =0,6051 .
Показатель энтропии позволяет также измерять количество ин-формации. Чем больше информации о случайном событии, тем опреде-леннее его состояние. Чем больше вероятность случайного события
• a , тем меньше информации несет его осуществление. В случае
• a=1 энтропия равна нулю, т. к. логарифм единицы по любому осно-
ванию равен нулю. Что это означает?
Это значит, что данное испытание не содержит никакой инфор-мации.
Энтропия распределения интерпретируется как мера рассредото-ченности вариантов случайной переменной по ее возможным значени-ям или как мера неопределенности значения реализации.
Неопределенность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отношении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности результатов одного и того же наблюдения со случай-ными исходами существенно различаются.
Например, результаты голосования при экспертных опросах для наблюдателя – участника голосования и наблюдателя, не участвующе-го в голосовании.
В связи с тем, что верхнего предела энтропия распределения не имеет, целесообразно вычислять наряду с абсолютной и относительную величину неопределенности, т. е. относительную энтропию.
34
Как она определяется?
Относительная энтропия определяется как отношение ее фак-тической величины к максимальной.
Это отношение изменяется от нуля до единицы и может быть ин-терпретировано. Чем меньше относительная энтропия, тем меньше неопределенность и выше однородность.
Итак, мы познакомились в этой главе со статистическими рас-пределениями, их характеристиками. Выяснили, как они вычисляют-ся. В следующей главе мы переходим к рассмотрению рядов динами-ки, т. е. к тому вопросу, о котором мы частично уже говорили.
35
РАЗДЕЛ 2. РЯДЫ ДИНАМИКИ
Глава 2.1. Характеристика и классификация динамических рядов
В предыдущих главах мы вели разговор о показателях, спосо-бах их определения, типах показателей. В этой главе мы попытаемся выяснить, как можно отслеживать изменения тех или иных показа-телей во времени, т. е. динамично. Ведь мы уже объясняли, что такое название связано с разделом физики (динамики), занимающейся изу-чением движения. Для отображения изменений показателей во вре-мени строят ряды динамики.
Итак, ряды динамики (временные ряды) применяются для изуче-ния изменения явлений во времени. Что представляет собой ряд дина-мики? Это ряд числовых значений определенного статистического по-казателя в последовательные моменты или периоды времени (годы, кварталы, месяцы). Значит, ряды динамики задаются столбцами и строками. Обычно уровни ряда обозначают через y , моменты или пе-риоды времени, к которым относятся уровни – через t . Например, та-блицей 2.1 задается выпуск продукции предприятием по годам. Это и есть ряд динамики.
Таблица 2.1. Выпуск продукции предприятием по годам
Год, t
Выпуск
продукции, yi
(млн.т.)
2003
15
2004
17
2005
18,5
2006
19
2007
21
◦ статистике различают два вида временных рядов: моментные
• интервальные.
36
Моментным называется ряд, который отражает значение иссле-дуемого признака на какой-то момент времени. Например, числен-ность работников фирмы или уровни товарных остатков на складе на какой-то момент времени.
Можно привести множество примеров моментного ряда, но по-смотрим, какими особенностями обладает моментный ряд.
Дело в том, что для моментного ряда нельзя суммированием по-лучить общее значение показателя за весь период. А происходит это потому, что значения анализируемого показателя, относящиеся к разным датам, пересекаются между собой. Например, отслеживая остатки какой-то марки печенья на складе по месяцам года, нельзя сум-мированием определить остаток этого печенья в целом за весь год. Ведь то печенье, которое было остатком в январе месяце, станет со-ставляющей продукции склада в феврале месяце и будет входить в остаток печенья на складе в феврале и т. д.
Что же касается интервального ряда, то им называется такой ряд, абсолютные уровни которого представляют собой итоговые ве-личины за некоторые интервалы времени (например, производство продукции за месяц; число родившихся за месяц, год). Или объем выпущенной продукции за 2007 г. (табл. 2.1).
Какова особенность интервальных рядов? В отличие от момент-ных рядов их уровни можно дробить и складывать. Например, мы мо-жем узнать, какой объем продукции выпущен предприятием (табл. 2.1) за весь рассматриваемый период. Это означает, что мы должны сложить значения уровней второго столбца и получим 90,5 млн.т. продукции.
Можно определить не только итоговый показатель, но и показа-тели за какие-то промежутки всего полного периода.
Это как раз и будет дроблением ряда, т.е. мы разбиваем ряд на более мелкие промежутки времени.
Например, за два первых года исследуемого показателя (табл. 2.1) выпуск продукции предприятием составил 32 млн.т., а за два последних года – 40 млн.т. Как мы это определили? Мы просто сложили соответствующие уровни.
37
Итак, главный вывод по моментным и интервальным рядам: сумма уровней интервального ряда – вполне реальный показатель (мы только, что в этом убеждались), сумма уровней моментного ряда не имеет смысла.
Глава 2.2. Показатели изменения уровней ряда динамики
В статистике выделяют также производные ряды динамики, ко-торые состоят из средних или относительных величин. Они рассчиты-ваются на основе моментных или интервальных рядов. Например, среднегодовая численность населения.
Для анализа скорости и интенсивности развития исследуемого явления используют следующие статистические показатели: абсо-лютный прирост, темп роста и прироста, абсолютное значение одно-го процента прироста.
При этом принято сравниваемый уровень называть отчетным, а уровень, с которым производят сравнение, – базисным.
Но абсолютные приросты делят на цепные и базисные. Абсо-лютный прирост показывает, на сколько изменился изучаемый показа-тель по сравнению с предыдущим или базисным периодом времени. Он равен разности двух сравниваемых уровней и выражает абсолют-ную скорость роста. Итак, формула для базисного абсолютного приро-ста имеет вид:
yb= yi− y0 , (2.1)
где y 0 – базисный уровень ряда.
Когда сравниваются абсолютные показатели двух любых сосед-них рядов, то следует говорить о цепном абсолютном приросте, кото-рый задается формулой (2.2).
yц= yi− yi-1 . (2.2)
С понятием темп роста мы уже встречались. Этот показатель ха-рактеризует интенсивность изменения уровня. И задается отношением отчетного уровня к базисному. Интенсивность изменения уровня ряда оценивается отношением отчетного уровня к базисному, которое все-
38
гда представляет собой положительное число. Показатель интенсив-ности изменения уровня ряда в зависимости от того, выражается ли он в виде коэффициента или в процентах, принято называть коэффици-ентом роста или темпом роста. Это фактически одно и то же отноше-ние, только коэффициент роста безразмерная величина – число, а темп роста – это то же самое число, только умноженное на сто процентов. Значит, темп роста измеряется в процентах.
Пусть фирма занимающаяся реализацией школьных товаров имела за июль месяц 2007 г. выручку 4 млн. руб., а за август месяц 2007 г. этот объем достиг 6 млн. руб.
Тогда коэффициент роста объема выручки будет равен 6 : 4 = 1,5.
Темп роста объема выручки фирмы составит (6 : 4) х 100% = 150%.
Коэффициент роста показывает, во сколько раз изменился изучаемый показатель по сравнению с предыдущим периодом време-ни или с базисным периодом времени. Соответственно коэффициент роста может быть цепным и базисным.
Введем формулу для цепного коэффициента роста.
K цР = yi . (2.3)
i
yi −1
Базисный коэффициент роста позволяет сравнивать отчетный уровень с начальным:
K Б = yi . (2.4)
Рi y0
Из предыдущих рассуждений можно заключить, что темпы ро-ста – это коэффициенты роста, выраженные в процентах (они также могут быть цепными, базисными и средними). А значит, их можно вы-числять по формуле
T P= K P⋅100 % . (2.5)
Следующим показателем ряда динамики является темп приро-ста. Темп прироста показывает, на сколько процентов изменился изу-
39
чаемый показатель по сравнению с предыдущим периодом времени или с базисным периодом времени. Аналогично различают цепной и базисный темп прироста. Темп прироста – это разность между темпом роста и 100. Формула цепного темпа прироста задается так:
ц
yi− yi−1
T пр
=
⋅100 % . (2.6)
i
yi−1
Базисный темп прироста задается такой формулой
T Б = yi− y0⋅100 % . (2.7)
прi y0
В практике статистики часто вместо темпов роста и прироста используют абсолютное значение одного процента прироста. Оно представляет собой одну сотую часть базисного уровня и в то же вре-мя – отношение абсолютного прироста к соответствующему темпу прироста.
∣%∣=
yi− yi−1
yi− yi −1
. (2.8)
⋅100 %
yi
Абсолютное значение одного процента прироста служит кос-венной мерой базисного уровня и вместе с темпом прироста позволя-ет рассчитать абсолютный прирост уровня за рассматриваемый пери-од.
А теперь, чтобы реанимировать формулы, которые мы сейчас с вами получили, исходя из определений того или другого показателя рядов динамики, вернемся к табл. 2.1 и вычислим для нее все возмож-ные показатели ряда динамики. Начнем свои рассуждения с 2004 г., т. к. для 2003 г. большинство из показателей нельзя вычислить, ввиду того, что не с чем его сравнивать (исходя из нашей таблицы).
Находим абсолютный прирост, как разность показателя выра-ботки продукции 2004 и 2003 гг. Она равна yц= yi− yi-1=17−15=2 . В этом случае значение цепного и базисного приростов совпадают, т.е. yб= yi− y0=17−15=2 . Для вычисления коэффициента роста цепного
(он снова будет совпадать с базисным) найдем отношение числа 17 к 40
ц
yi
Б
17
числу 15, тогда
K Р
=
=K Р
=
=1,133
. Для вычисления темпа роста
yi −1
15
i
i
будем умножать коэффициент роста на 100%. Получим, что цепной и базисный темпы роста совпали и равны 113,3%.
Переходим к вычислению цепного темпа прироста
ц
yi− yi−1
17−15
T пр
=
⋅100 %=
15
⋅100 %=13,3 % .
i
yi−1
Он будет в нашем случае равен базисному темпу прироста. Последний показатель, который мы вычислим в этом примере –
абсолютное значение одного процента прироста.
∣%∣=
17−15
=
2
=0,17 .
17−15
⋅100 %
200
17
17
Аналогично можно вычислить эти же показатели только для других уровней. Сделайте это самостоятельно, это будет хорошей практикой и позволит убедиться вам в том, что расчеты не представ-ляют никаких сложностей.
Глава 2.3. Расчет среднего уровня ряда динамики
Мы выяснили, что ряды динамики можно анализировать с помо-щью различных абсолютных показателей и рассмотрели способы вы-числения этих показателей. Но мы не раз с вами подчеркивали, что средние одни из важнейших понятий в статистике. И мы снова прибе-гаем к ним за помощью. В рядах динамики они необходимы для обоб-щающей характеристики исследуемого явления за ряд периодов. Рассмотрим две категории этих показателей:
• средние уровни ряда;
• средние показатели изменения уровней ряда.
Метод расчета среднего уровня ряда динамики зависит от вида
временного ряда.
Если ряд динамики является интервальным, то расчет среднего уровня ведется по формуле простой средней арифмети-ческой:
41
n
∑i1 yi . (2.9)
y= = n
Например (табл. 2.2), имеются следующие данные о динамике производства продукции предприятием по выпуску модулей для сбор-ки офисной мебели за 2006-2010 гг., тыс. шт.
Таблица 2.2. Производство продукции (тыс. шт.) предприятием за 2006 – 2010 гг.
Год
2006
2007
2008
2009
2010
Объем продукции (тыс.шт.)
201
215
234
236
241
Чтобы определить среднегодовое производство продукции за 2006-2010 гг. достаточно воспользоваться формулой простой средней арифметической:
n
∑ yi
=201 215 234 236 241 =225 , 40 .
y=
i=1
n
5
Итак, среднегодовой выпуск модулей для сборки офисной мебе-ли за пять последних лет на данном предприятии составил 225,40 тыс. шт.
Средний уровень моментного динамического ряда определяется несколько иначе. Рассмотрим вычисление среднего уровня для такого моментного динамического ряда, когда промежутки между датами одинаковы. Например, определим средний месячный остаток материа-лов на складе предприятия по выпуску модулей для сборки офисной мебели в течение первого квартала текущего года. Известно, что оста-ток материалов на складе на 1 января текущего года составил 242 млн. руб., на 1 февраля – 251 млн. руб., на 1 апреля – 186 млн. руб. При вычислении среднего уровня моментного ряда условно предпола-гается непрерывное, равномерное изменение уровня в промежутках между двумя датами.
Основываясь на этом предположении, определяем средние остатки материалов на складе за каждый месяц как полусумму остат-
42
ков на начало и конец месяца. Средние остатки за месяц соответ-ственно будут равны:
за январь y=242 251 =246,5 млн . руб . , 2
за февраль y=251 214 =232,5 млн. руб . , 2
за март y=214 186 =200,0 млн . руб . 2
Естественно возникает вопрос, как получили число 214? Это средняя между остатками крайних месяцев, т. к. в нашем случае дина-мический ряд состоит из нечетного числа значений, т. е.
214=242 186 . А теперь средний остаток за квартал определяется 2
как простая средняя арифметическая, т. е.
y=246,5 232,5 200 =226 , 333 млн . руб . 3
Приведенный расчет среднего уровня можно представить фор-мулой средней хронологической
y1
y2 y3 ... yn−1
yn
(2.10)
2
y хр .=
2
.
n−1
В этой формуле n – число дат,
y1 , y2 , ... , yn – уровни ряда в
последовательные моменты времени. В нашем примере средние остат-ки на складе будут равны
242
251 214 186
y хр .=
2
2
=226 , 333 млн . руб .
4−1
• этом примере мы рассмотрели моментный ряд с равными про-межутками между временными датами (один месяц). А как быть в том случае, если рассматриваемый моментный ряд с неравными промежут-ками между временными датами?
• таком случае для определения среднего уровня применяется формула средней хронологической взвешенной
43
y=
y1 y2
t1
y2
y3 t 2 ... yn−1
yn t n−1
.
(2.11),
2∑ t i
где ti
- длина временного периода между двумя соседними да-
тами.
В качестве примера рассмотрим такую ситуацию. По данным о запасах товаров на складе на начало месяца определим средний размер товарных запасов в 2010 г. (табл. 2.3)
Таблица 2.3. Данные о запасах товаров (тыс. руб.)
Дата
01.01.10
01.02.10
01.03.10
01.07.10
01.09.10
01.12.10
01.01.11
Запасы
товаров
1320
1472
1518
1300
1100
1105
920
(тыс. руб.)
Еще раз подчеркнем, что рассматривается моментный ряд с не-равными промежутками между временными датами, а потому восполь-зуемся формулой 2.11.
y = 1320 1472 ⋅1 1472 1518 ⋅1 1518 1300 ⋅4 1300 1100 ⋅2 1100 1005 ⋅3 1005 920 ⋅1 = 2⋅12
=1253,9 тыс . руб .
Мы определили средний размер товарных запасов на складе в 2010 г. Он составил 1253,9 тыс. руб. Обратите внимание на первое, вто-рое и последнее слагаемые числителя наших расчетов. Они в качестве сомножителя содержат единицу, т. к расстояния между датами равно одному месяцу. Третье слагаемое умножается на 4, т. к. расстояние между датами равно 4 месяцам. Аналогично 4-ое и 5-ое слагаемые, со-ответственно умножаются на 2 и на 3. В знаменателе число 2 умножа-ется на число 12, т. к. речь идет о среднем размере за год (12 месяцев).
Если имеется полная информация о значениях моментного стати-стического показателя на каждую дату, то среднее значение этого пока-зателя за весь период вычисляется по средней арифметической взве-шенной. В качестве весов принимается продолжительность промежут-ков времени между моментами, в которые происходят изменения в уровнях динамического ряда:
44
n
∑ yi ti
y= i=1
(2.12),
n
∑ ti
i=1
где ti - количество дней (месяцев) между смежными датами.
Мы говорили в начале рассматриваемого раздела, что ряды дина-мики имеют большое практическое значение и уметь их исследовать важно для специалиста любой отрасли. Т. е., это не только важно эконо-мисту, но и кадровику, менеджеру. Поэтому рассмотрим применение формулы (2.12) еще на примере следующей ситуации. Пусть на 1 января отчетного года стоимость основных средств предприятий составляла 75 млрд. руб. В марте были приобретены основные средства на сумму 2 млрд. руб., в мае выбыло основных средств на 7 млрд. руб., а в сентябре было приобретено еще основных средств на 8 млрд. руб. Вычислим среднюю годовую стоимость основных средств основных средств пред-приятия.
Для удобства расчетов данные представим в таблице 2.4.
Таблица 2.4. Стоимость фондов предприятия (млрд. руб.)
Стоимость основных
Число месяцев, в течение
y
t
Даты времени
которых стоимость не
i
средств, млрд. руб.
изменялась
i
1/I
75
3
225
1/IV
77
2
154
1/VI
70
4
280
1/X
78
3
234
Итого:
12
893
Среднегодовая стоимость основных средств предприятия по данным приводимого примера составит 74,417 млрд. руб., мы полу-чили это с помощью формулы средней арифметической взвешенной
n
∑ yi t i
=893 =74 , 417 млрд . руб .
y=
i=1
n
12
∑ t i
i=1
Если же ориентироваться на стоимость основных средств пред-
приятия на начало и конец отчетного года, т. е., например, использо-45
вать показатели балансового отчета предприятия, то получим иной по-казатель среднегодовой стоимости основных средств предприятия:
y=75 78 =76,5 млрд . руб . 2
В этой формуле 78 млрд. руб. стоимость основных средств на конец года (78=75+2-7+8).
Вот почему для анализа деятельности предприятия следует пользоваться данными внутренней отчетности, что позволяет полу-чить более достоверную оценку результатов.
При определении средних уровней временного ряда нужно иметь в виду, что средняя будет достаточно надежной характеристи-кой ряда динамики, если она характеризует период с более или менее стабильными условиями развития. Если же за исследуемый период можно выделить этапы, в течение которых условия развития суще-ственно менялись, то пользоваться общей средней не всегда целесооб-разно, а предпочтение нужно отдать средним, рассчитанным по отдельным этапам.
Итак, мы рассмотрели одну из категорий средних показателей ряда динамики – средние уровни ряда.
Далее мы выясним, как вычисляются средние показатели изме-нений уровней ряда. Начнем с рассмотрения среднего абсолютного прироста или средней скорости роста.
Этот показатель рассчитывается как средняя арифметическая из показателей скорости роста за отдельные промежутки времени.
n−1
∑ i
y
− y
, (2.13)
=
i=1
=
n
1
n−1
n−1
где n – число уровней ряда,
i – абсолютные изменения по сравнению с предшествующим уровнем.
Если вернуться к таблице 2.2, в которой отражена динамика производства продукции предприятием по выпуску модулей для сбор-ки офисной мебели за 2006-2010 гг., (тыс. шт.), то в соответствии с
формулой (2.13) средняя скорость роста будет равна 46
n−1
∑ i
=241−201
=10 тыс. шт.
=
i=1
n−1
5−1
Что означает этот показатель – 10 тыс. шт.? Это означает, что в среднем за 2006 – 2010 гг. выпуск продукции увеличивался на 10 тыс. шт.
Следующим показателем рядов динамики является средний ко-эффициент роста. Он вычисляется по формуле средней геометриче-ской из показателей коэффициентов роста за отдельные периоды:
n−1
, (2.14)
K =
K 1⋅K 2⋅...⋅Kn−1
где K 1⋅K2⋅...⋅K n−1
– коэффициенты роста по сравнению с уров-
нем предшествующего периода;
n – число уровней ряда.
Эту формулу можно записать иначе, если использовать взаимо-связь между коэффициентами роста, вычисленными с переменной ба-зой, и коэффициентами роста, рассчитанными с постоянной базой,
т. е. учитывая, что
K 1⋅K2⋅...⋅K n−1=
yn
, средний коэффициент роста
y1
можно определить по формуле:
n−1 yn
y1
.
(2.15)
K =
По данным примера таблицы 2.2, средний коэффициент роста
будет равен:
n−1 yn
5−1 241
4 241
K =
=
201
= 201 =1,046 .
y1
Вы замечаете, что формула (2.13) позволяет определить средний коэффициент роста на основе данных о начальном и конечном уровнях ряда динамики. Средний коэффициент роста показывает, во сколько раз в среднем за отдельные составляющие рассматриваемого периода изме-нялись уровни динамического ряда.
47
С понятием темп роста мы уже встречались ранее. Средний темп роста представляет собой средний коэффициент роста, выра-женный в процентах.
T = K⋅100 % , (2.16)
где K – средний годовой коэффициент роста. Для приводимого примера
T =1,046⋅100 %=104,6 % ,
а это означает, что в среднем ежегодно выпуск модулей по сбор-ке офисной мебели составлял 104,6% к уровню предыдущего года.
Или так можно сказать, что в среднем ежегодно выпуск модулей по сборке офисной мебели за 2006 – 2010 гг. увеличивался на 4,6%.
Для практического применения средний темп роста, рассчитанный по данным о конечном и начальном уровнях временного ряда, можно использовать только в случае более или менее равномерного изменения уровней. В случае сильной колеблемости уровней ряда использование средней геометрической может дать искаженное выражение средней ин-тенсивности изменения их уровней. В таких случаях предлагается сред-ний коэффициент роста рассчитывать как параболический средний темп роста, средний геометрический темп роста выравненного ряда показа-тельной функции и т.д.
Особую осторожность при применении средних абсолютных приростов или средних темпов роста (прироста) следует соблюдать в тех случаях, когда появляется перелом в имевшей место тенденции изменения уровней динамического ряда. Например, резкое снижение выпуска производства в последнем месяце полугодия, если все преды-дущие месяцы был рост. Причины резкого снижения производства могут быть самыми различными. В таких ситуациях лучше ориенти-роваться на средний темп роста за первые пять месяцев.
Итак, мы рассмотрели расчет среднего уровня ряда динамики и перейдем к рассмотрению проблемы сопоставимости уровней рядов динамики.
48
Глава 2.4. Смыкание рядов динамики
Важнейшим условием правильного построения ряда динамики является сопоставимость всех входящих в него уровней. Поскольку ряды динамики формируются на протяжении длительных периодов времени, их уровни часто оказываются несопоставимыми. Причины могут быть самыми различными: изменение цен, изменение методи-ки расчета показателей, изменение «границ» (организационных, административных).
Несопоставимость уровней ряда может возникнуть вследствие из-менения единиц измерения или единиц счета. Нельзя, например, сравни-вать и анализировать цифры о производстве молочных продуктов, если за один год они даны в тоннах, а в другой год в литрах. На сопостави-мость уровней ряда динамики непосредственно влияет методология уче-та или расчета показателей. Например, если в одни годы урожайность считали с засеянной площади, а в другие – с убранной, то такие уровни будут несопоставимы.
Для обеспечения сопоставимости данных часто применяется метод смыкания рядов динамики. Под смыканием понимают объеди-нение в один ряд (более длинный) двух или несколько рядов динами-ки, уровни которых исчислены по разной методологии или разным территориальным границам. Для смыкания ряда динамики необходи-мо иметь переходное звено. Переходное звено – это период времени, для которого изучаемый показатель рассчитан как по старой методи-ке (в старых границах), так и по новой методике (в новых границах).
Для переходного звена рассчитывается коэффициент, действие которого распространяется на все предшествующие периоды времени. Например, несколько мелких предприятий по выпуску молочной про-дукции были объединены в комбинат. Выпуск продукции в млн.т. за-дается таблицей 2.5.
Таблица 2.5. Выпуск молочной продукции (млн. т.)
Выпуск молочной продукции
2003
2004
2005
2006
2007
До слияния
6 600
6 700
6 900
-
-
После слияния
-
-
7 500
7 800
7 900
49
Вычислим коэффициент K = 67500900 =1,087 .
Мы его можем вычислить только по 2005 году, т. к. для него есть объемы продукции до и после слияния предприятий. Далее вы-числяем значения объемов выпускаемой продукции с учетом вычис-ленного коэффициента для всех рассматриваемых периодов, т. е. 2003 и 2004 гг.
y03=6600⋅1,087=7174 и y04=6 700⋅1,087=7283 .
Теперь в табл. 2.5 вводим сопоставимый ряд, и таблица прини-мает вид таблицы 2.6.
Таблица 2.6. Выпуск молочной продукции (млн. т.)
Выпуск молочной продукции
2003
2004
2005
2006
2007
До слияния
6 600
6 700
6 900
-
-
После слияния
-
-
7 500
7 800
7 900
Сопоставимый ряд
7 174
7 283
7 500
7 800
7 900
Глава 2.5. Анализ основной тенденции рядов динамики
Итак, одной из задач, возникающих при анализе рядов динамики, является установление закономерности изменения уровней изучаемого показателя во времени. В некоторых случаях эта закономерность – об-щая тенденция развития объекта. Она вполне ясно отображается уровня-ми динамического ряда. Либо это увеличение показателя, либо умень-шение на всем исследуемом временном интервале. Однако часто прихо-дится встречаться с такими рядами динамики, когда уровни ряда претер-певают самые различные изменения (то возрастают, то убывают) и мож-но говорить лишь об общей тенденции развития явления, либо о тенден-ции к росту, либо к снижению. В этих случаях для определения основ-ной тенденции развития явления, достаточно устойчивой на протяжении данного периода, используют особые приемы обработки рядов динами-ки.
Рассмотрим, в чем они заключаются.
Один из наиболее простых приемов обнаружения общей тенден-ции развития явления – укрупнение интервала динамического ряда. Смысл приема заключается в том, что первоначальный ряд динамики преобразуется и заменяется другим, показатели которого относятся к
50
большим по продолжительности периодам времени. Например, ряд, со-держащий данные о месячном выпуске продукции, может быть преоб-разован в ряд квартальных данных.
Вновь образованный ряд может содержать либо абсолютные ве-личины за укрупненные по продолжительности промежутки времени (эти величины получают путем простого суммирования уровней пер-воначального ряда абсолютных величин), либо средние величины. При суммировании уровней или при выведении средних по укрупнен-ным интервалам отклонения в уровнях, обусловленные случайными причинами, взаимопогашаются, сглаживаются и более четко обнару-живается действие основных факторов изменения уровней (общая тенденция).
Выявление основной тенденции может быть осуществлено так-же методом скользящей средней. Для определения скользящей сред-ней формируем укрупненные интервалы, состоящие из одинакового числа уровней. Каждый последующий интервал получаем, постепенно сдвигаясь от начального уровня динамического ряда на один уровень.
Таким образом, интервал сглаживания как бы скользит по дина-мическому ряду с шагом, равным единице.
По сформированным укрупненным интервалам определяем сум-му значений уровней, на основе которых рассчитываем скользящие средние. Полученная средняя относится к середине укрупненного ин-тервала. Поэтому при сглаживании скользящей средней технически удобнее укрупненный интервал составлять из нечетного числа уров-ней ряда. Нахождение скользящей средней по четному числу уровней создает неудобство, вызываемое тем, что средняя может быть отнесе-на только к середине между двумя датами. В этом случае необходима дополнительная процедура центрирования средних. В целом можно сказать, что метод скользящей средней – это замена исходных уров-ней ряда средними величинами, которые рассчитываются для последо-вательно смещающихся интервалов времени. Уточним еще раз, под воздействием каких факторов формируются уровни рядов динамики?
51
Эти факторы можно разделить на 3 группы: определяющие, се-зонные, случайные. Выясним, что относят к каждому из этих типов факторов.
Определяющие факторы – факторы, которые оказывают посто-янное и сильное воздействие на изучаемый показатель. Они определя-ют основную тенденцию (тренд) ряда динамики.
Сезонные факторы – факторы, которые вызывают сезонные колебания относительно основной тенденции.
Случайные факторы – факторы, которые вызывают случайные колебания уровней ряда (например, погодный фактор).
После того как установлено наличие тенденции в ряду динами-ки, производится ее описание с помощью метода сглаживаний. Наибо-лее широко применяемые методы сглаживаний: метод укрупнения ин-тервалов и метод скользящей средней, что мы и рассмотрели в общем виде.
Итак, мы завершили рассмотрение важного вопроса статистики – ряды динамики. Выяснили, что в статистике различают два вида рядов: моментные и интервальные. Чем характеризуется каждый из видов ря-дов. Выяснили, как осуществляется расчет среднего уровня ряда, и в чем состоит несопоставимость уровней ряда.
В следующем разделе рассмотрим важное статистическое поня-тие – индекс.
Конец второй лекции
Все замечания и предложения отсылайте по адресу: feedback @rfet.ru
52