Справочник Автор24
Лекторий Автор24
Лекционные и методические материалы по статистике
Статистика.Способы наглядного представления статистических данных. Организация статистики в Российской Федерации

Статистика.Способы наглядного представления статистических данных. Организация статистики в Российской Федерации

⌛ 2013 год
👀 1591 просмотр
📌 1539 загрузок
🏢️ ТКУиК

Выбери формат для чтения

Конспект лекции по дисциплине «Статистика.Способы наглядного представления статистических данных. Организация статистики в Российской Федерации», doc

Загружаем конспект в формате doc

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Статистика.Способы наглядного представления статистических данных. Организация статистики в Российской Федерации», Word формат

ПРАВИТЕЛЬСТВО САНКТ-ПЕТЕРБУРГА КОМИТЕТ ПО НАУКЕ И ВЫСШЕЙ ШКОЛЕ Государственное бюджетное образовательное учреждение среднего профессионального образования «Санкт-Петербургский технический колледж управления и коммерции» КОНСПЕКТ ЛЕКЦИЙ по курсу «Статистика» для студентов очно - заочной (вечерней)формы обучения с использованием дистанционных технологий для специальностей 080114 «Экономика и бухгалтерский учет (по отраслям)» 030912 «Право и организация социального обеспечения» 100701 «Коммерция Часть 2 Подготовила: преподаватель Смирнова С.О. Санкт-Петербург 2013 г Содержание Тема 7. Способы наглядного представления статистических данных…………..3 Тема 8. Средние величины и показатели вариации……………………………….10 Тема 9. Статистическое изучение связей между явлениями……………………18 Тема 10. Ряды динамики и ряды распределения………………………………….24 Тема 11. Индексы…………………………………………………………………..35 Тема 12. Организация статистики в Российской Федерации…………………..39 Тема 7. Способы наглядного представления статистических данных. В результате изучения этой темы Вы будете: знать: • требования, предъявляемые к построению статистических таблиц и графиков; • способы представления результатов статистических наблюдений; • основные виды графиков и диаграмм; • возможности применения графиков для изображения динамики явлений и их структуры; уметь: • "читать" графики; • представлять статистические данные различными типами графиков. В предыдущей теме, когда мы с Вами говорили о группировке, часто приходилось ссылаться на таблицы как на одну из форм представления статистических данных, Давайте рассмотрим, из чего состоит таблица, и в чем ее преимущества, а в качестве примера возьмем одну из уже знакомых Вам таблиц. Таблица 1. Количество посетителей магазина "Центральный" Название магазина Категория Количество (чел.) Пол Количество (чел.) 40,2% Заголовки строк Преимущества представления данных в виде таблиц, во-первых, в том, что, пользуясь заголовками строк и столбцов, можно легко найти нужные данные в ячейках на пересечении соответствующих строк и столбцов, а, во-вторых, достаточно удобно сравнивать различные данные. Но если Вам уже приходилось иметь дело с большими таблицами, содержащими много различных цифр, Вы, скорее всего, согласитесь, что работать только с таблицами не всегда удобно, особенно если нужно представить данные в наглядном и доступном виде. Чтобы решить проблему наглядного представления различных данных, используют различные виды графиков, Статистический график - это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. С определенными видами графиков Вы, скорее всего, уже знакомы - изучали на уроках математики в школе, видели в газетах и журналах или использовали на работе. Но поскольку графическое представление данных может значительно облегчить работу с информацией любому человеку независимо от профессии, мы рассмотрим эту тему более детально. Обычно график строится на основе таблицы. Представление табличных данных в виде графика позволяет: • лучше осмыслить результаты статистического наблюдения; • правильно истолковывать результаты анализа; • значительно облегчить понимание статистических мате- • риалов; • сделать представление данных гораздо более наглядным и доступным. Чтобы действительно воспользоваться преимуществами графиков, необходимо соблюдать определенные требования при их построении. График должен быть, прежде всего, выразительным, доходчивым и понятным, а для этого необходимо понимать, какие виды данных каким типом графиков лучше представлять. В зависимости от решаемых задач выделяют такие виды диаграмм как: • структурные диаграммы; • диаграммы сравнения; • диаграммы динамики. Теперь перейдем к описанию наиболее распространенных видов графиков и диаграмм. Структурные диаграммы. Их основная задача - наглядно представить соотношение частей (структуру) изучаемой совокупности. Один из самых простых и наиболее распространенных видов структурных диаграмм - круговая диаграмма (иногда ее также называют секторной, так как отдельные части совокупности представляются в виде секторов). Вспомним исследование посетителей магазинов, которое мы уже рассматривали в качестве примера -итоговую информацию о распределении посетителей по полу можно легко представить в виде круговой диаграммы. И сразу становится видно, что среди посетителей магазинов женщин значительно больше, чем мужчин. Распределение посетителей магазинов по полу 60,3%- 39,7% Круговую диаграмму лучше использовать в тех случаях, когда составляющих совокупность частей не слишком много, так как при большом количестве секторов они будут сливаться, и диаграмма потеряет основное свое преимущество - наглядность. Существуют различные виды круговых диаграмм - плоские и объемные, с вырезом секторов и без. В нашем примере мы строили объемную круговую диаграмму с вырезанным сектором. Диаграммы сравнения. Для того чтобы наглядно показать сравнение нескольких объектов, чаще всего используют так называемые столбиковые диаграммы (гистограммы), в которых данные представлены в виде вертикальных прямоугольников - столбиков. Предположим, что в нашем примере руководство компании интересует общая картина посещаемости всех магазинов. Тогда удобным способом представления такой информации будет такая столбиковая диаграмма (гистограмма): Соотношение количества "посетителей" и "покупателей" Данные о каждом магазине представлены в виде двух столбиков - количество "посетителей" и количество "покупателей". Высота каждого столбика соответствует определенному значению - в нашем примере количеству "посетителей" и "покупателей". Не правда ли, работать с такой информацией гораздо удобнее, чем с таблицей? Во-первых, сразу видно различие между количеством "посетителей" и "покупателей" в каждом магазине, во-вторых, можно легко сравнить посещаемость всех трех магазинов. Столбики могут располагаться на некотором расстоянии друг от друга, вплотную, с перекрытием или с полным наложением друг на друга - все зависит от того, сколько и какой информации Вам надо представить на графике. Общие пожелания к построению гистограмм такие: • значения признака, а, следовательно, и размеры столбиков, должны быть соразмерны (сопоставимы по величине) - не стоит, например, на одной гистограмме показывать данные, измеряющиеся единицами и десятками тысяч; • высота столбиков (длина полос на полосовой диаграмме) должна быть пропорциональна изображаемым величинам. Как и для круговых диаграмм, для гистограмм также возможны различные варианты построения. Например, если расположить столбики не по вертикали, а по горизонтали, получится так называемая ленточная (ее также называют линейчатая или полосовая) диаграмма. Вот несколько примеров различных столбиковых диаграмм (гистограмм). Плоская полосовая Объемная гистограмма Объемная гистограмма с наложением Диаграммы динамики. Очень часто нам необходимо иметь не только "картину" сегодняшнего состояния объекта, например, сколько человек было в магазине сегодня, но и изменение состояния объекта во времени - динамику, то есть сколько человек посещало магазин в прошлом месяце, на прошлой неделе, позавчера, вчера и т.п. Для чего нужно отслеживать изменение по времени? Например, для того, чтобы узнать, увеличилось ли количество посетителей магазина после публикации рекламы в газете или раскладки приглашений на сезонную распродажу по почтовым ящикам. Или для того, чтобы знать, насколько быстро увеличивается количество посетителей во вновь открывшемся магазине, и не пора ли набирать дополнительный персонал. Более подробно об анализе изменений статистических данных во времени (рядах динамики) мы поговорим позже, а пока рассмотрим, как такие изменения можно показать графически. Чтобы наглядно представлять изменения состояния объекта во времени, можно в принципе применять и описанные выше столбиковые диаграммы - например, расположив рядом столбики с количеством посещений в неделю. Но есть другой более адекватный способ, так называемые линейные графики. Что это такое, мы сейчас рассмотрим на примерах тех же магазинов. Динамика количества посетителей магазинов Вот так выглядит линейный график изменения (динамики) количества посетителей трех магазинов за квартал (3 месяца или условно 12 недель). Для того чтобы построить линейный график, на оси абсцисс (горизонтальная ось графика, ее также называют осью категорий или осью X) откладывают определенные интервалы времени (в нашем примере на этой оси цифрами обозначены недели - с 1 по 12), а на оси ординат (вертикальная ось графика, называется также ось значений или ось У ) откладывают определенные уровни нужных признаков изучаемой совокупности (в нашем примере на оси ординат обозначены определенные количества посетителей магазинов с интервалом в 200 человек). На графике может быть представлена информация как об одном объекте (мы могли бы для каждого магазина построить свой график), так и нескольких объектах (как в нашем примере - на одном графике данные всех трех магазинов). Какие же выводы можно сделать, анализируя графики? Смотря на круговую диаграмму, можно наглядно представить себе состав и структуру посетителей магазинов или, в общем случае, любого другого объекта. Пользуясь гистограммами и линейными графиками, мы можем легко сравнивать данные о различных объектах, например, количество посетителей в магазинах - чем выше расположена линия графика (или чем выше столбик, если это гистограмма), тем больше посетителей было в магазине. Но у линейных графиков (диаграмм динамики) есть и дополнительные преимущества. В чем они состоят? Прежде всего в том, что такой график отражает, как уже говорилось выше, изменения состояния объекта во времени. Попробуем, как говорят специалисты, "прочитать" график, то есть проанализировать представленную на нем информацию и сделать какие-то выводы. Итак, посмотрим внимательно на линейный график. Магазин "Центральный" (самая верхняя линия) - сначала график идет ровно, практически горизонтально, значит, количество посетителей приблизительно одинаково и не сильно меняется в течение первых восьми недель. Затем (с девятой недели), линия довольно-таки резко идет вверх - это говорит о том, что количество посетителей увеличивается с каждой неделей. Это сигнал для грамотного менеджера - стоит проанализировать причины такого роста. С чем связано увеличение количества посетителей - с началом рекламной кампании, с тем, что закрылся расположенный недалеко магазин конкурирующей фирмы, или с тем, что магазин начал торговать каким-то очень популярным новым товаром - это предмет отдельного исследования. График нам только сообщает о том, что 4 недели назад произошли некоторые события, которые связаны с резким ростом количества посетителей магазина "Центральный" - значит, есть повод задуматься о том, что привело к такому эффекту. Смотрим на линию "Первомайского" (она средняя на графике) - сначала (первые 4 недели) практически никаких изменений, затем быстрый рост (5-8 недели), небольшой спад и стабилизация на новом уровне посещаемости. Такое положение дел характерно для грамотной, правильно спланированной и проведенной рекламной кампании - во время активных рекламных действий количество посетителей резко возрастает, затем, после окончания рекламной кампании, количество посетителей несколько уменьшается, но все равно их больше, чем до рекламы. Различные типы графиков можно объединять. Например, над гистограммой, показывающей количество посетителей магазина в день, можно построить линейный график, демонстрирующий динамику (изменение) этого количества в течение месяца или квартала. Существуют и другие типы графиков, вот некоторые примеры: "Лепестковая" диаграмма - значения откладываются не по одной оси, а по нескольким (обязательно соблюдать один масштаб для всех осей). "Пузырьковая" диаграмма, которая позволяет наглядно отражать одновременно три характеристики совокупности: две -расположением "пузырька" по осям X и У, а третью - размером самого "пузырька". Например, на показанной выше пузырьковой диаграмме на оси X (горизонтальной) отмечен номер месяца, в котором проводились замеры количества посетителей магазинов, расположение пузырька по вертикальной оси (цифры рядом с "пузырьком") говорит нам о количестве посетителей, а размер "пузырька" означает примерный общий объем продаж товаров за соответствующий период. Кроме описанных типов диаграмм для представления данных о географических территориях в статистике широко используются специальные типы графиков - картограммы и их разновидности - картодиаграммы. Картограмма представляет собой схематическую географическую карту, на которой определенными обозначениями (штриховкой, цветом, различными геометрическими фигурами и знаками) показано наличие и количество какого-либо признака на данной территории. Например, на многих картах тип населенного пункта и количество жителей в нем показывается кругом определенного цвета и/или размера, чем больше круг, тем больше жителей в данном городе или поселке. Картодиаграмма - это сочетание диаграмм с географической картой, например, на картодиаграмме при помощи линейных графиков могут быть показаны изменения численности населения в различных районах страны, края, области. Грамотное представление статистической информации в виде графиков играет важную роль в процессе обработки и анализа данных, поэтому специальные инструменты для работы с графиками включены в наиболее распространенные офисные компьютерные программы – Мicrosoft Word и Мicrosoft Ехсе1. Об основных приемах работы с графиками Вы узнаете из соответствующего раздела "Хрестоматии" и заданий для выполнения на компьютере. Но хотя компьютер значительно упрощает работу по графическому представлению данных статистических наблюдений, основную задачу - выбор типа графика, его формы и способа построения - все равно придется решать Вам. И не лишним будет еще раз напомнить, что форма представления данных определяется, прежде всего, поставленными перед Вами целями и задачами по обработке и анализу статистической информации. Подведем итоги 1. Основные способы представления результатов статистических наблюдений - таблицы и графики. 2. Статистический график - это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. 3. График позволяет сделать представление данных гораздо более наглядным и доступным. 4. Чтобы полностью использовать преимущества графического способа представления данных, график должен быть выразительным, доходчивым и понятным. 5. Для представления различных типов данных и в зависимости от задач исследования используют структурные диаграммы, диаграммы сравнения и динамики. 6. В каждом типе диаграмм существует большое число различных видов графиков и способов их построения. 7. Для представления данных о географических территориях в статистике широко используются специальные типы графиков - картограммы и их разновидности картодиаграммы. 8. Выбор конкретного типа графика, его формы и способа построения определяется задачами представления и анализа данных. ЗАДАНИЕ 4. Выберите наиболее подходящий тип графика и графически представьте данные следующих таблиц, обоснуйте свой выбор. Пол студентов Мужской Женский Доля в общем количестве 42% 58% Учебный год Количество студентов 2008-2009 600 2009-2010 640 2010-2011 690 2011-2012 760 2012-2013 850 Учебный год Количество студентов Муж. Жен. Всего 2008-2009 270 330 600 2009-2010 300 340 640 2010-2011 340 350 690 2011-2012 380 370 760 2012-2013 440 410 850 Тема 8. Средние величины и показатели вариации. В результате изучения этой темы Вы будете знать: • сущность средних величин; • виды средних величин и порядок их исчисления; • виды показателей вариации и способы их расчета; уметь: • рассчитывать средние величины; • определять показатели вариации; иметь навыки: • применять средние величины при обобщении социально-экономических показателей (средняя зарплата, средний возраст, среднесписочная численность и т.д.). Переходим к одной из наиболее важных тем в курсе статистики - средним величинам и показателям вариации. Что же такое средние и почему эти показатели так важны для анализа статистической информации? Давайте рассмотрим такой пример. Предположим, у банка "Кредит-Банк" (название и приведенные в примере цифры условные) есть несколько филиалов, работающих в разных районах города. В этих филиалах работает разное количество сотрудников, у них разное количество посетителей и т.п. Перед нами как исследователями стоит задача - сравнить эффективность работы филиалов и отдельных сотрудников, чтобы поощрить успешных менеджеров и операционистов и распространить их опыт на другие подразделения, а с теми, кто не слишком хорошо работает, разобраться - в чем причина такой ситуации. Но как это сделать, ведь количество сотрудников и посетителей разное, операции они проводят тоже разные - в одном филиале большое количество посетителей оплачивает, например, коммунальные услуги, в другом больше обслуживается юридических лиц со своими задачами, в третьем - в основном, операции с вкладами граждан и т.п. Чтобы решить эту задачу, мы собирали первичные данные о том, сколько посетителей в день обслуживал каждый операционист в каждом из филиалов в течение месяца, затем сложили эти данные и получили следующую таблицу: Филиал "Центральный" "Первомайский" "Заводской" Кол-во клиентов 1620 1976 864 Кол-во операционистов 7 5 3 Какие выводы можно сделать из этой таблицы? Да практически никаких, пока мы только установили некоторый факт – количество клиентов, обслуженных в течение месяца. В «Первомайском» больше всего клиентов, в "Заводском" - меньше, и все. Чтобы продолжить решение нашей задачи и приблизиться к конечной цели - принятию определенного решения, необходимо найти такой показатель, который будет общим для всех филиалов и операционистов, и по которому можно будет сравнить эти группы. Например, показателем эффективности работы операционистов может быть количество клиентов, обслуживаемых ими в день (для простоты условимся, что качество работы всех операционистов примерно одинаково) - чем больше обслужено клиентов, тем лучше работает сотрудник. Но тогда возникает вопрос, как провести такое сравнение - ведь в один день клиентов могло быть много, а в другой - мало, несколько дней у одной из сотрудниц болел ребенок, и она никак не могла сосредоточиться на работе и делала все медленнее, чем обычно, а другой сотрудник неделю был на больничном. И таких случайных факторов в любой работе достаточно много. Как же устранить их влияние и выделить основное, характерное именно для этого сотрудника, или, в общем случае, для изучаемого объекта? Вот здесь-то нам на помощь и приходят средние величины. И в нашем примере сравнить эффективность работы сотрудников банка можно, в частности, по такому показателю, как среднее количество клиентов, обслуживаемых в день. Рассчитать этот показатель очень просто: 1. берем данные о том, сколько клиентов обслуживал конкретный сотрудник каждый день (предположим, в течение месяца); 2. суммируем их, то есть получаем общее количество клиентов, обслуженных данным сотрудником в течение месяца; 3. делим на количество дней, в которые проводилось наблюдение (для каждого сотрудника оно может быть разным). Полученная цифра и будет средним количеством клиентов, обслуживаемых в день конкретным сотрудником. В общем виде показатель, который мы рассчитываем, называется "простая средняя арифметическая", а формула для расчетов выглядит так: X = Страшновато смотрится? На самом деле ничего сложного в этой и других статистических формулах нет, просто надо привыкнуть к определенной системе обозначений, принятой в математике и статистике. Если Вы уже знакомы с такими обозначениями, можете двигаться дальше, если же нет - советуем внимательно прочитать комментарий. Комментарий. В математике и статистике приняты определенные обозначения для различных элементов и действий. Общий объем изучаемой совокупности (количество единиц наблюдения или число вариант и т.п.) обозначается А/ или п. В приведенном выше примере n- это количество дней, в которые проводились измерения количества обслуживаемых клиентов. Каждое конкретное значение (специалисты говорят "варианта") в общем виде обозначается традиционными для переменных величин в математике буквами х, у и т.п. с приписанным справа и чуть ниже обозначением порядкового номера (обычно для этого используются буквы i или j) - получается хi или yj и т.п. В нашем примере х1 - это количество клиентов, обслуженных в первый день наблюдения, х2 - во второй день, х3 - в третий и так далее. Тогда любой ряд данных можно представить в следующем виде – хi . Такой ряд (он называется ряд распределения, но подробно об этом позже) характеризуется еще одной величиной - так называемой частотой (обычно обозначается fi), которая показывает, сколько раз в ряду встречается данная варианта. ∑ (греческая буква, читается "сигма") обозначает сумму всего, что за ней стоит. То есть выражение ∑хi. (дальше мы будем писать просто ) означает, что необходимо сложить х1, х2, х3 и так далее до самого последнего хn . А (или другая какая-то буква с чертой над ней) обычно обозначает среднюю величину. Таким образом, формулу простой средней арифметической можно перевести на "человеческий" язык примерно так: "средняя арифметическая равна сумме всех значений икс (в нашем примере это количество обслуженных каждый день клиентов), деленной на количество значений (в нашем примере - дней, в течение которых проводились измерения числа обслуживаемых клиентов)". Предположим, мы провели измерение количества обслуживаемых клиентов и получили такие данные для операционистов филиала "Заводской": Фамилия сотрудника: Алексеева Всего Даты 1 2 3 … 29 30 22 (дня, в которые проводилось наблюдение) Количество обслужен -ных клиентов 113 111 118 ….. 113 116 319 (всего обслужено клиентов за все дни наблюдения) Данные по другим сотрудникам отдельно приводить не будем, перейдем сразу к сводной таблице. Фамилия сотрудника Общее количество клиентов, обслуженных данным сотрудником за время наблюдения (∑ хi) Количество дней, в течение которых проводилось наблюдение (n) Среднее количество клиентов, обслуживаемых в день Алексеева 319 22 319:22 = 14,5 Горобец 328 18 328: 18 = 18,2 Тимина 217 25 217:25 = 8,7 Итого: 864 65 13,3 Итак, делим общее количество обслуженных клиентов (864) на общее количество дней, в течение которых проводилось наблюдение (65) и получаем среднее количество клиентов, обслуживаемых в день (округленно 13,3) в филиале "Заводской". Что нам дает эта цифра? Она важна, в частности, как показатель для сравнения. Например, если в других филиалах этот же показатель значительно выше или ниже, то руководству филиала и банка необходимо задуматься над причинами этого - чем так отличается данный филиал, что в среднем обслуживает намного меньше или больше клиентов. Или можно сравнить средние по нескольким месяцам или кварталам - если этот показатель увеличивается, то, скорее всего, банк успешно развивается, растет профессионализм сотрудников и т.п. Если же среднее количество клиентов становится меньше, то это сигнал о каких-то значительных изменениях, на которые также надо реагировать. Но вернемся к таблице. Итак, на первый взгляд, мы получили желаемый результат - обобщающий показатель, значение которого практически не зависит ни от количества дней, в течение которых проводилось наблюдение, ни от случайностей типа болезни, плохого настроения и т.п. Из последнего столбца таблицы видно, что в среднем больше всего клиентов в день обслуживает Горобец, а у Тиминой этот показатель в два с лишним раза меньше, следовательно ... Но не спешите с выводами! Помните, еще в самом начале этой тетради мы говорили о том, что правильные выводы можно делать только из достоверной и полной информации. Так вот, вывод о том, что Тимина работает значительно менее эффективно, чем другие сотрудники, можно сделать, только если они находятся в равных условиях - обслуживают один тип клиентов, проводят одни и те же операции и т.п. А если она занимается, например, обслуживанием юридических лиц или решением особо сложных вопросов, требующих значительных затрат времени? Но конечной целью нашего анализа является сравнение всех трех филиалов. Одним из возможных показателей для сравнения может быть среднее количество клиентов, обслуживаемых одним операционистом в месяц, так как оно определяется и работой операционистов, и общей организацией труда в филиале, и другими факторами. Считаем: Филиал "Центральный" "Первомайский" "Заводской" Кол-во клиентов 1620 1976 864 Кол-во операционистов 7 5 3 Среднее кол-во клиентов обслуживаемое одним операционистом 1620:7= 231, 4 ЗАДАНИЕ 5. Среднее количество клиентов, обслуживаемое одним операционистом, для филиалов "Первомайский" и "Заводской" рассчитайте, пожалуйста, сами и впишите результат в таблицу. Если все филиалы выполняют одни и те же операции и находятся в примерно равных условиях, то получается, что в "Первомайском" работа, в том числе по привлечению клиентов, организована значительно эффективнее. Разумеется, это только учебный пример, и в реальной жизни вряд ли можно встретить такие значительные различия в эффективности работы похожих организаций. Тем более не стоит делать выводы об эффективности только по одному показателю, на самом деле необходимо учитывать большое количество различных факторов, влияющих на эффективность работы организации. Приведенную выше формулу простой средней арифметической можно применять не всегда, а только тогда, когда значения не повторяются или их частоты (сколько раз это значение встречается в ряду) равны. Если же, например, у нас в результате наблюдения получился такой ряд, в котором некоторые значения встречаются несколько раз (повторяются): Даты 1 2 3 4 5 6 7 8 9 10 Всего Количество обслуженных клиентов 13 11 18 16 13 16 11 18 18 .11 145 то более точную характеристику ряда дает средняя арифметическая взвешенная, которая рассчитывается по следующей формуле: где хi - значения (сколько клиентов было обслужено), fi - веса (частоты - сколько раз это значение встречается в ряду). Тогда наш расчет будет выглядеть так: = 13*2 + 11*3 + 16*2 + 18*3 = 145 = 14,5 2 + 3 + 2 + 3 10 Средняя величина признака - это отношение определенных показателей, поэтому прежде чем рассчитывать какие-либо средние, необходимо выяснить и обосновать, какие именно показатели использовать для расчетов. Для этого применяется так называемая логическая формула средней, которая записывается словами. В общем виде логическую формулу средней можно определить так: общий объем изучаемого признака количество объектов совокупности, обладающих данным признаком Например, для средней заработной платы логическая формула средней будет выглядеть как средняя заработная плата в расчете на одного сотрудника = общий фонд заработной платы количество сотрудников Существуют и другие виды средних величин, у каждого из которых есть своя специфика. Мы рассмотрим еще так называемые структурные средние - моду и медиану. Мода - это наиболее часто встречающееся в ряду значение. Например, представим такой ряд оценок: 24445444344544434 В этом ряду значение моды - 4, так как именно эта оценка встречается чаще всего. Бывают случаи, когда характеристику ряда удобнее давать не по средней арифметической, а по моде, так как она более точно описывает основное свойство ряда, особенно, если в ряду есть несколько сильно отклоняющихся от среднего значений. Ниже, в таблице представлены виды и расчет наиболее часто используемых средних величин. ВИДЫ И РАСЧЕТ СРЕДНИХ ВЕЛИЧИН Методика расчета в области применения средней Пример 1.Простая средняя арифметическая величина X1=∑Xi/n, где Х1 – среднее значение величины, ∑Хi – сумма значений осредняемого признака, n – число показаний Используется в тех случаях, когда расчет осуществляется по не сгруппированным данным В бригаде из 7 человек зафиксирован следующий стаж работы по специальности: 10,3,5,12,11,7,9 лет. Определить средний стаж работы Х1 = ∑Хi/n= (10+305+12+11+7+9)/7=8,1 года – средний стаж рабочих бригады 2. Средняя арифметическая взвешенная Х2=∑Xifi/∑fi, где fi – частота признака Применяется в тех случаях, когда отдельное значение осредняемого признака повторяется несколько раз Продажи акций АО «Русский хлеб» на торгах фондовой биржи Сделки Кол-во проданных акций (fi) Курс продажи, руб. (Xi) 1 500 1080 2 300 1090 3 1100 1145 Определить средний курс продаж акций на торгах. Х2=∑Xifi/∑fi = (500*1080+300*1090+1100*1145)/(500+300 +1100) = 1112,9 руб. – средний курс продажи акций на торгах 3. Средняя гармоническая – X3=∑Wi/ ∑( Wi /Xi), где Wi- значение варианты, Wi /Xi – обращенная варианта Это превращенная форма средней арифметической величины. Вместо гармонической средней всегда можно рассчитать среднюю арифметическую, сделав предварительные расчеты. Существует гармо-ническая взвешенная и не взвешенная Валовый сбор и урожайность подсолничнека по центрально-черноземному району (в хозяйствах всех категорий) Область Валовый сбор, тыс.т (W) Урожайность, ц/га Белгородская 97,0 16,1 Воронежская 204,0 9,5 Курская 0,5 4,8 Липецкая 16,0 10,9 Тамбовская 69,0 7,0 Определить среднюю урожайность подсолнечника. X3=(970+2040+5+160+690)/(970/16,1+2040/9,5+5/4,8+160/10,9 +690/7)=9,9 ц/га – средняя урожайность подсолничнека 4. Структурные средние: 4.1. Мода (Мо)– применяется для характеристики. Мода – чаще всего встречающийся вариант (типичное значение). Ряд значений, для которого определяется мода, называется модальным. В дискретном ряду мода – это варианта с наибольшей частотой. Если варианта в ряду представлена интервалом значений, то берется середина интервала (средняя из крайних значений интервала. 4.2. Медиана (Ме) – средняя варианта упоря-доченного (ранжирован-ного) вариационного ряда. Если вариационный ряд имеет четное число членов, то медиана (Ме) рассчтыва-ется как полу сумма двух средних вариант. Для интервального ряда медиана рассчитывается более сложно по специаль-ным формулам. 4.1. Мода Размер обуви Число купленных пар Стаж, лет Число работников 34 2 До 2 4 35 10 2-4 23 36(Мо) 90 4-6 20 37 88 6-8(Мо) 35 38 19 8-10 11 39 9 Свыше 10 7 40 1 Наибольшим спросом пользуется размер обуви 36 – это и есть среднее (типичное) значение ряда. Средний стаж работников 7 лет = (6+8)/2 – середина интервала. 4.2. Семь членов бригады имеют следующий стаж работы: Таб.№ 1 2 3 4 5 6 7 Стаж.лет 10 3 5 12 11 7 9 Определить средний стаж рабочмх. Ранжируем ряд: 3 5 7 9 10 11 12 Ме Средний стаж рабочих приблизительно 9 лет (см. расчет простой средней арифметической величины по этим же данным). ЗАДАНИЕ 6 В течение двух недель в кинотеатре подсчитывали количество зрителей и получили следующие данные: День недели Утренние и дневные сеансы Вечерние сеансы 1-я неделя Понедельник 376 520 Вторник 420 560 Среда 397 590 Четверг 440 558 Пятница 432 614 Суббота 668 748 Воскресенье 684 711 2-я неделя Понедельник 567 712 Вторник 611 769 Среда 581 787 Четверг 645 765 Пятница 641 837 Суббота 892 961 Воскресенье 878 930 По приведенным в таблице данным рассчитайте следующие показатели: 1. среднее количество зрителей в день 2. среднее количество зрителей в неделю 3. среднее количество зрителей в будние дни 4. среднее количество зрителей в выходные дни 5. среднее количество зрителей на утренних и дневных сеансах 6. среднее количество зрителей на вечерних сеансах 7. среднее количество зрителей в первую неделю 8. среднее количество зрителей во вторую неделю Другая структурная средняя характеристика - медиана - это значение, стоящее в центре ранжированного (упорядоченного по возрастанию или убыванию) ряда. Она как бы делит ряд на две равных части - со значениями больше медианы и меньше ее. Например, для следующего ряда показателей заработной платы 9 сотрудников организации: 630 650 680 690 700 710 720 730 750 медиана равна 700, так как именно эта варианта стоит в середине ряда. В данном случае медиана означает, что половина сотрудников получала заработную плату менее 700 рублей, а половина - более 700. Если ряд состоит из четного количества вариант, то медиана вычисляется как средняя арифметическая из двух стоящих в центре ряда вариант. До сих пор речь шла только о средних характеристиках какой-либо совокупности. Но одни только средние не всегда могут полно охарактеризовать совокупность. Сравните, например, два следующих ряда зарплат, получаемых двумя сотрудниками в течение полугода: 700 710 700 700 690 700 500 700 900 700 600 800 Если Вы посчитаете средние месячные зарплаты сотрудников, то увидите, что они одинаковые - 700. Однако Вы видите, что ряды сильно отличаются - во втором ряду значительно больше вариация (разброс), то есть отклонение значений друг от друга и, соответственно, от среднего. Чтобы более полно и точно описывать совокупности, кроме средних в статистике применяют еще и показатели вариации, которые как раз и описывают разброс значений совокупности. Основные показатели вариации - это размах вариации, дисперсия и коэффициент вариации. Размах вариации - это разность между максимальным и минимальным значениями совокупности. В нашем примере у первого сотрудника размах вариации зарплаты составляет 20 единиц (710— 690), а у второго - 400 (900—500). На практике размах вариации применяют, в частности, при контроле качества продукции, чтобы, например, размер какого-либо изделия был не меньше и не больше определенных заданных стандартами величин. Дисперсия - более сложный, но и более точный и часто применяемый показатель. Она представляет собой средний квадрат отклонений вариант от их средней величины, и вычисляется по следующим формулам: σ2= - простая дисперсия для не сгруппированных данных (когда значения не повторяются) σ2= - взвешенная дисперсия, для совокупности (ряда) с повторяющимися значениями. В данных формулах - это средняя (простая или взвешенная), а fi - частоты (веса) соответствующих значений хi. Иногда вычисляют также среднее квадратическое отклонение (обозначается σ) - это квадратный корень из дисперсии. Оно является обобщающей характеристикой размеров вариации признака в совокупности и показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения. Поскольку среднее квадратическое отклонение выражается в тех же единицах, что и варианты, оно часто используется при характеристике экономических явлений. Чем больше дисперсия или среднее квадратическое отклонение, тем большим разбросом значений признака характеризуется совокупность, следовательно, тем больше ее неоднородность. В практике очень часто возникают задачи определения однородности какой-либо совокупности, другими словами, выяснения того, насколько похожи друг на друга по определенным характеристикам составляющие совокупность элементы (например, близкие ли суммы тратят на покупки попавшие в выборку посетители магазина, или похожи ли по возрасту покупатели определенного товара). Для решения таких задач используют коэффициент вариации, который представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: V = * 100% Принято считать, что совокупность количественно однородна, если коэффициент вариации не превышает 33%. Поскольку коэффициент вариации является относительным показателем и не зависит от конкретных значений, его также можно использовать для решения задач сравнения вариаций различных признаков (например, цены и себестоимости продукции, возраста и дохода покупателей и т.п.). Анализ и сравнение вариаций может дать много полезной информации для принятия решений. Например, если результаты исследования показывают, что у потребителей некоторого товара весьма небольшой разброс в возрасте, а товар в принципе предназначен для людей практически любого возраста, стоит задуматься над изменением имиджа товара или корректировкой рекламной кампании, чтобы привлечь потенциальных потребителей других возрастных групп. В заключение остается добавить, что расчет и анализ статистических показателей можно и нужно проводить при помощи компьютера. Во-первых, существуют специальные статистические пакеты программ, а во-вторых, многие статистические показатели и функции реализованы в электронных таблицах Ехсе1. Подведем итоги 1. Для характеристики статистической совокупности используют средние и показатели вариации. 2. Средняя величина - это обобщающая характеристика изучаемого признака совокупности, она отражает то общее, что есть у всех единиц совокупности. 3. Выбор вида средней и способов расчета зависит от целей анализа и характеристик совокупности. 4. Средние используются как для сравнения различных совокупностей между собой, так и для анализа изменений одной и той же совокупности во времени. 5. Выбор показателей для расчета средних должен быть обоснован в соответствии с логической формулой средней. 6. Кроме средних совокупность характеризуется также показателями вариации. 7. Анализ и сравнение средних величин и показателей вариации дает полезную информацию для принятия решений. 8. Компьютеры и современное программное обеспечение позволяют значительно упростить и ускорить расчеты статистических показателей Тема 9. Статистическое изучение связей между явлениями. В результате изучения этой темы Вы будете иметь представление: • о том, что такое функциональные и стохастические связи; • о методах установления зависимостей между признаками. Одна из основных задач статистики - изучение закономерностей, то есть устойчивых связей между различными явлениями и процессами. Помните, когда мы с Вами говорили об аналитической группировке, из приведенных в примере данных можно было сделать предварительный вывод о том, в каком издании эффективнее размещать рекламу различных товаров. Тогда мы упоминали понятие связи - конкретно в примере речь шла о связи между тематикой издания и видом товара, рекламу которого в этом издании лучше размещать. Многие социально-экономические процессы и явления, изучением которых занимается статистика, связаны между собой, то есть оказывают влияние друг на друга. Например, инфляция связана с объемом эмиссии (выпускаемых Центральным Банком в обращение денег), заработная плата сотрудников предприятия зависит, в частности, от объема произведенной и проданной продукции и т.п. Наличие связи между одними явлениями можно легко установить "на уровне здравого смысла, то есть не пользуясь никакими специальными средствами и методами. Например, достаточно очевидно, что летом объем продажи мороженого выше, чем зимой, следовательно, объем продажи мороженого связан с сезоном. Связи же между многими социально-экономическими явлениями далеко не так очевидны, и поэтому для их изучения в статистике разработаны специальные методы. Наиболее распространенные и часто использующиеся - это регрессионный и корреляционный анализ. Но, прежде чем мы перейдем к знакомству с этими методами, поговорим немного о различных типах связей. Вы, наверное, помните, что в математике есть такое понятие функция, которое в общем виде выражается так: y = f (x) Это означает, что значения у строго определенным образом зависят от значений х, а вид этой зависимости может быть различным. Например, при формуле у=5х каждому значению х соответствует в 5 раз большее значение у. Такую связь называют функциональной, основное ее свойство в том, что каждому значению независимого признака х соответствует строго определенное значение зависимого признака у. Такой вид связи характерен в основном для явлений, которые изучаются точными науками - математикой, физикой и т.п. В реальной общественной жизни такой вид связи встречается очень редко, например, это может быть связь между объемом выполненной работы и оплатой при простой сдельной системе оплаты труда - если за печать одной страницы текста машинистке платят 2 рубля, то легко можно посчитать по уравнению у=2х, сколько она получит за 5, 20 или 163 страницы соответственно, 10, 40 или 326 рублей. Но в основном социально-экономические явления связаны с большим количеством различных факторов, точно определить влияние которых практически невозможно. Поэтому всегда сохраняется некоторая неопределенность, которая характеризуется вероятностью наступления того или иного события. Например, при приеме на работу в фирму нескольких новых агентов по продаже товара общий объем продажи товара, скорее всего, изменится, но на сколько именно - точно сказать невозможно, так как это зависит от многих факторов (опыта работы агентов с данным товаром, экономической ситуации в тех районах, где они будут работать, личных качеств агентов и т.п.). В таких случаях мы можем только определить, что с большой вероятностью объем продаж в следующем месяце будет находиться в некоторых пределах - скажем, от 120 до 150 штук. Такой тип связи, когда значение зависимой переменной у' может быть предсказано на основе имеющихся значений х с некоторой вероятностью, называется стохастической, и именно стохастическая (вероятностная) связь характерна для социально-экономических явлений и процессов. У стохастической связи есть очень важная особенность - она обнаруживается не на уровне единичных случаев, а в массовых явлениях, и чем больше у нас результатов наблюдений, тем точнее мы можем описать связь между изучаемыми явлениями. Например, если мы, приняв на работу одного-двух новых агентов по продаже и не увидев изменения количества проданного товара за месяц, попытаемся сделать вывод о том, что прием новых агентов практически не влияет на объем продаж, то, скорее всего, мы будем не правы, так как эти конкретные агенты, не продавшие за месяц ничего, могли оказаться просто неопытными, или работали не с теми потенциальными потребителями и не в том районе, в котором следовало, и т.п. То есть из единичного случая нельзя делать вывод о том, есть связь между количеством агентов и объемом продаж или нет. Вот если количество агентов увеличилось на 50 человек, а объем продаж практически не изменился, тогда уже отсутствие связи более очевидно, и есть смысл задуматься над причинами такого положения дел - или агенты неподготовленные, или товар не нужен на рынке, или что-то еще. Еще раз обращаем Ваше внимание - статистика изучает массовые явления, и только на основании достаточной информации можно делать серьезные выводы. Еще стоит вспомнить о том, что связь бывает прямая и обратная. Прямой называется такая связь, при которой с увеличением одного признака увеличивается и другой. Например, чем больше количество страниц, которое машинистка может напечатать в час, тем больше документов она напечатает за рабочий день. При обратной связи все наоборот - с увеличением одного признака другой уменьшается, или при уменьшении одного другой увеличивается. Например, чем меньше времени тратит машинистка на печать одной страницы, тем больше страниц она напечатает в день, тем выше, соответственно, ее производительность труда (объем работы, выполняемый в единицу времени). Итак, Вы познакомились со стохастической связью. Частные случаи этого типа связи, которые мы и будем рассматривать - это корреляционная и регрессионная. Какими же методами изучаются эти связи? Начнем с самых простых. Метод аналитических группировок. С этим методом Вы уже немного знакомы (вспомните пример с размещением рекламы, который мы рассматривали, когда изучали группировки) - группируя имеющиеся данные по определенным признакам, можно оценить, существует между признаками какая-либо связь или нет, и при необходимости изучить этот вопрос более глубоко. Метод сопоставления параллельных рядов. Суть этого метода в том, что имеющиеся данные выписывают в два ряда значения независимого (факторного) признака - в один, а зависимого (результативного) - в другой, и, сопоставляя эти ряды, отслеживают, как изменяется зависимый признак. Рассмотрим пример с анализом связи между количеством агентов и объемом продаж товара. Предположим, мы изучили финансовые документы и получили следующие данные: Кол-во агентов 5 8 10 15 20 30 Объем продаж товара (штук) 92 164 198 275 380 549 Даже "невооруженным глазом" можно заметить, что чем больше агентов, тем больше единиц товара продается, следовательно, между признаками "количество агентов" и "объем продаж" есть связь. ЗАДАНИЕ 7. Если эти данные представить графически, то наличие связи будет еще более наглядно - попробуйте самостоятельно построить график зависимости объемов продаж от количества агентов и объясните, по каким признакам Вы можете сделать вывод о том, что связь есть. Метод, которым Вы только что воспользовались, называется графическим методом изучения связи между признаками. Им также пользуются для определения наличия и вида связи. Для этого на графике располагают точки, соответствующие полученным данным, и по виду расположения точек делают предварительные выводы о связи. А если бы объем продаж практически не изменялся, вывод был бы другим - связи между этими признаками, скорее всего, нет. Почему "скорее всего"? Да потому, что имеющейся у нас информации недостаточно, чтобы сказать об этом точно - может быть, мы неправильно собирали данные, или не учли сезонный спад спроса на товар - мало ли причин, по которым товар не продается. Так что вывод о том, что количество агентов надо сокращать, делать пока рановато. Пользуясь описанными выше методами, можно в принципе установить, есть связь между какими-то признаками или нет. Но очень часто необходимо не только знать о том, что между определенными признаками связь есть, но и определять, насколько она тесная, и как изменение одного признака будет влиять на изменение другого. Например, рост цен на бензин ведет к увеличению цен на большинство товаров и услуг. Но одни товары, в себестоимости которых транспортные расходы невелики, подорожают совсем немного, а другие, цена которых сильно зависит от стоимости доставки, могут подорожать весьма значительно. Как узнать, насколько изменяется цена товаров в зависимости от цены на топливо? Для решения такого типа задач и существует регрессионный анализ, позволяющий установить вид связи между признаками (линейная или нелинейная, прямая или обратная) и определить расчетные значения зависимой переменной. Мы с Вами рассмотрим в качестве примера уравнение однофакторной (парной) линейной регрессии, которое имеет следующий вид: = где у - теоретические значения результативного признака, полученные по уравнению регрессии, а0 и а] - коэффициенты (параметры) уравнения регрессии. "Физический" смысл этого уравнения в следующем: • все уравнение в целом показывает, как признак у изменяется в зависимости от изменения признака х; • коэффициент а1 говорит о силе связи между признаками х и у, то есть, чем он больше, тем больше изменяется у при изменении х на одну единицу (сравните, например уравнения у=2х и у=7х), а его знак - о направлении связи, если а1 положительный, то связь прямая, а если отрицательный - обратная. Параметры уравнения регрессии обычно находят методом наименьших квадратов (он реализован в различных математических и статистических компьютерных программах, регрессионный анализ можно также проводить при помощи электронных таблиц Ехсе1), но это связано с решением достаточно сложных систем уравнений, поэтому иногда их вычисляют по следующим формулам: Пример (из книги "Теория статистики", В.М.Гусаров, М.,"Аудит", 1998). Рассмотрим построение однофакторного уравнения регрессии зависимости производительности труда у от стажа работы х по данным таблицы (10 рабочих одной бригады заняты производством радиоэлектронных изделий, данные ранжированы по стажу их работы). Исходя из экономических соображений, стаж работы выбран в качестве независимой переменной х. Сопоставление данных параллельных рядов признаков х и у (см. табл.) показывает, что с возрастанием признака х (стаж работы), растет, хотя и не всегда, результативный признак у (производительность труда). Следовательно, между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно. Распределение рабочих бригады по выработке и стажу работы. Исходные данные Расчетные значения Номер рабочего Стаж работы, годы (х) Дневная выработка рабочего, шт. (У) х2 у2 ху у 4 1 4 1 16 4 4,6 6 2 5 4 25 10 5,2 3 3 6 9 36 18 5,8 1 4 7 16 49 28 6,4 2 5 7 25 49 35 7,0 7 6 8 36 64 48 7,6 9 7 8 49 64 56 8,2 10 8 9 64 81 72 8,8 8 9 10 81 100 90 9,4 5 10 9 100 81 90 10,0 Итого ∑х=55 ∑у=73 ∑х2=385 ∑у2=565 ∑ху=451 73,0 ЗАДАНИЕ 8 Для уточнения формы связи между рассматриваемыми признаками можно использовать графический метод. Постройте самостоятельно график зависимости выработки от стажа работы по приведенной в примере таблице (нанесите на график соответствующие точки и соедините их отрезками). Дневная выработка, шт Стаж работы, годы (х) Анализируя ломаную линию, можно предположить, что возрастание выработки (у) идет равномерно, пропорционально росту стажа работы (х). В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь, которая может быть выражена линейным уравнением регрессии: у = а0 + а1 х где у -теоретические значения результативного признака (выработки одного рабочего, шт.), полученные по уравнению регрессии, а0 и а1 -неизвестные параметры уравнения регрессии, х - стаж работы рабочих, годы. Пользуясь расчетными значениями (см. табл.), вычисляем параметры для данного уравнения регрессии. Следовательно, регрессионная модель распределения выработки по стажу работы для данного примера может быть записана в виде конкретного простого уравнения регрессии: Это уравнение характеризует зависимость среднего уровня выработки рабочими бригады от стажа работы. Экономически параметры регрессии можно интерпретировать так: • параметр а1>0, следовательно, связь прямая, то есть с увеличением стажа выработка также увеличивается; • величина этого параметра (0,6) свидетельствует о том, что при возрастании стажа на 1 год дневная выработка рабочего увеличивается в среднем на 0,6 изделия. Для удобства интерпретации параметра а] используют так называемый коэффициент эластичности (с понятием эластичности вы подробно познакомитесь в Рабочих тетрадях по экономике и маркетингу). Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по следующей формуле (%): В рассмотренном примере Э = 0,6 * Это означает, что с возрастанием стажа работы на 1% можно ожидать роста производительности труда в среднем на 0,45%. Для измерения тесноты связи, то есть насколько сильно связаны друг с другом изучаемые признаки, пользуются таким показателем, как коэффициент корреляции. Он рассчитывается на основе вычисления средних и средних квадратических отклонений (о которых мы говорили в предыдущей теме) признаков по следующим формулам: Это линейный коэффициент корреляции для двух признаков –х и у. Коэффициент корреляции изменяется от -1 до 1. Положительные значения коэффициента корреляции говорят о прямой связи, отрицательные - об обратной. Чем ближе значение коэффициента корреляции к 1 (или -1), тем сильнее связь между изучаемыми признаками, соответственно, чем ближе к 0, тем меньше теснота связи. При уровне корреляции приблизительно 0,6-0,7 по модулю уже можно говорить о наличии связи. Например, коэффициент корреляции между стажем рабочих и выработкой (из рассмотренного нами выше примера) равен 0,96 – это значит, что между стажем работы и выработкой существует прямая и достаточно сильная связь. В нашем примере с зависимостью объема продаж от количества агентов также можно при помощи коэффициента корреляции обнаружить устойчивую прямую связь - коэффициент корреляции равен 0,99. Кроме линейного существуют и другие виды коэффициентов корреляции.. Расчет коэффициента корреляции также возможен в электронных таблицах Ехсе1 и специальных статистических пакетах программ. Но при всем богатстве возможностей анализа данных и поиска связей между признаками и явлениями, прежде чем выявлять и анализировать какие-то связи, следует максимально подробно и логично описать самому себе, почему Вы предполагаете, что между данными признаками может быть связь, по каким основаниям можно сделать вывод о том, что она есть и как это можно проверить. То есть Вам нужно составить небольшой план анализа полученных данных. Это поможет избежать ошибок как в самом анализе, так и в выводах, которые Вы будете делать на его основе. И еще одно очень важное замечание - корреляционная связь совершенно не обязательно является причинно-следственной, если два явления связаны друг с другом, то это еще не значит, что одно является причиной другого, они просто изменяются сходным образом, возможно под воздействием совсем других факторов. Можно привести такой пример - очевидно, что летом увеличивается объем продаж темных очков и мороженого. Вероятно, между объемами продаж мороженого и темных очков существует достаточно тесная связь с высоким коэффициентом корреляции. Но из этого не следует и не может следовать, что люди едят больше мороженого потому, что покупают темные очки, или покупают темные очки потому, что едят мороженое. Рост объемов продаж обоих товаров связан с третьим фактором - сезоном, который и определяет во многом такую связь. Так что воздержитесь от поспешных выводов, если хотите, чтобы Ваши решения и действия приводили к положительным результатам. Подведем итоги 1. Одной из наиболее важных задач статистики является анализ и изучение связи между явлениями. 2. Связь бывает прямая и обратная, функциональная и стохастическая. 3. Наличие и тесноту (силу) связи можно установить, пользуясь регрессионным и корреляционным анализом. 4. Задачи регрессионного анализа - выбор формы связи и определение расчетных значений зависимой переменной (функции регрессии). 5. Задача корреляционного анализа - измерение тесноты связи между признаками и явлениями. 6. Наличие связи между явлениями совсем не означает, что одно явление является причиной другого. Тема 10. Ряды динамики и ряды распределения. В результате изучения этой темы Вы будете знать: • что такое ряды распределения и динамики; • виды рядов распределения и динамики и их характеристики; • как определить средний уровень интервального и моментного ряда; • основные приемы построения и анализа рядов; • показатели динамического ряда и методику их расчета; уметь: • строить ряды распределения и динамики; • анализировать ряды и определять основные показатели рядов распределения и динамики; иметь навыки: • рассчитывать показатели динамического ряда базисным и цепным способом. Сначала несколько определений. Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по определенному варьирующему (изменяющемуся) признаку. Например, вот такое распределение посетителей магазина по возрасту является рядом распределения: до 20 лет 21 -30 31 -40 41-50 51-60 больше 60 178 чел. 296 чел. 353 чел. 287 чел. 244 чел. 195 чел. Ряды распределения, построенные по атрибутивным признакам (таким признакам, которые нельзя выразить числом), называются атрибутивными. Пример таких рядов - распределение населения по полу, профессии, образованию и т.п. Другой тип рядов распределения - вариационные - это ряды, построенные по количественному (выражаемому числом) признаку. Например, распределение населения по возрасту или доходам, покупателей -по суммам покупок и т.п. - это вариационные ряды. Вариационные ряды распределения состоят из двух элементов - вариант и частот (весов). Варианта - это само числовое значение признака, а частота (вес) - число, показывающее, как часто встречается данная варианта в ряду распределения. Сумма всех частот составляет объем изучаемой совокупности. Для характеристики вариант и частот используют также такой показатель, как частость - то есть частоты, выраженные в виде относительных величин (в процентах или долях единиц). Сумма частостей равна 100%, если измеряется в процентах, или единице - если в долях. Давайте рассмотрим, что и как можно делать с рядами распределения. Предположим, что мы собрали такие данные о суммах (в рублях), затраченных покупателями на товары в одном из отделов нашего магазина: 113, 58, 58, 109, 79, 156, 113, 109, 109, 25, 79, 79, 109, 156, 58, 58, 109, 31, 113, 31, 109, 79, 58, 79, 109, 79, 156, 79, 79, 31, 79, 113, 79 Что можно сразу увидеть в этом ряду? То, что некоторые числа повторяются, то есть некоторые покупатели затратили на покупки одинаковые суммы. Но, согласитесь, даже с таким относительно небольшим количеством цифр работать уже непросто, а если их в десятки раз больше? Чтобы ряды распределения легко было анализировать, применяют определенные способы их упорядочения. Первое, что можно делать с таким рядом, - это ранжировать, то есть упорядочить по возрастанию или убыванию содержащихся в нем чисел. После ранжирования по возрастанию наш ряд будет выглядеть так: 25. 31, 31, 31, 58, 58, 58, 58, 58, 79, 79, 79, 79, 79, 79, 79, 79, 79, 79, 109, 109,109,109,109,109,109,113,113,113,113,156,156,156 Уже проще, по крайней мере, видно, какие максимальные и минимальные суммы потратили покупатели, и какие суммы встречаются чаще других. Но чтобы сделать анализ ряда распределения еще более удобным, обычно его организуют следующим образом: Номер варианты, обычно обозначается i 1 2 3 4 5 6 7 Варианта (значение), обычно обозначается хi 25 31 58 79 109 113 156 Частота (вес), обычно обозначается fi 1 3 5 10 7 4 3 Частость (%) 3% 9% 15% 31% 21% 12% 9% Чтобы получить такую таблицу, мы подсчитали частоту каждой варианты, то есть сколько раз она встречается в ряду, выписали все варианты и под каждой вписали ее частоту. Верхняя строка таблицы приведена для примера и удобства обозначения, если вариант немного, то ее писать необязательно, ведь порядковый номер каждой варианты можно посчитать и так. Частость определяется как отношение частоты к сумме частот . Например, для 1-ой варианты частость будет равна 1:33*100% = 3%. (где, 1 – частота данной варианты, 33 – сумма частот всех вариант). Теперь, когда мы наши неупорядоченные данные превратили в удобную для работы таблицу, их можно анализировать. Что же мы видим? Чаще всего наши покупатели тратили на товар 79 рублей. Как мы об этом узнали - просто посмотрели на строку "Частота", нашли самое большое значение (f4= 10) и нашли соответствующую этой самой большой частоте варианту (х4=79). О чем нам говорит представленный в примере ряд распределения, и какие выводы можно сделать? Во-первых, видны наиболее и наименее часто встречающиеся суммы покупок, следовательно, можно сделать предварительный вывод о том, какие товары пользуются наибольшим и наименьшим спросом. Сравнение рядов распределения сумм покупок в разных магазинах тоже может дать полезную информацию. Например, если в одинаковых отделах с примерно одинаковым ассортиментом ряды распределения сумм покупок сильно отличаются, это сигнал к тому, чтобы искать причину может быть, дело в продавцах, или в рекламе, или в расположении товаров на полках и витринах. Вариационные ряды делятся на дискретные и непрерывные. Дискретные ряды построены из дискретных (прерывных) величин, которые отличаются друг от друга на некоторую конечную величину (например, число детей в семье, количество посетителей магазина и т.п.). Непрерывные же ряды построены на непрерывных признаках, отличающихся друг от друга на сколь угодно малую величину и принимающих любые значения, в том числе и дробные. Примером непрерывного ряда может быть распределение времени, затрачиваемого на обслуживание одного клиента. Способы построения дискретных и непрерывных рядов различны. Если ряд состоит из не очень большого количества вариант, его можно оформить в виде таблицы, как мы уже делали в примере с суммами покупок. Как Вы убедились, построить дискретный ряд распределения несложно. А как быть, если признак изменяется непрерывно (например, время на проведение какого-то действия), или количество значений дискретного признака достаточно велико? В таких случаях строят так называемые интервальные ряды - ряды распределения, состоящие из определенных групп значений признака (интервалов - "от и до"). Например, при исследовании в магазине мы могли получить такие данные, как время, которое покупатель проводит в очереди в кассу, измеренное, предположим, с точностью до минуты. Что делать с этими данными? Согласитесь, что практически бессмысленно анализировать весь большой ряд цифр, показывающих затраченное посетителями магазина время, ведь нас интересуют, прежде всего, реальные практические выводы из нашего исследования. Одним из выводов, в частности, может быть обоснование установки дополнительных кассовых аппаратов, чтобы снизить время, на ожидание в очереди. Как нам узнать, нужны ли дополнительные кассы? Для этого мы можем распределить все полученные данные по следующим интервалам - например, "до 5 минут в очереди", "5-10 минут". "11-20 минут", "больше 20 минут" и получить, предположим такую таблицу. Интервалы Время, проведенное в очереди до 5 мин 5-10 мин 11-20 мин больше 20 мин Кол-во покупателей, затративших такое время в очереди 226 457 143 65 С такой таблицей, где данные распределены по интервалам, гораздо проще работать. Сразу видно, что подавляющее большинство покупателей (683 из 891) проводит в очереди не больше 10 минут - мы просто сложили цифры из первого и второго столбца (226 и 457) и сравнили их с общим количеством покупателей (226+457+143+65), о которых у нас есть данные. Поскольку большинство покупателей, как мы видим, ждет в очереди не больше 10 минут, скорее всего, руководство магазина не будет нести дополнительные расходы и устанавливать новые кассовые аппараты. А если бы распределение данных по тем же интервалам было полностью противоположным, вот таким: Интервалы Время, проведенное в очереди до 5 мин 5-10 мин 11-20 мин больше 20 мин Кол-во покупателей, затративших такое время в очереди 65 143 457 226 Видимо, в этом случае менеджерам стоит задуматься о том, что покупатели слишком много времени проводят в очереди, и постараться найти способы решения данной проблемы. Построение таких рядов весьма часто используется в экономике и управлении - тарифные сетки, шкалы налогов, возрастные группы - это все примеры интервальных рядов распределения. При построении интервальных рядов необходимо установить оптимальное количество интервалов, на которое разбиваются все единицы изучаемой совокупности. Количество интервалов зависит от объема изучаемой совокупности, степени разброса данных, задач исследования и других факторов. В приведенном выше примере мы разбили наши данные на такие интервалы просто исходя из "здравого смысла". В случаях, когда необходимо более точное и обоснованное разбиение на интервалы, для расчета необходимого количества равных интервалов применяют формулу Стерджесса: n = 1 + 3,322 lg N где n - количество групп, на которые разбивается вся совокупность, N - число единиц совокупности. Чтобы не высчитывать каждый раз логарифм, можно пользоваться следующей таблицей: N 15-24 25-44 45-89 90-179 180-359 360-719 n 5 6 7 8 9 10 То есть, если количество единиц изучаемой совокупности находится в пределах от 15 до 24, можно ее разбивать на 5 групп (интервалов), от 25 до 44 - на 6 групп и т.д. Однако, не стоит применять данную формулу всегда и везде, в первую очередь разбиение на интервалы должно быть обосновано целями и задачами анализа Ваших данных. Величину интервала (если необходимы равные интервалы) можно вычислять так: 1. посчитать разность между максимальным и минимальным значениями признака (если помните, эта разность называется размахом вариации); 2. полученное число разделить на количество интервалов - это и будет величиной интервала. Например, если в нашу выборку попали покупатели от 16 лет (минимальное значение) до 70 лет (максимальное), то величину интервала можно легко посчитать: 1. из максимального значения вычитаем минимальное (70-16 = 54) и получаем размах вариации 54 (года); 2. определяем необходимое количество интервалов. Если весь объем выборки составил, предположим, 300 человек, то имеет смысл разделить их на 5 интервалов, а не на 9, как следует из формулы Стерджесса, так как при делении на 9 интервалов в каждом интервале при условии приблизительно равномерного распределения может оказаться всего около 30 человек, и сложно будет найти какие-то общие свойства такой группы или ее отличия от других. Как Вы, должно быть, помните, чем больше совокупность, тем меньше случайностей может оказать влияние на наши выводы о ней. Итак, исходя из задач анализа, мы определили, что интервалов будет 5; 3. делим 54 (размах вариации) на 5 (количество интервалов) и получаем величину интервала - округленно 11 (лет). Тогда наша таблица с интервалами будет выглядеть так (в скобках пояснения, как появилась данная цифра): От 16 (минимальное значение) до 26 лет (до 26, а не до 27, как кажется на первый взгляд, так как 16 входит в интервал и получается, что в интервале находится 11 лет – величина интервала) 27 (т.к. все, кому 26 полных лет, попадают в предыдущий интервал) – 37 лет 38-48 49-59 60-70 Пока мы с Вами говорили о рядах распределения, никак не связанных с изменением состояния исследуемого объекта во времени, а ведь изучение социально-экономических явлений в динамике - одна из наиболее важных задач статистики. Поэтому перейдем к рассмотрению временных (динамических) рядов, их также называют рядами динамики, при помощи которых можно анализировать изменение различных показателей во времени. Динамическим называется ряд значений статистических показателей, расположенных в хронологической последовательности. Динамический ряд состоит из двух элементов: • время (момент или период), к которому относятся статистические данные; • статистические показатели, которые характеризуют изучаемый объект на определенный момент или за указанный период времени, эти показатели называют уровнями ряда. Если уровни ряда характеризуют состояние объекта на какой-то определенный момент времени (дату, час и т.п.), такой ряд называется моментным. Например, моментным является ряд, описывающий курс доллара на каждую конкретную дату (цифры условные): Дата 01.04 01.05 01.06 01.07 Курс $ (руб.) 31,60 32,10 32,24 32,86 В случае, когда статистический показатель характеризует явление за определенный период времени (месяц, квартал, год и т.п.), такой ряд называется интервальным (периодическим): Период 1 квартал 2 квартал 3 квартал 4 квартал Объем производства продукции (шт.) 1228 1354 1311 1348 Значения интервального ряда можно суммировать, получая таким образом данные о более крупных интервалах. Например, если мы просуммируем показатели объема производства за четыре квартала, то получим объем производства за год. Иногда интервальный ряд удобно представлять в виде ряда с нарастающими итогами (кумулятивного), тогда таблица может выглядеть так: Период 1квартал 2 квартал 3 квартал 4 квартал Объем производства за квартал 1228 1354 1311 1348 Объем производства (нарастающим итогом) 1228 2582 3893 5241 При составлении такой таблицы в каждой следующей ячейке пишется сумма показателей за данный период времени и за предыдущий. В нашем примере (в последней строке) сначала идут данные за 1 квартал, затем сумма объемов за первый и второй квартал (1228 + 1354=2582), то есть объем производства за полгода, затем к ним прибавляются данные соответственно за третий и четвертый кварталы, и таким образом в последней ячейке мы получаем данные об общем объеме производства за все четыре квартала, то есть за год. Уровни в динамическом ряду могут быть представлены абсолютными, относительными, и средними величинами. Графически ряды динамики обычно представляют в виде гистограмм (дискретные величины) или линейных графиков (непрерывные величины) - об этом мы с Вами уже говорили в Теме 7. Одной из наиболее важных задач при анализе рядов динамики является выявление и изучение основной тенденции изменения уровней ряда, которая называется трендом. Кроме того, при помощи анализа рядов динамики можно: • характеризовать интенсивность изменений изучаемого объекта; • выявить основные закономерности изменений объекта; • определить факторы, которые оказывают значительное влияние на изменения объекта во времени; • дать прогноз развития объекта на будущее. Для решения этих задач разработана система показателей динамики, в которую входят: ◦ абсолютный прирост (сокращение) ◦ темп и коэффициент роста; ◦ темп прироста; ◦ абсолютное значение одного процента прироста. Все показатели динамики могут рассчитываться на постоянной и переменной базе. Что имеется в виду по этими названиями? В общем, ничего сложного. Расчет на постоянной базе, его также называют базисным способом расчета, означает, что каждый уровень ряда сравнивается с каким-то одним, выбранным в качестве основы для сравнения (этот уровень называют базисным). Обычно в качестве базисного берут первый уровень ряда или тот уровень, с которого начинается какой-то новый этап в развитии изучаемого объекта. Обозначается базисный уровень у0. Расчет же на переменной базе проводится путем сравнения каждого следующего уровня с предыдущим, такой способ еще называют цепным. Рассмотрим смысл и возможности применения этих показателей на примере изучения динамики посетителей магазина "Заводской". Неделя (номер с момента открытия магазина) 1 2 3 4 5 6 7 8 Кол-во посетителей (чел.) 138 234 288 343 388 446 491 532 Условные обозначения у1 у2 у3 у4 у5 у6 у7 у8 Абсолютный прирост (сокращение), его также называют абсолютным изменением - это разность между двумя уровнями ряда динамики, он показывает, на сколько данный уровень отличается от уровня, взятого в качестве базы для сравнения. Соответственно, формулы для базисного и цепного способа выглядят так. Базисный способ А = уi – у0 Цепной способ А = уi- уi-1 где, соответственно, А - абсолютное изменение, у0 - базисный уровень, уi - сравниваемый уровень (его также называют отчетным), уi-1 - уровень предшествующего периода. Если мы проведем расчеты по этим формулам для наших данных, получим следующую таблицу: Неделя (номер с момента открытия магазина) 1 2 3 4 5 6 7 8 Кол-во посетителей (чел.) 138 234 288 343 388 446 491 532 Базисный абсолютный прирост (базисный уровень у0 =- у1 = = 138) --- 234-138=96 288-138=150 343-138=205 250 318 353 394 Цепной абсолютный прирост 234-138=96 288-234=54 343-288=55 45 58 49 41 ЗАДАНИЕ 9. В данной таблице в результатах расчетов базисного и цепного абсолютного прироста есть две ошибки. Найдите и исправьте их. Если значение абсолютного изменения положительное (А>0), то это прирост, а если отрицательное (А<0) - сокращение. Цепные и базисные абсолютные приросты связаны между собой - сумма последовательных цепных абсолютных приростов равна базисному, то есть общему приросту за весь изучаемый промежуток времени. Для характеристики интенсивности, то есть относительного изменения уровня ряда за какой-либо период, вычисляют такие относительные показатели (вспоминайте Тему 6), как коэффициент и темп роста (снижения). Эти показатели рассчитываются как отношение отчетного уровня к базисному, при этом коэффициент роста рассчитывается в долях единицы и означает, во сколько раз сравниваемый уровень больше или меньше того, с которым проводится сравнение. Темп роста - это тот же самый показатель, но рассчитанный в %. Формулы для расчета коэффициента и темпа роста выглядят так: Базисный Цепной Коэффициент роста Темп роста Для нашего примера с магазином "Заводской" коэффициенты и темпы роста будут выглядеть так: Неделя 1 2 3 4 5 6 7 8 Кол-во посетителей 138 (чел.) 234 288 343 388 446 491 532 Базисный коэффициент роста(базисный уровень у0= у1 = 138) 234: 138 = 1,70 288: 138 = 2,09 2,49 2,81 3,23 3,56 3,86 Цепной коэффициент 234:138 = 1,70 роста 288:234=1,23 1,19 1,13 1,15 1,10 1,08 О чем говорят эти показатели, и как их можно использовать в практической деятельности? Например, если мы посмотрим на строку "цепной коэффициент роста", то легко сможем увидеть, что несмотря на увеличение количества посетителей, темп роста снижается, следовательно, если не принимать никаких дополнительных мер по привлечению посетителей их количество, скорее всего, стабилизируется в течение нескольких недель и больше увеличиваться не будет. Если достигнутое количество посетителей соответствует планам, хорошо. А если запланированное количество посетителей значительно больше? Тогда на основании расчета коэффициентов и темпов роста можно спрогнозировать развитие ситуации и сделать вывод о том, что пора предпринимать какие-то активные действия по привлечению новых посетителей. Если значения коэффициентов роста меньше единицы, это означает, что наблюдается не рост, а сокращение, то есть следующий уровень ряда меньше предыдущего (или базисного). Относительную оценку скорости изменения уровня ряда дают такие показатели, как коэффициент и темп прироста, которые можно рассчитать на основе коэффициентов и темпов роста. Формулы этих показателей выглядят так: Коэффициент прироста Темп прироста Кпр = Кр -1 Тпр = Тр -100 Они показывают, на сколько сравниваемый уровень больше или меньше уровня, принятого за базу сравнения. При анализе рядов динамики важно знать, какие абсолютные значения скрываются за различными показателями. Поэтому, чтобы правильно оценивать, например, темп прироста, его рассматривают в сопоставлении с показателем абсолютного прироста. Результат такого сравнения называется абсолютным значением (содержанием) одного процента прироста и рассчитывается как отношение абсолютного прироста к темпу прироста за тот же период времени по следующей формуле: где А - абсолютный прирост, Тпр - темп прироста. Ниже, в таблице представлены виды и расчет показателей рядов динамики. ВИДЫ И РАСЧЕТ ПОКАЗАТЕЛЕЙ РЯДОВ ДИНАМИКИ Показатели Алгоритм расчета 1. Абсолютный прирост: -базисный -цепной Δ yб.п. = yi – y0 Δ yц.п. = yi – yi-1 2. Коэффициент роста: - базисный - цепной Kp.б. = yi / y0 Kp.ц. = yi / yi-1 3. Коэффициент прироста: - базисный - цепной Kpп.б. = Kp.б. – 1 Kpп.ц = Kp.ц - 1 4. Темп роста: - базисный - цепной Тр.б. = (yi / y0) * 100% Тр.ц. = (yi / yi-1) * 100% 5. Темп прироста: - базисный - цепной Тпр.б. = Тр.б. – 100 Тпр.ц. = Тр.ц. - 100 6. Абсолютное значение 1% прироста = Абсолютный прирост : Темп прироста ЗАДАНИЕ 10. Пользуясь соответствующими формулами, рассчитайте недостающие цепные показатели динамики. Произведите расчеты. Год Пассажиро оборот, млрд пасс. км Цепные показатели динамики Абсолютный прирост млрд пасс, км Темп роста, % Темп прироста, % Абсолютное значение 1% прироста млрд пасс, км XXXI 127,0 ХХХ2 102,4 ХХХ3 3,8 ХХХ4 164,6 ХХХ5 ХХХ6 8,3 1,70 Как и для других статистических показателей, для обобщающей характеристики рядов динамики используют различные средние - в частности, средний уровень ряда, средние темпы роста и прироста. Средний уровень ряда. Этот показатель рассчитывается по-разному для интервальных и моментных рядов. Для интервальных рядов динамики из абсолютных уровней средний уровень ряда рассчитывается по формуле средней арифметической, при этом в случае равных интервалов применяется средняя арифметическая простая, а при неравных - средняя арифметическая взвешенная. Простая средняя арифметическая для интервального ряда где уi - уровни ряда от 1 до n, n -число уровней ряда. Пример. Для наших данных о количестве посетителей магазина "Заводской" можно рассчитать простую среднюю арифметическую, так как интервалы равные (1 неделя). Для этого суммируем количество посетителей за 8 недель (138 + 234+288 + +343+388+446+491+532=2860), делим полученную сумму на 8 (так как у нас всего 8 уровней ряда) и получаем результат — среднее количество посетителей в неделю — 357,5. Средняя арифметическая взвешенная для интервального ряда с неравными интервалами: где уi - уровни ряда, ti - веса (в данном случае количество интервалов времени - дней, недель, месяцев и т.п. - между смежными датами). Пример. Предположим, что в некоторой фирме с 1 по 15 число месяца работали 12 человек, с 16 по 25 - 18 человек, а с 26 по 30 - 21 человек. Задача - рассчитать такой часто применяющийся показатель, как среднесписочное число работников за месяц. Запишем интервальный ряд: Дата (t) 1 – 15 16 – 25 26 - 30 Кол-во работников (y) 12 18 24 Интервалы неравные, поэтому считаем по формуле средней арифметической взвешенной для интервального ряда 12 (чел) * 15(дней) + 18*10 + 24*5 = 480 = 16 30 (дней) 30 Результат - среднесписочное число работников за месяц -16 (чел.). Для моментных рядов используются другие формулы. Средний уровень моментного ряда с равными промежутками между датами определяется по формуле средней хронологической для моментного ряда: где п -число дат, у1 ... , уn - уровни ряда в соответствующие моменты времени. Пример. Предположим, нам нужно посчитать средний месячный курс доллара в квартале, и мы имеем данные о курсе доллара на первое число каждого месяца (цифры условные). Моментный ряд в этом случае выглядит так: Дата 01.04 01.05 01.06 01.07 Курс $ (руб) 24,26 25,10 25,24 25,86 Проводим расчет: Следовательно, средний курс за квартал равен 25,19(руб./$). Средний уровень моментных рядов с неравномерными промежутками между датами рассчитывается по формуле средней хронологической взвешенной: где у1 - уровни ряда, t1 - количество дней (недель, месяцев и т.п.) между смежными датами. Пример. Предположим, на 1 января отчетного года стоимость основных фондов предприятия составила 75 млн. руб. В марте были приобретены основные фонды на сумму 2 млн. руб., в мае выбыло основных фондов на 7 млн. руб., а в сентябре - еще приобретено основных фондов на 8 млн. руб. Необходимо рассчитать среднегодовую стоимость основных фондов предприятия. Промежутки между датами неравные, поэтому используем формулу средней хронологической взвешенной. Для наглядности расчетов составляем таблицу: Даты Стоимость основных фондов (млн. руб.) Количество месяцев между смежными датами (число месяцев, в течение которых стоимость фондов не изменялась) У,*, 1 января 75 3 (с января по март включительно) 225(75x3) 1 апреля 77(75+2) 2 (апрель и май) 154(77x2) 1 июня 70(77-7) 4 (с июня по сентябрь включительно) 280(70x4) 1 октября 78(70+8) 3 (с октября по декабрь включительно) 234(78x3) Итого: 12(∑t1 , то есть всего месяцев) 893 (∑yiti) Делим в соответствии с формулой 893 на 12 и получаем среднегодовую стоимость основных фондов - 74,417 млн. руб. Вы можете спросить, зачем такие сложности, ведь можно было посчитать по формуле обычной средней арифметической - сложить стоимость на начало и на конец года и разделить на два. О том, что в таких случаях лучше применять среднюю взвешенную, мы уже говорили в Теме 8, но давайте проверим, что получится - (75+78)/2=76,5 млн. руб. А рассчитанный по средней взвешенной - 74,417 млн. руб. Разница практически в 2 миллиона рублей, и только из-за методики расчета! А ведь со стоимости основных фондов платятся налоги. Представляете, сколько можно сэкономить, если хорошо знать статистику и правильно применять соответствующие формулы. ЗАДАНИЕ 11. В течение полугода Вам приходилось несколько раз изменять цену на свой товар. Для сравнения своей цены с ценами конкурентов Вам необходимо рассчитать, пользуясь приведенными ниже данными, среднюю цену на товар за это полугодие: Дата 1 января 1 марта 1 мая 1 июля Цена товара 1264 1302 1314 1330 Завершая эту тему, стоит сказать и о том, что для получения логичных правильных результатов и выводов при построении и анализе рядов динамики, статистические данные должны быть - по территории, единицам измерения, времени регистрации, ценам и т.п. Например, если Вы в одном месяце будете регистрировать количество посетителей магазина только вечером, в другом - только утром, а затем попытаетесь сравнить получившиеся ряды динамики, формально Вы получите какие-то данные, но в них будет мало смысла, и на их основе нельзя будет сделать никаких практических выводов. Или, если Вы хотите сравнить динамику объема продаж (в рублях) Вашей компании за этот год и позапрошлый, для действительно адекватных выводов Вам придется сначала привести все данные к так называемым сопоставимым ценам, то есть ценам одного определенного (базисного) периода и одинаково описывающим стоимость товара, чтобы не получилось, что Вы сравниваете тысячи с миллионами, а доллары – с рублями. Подведем итоги 1. Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по определенному варьирующему (изменяющемуся) признаку. 2. Ряды распределения бывают атрибутивные (построенные по качественному признаку) и вариационные (построенные по количественному признаку). 3. Вариационные ряды распределения состоят из двух элементов - вариант (значений) и частот (весов). 4. Вариационные ряды делятся на дискретные и непрерывные. 5. Если признак изменяется непрерывно или количество значений дискретного признака достаточно велико, строят интервальные ряды. 6. Для изучения изменений объекта во времени строят и анализируют ряды динамики. 7. Для анализа динамических рядов разработана система показателей динамики, в которую входят: абсолютный прирост (сокращение), темп и коэффициент роста, темп прироста, абсолютное значение одного процента прироста. 8. Все показатели динамики могут рассчитываться на постоянной (базисный способ) и переменной (цепной способ) базе. 9. Для получения логичных правильных результатов и выводов при построении и анализе рядов распределения и динамики статистические данные должны быть сопоставимы. Тема 11. Индексы. В результате изучения этой темы Вы будете знать: • что такое индексы и для чего они применяются; • виды индексов, порядок их исчисления и взаимосвязи; уметь: • рассчитывать индивидуальные и общие индексы (цен, стоимости, физического объема); иметь навыки: • применять индексный метод при анализе социально-экономических показателей. Наряду со средними и показателями вариации одними из наиболее часто применяемых в статистике показателей являются индексы (от латинского слова index - "указатель, показатель"). С их помощью можно: • характеризовать развитие экономики в целом и отдельных отраслей; • анализировать результаты деятельности предприятий и организаций; • исследовать роль отдельных факторов в формировании социально-экономических показателей. Индексы также широко используются при международных сопоставлениях экономических показателей, определении уровня жизни, мониторинге деловой активности и т.д. В статистике под индексом понимают относительный показатель, характеризующий изменение величины какого-либо объекта во времени, пространстве или по сравнению с эталоном (нормативом, планом, прогнозом и т.п.). Например, предприятия обычно выпускают много разных видов продукции и продают их по разным ценам, поэтому нельзя простым сложением количества всех видов продукции в натуральных единицах измерения (штуках, тоннах, метрах и т.п.) получить общую характеристику объема производства. Представьте, что будет, если мы начнем складывать друг с другом метры ткани, килограммы кожи и штуки костюмов и платьев, и на основании таких несуразных чисел делать выводы об объеме производства предприятия. Вот тут-то и приходят на помощь индексы, которые позволяют привести разнородные продукты к соизмеримым величинам (мерам соизмерения). В качестве меры соизмерения разнородных продуктов можно использовать цену, себестоимость или трудоемкость единицы продукции. Для удобства восприятия индексов в теории статистики разработаны и приняты определенные обозначения. Каждая индексируемая величина имеет свое обозначение: qi - обозначается количество единиц данного вида продукции; pi - цену единицы продукции; уi - себестоимость единицы продукции; ti -трудоемкость (затраты времени на производство) единицы продукции, и так далее. Чтобы различать, к какому периоду относятся индексы, их также обозначают и цифрами - 0 для базисного периода (вспомните, какой период называется базисным, а какой -отчетным, мы это изучали в предыдущей теме), 1 - для отчетного (сравниваемого). Различают индивидуальные индексы, которые характеризуют изменение только одного элемента совокупности, например, выпуск одного вида продукции, и общие (сводные) индексы, характеризующие всю совокупность или сложное явление. Индивидуальные индексы обозначаются i, общие - I, при этом для всех типов индексов внизу справа добавляется обозначение индексируемого показателя. Например, ip - индивидуальный индекс цен, Iq - общий индекс объема продукции. Индексы также бывают базисные (рассчитанные базисным способом, о котором мы говорили в предыдущей теме), и цепные (рассчитанные цепным способом). Общие индексы могут быть также построены двумя способами – как агрегатные, и как средние из индивидуальных. Примеры и способы расчета основных типов индексов мы с Вами сейчас рассмотрим. Индивидуальные индексы рассчитываются достаточно просто - они представляют собой отношение двух индексируемых величин: - индивидуальный индекс цен, где р1 - цена единицы продукции в отчетный период, р0 -цена единицы той же продукции в базисный период. Если в прошлом (базисном) году производимый швейной фабрикой костюм стоил, предположим, 600 рублей, а в этом (отчетном) - 720 рублей, то индекс цен на данный товар составит 1,2 (720 делим на 600 и получаем 1,2). Это означает, что цена на костюм в отчетном периоде увеличилась в 1,2 раза по сравнению с базисным периодом. Так же считаются и другие индивидуальные индексы. Если же мы хотим выяснить, например, как изменилась общая стоимость произведенной швейной фабрикой продукции по сравнению с прошлым годом, то необходимо рассчитать общий индекс стоимости по следующей формуле: То есть мы отдельно для отчетного и базисного периодов умножаем количество произведенной продукции каждого вида на стоимость этого вида продукции, полученные цифры складываем и получаем общую стоимость продукции за соответствующий период (например, 1000 рубашек по 25 рублей + 400 костюмов по 720 рублей + 600 платьев по 500 рублей составит общую стоимость продукции за отчетный период - 613 тыс. руб., а 800 рубашек по 25 рублей + 400 костюмов по 600 рублей + 500 платьев по 400 рублей составит общую стоимость продукции за базисный период - 460 тыс. руб.). Затем делим стоимость за отчетный период на стоимость за базовый период (613 делим на 460) и получаем общий индекс стоимости продукции - приблизительно 1,33. С одной стороны, мы получили то, что хотели - сравнили стоимость продукции фабрики за отчетный и базисный период. С другой стороны, у способа, которым мы рассчитывали индекс, есть существенный недостаток: имея только такой индекс, нельзя сказать, за счет чего именно увеличилась стоимость продукции - за счет увеличения физического объема производства (в штуках, метрах и т.п.), повышения цены на продукцию, или и того и другого вместе. Почему так происходит? Потому что в данной формуле одновременно изменяются обе величины - и в числителе, и в знаменателе, в данном случае и цена, и объем производства. Этот недостаток устраняется при помощи агрегатных индексов, основной особенностью которых является то, что в числителе и знаменателе меняется только одна величина, значение же другой (соизмеримой), остается неизменным. Например, если в формуле общего индекса стоимости устранить влияние изменения цен, рассчитав и числитель, и знаменатель в ценах базисного периода, то получим так называемый агрегатный индекс физического объема: Этот индекс, предложенный немецким экономистом Э. Ласпейресом, показывает, во сколько раз изменился физический объем продукции в отчетном периоде по сравнению с базисным. Таким же образом можно рассчитывать агрегатные индексы цен, себестоимости, трудоемкости и т.п. Агрегатный способ вычисления индексов в статистике является наиболее распространенным, но не единственным. В тех случаях, когда имеющейся информации недостаточно для расчета агрегатных индексов, используют способ расчета средних из индивидуальных индексов. Например, когда неизвестны количества произведенных отдельных видов продукции, но известны индивидуальные индексы для этих видов продукции (i) и стоимость каждого вида продукции базисного периода (р10q10 , можно легко определить средний арифметический индекс физического объема продукции по формуле: Если же известны данные, которые позволяют вычислить только числитель агрегатного индекса физического объема, то, выразив продукцию базисного периода как q10 = q11 / pq можно заменить знаменатель в формуле агрегатного индекса физического объема, и получить формулу среднего гармонического индекса физического объема: Как мы уже говорили, индексы применяют для анализа сложных экономических явлений, в частности для описания изменений цен на потребительском уровне в городах, регионах и стране в целом. Для этого рассчитывают так называемый индекс потребительских цен: стоимость рыночной корзины базисного периода в текущем году *100 ИПЦ = стоимость рыночной корзины базисного года в базисном году Этот индекс характеризует изменение во времени общего уровня цен на товары и услуги, приобретаемые населением для непроизводственного потребления. Он является одним из важнейших показателей инфляции и используется для анализа социально-экономических процессов, регулирования курса национальной валюты, определения уровня минимальных социальных гарантий и других целей. Индексный метод широко используется и в аналитических целях, так как дает возможность устранить влияние отдельных факторов, характеризующих явление, и ответить на вопрос, за счет изменения каких составляющих изменяется объект в целом. Ниже, в таблице представлены виды и расчет наиболее распространенных экономических индексов. ВИДЫ И РАСЧЕТ НАИБОЛЕЕ РАСПРОСТРАНЕННЫХ ЭКОНОМИЧЕСИХ ИНДЕКСОВ Наименование индекса Алгоритм расчета Индивидуальные индекс Общие индексы 1. Индекс физического объема iq = q1 / q0 Iq = ∑ p1q1 / ∑ p1q0 или Iq = ∑ p0q1 / ∑ p0q0 2. Индекс цен ip = p1 / p0 Ip = ∑ p1q1 / ∑ p0q1 или Ip = ∑p1q0 / ∑p0q0 3. Индекс стоимости ipq = p1q1 / p0q0 Ipq = ∑p1q1 / ∑p0q0 = Ip Iq ЗАДАНИЕ 12 Вам предоставили следующие данные об объемах производства и ценах на товары Вашей компании: 2011 год 2022 год Кол-во Цена за шт. Кол-во Цена за шт. Изделие 1 26 14540 32 14810 Изделие 2 138 8150 412 8340 Изделие 3 670 1600 650 1620 По приведенным в таблице данным рассчитайте следующие индексы: Общий индекс стоимости изделия 1 Общий индекс стоимости изделия 2 Общий индекс стоимости изделия 3 Общий индекс стоимости продукции компании Агрегатный индекс физического объема продукции компании Агрегатный индекс цен продукции компании Как изменилась общая стоимость продукции компании? Можно ли на основании данных таблицы ответить на вопрос, за счет чего в основном произошло изменение общей стоимости продукции компании в 2012 году? Подведем итоги 1. Для анализа сложных социально-экономических явлений и процессов используется такой вид статистических показателей, как индексы. 2. Индекс - это относительный показатель, характеризующий изменение величины какого-либо объекта во времени, пространстве или по сравнению с эталоном. 3. Индексы позволяют привести разнородные продукты к соизмеримым величинам. 4. Индексы разделяют на индивидуальные, характеризующие изменение одного элемента совокупности, и общие (сводные), при помощи которых можно описать всю совокупность, процесс или явление. 5. В зависимости от базы сравнения индексы также бывают базисные (рассчитанные базисным способом) и цепные (рассчитанные цепным способом). 6. По способу построения индексы бывают агрегатные и средние из индивидуальных. 7. Основное отличие агрегатного индекса состоите том, что при его расчете только одна величина изменяется, а другая остается неизменной. 8. Индексный метод широко используется как для оценки различных социально-экономических явлений и процессов, так и в аналитических целях. Тема 12. Организация статистики в Российской Федерации. В результате изучения этой темы Вы будете иметь представление: • о современной организации государственной статистики в Российской Федерации: • о Системе Национальных Счетов (СНС) ООН. Организация статистических наблюдений и статистического учета в масштабах страны - важная часть системы управления государством. Изучением социально-экономического развития страны, регионов, отраслей, предприятий занимаются специально созданные для этого органы, совокупность которых называется статистической службой. В Российской Федерации функции статистической службы выполняют органы государственной и ведомственной статистики. В РФ действующая в основном централизованная система статистического наблюдения, основным элементом которой является Государственный Комитет РФ по статистике, сочетается с функционированием необособленной системы, когда сбор, обработка, анализ и хранение информации обеспечивается отдельными органами или ведомствами, такими как налоговая инспекция, Госкомимущество РФ, органы здравоохранения, таможенный комитет и т.п. Централизованная система осуществляет сбор и анализ данных для наиболее важных общегосударственных исследований, разрабатывает методологию организации и проведения такой работы, выполняет функции руководства и контроля за системой сбора информации в министерствах, ведомствах, регионах. Общее руководство и методологическое обеспечение проводимых в стране статистических наблюдений осуществляет Госкомстат РФ. Можно выделить такие важнейшие его задачи: • сбор данных о социально-экономическом положении страны, регионов, отраслей экономики; • реализация программ по проведению важнейших общегосударственных наблюдений - переписей населения, бюджетных обследований и т.п.; • развитие методологии и организации единой системы статистической отчетности, предоставляемой государственными и частными предприятиями, общественными организациями и другими учреждениями; • сбор данных по программам международных организаций; • создание и развитие технологий сбора, хранения, поиска и предоставления информации потребителям. Как и любая другая деятельность, организация статистического наблюдения нуждается в постоянном совершенствовании и развитии. Одним из важнейших направлений такого развития в настоящее время является переход на систему национальных счетов (СНС). В соответствии с Постановлением Верховного Совета РФ от 14 февраля 1992 года "О переходе на принятую в международной практике систему учета и статистики" разработана Государственная программа перехода РФ на СНС. Выполнение этой программы призвано обеспечить: • переход к системе учета и статистики в соответствии с международными стандартами; • повышение уровня достоверности и эффективности собираемой информации; • внедрение более эффективных методов статистической работы. Решение перечисленных выше задач требует обеспечения системности и скоординированности всех этапов статистического наблюдения на разных уровнях управления. В связи с этим необходима реконструкция статистического наблюдения, которая включает: • введение единого регистра для всех хозяйствующих субъектов; • адаптацию международных классификаций и стандартов к российской практике; • сближение учета с международными стандартами. Единый государственный регистр предприятий и организаций всех форм собственности (ЕГРПО) является новым организационным и технологическим видом сплошного наблюдения и представляет собой, говоря условно, базу данных, в которой хранятся определенные сведения обо всех субъектах рынка с правом и без права юридического лица. Введение ЕГРПО позволяет обеспечить сплошное наблюдение по определенному набору статистических показателей по всей совокупности объектов (предприятий, организаций, предпринимателей без образования юридического лица и т.п.), проходящих государственную регистрацию на территории РФ. Сбор и хранение статистической информации в России организованы следующим образом - все зарегистрированные предприятия и организации регулярно предоставляют в местные органы статистики сведения о результатах своей деятельности по установленным формам. Эти данные частично обрабатываются, обобщаются и направляются в органы статистики более высокого уровня - из районных органов в городские и областные, затем в республиканские (региональные) и в итоге в центральные органы Госкомстата РФ, где обобщаются, и на их основе строятся различные показатели социально-экономического развития страны, регионов, отраслей и т.п. Статистические органы периодически публикуют основные сведения в специальных сборниках, и этими данными можно пользоваться для подготовки и проведения собственных статистических наблюдений, например, для исследований рынка. Кроме официальных публикаций органы статистики оказывают услуги по предоставлению необходимой информации на возмездной основе, поэтому, если Вас интересуют определенные статистические данные, не вошедшие в официальные публикации, Вы можете заказать подбор такой информации в соответствующих местных органах статистики. Правильное использование имеющихся у государственных органов статистики данных может оказать Вам существенную помощь при организации и проведении собственных наблюдений, в частности, исследований рынка, потенциального потребителя, конкурентов и других субъектов рыночных отношений, а также при планировании и организации деятельности в Вашей фирме или на предприятии. Подведем итоги 1. Организация статистических наблюдений и учета - важная часть системы управления государством. 2. Организацией статистики в стране занимается статистическая служба. 3. Основным элементом системы статистического учета в РФ является Госкомстат РФ. 4. В настоящее время в организации статистической деятельности в РФ осуществляется переход на систему национальных счетов (СНС). 5. Статистические сведения, собираемые системой государственной статистики - важный источник информации необходимой для управления