«Статистические показатели и данные.»

Конспект лекции по дисциплине «Статистические показатели и данные.», Word формат

МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ТВЕРСКАЯ ГОСУДАРСТВЕННАЯ СЕЛЬСКОХОЗЯЙСТВЕННАЯ АКАДЕМИЯ» Кафедра бухгалтерского учета, финансов, АЭД и аудита Егорова Е.В. Конспект лекций для бакалавров направления 080100.62 – Экономика, профиль – Бухгалтерский учет, анализ и аудит, направления 080200.62 – Менеджмент, профиль – Производственный менеджмент, направления 100800.62 – Товароведение, профиль – Товароведение и экспертиза товаров (в сфере производства и обращения сельскохозяйственного сырья и продовольственных товаров) (часть 1) Тверь, 2014 СОДЕРЖАНИЕ ТЕМА 1. ВВЕДЕНИЕ В СТАТИСТИКУ …………………………………. 1. Понятие статистики ……………………………………………………... 2. Статистическая закономерность. Статистические совокупности ……. 3. Признаки и их классификация ………………………………………….. 4. Статистическая методология …………………………………………… РЕЗЮМЕ ……………………………………………………………………. ТЕМА 2. СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ …………………………. 1. Сущность и значение статистических показателей …………………… 2. Классификация статистических показателей ………………………….. 3. Общие принципы построения относительных статистических показателей …………………………………………………………………. 4. Системы статистических показателей …………………………………. 5. Функции статистических показателей …………………………………. РЕЗЮМЕ ……………………………………………………………………. ТЕМА 3. ПРЕДСТАВЛЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ: ТАБЛИЦЫ И ГРАФИКИ ………………………………………………….. 1. Статистические таблицы ………………………………………………... 2. Основные виды графиков ……………………………………………….. 3. Картограммы и картодиаграммы ……………………………………….. РЕЗЮМЕ ……………………………………………………………………. ТЕМА 4. ГРУППИРОВКА 1. Значение и сущность группировки ……………………………………... 2. Виды группировок ………………………………………………………. РЕЗЮМЕ ……………………………………………………………………. ТЕМА 5. СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ ……. 1. Теоретические основы средних показателей ………………………….. 2. Средняя арифметическая величина …………………………………….. 3. Другие формы средних величин ………………………………………... 4. Показатели вариации ……………………………………………………. РЕЗЮМЕ ……………………………………………………………………. ТЕМА 6. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКИХ СВЯЗЕЙ …………………... 1. Определение степени зависимости признаков ………………………… 2. Линейное моделирование взаимосвязей ……………………………….. 3. Нелинейное моделирование взаимосвязей …………………………….. РЕЗЮМЕ ……………………………………………………………………. 2 с. 4 4 6 9 12 15 16 16 18 22 23 25 26 27 27 34 40 41 42 42 44 50 51 51 53 57 60 67 68 68 74 82 84 ТЕМА 7. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ ………………………………. 1. Понятие временных рядов ………………………………………………. 2. Предварительный анализ временных рядов …………………………… 3. Способы выявления наличия тенденции ………………………………. 4. Выявление типа тенденции ……………………………………………... 5. Оценка адекватности трендовых моделей …………………………….. 6. Прогнозирование на основе трендовой модели. Критерии точности и надежности прогнозов РЕЗЮМЕ ……………………………………………………………………. ТЕМА 8. ИНДЕКСЫ ……………………………………………………….. 1. Понятие индексов, их виды и значение в статистике …………………. 2. Методы построения индексов …………………………………………... 3. Индексы средних уровней изучаемых явлений ……………………….. Рекомендуемая литература ………………………………………………… 3 85 85 87 93 98 104 109 114 115 115 116 117 118 ТЕМА 1. ВВЕДЕНИЕ В СТАТИСТИКУ 1. Понятие статистики Термин «статистика» употребляется в различных значениях. 1. Под статистикой понимается практическая деятельность по сбору, накоплению, обработке и анализу цифровых данных, характеризующих население, экономику, культуру, образование и другие стороны жизни общества. В России, как и в большинстве стран, эту работу выполняют и возглавляют специальные государственные учреждения (Федеральная государственная служба статистики (Росстат) и ее территориальные органы). 2. Статистикой также называют науку, имеющую целью сбор, упорядочивание, анализ и сопоставление числового представления факторов, относящихся к самым разнообразным массовым явлениям. 3. Статистика вместе с тем это учение о системе показателей, т.е. количественных характеристик, дающих всестороннее представление об общественных явлениях, о народном хозяйстве в целом и отдельных его отраслях. 4. Статистикой называют также различного рода числовые или цифровые данные, характеризующие различные стороны жизни государства: политические отношения, культуру, население, производство и т.д. Между статистической наукой и практикой существует тесная связь и зависимость: наука использует данные практики, обобщает их и разрабатывает методы проведения статистических исследований. В свою очередь, в практической деятельности применяются теоретические положения статистической науки для решения конкретных управленческих задач. Слово «статистика» происходит от латинского слова status – состояние, положение вещей. Первоначально оно употреблялось в значении «политическое состояние». Отсюда итальянское слово stato – государство и statista – знаток государства. В научный обиход слово «статистика» вошло в XVIII в. и первоначально употреблялось в значении «государствоведение». В настоящее время статистика может быть определена как собирание массовых данных, их обобщение, представление, анализ и интерпретация. Это особый метод, который используется в различных сферах деятельности, в решении разнообразных задач. Статистика нужна для расчета страховых тарифов, оценки финансовых и предпринимательских рисков; она используется в работе аудитора, при постановке управленческого учета в фирме, в контроле и анализе качества продукции, в медицине, спорте и маркетинге. При изучении разных объектов и решении разных задачах используются различные методы. Тем не менее, существуют некоторые общие принципы и методы статистической работы. В учебнике «Теория статистики» английских статистиков Джорджа Эндина Юла и Мориса Джорджа Кендэлла говорится: «Независимо от того, в какой отрасли знания получены числовые данные, они обладают определенными свойствами, для 4 Конспект лекций по ОТС (Егорова Е.В.) выявления которых может потребоваться особого рода научный метод обработки. Последний известен как статистический метод или, короче, статистика». Статистические методы включают как простые методы, которые могут быть понятны любому человеку, так и сложные математические процедуры, доступные специалистам. Различная сложность статистических методов определяет структуру статистической науки: общая теория статистики; теория вероятностей; математическая статистика. С точки зрения развития статистики выделяют три уровня статистической науки. Первый уровень – общая теория статистики является наукой о наиболее общих принципах, правилах и законах цифрового освещения социально-экономических явлений. Она разрабатывает наиболее общие понятия и категории статической науки, которые имеют общестатистический смысл и методы изучения социально-экономических явлений. Ее категориями, показателями и методами пользуются все отраслевые статистики, т.е. общая теория статистики является методологической основой, ядром всех отраслей статистики. Общая теория статистики изучает историю статистической науки, разрабатывает организацию статистической службы в своей стране, изучает опыт организации статистики в других странах. На втором уровне выделены две большие обобщающие отрасли: экономическая и социально-демографическая статистики. Экономическая статистика изучает явления и процессы в области экономики: структуру, пропорции, взаимосвязи отраслей и элементов общественного воспроизводства. Социально-демографическая статистика изучает население, а также социальные (неэкономические) явления и процессы, которые характеризуют условия жизнедеятельности людей, их взаимоотношения в процессе труда и внепроизводственной деятельности. Ее основной целью является комплексное изучение различных сторон социальных условий и образа жизни людей. На третьем уровне выделены отрасли экономической и социальнодемографической статистики. В структуре экономической статистики выделяют макроэкономическую статистику, разрабатывающую методы комплексного изучения экономики страны, межотраслевые связи и др. Помимо этого в совокупность отраслей экономической статистики входят статистики промышленности, сельского хозяйства, торговли и других отраслей производственной сферы. В состав социально-демографической статистики входят статистики населения, уровня жизни, культуры, общественного мнения, политическая, моральная и другие отрасли. Каждая отраслевая статистика представляет собой науку о количественных изменениях, происходящих в соответствующих отраслях народного хозяйства. Задачей всех отраслевых статистик является разработка статистических показателей соответствующих отраслей. 5 Конспект лекций по ОТС (Егорова Е.В.) 2. Статистическая закономерность. Статистические совокупности Статистика позволяет выявить и измерить закономерности развития социально-экономических явлений и процессов, взаимосвязи между ними. Познание закономерностей возможно только в том случае, если изучаются не отдельные явления, а совокупности явлений, т.к. закономерности общественной жизни проявляются в полной мере лишь в массе явлений. В каждом отдельном явлении необходимое – то, что присуще всем явлениям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению. Например, реклама какого-либо товара может не оказать влияния на рост объема продажи этого товара, однако обобщение данных о затратах на рекламу товаров и объеме их реализации показывает наличие прямой связи между этими показателями. Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон, называются статистическими закономерностями. Например, кто дольше живет: мужчины или женщины? В истории известны случаи долгожительства мужчин. Так, Дзироэмон Кимура (Япония) прожил 116 лет (19 апреля 1897 – 12 июня 2013), Кристиан Мортенсен (Дания) и Эмилиано Меркадо дель Торо (Пуэрторика) дожили до 115 лет. Однако это лишь частные примеры. Обобщение данных по всему населению показывает, что продолжительность жизни женщин выше, чем у мужчин. Таблица 1.1. – Ожидаемая продолжительность жизни по отдельным странам Европы Страны Австрия Беларусь Бельгия Болгария Венгрия Германия Латвия Литва Португалия Россия Словакия Словения Великобритания Украина Финляндия Франция Швеция Эстония Ожидаемая продолжительность жизни, лет мужчин в возрасте, лет женщин в возрасте, лет 15 45 65 15 45 65 77,9 63,3 34,6 17,9 83,5 68,9 39,5 21,4 64,7 50,2 24,2 11,9 76,7 62,2 33,6 17,1 77,6 63,0 34,4 17,6 83,0 68,3 39,1 21,3 70,3 56,3 28,2 13,6 77,4 63,3 34,3 17,0 70,7 56,2 27,8 14,1 78,6 64,1 34,8 18,2 78,0 63,4 34,5 17,8 83,0 68,3 38,9 20,9 68,6 54,3 26,9 13,3 78,4 64,0 35,1 18,2 68,0 53,5 26,7 13,5 78,9 64,4 35,4 18,4 76,7 62,1 33,5 17,1 82,8 68,1 38,9 20,6 64,0 49,9 25,0 12,6 75,6 61,4 33,5 17,0 71,7 57,4 29,0 14,0 79,3 64,9 35,6 18,0 76,4 61,7 33,0 16,8 83,1 68,5 39,1 21,0 78,7 64,2 35,4 18,3 82,6 68,1 38,8 20,9 66,0 51,9 25,8 12,6 75,9 61,7 33,3 16,5 76,9 62,2 33,9 17,5 83,5 68,8 39,5 21,5 78,3 63,7 35,2 18,9 85,3 70,7 41,4 23,4 79,6 64,9 35,9 18,3 83,6 68,9 39,5 21,2 70,6 56,2 28,6 14,2 80,8 66,2 37,0 19,4 6 Конспект лекций по ОТС (Егорова Е.В.) Понятию статистическая закономерность противостоит понятие динамическая закономерность, проявляющаяся в отдельном явлении. Например, площадь круга меняется с изменением его радиуса, и эта связь выражается формулой = , которая справедлива для любого круга. Свойство статистических закономерностей, проявляющееся лишь в массе явлений при обобщении данных по достаточно большому числу единиц, получило название закон больших чисел. Соответственно предметом статистического изучения всегда выступают совокупности тех или иных явлений, включающие все множество проявлений исследуемой закономерности. В большой совокупности индивидуальные разнообразия взаимно погашаются, и на первый план выступают закономерные свойства. В течение более или менее длительного промежутка времени характеристики остаются примерно постоянными. Например, доля мальчиков и девочек среди новорожденных колеблется слабо: 105–106 мальчиков на 100 новорожденных девочек. На свойстве устойчивости базируются прогнозы. Если известно, как развивался процесс в прошлом, известны закономерности, то основываясь на свойстве устойчивости закономерностей, можно предсказать будущее положение вещей. Каждое единичное явление рассматривается статистикой как особый, частный случай изучаемой закономерности. Количественная характеристика каждого отдельного явления отражает его сущность. Но эта частная характеристика ограничена в своем значении для познания закономерности, поскольку сложилась в конкретных условиях и в силу этого соединяет в себе как типичные черты, присущие всем явлениям данного вида, так и случайные, присущие именно этой конкретной единице. Например, в Санкт-Петербурге имеются крупные семьи, включающие родителей и 5–6 детей; есть бездетные семьи, состоящие лишь из мужа и жены, но и те, и другие не являются типичными для этого города. Обобщив данные по всем петербургским семьям, можно говорить о том, какой размер семьи закономерен для северной столицы на современном этапе (3,1 человека), а также о том, что типичными являются так называемые простые семьи, состоящие из родителей и одного-двух детей, без прочих родственников. Статистика, опираясь на данные о каждом отдельном проявлении изучаемой закономерности, обобщает их и таким образом получает количественное выражение этой закономерности. Статистическая совокупность состоит из единиц совокупности. Каждая единица совокупности представляет собой частный случай проявления изучаемой закономерности. Единица совокупности – это предел дробления объекта исследования, при котором сохраняются все свойства изучаемого процесса. 7 Конспект лекций по ОТС (Егорова Е.В.) Итак, предметом статистического изучения выступают совокупности – множество однокачественных, варьирующих явлений. В это определение входят три основные черты совокупности любых явлений: во-первых, это множество явлений; во-вторых, это множество явлений, объединенных общим качеством, представляющим собой проявления одной и той же закономерности; в-третьих, это множество варьирующих явлений, отличающихся по своим характеристикам. Именно последнее свойство вызывает необходимость изучения всего множества явлений одного вида. Если бы единицы совокупности были полностью тождественны друг другу, то не было бы потребности обращаться к множеству единиц: достаточно изучить лишь одну единицу, чтобы знать все о всех явлениях этого вида. Предметом статистического изучения могут выступать данные: пространственные (число единиц совокупности велико, данные относятся к одному и тому же периоду времени: → ∞, = 1); панельные (данные близкие к пространственным: → ∞, 1 < ≤ 10); временные ряды ( = 1, → ∞). 8 Конспект лекций по ОТС (Егорова Е.В.) 3. Признаки и их классификация Единицы совокупности обладают определенными свойствами, качествами. Эти свойства принято называть признаками. Например, признаки человека: возраст, образование, занятие, рост, вес, семейное положение и т.д.; признаки предприятия: форма собственности, специализация (отрасль), численность работников, величина уставного капитала, экономическая эффективность его деятельности и т.д. Статистика изучает явления через их признаки: чем более однородна совокупность, тем больше общих признаков имеют ее единицы и тем меньше варьируются, их значения. Признаки различаются способами их измерения и другими особенностями, влияющими на приемы статистического изучения, что дает основание для классификации признаков. 1. По характеру выражения: описательные и количественные. Описательные (качественные) признаки выражаются словесно: национальность человека, разновидность почв, материал стен здания. Описательные признаки подразделяются на номинальные и порядковые. Номинальные (атрибутивные) – это описательные признаки, по которым нельзя ранжировать (упорядочивать) данные, а порядковые – это признаки, по которым можно ранжировать данные. Например, пользуясь оценками экспертов, ранжируют работников – по мастерству, студентов – по успеваемости. Количественные признаки выражаются числами (например, возраст человека, площадь пашни, заработная плата рабочих, население города, доход семьи и т.д.). 2. По способу измерения: первичные и вторичные. Первичные (учитываемые) признаки характеризуют единицу совокупности в целом. Это абсолютные величины. Они могут быть измерены, сосчитаны, взвешены и существуют сами по себе независимо от их статистического изучения. Например, площадь с.х. угодий, численность работников, валовой надой молока в хозяйстве. Вторичные (расчетные) признаки не измеряются непосредственно, а рассчитываются. Они являются продуктами человеческого сознания, результатом познания изучаемого объекта. Например, себестоимость единицы продукции, производительность труда, рентабельность, урожайность. Вторичные признаки представляют собой соотношения первичных признаков: деление суммы затрат на произведенную продукцию на число единиц данной продукции дает себестоимость; деление объема выпущенной продукции на численность работников дает показатель производительности труда; 9 Конспект лекций по ОТС (Егорова Е.В.) деление прибыли предприятия на выручку от реализации продукции дает показатель рентабельности продаж; деление валового сбора картофеля на площадь пашни под посадкой картофеля дает показатель его урожайности. Отметим, что вторичный – не означает второстепенный. Термин определяет только путь познания: сначала надо измерить значения первичных признаков, а уже потом, во вторую очередь, на основе первичных признаков рассчитать значения вторичных. 3. По отношению к характеризуемому объекту: прямые и косвенные. Прямые (непосредственные) признаки – это свойства, непосредственно присущие тому объекту, который ими характеризуется (например, возраст человека, поголовье коров на ферме, валовой сбор овощей, численность рабочих фермы). Косвенные признаки являются свойствами, присущими не самому объекту, а другим совокупностям, относящимся к объекту, входящим в него. Например, продуктивность коров как косвенный признак фермы. Продуктивность коров – это их прямой признак коров. Но поскольку продуктивность характеризует и ферму, которой принадлежат эти коровы, то продуктивность коров – это косвенный признак фермы. Заработная плата рабочих завода – прямой признак рабочих этого завода и косвенный признак самого завода. Практически деление признаков на прямые и косвенные совпадает с их делением на первичные и вторичные. 4. По характеру вариации: альтернативные, дискретные, непрерывные. Альтернативные признаки –признаки, которые могут принимать только два значения. К ним относятся признаки обладания или необладания чем-то. Например, все садовые участки по признаку наличия посадок вишни можно разделить на имеющие посадки вишни и не имеющие их. Альтернативным признаком являются пол человека (мужской, женский), место проживания (город, село), коробка переключения скоростей автомобиля (механическая, автоматическая). К дискретным относятся количественные признаки, которые могут принимать только целочисленные значения, без промежуточных значений между ними. Например, число членов семьи, количество этажей здания, комнат в квартире. Непрерывные, точнее непрерывно варьирующиеся, признаки способны принимать любые значения, конечно, в определенных границах. К непрерывным относятся расчетные вторичные признаки. Ведь их значения – результат деления, а оно может приводить к любым числам – целым, дробным, иррациональным. 10 Конспект лекций по ОТС (Егорова Е.В.) 5. По отношению ко времени: моментные и интервальные. Моментные признаки характеризуют изучаемый объект в какой-то момент времени, установленный планом статистического исследования. Они существуют на любой момент и характеризуют наличие чего-либо (например, численность населения, стоимость основных фондов, количество скота, размеры жилой площади). К интервальным относятся признаки, характеризующие результаты процессов. Поэтому их значения могут возникать только за интервал времени: год, месяц, сутки, но не на момент времени (например, число родившихся, умерших, объем промышленной продукции, надой молока, сумма полученной прибыли). Моментные признаки – характеристики состояния, а интервальные – характеристики процесса. Различие между моментными и интервальными признаками существенно при изучении динамики. Единицы измерения моментных признаков относятся только к характеризуемым ими свойствам объектов, а единицы измерения интервальных признаков содержат еще и указание того отрезка времени, за который определено значение признака. Например, стоимость основных производственных фондов предприятия на 1 января выражается в миллионах рублей, а объем продукции за январь – в тысячах или миллионах рублей за месяц. 11 Конспект лекций по ОТС (Егорова Е.В.) 4. Статистическая методология Основой статистической методологии является ее предмет – совокупность явлений. Как правило, она включает в себя несколько частных совокупностей, представляющих особые типы явлений, иначе говоря, особые модификации изучаемой закономерности. Единицы разных частных совокупностей в рамках общего качества отличаются кругом признаков и их значений. В большинстве случаев правильным будет представление частной совокупности (однородной группы), состоящей из ядра и окружающих его явлений – слоя. Ядро – концентрированное выражение всех специфических свойств типа (группы), определяющих качественное отличие данного типа от всех иных. Кроме единиц, составляющих ядро, тип включает явления переходного качества («слой»), принадлежность которых к данному типу может быть установлена с определенной вероятностью. Подобные явления образуют, так сказать, «полосу размыва» между типами. Например, среди студентов можно встретить тип «идеальный студент»: прекрасно учится, много читает, хороший товарищ. Есть студенты не такие разносторонние, для которых важны только специальные знания; есть и другие типы. «Качество» одних студентов, их принадлежность к тому или иному типу можно определить практически безошибочно, тогда как других бывает трудно отнести к какому-то типу. Они-то и представляют собой явления переходного качества. Соотношение между ядром и его окружением в разных типах будет различным: это зависит от устойчивости типа, длительности его существования, взаимодействия с другими типами той же совокупности, с другими совокупностями. Однако ядро должно составлять большинство единиц того или иного типа. Социально-экономическая статистика изучает совокупности однокачественных явлений в конкретных условиях места и времени. Таким образом, статистика располагает всегда ограниченным числом данных. Каждое явление возникает как результат множества факторов. В естественных науках можно проследить интересующие взаимосвязи с помощью специально проведенных лабораторных экспериментов, которые называют активными экспериментами, так как исследователь практически полностью контролирует ход эксперимента и может выделить в более или менее чистом виде влияние каждого из выбранных факторов, элиминируя влияние остальных. Иная ситуация в социально-экономических исследованиях. Применяя различные методы анализа, мы проводим «пассивный» эксперимент, причем ни один метод не позволяет определить «чистый» вклад каждого из факторов по отдельности в совокупный результат. 12 Конспект лекций по ОТС (Егорова Е.В.) В центре социально-экономических явлений и процессов находится человек со своими субъективными установками, активным воздействием на окружающий мир; это делает достоверность данных важнейшей проблемой статистики. Обобщая сказанное, можно указать следующие особенности социально-экономических явлений: 1) сложность их материальной природы, многообразие количественных и качественных определений; 2) ограниченность численности; 3) динамичность; 4) многообразие видов и форм, в которых проявляются единые по своей сущности процессы, отсюда – разделение на частные совокупности, на группы особого качества; 5) взаимосвязанность явлений и признаков; невозможность элиминирования действия факторов и раздельной оценки их действия. Специфика предмета статистики обусловливает специфику статистического метода. Статистическое исследование состоит из трех стадий: 1) статистическое наблюдение; 2) первичная обработка, сводка и группировка результатов наблюдения; 3) анализ полученных сводных материалов. Начальной стадией статистических исследований является статистическое наблюдение – научно организованный сбор сведений об изучаемых социально-экономических процессах или явлениях. Полученные в результате статистического наблюдения данные являются исходными для выполнения последующих этапов статистического исследования. Статистические данные могут быть взяты из публикаций, а можно собрать новую информацию по каждой единице совокупности (фирме, человеку, виду продукции, товару). Главное – использовать те данные, которым можно доверять. Результатом статистического наблюдения являются данные, характеризующие каждую единицу наблюдения. Цель же исследования – получение характеристики объекта наблюдения в целом, поэтому результаты статистического наблюдения представляют собой лишь исходный статистический материал. Эти результаты необходимо определенным образом обработать, чтобы выявить статистические данные. Такая обработка является следующей после наблюдения стадией статистического исследования и представляет собой сводку исходных данных для получения обобщающих характеристик исследуемого процесса или явления. Вторая стадия статистического исследования представляет собой комплекс последовательных действий по обобщению конкретных единичных фактов, образующих совокупность в целях выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. 13 Конспект лекций по ОТС (Егорова Е.В.) Важнейшим специфическим методом на этой стадии является метод группировок. Статистическая сводка включает в себя распределение исходных данных по группам, качественно однородным по одному или нескольким признакам и получение групповых итогов. На правильность выводов, получаемых в результате исследования, оказывает существенное влияние выбор группировочных признаков. Для правильного выделения качественно однородных групп следует выбирать основные, наиболее существенные для данного явления или процесса, признаки. Для того чтобы пользоваться результатами обобщения данные должны быть представлены в подходящей форме, компактно и наглядно. С этой целью строятся таблицы и графики. Третьей, заключительной стадией статистического исследования является статистический анализ. Выделяют следующие основные этапы анализа: 1) констатация фактов и их оценка; 2) установление характерных черт и причин явления; 3) сопоставление явления с другими, принятыми за базу сравнения, – нормативными, плановыми и прочими явлениями; 4) формулирование гипотез, выводов и предложений; 5) статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей. Характерным для статистических методов на этой стадии является применение обобщающих показателей: абсолютных, относительных, средних величин и индексных систем. 14 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Термин «статистика» может означать массовые данные, отрасль знаний, область профессионального занятия. Статистика выделилась как самостоятельная наука во второй половине XVIII в. Статистика – наука о методах сбора, представления, обработки и анализа данных. Статистические методы адаптируются к изучаемым явлениям. Статистическая наука включает общую теорию статистики (дескриптивную статистику), социально-экономическую статистику. Возможны выделения и других разделов этой области знания (математическая статистика, теория вероятностей). Предмет статистики – статистическая совокупность, т.е. множество однокачественных варьирующих явлений. Могут изучаться пространственные, панельные, временные данные. В статистической совокупности реализуется статистическая закономерность, которая проявляется при обобщении множества явлений. Это свойство статистической закономерности получило название закона больших чисел. Статистическая закономерность обладает устойчивостью, повторяемостью. Категории предмета статистического изучения: частная совокупность, или особый тип явлений; структура типа: ядро и слой (промежуточные явления); единица совокупности – частный случай изучаемой закономерности; признак – свойство единицы совокупности; показатель – характеристика группы явлений. 15 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 2. СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ 1. Сущность и значение статистических показателей Как мы уже знаем, статистика выражает массовые явления и процессы количественно в числовой форме. Но «числа», применяемые в статистике, это не абстрактные числа математики, характеризуемые только величиной, знаком, формой (целые – дробные; мнимые – действительные; рациональные – иррациональные и т.п.). Статистика применяет, собственно говоря, не числа, а показатели, точнее статистические показатели. Не умея правильно понять содержание, форму, свойства того или иного статистического показателя, нельзя корректно применить его в анализе социально-экономических явлений и процессов и осознать смысл статистической информации и жизни страны и мира. Статистический показатель – это единство качественного и количественного отражения свойств объективных явлений и процессов. Поскольку статистика изучает массовые явления, статистический показатель – это обобщающая характеристика какого-то свойства совокупности, группы. Этим он отличается от индивидуальных значений, которые, как отмечалось, называются признаками. Например, средняя продолжительность ожидаемой жизни родившегося поколения людей в стране – статистический показатель. Продолжительность жизни конкретного человека – признак. Не всегда статистический показатель является именованным числом. Он может быть абстрактным и отвлеченным числом без наименования, может быть выражен в долях единицы: в процентах, промилле и т.п. Именованными числами являются абсолютные статистические показатели. Статистический показатель имеет указание на территориальные и иные границы объекта и границы во времени. Без указания территориальных, отраслевых или ведомственных границ объекта и без привязки к определенному интервалу времени или моменту статистический показатель не существует. Таким образом, атрибутами статистического показателя являются: − качественная сторона: объект, его свойство; − количественная сторона: число и единицы измерения; − территориальные, отраслевые и иные границы объекта; − интервал или момент времени. Являясь отображением свойств изучаемых явлений и процессов, статистический показатель служит орудием их познания. Но следует помнить, что ни один статистический показатель, ни целая их система не могут отразить все особенности объекта и даже часть этих свойств с абсолютной точностью. 16 Конспект лекций по ОТС (Егорова Е.В.) Статистический показатель – приближенное, неточное и неполное отображение свойств изучаемого объекта, доступное при имеющемся уровне знаний и возможностях учета, измерения, сбора и передачи информации. Например, совершенно ясно, что невозможно точно измерить вес собранного картофеля без примеси песка, глины, частиц почвы и камней, невозможно в масштабах страны или даже хозяйства избежать ошибок во взвешивании, записи, передаче сведений об урожае. Остановимся на соотношении между признаком и статистическим показателем. Признак – это свойство, присущее единице совокупности. Признак входит в качественное содержание показателя, он существует объективно независимо от того, отражает ли его наука с помощью тех или иных показателей. Например, возраст человека – это его признак, который можно измерять с разной степенью точности – в годах, месяцах, в сутках или охарактеризовать датой рождения. Показатель – характеристика группы единиц, или совокупности в целом. Его построение зависит от цели исследования и изобретательности статистика. Например, средний возраст работников фирмы или жителей города – это статистические показатели, дающие возрастную характеристику определенных групп. 17 Конспект лекций по ОТС (Егорова Е.В.) 2. Классификация статистических показателей Объектами статистического исследования могут быть самые разнообразные явления и процессы. Поэтому чрезвычайно велико и разнообразие статистических показателей. Мы рассмотрим только наиболее общую классификацию статистических показателей. 1. По качественной стороне показателей: показатели свойств конкретных объектов и показатели статистических свойств любых массовых явлений и процессов. 2. По количественной стороне показателей: абсолютные и относительные. 3. По отношению к характеризуемому свойству: прямые и обратные. Показатели конкретных свойств изучаемого объекта – это, например, средний возраст работников предприятия, объем реализованной продукции предприятия, валовой внутренний продукт государства, средний надой молока на корову на ферме, объем перевозок груза автопарком, показатели рождаемости, смертности, обеспеченности населения товарами и услугами и т.д. Особенностью этих показателей является то, что они формируются не только статистикой. В построении этих показателей их качественное содержание определяется конкретной предметной наукой: показатель рождаемости – демографией, показатель внутреннего валового продукта – теорией экономики, показатели урожайности, продуктивности скота – соответствующими сельскохозяйственными науками. Статистика отвечает за методику учета или расчета количественной стороны этих показателей и их форму. К показателям статистических свойств любых массовых явлений и процессов, не зависящих от конкретного содержания этих явлений относятся: средние величины, показатели вариации, показатели связи признаков, показатели структуры и характера распределения, показатели скорости и темпов изменения, показатели колеблемости в динамике; статистические оценки степени точности и надежности любых конкретных статистических показателей, полученных при выборочном изучении совокупности, а также оценки надежности и точности статистических прогнозов. За качественную и количественную сторону этих показателей, за их построение, интерпретацию и применение отвечает не какая-либо иная научная дисциплина, а только сама статистика. Система таких показателей создается и совершенствуется в ходе развития методов статистики. Теоретическая статистика разрабатывает и изучает содержание, форму, методы расчета этих показателей в общем виде: что такое средняя арифметическая величина, коэффициент вариации, уравнение тренда ряда динамики. Если же любой из этих показателей рассчитан для определенного объекта, признака, периода времени, то он становится уже конкретным показателем. 18 Конспект лекций по ОТС (Егорова Е.В.) Абсолютным показателем является такой, который отражает либо суммарное число единиц, либо суммарное свойство объекта. Например, число фермерских хозяйств в Тверской области на 1 января 2013 г., посевная площадь картофеля в районе, налоговые доходы бюджета за конкретный месяц, квартал или год, и т.п. Абсолютные показатели, как правило, выражаются именованными величинами в натуральных единицах измерения: тоннах, штуках, часах, амперах и т.п., в условных единицах: условном топливе, нормо-сменах, условных головах и т.д. или в стоимостных единицах: рублях, долларах, евро. Они характеризуют сумму значений первичных признаков объекта. Относительным показателем является показатель, полученный путем сравнения, сопоставления абсолютных или относительных показателей в пространстве (между объектами), во времени (по одному и тому же объекту) или сравнения показателей разных свойств изучаемого объекта. Относительные статистические показатели, получаемые при сопоставлении абсолютных показателей, могут быть названы относительными показателями первого порядка, а полученные при сопоставлении относительных же показателей – показателями высших (второго, третьего и т.д.) порядков. Относительные статистические показатели выражают связь между абсолютными показателями: Например, урожайность картофеля – отношение валового сбора к посевной площади; доля городского населения в стране – отношение численности населения городов к общему числу жителей страны. Основные виды относительных величин чаще выражаются отвлеченными числами, но могут быть также именованными относительными показателями. Относительные показатели можно подразделить на следующие группы. 1. Относительные показатели, характеризующие структуру объекта. Это доля (удельный вес) – отношение части к целому. д = дпашни = (2.1) пашня с. х. угодья Например, отношение площади каждой из сельскохозяйственных культур к общей посевной площади; числа женщин к общей численности населения города, страны. Доли выражаются нередко в процентах или промилле (тысячных долях). 19 Конспект лекций по ОТС (Егорова Е.В.) 2. Относительные показатели, характеризующие динамику процесса, изменение во времени. Это отношения показателей, характеризующих объект в более позднее время (текущий период), к аналогичным показателям того же объекта в более ранний (базисный) период. Такие показатели называют темпами роста. Тр = Трпоголовья КРС = (2.2) поголовье КРС поголовье КРС Темп роста может быть выражен в разах или в процентах. Темп роста говорит о том, во сколько раз больше показатель текущего периода в сравнении с базисным или сколько процентов он составляет по отношению к показателю базисного периода. К относительным показателям динамики принадлежат также темпы прироста, параметры уравнений трендов, коэффициенты колеблемости и устойчивости в динамике, индексные показатели динамики. 3. Относительные показатели, характеризующие взаимосвязь признаков в совокупности явлений, а также взаимосвязь результативных признаков-следствий с факторными признаками-причинами. Например, связь уровня душевого дохода с размером потребления мяса или фруктов на одного человека; связь дозы удобрений с урожайностью картофеля и т.п. К таким показателям относятся коэффициенты корреляции, эластичности, детерминации, а также аналитические индексы. Относительные показатели взаимосвязи могут быть как отвлеченными, так и именованными числами. 4. Относительные показатели, характеризующие соотношение разных признаков того же объекта между собой (иногда их называют показателями интенсивности). ПТ = = (2.3) валовая продукция численность работников Эти показатели обобщают вторичные признаки объектов (например, производительность труда – отношение произведенной продукции в натуральном или стоимостном выражении к затратам труда на ее производство и др.). Показатели соотношения признаков могут быть прямыми и обратными. Например, отношение затрат труда на производство к объему продукции дает показатель трудоемкости продукции – величину, обратную 20 Конспект лекций по ОТС (Егорова Е.В.) прямому показателю производительности труда. И прямые, и обратные показатели выражаются именованными числами с двойными единицами измерения обоих сравниваемых признаков: в рублях за 1 час труда, в центнерах с 1 га площади. В экономике относительные показатели, характеризующие величину признака объекта, рассчитанные на единицу другого признака, используются для измерения эффективности либо интенсивности производства. 5. Отношения фактически наблюдаемых величин признака к его нормативным, плановым, оптимальным или максимально возможным величинам. Отношения наблюдаемых величин признака к оптимальным или плановым характеризуют приближение изучаемого процесса к идеалу. Отношение фактических значений признака к максимально возможным значениям часто характеризует качество процесса, агрегата, машины. Отношения фактических показателей вариации к максимально возможным при данной численности совокупности используются при анализе вариации, при измерении степени специализации предприятия или региона на производстве определенной продукции и в ряде других задач. 6. Показатели сравнения разных объектов по одинаковым признакам (например, сравнение урожайности одной и той же культуры в том же году между хозяйствами, областями; сравнение показателей производства или уровня жизни населения в разных странах). При построении таких относительных показателей необходимо позаботиться, чтобы сравниваемые показатели определялись по единой методике построения, были сравнимы по единицам измерения и во всех других отношениях. 7. Относительные показатели координации. Характеризуют соотношение между частями одного целого. Кк = КСК ЗК = (2.4) собственный капитал долгосрочные и краткосрочные обязательства Например, показатели, характеризующие соотношение между численностью городского и сельского населения, между численностью рабочих и служащих, между численностью мужчин и женщин, между величиной заемного и собственного капитала предприятия. Относительные величины координации нередко характеризуются числом единиц одной части на 100 или 1000 единиц другой части. Например, сколько безработных приходится на 1000 человек занятых в экономике России. 21 Конспект лекций по ОТС (Егорова Е.В.) 3. Общие принципы построения относительных статистических показателей Построение относительных показателей – задача, требующая сочетания конкретного знания свойств объекта и общих закономерностей статистической методологии. Общие принципы построения относительных показателей. Первый принцип. Относительный показатель как сравнение двух абсолютных величин, которые объективно связаны, должен быть независим от нашего желания. Необходимо добиваться как можно большего соответствия по смыслу сравниваемых показателей. Например, мы хотим построить относительный показатель, характеризующий степень грамотности населения. Можно разделить число грамотных на общую численность населения, но это не лучший из показателей. Ведь ясно, что дети до 6 лет, некоторые категории инвалидов с детства, душевнобольных не могут наравне со здоровыми и достигшими школьного возраста людьми быть обучены грамоте. Эти категории лиц правильнее исключить из всего населения при построении относительного показателя грамотности. Второй принцип. При построении относительного статистического показателя сравниваемые величины могут различаться только одним атрибутом: или видом признака (при одинаковом объекте, периоде времени, плановом или фактическом характере показателей), или временем (при том же признаке, объекте и т.п.), или только фактическим, плановым или нормативным характером показателей (тот же объект, признак, время) и т.д. Нельзя сопоставлять показатели, различные по двум и более атрибутам, например, сравнивать добычу угля в США в 2011 г. с выплавкой стали в Российской Федерации в 2012 г. Третий принцип. Необходимо знать возможные границы существования относительного показателя. Например, относительные показатели вариации теряют смысл и не могут применяться в тех случаях, когда их знаменатели – средние значения признаков – близки к нулю, потому что при стремлении знаменателя к нулю относительный показатель стремится к абсурдному бесконечному значению. Аналогично если исходные показатели в текущем и базисном периодах имеют разные знаки, то теряет смысл и не может применяться относительная величина динамики – темп роста. Например, нельзя рассчитать темп роста, если предприятие имело в 2010 г. убыток 150 тыс. руб., а в 2011 г. получило прибыль 300 тыс. руб. Относительные показатели, измеряющие степень приближения некоторого признака к предельному значению, должны строиться так, чтобы в пределе увеличения они стремились к единице, а в другом пределе своего уменьшения – к нулю. Так строятся коэффициенты, измеряющие тесноту связи признаков, степень эффективности использования ресурсов, скажем, КПД двигателя. 22 Конспект лекций по ОТС (Егорова Е.В.) 4. Системы статистических показателей Свойства, признаки изучаемых статистических объектов (совокупностей процессов) не изолированы, а связаны между собой. Поэтому и показатели этих свойств образуют более или менее полную систему. Число взаимосвязанных показателей может составлять от двух-трех до нескольких сотен. Различают жестко детерминированные и статистические связи показателей. Примером системы жестко связанных показателей может служить система объемных и качественных показателей сельского хозяйства Тверской области за 2010 год. Абсолютные показатели: 1. Стоимость основных производственных фондов с.х. – 25 582 млн.руб. 2. Среднегодовая численность занятых в с.х. – 67,4 тыс.чел. 3. Объем сельскохозяйственной продукции – 17 962 млн.руб. Относительные показатели: 1. Фондовооруженность персонала 25 582 млн. руб. стоимость основных фондов = = 67,4 тыс. чел. среднегодовая численность занятых = 379,5 тыс. руб./чел. 2. Фондоотдача объем с. х. продукции 17 962 млн. руб. = = стоимость основных фондов 25 582 млн. руб. = 70,2 руб. на 100 руб. ОПФ 3. Производительность труда объем с. х. продукции 17 962 млн. руб. = = среднегодовая численность занятых 64,7 тыс. чел. = 277,6 тыс. руб./чел. Каждый показатель данной системы может быть точно вычислен по остальным показателям, т.к. он является либо частным от деления других показателей, либо произведением показателей. Примером системы показателей, связанных статистической зависимостью, служит система факторов, влияющих на величину заработной платы: результирующий показатель – среднемесячная заработная плата, руб. на человека факторные показатели: возраст рабочего; стаж работы по специальности; число рабочих часов за месяц; часовая выработка; разряд рабочего; рентабельность предприятия; отрасль предприятия. 23 Конспект лекций по ОТС (Егорова Е.В.) Никакие арифметические действия над величинами факторных показателей не приводят к величине результирующего показателя. Однако средняя величина заработной платы в совокупности рабочих связана со стажем, с разрядом рабочего. Стаж, в свою очередь, связан с возрастом, рентабельность предприятия – с отраслью. Все показатели образуют систему, но связь их проявляется в среднем для достаточно большой совокупности рабочих. Система статистических показателей, как правило, должна включать как абсолютные показатели, так и относительные. Изолированный абсолютный показатель не говорит ничего. Предположим, предприятие произвело продукции в 2012 г. на 46 млн руб. Из этого показателя нельзя сделать никакого вывода, пока его величина не сопоставлена с числом работников, затратами на производство, объемом продукции за предыдущий год и т.п., т.е. пока этот показатель не будет включен в систему и не будут построены относительные величины. Из этого не следует делать заключение о большей информативности относительных показателей. Если известно, что в студенческой группе число отличников в данную сессию составило 200% к их числу в прошлую сессию, то это не значит, что группа резко повысила уровень знаний. Может быть, в прошлую сессию был 1 отличник из 27 человек, а теперь стало 2, что и составило 200%. Только сочетание абсолютных и относительных показателей позволяет достаточно полно характеризовать объект. 24 Конспект лекций по ОТС (Егорова Е.В.) 5. Функции статистических показателей Основной функцией статистических показателей и их систем является познавательная информационная функция. Без статистической информации невозможны познание закономерностей экономических и социальных массовых явлений, их предвидение, а значит, регулирование либо прямое управление, будь то на уровне отдельного предприятия, фермы, города или региона, на государственном или межгосударственном уровне. Например, фермеру необходимо знать показатели средней урожайности за ряд лет различных сельскохозяйственных культур на его участках земли, показатели колеблемости и устойчивости урожаев в зависимости от условий погоды, среднюю частоту поломок деталей машин, средние цены (и темпы их роста) на покупаемые удобрения и т.д. Среди познавательно-информационных функций статистических показателей выделяется функция мониторинга – постоянно действующего наблюдения при постоянстве рассчитываемых показателей. Например, существует мониторинг Центрального банка России за деятельностью коммерческих банков или экологический мониторинг и т.д. Кроме того, показатели выполняют роль системы сигналов, свидетельствуя о социальной напряженности (например, число забастовок, в том числе по причинам, количество бастующих, процент неявок на выборы, уровень преступности и т.д.). Условием выполнения статистическими показателями их информационной, познавательной функции являются их научное обоснование и достаточно точное и надежное, а также своевременное количественное определение. Прогностическая функция, т.е. роль статистических показателей в предвидении будущего, тесно связана с их информационной функцией. Данная функция присуща не всем статистическим показателям, а тем из них, которые используются при моделировании массовых процессов. Оценочная функция статистических показателей заключается в том, что на их основе люди, общество, государство оценивают деятельность предприятий, организаций, трудовых коллективов, правительств. Великий немецкий писатель, поэт и мыслитель Иога́ нн Во́ льфганг фон Гете сказал: «Считают, будто числа управляют миром. Но я знаю, что числа учат нас узнавать, хорошо ли мир управляется». А российский статистик Карл Федорович Герман писал: «Статистик есть публичный провозвестник и доброго, и худого, и контролер правительства». 25 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Статистический показатель – это обобщающая характеристика какоголибо свойства совокупности, группы явлений. Атрибуты статистического показателя включают определение качественной стороны характеризуемого свойства, количественное выделение этого свойства (числовая величина и единица измерения), территориальные, отраслевые и иные границы объекта, период или момент времени, к которому относится данное значение показателя. В классификации показателей важнейшим является подразделение на абсолютные и относительные, прямые и обратные. Абсолютные показатели служат основой вычисления разнообразных относительных показателей, получаемых путем соотношения абсолютных величин. Относительные показатели подразделяются на характеристики структуры, показатели эффективности и интенсивности производства, сравнительные характеристики (выполнение норм, соответствие нормативу, сравнение с прошлым периодом и т.д., или сравнение разных объектов по одним и тем же показателям за одно и то же время). Качественный экономический анализ должен быть основан не на отдельных показателях, а на системе показателей, т.е. на группе взаимосвязанных показателей. При этом нужно следовать определенным принципам их построения. Основная функция статистических показателей и их систем – познавательно-информационная, однако показатели выполняют и другие функции: сигнальную, прогностическую, оценочную. 26 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 3. ПРЕДСТАВЛЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ: ТАБЛИЦЫ И ГРАФИКИ 1. Статистические таблицы Статистические данные должны быть представлены так, чтобы ими было удобно пользоваться. Существуют, по крайней мере, три способа представления данных: они могут быть включены в текст, в таблицы или выражены графически. Если мы включим множество цифр в текст, это затруднит их восприятие. Например, данные об общем числе предприятий и организаций Тверской области и их количестве по видам экономической деятельности изложены в следующем тексте. На 1 января 2006 г. в Тверской области было 48 075 предприятий и организаций, из них по видам экономической деятельности: − сельское хозяйство, охота и лесное хозяйство – 5 405 или 11,2%; − обрабатывающие производства – 4 674 или 9,7%; − строительство – 3 218 или 6,7%; − оптовая и розничная торговля; ремонт автотранспортных средств, мотоциклов, бытовых изделий и предметов личного пользования – 16 263 или 33,8%; − гостиницы и рестораны – 707 или 1,5%; − транспорт и связь – 1742 или 3,6%; − финансовая деятельность – 657 или 1,4%; − операции с недвижимым имуществом, аренда и предоставление услуг – 5 741 или 11,9%; − государственное управление и обеспечение военной безопасности; социальное страхование – 1 685 или 3,5%; − образование – 1 606 или 3,5%; − здравоохранение и предоставление социальных услуг – 1 295 или 2,7%; − предоставление прочих коммунальных, социальных и персональных услуг – 4 543 или 9,4%; − прочие виды деятельности – 485 или 1,0%. На 1 января 2011 г. общее предприятий и организаций составило 37 768, т.е. на 21,4% меньше, чем в 2006 г., из них по видам экономической деятельности: − сельское хозяйство, охота и лесное хозяйство – 2 009или 5,3% (–62,8 % к 2006 году); − обрабатывающие производства – 3 675или 9,7% (–21,4 % к 2006 году); − строительство – 2 978 или 7,9% (–7,5 % к 2006 году); − оптовая и розничная торговля; ремонт автотранспортных средств, мотоциклов, бытовых изделий и предметов личного пользования – 10 010 или 26,5% (–38,4 % к 2006 году); 27 Конспект лекций по ОТС (Егорова Е.В.) − гостиницы и рестораны – 775 или 2,1% (+9,6 % к 2006 году); − транспорт и связь – 2 122 или 5,6% (+21,8 % к 2006 году); − финансовая деятельность – 563 или 1,5% (–14,3 % к 2006 году); − операции с недвижимым имуществом, аренда и предоставление услуг – 7 408 или 19,6% (+29,0 % к 2006 году); − государственное управление и обеспечение военной безопасности; социальное страхование – 1 718 или 4,5% (+2,0 % к 2006 году); − образование – 1 621 или 4,3% (–2,3 % к 2006 году); − здравоохранение и предоставление социальных услуг – 998 или 2,6% (–22,9 % к 2006 году); − предоставление прочих коммунальных, социальных и персональных услуг – 3 201 или 8,5% (–29,5 % к 2006 году); − прочие виды деятельности – 689 или 1,8% (–42,1 % к 2006 году). Текст из-за перегруженности цифровыми данными плохо воспринимается. Более эффективно представление статистических данных в форме таблицы. Статистические таблицы рассказывают языком цифр об изучаемых объектах. Статистическая таблица – система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях. Представим в форме таблицы информацию о предприятиях и организациях Тверской области. Данные этой таблицы позволяют увидеть снижение общего числа предприятий и организаций на 21,4%, в том числе в 2,7 раза сократилось количество предприятий занимающихся сельским хозяйством, охотой и лесным хозяйством; более чем в полтора раза сократилось число торговых предприятий; вместе с тем произошло увеличение организаций, занимающихся недвижимостью на 29%; транспортных предприятий на 2,8%. 28 Конспект лекций по ОТС (Егорова Е.В.) Таблица 3.1. – Распределение предприятий и организаций Тверской области по видам экономической деятельности* Вид экономической деятельности Всего Число предприятий и организаций 2006 2011 2011 г. в % к 2006 г. число % число % 48075 100,0 37768 100,0 78,6 в том числе сельское хозяйство, охота и лесное хозяйство 5405 11,2 2009 5,3 обрабатывающие производства 4674 9,7 3675 9,7 строительство 3218 6,7 2978 7,9 оптовая и розничная торговля; ремонт автотранспортных средств, мотоциклов, бытовых изделий и предметов личного пользования 16263 33,8 10010 26,5 гостиницы и рестораны 707 1,5 775 2,1 транспорт и связь 1742 3,6 2122 5,6 финансовая деятельность 657 1,4 563 1,5 операции с недвижимым имуществом, 11,9 7408 19,6 аренда и предоставление услуг 5741 государственное управление и обеспечение военной безопасности; социальное страхование 1685 3,5 1718 4,5 образование 1660 3,5 1621 4,3 здравоохранение и предоставление социальных услуг 1295 2,7 998 2,6 предоставление прочих коммунальных, социальных и персональных услуг 4543 9,4 3201 8,5 прочие виды деятельности 485 1,0 689 1,8 * Источник: Российский статистический ежегодник. 2012: Стат.сб./Росстат. М., 2012. – 786 с. 37,2 78,6 92,5 61,6 109,6 121,8 85,7 129,0 102,0 97,7 77,1 70,5 142,1 В статистической таблице различают подлежащее и сказуемое. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в количественной форме – в виде системы показателей. Обязателен заголовок таблицы, в котором указывается, к какой категории и какому времени относятся данные таблицы. По характеру подлежащего статистические таблицы подразделяются на простые, групповые, комбинационные. 29 Конспект лекций по ОТС (Егорова Е.В.) В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. Единицы упорядочиваются по одномудвум признакам (по возрастанию или убыванию значений). Сказуемое должно содержать данные по каждой единице совокупности. Такие таблицы хороши при небольшом числе единиц (20 и менее). Как правило, они представляют данные в динамике. Например, таблица, в которой приведена динамика структуры населения по месту проживания. Таблица 3.2. - Численность населения России в том числе городское сельское 2001 146,3 107,1 39,2 2002 145,2 106,4 38,8 2003 145,0 106,3 38,7 2004 144,3 106,0 38,3 2005 143,8 105,2 38,6 2006 143,2 104,8 38,4 2007 142,8 104,7 38,1 2008 142,8 104,9 37,9 2009 142,7 104,9 37,8 2010 142,9 105,3 37,6 2011 142,9 105,4 37,5 2012 143,0 105,7 37,3 * Источник: Российский статистический ежегодник. 2012: Стат.сб./Росстат. М., 2012. – 786 с. Годы Все население, млн. человек 30 Конспект лекций по ОТС (Егорова Е.В.) В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку. В сказуемом указываются число единиц в группах (абсолютное и в процентах) может располагаться в левой и верхней частях таблицы. Например, таблица, в которой население распределено по возрастным группам. Таблица 3.3 - Распределение населения России по возрастным группам (на 1 января) 2001 тысяч человек 146304 % к итогу 100 2012 тысяч человек 143056 % к итогу 100 Все население в том числе в возрасте, лет: 0-4 6367 4,4 8380 5,9 5-9 7762 5,3 7261 5,1 10-14 11789 8,1 6567 4,6 15-19 12322 8,4 7631 5,3 20-24 11106 7,6 11599 8,1 25-29 10451 7,1 12328 8,6 30-34 9620 6,6 11116 7,8 35-39 11333 7,7 10380 7,3 40-44 12651 8,6 9340 6,5 45-49 11434 7,8 10023 7,0 50-54 9409 6,4 11560 8,1 55-59 4995 3,4 10215 7,1 60-64 8906 6,1 8380 5,9 65-69 5903 4,0 3896 2,7 70 и более 12256 8,4 14380 10,1 * Источник: Российский статистический ежегодник. 2012: Стат.сб./Росстат. М., 2012. – 786 с. 31 Конспект лекций по ОТС (Егорова Е.В.) В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам. Например, таблица распределения населения по территории и половому признаку. Таблица 3.4 – Распределение численности населения по полу по субъектам ЦФО на 1 января 2012 г. (человек) Регионы Все население в том числе мужчины женщины Центральный федеральный округ 38537608 17634884 20902724 Белгородская область 1536073 707142 828931 Брянская область 1264416 576446 687970 Владимирская область 1431932 645290 786642 Воронежская область 2331506 1065262 1266244 Ивановская область 1054040 471607 582433 Калужская область 1008229 463735 544494 Костромская область 661764 301703 360061 Курская область 1121563 508252 613311 Липецкая область 1165916 531727 634189 Московская область 7198686 3320143 3878543 Орловская область 781281 352342 428939 Рязанская область 1148457 522237 626220 Смоленская область 980482 447965 532517 Тамбовская область 1082545 497490 585055 Тверская область 1342200 607018 735182 Тульская область 1544545 694782 849763 Ярославская область 1271030 567860 703170 г. Москва 11612943 5353883 6259060 * Источник: Российский статистический ежегодник. 2012: Стат.сб./Росстат. М., 2012. – 786 с. 32 Конспект лекций по ОТС (Егорова Е.В.) При построении таблиц необходимо руководствоваться следующими общими правилами. Статистическая таблица содержит три вида заголовков: общий (тематический), верхние и боковые. Общий заголовок отражает содержание всей таблицы, а также, к какому месту и времени она относится. В соответствии с действующими ГОСТами, общий заголовок располагается над ее макетом по центру и является внешним заголовком. Верхние заголовки («шапка») обозначают содержание граф, а боковые – строк. Заголовки граф содержат названия показателей (без сокращения слов), их единицы измерения. Последние могут указываться как в заголовке соответствующей графы, так и в заголовке таблицы или над таблицей, если все показатели таблицы выражены в одних и тех же единицах измерения и счета. Цифровые данные записываются с одной и той же степенью точности в пределах каждой графы: при этом обязательно разряды чисел располагаются под разрядами; целая часть числа отделяется от дробной запятой. В таблице не должно быть ни одной пустой клетки: если данные равны нулю, ставится знак «» (прочерк); если данные не известны, делается запись «сведений нет» или ставится знак «...» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1). Итоговая строка завершает таблицу и располагается в конце таблицы, но иногда бывает первой: в этом случае во второй строке дается запись «в том числе», и последующие строки содержат составляющие итоговой строки, иногда не все, а основные. Если таблица имеет много граф, то графы подлежащего обозначаются заглавными буквами (А, Б), а графы сказуемого – цифрами (1, 2 и т.д.). Это бывает удобно; если таблица имеет много строк и печатается на нескольких страницах, то заголовки граф не повторяются, а указываются только их обозначения. В таблице не должно быть ни одной лишней линии, только необходимые: линия, отделяющая заголовок таблицы от заголовков ее граф, заголовки граф от цифровых данных. Иногда используется линия, отделяющая итоговую строку. Вертикальная разграфка может быть, а может и отсутствовать. В случае необходимости таблицы могут сопровождаться примечаниями, используемыми с целью пояснения заголовков, методик расчета некоторых показателей, источников информации и т.п. Если в каком-либо документе содержится более одной таблицы, то их принято нумеровать для обеспечения возможности сослаться на ту или иную таблицу при необходимости. Таблицы последовательно нумеруются арабскими цифрами в пределах всего документа или отдельной главы какойлибо рукописи. 33 Конспект лекций по ОТС (Егорова Е.В.) 2. Основные виды графиков Более наглядным средством представления данных, чем таблицы, являются графики. Графическая информация легко воспринимается, вызывает больше доверия, обладает значительной емкостью. Статистические графики представляют собой условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графический способ облегчает рассмотрение статистических данных. На графике сразу видны пределы изменения показателя, сравнительная скорость изменения разных показателей, их колеблемость. Вместе с тем график имеет определенные ограничения: не может включить столько данных, сколько может войти в таблицу; на нем показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. По способу построения графики делятся на диаграммы, картограммы и картодиаграммы. Наиболее распространенными являются диаграммы. Они бывают разных видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграммы зависит от вида представляемых данных (одна переменная или один показатель, несколько переменных или показателей, количественные или неколичественные) и задачи построения графика. В любом случае график обязательно сопровождается заголовком – над или под полем графика. В заголовке указывается, какой показатель изображен, в каких единицах измерения, по какой территории и за какое время он определен. Остановимся на основных видах графиков и области их применения. Линейные графики используются для представления количественных переменных: характеристики вариации их значений, динамики, взаимосвязи между переменными. Линейные графики целесообразно разделять на используемые для представления данных по одной переменной – одномерные или по двум переменным – двумерные. Примером первого является полигон распределения, второго – линия регрессии. Возможен такой случай, когда на графике представлено несколько переменных (показателей), а он все-таки не является многомерным. Для того чтобы динамика двух и более показателей была сопоставимой, следует обеспечить их «единый старт» – показатели базисного года принимаются за 100%. Динамика двух показателей на одном и том же графике может быть представлена и без приведения их к 100%, если эти показатели связаны каким-либо функциональным соотношением (например, представлена динамика общего показателя и показателя, который является одним из его составляющих). 34 Конспект лекций по ОТС (Егорова Е.В.) Обеспеченность оборотными средствами сельскохозяйственных предприятий Тамбовской области (2008 г., тыс.руб. на 100 га с.х. угодий) Количество предприятий 120 106 100 80 62 60 60 47 40 37 20 до 200 200,01-400 400,01-600 600,01-1000 свыше 1000 Рис. 3.1. Полигон распределения с.х. предприятий Тамбовской области по обеспеченности оборотными средствами Валовая продукция на 100 га с.х. угодий, тыс. руб. Зависимость выпуска продукции от обеспеченности оборотными средствами 1400 1200 y = 439,98ln(x) - 2136,6 1000 800 600 400 200 500 1000 1500 2000 Обеспеченность оборотными средствами, тыс.руб на 100 га с.х. угодий Рис.3.2. Зависимость выпуска продукции от обеспеченности с.х. предприятий Тамбовской области оборотными средствами (логарифмическая) 35 Конспект лекций по ОТС (Егорова Е.В.) Рис.3.3. 3. Динамика ВВП и индексов цен в США 1 400 1 200 1 191,8 продукция - всего продукция животноводства 1 000 697,8 684 800 586,9 600 400 200 356,6 257,9 231,3232,6 207,8 183 223,6200,1 127,2 49,1 48,8 52,9 66,1 83,1 89,8 807,9 507,6 468 283,8 756,1 309,7 237,9 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Рис.3.4. Выпуск продукции с.х. К(Ф)Х Тверской области, тыс. руб. (в фактически действующих ценах) 36 Конспект лекций по ОТС (Егорова Е.В.) Среди плоскостных диаграмм по частоте использования выделяются столбиковые диаграммы, на которых показатель представляется в виде столбика, высота которого соответствует значению показателя. Часто на столбиковой диаграмме показываются относительные величины: при сравнении показателей по группам, по разным совокупностям, одна из которых может быть принята за 100%. Ленточная диаграмма представляет показатели в виде горизонтально вытянутых прямоугольников. Как столбиковые, так и ленточные диаграммы можно применять не только для сравнения самих величин, но и для сравнения их частей. Особый тип ленточных диаграмм применяется для представления данных с разным характером изменений: положительным и отрицательным. Из плоскостных диаграмм часто используется секторная диаграмма. Она применяется для иллюстрации структуры изучаемой совокупности. Вся совокупность принимается за го показателя. Площадь фигуры соответствует величине показателя. 7 000 безработные, тыс. чел. 6 000 6 284 5 242 5 544 5 250 5 000 4 519 4 922 4 697 4 131 4 000 3 000 2 000 1 000 2005 2006 2007 2008 2009 2010 2011 Рис.3.5. Динамика численности безработных в России 37 Конспект лекций по ОТС (Егорова Е.В.) 2012 Структура населения России по месту жительства 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 26,8 26,8 26,7 26,5 26,5 26,3 26,2 26,1 73,2 73,2 73,3 73,5 73,5 73,7 73,8 73,9 2005 2006 2007 2008 2009 2010 2011 2012 городское сельское Рис.3.6. Столбиковая диаграмма структуры населения России Численность населения в некоторых областях ЦФО Ивановская 1054,0 Воронежская 2331,5 Владимирская 1431,9 Брянская 1264,4 Белгородская 1536,1 0,0 500,0 1000,0 1500,0 2000,0 Рис.3.7. Ленточная диаграмма численности населения 38 Конспект лекций по ОТС (Егорова Е.В.) 2500,0 Численность населения в некоторых областях ЦФО Ивановская 1054,0 582,4 Воронежская 2331,5 1266,2 Владимирская 786,6 Брянская 1264,4 688,0 Белгородская 828,9 0,0 500,0 1000,0 население - всего 1431,9 1536,1 1500,0 2000,0 2500,0 в том числе - женщины Рис.3.8. Ленточная диаграмма сравнения численности населения Структура с.х. производства Воронежской области, 2012 год 44,7 47,6 Сельскохозяйственные предприятия Крестьянские (фермерские) хозяйства Хозяйства населения 7,7 Рис.3.9. Секторная диаграмма структуры сельскохозяйственного производства 39 Конспект лекций по ОТС (Егорова Е.В.) 3. Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории – в республике, области, экономическом или административном районе и т.д. На картограмме распределение изучаемого признака по территории изображается условными знаками (точками, штриховкой, цветом и т.д.), соответствующими определенным интервалам значений величины этого признака. Эти знаки покрывают контур каждого района. Картограмма применяется в тех случаях, когда возникает необходимость показать территориальное распределение какого-нибудь одного статистического признака между отдельными районами для выявления закономерностей этого распределения. Картограммы бывают фоновые и точечные. На фоновых картограммах распределение изучаемого явления на территории изображается различной раскраской территориальных единиц с разной густотой цвета. Часто вместо раскраски применяется штриховка различной интенсивности. Чем интенсивнее явление, тем гуще штриховка (точки), или темнее окраска. Такие картограммы обычно используются для изображения уровня относительных и средних величин по территориям. На точечной картограмме символами графического изображения статистических данных являются точки, размещенные в пределах определенных территориальных границ. Точечная картограмма применяется для изображения абсолютных величин. Каждой точке, нанесенной на картограмму, придается числовое значение, что позволяет использовать ее для прямого счета. 40 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Наиболее удобная и рациональная форма представления количественных данных – таблица. Статистическая таблица должна быть построена по определенным правилам. Она состоит из подлежащего (объект изучения) и сказуемого (цифровая характеристика объекта). Вид таблицы определяется по подлежащему – по тому, как представлен объект изучения: простая таблица – объект изучения не разделен на группы, т.е. показываются либо единицы совокупности, либо совокупность в целом; групповая таблица – объект изучения разделен на группы по одному признаку; комбинационная таблица – объект изучения разделен на группы по двум и более признакам; типовая таблица – объект изучения разделен на типы, и в подлежащем дана словесная характеристика типов. Таблица должна иметь заголовок; должен быть указан источник данных. Графики обеспечивают наглядность представления данных; они подразделяются на линейные, плоскостные и секторные. Пространственное представление статистических данных достигается с помощью картограмм и картодиаграмм. 41 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 4. ГРУППИРОВКА 1. Значение и сущность группировки Группировка – это разграничение общей совокупности на однородные группы единиц. Группировка лежит в основе дальнейшей работы с собранной информацией. Она обеспечивает систематизацию данных, их обобщение, отражает состав совокупности, создает основы для расчета системы показателей. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не сможем уловить ее структуры, роли отдельных групп, их специфики. Например, можно рассчитать среднюю прибыль на одно предприятие, обобщая данные по всем предприятиям данной территории, а можно первоначально разделить их на прибыльные и убыточные, прибыльные – на подгруппы по величине прибыли и только после этого приступить к расчетам средней прибыли в каждой группе (для убыточных предприятий финансовый результат – это средняя сумма убытка на одно предприятие). Тогда можно сравнить успешность работы предприятий по группам, узнать долю каждой группы в общей численности предприятий. Очевидно, что дифференцированный подход даст больше информации и обеспечит лучшее качество анализа и выводов. Однородность (гомогенность) данных является исходным условием их статистического описания и анализа – вычисления и интерпретации обобщающих показателей, построения уравнения регрессии, измерения корреляции. Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. Кроме того, группировка создает основу для последующей сводки и анализа данных. Статистические показатели, как обобщающие характеристики какоголибо свойства единиц совокупности, формируются в процессе статистической сводки, т.е. путем объединения первичных данных по группам или совокупности в целом. Сводные показатели для отдельных групп являются типичными и устойчивыми, если, во-первых, группировка проведена правильно, во-вторых, группы имеют достаточную численность. Первое условие связано с тем, что деление на группы далеко не всегда очевидно. Выполнение второго условия необходимо, так как при достаточно большом числе единиц (не менее пяти в группе) в сводных показателях взаимопогашаются случайные характеристики и проявляются закономерные, типичные. 42 Конспект лекций по ОТС (Егорова Е.В.) Группировка и сводка как методы обобщения данных взаимосвязаны и дополняют друг друга. Расчет показателей сводки на основе предварительной группировки данных существенно расширяет возможности статистического анализа. В свою очередь, показатели сводки отражают результативность проведенной группировки. Рассчитанные сводные показатели по группам позволяют решить ряд задач: − установить наличие, размеры и распространенность выделенных групп в общей совокупности; − раскрыть основные свойства этих групп, уровень однородности составляющих каждую группу явлений; − оценить степень различий между выделенными группами. 43 Конспект лекций по ОТС (Егорова Е.В.) 2. Виды группировок Задачи группировок состоят в следующем: − выделение социально-экономических типов; − изучение структуры совокупности; − исследование связи между признаками. В зависимости от решаемых задач выделяют три вида группировок: − типологические; − структурные (вариационные); − аналитические (факторные). Типологическая группировка – это разделение разнородной совокупности на однокачественные группы (частные совокупности), которые отличаются типом явлений. Типологическая группировка состоит в определении перечня типов, которые встречаются в изучаемой совокупности экспертным путем в соответствии с поставленной целью исследования. Например, при изучении сельскохозяйственного производства хозяйства делятся на три категории: сельскохозяйственные предприятия, крестьянские (фермерские) хозяйства и хозяйства населения. В целях изучения деловой активности банков их делят по объему собственных средств на малые, средние и крупные. Таблица 4.1 – Основные показатели сельскохозяйственного производства Тверской области (2012 год) Категория хозяйств Надоено молока кг на 1 корову Урожайность картофеля ц/га Урожайность овощей ц/га Сельскохозяйственные организации 3 361 168 236 Крестьянские (фермерские) хозяйства Хозяйства населения 3 212 4 584 172 111 136 242 Из таблицы видно, что самый высокий уровень надоев в хозяйствах населения, вместе с тем в данной категории хозяйств самая низкая урожайность картофеля. Урожайность овощей примерно одинаковая в хозяйствах населения и сельскохозяйственных организациях. Крестьянские (фермерские) хозяйства имеют самые низкие показатели сельскохозяйственного производства. 44 Конспект лекций по ОТС (Егорова Е.В.) Структурная группировка предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку. Таблица 4.2 – Группировка кредитных организаций по величине активов Группа кредитных организаций по величине активов, млн.руб. 1-5 6-20 21-50 51-200 201-500 501 и более Итого Количество филиалов единиц 415 261 392 628 409 244 2 349 %, к итогу 17,7 11,1 16,7 26,7 17,4 10,4 100 Собственные средства млн. руб. 2 941 102 1 165 873 662 541 865 230 342 078 136 114 6 112 937 Объем вкладов физических лиц %, к итогу 48,1 19,1 10,8 14,2 5,6 2,2 100 млн. руб. 7 988 371 1 957 270 1 469 834 1 924 432 769 147 141 993 14 251 046 %, к итогу 56,1 13,7 10,3 13,5 5,4 1,0 100 Объем предоставленных кредитов - всего млн. руб. 17 894 698 6 716 158 3 632 880 4 065 065 1 339 886 311 398 33 960 085 %, к итогу 52,7 19,8 10,7 12,0 3,9 0,9 100 Различия между типологической и структурной группировкой часто оказываются весьма условными. С одной стороны, выделенные типы отражают структуру совокупности, с другой – если границы интервалов совпадают с типами, то группировка может назваться типологической. Использование структурных группировок позволяет не только раскрыть соотношение различных частей изучаемой совокупности, но и через сопоставление во времени проанализировать наметившиеся в ней структурные сдвиги. Для характеристики интенсивности изменений используют интегральные показатели структурных сдвигов. Линейный коэффициент абсолютных структурных сдвигов: где = ∑| − | (4.1) ∑( − ) (4.2) d0 и d1 – удельный вес каждой части соответственно в базисном и отчетном периоде; n – количество составных частей совокупности. Квадратичный коэффициент абсолютных структурных сдвигов: = При отсутствии изменений в составе совокупности величина линейного и квадратичного коэффициента абсолютных структурных сдвигов равна нулю. Для оценки усиления или снижения интенсивности структурных сдвигов расчет проводят по нескольким периодам. 45 Конспект лекций по ОТС (Егорова Е.В.) Индекс различий: где 1 (4.3) | − | 2 d0 и d1 – удельный вес каждой части соответственно в базисном и отчетном периоде, выраженный в долях единицы. разл. = Значение индекса может меняться от нуля до единицы. Чем ближе его величина к единице, тем значительнее степень изменений в составе анализируемой группы статей. Таблица 4.3 – Изменение структуры сельскохозяйственного производства за 1995-2010 гг. Категория хозяйств С.х. организации Хозяйства населения Крестьянские (фермерские) хозяйства Хозяйства всех категорий 1995 2000 2005 2010 | − 1995-2000 | ( − 5,0 25,0 50,2 45,2 44,6 44,5 47,9 51,6 49,3 48,3 3,7 1,9 3,2 6,1 7,2 100,0 100,0 100,0 100,0 / / / ∑| | ∑( − ) ∑( − ) = = / − = = ∑| | − 2005-2010 | ( − ) 0,1 0,0 13,7 1,0 1,0 1,3 1,7 1,1 1,2 10,0 40,4 2,2 2,2 10,0 = 3,33 3 | 2,2 = = 0,73 3 = = = 40,4 = 3,67 3 2,2 = 0,86 3 0,1 = 0,05 2 1 0,022 / | − |= = = 0,011 разл. 2 2 Таким образом, в период 1995-2000 гг. изменение структуры сельскохозяйственного производства происходило более интенсивно по сравнению с периодом 2005-2010 гг. разл. / = 1 2 − ) | − |= 46 Конспект лекций по ОТС (Егорова Е.В.) Аналитическая группировка является средством изучения связи между признаками. Аналитическая группировка отличается тем, что при ее построении признаки делятся на факторные и результативные. Единицы совокупности делятся по факторному признаку, а затем каждая группа характеризуется средними величинами результативного признака. Сопоставляя изменения средних значений результативного признака по группам с изменением фактора, можно сделать вывод о наличии или отсутствии связи, ее форме и направлении. Таблица 4.4 – Влияние трудообеспеченности сельскохозяйственных предприятий Тамбовской области на эффективность производства (2008 год) Показатели Количество хозяйств в группе Среднее значение признака в группе Получено валовой продукции в расчете на 100 га с.х. угодий, тыс. руб. Получено прибыли на 100 га с.х. угодий, тыс. руб. Уровень рентабельности, % Группы хозяйств с количеством работников приходящихся на 100 га сельскохозяйственных угодий, чел. до 1 1,01-2,00 2,01-4,00 свыше 4 84 136 77 15 0,66 1,51 2,66 6,02 509,31 650,70 846,65 2297,29 51,44 13,70 132,44 15,84 146,08 17,82 404,78 30,89 Из таблицы видно, что с ростом трудообеспечености растет выход валовой продукции и прибыли на 100 га сельскохозяйственных Наблюдается также рост уровня рентабельности. Группировка может быть произведена по одному или нескольким признакам. Если группы образуются по одному признаку, группировка называется простой. Группировка, в которой разделение совокупности на группы производится по двум или более признакам называется комбинационной. Основанием группировки может служить как неколичественный (атрибутивный) признак, так и количественный признак. Выбор атрибутивного группировочного признака зачастую определяет и количество групп (например, группировка населения по полу предполагает только две группы, группировка сельскохозяйственных товаропроизводителей по категориям хозяйств – три группы). Разграничение групп по количественным группировочным признакам, как правило, связано с образованием интервалов по этим признакам. Интервалы группировки – это количественные значения признака, на основе которых исследуемые явления разбиваются на группы. Разность между верхней и нижней границами интервала составляет его величину. Интервалы могут быть равными или неравными. 47 Конспект лекций по ОТС (Егорова Е.В.) Равные интервалы применяются в тех случаях, когда изменение признака происходит в сравнительно узких границах и носит более или менее равномерный характер. Для группировки с равными интервалами величина интервала определяется по формуле − (4.4) ℎ= где h – величина отдельного интервала; xmax и xmin – наибольшее и наименьшее значение признака в исследуемой совокупности; n – число групп. Неравные интервалы иногда применяются как прогрессивно возрастающие или убывающие. Использование таких интервалов при изучении социально-экономических явлений обусловлено тем, что для большей их части количественное изменение размера признака имеет неодинаковое значение в высших и низших группах. Интервалы группировки могут быть закрытыми (с указанием нижней и верхней границ) и открытыми (с указанием одной границы). Открытые интервалы применяются только для крайних групп. Порядок выбора группировочного признака и интервалов зависит от вида группировки. При типологической группировке число интервалов определяется числом выделенных типов, а величина каждого из интервала зависит от содержания типа. При этом, как правило, используют открытые и неравные интервалы. В аналитических и структурных группировках анализ проводится в однокачественных совокупностях, образованных в результате типологической группировки. Чем значительнее совокупность единиц, чем интенсивнее меняется признак, тем больше может быть образовано групп. Применяются, как правило, закрытые, равные интервалы. Ориентировочно количество групп при группировке с равными интервалами можно рассчитать по формуле, предложенной в 1926 году американским ученым Гербертом Стерджессом (Sturges H. The choice of a class-interval. // J.Amer. Statist. Assoc. 1926. №21/ P.65-66). где = 1 + 3.322lg N – число единиц совокупности; n – число групп. 48 Конспект лекций по ОТС (Егорова Е.В.) (4.5) Итак, этапы построения интервальной группировки следующие. 1. Определение минимального и максимального значения признака. 2. Определение размаха варьирования признака. 3. Определение приблизительного числа групп. 4. Определение ширины интервала. 5. Определение граничных значений интервалов. Рекомендуется отступить влево от нижнего предела варьирования (xmin), так как минимальное наблюдение данной совокупности может быть не минимально возможным значением признака. За нижнюю границу первого интервала обычно принимается величина = −ℎ 2 Если оказывается, что a1<0, хотя по смыслу рассматриваемая величина не отрицательная, то принимают a1=0. Верхняя граница первого интервала равняется = +ℎ Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше xmax. 6. Группировка результатов наблюдения. 49 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Требование однородности данных выдвигается на всех этапах статистического анализа. Для получения однородных данных проводится группировка. При этом различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам. Проведение группировки включает выбор группировочного признака (или признаков) и определение границ интервалов. Чаще всего группировки проводятся с равными интервалами, но при неравномерном изменении группировочного признака и его значительной вариации применяются группировки с равнонаполненными интервалами. В зависимости от цели проведения различают следующие виды группировок: типологические, структурные, аналитические. Типологическая группировка проводится с целью выделения социально-экономических типов. Структурная группировка соответствует вариационному ряду. Аналитическая группировка строится для изучения зависимости одного признака от другого. 50 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 5. СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ 1. Теоретические основы средних показателей Как уже было сказано, статистика изучает массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойствами (вариациями). Средний показатель (средняя величина, или просто средняя) является наиболее распространенной формой статистических показателей, используемой в экономических расчетах, и представляет собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности варьируют, отклоняются в ту или иную сторону под влиянием множества факторов, среди которых могут быть как основные, так и случайные. Например, курс акций компании в основном определяется производственными и финансовыми результатами ее деятельности, конкурентоспособностью на рынке. В то же время в отдельные дни и на отдельных биржах эти акции в силу сложившихся соотношений между спросом и предложением или под воздействием каких-либо причин случайного характера могут продаваться по более высокому или заниженному курсу. Сущность средней заключается в том, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием основных факторов. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам. Типичность средней непосредственным образом связана с однородностью статистической совокупности. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности. Например, если мы рассчитаем средний курс по акциям всех компаний, реализуемых в данный день на данной бирже, то получим фиктивную среднюю. Это будет объясняться тем, что используемая для расчета совокупность является крайне неоднородной. Предприятия относятся к разным отраслям, имеют разные размеры, отличаются по финансовым показателям и другим признакам. В подобных случаях метод средних используется в сочетании с методом группировок: если совокупность неоднородна – общие средние должны быть заменены или дополнены групповыми средними, т.е. средними, рассчитанными по качественно однородным группам. 51 Конспект лекций по ОТС (Егорова Е.В.) От того, в каком виде представлены исходные данные для расчета средней, зависит, какую форму средней величины следует рассчитывать: − средняя арифметическая; − средняя гармоническая; − средняя геометрическая; − средняя квадратическая, кубическая и т.д. Перечисленные средние объединяются в общей формуле средней степенной (при различной величине k): где ̅= ∑ ∑ (5.1) хi – i-й вариант осредняемого признака (i =1, n); fi – вес i-го варианта. Помимо степенных средних в экономической практике также используются средние структурные, среди которых наиболее распространены мода и медиана. При осреднении уровней динамических рядов применяются различные виды средней хронологической. Нужно помнить, что вычисление средней не является простой счетной операцией. Для научно обоснованного использования средних необходимо соблюдать следующие условия: 1. Средние величины должны рассчитываться только по качественно однородным совокупностям. Только при выполнении этого условия средняя как обобщающая характеристика отражает общее, типичное, закономерное, присущее всем единицам исследуемой совокупности. Средние, полученные для неоднородных совокупностей будут описательными, будут искажать характер изучаемого явления. В таких случаях метод средних используется в сочетании с методом группировок, позволяющим выделить однородные группы, по которым и исчисляются типические групповые средние. 2. Средняя должна исчисляться по совокупности, состоящей из достаточно большого числа единиц. Только в этом случае обеспечивается взаимопогашение случайных индивидуальных особенностей, что способствует проявлению основного, существенного, типичного, присущего всей массе единиц. 3. Каждая средняя характеризует изучаемую совокупность лишь по какому-либо одному признаку. Для того чтобы дать всестороннюю характеристику совокупности, чтобы понять сущность средней, необходимо использовать систему взаимосвязанных средних величин. 4. Средняя должна вычисляться исходя: а) из социально-экономического смысла признака б) из характера исходных статистических данных, по которым определяется средняя. 52 Конспект лекций по ОТС (Егорова Е.В.) 2. Средняя арифметическая величина Наиболее распространенным видом средних величин является средняя арифметическая, которая, как и все средние, в зависимости от характера имеющихся данных может быть невзвешенной (простой) или взвешенной. Эта форма средней используется в тех случаях, когда расчет осуществляется по несгруппированным данным. Формула средней арифметической простой имеет вид: ̅= + + ⋯+ = ∑ (5.2) Рассмотрим пример, расчета среднеарифметической простой. Таблица 5.1. – Площадь сельскохозяйственных угодий К(Ф)Х в районах Тверской области* № п/п район Тверской области площадь с.х. угодий К(Ф)Х, га № п/п район Тверской области 3920,0 19 Лихославльский 2243,0 2140,0 20 Максатихинский 4463,0 2789,0 21 Молоковский 2300,0 834,0 22 Нелидовский 527,0 465,0 23 Оленинский 1589,0 3458,0 24 Осташковский 3131,0 82,0 25 Пеновский 1078,0 301,0 26 Рамешковский 5952,0 1150,0 27 Ржевский 2092,0 5623,0 28 Сандовский 496,0 1916,0 29 Селижаровский 3281,0 3092,0 30 Сонковский 204,0 184,0 31 Спировский 3720,0 4541,0 32 Старицкий 5172,0 1862,0 33 Торжокский 2607,0 1249,0 34 Торопецкий 3240,0 568,0 35 Удомельский 1596,0 8659,0 36 Фировский 319,0 Общая земельная площадь, га 86843 Средняя земельная площадь, га 2412,3 * Источник: Итоги Всероссийской сельскохозяйственной переписи 2006 года: в 9 Т./Федеральная служба гос. статистики. М.: ИИЦ «Статистика России», 2008. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 где Андреапольский Бежецкий Бельский Бологовский Весьегонский Вышневолоцкий Жарковский Западнодвинский Зубцовский Калининский Калязинский Кашинский Кесовогорский Кимрский Конаковский Краснохолмский Кувшиновский Лесной площадь с.х. угодий К(Ф)Х, га ∑ 86843 = 2412,3 36 xi – площадь с.х. угодий фермерских хозяйств в i-м районе; n – количество районов Тверской области ̅= = 53 Конспект лекций по ОТС (Егорова Е.В.) В связи с тем, что в данном случае каждый вариант признака встречался только один раз, т.е. у всех районов была разная площадь с.х. угодий, при расчете мы использовали формулу средней арифметической простой (невзвешенной). При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться по нескольку раз. В подобных случаях расчет средней производится по сгруппированным данным или вариационным рядам, которые могут быть дискретными или интервальными. Формула средней арифметической взвешенной имеет вид: Рассмотрим пример. ̅= ∑ ∑ (5.3) Таблица 5.2 – Сбор картофеля в регионах ЦФО, 2008 год* площадь под посадку урожайность, ц/га картофеля, га Белгородская область 54 684 87,4 Брянская область 43 215 162,5 Владимирская область 24 588 109,0 Воронежская область 99 657 117,8 Ивановская область 10 895 99,2 Калужская область 23 573 137,0 Костромская область 10 879 147,2 Курская область 62 971 131,5 Липецкая область 47 778 105,5 Московская область 48 249 147,3 Орловская область 29 751 137,5 Рязанская область 28 009 137,0 Смоленская область 19 277 109,4 Тамбовская область 39 968 108,1 Тверская область 18 968 126,2 Тульская область 39 894 154,5 Ярославская область 14 337 125,6 Центральный федеральный округ 616 693 125,3 * Официальный сайт Росстата. Режим доступа: http://www.gks.ru/ Регион ЦФО где ̅= ∑ = 77 280 000 = 125,3 ц/га 616 693 xi – урожайность картофеля в i-м регионе; fi – площадь под посадкой картофеля в i-м регионе. 54 Конспект лекций по ОТС (Егорова Е.В.) При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. Рассмотрим пример. Таблица 5.3 – Численность населения города N Возраст 0-4 05-09 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70 и более Всего Количество человек 4082 3545 3202 3736 5702 6131 5597 5311 4805 5283 6257 5778 4917 2410 10124 76880 Для определения среднего возраста жителей данного города найдем середины интервалов. При этом величины открытого интервала (последнего) условно приравняем к величинам интервала, примыкающего к нему (предпоследнего). С учетом этого середины интервалов будут следующими: 2; 7; 12; 17; 22; 27: 32; 37; 42; 47; 52; 57; 62; 67; 72 Используя среднюю арифметическую взвешенную, определим средний возраст жителей города: где ∑ 2 × 4 082 + 7 × 3 545 + ⋯ + 72 × 10 124 = 4 082 + 3 545 + ⋯ + 10 124 3 101 580 = = 40,3 года 76 880 xi – возраст в середине i-го интервала; fi – количество жителей в возрасте i-го интервала. ̅= = 55 Конспект лекций по ОТС (Егорова Е.В.) Средняя арифметическая обладает некоторыми математическими свойствами, более полно раскрывающими ее сущность и в ряде случаев используемыми при ее расчете. Рассмотрим эти свойства. 1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты: ̅ = 2. Сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: ( ) =0 − ̅ 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины С: 4. Если все варианты значений признака уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится на ту же величину: ∑( ± ) = ̅± ∑ 5. Если все варианты значений признака уменьшить или увеличить в А раз, то средняя также соответственно увеличится или уменьшится в А раз: ∑ = ∑ 1 ̅ 6. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится: ∑ = ̅ ∑ Из данного свойства следует, что если все веса равны между собой, то расчеты по средней арифметической взвешенной и средней арифметической невзвешенной приведут к одному и тому же результату. 56 Конспект лекций по ОТС (Егорова Е.В.) 3. Другие формы средних величин Несмотря на то, что средняя арифметическая является самой распространенной формой средней величины, кроме нее при расчете статистических показателей применяются и другие виды средних. При этом следует учитывать, что в каждом конкретном случае, в зависимости от характера имеющихся данных, существует только одно истинное среднее значение показателя. Средняя гармоническая взвешенная ∑ ̅= (5.4) ∑ где wi – произведение значения варьирующего признака на его вес (xi fi) xi – отдельные значения признака (варианты). Таблица 5.4 – Себестоимость и затраты на производство продукции в трех агрофирмах Агрофирма А Б В Себестоимость продукции, руб./ц 380 420 310 Затраты на производство продукции, тыс. руб. 273,6 258,3 291,4 273 600 + 258 300 + 291 400 823 300 = = 361,9 руб. 273 600 258 300 291 400 2 275 + + 380 420 310 Средняя гармоническая простая ̅= где ̅= ∑ 1 (5.5) xi – отдельные значения признака (варианты); n – общее число вариантов. Пример. Две машины прошли один и тот же путь: одна со скоростью 60 км/час, а вторая – 80 км/час. Принимаем протяженность пути, который прошла каждая машина, за единицу. Тогда средняя скорость составит: 1+1 2 480 ̅= = = = 68,6 км/ч 1 1 4+3 7 + 60 80 240 Средняя гармоническая взвешенная в расчетах используется значительно чаще невзвешенной. Средняя гармоническая невзвешенная может использоваться вместо взвешенной в тех случаях, когда значения wi для единиц совокупности равны (в рассмотренном примере пройденный путь автомобилями одинаковый). 57 Конспект лекций по ОТС (Егорова Е.В.) Средняя геометрическая простая Средняя геометрическая применяется при определении средних относительных изменений. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X. ̅= × × ⋯× = (5.6) Таблица 5.5 – Уровень инфляции в России, 2012 год, % ̅= Январь 0,50 Июль 1,23 Февраль 0,37 Август 0,10 Март 0,58 Сентябрь 0,55 Апрель 0,31 Октябрь 0,46 Май 0,52 Ноябрь 0,34 Июнь 0,89 Декабрь 0,54 0,5 × 0,37 × 0,58 × 0,31 × 0,52 × 0,89 × 1,23 × 0,10 × 0,55 × 0,46 × 0,34 × 0,54 = 0,46 Средняя квадратическая Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений Главной сферой применения квадратической средней является измерение вариации значений X Средняя квадратическая простая ̅= ∑ (5.7) Средняя квадратическая взвешенная ̅= ∑ (5.8) 58 Конспект лекций по ОТС (Егорова Е.В.) Структурные средние Мода представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. Это наиболее типичное, распространенное значение признака в изучаемой статистической совокупности. Медианой называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: | | = min − 59 Конспект лекций по ОТС (Егорова Е.В.) 4. Показатели вариации Вариация признака – это изменение значений признака у единиц статистической совокупности, которые обусловлены влиянием действия различных факторов. Например, прибыль коммерческих юридических лиц складывается под влиянием внутренних и внешних факторов. К внешним факторам относятся географическое положение страны, система налогообложения, конъюнктура рынка, уровень цен на потребляемые материальнотехнические ресурсы и др. Наиболее значимыми внутренними факторами считаются объем выпускаемой продукции, цена, затраты, ассортимент продукции (работ, услуг). Наряду с вычислением средней прибыли, сложившейся под влиянием указанных и прочих факторов, при сравнении статистических совокупностей встает вопрос об оценке вариации значений признака в данном распределении, т.е. о том, как отдельные значения изучаемого признака группируются вокруг средней, какова степень их разбросанности. Существуют две группы показателей вариации: 1) абсолютные; 2) относительные. Абсолютные показатели вариации. Первой абсолютной величиной, с помощью которой измеряется вариация признака, является размах вариации. Размах вариации (R) – это разность между наибольшим и наименьшим значениями признака. Он определяется следующим образом: где = − (5.9) xmax – максимальное значение признака; xmin – минимальное значение признака. Следовательно, величина размаха вариации зависит от крайних значений признака и не отражает колеблемости признака у основной массы единиц совокупности. 60 Конспект лекций по ОТС (Егорова Е.В.) Пример. Таблица 5.6 – Денежные доходы в ЦФО (в среднем на душу) Регион Белгородская область Брянская область Владимирская область Воронежская область г.Москва Ивановская область Калужская область Костромская область Курская область руб. 18 799,7 15 347,6 14 312,2 15 870,9 47 318,9 13 005,5 17 556,9 14 822,6 16 386,9 Регион Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область руб. 16 811,3 25 604,5 14 824,3 14 788,0 15 969,1 15 150,6 14 943,4 16 975,0 15 508,9 Максимальный доход – 47 318,9 рублей; Минимальный доход – 13 005,5 рублей; Размах вариации = 47 318,9 – 13 005,5 = 34 313,4 рублей. На практике часто требуется такой показатель, который будет отражать вариацию значений признаков от их средней (общей) величины. К таким показателям относятся: − среднее линейное отклонение; − дисперсия; − среднее квадратическое отклонение. Вышеуказанные показатели вариации представляют собой средние показатели, полученные из отклонений индивидуальных значений признака от их среднего. Среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности и вычисляется для несгруппированных и сгруппированных данных по следующим формулам. среднее линейное отклонение простое: ∑| − ̅ | ̅= (5.10) среднее линейное отклонение взвешенное: ∑| − ̅ | ̅= ∑ 61 Конспект лекций по ОТС (Егорова Е.В.) (5.11) Пример. Таблица 5.7 – Денежные доходы в ЦФО (в среднем на душу) Регион Белгородская область Брянская область Владимирская область Воронежская область г.Москва Ивановская область Калужская область Костромская область Курская область Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область руб. (xi) 18 799,7 15 347,6 14 312,2 15 870,9 47 318,9 13 005,5 17 556,9 14 822,6 16 386,9 16 811,3 25 604,5 14 824,3 14 788,0 15 969,1 15 150,6 14 943,4 16 975,0 15 508,9 | | − ̅ 799,9 2652,2 3687,6 2128,9 29319,1 4994,3 442,9 3177,2 1612,9 1188,5 7604,7 3175,5 3211,8 2030,7 2849,2 3056,4 1024,8 2490,9 По данным таблицы: средний доход на душу составляет 17 999,8 руб. среднее линейное отклонение: 75 447,4 = 4 191,5 руб. 18 Исчисленная величина означает, что в среднем отклонение дохода на душу населения по регионам от средней величины по ЦФО составляет 4 191,5 руб. Поскольку Москва и Московская область явные выбросы в данной совокупности статистический анализ следует проводить без учета этих регионов. Тогда, средний доход на душу населения составит – 15 692,1 руб., а среднее линейное отклонение – 947,3 руб. 62 Конспект лекций по ОТС (Егорова Е.В.) 20 000,0 18 000,0 16 000,0 14 000,0 12 000,0 10 000,0 8 000,0 6 000,0 4 000,0 2 000,0 0,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Рис. 5.1. Наглядное представление среднего линейного отклонения Дисперсия есть средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных рассчитывается по формулам простой дисперсии (для несгруппированных данных) и взвешенной дисперсии (для сгруппированных данных): простая дисперсия: = взвешенная дисперсия: = ∑( ∑( ) − ̅ ) − ̅ ∑ (5.12) (5.13) Однако в чистом виде, как, например, средняя арифметическая, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который используется для других видов статистического анализа. Среднее квадратическое отклонение (стандартное отклонение) характеризует меру рассеяния данных, но в отличие от дисперсии его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые. Среднее квадратическое отклонение рассчитывается как корень квадратный из дисперсии. Эта величина также вычисляется как простая или взвешенная в зависимости от того, какими являются исходные данные – сгруппированными или несгруппированными: 63 Конспект лекций по ОТС (Егорова Е.В.) среднее квадратическое отклонение простое: = ∑( ) − ̅ (5.14) среднее квадратическое отклонение взвешенное: = ∑( ) − ̅ ∑ (5.15) Таблица 5.8 – Расчет дисперсии и среднеквадратического отклонения доходов населения ЦФО Регион Белгородская область Брянская область Владимирская область Воронежская область Ивановская область Калужская область Костромская область Курская область Липецкая область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область руб. 18 799,7 15 347,6 14 312,2 15 870,9 13 005,5 17 556,9 14 822,6 16 386,9 16 811,3 14 824,3 14 788,0 15 969,1 15 150,6 14 943,4 16 975,0 15 508,9 = ( ) − ̅ 3107,6 -344,5 -1379,9 178,8 -2686,6 1864,8 -869,5 694,8 1119,2 -867,8 -904,1 277,0 -541,5 -748,7 1282,9 -183,2 29 079 007,2 = 1817437,9 16 = 1817437,9 = 1348,1 ( ) − ̅ 9657449,7 118650,1 1904003,3 31985,1 7217584,5 3477642,2 755954,2 482807,8 1252706,6 753000,9 817317,7 76753,2 293174,9 560486,2 1645944,7 33546,2 В условиях нормального распределения существует определенная взаимосвязь величины среднего квадратического отклонения и количества наблюдений: − в пределах xср ±1σ располагается 68,3% количества наблюдений; − в пределах xср ±2σ располагается 95,4% количества наблюдений; − в пределах xср ±3σ располагается 99,7% количества наблюдений. 64 Конспект лекций по ОТС (Егорова Е.В.) Относительные показатели вариации. Эти показатели характеризуют колеблемость изучаемых признаков в совокупности или одного и того же признака в нескольких совокупностях. Эти показатели исчисляются в виде отношения (в процентах) абсолютного показателя вариации к средней арифметической. Существуют следующие относительные показатели вариации: коэффициент осцилляции: = × 100% ̅ линейный коэффициент вариации: ̅ = × 100% ̅ коэффициент вариации: (5.16) (5.17) = × 100% (5.18) ̅ Если коэффициент вариации не превышает 33%, то совокупность считается однородной. Правило сложения дисперсий. Это правило применяется в том случае, когда совокупность разбита на две или более группы по какому-либо факторному признаку, предположительно оказывающему влияние на вариацию исследуемого результативного признака. Существуют следующие виды дисперсий в совокупности, разделенной на группы: − общая дисперсия; − межгрупповая дисперсия; − средняя из внутригрупповых дисперсий. Общая дисперсия позволяет измерить вариацию признака в совокупности под влиянием всех факторов, обусловивших данную вариацию. Общая дисперсия рассчитывается по следующей формуле: = ∑( ) − ̅ ∑ ∑( ) − ̅ ∑ (5.19) Межгрупповая дисперсия характеризует различия в величине изучаемого признака, возникающие под влиянием факторного признака, положенного в основание группировки. Таким образом, данная дисперсия отражает систематическую вариацию и исчисляется по формуле: = 65 Конспект лекций по ОТС (Егорова Е.В.) (5.20) где ̅– общая средняя изучаемого показателя; – групповые средние; ni – численность по отдельным группам. Внутригрупповая дисперсия отражает часть вариации, происходящей под влиянием неучтенных факторов и не зависящей от факторного признака, положенного в основание группировки. Она отражает случайную вариацию и определяется следующим образом: = ∑( ) − ̅ ∑ (5.21) Средняя из внутригрупповых дисперсий равна: = ∑ ∑ (5.22) Закон, связывающий три вида дисперсий, принято называть правилом сложения дисперсий. Согласно правилу общую дисперсию можно рассчитать как сумму дисперсии, возникающей под влиянием всех прочих факторов, и дисперсии, появляющейся за счет группировочного признака: = + (5.23) 66 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Средние величины – важнейшие статистические показатели. При вычислении по однородным данным они характеризуют типичные значения признаков. Показательность средней зависит не только от однородности, но и от объема данных – при прочих равных условиях чем больше объем наблюдений, тем более надежна средняя величина. Средние, используемые статистикой, относятся к степенным средним. В зависимости от показателя степени k выделяются средние разных видов: арифметические, гармонические, геометрические, квадратические. Средние подразделяются на простые и взвешенные. Взвешивание позволяет отразить реальное значение отдельных вариантов. Чем сильнее варьируют веса и чем сильнее корреляция между осредняемым признаком и весом, тем больше значение взвешенной средней отличается от значения простой средней, рассчитанной по тем же данным. Медиана и мода относятся к структурным характеристикам ряда распределения. Размер и интенсивность вариации измеряются следующими показателями: размах вариации, среднее линейное отклонение от средней (среднее абсолютное отклонение), среднее квадратическое отклонение, дисперсия, коэффициент вариации. Если значение среднего квадратического отклонения составляет половину и более значения средней, то данные можно считать неоднородными. Общая дисперсия равна сумме межгрупповой и внутри групповой дисперсий. 67 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 6. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКИХ СВЯЗЕЙ 1. Определение степени зависимости признаков Важнейшей задачей многих экономических исследований является анализ взаимосвязей, присущих изучаемым процессам и явлениям. Изучение этих взаимосвязей возможно при помощи построения эконометрических моделей, параметры которых оцениваются средствами математической статистики. Построенные модели выступают в качестве средств анализа и прогнозирования экономических явлений. Переменные, участвующие в эконометрической модели, разделяются на результирующую (зависимую) и объясняющие (независимые) переменные. Результирующая переменная характеризует результат или эффективность функционирования экономической системы. Значения ее формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов. Объясняющие переменные – это переменные, которые поддаются регистрации и описывают условия функционирования реальной экономической системы. Они в значительной мере определяют значения результирующей переменной. В экономических исследованиях между результирующей (Y) и объясняющими (X) переменными выделяют два основных типа связи: функциональную (жестко детерминированную) и статистическую (стохастически детерминированную). Функциональные связи характеризуются полным соответствием между изменением факторного признака (объясняющей переменной) и изменением результативного признака (результирующей переменной). При функциональной связи каждому значению факторного признака соответствует строго определенное значение результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. (Например, выручка в зависимости от объема продаж и цены реализации). В статистических связях, которых большинство, между изменением факторного и результативного признака нет полного соответствия. При статистической связи с изменением значения факторного признака значение результативного может варьировать в определенных пределах с некоторой вероятностью, т. е. одному и тому же значению факторного признака соответствует целое распределение значений результативного. Статистическая связь проявляется не в каждом отдельном случае, а в среднем при массовом числе наблюдений. Частным случаем статистической зависимости является корреляционная зависимость, при которой функциональной зависимостью связаны факторный признак и среднее значение результативной переменной. 68 Конспект лекций по ОТС (Егорова Е.В.) Исследование зависимости включает задачи двух видов: определение степени и вида зависимости между признаками X и Y. Оценить тесноту статистической связи и определить ее направление позволяет корреляционный анализ, а установить форму связи (аналитическое выражение зависимости) возможно в рамках регрессионного анализа. Поскольку, как правило, эти два метода анализа взаимосвязей используются одновременно, в литературе часто встречается термин «корреляционнорегрессионный анализ». Существуют различные приемы изучения статистических взаимосвязей экономических явлений, среди которых широкое распространение получил корреляционный анализ. С помощью корреляционного анализа устанавливается численное значение тесноты связи между явлениями и достоверность суждений об их наличии, производится отбор факторов, оказывающих наиболее существенное влияние на результативный признак. Статистической мерой взаимодействия двух переменных является ковариация (Cov), которая рассчитывается следующим образом: где 1 n Cov = (6.1) ∑ ( xi − x )( yi − y ) , n − 1 i =1 xi и yi – фактические значения независимой и зависимой переменной; 1 n 1 n x = ∑ xi , y = ∑ yi . n i =1 n i =1 Этот показатель неудобен для практического применения, так как имеет размерность, равную произведению размерностей переменных, и по его величине трудно судить об их зависимости. Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом парной линейной корреляции (r). Он рассчитывается по одной из формул: 1 n ∑ ( x − x )( yi − y ) Cov n − 1 i =1 i r= = = sx s y sx s y n ∑ ( xi − x )( yi − y ) i =1 n n ∑ ( xi − x ) ∑ ( y i − y ) 2 i =1 ; (6.2) 2 i =1 1 1 ( xi − x )2 , s y = ( yi − y ) 2 – соответствующие дисперсии. n −1 n −1 Слагаемые в числителе выражают взаимодействие двух переменных и определяют знак корреляции. Если между переменными – сильная положительная взаимосвязь (увеличение одной переменной при увеличении второй), каждое слагаемое будет положительным числом. При сильной отрицательной взаимосвязи все слагаемые будут отрицательными числами, что в результате дает отрицательное значение корреляции. где sx = 69 Конспект лекций по ОТС (Егорова Е.В.) Знаменатель выражения для коэффициента корреляции просто нормирует числитель таким образом, что коэффициент корреляции оказывается легко интерпретируемым числом, не имеющим размерности, в диапазоне от –1 до 1. Когда коэффициент парной линейной корреляции равен –1 или +1, это указывает на то, что исследуемая зависимость носит обратный или прямой функциональный характер. Если коэффициент корреляции равен нулю, какая-либо связь между изучаемыми явлениями отсутствует. В практике используются различные пороги значений коэффициента корреляции. Обычно считается, что при r < 0,3 связь между переменными слабая, при r = 0,3 − 0,7 – теснота связи средняя, при r > 0,7 – сильная. Следует отметить, что величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми явлениями, а представляет собой оценку степени взаимной согласованности в их изменениях. Принципиально возможны случаи, когда отклонение от нуля полученной величины коэффициента корреляции оказывается целиком обусловлено неизбежными случайными колебаниями выборочных данных, на основании которых он вычислен. В этой связи возникает необходимость оценки существенности значения коэффициента корреляции. Для такой оценки применяется t-критерий Стьюдента. При этом фактическое значение этого критерия (tр) tр = r2 1− r2 ( n − 2) , (6.3) сравнивается с критическим значением tкр, которое берется из таблицы значений t с учетом заданного уровня значимости α и числа степеней свободы k = (n – 2). Если tр > tкр, то полученное значение коэффициента корреляции признается значимым и делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь. Удобным графическим средством анализа парных данных является диаграмма рассеяния, которая представляет каждое наблюдение в пространстве двух измерений, соответствующих двум факторам. Диаграмму рассеяния, на которой изображается совокупность значений двух признаков, называют еще корреляционным полем. Каждая точка этой диаграммы имеет координаты Xi и Yi. По мере того, как возрастает сила линейной связи, точки на графике будут лежать более близко к прямой линии, а величина r будет ближе к 1. 70 Конспект лекций по ОТС (Егорова Е.В.) Рис.6.1. Отрицательная корреляция (r<0) Рис.6.2. Отсутствие корреляции (r=0) Рис.6.3. Положительная корреляция (r>0) Рис.6.4. Положительная корреляции (r>>r3) 71 Конспект лекций по ОТС (Егорова Е.В.) Таблица 6.1 – Исходные и расчетные данные для оценки зависимости ВРП на душу населения от уровня безработицы в регионе Регион ЦФО Белгородская область Брянская область Владимирская область Воронежская область Ивановская область Калужская область Костромская область Курская область Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область Сумма Уровень безработицы, процентов 4,30 7,10 5,70 6,40 6,60 5,60 5,10 6,30 4,90 3,70 6,30 7,20 7,60 6,60 6,00 5,30 5,10 99,80 ВРП на душу населения 333502,00 141683,00 178492,00 191652,00 120350,00 232256,00 167845,00 207691,00 244561,00 313636,00 167150,00 182964,00 186619,00 167850,00 188507,00 176074,00 224356,00 3425188,00 − ̅ -1,57 1,23 -0,17 0,53 0,73 -0,27 -0,77 0,43 -0,97 -2,17 0,43 1,33 1,73 0,73 0,13 -0,57 -0,77 0,00 − 132020,35 -59798,65 -22989,65 -9829,65 -81131,65 30774,35 -33636,65 6209,35 43079,35 112154,35 -34331,65 -18517,65 -14862,65 -33631,65 -12974,65 -25407,65 22874,35 0,00 ( 72 Конспект лекций по ОТС (Егорова Е.В.) )×( − ̅ − ) -207349,61 -73517,16 3921,76 -5203,93 -59178,38 -8327,18 25920,00 2666,37 -41812,31 -243440,92 -14742,41 -24617,58 -25703,64 -24531,32 -1679,07 14497,30 -17626,71 -700724,78 ( ) − ̅ 2,47 1,51 0,03 0,28 0,53 0,07 0,59 0,18 0,94 4,71 0,18 1,77 2,99 0,53 0,02 0,33 0,59 17,74 ( − ) 17429373590,71 3575878190,07 528523871,89 96621961,30 6582344154,48 947060798,95 1131424025,36 38556063,95 1855830649,83 12578598883,65 1178661989,77 342903252,60 220898277,60 1131087683,89 168341466,30 645548529,07 523236022,48 48974889411,88 = ВРП на душу населения, руб. 350000,0 −700724,78 √48974889411,88 = −0,75 300000,0 250000,0 200000,0 150000,0 100000,0 3,0 4,0 5,0 6,0 7,0 8,0 Уровень безработицы, % Рис.6.5. Зависимость ВРП от уровня безработицы (r = –0 ,75) 0,57 × (17 − 2) = 4,42 0,43 tкр на 5-ти % уровне значимости при числе степеней свободы k = 15 – 2,13. Таким образом, между ВРП на душу населения и уровнем безработицы в регионе существует сильная обратная корреляционная зависимость. = Какая доля общей вариации результата формируется под влиянием данного фактора, показывает коэффициент детерминации r2. В нашем случае = 0,75 = 0,563 или 56,3%, т.е. изменение ВРП на душу населения зависит от уровня безработицы на 56,3%, а от изменения всех прочих причин на 43,7%. 73 Конспект лекций по ОТС (Егорова Е.В.) 2. Линейное моделирование взаимосвязей Для исследования зависимости результативной переменной от различных факторов и отображения их взаимосвязи в форме модели предназначен регрессионный анализ. Связь между переменной y и n-независимыми факторами Х характеризуется функцией регрессии y = f ( x1 , x2 ,..., xi ), которая показывает, каково будет в среднем значение переменной yi, если переменные xi примут конкретные значения. Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений. В парном регрессионном анализе исследуется зависимость переменной y от одной объясняющей переменной х. Линейное уравнение связи двух переменных можно представить в виде y = b0 + b1 x , где b0 – постоянная величина (или свободный член уравнения); b1 – коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной yi, при изменении значения xi на единицу. Если b1 > 0 – переменные xi и yi положительно коррелированные, если b1 < 0 – отрицательно коррелированны. Общей математической моделью многофакторной линейной зависимости является уравнение y = b0 + b1 x1 + b2 x2 + K + bi xi . Свободный член (b0) регрессионного уравнения характеризует усредненное влияние всех факторов, которые не включены в исследование, и частичное влияние учтенных признаков. Коэффициенты регрессии (b1, b2, ..., bi) отражают влияние соответствующих факторов на зависимый показатель. Модель линейной функции очень часто используют в прогнозировании, исходя из общенаучного принципа «от простого – к сложному». На практике эту модель также довольно часто предпочитают другим более сложным моделям, поскольку другой общенаучный принцип «простоты» гласит о том, что если сложная модель не значительно улучшает понимание процесса, то ей надо предпочесть более простую модель – нет смысла усложнять задачу, если она имеет простое решение. Для оценки параметров уравнений линейной зависимости обычно используют метод наименьших квадратов, суть которого состоит в нахождении таких параметров уравнения, при которых сумма квадратов отклонений расчетных значений уровней от фактических значений была бы минимальной. Таким образом, эти оценки находятся в результате минимизации выражения: 74 Конспект лекций по ОТС (Егорова Е.В.) где ( − ) → min yt – фактическое значение результативного признака; yˆ t – расчетное значение результативного признака; n – количество наблюдений. ВРП на душу населения, руб. 350000,0 300000,0 250000,0 200000,0 150000,0 100000,0 3,0 4,0 5,0 6,0 7,0 8,0 Уровень безработицы, % Рис.6.6. Графическая интерпретация МНК Параметры уравнения парной регрессии находятся из системы нормальных уравнений ( = × × )= + × × + × Разделив на n левую и правую части обоих уравнений, получим: = + × ̅ = × ̅+ × Отсюда = − × ̅ Подставив выражение b0 во второе уравнение, имеем − ̅× = ) −( ̅ 75 Конспект лекций по ОТС (Егорова Е.В.) Таблица 6.2 – Исходные данные и промежуточные расчеты для оценки параметров линейного уравнения регрессии Регион ЦФО Белгородская область Брянская область Владимирская область Воронежская область Ивановская область Калужская область Костромская область Курская область Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область Сумма Среднее xi 4,3 7,1 5,7 6,4 6,6 5,6 5,1 6,3 4,9 3,7 6,3 7,2 7,6 6,6 6,0 5,3 5,1 99,80 5,9 yi xi×yi 333502,0 1434058,60 141683,0 1005949,30 178492,0 1017404,40 191652,0 1226572,80 120350,0 794310,00 232256,0 1300633,60 167845,0 856009,50 207691,0 1308453,30 244561,0 1198348,90 313636,0 1160453,20 167150,0 1053045,00 182964,0 1317340,80 186619,0 1418304,40 167850,0 1107810,00 188507,0 1131042,00 176074,0 933192,20 224356,0 1144215,60 3425188,00 19407143,60 201481,6 1141596,7 xi2 18,49 50,41 32,49 40,96 43,56 31,36 26,01 39,69 24,01 13,69 39,69 51,84 57,76 43,56 36,00 28,09 26,01 603,62 35,5 xi – уровень безработицы, проценты yi – ВРП на душу населения, руб. 76 Конспект лекций по ОТС (Егорова Е.В.) 263535,88 152907,36 208221,62 180564,49 172662,45 212172,64 231927,73 184515,51 239829,77 287241,99 184515,51 148956,34 133152,27 172662,45 196368,56 224025,69 231927,73 3425188,00 201481,6 − 69966,12 -11224,36 -29729,62 11087,51 -52312,45 20083,36 -64082,73 23175,49 4731,23 26394,01 -17365,51 34007,66 53466,73 -4812,45 -7861,56 -47951,69 -7571,73 0,00 ̅ 34,73 5,57 14,76 5,50 25,96 9,97 31,81 11,50 2,35 13,10 8,62 16,88 26,54 2,39 3,90 23,80 3,76 241,13 14,18 = 1141596,7 − 5,9 × 201481,6 = −39 510 35,5 − (5,9) = 201481,6 − (−39510 × 5,9) = 433 430 = 433 430 − 39 510 Из уравнения регрессии следует, что при увеличении уровня безработицы на единицу ее измерения ВРП на душу населения в среднем уменьшится на 39 510 руб. Важным моментом является проверка значимости построенного уравнения регрессии. Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Значимость уравнения регрессии оценивается при помощи F-критерия Фишера (6.4) ÷ 1− − −1 Если расчетное значение F-критерия с ν1= k и ν2 = (n – k – 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой и она пригодна для практического использования. В нашем случае: 0,57 1 = ÷ = 19,9 р 0,43 17 − 1 − 1 Табличное значение F-критерия при α=0,05 и заданном числе степеней свободы составляет 4,5. Эта величина значительно меньше Fр, поэтому построенное уравнение зависимости ВРП от уровня безработицы с вероятностью 95% является надежным, статистически значимым и пригодным для решения аналитических задач. Количественную оценку качества модели также дает средняя ошибка аппроксимации: р ̅= 1 = − × 100% = 1 (6.5) Средняя ошибка аппроксимации не должна превышать 8–10%. Расчет средней ошибки аппроксимации (14,2%) выявил не высокое качество построенной модели, что не позволяет надеяться на точный и надежный прогноз по данному варианту модели. 77 Конспект лекций по ОТС (Егорова Е.В.) Для анализа общего качества уравнения регрессии используют коэффициент детерминации R2, называемый также квадратом коэффициента множественной корреляции. Коэффициент детерминации (мера определенности) всегда находится в пределах интервала [0;1]. Если значение R2 близко к единице, это означает, что построенная модель объясняет почти всю изменчивость соответствующих переменных. И наоборот, значение R2 близкое к нулю, означает плохое качество построенной модели. Коэффициент детерминации R2 показывает, на сколько процентов ( ) ∙ 100% найденная функция регрессии описывает связь между исходными значениями Y и Х. Соответственно, величина (1 − ) ∙ 100% показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком значении коэффициента детерминации ( ≥75%) можно делать прогноз ∗ = ( ∗ ) для конкретного значения ∗ в пределах диапазона исходных данных. При прогнозах значений, не входящих в диапазон исходных данных, справедливость полученной модели гарантировать нельзя. Это объясняется тем, что может проявиться влияние новых факторов, которые модель не учитывает. Процедура прогноза по регрессионной модели заключается в определении прогнозного значения фактора и расчете с его участием прогнозного значения результата = + Прогноз может быть выполнен для всего множества изучаемых объектов на основе прогнозных значений среднего уровня фактора, т.е. = ̅× , где k – темп его изменения. Также прогноз возможен для конкретного i-го объекта с использованием индивидуального значения фактора, т.е. = × . Пример 1. Пусть средний уровень безработицы в регионах ЦФО снизится на 7,5 процентных пункта, т.е. составит 5,9 × 0,925 = 5,4%. Тогда средний ВРП на душу населения составит 433 430 − 39 510 × 5,4 = 218 877,7 руб. Темп прироста ВРП равняется , , × 100% − 100% = 8,6%. Таким образом, снижение среднего уровня безработицы на 7,5 процентных пункта(0,5%) вызывает рост ВРП в расчете на душу населения на 8,6%. Пример 2. Пусть уровень безработицы в Ярославской области увеличится до 6,0%, тогда ВРП в данном регионе составит 433 430 − 39 510 × 6,0 = 196 368,6 руб. Темп прироста равняется , , × 100% − 100% = −12,5%, т.е. рост уровня безработицы на 0,9 процентных пункта (17,5%) вызывает снижение уровня ВРП на 12,5%. 78 Конспект лекций по ОТС (Егорова Е.В.) Для оценки точности выполненного прогноза рекомендуется рассчитывать его погрешности и определять верхнюю и нижнюю границы доверительного интервала, в которых возможна реализация данного прогноза. Эти вопросы Вы можете изучить самостоятельно. Помимо прогнозирования уравнения регрессии используются для решения широкого круга аналитических задач. Так путем сравнения расчетного ( ) и среднего ( ) значений результативного показателя для каждого объекта изучаемого множества можно оценить обеспеченность объекта данным фактором. Если = − < 0, то фактическая обеспеченность данным фактором x ниже среднего уровня. Если = − > 0, то фактическая обеспеченность единицы данным фактором выше среднего. При сравнении фактического( yi) и расчетного ( ) значений результата можно оценить интенсивность использования фактора. Если Б = − < 0, то данная единица использует имеющиеся ресурсы исследуемого фактора с меньшей результативностью, чем в среднем по изучаемому множеству. Если Б = − > 0, то применение имеющихся ресурсов данного фактора выше, чем в среднем по совокупности. Если уровень безработицы использовать в качестве индикатора трудовых ресурсов, то на основе данных таблицы можно сделать следующие выводы. В девяти регионах, в том числе и в Тверской области обеспеченность трудовыми ресурсами ниже, чем в среднем по ЦФО. В этих регионах для увеличения ВРП необходимо снизить уровень безработицы. В регионах второй группы нужно искать иные факторы роста ВРП. Так же в девяти регионах интенсивность использования трудовых ресурсов ниже среднего по совокупности. В данных территориях прирост ВРП в результате снижения уровня безработицы будет ниже, чем в территориях второй группы, где интенсивность использования трудовых ресурсов выше средней. 79 Конспект лекций по ОТС (Егорова Е.В.) Таблица 6.3 – Оценка обеспеченности регионов ЦФО трудовыми ресурсами и эффективности их использования Регион ЦФО Белгородская область Брянская область Владимирская область Воронежская область Ивановская область Калужская область Костромская область Курская область Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область Сумма Среднее xi 4,3 7,1 5,7 6,4 6,6 5,6 5,1 6,3 4,9 3,7 6,3 7,2 7,6 6,6 6,0 5,3 5,1 99,8 5,9 yi 333502,0 141683,0 178492,0 191652,0 120350,0 232256,0 167845,0 207691,0 244561,0 313636,0 167150,0 182964,0 186619,0 167850,0 188507,0 176074,0 224356,0 3425188,0 201481,6 Ai<0 263535,9 152907,4 208221,6 180564,5 172662,5 212172,6 231927,7 184515,5 239829,8 287242,0 184515,5 148956,3 133152,3 172662,5 196368,6 224025,7 231927,7 3425188,0 201481,6 Ai>0 62054,2 -48574,3 6740,0 -20917,2 -28819,2 Бi<0 -11224,4 -29729,6 11087,5 -52312,5 10691,0 30446,1 20083,4 -64082,7 -16966,1 23175,5 4731,2 26394,0 38348,1 85760,3 -16966,1 -52525,3 -68329,4 -28819,2 -5113,1 - 80 Конспект лекций по ОТС (Егорова Е.В.) Бi>0 69966,1 -17365,5 34007,7 53466,7 22544,0 30446,1 - -4812,5 -7861,6 -47951,7 -7571,7 - - Завершить данный анализ целесообразно построив комбинационную таблицу, где регионы будут сгруппированы сначала по уровню обеспеченности ресурсом, а затем по уровню интенсивности его использования. Таблица 6.4 – Результаты группировки регионов ЦФО по обеспеченности трудовыми ресурсами и интенсивности их использования Группа территорий по значениям А Подгруппы территорий по значениям Б Число территорий в группе Б<0 5 Б>0 4 Б<0 4 Б>0 4 Состав группы Брянская, Ивановская, Орловская, Тамбовская, Тверская Воронежская, Курская, Рязанская, Смоленская Владимирская, Костромская, Тульская, Ярославская Белгородская, Калужская, Липецкая, Московская А<0 А>0 Оценка обеспеченности ресурсами и их использования очень плохо хорошо неважно отлично В первую подгруппу первой группы попали территории, у которых не достаточное обеспечение трудовыми ресурсами и низкая интенсивность их использования. В первой подгруппе второй группы регионы, которые обеспечены трудовыми ресурсами выше, чем в среднем по ЦФО, но используются они не достаточно интенсивно. Во второй подгруппе первой группы регионы, низко обеспеченные трудовыми ресурсами, но с интенсивным их использованием. И, наконец, во второй подгруппе второй группы регионы с обеспеченностью и интенсивностью использования трудовых ресурсов выше среднего по совокупности. Таким образом, можно определить регионы, которым следует обеспечить приток трудовых ресурсов, а которым нужно обратить внимание на интенсивность их использования. 81 Конспект лекций по ОТС (Егорова Е.В.) 3. Нелинейное моделирование взаимосвязей На практике намного чаще, чем линейные, встречаются криволинейные (нелинейные зависимости). Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций. Различают два класса нелинейных уравнений регрессии: − нелинейные относительно включенных в модель объясняющих переменных, но линейные по оцениваемым параметрам; − нелинейные по оцениваемым параметрам. Первые – это уравнения, в которых зависимая переменная линейно связана с параметрами. При оценке параметров уравнений регрессии данного класса используется подход замены переменных. Суть его состоит в замене «нелинейных» объясняющих переменных новыми «линейными» переменными. К преобразованному уравнению регрессии для оценки его параметров можно применять метод наименьших квадратов (МНК). Примером нелинейных моделей регрессии по переменным могут служить: полиномы разных степеней y = b0 + b1 x + b2 x 2 + b3 x 3 + K + bk x k ; b равносторонняя гипербола y = b0 + 1 . x В уравнениях нелинейной регрессии по оцениваемым параметрам зависимая переменная связана с параметрами нелинейно. Примером таких нелинейных регрессий являются функции: степенная y = b0 ⋅ x b1 ; показательная y = b0 ⋅ b1 x ; экспоненциальная y = e b0 +b1x . Нелинейные модели по оцениваемым параметрам подразделяются на внутренне линейные и внутренне нелинейные. Если нелинейная модель внутренне линейна, то она с помощью соответствующих преобразований может быть приведена к линейному виду. Если нелинейная модель внутренне нелинейна, то она не может быть сведена к линейной функции. Наиболее часто используемые нелинейные функции и соответствующие им линеаризующие преобразования представлены в таблице. 82 Конспект лекций по ОТС (Егорова Е.В.) Таблица 6.5 – Преобразование уравнения модели к линейному виду № модели Вид модели 1 ŷ = b0 + b1 x + b2 x 2 3 yˆ = b0 + x 2 = u; yˆ = b0 + b1 x + b2u 1 = u; x yˆ = b0 + b1u ln yˆ = z; ln b0 = k1; ln b1 = k2 ; 2 b1 x z = k1 + k 2 x; yˆ = b0b1x 4 yˆ = b0 x b1 5 yˆ = b0 b1x x b2 6 Преобразование yˆ = b0 + b1x + b0 = e k1 ; b1 = e k2 ln yˆ = z; ln b0 = k ; ln x = u; z = k + b1u; b0 = e k ln yˆ = z; ln b0 = k1 ; ln b1 = k 2 ; ln x = u z = k + k 2 x + b2u; b0 = e k1 ; b1 = e k2 1 = u; x ŷ = b0 + b1 x + b2u ln x = u ; ŷ = b0 + b1 x + b2u 1 = u ; ln x = v ; x ŷ = b0 + b1 x + b2v b2 x 7 yˆ = b0 + b1 x + b2 ln x 9 yˆ = b0 + b1 + b2 ln x x 83 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Изучение взаимосвязей экономических явлений и процессов возможно при помощи построения эконометрических моделей. Переменные, участвующие в эконометрической модели, разделяются на результирующую и объясняющие переменные. Между результирующей и объясняющими переменными выделяют два основных типа связи: функциональную и статистическую. Частным случаем статистической зависимости является корреляционная зависимость. Для измерения силы связи между двумя переменными используется коэффициент корреляции Пирсона, он может принимать значении от –1 до +1. Какая доля общей вариации результата формируется под влиянием изучаемого фактора, показывает коэффициент детерминации. Для отображения взаимосвязи результирующей и объясняющей переменной в форме модели предназначен регрессионный анализ. Для оценки параметров уравнений линейной зависимости обычно используют метод наименьших квадратов. Перед использованием построенной модели нужно проверить ее значимость и качество. Для этого рассчитывают F-критерий Фишера и среднюю ошибку аппроксимации. Регрессионные модели используют для прогнозирования и для решения многочисленных аналитических задач. Довольно часто социально-экономические явления имеют нелинейную зависимость. 84 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 7. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ 1. Понятие временных рядов Статистика, в соответствии с одним из требований научной методологии, должна дать характеристику изменений статистических показателей во времени, или, как принято говорить, в динамике. Изучение динамики того или иного явления начинается с построения ряда динамики, или временного ряда. Временной ряд – это таблица, в которой представлены значения показателя за последовательные периоды или на моменты времени. Каждое значение показателя называется уровнем ряда. Временной ряд обычно обозначают Y(t), или yt, где t = 1, 2, …, n. Под длиной временного ряда понимают количество входящих в него уровней n. Временные ряды классифицируются: 1) по времени, отражаемому во временных рядах, – разделяются на моментные и интервальные. В моментных временных рядах уровни ряда выражают величины статистического показателя, зафиксированные на определенные даты. В интервальных рядах уровни ряда выражают размеры явления за определенный промежуток времени (сутки, неделю, месяц и т. д.); 2) по форме представления уровней временного ряда выделяют ряды абсолютных, относительных и средних величин; 3) по расстоянию между датами или интервалам времени выделяют полные и неполные временные ряды. В полных временных рядах даты или периоды следуют друг за другом с равным интервалом (равноотстоящие динамические ряды). В неполных временных рядах в последовательности времени равный интервал не соблюдается (неравноотстоящие динамические ряды). Однако с каким бы рядом динамики не приходилось иметь дело, основным требованием, предъявляемым к анализируемому ряду, является сопоставимость уровней образующих ряд. Статистические данные, представленные в виде временных рядов, должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, моменту регистрации, методике расчета и др. В практике исследования динамики и прогнозирования различных явлений принято считать, что значения уровней временных рядов, в общем случае, могут содержать следующие компоненты (составные части или структурообразующие элементы): ü тренд, плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов (число занятых в производстве, стоимость основных фондов и т. д.); ü сезонную компоненту, отражающую повторяемость процессов в течение не очень длительного периода (недели, месяца и т.д.); ü циклическую компоненту, отражающую повторяемость процессов в течение длительных периодов времени (свыше одного года); 85 Конспект лекций по ОТС (Егорова Е.В.) ü случайную компоненту, отражающую влияние не поддающихся учету и регистрации случайных факторов. В процессе формирования значений временных рядов не всегда участвуют все четыре компоненты. Однако во всех случаях предполагается наличие случайной составляющей. В ходе анализа временных рядов изучается соотношение между закономерностью и случайностью в формировании значений уровней ряда. Проводится оценка количественной меры их влияния. Закономерности, объясняющие динамику показателя в прошлом, используются для прогнозирования его значений в будущем, а учет случайности позволяет определить вероятность отклонения от закономерного развития и его возможную величину. Процесс моделирования на основе временных рядов сводится к выполнению следующих этапов: 1) предварительный анализ данных; 2) построение моделей: формирование набора аппроксимирующих функций (кривых роста) и численное оценивание параметров моделей; 3) проверка адекватности моделей и оценка их точности; 4) выбор лучшей модели; 5) расчет точечного и интервального прогнозов. 86 Конспект лекций по ОТС (Егорова Е.В.) 2. Предварительный анализ временных рядов Цель предварительного анализа временных рядов − определить соответствие имеющихся данных требованиям объективности, сопоставимости, полноты, однородности и устойчивости. Начинается этап предварительного анализа с построения графика динамики, и расчета основных динамических характеристик, которые позволяют определить характер, скорость, интенсивность и направление развития изучаемого явления за определенный временной период. К числу показателей динамики временного ряда относятся: абсолютный прирост, темп роста, темп прироста. Формулы расчета названных показателей приведены ниже. Абсолютный прирост базисный: ∆ б = Yt − Y0 , где Yt – текущее значение уровня временного ряда; Y0 – начальное значение уровня временного ряда. (7.1) Абсолютный прирост цепной: ∆ ц = Yt − Yt −1 . (7.2) Темп роста базисный: Yt * 100% . Y0 (7.3) Yt * 100% . Yt −1 (7.4) ∆б *100% или Тпрб = Трб − 100 . Y0 (7.5) Трб = Темп роста цепной: Трц = Темп прироста базисный: Тпрб = Темп прироста цепной: Тпрц = ∆ц * 100% или Тпрц = Трц − 100 . (7.6) Yt Неотъемлемой частью предварительного анализа временных рядов является графическое представление данных. Графический метод помогает осмыслить закономерности, лежащие в основе больших объемов данных, а также оказывает существенную помощь в обнаружении тенденции развития изучаемых явлений. Кроме того графическое представление может помочь обнаружить ошибку в данных. 87 Конспект лекций по ОТС (Егорова Е.В.) Традиционно временные ряды представляются двумя типами диаграмм: ü гистограммой – используется, если длина ряда не превышает семи наблюдений; ü графиком – используется при длине ряда более семи наблюдений. Для того чтобы нагляднее представить показатели, характеризующие тенденцию, следует выявить динамический ряд в форме «чистого» тренда при отсутствии резких колебаний. Избавиться от резких колебаний позволяет всесторонняя качественная предварительная обработка исходных временных рядов. Основная цель предварительной обработки временного ряда заключается в выявлении и устранении аномальных (нехарактерных) значений уровней ряда и его сглаживании. Аномальные значения временного ряда не отвечают потенциалу исследуемой экономической системы, и их использование для построения трендовой модели может сильно исказить получаемые результаты. Обычно аномальные значения можно обнаружить визуально. Нехарактерные уровни во временном ряду можно подразделить на три группы: ü значения, отражающие объективное развитие процесса, но сильно отличающиеся от общей тенденции, так как они проявляют свои экстремальные воздействия крайне редко; ü значения, возникающие вследствие изменений методики расчета; ü значения, возникающие вследствие ошибок при измерении показателя, при записи и передаче информации, а также значения, связанные с различными катастрофическими явлениями, не влияющими на дальнейший ход развития явления. Аномальные значения первой группы не всегда должны исключаться из временного ряда и могут даже оказаться полезными на этапе исследования причинно-следственного механизма развития явления. Нехарактерные значения второй группы не должны исключаться из рассмотрения, а приниматься за «поворотные» (пороговые) уровни, начиная с которых должны пересчитываться по новой методике все предыдущие значения временного ряда. Аномальные значения третьей группы должны исключаться из рассмотрения в любом случае, так как они искажают представление о характере развития явления и могут оказать существенное влияние на выводы, полученные в результате анализа ряда, содержащего такую искаженную информацию. Выбор того или иного метода выявления и анализа аномальных наблюдений определяется числом уровней временного ряда, характером исследуемых процессов и задачами стоящими перед исследователем. 88 Конспект лекций по ОТС (Егорова Е.В.) При решении одномерных задач анализа временных рядов широкое применение получил метод выявления аномальных наблюдений, основанный на определении q-статистики рассчитываемой по формуле: qt = где yt − y sy (7.7) yt – подозреваемый в анормальности уровень ряда; 1 n y – среднее значение уровней ряда, y = ∑ yt , n t =1 n – число уровней временного ряда. sy – среднеквадратическое отклонение исходных значений уровней N ряда от их среднего уровня, s y = ∑ ( yt − y )2 t =1 . n −1 Если для расчетного значения выполняется неравенство qt ≥ q кр с заранее заданным уровнем значимости α и известным числом приемлемых результатов k, то данное наблюдение считается аномальным и подлежит замене скорректированным значением. Скорректированное значение, на которое заменяется аномальное значение, рассчитывается по формуле: yt* = qкр s y + y . Способ, основанный на расчете q-статистики, применим для относительно стационарных рядов, так как при использовании для анализа динамических рядов, имеющих ярко выраженную тенденцию, он приводит к ошибкам. Рис.7.1. Пример стационарного временного ряда 89 Конспект лекций по ОТС (Егорова Е.В.) Для выявления аномальных значений динамического ряда широко используется критерий Ирвина, который основан на сравнении соседних значений ряда. Суть метода состоит в следующем: для всех, или только для подозреваемых в анормальности наблюдений, вычисляется критерий Ирвина λ t: λt = yt − yt −1 . sy (7.8) Если расчетное значение λi превысит уровень критического значения λкр (с заданным уровнем значимости α и числом уровней n) то значение yt признается аномальным. Выявленные таким образом аномальные значения заменяются среднеарифметическими значениями двух соседних уровней, либо соответствующими значениями по кривой, аппроксимирующей данный временной ряд. После замены исходных аномальных уровней на скорректированные уровни, следующим шагом выделения тренда является сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене исходных уровней временного ряда расчетными уровнями, которые в меньшей степени подвержены колебаниям, что способствует более четкому проявлению тенденции развития. В теории обработки временных рядов существует множество способов их сглаживания. Мы рассмотрим два простейших, но принципиально разных вида сглаживания, которые, в какой-то мере, обобщают особенности этой процедуры: ü метод скользящего среднего; ü медианное сглаживание. Широко распространенным статистическим методом сглаживания основной тенденции является метод скользящих средних, когда каждый член динамического ряда заменяется простым или взвешенным средним (nt) соседних членов, где nt – длинна периода осреднения. В результате выполнения данной процедуры получают сглаженную линию динамики временного ряда. В практике экономического анализа применяют три вида скользящих средних – простые, взвешенные и экспоненциальные. Рассчитанные скользящие средние относятся к центральному моменту времени периода осреднения. Алгоритм сглаживания методом простой скользящей средней заключается в следующем. 1. Определяют длину интервала сглаживания (nt), включающего в себя nt последовательных уровней ряда (nt < n). Чем сильнее колебания, тем шире должен быть интервал сглаживания, так как чем шире интервал сглаживания, 90 Конспект лекций по ОТС (Егорова Е.В.) тем в большей степени сглаживаются колебания, и тенденция развития становится плавной. 2. Разбивают весь период наблюдения на участки сглаживания, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1. 3. Рассчитывают средние арифметические уровней ряда, образующих каждый участок сглаживания. 4. Заменяют исходные значения ряда, стоящие в центре каждого участка сглаживания, на соответствующие средние значения. Длину интервала сглаживания (nt) удобно брать в виде нечетного числа: nt = 2p + 1, т.к. в этом случае полученные значения скользящей средней приходятся на средний член интервала. В этом случае, значения скользящих средних рассчитывается по формуле: t+ p ∑ yi yˆ t = где i =t − p (7.9) 2p +1 yˆ t – значение скользящей средней в момент t; yi – исходное значение i-го уровня; 2p + 1 – длина интервала сглаживания. При использовании скользящей средней с длиной участка сглаживания (h) равной (2p + 1) первые и последние значения p уровней ряда теряются. Их сгладить методом скользящей средней нельзя. Потеря значений последних точек является существенным недостатком, так как именно последние данные обладают наибольшей информативной ценностью. Один из приемов, позволяющих восстановить потерянные значения временного ряда при использовании простой скользящей средней заключается в следующем: − вычисляют средний абсолютный прирост на последнем участке сглаживания по формуле: ∆y = где yt + p − yt − p (7.10) nt − 1 nt – длина участка сглаживания; yt+p – значение последнего уровня на участке сглаживания; yt-p – значение первого уровня на участке сглаживания; ∆ y – средний абсолютный прирост на последнем участке сглаживания; − получают p сглаженных значений в конце временного ряда путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению. Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда. Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает прямую. 91 Конспект лекций по ОТС (Егорова Е.В.) При сглаживании временного ряда, наряду со средним значением, можно использовать медиану значений, попавших в интервал сглаживания. Основное преимущество медианного сглаживания, в сравнении со сглаживанием скользящим средним, состоит в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри интервала сглаживания). Таким образом, если в данных имеются выбросы (связанные, например, с ошибками измерений), то сглаживание медианой обычно приводит к более гладким или, по крайней мере, более «надежным» кривым по сравнению со скользящим средним с тем же самым интервалом сглаживания. Процедура медианного сглаживания довольно проста. Пусть экономические показатели заданы временным рядом: y1 , y2 , ..., yt , ..., yn . Каждый новый уровень сглаженного ряда вычисляется по формуле: yˆt = 1 + ( yt − Me) , i = 1, n ymax − ymin + 1 , где (7.11) Me – медиана временного ряда на участке сглаживания; ymax, ymin – максимальное и минимальное значения уровней временного ряда на участке сглаживания. Основной недостаток медианного сглаживания заключается в том, что при отсутствии явных выбросов, он приводит к более «зубчатым» кривым (чем сглаживание скользящим средним) и не позволяет использовать веса. 92 Конспект лекций по ОТС (Егорова Е.В.) 3. Способы выявления наличия тенденции В настоящее время известно достаточно большое количество классических критериев выявления тенденции. Наиболее эффективными, и дающими хорошие результаты, являются: критерий Хальда-Аббе; Tкритерий Стьюдента кумулятивных сумм; критерий Спирмена; метод сравнения средних уровней временного ряда; критерий серий; метод Фостера-Стюарта. Все они различаются как по мощности, так и по сложности математического аппарата, что предоставляет исследователю возможность самостоятельного выбора критерия при практической реализации проверки наличия тенденции. Рассмотрим некоторые из наиболее часто применяемых критериев выявления тенденции. 1. Одним из критериев, позволяющим определить наличие тенденции, является кумулятивный Т-критерий Стьюдента. При выявлении наличия тенденции методом T-критерия кумулятивных сумм выдвигается нулевая гипотеза H0 об отсутствии тенденции в исследуемом временном ряду. Конкурирующей гипотезой H1 является гипотеза о наличии тренда. Расчетные значения кумулятивного Tр-критерия или tр-критерия (если анализируется достаточно длинный временной ряд) сравниваются с критическими при заданном уровне значимости α. Если расчетное значение Tр или tр превышает критическое значение критерия Tкр или tкр, то гипотеза об отсутствии тенденции отвергается. В противном случае, если Tр< Tкр или tр< tкр признается отсутствие тенденции в исследуемом ряду динамики. Расчетное значение T-критерия определяется по формуле: n Tр = где ∑ Z t2 i =1 s 2y , (7.12) Zt – накопленный итог отклонений эмпирических значений уровней исходного ряда динамики от среднего его уровня; s 2y – общая сумма квадратов отклонений, определяемая по формуле n s 2y = ∑ yt2 − y 2n (7.13) i =1 Если анализируется достаточно длинный временной ряд, то для расчета значений критерия (tр) можно использовать нормированное отклонение:  n +1 Tр −   6   tр = 2n − 1 (n − 2) 90 93 Конспект лекций по ОТС (Егорова Е.В.) (7.14) 2. Широкое применение в исследовательской практике, при обнаружении тенденции, находит метод сравнения средних уровней временного ряда. Метод сравнения средних уровней временного ряда, при обнаружении тенденции, предполагает, что исходный динамический ряд уровней делится на две примерно равные части с числом уровней n1 и n2. Каждая часть рассматривается как самостоятельная, независимая совокупность, имеющая нормальное распределение. Если временной ряд имеет тенденцию, то средние значения уровней, вычисленные для каждой совокупности в отдельности, должны существенно, значимо различаться между собой. Если же расхождение незначимо, несущественно и носит случайный характер, то временной ряд не имеет тенденции средней. Таким образом, проверка нулевой гипотеза H0: y1 = y2 о наличии тенденции в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей. При этом исходят из условий, что дисперсии уровней динамических рядов неизвестны и предполагается, что эти дисперсии не равны между собой. Конкурирующая гипотеза H1 следующая: y1 ≠ y2 , т.е. средние значения уровней первой и второй частей временного ряда не равны. По предварительно определенным средним значениям y1 и y2 , а так же вычисленным дисперсиям s12 и s 22 , определяются расчетные значения t-критерия Стьюдента по формуле N kр =1− где y1 = n1 6 ∑ dt2 i =1 3 n −n , (7.15) n2 1 1 ∑ yi ; y2 = ∑ yi ; n1 i =1 n2 i =1 1 n1 1 n1 2 2 = ∑ ( yi1 − y1 ) ; s2 = ∑ ( yi 2 − y 2 ) 2 . n1 − 1 i =1 n2 − 1 i =1 На следующем этапе по формуле находится число степеней свободы: s12 2  s12 s22   +  n n k =  12 2  2 . (7.16)  s12   s22       n1  +  n2  n1 − 1 n2 − 1 Если, при определении числа степеней свободы k, получается дробное число, то оно округляется до ближайшего целого 94 Конспект лекций по ОТС (Егорова Е.В.) При заданном уровне значимости α и рассчитанном числе степеней свободы k, если tр > tкр то гипотеза о равенстве средних уровней двух нормально распределенных совокупностей отвергается. Расхождение между вычисленными средними значениями уровней значимо, существенно и носит неслучайный характер. Во временном ряду существует тенденция средней и существует тренд. Если временной ряд имеет тенденцию, то дисперсии, вычисленные для каждой совокупности в отдельности, должны существенно и значимо различаться между собой. Если же расхождения между ними не значимо, то временной ряд не имеет тенденции дисперсии. Таким образом, проверяется нулевая гипотеза H0 об отсутствии тенденции в дисперсиях в исходном временном ряду, которая сводится к проверке гипотезы о равенстве дисперсий двух нормально распределенных совокупностей, то есть: H0: s12 = s22. Конкурирующая гипотеза H1: s12 ≠ s22. Гипотеза об однородности дисперсий двух частей ряда проверяется на основе сравнения расчетного и критического значения F-критерия Фишера полученного при заданном уровне значимости α и числе степеней свободы k1 и k2 . s12 / s22 , если s12 > s22 ; Fр =≤  2 2 2 2 s2 / s1 , если s2 > s1 . Если s22 > s12 , то k1 = n2 − 1; k 2 = n1 − 1. Если s12 > s22 , то k1 = n1 − 1; k 2 = n2 − 1. Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей отвергается, если Fр > Fкр. Следовательно, расхождение между вычисленными дисперсиями значимо, существенно, носит неслучайный характер и в ряду динамики существует тенденция в дисперсиях и существует тренд. Следует отметить, что данный метод дает вполне приемлемые результаты лишь в случае рядов с монотонной тенденцией. Если же ряд динамики меняет общее направление развития, то точка поворота тенденции может оказаться близкой к середине ряда, в силу чего средние двух отрезков ряда будут близки и проверка может не показать наличия тенденции. 3. Критерий серий, применяемый при обнаружении тенденции, имеет две модификации ü критерий серий, основанный на медиане временного ряда; ü критерий «нисходящих» и «восходящих» серий. Порядок расчета критерия серий, основанного на медиане временного ряда следующий. Из исходного ряда yt длиной n образуют ранжированный (вариационный) ряд yt' : y1' , y2' , …, yn' , где y1' – наименьшее значение ряда yt. 95 Конспект лекций по ОТС (Егорова Е.В.) Затем определяют медиану этого вариационного ряда – Ме. Для нечетного числа уровней динамического ряда (n = 2p + 1) Me = y 'p + 1 , а для четного Me = ( y 'p + y 'p +1 ) / 2 . Далее образуют последовательность δi из плюсов и минусов по следующему правилу: +, если yt > Me, t = 1, 2, ..., n δ t =  −, если yt > Me, t = 1, 2, ..., n Если значение yt равно медиане, то это значение пропускают. Подсчитывают ν(n) – число серий в совокупности δi, где под серией понимается последовательность подряд идущих плюсов или минусов. Определяют τ max (n) – протяженность самой длинной серии. (Один плюс или один минус тоже считается серией). Проверка гипотезы основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий – слишком маленьким. Поэтому для того, чтобы не была отвергнута H0 гипотеза о случайности исходного ряда (об отсутствии систематической составляющей) должны выполняться следующие неравенства (при 5% уровне значимости): τ max ( n) < [3,3(lg n + 1) ]  (7.17)  1 . ν ( n ) > n + 1 − 1,96 n − 1   2   Если хотя бы одно из неравенств нарушается, то гипотеза об отсутствии тенденции отвергается. Квадратные скобки в правой части неравенства означают, что берется целая часть числа. ( ) 4. При использовании метода Фостера-Стюарта для обнаружения тенденции проверяется нулевая гипотеза H0 об ее отсутствии. Для этого каждый уровень динамического ряда сравнивается со всеми предшественниками, и определяются значения вспомогательных характеристик mt и lt: 1, если yt > yt −1 , yt − 2, y1 mt =  0, в противном случае (7.18) 1, если yt < yt −1 , yt − 2, y1 lt =  0, в противном случае Таким образом, mt = 1, если yt больше всех предшествующих уровней, а lt = 1, если yt меньше всех предшествующих уровней. Вычисляется dt = mt – lt для всех t = 2, n . 96 Конспект лекций по ОТС (Егорова Е.В.) Очевидно, что величина dt может принимать значения 0; 1; –1. n Находится характеристика D = ∑ dt . t =2 С помощью t-критерия Стьюдента проверяется нулевая гипотеза H0 о равенстве характеристики D нулю. Для этого расчетное значение t-критерия Стьюдента сравнивается с критическим значением для заданного уровня значимости α и числа степеней свободы k = n – 1. Если t р > t кр , то гипотеза об отсутствии тенденции отвергается. Расчетное значение t-критерия определяется по формуле: D (7.19) sD sD – средняя квадратическая ошибка величины D рассчитанная по формуле: tр = где n 1 s D = 2 ∑ ≈ 2 ln n − 0,8456 t = 2t 97 Конспект лекций по ОТС (Егорова Е.В.) (7.20) 4. Выявление типа тенденции Прежде чем применить методы математического анализа для вычисления параметров уравнения тренда, необходимо дать ответ на вопрос, с какой целью мы строим модель изучаемого процесса? Аналитическая модель тенденции может строиться для ретроспективного анализа, смысл которого заключается в том, чтобы дать исчерпывающую характеристику изучаемого процесса в динамике за прошедший период времени и выявить, не произошло ли качественных, существенных изменений условий развития процесса внутри исследуемого периода. В этом случае для построения модели тенденции используются все уровни временного ряда изучаемого период. Аналитическая модель тенденции может так же строиться для экстраполяции полученных данных на последующий период, т.е. для построения прогнозных экономико-математических моделей развития, способных отразить последствия воздействия социально-экономических факторов на развитие модели прогнозирования. В этом случае нас будет, прежде всего, интересовать вопрос, носит ли тенденция устойчивый характер? Если единой тенденции показателей за весь рассматриваемый период не наблюдается, то требуется дробление временного ряда на отдельные периоды и прогнозная модель строится начиная с того уровня, когда тенденция становится устойчивый. После выявления и устранения аномальных (нехарактерных) значений уровней временного ряда и его сглаживания, в ходе предварительной обработки данных, на графическом изображении ряда тенденция (если она существует) просматривается более четко. Это позволяет при выборе формы кривой тренда воспользоваться методом визуального анализа, подбирая такую кривую тренда, форма которой соответствует фактическому развитию тенденции. Рассмотрим некоторые, наиболее часто применяемые на практике, типы уравнений тренда. 1. При построении моделей исследуемого процесса часто прибегают к полиномам разной степени, которые в общем виде можно записать yˆ t = a0 + a1t + a2t 2 + a3t 3 + ... + ant n Коэффициенты полиномов невысоких степеней могут иметь конкретную интерпретацию в зависимости от содержания динамического ряда. Например, их можно трактовать как скорость роста (a1), ускорение роста(a2), изменение ускорения (a3), начальный уровень ряда при t = 0 (a0). Обычно в экономических исследованиях применяются полиномы не выше третьего порядка. Использовать для определения тренда полиномы высоких степеней нецелесообразно, поскольку полученные таким образом аппроксимирующие функции будут отражать случайные отклонения (что противоречит смыслу тенденции). 98 Конспект лекций по ОТС (Егорова Е.В.) 1.1. Из всего множества различных видов трендов к числу наиболее простых относятся однофакторные линейные зависимости (полиномы первой степени). Линейный тренд вида (7.21) Yˆt = a0 + a1 t хорошо отражает тенденцию изменений процесса, при действии множества факторов изменяющихся по разным закономерностям. Равнодействующая этих факторов часто приводит к примерно постоянной абсолютной скорости изменения процесса, т.е. первые разности (абсолютные приросты) такого процесса постоянны. График этой функции приведён на рисунке 7.2. Рис. 7.2. Линейная модель и геометрическая интерпретация значений её коэффициентов Свободный член этой функции означает отрезок, который отсекает прямая линия на оси OYt, а коэффициент пропорциональности a1 характеризует тангенс угла наклона этой прямой к оси OXt. Модель линейной функции очень часто используют в прогнозировании, исходя из общенаучного принципа «от простого – к сложному». На практике эту модель также довольно часто предпочитают другим более сложным моделям, поскольку другой общенаучный принцип «простоты» гласит о том, что если сложная модель не значительно улучшает понимание процесса, то ей надо предпочесть более простую модель – нет смысла усложнять задачу, если она имеет простое решение. 99 Конспект лекций по ОТС (Егорова Е.В.) 1.2. Значительно реже, чем линейную модель, используют модель квадратичной функции, которая применительно к трендам может быть записана так: (7.22) Yˆt = a0 + a1t + a2t 2 . Полином второго порядка применим в тех случаях, когда процесс развивается равноускоренно (т.е. имеется равноускоренный рост или равноускоренное снижение уровней). Графиком этой функции является парабола с осью симметрии, параллельной оси ординат. Характер функции определяется её коэффициентами. Рис. 7.3. Квадратичный тренд, a2 > 0 Если коэффициент a2 > 0, то ветви параболы направлены вверх (рис. 1.2); если этот коэффициент меньше нуля, a2 < 0, то ветви параболы направлены вниз. Ось ординат пересекается в точке Y0 = x0. Поэтому значение свободного члена модели этого тренlа также характеризует начальный уровень тренда. Эта модель используется в тех случаях, когда временной ряд имеет нелинейную тенденцию, но, используя эту модель, необходимо помнить о том, что при довольно большом периоде прогнозирования сам показатель Yt, который вычисляется по формуле (27), значительно меняет свои значения. 100 Конспект лекций по ОТС (Егорова Е.В.) 1.3. Крайне редко используются тренды, представляющие собой модель многочлена третьей степени. Они применяется для моделирования данных с постоянной скоростью изменения относительного прироста или с постоянной скоростью изменения ускорения. Yˆt = a0 + a1t + a2t 2 + a3t 3 . Графиком такой функции является кубическая парабола. Одной из её характеристик выступает расчётная величина: (7.23) ∆ = 3a3 a1 − a22 . (7.24) Если, например, ∆ > 0 , то кубическая парабола имеет возрастающий характер при a3 > 0 и убывает при a3 < 0. А если ∆ < 0 и a3 > 0 , то она имеет вид, представленный на рисунке 7.4. При этом ветви такой параболы, устремляются резко вниз в левой части графика и резко вверх в правой части графика. Поэтому кубическая парабола может хорошо описать внутреннюю часть некоторой изменяющейся временной динамики, а для прогноза будет моделировать либо резкий рост, либо резкое падение в зависимости от коэффициентов тренда. Это и определило то, что такие модели очень редко встречаются в прогнозировании вообще, а в прогнозировании экономической динамики тем более. Рис.7.4. Кубическая парабола, a3 > 0 Многочлены выше третьей степени в практике прогнозирования не используются. 101 Конспект лекций по ОТС (Егорова Е.В.) 2. Значительно чаще используется в практике прогнозирования степенная функция как модель тренда. Она имеет вид: a (7.25) Yˆt = a0t 1 . Графиком этой функции является парабола порядка a1, которая проходит через точки O(0, 0) и A(1, a0), и касается оси Ox в начале координат. В подавляющем большинстве случаев тренды экономических показателей располагаются в первом квадранте. Поэтому на практике можно встретиться с двумя случаями трендов в виде параболы (рис. 7.5). Первый случай (рис.7.5а) соответствует ситуации, когда показатель степени больше единицы. Тогда это возрастающая функция, причем, чем больше показатель степени, тем более резко возрастает функция. В реальных экономических процессах такой резкий рост показателей встречается довольно редко. Чаще всего приходится иметь дело с более пологим характером степенной функции, и вполне может быть так, что применение МНК приведёт к тому, что показатель степени будет лежать в пределах 0 < a1 < 1. Тогда функция будет возрастать не так быстро и её характер можно определить как пологий (рис.7.5б). Подобные ситуации встречаются довольно часто. а) случай 1, когда a1 > 0 б) случай 1, когда a1 < 0 Рис. 7.5. Тренд в виде степенной функции 102 Конспект лекций по ОТС (Егорова Е.В.) 3. В научных исследованиях широкое применение имеет возрастающая логистическая S–образная функция, которую иногда называют моделью Верхулста, а иногда – моделью Перла-Рида. Наиболее часто она выражается в виде k . (7.26) 1 + a1 e − a2 t Логистическая функция возрастает сначала ускоренным темпом, затем темп роста замедляется и, наконец, рост почти полностью прекращается, о чем свидетельствует тот факт, что кривая асимптотически приближается к некоторой прямой, параллельной оси абсцисс. Используется логистическая кривая для описания развития новых товаров, роста численности населения и т.д. Типичная логистическая кривая изображена на графике рисунке 7.6. Yˆt = Рис.7.6 График логистической функции 103 Конспект лекций по ОТС (Егорова Е.В.) 5. Оценка адекватности трендовых моделей Возможность использования трендовой модели для анализа и прогнозирования может быть определена только после установления ее адекватности, т.е. соответствия модели исследуемому процессу. Проверка адекватности модели осуществляется исходя из свойств остатков. Остатки (случайные ошибки) неизбежны. Причины их появления многообразны. Они вызваны действием множества случайных неконтролируемых факторов и поэтому не поддаются анализу. В результате этого практически любое измерение содержит случайные ошибки. Трендовая модель считается адекватной, если правильно отражает систематические компоненты временного ряда. Это требование эквивалентно следующим требованиям, предъявляемым к остаточной компоненте: ü случайность; ü соответствие нормальному закону распределения; ü равенство нулю математического ожидания; ü независимость значений (отсутствие автокорреляции). Модель считается адекватной, если выполняются все четыре требования. 1. Для проверки случайности остаточной компоненты используются критерий серий и критерий пиков. Критерий серий основывается на медиане ряда. Этапы реализации метода следующие: ü рассчитываются отклонения (остатки) фактических значений уровней динамического ряда от теоретических значений, полученных по уравнению тренда; ü полученные остатки ранжируются в порядке возрастания или убывания; ü определяется медиана отклонений; ü значения отклонений сравниваются со значением медианы, и ставится знак «+» или «–», в зависимости от того в какую сторону значение отклонения отличается от значения медианы. Таким образом, получается ряд «+» и «–». Последовательность «+» и «–» называется серией. По полученному ряду определяются: τmax(n) – длинна наибольшей серии и ν(n) – число серий. Для того чтобы последовательность «+» и «–» являлась случайной, протяженность самой длинной серии не должна быть слишком длинной, а число серий – слишком малым. Отклонения от тренда признаются случайными, если одновременно выполняются два неравенства (при α = 0,05): τ max (n) < [3,3(lg n + 1)]; .  > + − − ν ( n ) [0,5 ( n 1 1,96 n 1)]  Если хотя бы одно неравенство нарушается, то гипотеза о случайности отклонений остатков от тренда отвергается. 104 Конспект лекций по ОТС (Егорова Е.В.) Критерий пиков (поворотных точек) основан на определении числа пиковых точек p. Точка считается пиковой, если она больше или меньше своих соседей, т.е. выполняется одно из условий: ε t −1 < ε t > ε t +1 или ε t −1 > ε t < ε t +1 . (7.27) Общее число пиковых точек p для случайной последовательности характеризуется математическим ожиданием числа пиковых точек и дисперсией: 2 16n − 29 p = (n − 2), s 2р = . (7.28) 3 90 Пиковых точек не должно быть слишком мало. Если выполняется следующее неравенство p > [ p − 1,96 s 2p ] , (7.29) то трендовая модель считается адекватной, если не выполняется, то – неадекватной. Квадратные скобки в формуле означают целую часть числа. 2. Исключительно важную роль при обработке остатков играет проверка нормальности их распределения. На практике для проверки нормальности обычно применяют визуальные методы, например, гистограммы, нормальные вероятностные графики или численные методы. Наиболее простой метод проверки гипотезы о нормальности распределения остаточной компоненты основан на RS – критерии. RS-критерий численно равен отношению размаха вариации случайной величины остатков к стандартному отклонению sε (ε max − ε min ) , sε = max(ε t ) – максимальный уровень ряда остатков; RS = где ε max (7.30) i ε min = min (ε t ) – минимальный уровень ряда остатков; i n sε = ∑ ε t2 t n −1 – стандартное отклонение. Имеются теоретические таблицы критических значений величины RS, рассчитанные для различных доверительных вероятностей в зависимости от числа уровней n. Если расчетное значение RS попадает между табулированными значениями a и b, т.е. a < RS < b при выбранном уровне значимости, то принимается гипотеза о соответствии ряда остатков нормальному закону распределения, в противном случае эта гипотеза отвергается. 105 Конспект лекций по ОТС (Егорова Е.В.) Проверку гипотезы о нормальности распределения остаточной компоненты можно выполнить, используя метод показателей асимметрии (A) и эксцесса (Э). При нормальном распределении показатели асимметрии и эксцесса равны нулю. Так как предполагается, что отклонения от тренда представляют собой выборку из некоторой генеральной совокупности, то можно определить выборочные характеристики асимметрии (A) и эксцесса (Э). Несмещенные оценки АН и ЭН для А и Э соответственно рассчитываются как AH = n (n − 1) A; n−2 n −1 ((n + 1)Э + 6) , (n − 2)(n − 3) а их среднеквадратические отклонения SА и SЭ по формулам: ЭН = SA = 6n(n − 1) ; (n − 2)(n + 1)(n + 3) (7.31) (7.32) (7.33) 24n(n − 1) 2 (7.34) SЭ = . (n − 3)(n − 2)(n + 3)(n + 5) В рассматриваемом критерии гипотеза нормальности исследуемого распределения может быть принята, если совместно выполняются условия АН ≤ 3S А и Э Н ≤ 5 S Э . В противном случае гипотеза должна быть отвергнута. 3. Проверка гипотезы о равенстве математического ожидания остатков нулю, при предположении, что они распределены по нормальному закону, выполняется по t-критерию Стьюдента. Расчетное значение t-критерия Стьюдента определяется по формуле: εt n, (7.35) sε где ε t – математическое ожидание остаточной компоненты (при нормальном распределении равняется среднему значению остатков); sε – стандартное отклонение остатков. tр = Критическое значение tкр – критерия Стьюдента при числе степеней свободы k = n – 1 и принятом уровне значимости α = 0,05 определяется по таблице и сравнивается с tр. Если вычисленное значение статистики окажется меньше критического ее значения (tр < tкр), то гипотеза о равенстве математического ожидания ряда остатков нулю принимается и модель на уровне значимости 5% считается адекватной. 106 Конспект лекций по ОТС (Егорова Е.В.) Хотя применение t-критерия требует нормальности исходной случайной величины, он может применяться и при умеренных отклонениях от нормальности и не слишком малых n (n ≥ 15). 4. Классические методы математической статистики лишь тогда применимы, когда отдельные члены статистического ряда независимы. В силу ряда причин в регрессионных моделях может иметь место корреляционная зависимость между соседними случайными отклонениями называемая автокорреляцией. Если в остатках присутствует автокорреляция, то выводы по t и F–статистикам, определяющим значимость коэффициентов регрессии и коэффициента детерминации, возможно, будут неверными. Вследствие этого ухудшаются прогнозные качества модели. Поэтому достаточно важным является умение определить наличие автокорреляции и устранить это нежелательное явление. Существует несколько методов обнаружения автокорреляции. Наиболее распространенным является подход, опирающийся на критерий Дарбина-Уотсона. Тест Дарбина-Уотсона связан с проверкой гипотезы об отсутствии автокорреляции только первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. При этом критическая статистика определяется по формуле: n d= ∑ (ε t − ε t −1 )2 t =2 n ∑ t =1 . (7.36) ε t2 Величина d приближенно равна: d ≈ 2(1 − r1 ) , (7.37) где r1 – коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя последовательностями остатков ε1, ε2, ... , εn-1 и ε2, ε3, ... , εn). Близость значения статистики d к нулю означает наличие высокой положительной автокорреляции (коэффициент r1 близок к единице); близость значения статистики d к четырем означает наличие высокой отрицательной автокорреляции (коэффициент r1 близок к минус единице). Естественно, в случае отсутствия автокорреляции значение статистики d будет близким к двум (коэффициент r1 не сильно отличается от нуля). Применение на практике критерия Дарбина-Уотсона основано на сравнении расчетного значения статистики d с пороговыми, граничными значениями dL и dU. Граничные значения dL и dU, зависящие от числа наблюдений n, количества объясняющих переменных в модели и уровня значимости α, находятся по таблицам. Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. 107 Конспект лекций по ОТС (Егорова Е.В.) Выдвигается гипотеза H0 об отсутствии автокорреляции остатков. Пусть альтернативная гипотеза состоит в наличии в остатках положительной автокорреляции первого порядка. Тогда при сравнении расчетного значения статистики d ( d < 2) с dL и dU возможны следующие варианты. 1. Если d < dL , то гипотеза H0 об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α) в пользу гипотезы о положительной автокорреляции. 2. Если d > dU , то гипотеза H0 не отвергается. 3. Если dL ≤ d ≤ dU, то нельзя сделать определенный вывод по имеющимся исходным данным (значение d попало в область неопределенности). Если альтернативной является гипотеза о наличии в остатках отрицательной автокорреляции первого порядка, то с пороговыми, граничными значениями dL и dU сравнивается величина 4 − d (при d >2). При этом возможны следующие варианты. 1. Если 4 − d < dL , то гипотеза H0 об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α) в пользу гипотезы об отрицательной автокорреляции. 2. Если 4 − d > dU, то гипотеза H0 не отвергается. 3. Если dL ≤ 4 − d ≤ dU, то нельзя сделать определенный вывод по имеющимся исходным данным. При обнаружении автокорреляции нужно попытаться устранить ее. Так как автокорреляция чаще всего вызывается неправильной спецификацией модели, то для ее устранения необходимо, прежде всего, попытаться скорректировать саму модель. Возможно, автокорреляция вызвана отсутствием в модели некоторой важной объясняющей переменной. Необходимо попытаться определить данный фактор и учесть его в уравнении регрессии. Также можно попробовать изменить формулу зависимости, например, линейную на лог-линейную, линейную на гиперболическую и т.д. Если все разумные процедуры изменения спецификации модели, на ваш взгляд исчерпаны, а автокорреляция имеет место, то можно предположить, что она обусловлена какими-то внутренними свойствами ряда остатков. В этом случае можно воспользоваться авторегрессионным преобразованием. Алгоритм данного метода можно найти в специальной литературе, мы же на нем останавливаться не будем. 108 Конспект лекций по ОТС (Егорова Е.В.) 6. Прогнозирование на основе трендовой модели. Критерии точности и надежности прогнозов Одна из основных целей создания трендовых моделей экономической динамики – сделать прогноз на их основе о развитии изучаемого процесса на предстоящий промежуток времени. Прогнозирование на основе временного ряда экономических показателей относится к одномерным методам, базирующимся на экстраполяции, т.е. на продлении на будущее тенденции, наблюдавшейся в прошлом. При таком подходе предполагается, что прогнозируемый показатель формируется под воздействием большого количества факторов, выделить которые либо невозможно, либо по которым отсутствует информация. В этом случае ход изменения данного показателя связывают не с факторами, а с течением времени. Широкое практическое применение методов экстраполяции трендов объясняется простотой метода, сравнительно небольшим объемом информации и четкостью механизма реализации, лежащих в основе его предпосылок. При эконометрическом прогнозировании уместным является вопрос о максимально возможной глубине прогнозного периода. Однозначного ответа на него дать невозможно. Очевидно, что, чем более инерционным является рассматриваемый процесс, чем более устойчивее его взаимосвязи, чем стабильнее ситуация в экономике, тем больше может быть и прогнозный период. В некоторых научных публикациях можно встретить рекомендации принимать глубину экономического прогноза как 1/3 или 1/2 от величины оценочного периода. Процесс экстраполяции заключается в подстановке соответствующей величины периода упреждения прогноза – промежутка времени, на который разрабатывается прогноз, в формулу, описывающую тренд. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя. Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, – явление маловероятное. Отсюда появляется недостаточность точечной оценки и необходимость получения интервальной оценки с тем, чтобы прогноз, охватывая некоторый интервал значений прогнозируемой переменной, был бы более надежным. Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано: 1. Ошибочностью выбора вида кривой, характеризующей тренд; 2. Погрешностью оценивания параметров кривых на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту; 109 Конспект лекций по ОТС (Егорова Е.В.) 3. Погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени в прошлом. Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. С помощью такого интервала точечный прогноз преобразуется в интервальный. В основу расчета доверительного интервала прогноза положен измеритель колеблемости ряда наблюдаемых значений признака. Обычно за такой измеритель принимают среднее квадратическое отклонение (стандартное отклонение) фактических наблюдений от расчетных, полученных при аналитическом выравнивании динамического ряда. Сумма квадратов отклонений линий тренда, т.е. ∑ ( yt − yˆt ) 2 , и среднее квадратическое отклонение от тренда sy – являются основой при определении средней квадратической ошибки отдельных параметров уравнения тренда и их доверительных интервалов, а также ошибок и доверительных интервалов тренда – прогноза. Следует отметить, что перенос результатов, найденных для регрессии выборочных показателей, не может, по существу, безоговорочно переноситься на анализ временных рядов. Однако, принципиально новый подход пока не найден. В общем виде доверительный интервал для тренда определяется как yˆ t ± tα s yˆ , где (7.38) yˆ t – расчетное значение y ; t s ŷ – средняя квадратическая ошибка тренда; tα – значение t–критерия Стьюдента при уровне значимости α; Для определения интервальных оценок δ положения тренда на год прогноза tk предварительно вычисляются средние квадратические ошибки s yˆ прогнозного положения тренда на год прогноза, зависящие от типа тренда. Для линейного типа тренда средняя квадратическая ошибка s yˆ на год прогноза tk рассчитывается по формуле s yˆ = s y 1 t2 + k2, n ∑ti (7.39) где sy – среднее квадратическое отклонение фактических наблюдений от расчетных y; tk – номер года прогноза от середины периода наблюдения; ∑ ti2 – сумма номеров каждого года от середины периода наблюдения; n – число уровней динамического ряда; 110 Конспект лекций по ОТС (Егорова Е.В.) Для полинома второго порядка по формуле s yˆ = s y ti4 − (2∑ ti2 ) tk2 + ntk4 tk2 ∑ . 1+ + 2 4 2 2 t n t − ( t ) ∑i ∑i ∑i (7.40) Для полинома третьего порядка по формуле s yˆ = s y ti4 − (2∑ ti2 ) tk2 + ntk4 (∑ ti6 − 2 ∑ ti4 ) tk2 + (∑ ti2 ) tk6 tk2 ∑ . 1+ + + 2 4 2 2 2 6 4 2 t n t − ( t ) t t − ( t ) ∑i ∑i ∑i ∑i∑i ∑t (7.41) Значение вероятного отклонения тренда δ ŷ от расчетного значения ŷt на год прогноза tk получают умножая среднюю квадратическую ошибку прогнозного положения тренда s yˆ на год прогноза tk на величину t–критерия Стьюдента, при принятой доверительной вероятности p, и при числе степеней свободы k, получают = (7.42) табл. . Таким образом, ширина доверительного интервала зависит от принятого уровня значимости, номера года прогноза, среднего квадратического отклонения от тренда и степени полинома. Как видно, значения корней в выражениях зависят только от n и tk, т.е. от длины ряда и номера года прогноза. Обозначив значения корней через K, а tαK через K*, интервальные оценки можно записать в виде δ yˆ = tα s y K = s y K * . (7.43) Значения К* приводятся в специальных таблицах в зависимости от длины временного ряда n и периода упреждения L, для разных форм тренда. Наряду с прогнозом границ возможных отклонений линии тренда, от наиболее вероятных значений, для практических целей, не менее важным является прогноз границ возможных колебаний уровней динамических рядов. Ошибку прогноза уровней конкретного года вычисляют по правилу сложения независимых дисперсий s yt = s 2yˆ + s 2y (7.44) . Эта формула является общей для любых типов тренда. Умножая ошибку прогноза уровней конкретного года на величину t–критерия Стьюдента при принятой доверительной вероятности p и при числе степеней свободы k, получают значение вероятного отклонения уровней ряда от расчетного значения на год прогноза = табл. . 111 Конспект лекций по ОТС (Егорова Е.В.) (7.45) Даже при небольшой протяженности и умеренной колелемости ряда вокруг тренда доверительные интервалы оказываются весьма широкими. При увеличении периода упреждения ширина доверительного интервала будет ускоренно возрастать. Отсюда экстраполяция может довольно быстро привести к неопределенности результатов в статистическом смысле. Сократить ширину доверительного интервала, потеряв при этом в его надежности, можно за счет сокращения доверительной вероятности полученных оценок. Уменьшение доверительной вероятности приводит к сокращению t–критерия Стьюдента, который влияет на значение доверительного интервала. Экстраполяция – довольно грубая операция, основывающаяся на целом ряде допущений. В практике такого рода расчетов обычно принимают, что доверительная вероятность равна 80 – 90%. При экстраполяционном прогнозировании экономической динамики с использованием трендовых моделей весьма важным является заключительный этап — верификация прогноза. Верификация – оценка достоверности прогнозной модели представляет собой совокупность критериев, способов и процедур, позволяющих на основе многостороннего анализа оценивать качество получаемого прогноза. На практике наиболее часто используется прямой метод верификации, когда расчетное значение yˆ t +1 , полученное по уравнению тренда, сравнивается с фактическим значением. Нужно иметь в виду, что экстраполяция в рядах динамики носит не только приближенный, но и условный характер. Поэтому ее следует рассматривать как предварительный этап в разработке прогнозов. Для составления окончательного прогноза должна быть привлечена дополнительная информация, не содержащаяся в самом динамическом ряду. В прогностической литературе широко распространены термины – точность и надежность прогноза. О точности прогноза принято судить по величине погрешности прогноза – разности между прогнозируемым и фактическим значением исследуемой переменной. Такой подход к оценке точности возможен в двух случаях. Во-первых, когда период упреждения уже окончился и исследователь имеет фактические значения переменной. Во-вторых, когда прогноз разрабатывается ретроспективно, т.е. прогнозирование осуществляется для некоторого момента времени в прошлом, для которого уже имеются фактические данные. В указанных случаях о степени погрешности прогноза можно судить по относительной ошибке – отношении абсолютной погрешности прогноза к ожидаемому (или фактическому) значению признака. Проверка точности единичного прогноза, как правило, мало что может сказать исследователю. О качестве прогнозов применяемых методик и моделей можно судить лишь по совокупности сопоставлений прогнозов и их реализацией, например, по средним абсолютным значениям ошибок прогноза ( ε t ), выраженных в процентах относительно фактических значений показателя (yt) 112 Конспект лекций по ОТС (Егорова Е.В.) где 1 n yt − yˆt εt = ∑ ⋅ 100 % , n t =1 yt yt – фактический уровень показателя на момент t; yˆ t – точечный прогноз на момент t. (7.46) В практической работе проблему точности прогноза надо решать, как правило, тогда, когда период упреждения еще не прошел и истинное значение прогнозируемой переменной неизвестно. В этом случае проблему точности, если прогнозирование осуществляется статистическими методами, можно связать с размером доверительного интервала. Модель дающая более узкий доверительный интервал при одной и той же доверительной вероятности и является более точной. Надежность прогноза определяется вероятностью наступления прогнозируемого события, т.е. реализации соответствующей прогностической оценки. Чем она выше, тем выше и надежность. Вероятность реализации может быть субъективной (экспертное прогнозирование) или может быть связана с доверительными интервалами прогнозов, если последний основывается на статистической модели. Понятия точности и надежности прогнозов, связанные с доверительными интервалами, могут использоваться в практической работе лишь при условии, что принятая для получения прогнозов модель имеет серьезное теоретическое обоснование. В противном случае полученные доверительные интервалы лишь создают иллюзию точности. 113 Конспект лекций по ОТС (Егорова Е.В.) РЕЗЮМЕ Общественные явления, изучаемые статистикой, претерпевают изменения во времени. В процессе исторического развития изменяются их объем, уровень, состав и структура. Выявление и измерение этих изменений представляют одну из самых важных задач статистики. Исходной базой решения данной задачи служат ряды динамики. В ходе анализа временных рядов изучается соотношение между закономерностью и случайностью в формировании значений уровней ряда. Закономерности, объясняющие динамику показателя в прошлом, используются для прогнозирования его значений в будущем, а учет случайности позволяет определить вероятность отклонения от закономерного развития и его возможную величину. Моделирования на основе временных рядов осуществляется в несколько этапов: 1) предварительный анализ данных; 2) построение моделей: формирование набора аппроксимирующих функций (кривых роста) и численное оценивание параметров моделей; 3) проверка адекватности моделей и оценка их точности; 4) выбор лучшей модели; 5) расчет точечного и интервального прогнозов. 114 Конспект лекций по ОТС (Егорова Е.В.) ТЕМА 8. ИНДЕКСЫ 1. Понятие индексов, их виды и значение в статистике Индекс (лат. index – указатель, показатель) – это особый статистический относительный показатель, характеризующий соотношение во времени или пространстве различных социально-экономических явлений. Практически любой статистический сборник содержит информацию государственной статистики об изменении важнейших экономических показателей развития экономики в виде индексов. Во-первых, индексы позволяют измерить изменение сложных явлений. Во-вторых, индексы позволяют проанализировать изменение, выявить роль отдельных факторов. В-третьих, индексы являются показателями сравнений не только с прошлым периодом (сравнение во времени), но и с другой территорией (сравнение в пространстве), а также с нормативами. Существует несколько определений индекса. Приведем одно из них, может быть самое краткое. Индекс – это показатель сравнения двух состояний одного и того же явления (простого или сложного, состоящего из соизмеримых или несоизмеримых элементов). Каждый индекс включает два вида данных: оцениваемые данные, которые принято называть отчетными и обозначать значком «1», и данные, которые используются в качестве базы сравнения, – базисные, обозначаемые значком «0». Индекс, построенный для характеристики изменений отдельных единиц статистической совокупности, называют индивидуальным и обозначают i. Индекс, который рассматривается в виде сравнения обобщенных величин (совокупности единиц в целом), называют общим или сводным и обозначают I. В зависимости от целей исследования и решаемых задач индексы делят на простые и аналитические. Простые индексы оценивают только динамику изучаемого признака без учета связи его с другими признаками, поэтому их иногда называют динамическими. Аналитические индексы характеризуют изменение изучаемого признака во взаимосвязи с другими признаками непосредственно несоизмеряемых, разнородных явлений. Как правило, аналитические индексы – это общие индексы, обладающие синтетическими и аналитическими свойствами. Синтетические свойства индексов выражаются в их способности соединять (агрегировать) в целое разнородные единицы статистической совокупности. Аналитические свойства индексов состоят в том, что на основе индексного метода измеряется влияние отдельных факторов на совокупное изменение изучаемого показателя. Индексы могут быть цепными и базисными. 115 Конспект лекций по ОТС (Егорова Е.В.) 2. Методы построения индексов Назначение индексов – изучение динамики сложных явлений, которые состоят из относительно более простых отдельных элементов. Изменение отдельных элементов характеризуется с помощью индивидуальных индексов, а сложных явлений в целом – на основе общих индексов. Индивидуальный индекс получается путем сравнения двух величин. Например, требуется проанализировать показатели коммерческой деятельности торгового предприятия, занимающегося реализацией бытовой техники. Допустим, имеется информация за два смежных месяца его деятельности об объеме реализации конкретных видов бытовой техники (q)? розничных ценах единицы товара (p), товарообороте (w=qp). Тогда индивидуальные индексы будут следующими: = ; = ; = ∑ ∑ × × ; Л = ; П = = × × При построении индивидуальных индексов следует выполнять требования сопоставимости сравниваемых величин: одинаковая методология исчисления, однокачественность сравниваемых величин, одна и та же территория и др. Для расчета индексов по всей совокупности использую сводные индексы, в которых несоизмеримые элементы выражаются через их общую меру, например, стоимость. В российской статистике в зависимости от целей исследования и информационного обеспечения применяют методику построения агрегатных индексов Пааше (с текущими весами), либо Ласпейреса (с базисными весами): а) методика Э. Ласпейреса Л = П = а) методика Г. Пааше ∑ ∑ × × ∑ ∑ ∑ ∑ × × × × (8.1) (8.2) Агрегатные индексы цен и физического объема с разными весами показывают различные результаты изменения индексируемых признаков. Как правило, индекс с базисными весами больше, чем с текущими. Такое соотношение двух индексов получило в экономической литературе название эффекта Гершенкропа, по имени американского ученого, занимавшегося теорией индексов в 1930-х годах. 116 Конспект лекций по ОТС (Егорова Е.В.) 3. Индексы средних уровней изучаемых явлений Статистические закономерности развития изучаемых совокупностей различных явлений отражаются через средние значение или средние величины их показателей. Динамика средних показателей качественных признаков учитывает не только изменения конкретных значений отдельных единиц совокупности, но и структурные сдвиги. При анализе изменения средних уровней качественных признаков для оценки влияния структурных сдвигов на динамику этих уровней можно использовать индексы средних величин. Средняя величина в этом случае должна быть выражена в виде средней взвешенной, а изменение этой средней будет характеризоваться соотношением этих средних за отчетный и базисный периоды: ̅ перем ̅ ∑ × = ∑ ̅ = ÷ ∑ × ∑ (8.3) Этот индекс получил название индекса переменного состава, так как он отражает не только изменение определенного признака x, но и структуры совокупности ∑ (изменение удельного веса отдельных элементов однородной совокупности). На основе индекса переменного состава рассчитывают индексы постоянного (фиксированного) состава и индекс структурных сдвигов ̅ пост = ∑ ̅ стр ∑ × = ∑ ÷ ∑ ∑ × ∑ × ÷ ∑ = ∑ × ∑ ∑ × × (8.4) (8.5) Рассмотренные индексы увязываются в следующую систему: ̅ перем = ̅ пост × ̅ стр (8.6) На основе этого равенства оценивают влияние каждого из факторов на изменение среднего уровня изучаемого признака. 117 Конспект лекций по ОТС (Егорова Е.В.) Рекомендуемая литература 1. Благовещенский Ю.Н. Тайны корреляционных связей. Монография. – М.: Научная книга: ИНФРА-М, 2009. – 158с. 2. Гришин А.Ф., Егорова Е.В. Экономико-статистический анализ хозяйственной деятельности крестьянских (фермерских) хозяйств – Тверь: издательство ТГСХА, – 2011. – 104с. 3. Гришин А.Ф., Кочерова Е.В. Статистические модели: построение, оценка, анализ: Учеб. пособие. – М.: Финансы и статистика, 2005. – 416с. 4. Егорова Е.В., Мутовкина Н.Ю. Экономико-статистический анализ хозяйственной деятельности в пакете прикладных программ STATISTICA: Учебное пособие. Тверь: ТГТУ, 2012 – 146с. 5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/ под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2005. - 480 с. 6. Ефимова М.Р. Социально-экономическая статистика: учебник / М.Р. Ефимова. – М.: Юрайт, 2011. 7. Мутовкина Н.Ю., Егорова Е.В. Статистический анализ финансовохозяйственной деятельности субъектов экономики в MS Excel. Учебное пособие. Тверь: ТГТУ, 2013 – 206с. 8. Статистика / учебник для бакалавров / под ред. И.И. Елисеевой. М.: Юрайт. 2013. – 558 с. – Серия: Бакалавр. Углубленный курс. 9. Статистика: учебник для бакалавров / под ред. В. С. Мхитаряна. – М.: Издательство Юрайт, 2013. – 590 с. – Серия: Бакалавр. Базовый курс. 10. Фаринюк Ю.Т., Егорова Е.В. Экономический анализ состояния и эффективности использования ресурсов сельскохозяйственной отрасли России – Тверь: Тверская ГСХА, – 2012. – 158с. 118 Конспект лекций по ОТС (Егорова Е.В.)

Статистические показатели и данные.

Тебе могут подойти лекции

Способы наглядного представления статистических данных. Средние величины и показатели вариации

Предмет, метод и задачи статистики

Статистика. Предмет, метод и задачи статистики

Основы статистики

Статистический показатель и его виды

Статистика как наука. Этапы статистических исследований

Статистика. Часть 1

Экономическая статистика

Экономическая статистика

Понятие и предмет статистики

Статистические показатели и данные.

Тебе могут подойти лекции

Другие экономические предметы

Помощь с написанием учебных работ