Справочник от Автор24
Поделись лекцией за скидку на Автор24

Предмет, метод и основные категории статистики как науки

  • ⌛ 2017 год
  • 👀 402 просмотра
  • 📌 313 загрузок
  • 🏢️ Тульский государственный университет
Выбери формат для чтения
Статья: Предмет, метод и основные категории статистики как науки
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Предмет, метод и основные категории статистики как науки» pdf
Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования «Тульский государственный университет» Кафедра «Финансы и менеджмент» к.т.н., доц. МАКАРОВА Н.Н. КОНСПЕКТ ЛЕКЦИЙ по дисциплине «Статистика» Уровень профессионального образования: высшее образование – бакалавриат Направление подготовки: 38.03.01 Экономика Профили подготовки: «Бухгалтерский учет, анализ и аудит», «Финансы и кредит», «Налоги и налогообложение» Квалификация (степень) выпускника: 62 – бакалавр Форма обучения – очная, заочная Тула 2017 Разработала: к.т.н., доц. Макарова Н.Н. Рассмотрено и утверждено на заседании кафедры «Финансы и менеджмент» Протокол № 1 от 30 августа 2016 г. СОДЕРЖАНИЕ 1. Предмет и метод статистики 1.1. Предмет, метод и основные категории статистики как науки 1.2. Органы государственной статистики Российской Федерации 2. Статистическое наблюдение 2.1. Понятия и требования статистического наблюдения 2.2. Программно-методологические и организационные вопросы статистического наблюдения 2.3. Формы, виды и способы наблюдения 3. Сводка и группировка данных статистического наблюдения 3.1. Понятия сводки и группировки статистических данных 3.2. Виды группировок 3.3. Статистические таблицы и графики 4. Абсолютные и относительные статистические величины 4.1. Понятие абсолютной и относительной величины в статистике 4.2. Виды и взаимосвязи относительных величин 5. Средние величины. Показатели вариации 5.1. Понятие средней величины 5.2. Виды средних и способы их вычисления 5.3. Структурные средние 5.4. Показатели вариации 6. Изучение динамики общественных явлений 6.1. Ряды динамики. Классификация динамических рядов 6.2. Показатели анализа рядов динамики 6.3. Изучение тенденции развития 7. Индексы 7.1. Индивидуальные индексы и их применение в экономическом анализе 7.2. Общие индексы и их применение в анализе 7.3. Индексы при анализе структурных изменений 8. Статистическое изучение взаимосвязей 8.1. Основные понятия корреляционного и регрессионного анализа 8.2. Парная корреляция и парная линейная регрессия 8.3. Оценка значимости параметров взаимосвязи 8.4. Непараметрические методы оценки связи Лекция 1. Предмет и метод статистики 1.1. Предмет, метод и основные категории статистики как науки Слово «статистика» имеет латинское происхождение (от status – состояние). В средние века оно означало политическое состояние государства. В науку этот термин введен в XVIII в. немецким ученым Готфридом Ахенвалем. Собственно как наука статистика возникла только в XVII в., однако статистический учет существовал уже в глубокой древности. Так, известно, что еще за 5 тыс. лет до н.э. проводились переписи населения в Китае, осуществлялось сравнение военного потенциала разных стран, велся учет имущества граждан в Древнем Риме, затем – населения, домашнего имущества, земель в средние века. У истоков статистической науки стояли две школы – немецкая описательная и английская школа политических арифметиков. Представители описательной школы считали, что задачей статистики является описание достопримечательностей государства: территории, населения, климата, вероисповедания, ведения хозяйства и т.п. – только в словесной форме, без цифр и вне динамики, т.е. без отражения особенностей развития государств в те или иные периоды, а только лишь на момент наблюдения. Видными представителями описательной школы были Г. Конринг (1606–1661), Г. Ахенваль (1719–1772), А. Бюшинг (1724–1793) и др. Политические арифметики ставили целью изучать общественные явления с помощью числовых характеристик – меры веса и числа. Это был принципиально новый этап развития статистической науки по сравнению со школой государствоведения, так как от описания явлений и процессов статистика перешла к их измерению и исследованию, к выработке вероятных гипотез будущего развития. Политические арифметики видели основное назначение статистики в изучении массовых общественных явлений, осознавали необходимость учета в статистическом исследовании требований закона больших чисел, поскольку закономерность может проявиться лишь при достаточно большом объеме анализируемой совокупности. Виднейшим представителем и основателем этого направления был В. Петти (1623–1687). История показала, что последнее слово в статистической науке осталось именно за школой политических арифметиков. В XIX в. получило развитие учение бельгийского статистика А. Кетле, основоположника учения о средних величинах. Математическое направление в статистике развивалось в работах англичан Ф. Гальтона (1822–1911 гг.) и К. Пирсона (1857–1936 гг.), В. Госсета (1876–1937 гг.) более известного под псевдонимом Стьюдента, Р. Фишера (1890–1962 гг.) и др. Прогрессу статистической методологии способствовали – труды российских статистиков – А.А. Чупрова (1874–1926 гг.), В.С. Немчинова (1894–1964 гг.), С.Г. Струмилина (1877– 1974 гг.) и др. Развитие статистической науки, расширение сферы практической статистической работы привели к изменению содержания самого понятия «статистика». В настоящее время данный термин употребляется в трех значениях: 1) под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни (в этом смысле «статистика» выступает как синоним словосочетания «статистический учет»); 2) статистикой называют цифровой материал, служащий для характеристики какой-либо области общественных явлений или территориального распределения какого-то показателя; 3) статистикой называется отрасль знания, особая научная дисциплина и соответственно учебный предмет в высших и средних специальных учебных заведениях. Как и всякая наука, статистика имеет свой предмет изучения: статистика изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной, исследует количественное выражение закономерностей общественного развития в конкретных условиях места и времени. Свой предмет статистика изучает при помощи определенных категорий, т.е. понятий, которые отражают наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира. Основные понятия теории статистики: 1. Статистическая совокупность – это множество единиц изучаемого явления, объединенных единой качественной основой, общей связью, но отличающихся друг от друга отдельными признаками. Таковы, например, совокупность домохозяйств, совокупность семей, совокупность предприятий, фирм, объединений и т.п. Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной. Совокупность может быть однородна в одном отношении и разнородна в другом. В каждом отдельном случае однородность совокупности устанавливается путем проведения качественного анализа, выяснения содержания изучаемого общественного явления. 2. Признак – это качественная особенность единицы совокупности. По характеру отображения свойств единиц изучаемой совокупности признаки делятся на две основные группы: признаки, имеющие непосредственное количественное выражение, например возраст, стаж работы, средний заработок и т.д. Они могут быть дискретными и непрерывными; признаки, не имеющие непосредственного количественного выражения. В этом случае отдельные единицы совокупности различаются своим содержанием (например, профессии – характером труда: учитель, столяр, швея-мотористка и т.д.). Такие признаки обычно называют атрибутивными (в философии «атрибут» – неотъемлемое свойство предмета). В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет). Например, продукция может быть годной или бракованной (не годной); для представителей отдельных возрастных групп существует вероятность дожить или не дожить до следующей возрастной группы; каждое лицо может состоять в браке или нет и т.д. Особенностью статистического исследования является то, что в нем изучаются только варьирующие признаки, т.е. признаки, принимающие различные значения (для атрибутивных, альтернативных признаков) или имеющие различные количественные уровни у отдельных единиц совокупности. 3. Статистический показатель – это количественная оценка свойства изучаемого явления. Статистические показатели можно подразделить на два основных вида: учетнооценочные показатели (размеры, объемы, уровни изучаемого явления) и аналитические показатели (относительные и средние величины, показатели вариации и т.д.). Свой предмет статистика изучает при помощи своего, специфического метода. Общей основой разработки и применения статистической методики является диалектический метод познания, согласно которому общественные явления и процессы рассматриваются в развитии, взаимной связи и причинной обусловленности. Метод статистики – это целая совокупность приемов, пользуясь которыми статистика исследует свой предмет. Она включает в себя три группы собственно методов: метод массовых наблюдений, метод группировок, метод обобщающих показателей. Статистическое наблюдение заключается в сборе первичного статистического материала, в научно организованной регистрации всех существенных фактов, относящихся к рассматриваемому объекту. Это первый этап всякого статистического исследования. Метод группировок дает возможность все собранные в результате массового статистического наблюдения факты подвергать систематизации и классификации. Это второй этап статистического исследования. Метод обобщающих показателей позволяет характеризовать изучаемые явления и процессы при помощи статистических величин – абсолютных, относительных и средних. На этом этапе статистического исследования выявляются взаимосвязи и масштабы явлений, определяются закономерности их развития, даются прогнозные оценки. 1.2. Органы государственной статистики Российской Федерации В соответствии со ст. 71 Конституции РФ руководство статистикой в стране осуществляет Госкомстат как федеральный орган исполнительной власти. Госкомстат РФ, его органы в республиках, краях, областях, автономных областях и округах, в городах Москве и Санкт-Петербурге, других городах и районах, а также подведомственные им организации, учреждения и учебные заведения составляют единую систему государственной статистики страны. Формы и методы сбора и обработки статистических данных, методология расчета статистических показателей, установленные Росстатом, являются статистическими стандартами РФ. В соответствии с положением основными задачами Росстата являются: 1) предоставление официальной статистической информации Президенту, правительству, федеральному собранию РФ, федеральным органам исполнительной власти, общественности; 2) разработка научно обоснованной статистической методологии, соответствующей международным стандартам; 3) координация статистической деятельности в государстве; 4) разработка экономико-статистической информации, ее анализ, составление национальных счетов, проведение необходимых балансовых расчетов; Основные функции Росстата состоят в том, что он: 1) организует проведение государственных статистических наблюдений по разработанным им или согласованным с ним программам, формам и методикам; 2) обеспечивает функционирование ЕГРПО (Единого государственного регистра предприятий и организаций); 3) обеспечивает сбор, обработку, хранение и защиту статистической информации, соблюдение государственной и коммерческой тайны, необходимую конфиденциальность данных (конфиденциальный – секретный, доверительный); 4) сопоставляет основные социально-экономические показатели России с аналогичными показателями других стран, совместно с Центробанком составляет платежный баланс страны; 5) проводит единую техническую политику в области сбора, обработки и передачи статистической информации, в разработке и формировании федеральных программ по вопросам, порученным Росстату. Лекция 2. Статистическое наблюдение 2.1. Понятия и требования статистического наблюдения Количественная характеристика социально-экономических процессов в непосредственной связи с их качественной сущностью невозможна без глубокого статистического исследования. Использование различных способов и приемов статистической методологии предполагает наличие исчерпывающей и достоверной информации об изучаемом объекте, что включает этапы сбора статистической информации и ее первичной обработки, сведения и группировки результатов наблюдения в определенные совокупности, обобщения и анализа полученных материалов. Если при сборе статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов. Поэтому статистическое наблюдение от начальной до завершающей стадии должно быть тщательно продуманным и четко организованным. Статистическое наблюдение – это первая стадия всякого статистического исследования, представляющая собой научно организованный по единой программе учет фактов, характеризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных. Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда, во-первых, обеспечивается регистрация устанавливаемых фактов в специальных учетных документах и, во-вторых, изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности. Поэтому статистическое наблюдение должно быть планомерным, массовым и систематическим. К статистическому наблюдению предъявляются следующие требования: 1) полноты и практической ценности статистических данных; 2) достоверности и точности данных; 3) их единообразия и сопоставимости. 2.2. Программно-методологические и организационные вопросы статистического наблюдения Любое статистическое исследование необходимо начинать с точной формулировки его цели и конкретных задач, а тем самым и тех сведений, которые могут быть получены в процессе наблюдения. После этого определяются объект и единица наблюдения, разрабатывается программа, выбираются вид и способ наблюдения. Объект наблюдения – совокупность социально-экономических явлений и процессов, которые подлежат исследованию, или точные границы, в пределах которых будут регистрироваться статистические сведения. Например, при переписи населения необходимо установить, какое именно население подлежит регистрации – наличное, т.е. фактически находящееся в данной местности в момент переписи, или постоянное, т.е. живущее в данной местности постоянно. В ряде случаев для отграничения объекта наблюдения пользуются тем или иным цензом. Ценз есть ограничительный признак, которому должны удовлетворять все единицы изучаемой совокупности. Единицей наблюдения называется составная часть объекта наблюдения, которая служит основой счета и обладает признаками, подлежащими регистрации при наблюдении. Так, например, при переписи населения единицей наблюдения является каждый отдельный человек. Программа наблюдения – это перечень вопросов, по которым собираются сведения, либо перечень признаков и показателей, подлежащих регистрации. Программа наблюдения оформляется в виде бланка (анкеты, формуляра), в который заносятся первичные сведения. Необходимым дополнением к бланку является инструкция (или указания на самих формулярах), разъясняющая смысл вопроса. Состав и содержание вопросов программы наблюдения зависят от задач исследования и от особенностей изучаемого общественного явления. Организационные вопросы статистического наблюдения включают в себя определение субъекта, места, времени, формы и способа наблюдения. 2.3. Формы, виды и способы наблюдения В статистической практике используются две организационные формы наблюдения – отчетность и специальное статистическое обследование. Отчетность – это такая организационная форма, при которой единицы наблюдения представляют сведения о своей деятельности в виде формуляров регламентированного образца. Особенность отчетности состоит в том, что она обязательна, документально обоснована и юридически подтверждена подписью руководителя. Примером второй формы наблюдения – специального статистического обследования – является проведение переписей населения. В зависимости от задач статистического исследования и характера изучаемого явления учет фактов можно производить: - систематически, постоянно охватывая факты по мере их возникновения – это будет текущее наблюдение (отчетность); - регулярно, но не постоянно, а через определенные промежутки времени – это будет периодическое наблюдение (переписи населения). Рис. 2.1. Формы, виды и способы статистического наблюдения С точки зрения полноты охвата фактов статистическое наблюдение может быть сплошным и несплошным. Сплошное наблюдение представляет собой полный учет всех единиц изучаемой совокупности. Несплошное наблюдение организуют как учет части единиц совокупности, на основе которой можно получить обобщающую характеристику всей совокупности. К видам несплошного наблюдения относятся: способ основного массива, выборочные наблюдения, монографические описания. При непосредственном учете фактов сведения получают путем личного учета единиц совокупности: пересчета, взвешивания, измерения и т.д. Документальный способ сбора статистической информации базируется на систематических записях в первичных документах, подтверждающих тот или иной факт. В ряде случаев для заполнения статистических формуляров прибегают к опросу населения, который может быть произведен экспедиционным, анкетным или корреспондентским способом. Существуют различные способы формирования выборочной совокупности. Это, вопервых, индивидуальный отбор, включающий такие разновидности, как собственно случайный, механический, стратифицированный, и, во-вторых, серийный, или гнездовой, отбор. Способы формирования выборочной совокупности При формировании выборки исследователь стремится, чтобы выборка была репрезентативной (представительной), т.е. достаточно хорошо отображала свойства генеральной совокупности. Если отбор элементов производится произвольно, то полученная выборка носит название случайной. В математической статистике это понятие имеет специальное определение: выборка называется случайной, если все элементы генеральной совокупности имеют одинаковые вероятности быть отобранными в состав этой выборки. Это соответствует процедуре взятия выборки с возвратом, или повторному отбору. При повторном отборе каждая единица после фиксации значения изучаемого признака должна быть возвращена в генеральную совокупность, где ей опять предоставляется равная возможность попасть в выборку. Но на практике повторный отбор осуществляется редко. Обычно выборочные исследования проводятся по схеме бесповторного отбора, при котором повторное попадание в выборку одних и тех же единиц исключено. Если генеральная совокупность велика, а объем выборки относительно мал, между повторным и бесповторным отбором нет разницы. В противном случае, если объем выборки составляет более 5 % объема генеральной совокупности, бесповторный отбор приведет к существенно иным результатам. Бесповторный отбор дает более точные результаты по сравнению с повторным, т.к. при одном и том же объеме выборки охватывается большее количество единиц генеральной совокупности. Однако бесповторный отбор при большом объеме генеральной совокупности не всегда целесообразен. Например, при исследовании пассажиропотоков или изучении потребительского спроса целесообразнее применять повторный отбор. В статистике применяются различные способы формирования выборочной совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения. Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения равных возможностей попадания в выборку каждой единицы генеральной совокупности. Практика применения выборочного метода в экономико-статистических исследованиях использует индивидуальный, групповой и комбинированный способы отбора в выборочную совокупность. В случае индивидуального отбора в выборку отбираются отдельные единицы генеральной совокупности, в случае группового - качественно однородные группы или серии изучаемых единиц. Комбинированный отбор является комбинацией индивидуального и группового способов отбора из генеральной совокупности. По правилам формирования выборочной совокупности выделяются выборки: 1) собственно случайная; 2) механическая; 3) экспертная; 4) типическая; 5) серийная; 6) комбинированная. Собственно случайный отбор. Собственно случайный отбор является наиболее простым способом формирования выборочной совокупности. Выборка образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности, при этом предполагается, что в распоряжении исследователя имеется полный перечень единиц (рис. 1.4). Количество отобранных в выборочную совокупность единиц определяется исходя из принятой доли выборки как отношение числа единиц выборочной совокупности к численности единиц генеральной совокупности. Так при 5%-й выборке из партии в 2000 единиц численность выборки составляет 0,05  2000  100 единиц. Рис. 2.2. Собственно случайная выборка Важным условием собственно случайной выборки является то, что каждой единице генеральной совокупности предоставляется равная возможность попасть в выборку. Именно принцип случайности попадания любой единицы в выборку предупреждает возникновение систематических ошибок. Примером использования собственно-случайной выборки является проведение тиражей лотереи, при которых обеспечивается равная возможность попадания в тираж любого номера лотерейного билета. Формирование собственно случайной выборки обычно осуществляется с помощью специальных фишек или таблиц случайных чисел. В случае использования фишек все единицы генеральной совокупности нумеруются и каждый номер записывается на фишку (жребий) одинаковой формы. Фишки тщательно перемешиваются и отбираются в выборку по одной. При использовании таблиц случайных чисел из таблицы выбирается любая строка или колонка таблицы и выборку включаются указанные номера единиц генеральной совокупности. Собственно случайная выборка может быть повторной и бесповторной. Так как при повторном отборе каждая единица, попавшая в выборку, после ее обследования должна обязательно быть возвращена в генеральную совокупность, на практике это не всегда осуществимо. Например, после контроля качества электроламп на продолжительность горения, нет никакого смысла возвращать в генеральную совокупность перегоревшие лампочки. А вот в случае изучения покупательского спроса населения допускается повторная регистрация неудовлетворенного спроса одного и того же лица в нескольких магазинах города. Механический отбор. Процедура механического отбора намного проще собственно случайного отбора, поэтому механический отбор на практике используется более широко и основан на предварительном упорядочении генеральной совокупности. Отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). Размер интервала равен обратной величине доли выборки. Так при 2 %-й выборке отбирается каждая 1 0,02  50 единица. Таким образом, генеральная совокупность механически разбивается на равновеликие группы. Из каждой такой группы в выборку отбирается лишь одна единица. Например, из телефонной книги берем каждую десятую фамилию, спрос в магазинах изучаем по пятницам и т.д. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. При этом по отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признакам. При упорядочении генеральной совокупности по существенному признаку – признаку, всецело определяющему поведение изучаемого показателя – в выборочную совокупность должна отбираться та единица, которая находится в середине каждой группы (рис. 1.5). Это позволяет избежать появления систематической ошибки выборки. Например, при изучении выполнения нормы выработки кассирами составляется список, упорядоченный по возрастанию показателя выполнения норм. При 10 %-м выборочном обследовании из каждого десятка в выборку следует отбирать пятые или шестые номера. Если в выборку отбирать первые номера из каждого десятка, то это исказит (занизит) выборочные характеристики – появится систематическая ошибка репрезентативности. При упорядочении генеральной совокупности по нейтральному признаку – признаку, который не влияет на поведение изучаемого показателя, – в выборочную совокупность из первой группы генеральной совокупности может быть взята любая единица. Во всех последующих группах механической выборки берут единицы, соответствующие порядковому номеру единицы, отобранной в первой группе, для соблюдения принципа случайности отбора. Рис. 2.3. Механическая выборка В основе упорядочения единиц генеральной совокупности может лежать и второстепенный по отношению к изучаемому показателю признак. Например, при исследовании хлебобулочных изделий в качестве признака, упорядочивающего совокупность, выбирается последовательность выхода продукции из цеха, но к концу смены качество может измениться под влиянием таких факторов, как разладка машин, усталость работников и т.д. В этом случае следует учитывать второстепенные признаки и выбирать из каждой группы единицы, находящиеся в ее середине. Важной особенностью механической выборки является то, что формирование выборки можно осуществлять, не прибегая к составлению списков. На практике используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Если элементы генеральной совокупности хорошо перемешаны, между механической и собственно случайной выборками не будет большой разницы. Если же элементы генеральной совокупности расположены в определенном порядке, то механического отбора следует избегать из-за возможного появления систематических ошибок. Например, нельзя проверять только дома с четными номерами или каждую 4-ю квартиру в доме, или посещаемость студентами занятий каждую пятницу. Экспертный отбор. При этом отборе исследователь сам решает, какой элемент генеральной совокупности попадает в выборку. Такой отбор можно применять лишь при отборе небольших выборок и из небольших генеральных совокупностей. Чаще всего экспертный отбор применяется при покупке и продаже товаров. Покупатели фруктов, кофе и многих других товаров постоянно основывают свои решения на экспертном отборе. Если исследователь обладает знаниями и опытом, он сможет получить очень хорошие оценки (лучше, чем при собственно случайном отборе) при очень маленьких выборках. Типический отбор. При типическом отборе генеральная совокупность вначале разбивается на однородные типические группы. Выбор из каждой типической группы осуществляется собственно случайным или механическим способом. Рис.2.4. Типическая выборка Типическая выборка применяется при изучении сложных статистических совокупностей, например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации; при проведении бюджетных обследований домашних хозяйств, сгруппированных по источнику средств существования или уровню образования. Число единиц из каждой выделенной группы отбирается в зависимости от числа элементов в каждой группе. Существует три способа отбора: 1. Отбор из каждой группы равного числа единиц дает достаточно надежные результаты лишь при равных размерах выделенных типических групп. 2. Отбор единиц пропорционально их численности в соответствующих группах генеральной совокупности. Использование этого способа формирования выборочной совокупности обеспечивает достаточно надежные результаты, если колеблемость признака несущественно различается в разных группах генеральной совокупности. Если же коэффициенты вариации в них различаются, то репрезентативность выборки при таком способе может оказаться невысокой. 3. Оптимальное размещение, учитывающее не только численность групп, но и степень вариации в них изучаемого признака. Разновидностью типической является районированная выборка, при которой отбор единиц для наблюдения проводится из групп, представленных административно-территориальными образованиями. В этом случае преимущества типической выборки проявляется лишь при заметном расхождении среднего значения изучаемого признака по отдельным регионам. Серийный (гнездовый) отбор. Серийный отбор применяется, если генеральная совокупность разбита на группы еще до начала выборочного обследования и довольно широко используется в торговле. Рис. 2.5. Серийная выборка При серийной выборке из генеральной совокупности отбираются не отдельные единицы, а целые их серии (гнезда). Внутри же каждой из попавшей в выборку серии обследуются все без исключения единицы, т.е. применяется сплошное наблюдение. Отбор отдельных серий в выборку осуществляется либо собственно случайным, либо механическим способом. Применение серийного отбора обусловлено тем, что многие товары упаковываются в пачки, коробки, ящики и т.п. При контроле качества товара рациональнее проверить несколько отдельных упаковок (серий), чем из всех упаковок отобрать необходимое количество единиц товара. В рассмотренных способах формирования выборочной совокупности отбор единиц для наблюдения осуществляется на первом этапе. Такой отбор называется одноступенчатым. На практике же используется многоступенчатый отбор, когда на первом этапе из совокупности отбираются укрупненные единицы (серии), а затем в рамках серии осуществляется собственно случайный или механический отбор единиц из каждой отобранной серии. При построении многоступенчатой выборки используется комбинация разных способов отбора – комбинированная выборка. Моментные или выборочные исследования. Этот способ применяется для статистического изучения протекающих во времени процессов. Большое распространение способ получил при анализе использования рабочего времени. Моментные выборочные исследования менее трудоемки, чем хронометраж рабочего дня, а результаты при правильной организации моментных обследований достаточно точны. Основным содержанием способа является периодическая фиксация (в заранее установленные моменты времени) состояния изучаемой совокупности. При сплошном охвате всех единиц совокупности этот способ по времени получения информации. Лекция 3. Сводка и группировка данных статистического наблюдения 3.1. Понятия сводки и группировки статистических данных Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведении разрозненных данных воедино. Научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных систематизацию, группировку материалов, составление таблиц, получение итогов и производных показателей (средних, относительных величин), называется в статистике сводкой. Сводка представляет собой второй этап статистического исследования. Целью сводки является получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Статистическая сводка осуществляется по программе, которая должна разрабатываться еще до сбора статистических данных, практически одновременно с составлением плана и программы статистического наблюдения. Программа сводки включает определение групп и подгрупп; системы показателей; видов таблиц. Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов выражается классификацией, которая основывается на самых существенных признаках (например, классификация отраслей народного хозяйства, классификация основных фондов и т.д.). Таким образом, классификация – это узаконенная, общепринятая, нормативная группировка. Метод группировки основывается на следующих категориях – это группировочный признак, интервал группировки и число групп. Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают: равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова; неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе; открытые, когда имеется только либо верхняя, либо нижняя граница; закрытые, когда имеются и нижняя, и верхняя границы. Определение числа групп. Здесь необходимо учитывать несколько условий: а) число групп детерминируется уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп; б) число групп должно отражать реальную структуру изучаемой совокупности; в) не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы. Для нахождения числа групп служит формула где N – количество элементов совокупности. В случае равных интервалов величина интервала может быть определена как 3.2. Виды группировок. При проведении группировки приходится решать ряд задач: 1) выделение группировочного признака; 2) определение числа групп и величины интервалов; 3) при наличии нескольких группировочных признаков описание того, как они комбинируются между собой; 4) установление показателей, которыми должны характеризоваться группы, т.е. сказуемого группировки. Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная, аналитическая (факторная). Типологическая группировка решает задачу выявления и характеристики социальноэкономических типов (частных подсовокупностей). Структурная дает возможность описать составные части совокупности или строение типов, а также проанализировать структурные сдвиги. Аналитическая (факторная) группировка взаимодействующими признаками. позволяет оценивать связи между В зависимости от числа положенных в их основание признаков различают простые и многомерные группировки. Группировка, выполненная по одному признаку, называется простой. Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. Структурная группировка применяется для характеристики структуры совокупности и структуры сдвигов. Структурной называется группировка, в которой происходит разделение выделенных с помощью технологической группировки типов явлений, однородных совокупностей на группы, характеризующие их структуру по какого либо варьирующему признаку. Например, группировка населения по размеру среднедушевого дохода. Анализ структурных группировок взятых за ряд периодов или моментов времени, показывает изменения структуры изучаемых явлений, то есть структурные сдвиги. В изменении структуры общественных явлений отражаются важнейшие закономерности их развития. Показатель численности групп представлен либо частотой (количеством единиц в каждой группе), либо частотностью (удельным весом каждой группы). Среди простых группировок особо выделяют ряды распределения. Ряд распределения – это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака) применяется один показатель – численность группы. Другими словами, это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку. Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения. Ряды распределения, построенные вариационными рядами. по количественному признаку, называются Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д. Примером вариационного ряда распределения могут служит распределения населения по возрасту, рабочих – по стажу работы, заработной плате и т.д. Вариационные ряды распределения состоят их двух элементов вариантов и частот. Вариантами называются числовые значения количественного признака в ряду распределения, они могут быть положительными и отрицательными, абсолютными и относительными. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности. Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. 3.3. Статистические таблицы и графики Статистические таблицы являются средством наглядного выражения результатов исследования. Практикой выработаны определенные требования к составлению и оформлению таблиц. 1. Таблица по возможности должна быть краткой. 2. Каждая таблица должна иметь подробное название, из которого становится известно: а) какой круг вопросов излагает и иллюстрирует таблица; б) каковы географические границы представленной статистической совокупности; в) за какой период времени, которому они относятся; г) каковы единицы измерения (если они одинаковы для всех табличных клеток). Если единицы измерения неодинаковы, то в верхних или боковых заголовках обязательно следует указывать, в каких единицах приводятся статистические данные (тонн, штук, рублей и пр.). 3. Таблица может сопровождаться примечаниями, в которых указываются источники данных, более подробно раскрывается содержание показателей, даются и другие пояснения, а также оговорки в случае, если таблица содержит данные, полученные в результате вычислений. 4. При оформлении таблиц обычно применяются такие условные обозначения: знак тире (-) – когда явление отсутствует; х – если явление не имеет осмысленного содержания; многоточие (...) – когда отсутствуют сведения о его размере (или делается запись «Нет сведений»). Если сведения имеются, но числовое значение меньше принятой в таблице точности, оно выражается дробным числом (0,0). Округленные числа приводятся в таблице с одинаковой степенью точности (до 0,1; до 0,01 и т.п.). Если в таблице приводятся проценты роста, то во многих случаях целесообразно проценты от 300 и более заменять отношениями в разах. Например, писать не «1000 %», а «в 10,0 раз». Использование графиков для изложения статистических показателей позволяет придать последним наглядность и выразительность, облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и особенности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей. Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа. По содержанию или назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т.п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны и комбинации этих графиков, например графическое изображение вариации в динамике или динамики взаимосвязанных показателей и т.п. По способу построения графики можно разделить на диаграммы, картодиаграммы и картограммы. По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, почасовые, квадратные, круговые, секторные, фигурные) и объемные. Примером диаграммы служит рис. 3.2. Рис. 3.2. Запасы нефти в отдельных странах в 1987 г. Разновидностью столбиковой диаграммы является полосовая (ленточная) диаграмма, для которой характерны горизонтальная ориентация столбиков (полос) и вертикальное расположение базовой линии. Полосовая диаграмма особенно удобна в тех случаях, когда отдельные объекты сравнения характеризуются противоположными по знаку показателями (рис. 3.3). Рис. 3.3. Добыча нефти в отдельных странах в 1986 г. по сравнению с 1970 г. Квадратные и круговые диаграммы менее наглядны, чем столбиковые и полосовые, что связано с трудностью визуальной оценки соотношения площадей. Поэтому внутри квадратов и кругов следует проставлять величины изображаемых показателей (рис. 3.4). Еще меньшей наглядностью отличаются объемные диаграммы (например, в виде кубов), в которых лимитные размеры графического образа пропорциональны корням кубическим из сравниваемых величин. Рис. 3.4. Численность населения Китая и Канады, млн. чел. Основной формой структурных диаграмм являются секторные диаграммы (рис. 3.5). «Работающим» геометрическим параметром в секторной диаграмме удельных весов служит величина угла между радиусами: 1 % принимается на диаграмме равным 3,6°, а сумма всех углов, составляющая 360°, приравнивается к 100 %. Рис. 3.5. Структура активов коммерческого банка по степени риска. Для изображения экономических явлений, протекающих во времени, применяют динамические диаграммы. В отличие от диаграмм, отображающих сравнительные величины отдельных объектов или их структуры, в динамических диаграммах объектом отображения служат процессы. Геометрически адекватной формой их отражения являются линейные координатные диаграммы (рис. 3.6.). Рис. 3.6. Уровень средней цены приватизационных чеков на торгах РТСБ, руб. Рис. 3.7. Распределение квартир по числу проживающих в них. Для изображения вариационных рядов применяются линейные и плоскостные диаграммы, построенные в прямоугольной системе координат. При дискретной вариации признака графиком вариационного ряда служит полигон распределения (рис. 3.7.). Полигон распределения представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующегося признака, а ординатами – соответствующие им частоты. Лекция 4. Абсолютные и относительные статистические величины 4.1. Понятие абсолютной и относительной величины в статистике Изучая массовые общественные явления, статистика в своих выводах опирается на числовые данные, полученные в конкретных условиях места и времени. Результаты статистического наблюдения регистрируются прежде всего в форме первичных абсолютных величин. Так, основная масса народнохозяйственных абсолютных показателей фиксируется в первичных учетных документах. Абсолютная величина отражает уровень развития явления. В статистике все абсолютные величины являются именованными, измеряются в конкретных единицах и, в отличие от математического понятия абсолютной величины, могут быть как положительными, так и отрицательными (убытки, убыль, потери и т.п.). Натуральные единицы измерения могут быть простыми (тонны, штуки, метры, литры) и сложными, являющимися комбинацией нескольких разноименных величин (грузооборот железнодорожного транспорта выражается в тонно-километрах, производство электроэнергии – в киловатт-часах). В статистике применяют и абсолютные показатели, выраженные в условно-натуральных единицах измерения (например, различные виды топлива пересчитываются в условное топливо). Стоимостные единицы измерения используются, например, для выражения объема разнородной продукции в стоимостной (денежной) форме – рублях. При использовании стоимостных измерителей принимают во внимание изменения цен с течением времени. Этот недостаток стоимостных измерителей преодолевают применением "неизменных" или "сопоставимых" цен одного и того же периода. В трудовых единицах измерения (человеко-днях, человеко-часах) учитываются общие затраты труда на предприятии, трудоемкость отдельных операций. С точки зрения конкретного исследования совокупность абсолютных величин можно рассматривать как состоящую из показателей индивидуальных, характеризующих размер признака у отдельных единиц совокупности, и суммарных, характеризующих итоговое значение признака по определенной части совокупности. Поскольку абсолютные показатели – это основа всех форм учета и приемов количественного анализа, то следует разграничивать моментные и интервальные абсолютные величины. Первые показывают фактическое наличие или уровень явления на определенный момент, дату (например, наличие запасов материалов или оборотных средств, величина незавершенного производства, численность проживающих и т.д.). Вторые – итоговый накопленный результат за период в целом (объем произведенной продукции за месяц или год, прирост населения за определенный период, величина валового сбора зерна за год и за пятилетку и т.п.). Сама по себе абсолютная величина не дает полного представления об изучаемом явлении, не показывает его структуру, соотношение между отдельными частями, развитие во времени. В ней не выявлены соотношения с другими абсолютными показателями. Эти функции выполняют определяемые на основе абсолютных величин относительные показатели. Относительная величина в статистике – это обобщающий показатель, который дает числовую меру соотношения двух сопоставляемых абсолютных величин. Так как многие абсолютные величины взаимосвязаны, то и относительные величины одного типа в ряде случаев могут определяться через относительные величины другого типа. Основное условие правильного расчета относительной величины – сопоставимость сравниваемых показателей и наличие реальных связей между изучаемыми явлениями. Таким образом, по способу получения относительные показатели – всегда величины производные, определяемые в форме коэффициентов, процентов, промилле, продецимилле и т.п. Однако нужно помнить, что этим безразмерным по форме показателям может быть, в сущности, приписана конкретная, и иногда довольно сложная, единица измерения. Так, например, относительные показатели естественного движения населения, такие как коэффициенты рождаемости или смертности, исчисляемые в промилле (‰), показывают число родившихся или умерших за год в расчете на 1 000 человек среднегодовой численности; относительная величина эффективности использования рабочего времени – это количество продукции в расчете на один отработанный человеко-час и т.д. 4.2. Виды и взаимосвязи относительных величин Относительные величины образуют систему взаимосвязанных статистических показателей. По содержанию выражаемых количественных соотношений выделяют следующие типы относительных величин. 1. Относительная величина выполнения задания. Рассчитывается как отношение фактически достигнутого в данном периоде уровня к запланированному. Так, в 1988 г. было произведено стиральных машин 6103 тыс. шт. при плане (госзаказе) 6481 тыс. шт. Относительная величина выполнения плана составила . Следовательно, плановое задание было недовыполнено на 5,8 %. На практике различают две разновидности относительных показателей выполнения плана. В первом случае сравниваются фактические и плановые уровни (таков пример, рассмотренный выше). Во втором случае в плановом задании устанавливается абсолютная величина прироста или снижения показателя и соответственно проверяется степень выполнения плана по этой величине. Так, если планировалось снизить себестоимость единицы продукции на 24,2 руб., а фактическое снижение составило 27,5 руб., то плановое задание по снижению себестоимости выполнено с ростом в 27,5 : 24,2 = 1,136 раза, т.е. план перевыполнен на 13,6 %. Показатель выполнения плана по уровню себестоимости в данном случае будет меньше единицы. Если фактическая себестоимость изделия равнялась 805,8 руб. при плановой 809,1 руб., то величина выполнения плана составила 805,8 : 809,1 = 0,996, или 99,6 %. Фактический уровень затратив одно изделие оказался на 0,4 % ниже планового. В аналитических расчетах при исследовании взаимосвязей чаще применяется оценка выполнения плана по уровню показателя. Оценка же выполнения плана по изменению уровня обычно приводится для целей иллюстрации, особенно если планируется снижение абсолютного значения затрат, расходов по видам и т.п. Относительные величины динамики, планового задания и выполнения плана связаны соотношением i=iпл.з.× iвып.пл. 2. Относительная величина динамики. Характеризует изменение уровня развития какого-либо явления во времени. Получается в результате деления уровня признака в определенный период или момент времени на уровень этого же показателя в предшествующий период или момент. 3. Относительные величины структуры. Характеризуют доли, удельные веса составных элементов в общем итоге. Как правило, их получают в форме процентного содержания: Для аналитических расчетов предпочтительнее представление, без умножения на 100. использовать коэффициентное Совокупность относительных величин структуры показывает строение изучаемого явления. 5. Относительные величины координации (ОВК). Характеризуют отношение частей данной совокупности к одной из них, принятой за базу сравнения. ОВК показывают, во сколько раз одна часть совокупности больше другой либо сколько единиц одной части приходится на 1, 10, 100, 1000, ... единиц другой части. Относительные величины координации могут рассчитываться и по абсолютным показателям, и по показателям структуры. Так, приняв за базу сравнения поставки топливных ресурсов на экспорт в 1987 г., увидим, что на каждую условную тонну экспортных поставок приходится в 2,342 раза больше ресурсов, потребляемых внутри страны для производства энергии, и в 2,363 раза больше ресурсов, предназначенных для производственно-технологических целей. Уровень остатков на конец года составляет 57,8 % по сравнению с годовыми поставками на экспорт (9,20 : 15,91 = 242 : 418,3 = 0,578). По относительным величинам координации можно восстановить исходные относительные показатели структуры, если вычислить отношение относительной величины координации данной части (ОВК) к сумме всех ОВК (включая и ту, которая принята за базу сравнения): . Например, доля экспортных поставок составляет 1 : (2,342 + 2,364 + 1 + 0,578) = 0,1591, или 15,9 %. 6. Относительные величины сравнения (ОВС). Характеризуют сравнительные размеры одноименных абсолютных величин, относящихся к одному и тому же периоду либо моменту времени, но к различным объектам или территориям. Посредством этих показателей сопоставляются мощности различных видов оборудования, производительность труда отдельных рабочих, производство продукции данного вида разными предприятиями, районами, странами. Например, по производству нефти и газа в 1985 г. СССР превосходил США: по нефти – в 1,36 раза, по газу – в 1,24 раза. Уровень производства электроэнергии (млрд. кВт • ч) в СССР составлял от уровня США 1544:2650 = 0,583, или 58,3 %. При известных коэффициентах роста (индексах динамики) и начальном соотношении уровней можно найти условие равенства уровней в предстоящем периоде t: . Отсюда ОВСa / б =Ya / Yб=(ia / iб)t, т.е. . Найденное значение t показывает, через какой период времени уровень изучаемого явления на объекте А сравняется с уровнем того же явления на объекте Б. Сопоставляя показатели динамики разных явлений, получают еще один вид относительных величин сравнения – коэффициенты опережения (отставания) по темпам роста или прироста. Так, если производительность труда на предприятии возросла на 12%, а фонд оплаты труда увеличился на 7,5 %, то коэффициент опережения производительности труда по темпам роста составит 112 : 107,5 = 1,042; коэффициент опережения по темпам прироста равен 12 : 7,5 = 1,60. 7. Относительные величины интенсивности. Характеризуют степень распределения или развития данного явления в той или иной среде. Представляют собой отношение абсолютного уровня одного показателя, свойственного изучаемой среде, к другому абсолютному показателю, также присущему данной среде и, как правило, являющемуся для первого показателя факторным признаком. Так, при изучении демографических процессов рассчитываются показатели рождаемости, смертности, естественного прироста и т.д. как отношение числа родившихся (умерших) или величины прироста населения за год к среднегодовой численности населения данной территории в расчете на 1000 чел. Если получаемые значения очень малы, то делают расчет на 10 000 человек. Относительными величинами интенсивности выступают, например, показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, трудоемкости, эффективности использования производственных фондов и т.д., поскольку их получают сопоставлением разноименных величин, относящихся к одному и тому же явлению и одинаковому периоду или моменту времени. Метод расчета относительных величин интенсивности применяется при определении средних уровней (среднего уровня выработки, средних затрат труда, средней себестоимости изделий, средней цены и т.д.). Поэтому распространено мнение, что относительные величины интенсивности – это один из способов выражения средних величин. Лекция 5. Средние величины. Показатели вариации 5.1. Понятие средней величины Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности. Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности. Вычисление среднего – один из распространенных приемов обобщения; средний показатель выделяет то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей. Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов. Остановимся на некоторых общих принципах применения средних величин. 1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц. 2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц. 3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии. 4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя. 5.2. Виды средних и способы их вычисления Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние. К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая. В качестве структурных средних рассматриваются мода и медиана. Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид: , где Xi – варианта (значение) осредняемого признака; m – показатель степени средней; n – число вариант. Взвешенная средняя считается по сгруппированным данным и имеет общий вид , где Xi – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта; m – показатель степени средней; fi – частота, показывающая, сколько раз встречается i-e значение осредняемого признака. Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек: № п/п Возраст Возраст Возраст Возраст № п/п № п/п № п/п (лет) (лет) (лет) (лет) 1 2 3 4 5 18 18 19 20 19 6 7 8 9 10 20 19 19 19 20 11 12 13 14 15 22 19 19 20 20 16 17 18 19 20 21 19 19 19 19 Средний возраст рассчитаем по формуле простой средней: Сгруппируем исходные данные. Получим следующий ряд распределения: Возраст, Х лет 18 19 20 21 22 Всего Число студентов 2 11 5 1 1 20 В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней: Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних: средняя гармоническая, если m = -1; средняя геометрическая, если m –> 0; средняя арифметическая, если m = 1; средняя квадратическая, если m = 2; средняя кубическая, если m = 3. Формулы степенных средних приведены в табл. 4.4. Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина: В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные. Таблица 5.1 Виды степенных средних Вид степенной Показатель Формула расчета средней степени (m) Простая Взвешенная Гармоническая -1 Геометрическая 0 Арифметическая 1 Квадратическая 2 Кубическая 3 Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия. Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым [1] . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической. Формула средней геометрической используется чаще всего при расчете относительным величинам динамики. среднего значения по индивидуальным Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i1, i2, i3,..., in. Очевидно, что объем производства в последнем году определяется начальным его уровнем (q0) и последующим наращиванием по годам: qn=q0× i1× i2×...×in. Приняв qn в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению Отсюда 5.3. Структурные средние Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий). В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его. Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы: , где XMe – нижняя граница медианного интервала; hMe – его величина; (Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении); SMe-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала; mMe – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении). При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как , где ХMo – нижнее значение модального интервала; mMo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении); mMo-1 – то же для интервала, предшествующего модальному; mMo+1 – то же для интервала, следующего за модальным; h – величина интервала изменения признака в группах. 5.4. Показатели вариации Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления. Для измерения вариации в статистике применяют несколько способов. Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (Xmax ) и минимальным (Xmin) наблюдаемыми значениями признака: H=Xmax - Xmin. Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается. Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня: При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной: (Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.) Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии. Дисперсия признака (s2) определяется на основе квадратической степенной средней: . Показатель s, равный , называется средним квадратическим отклонением. В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов. Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле . Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий. Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле , где n – объем выборки; s2 – дисперсия признака, рассчитанная по данным выборки. Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения. Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%. 1. Коэффициентом осцилляции отражают относительную колеблемость крайних значений признака вокруг средней . 2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины . 3. Коэффициент вариации: является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными. Лекция 6. Изучение динамики общественных явлений 6.1. Ряды динамики. Классификация динамических рядов Ряд динамики, хронологический ряд, динамический ряд, временной ряд – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Всякий ряд динамики включает, следовательно, два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Ряды динамики различаются по следующим признакам. 1. По времени – моментные и интервальные ряды. Интервальный ряд динамики – последовательность, в которой уровень явления относится к результату, накопленному или вновь произведенному за определенный интервал времени. Таковы, например, ряды показателей объема продукции по месяцам года, количества отработанных человеко-дней по отдельным периодам и т.д. Если же уровень ряда показывает фактическое наличие изучаемого явления в конкретный момент времени, то совокупность уровней образует моментный ряд динамики. Примерами моментных рядов могут быть последовательности показателей численности населения на начало года, величины запаса какого-либо материала на начало периода и т.д. Важное аналитическое отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год, общие затраты рабочего времени, общий объем продаж акций и т.д., сумма же уровней моментного ряда, хотя иногда и подсчитывается, но реального содержания, как правило, не имеет. 2. По форме представления уровней – ряды абсолютных, относительных и средних величин (табл. 6.1 – 6.3). 3. По расстоянию между датами или интервалам времени выделяют полные и неполные хронологические ряды. Полные ряды динамики имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равноотстоящие ряды динамики (см. табл. 6.1 и 6.2). Неполные – когда принцип равных интервалов не соблюдается (см. табл. 6.3). Таблица 6.1 Объем продаж долларов США на ММВБ, млн. долл. Дата 10.01.94 11.01.94 12.01.94 13.01.94 Объем продаж 126,750 124,300 148,800 141,400 Таблица 6.2 Индекс инфляции в 1993 г. (на конец периода, в % к декабрю 1992 г.) Период Январь Февраль Март Апрель Май Июнь Индекс инфляции 126 162 190 221 264 310 Таблица 6.3 Потребление основных продуктов питания на одного члена семьи, кг/год Продукты 1980 1985 1990 1991 1992 1993 Мясо и мясопродукты 80,0 78,4 74,1 68,3 58,7 63,2 Молоко и молочные продукты 411,2 389,6 378,9 345,4 280,4 285,6 Хлебные продукты 101,2 91,6 85,7 91,8 98,0 105,81 Чтобы о развитии явления можно было получить представление при помощи числовых уровней, при составлении ряда динамики должны приводиться в сопоставительный вид. Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета. Сопоставимость по территории означает, что данные по странам и регионам, границы которых изменились, должны быть пересчитаны в старых пределах. Сопоставимость по кругу охватываемых объектов означает сравнение совокупностей с равным числом элементов. Территориальная и объемная сопоставимость обеспечивается смыканием рядов динамики, при этом либо абсолютные уровни заменяются относительными, либо делается пересчет в условные абсолютные уровни. Не возникает особых сложностей при обеспечении сопоставимости данных по единицам измерения; стоимостная сравнимость достигается системой сопоставимых цен. Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями. 6.2. Показатели анализа рядов динамики При изучении явления во времени перед исследователем встает проблема описания интенсивности изменения и расчета средних показателей динамики. Решается она путем построения соответствующих показателей. Для характеристики интенсивности изменения во времени такими показателями будут: 1) абсолютный прирост, 2) темпы роста, 3) темпы прироста, 4) абсолютное значение одного процента прироста. Расчет показателей динамики представлен в следующей таблице. Показатель Базисный Цепной Yi-Y0 Yi-Yi-1 Коэффициент роста (Кр) Yi : Y0 Yi : Yi-1 Темп роста (Тр) (Yi : Y0)×100 (Yi : Yi-1)×100 * Абсолютный прирост Коэффициент прироста (Кпр )** Темп прироста (Тпр) Абсолютное значение прироста (А) одного процента * ** В случае, когда сравнение проводится с периодом (моментом) времени, начальным в ряду динамики, получают базисные показатели. Если же сравнение производится с предыдущим периодом или моментом времени, то говорят о цепных показателях. Рассмотрим пример. Показатель Март Апрель Май Объем продаж, млн. руб. Абсолютный прирост: цепной, базисный Коэффицент (индекс) роста цепной Темп роста, %: цепной, базисный Темп прироста цепной, % базисный, % 709,98 1602,61 - Июнь Июль Август 651,83 220,80 327,68 277,12 892,63 892,63 -950,78 -58,15 -431,03 106,88 -50,56 -489,18 -382,3 -432,86 2,257 0,407 0,339 1,484 0,846 225,7 225,7 40,7 91,8 33,9 31,1 148,4 46,2 84,6 39,0 125,7 125,7 -59,3 -8,2 -66,1 -68,9 48,4 -53,8 -15,4 61,0 Абсолютное значение 1% прироста (цепной) 7,10 16,03 6,52 2,21 3,28 Система средних показателей динамики включает: средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста. Средний уровень ряда – это показатель, обобщающий итоги развития явления за единичный интервал или момент из имеющейся временной последовательности. Расчет среднего уровня ряда динамики определяется видом этого ряда и величиной интервала, соответствующего каждому уровню. Для интервальных рядов с равными периодами времени средний уровень Y рассчитывается следующим образом: где n или (n +1) – общая длина временного ряда или общее число равных временных отрезков, каждому из которых соответствует свой уровень Yi (1 = 1, 2, ..., n или 1 = 0, 1, 2, ..., n). Средний абсолютный прирост рассчитывается по формулам в зависимости от способа нумерации интервалов (моментов). . Средний темп роста: где – средний коэффициент роста, рассчитанный как – цепные коэффициенты роста; . Здесь Кцеп Средний темп прироста (%) определяется по единственной методологии: 6.3. Изучение тенденции развития Всякий ряд динамики теоретически может быть представлен в виде составляющих: 1) тренд – основная тенденция развития динамического ряда (к увеличению либо снижению его уровней); 2) циклические (периодические) колебания, в том числе сезонные; 3) случайные колебания. Изучение тренда включает два основных этапа: 1) ряд динамики проверяется на наличие тренда; 2) производится выравнивание временного ряда и непосредственное выделение тренда с экстраполяцией полученных результатов. Непосредственное выделение тренда может быть произведено тремя методами. 1. Укрупнение интервалов. Ряд динамики разделяют на некоторое достаточно большое число равных интервалов. Если средние уровни по интервалам не позволяют увидеть тенденцию развития явления, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (одновременно уменьшается количество интервалов). 2. Скользящая средняя. В этом методе исходные уровни ряда заменяются средними величинами, которые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Интервал может быть нечетным (3, 5, 7 и т.д. точек) или четным (2, 4, 6 и т.д. точек). При нечетном сглаживании полученное среднее арифметическое значение закрепляют за серединой расчетного интервала, при четном этого делать нельзя. Поэтому при обработке ряда четными интервалами их искусственно делают нечетными, для чего образуют ближайший больший нечетный интервал, но из крайних его уровней берут только 50 %. Недостаток методики сглаживания скользящими средними состоит в условности определения сглаженных уровней для точек в начале и конце ряда. Получают их специальными приемами – расчетом средней арифметической взвешенной. 3. Аналитическое выравнивание. Под этим понимают определение основной проявляющейся во времени тенденции развития изучаемого явления. Развитие предстает перед исследователем как бы в зависимости только от течения времени. В итоге выравнивания временного ряда получают наиболее общий, суммарный, проявляющийся во времени результат действия всех причинных факторов. Отклонение конкретных уровней ряда от уровней, соответствующих общей тенденции, объясняют действием факторов, проявляющихся случайно или циклически. В результате приходят к трендовой модели где f(t) – уровень, определяемый тенденцией развития; et – случайное и циклическое отклонение от тенденции. Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t). На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t), а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса. Чаще всего при выравнивании используются следующие зависимости: Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению. Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют. Экспоненциальные зависимости применяются, если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост (устойчивость цепных темпов роста, темпов прироста, коэффициентов роста), либо, при отсутствии такого постоянства, – устойчивость в изменении показателей относительного роста (цепных темпов роста цепных же темпов роста, цепных коэффициентов роста цепных же коэффициентов или темпов роста и т.п.). Оценка параметров (a0, a1, a2, ...) осуществляется следующими методами: 1) методом избранных точек, 2) методом наименьших расстояний, 3) методом наименьших квадратов (МНК). В большинстве расчетов используют метод наименьших квадратов, который обеспечивает наименьшую сумму квадратов отклонений фактических уровней от выравненных: Для линейной зависимости (f(t)=a0+a1t) параметр а0 обычно интерпретации не имеет, но иногда его рассматривают как обобщенный начальный уровень ряда; а1 – сила связи, т.е. параметр, показывающий, насколько изменится результат при изменении времени на единицу. Таким образом, а можно представить как постоянный теоретический абсолютный прирост. Построив уравнение регрессии, проводят оценку его надежности. Это делается посредством критерия Фишера (F). Фактический уровень (Fфакт) сравнивается с теоретическим (табличным) значением: где k – число n – число уровней ряда; параметров функции, описывающей тенденцию; Fфакт сравнивается с Fтеор при v1 = (k-1), v2 = (n-k) степенях свободы и уровне значимости a (обычно a = 0,05). Если Fфакт > Fтеор, уравнение регрессии значимо, т.е. построенная модель адекватна фактической временной тенденции. Выравнивание проведено по линейной трендовой модели. Оценка параметров уравнения выполнена методом наименьших квадратов. Таким образом, f(t) = уt = 10,128-0,073t для t= -13, -11, -9, ..., +13, или f(t) = уt = 11,0770,1461 для t = 0, 1, ..., 13. Параметры последнего уравнения регрессии можно интерпретировать следующим образом: a0 = 11,077 – это исходный уровень брачности по России за период до 1977 г.; а1 = -0,146 – показатель силы связи, т.е. в России за период с 1977 по 1990 г. происходило снижение уровня брачности на 0,146 ‰ ежегодно. В качестве примера рассмотрим число зарегистрированных браков на 1000 жителей России за период с 1977 по 1990 г.: Год Число зарегистриt рованных браков, % 1977 11,2 -13 -145,6 169 11,077 1978 10,9 -11 -119,9 121 10,931 1979 10,7 -9 -96,3 81 10,785 1980 10,6 -7 -74,2 49 10,639 1981 10,6 -5 -53,2 25 10,493 1982 10,4 -3 -31,2 9 10,347 1983 10,4 -1 -10,4 1 10,202 1984 9,6 1 9,6 1 10,056 1985 9,7 3 29,1 9 9,910 1986 9,8 5 49,0 25 9,764 1987 9,9 7 69,3 49 9,618 1988 9,5 9 85,5 81 9,472 1989 9,4 11 103,4 121 9,326 1990 9,1 13 118,3 169 9,180 у×t t2 f(t) Итого 141,8 -66,4 910 141,800 Следующий шаг аналитического выравнивания – оценка надежности уравнения регрессии: Таким образом, Fтеор = 4,747; a = 0,05; v1 (k-1) = 1; v2 = (n-k) = 12 и Fтеор = 9,330 при a = 0,01, v1 = 1, v2 = 12. Fфакт > Fтеор, и уравнение прямой адекватно отражает сложившуюся в исследуемом ряду динамики тенденцию. Лекция 7. Индексы 7.1. Индивидуальные индексы и их применение в экономическом анализе Индекс – это относительная величина, показывающая, во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. Различие условий может проявляться во времени (тогда говорят об индексах динамики), в пространстве (территориальные индексы), в выборе в качестве базы сравнения какоголибо условного уровня, например планового показателя, уровня договорных обязательств и т.п. Соответственно вводят индекс выполнения обязательств или, если плановый уровень сравнивается с уровнем предыдущего периода, – индекс планового задания. В экономическом анализе индексы используются не только для сопоставления уровней изучаемого явления, но главным образом для определения экономической значимости причин, объясняющих абсолютное различие сравниваемых уровней. Относительная величина, получаемая при сравнении уровней, называется индивидуальным индексом, если исследователь не интересуется структурой изучаемого явления и количественную оценку уровня в данных условиях сравнивает с такой же конкретной величиной уровня этого явления в других условиях. Так, уровень товарооборота в виде суммы выручки от продажи товара в условиях отчетного года Q1 сравнивается с аналогичной суммой выручки базисного года Q0. В итоге получаем индивидуальный индекс товарооборота iQ=Q1 / Q0. Аналогичные индивидуальные индексы можно рассчитать и для любого интересующего нас показателя. В частности, поскольку сумма выручки определяется ценой товара (р) и количеством продаж в натуральном измерении (q), можно определить индивидуальные индексы цены ip и количества проданных товаров – iq : С аналитической точки зрения iq показывает, во сколько раз увеличилась (или уменьшилась) общая сумма выручки под влиянием изменения объема продажи в натуральных единицах. Аналогично ip показывает, во сколько раз изменилась общая сумма выручки под влиянием изменения цены товара. Очевидно, что Вторая формула представляет двухфакторную индексную мультипликативную модель итогового показателя, в данном случае – объема товарооборота. Посредством такой модели находят прирост итога под влиянием каждого фактора в отдельности. Так, если выручка от продажи некоторого товара возросла с 8 млн. руб. в предыдущем периоде до 12,180 млн. руб. в последующем и известно, что это объясняется увеличением количества проданного товара на 5 % при цене на 45 % большей, чем в предыдущем периоде, то можно записать следующее соотношение: 12,180 = 8 × 1,05 × 1,45 (млн. руб.). Очевидно, что общий прирост выручки в сумме 12,180-8 = 4,180 млн. руб. объясняется изменением объема продажи и цены. Прирост выручки за счет изменения объема продажи (в натуральном выражении) составит или в нашем примере Тогда за счет изменения цены данного товара сумма выручки изменилась на или Очевидно, что общий прирост товарооборота складывается из приростов, объясняемых каждым фактором в отдельности, т.е. или Можно заметить, что существует и другой способ распределения общего прироста по факторам в двухфакторной индексной мультипликативной модели, а именно: В нашем примере общий прирост выручки (4,18 млн. руб.) объясняется теперь: изменением цены изменением объема продажи Выбор конкретной формы разложения общего прироста итога должен определяться конкретными условиями развития изучаемого показателя, в данном случае – конъюнктурой спроса-предложения. В экономической практике и большинстве научных рекомендаций в настоящее время преобладает первое направление, когда сначала выясняют вклад в общий прирост количественного фактора при базисном уровне качественного признака (цен), а затем – вклад качественного фактора (цены) в расчете на отчетный уровень количественного показателя (объема – q). 7.2. Общие индексы и их применение в анализе Если известно, что изучаемое явление неоднородно и сравнение уровней можно провести только после приведения их к общей мере, экономический анализ выполняют посредством так называемых общих индексов. Индекс становится общим, когда в расчетной формуле показывается неоднородность изучаемой совокупности. Примером неоднородной совокупности является общая масса проданных товаров всех или нескольких видов. Тогда сумму выручки можно записать в виде агрегата (суммы произведений взвешивающего показателя на объемный), например: Отношение агрегатов, построенных для разных условий, дает общий индекс показателя в агрегатной форме. Так, например, получают индекс общего объема товарооборота в агрегатной форме: При анализе прироста общего объема товарооборота этот прирост также объясняется изменением уровня цен и количества проданных товаров. Влияние на прирост товарооборота общего изменения цен выражается агрегатным индексом цен Ip, который в предположении первичности изменения количественного показателя (q) и вторичности – качественного (р) имеет вид Влияние на прирост товарооборота изменения количества проданных товаров отражается агрегатным индексом физического объема Iq , который строится также в предположении первичности изменения количественных показателей (q) и вторичности влияния качественных (р): В форме мультипликативной индексной модели динамика товарооборота будет выражаться соотношениями где Если принимается предположение об очередности влияния факторов – сначала q, а затем р, то общий прирост товарооборота будет распределяться по факторам следующим образом: Если же принимается предположение об обратной последовательности влияния факторов – сначала р, затем q, то меняются и формулы разложения прироста и формулы расчета индексов Iq и Ip . Тогда где Примером мультипликативной индексной модели с большим числом факторов является изменение общей суммы материальных затрат на производство продукции. Сумма затрат зависит от количества выпущенной продукции (индекс Iq), удельных расходов (норм) материала на единицу продукции (индекс In) и цены на материалы (индекс Ip). Прирост общей суммы затрат распределяется следующим образом: где а величины индексов таковы: индекс увеличения суммы затрат в связи с изменением объемов производства продукции (индекс физического объема) индекс изменения суммы затрат за счет изменения удельных расходов материала (индекс удельных расходов) индекс изменения общей суммы затрат, объясняемого изменением цен на материалы (индекс цен на материалы) Приведем формулы расчета некоторых наиболее употребительных агрегатных индексов. Индекс изменения общей суммы затрат на производство продукции в зависимости от объема производства (q) и затрат на единицу (z): Индекс изменения общего фонда оплаты труда в связи с изменением общей численности работающих (Т) и заработной платы (f): Индекс изменения объема продукции в связи с изменением численности работающих (Т) и уровня их выработки (w): Индекс изменения объема продукции в связи с изменением объема основных производственных фондов (Ф) и показателя эффективности их использования – фондоотдачи (Н): Аналогичным образом находят общие агрегатные индексы и по многим другим экономическим показателям. Нетрудно заметить, что используемые в приведенных формулах индексы Iq, IТ, Iф получаются по методу индекса физического объема, а индексы Iz, If, IW, IH – по методу индекса цен. Таким образом, рассмотренная выше методика распределения общего прироста товарооборота полностью приложима к анализу прироста продукции, изменения общих затрат на производство, изменения общего фонда оплаты труда и т.д. 7.3. Индексы при анализе структурных изменений Индексы, которые рассчитываются по типу индексов физического объема, применимы при изучении совокупностей, состоящих как из разных объектов, так и из объектов одного и того же типа. Если совокупность неоднородна (например, совокупность товаров различного вида), то индекс физического объема – единственный способ показать динамику такой массы различных предметов, выражая ее через взвешивающий множитель (цену, себестоимость, трудоемкость). Если же совокупность состоит из объектов одного типа, то динамику этой массы можно показать непосредственно, сравнивая общее количество таких предметов в отчетном периоде с аналогичной величиной в базисном. Таким образом, для однородных совокупностей (допускающих суммирование по количественному признаку) индекс физического объема есть произведение индекса суммарной численности совокупности на индекс изменения структуры. Формула индекса структурных изменений может быть такова: где d0 – удельные веса, например доли предприятий в общей численности работающих в базисном периоде, a d1 – удельные веса или доли каждого предприятия в общей численности работающих в отчетном периоде: Знаменатель в формуле индекса структурных изменений есть не что иное. как средний уровень (выработки по группе предприятий) в базисном периоде, так как Экономическая сущность индекса структурных изменений состоит в том, что он показывает, во сколько раз изменился общий средний уровень только за счет изменения удельного веса каждого объекта в общем объеме количественного признака. В той же мере индекс структурных изменений показывает влияние процессов перераспределения на общий прирост итогового показателя. В итоге в форме мультипликативной индексной модели можно записать: Общий прирост продукции состоит, следовательно, из трех частей: 1) прирост за счет изменения общей численности работающих 2) прирост за счет перераспределения работающих 3) прирост за счет изменения уровня производительности труда на предприятиях Вклад разных факторов в общий прирост можно распределить по отдельным объектам, для каждого из которых применяют мультипликативную индексную модель где q0, q1, – объемы итогового признака (продукции) по данному объекту (предприятию); I sum T – общий для всей совокупности индекс количественного признака (индекс числа работающих); iW – индивидуальный для данного объекта индекс изменения уровня качественного признака (индивидуальный индекс производительности труда для данного предприятия); id – индивидуальный индекс доли данного объекта в общем объеме количественного признака (индивидуальный индекс доли данного предприятия в общей численности работающих). Индивидуальный индекс доли можно определить и по первичным данным, сопоставляя удельные веса за отчетный и базисный периоды, и более простым способом. Действительно, В условиях численного примера окончательное распределение общего прироста продукции по факторам и предприятиям может выглядеть следующим образом: Общий прирост Предприятие продукции, тыс. руб. В том числе за счет 1 2 445,0 -10,8 78,08 91,77 64,92 -270,57 302,0 168,0 Итого 434,2 169,85 -205,65 470,0 изменения изменения изменения числа удельного веса в производительности работающих общей численности труда Лекция 8. Статистическое изучение взаимосвязей 8.1. Основные понятия корреляционного и регрессионного анализа Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики. Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции. Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции. Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности. По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными. Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно. Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной. Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна. По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей. В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др. Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие. Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной. Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей. Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования. Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными. Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений. 8.2. Парная корреляция и парная линейная регрессия Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы: \ Y \ Y1 X \ Y2 X1 f11 12 ... f1z X1 f21 22 ... f2z ... ... ... ... ... Xr fk1 k2 ... fkz Итого ... Yz ... ... Итого Yi ... ... n - В основу группировки положены два изучаемых во взаимосвязи признака – Х и У. Частоты fij показывают количество соответствующих сочетаний Х и У. Если fij расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания fij допустимо утверждать о связи между Х и У. При этом, если fij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь. Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи. В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по У. Рассчитаем для каждого Хi среднее значение У, т.е. , как Последовательность точек (Xi, ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X. По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов. Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета. Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже. Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель где n – число наблюдений; а0, а1 – неизвестные параметры уравнения; ei – ошибка случайной переменной У. Уравнение регрессии записывается как где Уiтеор – рассчитанное выравненное значение результативного признака после подстановки в уравнение X. Параметры а0 и а1 оцениваются с помощью процедур, наибольшее распространение из которых получил метод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ag и а, получают, когда т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а0 и а1. Ее минимизация осуществляется решением системы уравнений Можно воспользоваться и другими формулами, вытекающими из метода наименьших квадратов, например: Аппарат линейной регрессии достаточно хорошо разработан и, как правило, имеется в наборе стандартных программ оценки взаимосвязи для ЭВМ. Важен смысл параметров: а1 – это коэффициент регрессии, характеризующий влияние, которое оказывает изменение Х на У. Он показывает, на сколько единиц в среднем изменится У при изменении Х на одну единицу. Если а, больше 0. то наблюдается положительная связь. Если а имеет отрицательное значение, то увеличение Х на единицу влечет за собой уменьшение У в среднем на а1. Параметр а1 обладает размерностью отношения У к X. Параметр a0 – это постоянная величина в уравнении регрессии. На наш взгляд, экономического смысла он не имеет, но в ряде случаев его интерпретируют как начальное значение У. Например, по данным о стоимости оборудования Х и производительности труда У методом наименьших квадратов получено уравнение У = -12,14 + 2,08Х. Коэффициент а, означает, что увеличение стоимости оборудования на 1 млн руб. ведет в среднем к росту производительности труда на 2.08 тыс. руб. Значение функции У = a0 + а1Х называется расчетным значением и на графике образует теоретическую линию регрессии. Смысл теоретической регрессии в том, что это оценка среднего значения переменной У для заданного значения X. Парная корреляция или парная регрессия могут рассматриваться как частный случай отражения связи некоторой зависимой переменной, с одной стороны, и одной из множества независимых переменных – с другой. Когда же требуется охарактеризовать связь всего указанного множества независимых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии. 8.3. Оценка значимости параметров взаимосвязи Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи. Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции: В первом приближении нужно, чтобы сопоставлением с . Значимость rxy проверяется его , при этом получают где tрасч – так называемое расчетное значение t-критерия. Если tрасч больше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что rxy значимо. Подобным же образом на основе соответствующих формул рассчитывают стандартные ошибки параметров уравнения регрессии, а затем и t-критерии для каждого параметра. Важно опять-таки проверить, чтобы соблюдалось условие tрасч > tтабл. В противном случае доверять полученной оценке параметра нет оснований. Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение: где n – m – число параметров уравнения регрессии. число наблюдений; Fрасч также должно быть больше Fтеор при v1 = (m-1) и v2 = (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д. 8.4. Непараметрические методы оценки связи Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов. Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических. Если изучается взаимосвязь двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Они вычисляются по следующей вспомогательной таблице: a c a+c b d b+d a+b c+d a+b+c+d Коэффициент ассоциации: Ка  ad  bc . ad  bc Коэффициент контингенции: Кk  ad  bc . a  b   b  d   a  c   c  d  Связь считается подтвержденной, если K a  0,5 или К k  0,3 . Если каждый из качественных признаков состоит более чем из двух групп, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности. Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей. Число детей, занятых в Занятия родителей Промышленсфере сфере интел- Всего ности и сельском обслужи- лектуального строхозяйстве вания труда ительстве 1. Промышленность и строительство 2. Сельское хозяйство 3. Сфера обслуживания 4. Сфера интеллектульного труда 40 34 16 24 5 29 6 5 7 13 15 9 39 12 19 72 91 88 56 110 Всего 114 45 44 142 345 Распределение частот по строкам и столбцам таблицы взаимной сопряженности позволяет выявить основные закономерности социальной мобильности: 42,9 % детей родителей группы 1 («Промышленность и строительство») заняты в сфере интеллектуального труда (39 из 91); 38,9 % детей. родители которых трудятся в сельском хозяйстве, работают в промышленности (34 из 88) и т.д. Можно заметить и явную наследственность в передаче профессий. Так, из пришедших в сельское хозяйство 29 человек, или 64,4 %, являются детьми работников сельского хозяйства; более чем у 50 % в сфере интеллектуального труда родители относятся к той же социальной группе и т.д. Однако важно получить обобщающий показатель, характеризующий тесноту связи между признаками и позволяющий сравнить проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К): где f2 – показатель средней квадратической сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки: К1 и К2 – число групп по каждому из признаков. Величина коэффициента взаимной сопряженности, отражающая тесноту связи между качественными признаками, колеблется в обычных для этих показателей пределах от 0 до 1. В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. Примерами могут быть ранжирование студентов (учеников) по способностям, любой совокупности людей по уровню образования, профессии, по способности к творчеству и т.д. При ранжировании каждой единице совокупности присваивается ранг, т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный (5 + 6) / 2 = 5,5. Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмена (r) и Кендэлла (t). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака. Библиографический список Основная литература 1. Годин А.М. Статистика (11-е издание) [Электронный ресурс]: учебник для бакалавров/ Годин А.М.— Электрон. текстовые данные.— М.: Дашков и К, 2014.— 412 c.— Режим доступа: http://www.iprbookshop.ru/24816.— ЭБС «IPRbooks», по паролю 2. Лосева О.В. Общая теория статистики для бакалавров экономики и менеджмента [Электронный ресурс]: учебное пособие/ Лосева О.В., Буданов К.М.— Электрон. текстовые данные.— Саратов: Вузовское образование, 2014.— 94 c.— Режим доступа: http://www.iprbookshop.ru/19527.— ЭБС «IPRbooks», по паролю 3. Улитина Е.В. Статистика [Электронный ресурс]: учебное пособие/ Улитина Е.В., Леднева О.В., Жирнова О.Л.— Электрон. текстовые данные.— М.: Московский финансово-промышленный университет «Синергия», 2013.— 320 c.— Режим доступа: http://www.iprbookshop.ru/17045.— ЭБС «IPRbooks», по паролю Дополнительная литература 1. Мхитарян, В. C. Теория вероятностей и математическая статистика: учебник для вузов / В. C. Мхитарян, В. Ф. Шишов, А. Ю. Козлов. — Москва : Академия, 2012 .— 413 с. : ил. — (Высшее профессиональное образование. Естественные науки) (Бакалавриат). — Библиогр. в конце кн. — ISBN 978-57695-8147-2 (в пер.).Статистика: учебник / под ред. И. И. Елисеевой. — Москва: Проспект, 2013. — 444 с. — Дар Изд-ва "Проспект" ТулГУ: 1341984 .— ISBN 978-5-392-07421-1. 2. Теория статистики [Электронный ресурс]: учебник/ Р.А. Шмойлова [и др.]. — Электрон. текстовые данные. — М.: Финансы и статистика, 2014. — 656 c.— Режим доступа: http://www.iprbookshop.ru/18846. — ЭБС «IPRbooks», по паролю Периодические издания 1. Экономическая наука современной России. 2. Экономист. Интернет-ресурсы 1. http://www.iprbookshop.ru 2. http://library.tsu.tula.ru/ellibraries/all_news.htm) 3. www.gks.ru / Федеральная служба государственной статистики/ 4. www.minfin.ru / Министерство финансов РФ 5.www.minpromtorg.gov.ru / Министерство промышленности и торговли РФ/ 6. www.rbc.ru / РосБизнесКонсалтинг/
«Предмет, метод и основные категории статистики как науки» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти

Тебе могут подойти лекции

Смотреть все 270 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot