Предмет и метод статистики
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Преподаватель: Пуляшкин Владимир Васильевич
СТАТИСТИКА
«01» октября 2007 г.
ТЕМА 1.: Предмет и метод статистики
• Вопрос 1. Предмет общей теории статистики;
• Вопрос 2. Стадии и методы статистического исследования;
• Вопрос 3. Задачи общей теории статистики;
Вопрос 1. Предмет общей теории статистики
Изначально термин «статистика» (происходит от лат. status – состояние, положение вещей) употреблялся в значении «политическое состояние» (отсюда итал. stato – государство и statista – знаток государства). В научную литературу этот термин вошел в XVIII в. и вначале понимался как «государствоведение». Статистическая же наука возникла еще раньше, в середине XVII в., в ответ на потребность государства иметь сводные, обобщенные по странам данные о наличии ресурсов для ведения производства, торговли, организации межгосударственных отношений и т. д. В этот период статистика называлась «политическая арифметика». Это была наука, в которой сочетались начала политической экономии и статистики. Ее родоначальником был английский ученый У. Петти. В первой половине XIX в. А. Кетле и его последователи в своих работах сделали попытку представить статистику как науку о закономерностях общественных явлений. Однако такие закономерности рассматривались метафизически. Законы общества отождествлялись с законами природы («социальная физика» А. Кетле). Затем в статистике получила распространение формалистическая трактовка предмета статистической науки, сводящая его к количественным отношениям в отрыве от качественного содержания явлений.
Большой вклад в статистическую науку и практику внесли русские ученые и общественные деятели. В трудах М. В. Ломоносова, И. К. Кирилова, В. Н. Татищева, а позднее и К. И. Арсеньева получили развитие идеи комплексного экономико-статистического описания страны. А. Н. Радищев сформулировал ценные предложения в области судебной статистики. В работах Д. П. Журавского показана роль группировок в статистике, предложена система статистических показателей для изучения общественной жизни. История статистики изложена в работах Ю. Э. Янсона. П. Л. Чебышев и его ученики сформулировали математическую базу для научно обоснованного применения выборочного метода. А. А. Чупров занимался методами установления зависимости между явлениями, разрабатывал теоретические основы математической статистики.
Значительный вклад в развитие статистики внесли В. И. Хотимский, B. C. Немчинов, С. Г. Струмилин, В. Н. Старовский, Б. С. Ястремский, А. Я. Боярский, П. П. Маслов, B. C. Новиков, Л. В. Некраш, В. Е. Овсиенко, В. Е. Адамов, Т. В. Рябушкин, И. С. Пасхавер, М. В. Птуха, Я. И. Лукомский и другие видные ученые.
Общая теория статистики – общественная наука, изучающая количественную сторону общественных явлений и процессов в неразрывной связи с качественной стороной, количественное выражение закономерностей общественного развития. Статистика изучает также влияние природных и технических факторов на количественные отношения общественной жизни, влияние организации производства на природные условия жизни общества.
Вопрос 2. Стадии и методы статистического исследования
Статистическое исследование количественной стороны общественных явлений проходит 3 стадии.
1. с помощью проведения статистического наблюдения собирают стат. данные.
2. собранные данные подвергаются сводке и группировке. Важнейшим методом на второй стадии статистической сводки является метод группировок, позволяющий выделить однородные совокупности, разделить их на группы и подгруппы. На этой стадии переходят от описания отдельных единиц к описанию их групп и объекта в целом посредством подсчета итогов, вычисления обобщающих показателей в виде относительных средних величин.
3. анализ и обобщение статистических фактов и обнаружение закономерностей в изучаемых явлениях. Здесь применяется весь арсенал статистических методов – ряды динамики, индексы, методы математической статистики и т. д. Выводы и анализ излагаются в текстовой форме и сопровождаются графиками и таблицами.
Вопрос 3. Задачи общей теории статистики
Произошедшие в последнее время в России коренные изменения в общественно-экономической и социальной жизни общества, переход на рыночные отношения вызвали потребность в значительном совершенствовании социально-экономической статистики и общей теории статистики. В частности, в комплексном пересмотре всей системы учета и статистики в стране, необходимость расширения возможности получения точной, объективной и аналитической информации о состоянии и развитии социально-экономических процессов для принятия решения на всех уровнях управления.
Большое значение для быстрейшего решения этой задачи имеют Указ Президента РФ от 9 марта 2004 г. № 314 «О системе и структуре федеральных органов исполнительной власти» и постановления Правительства от 7 апреля 2004 г. № 188 «Вопросы Федеральной службы государственной статистики» и от 30 июля 2004 г. № 399 «Об утверждении Положения о Федеральной службе государственной статистики».
В постановлении Правительства РФ от 30 июля 2004 г. отмечается, что Федеральная служба государственной статистики (далее – Служба) осуществляет следующие полномочия в установленной сфере деятельности:
1. вносит в Правительство РФ проекты федеральных законов, нормативных правовых актов Президента РФ и Правительства РФ и другие документы, по которым требуется решение Правительства РФ, а также проект ежегодного плана работы и прогнозные показатели деятельности Службы;
2. на основании и во исполнение Конституции Российской Федерации, федеральных конституционных законов, федеральных законов, актов Президента РФ и Правительства РФ самостоятельно принимает нормативные правовые акты по вопросам в установленной сфере деятельности, за исключением вопросов, правовое регулирование которых в соответствии с Конституцией РФ и федеральными конституционными законами, федеральными законами, актами Президента РФ и Правительства РФ осуществляется исключительно федеральными конституционными законами, федеральными законами, нормативными правовыми актами Президента РФ и Правительства РФ;
3. представляет официальную статистическую информацию Президенту РФ, Правительству РФ, Федеральному Собранию Российской Федерации, иным органам государственной власти, органам местного самоуправления, средствам массовой информации, организациям и гражданам, а также международным организациям;
4. разрабатывает официальную статистическую методологию для проведения статистических наблюдений и формирования статистических показателей, в пределах своей компетенции обеспечивает соответствие указанной методологии международным стандартам;
5. осуществляет подготовку, проведение и подведение итогов Всероссийской переписи населения, а также ее методологическое обеспечение;
6. осуществляет подготовку, проведение и методологическое обеспечение статистических обследований;
7. обеспечивает заинтересованных пользователей данными бухгалтерской отчетности юридических лиц, осуществляющих свою деятельность на территории Российской Федерации;
8. организует деятельность федеральных органов исполнительной власти по формированию государственных информационных ресурсов в области государственной статистики;
9. разрабатывает и ведет общероссийские классификаторы технико-экономической и социальной информации;
10. проводит конкурсы и заключает государственные контракты на размещение заказов на поставку товаров, выполнение работ и оказание услуг для нужд Службы, а также на проведение научно-исследовательских работ для государственных нужд;
11. обобщает практику применения законодательства Российской Федерации в установленной сфере деятельности;
12. осуществляет функции главного распорядителя и получателя средств федерального бюджета, предусмотренных на содержание Службы и реализацию возложенных на Службу функций;
13. организует прием граждан, обеспечивает своевременное и полное рассмотрение устных и письменных обращений граждан, принятие по ним решений и направление ответов заявителям в предусмотренный законодательством Российской Федерации срок;
14. обеспечивает в пределах своей компетенции защиту сведений, составляющих государственную тайну;
15. обеспечивает в пределах своей компетенции соответствующий режим хранения и защиты полученной в процессе деятельности Службы информации, составляющей служебную, банковскую, налоговую, коммерческую тайну, и иной конфиденциальной информации;
16. обеспечивает мобилизационную подготовку Службы, а также контроль и координацию деятельности подведомственных организаций по их мобилизационной подготовке;
17. организует профессиональную подготовку работников Службы, их переподготовку, повышение квалификации и стажировку;
18. взаимодействует с соответствующими органами государственной власти иностранных государств и международными организациями;
19. ведет в соответствии с законодательством Российской Федерации работу по комплектованию, хранению, учету и использованию архивных документов, образовавшихся в процессе деятельности Службы;
20. осуществляет иные полномочия, если такие полномочия предусмотрены федеральными законами, нормативными правовыми актами Президента РФ или Правительства РФ.
С целью реализации полномочий в установленной сфере деятельности Федеральная служба государственной статистики имеет право:
1. запрашивать и получать сведения, необходимые для принятия решений по вопросам, отнесенным к компетенции Службы;
2. заказывать проведение необх. исследований, испытаний, анализа и оценок, а также научных исследований по вопросам надзора в установленной сфере деятельности;
3. давать юридическим и физическим лицам разъяснения по вопросам, отнесенным к компетенции Службы;
4. осуществлять контроль над деятельностью территориальных органов Службы и подведомственных организаций;
5. привлекать для проработки вопросов в установленной сфере деятельности научные и иные организации, ученых и специалистов;
6. применять предусмотренные законодательством Российской Федерации меры ограничительного, предупредительного и профилактического характера, направленные на недопущение и (или) пресечение нарушений юридическими лицами и гражданами обязательных требований в установленной сфере деятельности, а также меры по ликвидации последствий указанных нарушений;
7. создавать координационные, совещательные и экспертные органы (советы, комиссии, группы, коллегии), в том числе межведомственные;
8. учреждать знаки отличия и награждать ими граждан за высокие достижения в установленной сфере деятельности.
ТЕМА 2.: Статистическое наблюдение
• Вопрос 1. Программно-методологические вопросы статистического наблюдения;
• Вопрос 2. Основные организационные формы, виды и способы статистического наблюдения;
Вопрос 1. Программно-методологические вопросы статистического наблюдения
Статистическое наблюдение является первым этапом статистического исследования и представляет собой массовое, планомерное, научно организованное наблюдение за явлениями социальной и экономической жизни, заключающееся в регистрации отобранных признаков у каждой единицы совокупности.
Процесс статистического наблюдения включает в себя следующие этапы:
1. подготовка наблюдения;
2. массовый сбор данных;
3. подготовка данных к автоматизированной обработке;
4. контроль качества получаемых данных;
5. разработка предложений по совершенствованию статистического наблюдения.
Примерами статистического наблюдения могут служить переписи населения, сельскохозяйственные переписи, бюджетные обследования хозяйств населения, опросы общественного мнения.
Подготовка статистич. наблюдения включает в себя различные виды работ.
Сначала необходимо решить методологические вопросы:
1. определение цели и объекта наблюдения, состава признаков, подлежащих регистрации;
2. разработка документов для сбора данных;
3. выбор отчетной единицы;
4. выбор методов и средств получения данных.
Затем следует решить организационные вопросы:
1. определение органов, проводящих наблюдение, и их состава;
2. подбор и подготовка кадров для проведения наблюдения;
3. составление календарного плана работ по подготовке, проведению и обработке материалов наблюдения;
4. тиражирование документов для сбора данных;
5. определение источников финансирования работ.
Массовый сбор данных заключается в выполнении работ, непосредственно связанных с заполнением статистических формуляров. Он начинается с рассылки переписных листов, анкет, бланков, форм статистической отчетности и заканчивается их сдачей после заполнения в органы, проводящие наблюдение.
Собранные данные подвергаются арифметическому и логическому контролю. Оба вида контроля основываются на знании взаимосвязей между показателями и качественными признаками.
На заключительном этапе наблюдения анализируются причины, которые привели к неверному заполнению статистических бланков, и разрабатываются предложения по совершенствованию наблюдения в будущем.
Цель наблюдения – получение достоверной информации для обнаружения закономерностей развития явлений и процессов. Например, целью Всероссийской переписи населения 2002 г. было получение данных о численности, размещении, составе населения (по различным признакам), а также условиях его проживания, необходимых для планирования и управления экономической и социальной жизнью страны. Цель и задачи наблюдения предопределяют его программу и формы организации.
Объект наблюдения – статистическая совокупность, в которой протекают исследуемые социально-экономические явления и процессы. Объектами наблюдения могут быть совокупность физических лиц (население страны, отдельного региона; лица, занятые на предприятиях отрасли), юридические лица (предприятия, коммерческие банки, фермерские хозяйства, учебные заведения), физические единицы (машины, оборудование, жилые дома).
Единица наблюдения – составной элемент объекта, являющийся носителем признаков, подлежащих регистрации. Например, при переписях населения и бюджетных обследованиях единицами наблюдения могут быть человек, семья или домохозяйство, при сельскохозяйственных переписях – крупный рогатый скот, сельскохозяйственный инвентарь и т. д.
Отчетная единица – субъект, от которого поступают данные о единице наблюдения.
Единица наблюдения и отчетная единица могут совпадать, например, при переписи населения.
Программа наблюдения – это перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения. К программе статистического наблюдения предъявляются следующие требования: она должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, его тип, основные черты и свойства.
Вопросы программы должны быть точными и недвусмысленными, иначе полученный ответ может содержать неверную информацию, а также легкими для понимания во избежание лишних трудностей при получении ответа. Кроме того, вопросы должны задаваться последовательно, в логическом порядке, для получения правильных и достоверных сведений.
В программу целесообразно включать вопросы контрольного характера для проверки и уточнения собираемых данных.
Вопросы в программе могут задаваться в различных формах. Они могут быть закрытые и открытые.
Закрытый вопрос – это вопрос альтернативный, т. е. предполагающий выбор одного из двух ответов: «да» или «нет», или же вопрос с выборочным ответом, где предлагаются три или более вариантов ответа на выбор.
На открытые вопросы респондент может ответить бесчисленным количеством способов, если вопрос поставлен без заданной структуры ответа.
Статистический формуляр – это документ единого образца, содержащий программу и результаты наблюдения.
Обязательными элементами статистического формуляра являются титульная и адресная части. Первая содержит наименования статистического наблюдения и органа, проводящего наблюдение, информацию о том, кто и когда утвердил этот формуляр, вторая – адрес отчетной единицы, ее подчиненность. Формуляр может иметь различные названия: переписной лист, анкета, карточка, отчет и т. д.
Наряду с формуляром разрабатывается инструкция по его заполнению и порядку проведения статистического наблюдения.
Формуляр и инструкция по его заполнению представляют собой инструментарий статистического наблюдения.
Критический момент (дата), или момент счета, – это конкретный день года, час дня, по состоянию на который должна быть проведена регистрация признаков по каждой единице исследуемой совокупности. Например, момент счета населения во Всероссийской переписи населения 2002 г. – 0 часов 9 октября 2002 г.
Вопросы населению задавались относительно этого момента счета населения. Так, детей, родившихся после момента счета населения (после 0 часов 9 октября 2002 г.), не переписывали, тогда как тех, кто умер к моменту заполнения переписных документов, но был жив на момент счета, включали в переписные документы. Таким образом, установление критического момента позволяет получить сопоставимые статистические данные.
Срок (период) наблюдения – это время, в течение которого заполняют статистические формуляры, т. е. время, необходимое для проведения массового сбора данных. Указанный срок определяется исходя из объема работы и численности персонала, занятого сбором информации. Период наблюдения не должен далеко отстоять от критического момента, так как это может привести к снижению достоверности получаемых данных. Например, Всероссийская перепись населения проводилась в течение недели – с 9 по 16 октября 2002 г.
Вопрос 2. Основные организационные формы,
виды и способы статистического наблюдения
В российской статистике используются 3 основные организационные формы статистического наблюдения:
1. статистическая отчетность (предприятий, организаций, учреждений и т. п.);
2. специально организованное статистическое наблюдение (переписи, единовременные учеты и обследования);
3. регистры.
Отчетность – основная форма статистического наблюдения, с помощью которой статистические органы в определенные сроки получают от предприятий, организаций и учреждений необходимые данные в виде установленных в законном порядке отчетных документов, скрепленных подписями лиц, ответственных за представление этих документов и достоверность собираемых сведений.
Действующая отчетность делится на типовую и специализированную.
По срокам представления отчетность бывает ежедневная, недельная, двухнедельная, месячная, квартальная и годовая.
Специально организованное наблюдение проводится для получения данных, отсутствующих в отчетности, или для проверки ее данных. Примерами такого наблюдения являются переписи населения, многолетних насаждений, сельскохозяйственных животных, оборудования.
Регистровое наблюдение – форма непрерывного наблюдения за долговременными процессами, имеющими фиксированное начало, стадию развития и фиксированный конец. Оно основано на ведении статистического регистра. Регистр представляет собой систему, постоянно следящую за состоянием единицы наблюдения, которая характеризуется совокупностью показателей. Все показатели хранятся до полного завершения наблюдения за единицей обследуемой совокупности.
В практике статистики различают регистры населения и регистры предприятий.
Регистр населения – поименованный и регулярно актуализируемый перечень жителей страны. Программа наблюдения содержит общие признаки: пол, дата, место рождения, дата вступления в брак, брачное состояние. Регистр населения, как любой регистр, охватывающий наблюдением значительную совокупность единиц, содержит данные по ограниченному числу признаков.
Регистр предприятий охватывает все виды экономической деятельности и содержит значения основных признаков по каждой единице наблюдаемого объекта за определенный период или момент времени. Регистры предприятий включают в себя данные о времени создания (регистрации) предприятия, его название и адрес, телефон, сведения об организационно-правовой форме, структуре, видах экономической деятельности, количестве занятых и др.
Единый государственный регистр предприятий и организаций всех форм собственности (ЕГРПО) дает возможность организовать сплошное наблюдение, а по ограниченному кругу статистических показателей предприятий, зарегистрированных на территории России, позволяет получать непрерывные ряды показателей в случае изменения территориальной, отраслевой и других структур совокупности.
Регистр содержит данные о таких показателях, как среднесписочная численность работников, средства, направляемые на потребление, остаточная стоимость основных средств, балансовая прибыль (убыток), уставный фонд.
ЕГРПО позволяет проводить отбор и группировку любой совокупности единиц по одному или нескольким признакам.
Данные о единицах наблюдения собираются в процессе государственной регистрации предприятий и последующего учета. При закрытии предприятия ликвидационная комиссия в десятидневный срок уведомляет об этом службу ведения регистра.
Пользователями регистра могут быть любые юридические или физические лица, заинтересованные в получении информации.
Виды статистического наблюдения классифицируются по след. признакам:
1. времени регистрации фактов;
2. охвату единиц совокупности.
По времени регистрации фактов наблюдение бывает непрерывным (текущим), периодическим и единовременным.
При текущем наблюдении изменения в отношении изучаемых явлений фиксируются по мере наступления таких изменений, например при регистрации рождения, смерти, состояния в браке.
Данные, отражающие динамику объекта, могут быть собраны в ходе нескольких обследований. Они обычно проводятся по схожим программам и с использованием аналогичного инструментария и называются периодическими. К такому виду наблюдения относятся переписи населения, сельскохозяйственные переписи, регистрация потребительских цен.
Единовременное обследование дает сведения о количественных характеристиках какого-либо явления или процесса в момент его исследования. Примером может служить инвентаризация незавершенного строительства. По охвату единиц совокупности статистическое наблюдение бывает сплошное и не сплошное.
При сплошном наблюдении информация собирается обо всех единицах исследуемой совокупности, например перепись населения, скота, жилого фонда.
При не сплошном наблюдении сведения собирают не обо всех единицах совокупности, а только некоторой их части, отобранной определенным образом. Не сплошное наблюдение в свою очередь подразделяется на выборочное, основного массива, монографическое. Различие между этими видами заключается в способе отбора тех единиц, которые должны быть подвергнуты наблюдению.
Способами статистического наблюдения являются непосредственное наблюдение, документальный учет фактов и опрос.
При непосредственном наблюдении факты, подлежащие регистрации, устанавливают лица, проводящие наблюдение, путем замера, подсчета числа каких-либо предметов и иными подобными методами); при документировании необходимые сведения берутся из соответствующих документов; особенность опроса состоит в том, что сведения фиксируются со слов опрашиваемого.
В статистике применяются следующие виды опросов:
1. экспедиционный (устный);
2. саморегистрации;
3. явочный;
4. корреспондентский;
5. анкетный.
Точностью статистического наблюдения называют степень соответствия величины какого-либо показателя, определенной по материалам статистического наблюдения, действительной величине этого показателя.
Расхождение между расчетными и действительными значениями изучаемых величин называется ошибкой наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации – это отклонения между значением показателя, полученным в ходе статистического наблюдения, и фактическим, действительным значением показателя. Ошибки регистрации бывают случайные и систематические.
Отклонение значения показателя обследованной совокупности от его величины по исходной совокупности называется ошибкой репрезентативности. Ошибки репрезентативности бывают случайные и систематические. Ошибки репрезентативности характерны только для не сплошного наблюдения. Они возникают в связи с тем, что отобранная и обследованная совокупность недостаточно точно воспроизводит всю исходную совокупность в целом.
После получения статистических формуляров следует провести проверку полноты и качества собранных данных. Контроль полноты - это проверка того, насколько полно объект охвачен наблюдением, иначе говоря, о всех ли единицах наблюдения собраны сведения. Контроль качества материала осуществляется с помощью логического и арифметического контроля.
ТЕМА 3.: Сводка и группировка статистических данных
• Вопрос 1. Статистическая сводка, содержание, задачи. Роль в анализе информации;
• Вопрос 2. Группировка – это основа статистической сводки. Виды группировки, их применение в статистике;
• Вопрос 3. Статистические ряды распределения. Их виды, их характеристики;
• Вопрос 4. Табличное и графическое представление их статистических данных.
Вопрос 1. Статистическая сводка, содержание, задачи.
Роль в анализе информации
Сводка выполняется на втором этапе статистического исследования. Ее цель и систематизация первичных данных и получение в результате характеристики всего объекта при помощи обобщающих показателей.
Например: необходимо рассчитать средний возраст студента: Имеем перечень фамилий, который мы группируем до 25 лет и старше 25 лет.
Группировка – часть сводки.
Сводка – это комплекс последовательных операций по обобщению конкретных единичных фактов для выявления типичных черт и закономерностей, присущий явлению в целом.
В результате сводки происходит переход от конкретных случайных данных к обобщающей характеристике этих данных.
Например: переход от конкретного возраста каждого студента к среднему возрасту всех студентов.
По глубине и точности обработки данные выделяются:
А) простую сводку – это операция, которая состоит только в подсчете итогов по совокупности единиц наблюдения;
Б) сложную сводку – комплекс операций, включающий:
1. группировку единиц наблюдений;
2. подсчет итогов по каждой группе и по объекту в целом;
3. представление результатов в виде статистической таблицы и графиков.
По форме обработки первичных данных:
А) централизованная сводка – весь первичный материал поступает в одну организацию и подвергается в ней обработке от начала и до конца;
Б) децентрализованная сводка – отчеты организации сводятся отдельными статистическими органами, далее отчеты поступают в вышестоящие органы и т.д. до Федеральной службы государственной статистики (ФСГС) (www.gks.ru – Росстат).
По технике выполнения:
А) автоматизированная сводка;
Б) ручная сводка.
Вопрос 2. Группировка – это основа статистической сводки.
Виды группировки, их применение в статистике
Группировка – это разбиение единиц изучаемой совокупности на однородные группы по определенным признакам существенным для данной статистической задачи.
Признак, который лежит в основании группировки – это группировочный признак.
Например: в варианте 2 курсовой работы группировочный признак – выпуск продукции. Все расчеты в 1-м задании будут произведены по нему.
Задачи группировки:
1. выделение социально-экономических явлений;
2. изучение структуры явлений и структурных сдвигов, которые происходят в этом явлении. Например, изменение цен за счет структурных сдвигов, разные товары по разной цене.
3. выявление связей и зависимостей между отдельными признаками изучаемых явлений.
Выделяются 3 вида группировки:
1. Типологическая группировка – это разбиение разнородных совокупностей на отдельные качественно однородные группы и выявление на этой основе различных экономических типов явлений.
При ее выполнении должен быть заранее известен перечень типов явлений, на которые разбиваются исследуемая совокупность, т.е. предварительно должен быть проведен теоретический анализ явления.
Например: таблица имеет название и в правом верхнем углу дается ее нумерация.
Таблица 1
Группировка предприятий РФ по формам собственности (на 01 января 2006 г.)
№ п/п
Группы предприятий по форме собственности
Число организаций
всего (тыс.)
в %
1
2
3
4
1
Государственная собственность
151
4,5
2
Муниципальная собственность
217
6,5
3
Частная собственность
2510
75,0
4
Собственность общественных и религиозных объединений
223
6,7
5
Прочие формы собственности
247
7,3
Итого:
3348
100,0
2. Структурная группировка – это группировка, предназначенная для изучения состава однородной совокупности по какому-либо варьирующему1 признаку.
Структурная группировка характеризует состав и структуру изучаемой совокупности2.
Таблица 2
Группировка предприятий РФ по формам собственности (на 01 января 2006 г.)
Группировки банков по величине уставного капитала (млн. руб.)
Число банков (ед.)
Уставной фонд (млн. руб.)
Работающие активы (млн. руб.)
Капитал (млн.руб.)
1
2
3
4
5
2100-73500
18
71272
504898
342889
7350-12600
6
12600-17850
3
17850-23100
3
Итого:
30
240018
10240731
806836
Основное назначение – тенденции изменения структурных сдвигов.
3. Аналитическая (факторная) группировка – это группировка, которая позволяет описать взаимосвязь между изучаемыми явлениями и их признаками.
В статистике признаки подразделяются на:
а) факторный признак, под воздействием которых изменяются другие (результативные признаки). Взаимосвязь проявляется в том, что с ростом факторного признака систематически возрастает или убывает результативный признак3.
б) результативный признак под влиянием факторного признака систематически изменяется.
Особенности:
1. единицы совокупности группируются по факторному признаку4;
2. каждая выделенная группа характеризуется средней величиной результативного признака5.
Таблица 3
Аналитическая таблица взаимосвязи уставного капитала и капитала банков (на 01 января 2006 г.)
Группировки банков по величине уставного капитала (млн. руб.)6
Число банков (ед.)
Капитал (млн. руб.)
Всего (млн.руб.)
В среднем на один банк7
1
2
3
4
2100-7350
18
342889
19049
7350-12600
6
204694
34116
12600-17850
3
130680
43560
17850-23100
3
128573
42858
Итого:
30
806836
26895
Пример 1.: Разговариваем по телефону 63 секунды, оплачиваем за 2 минуты, т.е. округление идет в большую сторону. Корреляционная прямая обратная.
Таблица*
x (мин.)
цена средняя()
112
1,2
0,7
116
1,0
0,8
118
0,8
1,0
150
0,7
1,2
Аналитическая (факторная) группировка показывает, что с ростом уставного капитала (УК) возрастает средний капитал на 1 балл, отсюда следует, что между факторным (x) и результативным признаком () в целом имеется взаимосвязь.
Кроме выше перечисленных существуют комбинационные, которые выключают деления на 3 и более показателей.
При разбиении совокупности на группы возникает вопрос: «Какое количество групп необходимо выделить?».
Если в основании группировки лежит описательный признак (см. табл. 1), то количество выделенных групп определяется теоретическим анализом.
Если в основании группировки лежит количественный признак (см. табл. 2, 3), то производят специальные расчеты, чтобы определить количество групп и величину интервала группировки8.
Интервал – это количественное значение, которое вычисляется как разность между max и min значениями признака в каждой группе.
Они могут быть:
А) равные
Б) неравные
В тех случаях, когда признак изменяется в достаточно узких пределах, причем равномерно, применяют равные интервалы.
Для образования групп применяют формулу Стерджесса:
,
где n число образуемых групп, а N число единиц наблюдения.
Для группировки с равными интервалами величина интервала (h) определяется как разница между:
,
где и соответствуют max и min значению интервалов, n – количество выделенных групп, а R – размах совокупности, т.е. разность между max и min значениями признака.
Интервалы в группах могут быть:
А) закрытыми – если указана и верхняя, и нижняя границы9;
Б) открытыми.
Если указана только одна граница, то в них величина интервала приравнивается к его размаху соседнего интервала (табл. 2, 3: до 7350 или свыше 17850).
– интервал (размах, величина).
Вопрос: «Куда относить пограничный элемент?». Ответ: «Отнесение должно быть единообразным». В нашем варианте 7350 отнесем ко 2-му интервалу.
Границы групп повторяются в качестве верхней границы предыдущего интервала и нижние границы последующего интервала. Принято, что пограничный элемент отнесен либо к одной, либо к другой группе. Но отнесение должно быть единообразным для всех пограничных элементов группировки.
Вопрос 3. Статистические ряды распределения.
Их виды, их характеристики
Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком.
В таблице 2 (только число банков) – малая выборка – простейший ряд.
Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:
8
2
9
3
10
1
11
3
9
Пример 2.: со студентами в аудитории.
Таблица 0
Распределение числа студентов группы 302
Пол
Число студентов (чел.)
%
1
2
3
женский
25
83,3
мужской
5
16,7
Итого:
30
100,0
Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.
Выделяются 2 вида рядов:
1. атрибутивный
Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).
Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.
2. вариационный
Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.
Характеристики ряда распределения:
1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;
2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.
Пример 3.: Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.
8
2
9
3
10
1
11
3
9
Сумма всех частот равна сумме элементов ряда
.
Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0.
В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.
(см. табл. 0: 83,3+16,7 = 100,0%)
(см. табл. 0: 0,83+0,17 = 1,00).
В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные.
В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.
Пример 4:
Таблица 4
Распределение семей по числу детей
Число детей в семье (чел.)
Количество семей (ед.)
%
S (накопленные частоты)10
1
2
3
4
3
15
3
1
8
40
11
2
4
20
15
3
3
15
18
4
2
10
20
Итого:
20
100
Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.
В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину11.
Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико12.
Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.
Таблица 513
Распределение сотрудников предприятия по размерам месячной заработной платы, руб.
Зарплата (руб.)14
Число сотрудников (чел.)15
Накопленные частоты16
1
2
3
до 5000
3
3
5000-10000
12
15
1000-15000
10
25
15000-20000
5
30
Итого:
30
Кроме частот используются накопленные частоты или накопленные частости.
Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S17.
Накопительные частоты называются аккумулированными частотами, они показывают сколько элементов ряда имеют значение до определенного ряда.
Вопрос 4. Табличное и графическое представление их статистических данных
Графическое представление статистических данных
Анализ рядов распределения наглядно можно представить в виде графического изображения через полигон, гистрограмму, куммуляту.
Полигон – используется только для изображения дискретных рядов.
По данным таблицы 4 строим график.
В декартовой системе по оси абсцисс18 откладывают варианты, по оси ординат19 – частоты, полученные точки соединяем.
«06» октября 2007 г.
Для изображения интервальных рядов используется гистограмма. На оси абсцисс откладывается величина интервалов, частоты изображаются прямоугольником, построенным на соответствующих…
Высота столбцов должны быть пропорциональны частотам. Между столбцами гистограммы не должно быть разрывов.
По данным табл. 5 строим гистограмму:
График 1
График 2.
f
12 12
10 10
5 5
3 3
5 10 15 20 x
Полигон20 – банальный график, что строили в школе.
Условный нулевой отступ от условного «0» должен быть обязателен.
Для изображения рядов распределения используем кумуляту – кривую накопленных частот. На оси абсцисс изображают величины интервалов, а по оси ординат накопленные частоты, которые наносят в виде перпендикуляров в верхних границах интервала. Затем эти перпендикуляры соединяют и получают ломаную кривую.
Табличное представление статистических данных
Статистическая таблица – это своего рода статистическое предложение, которое состоит из статистического подлежащего и статистического сказуемого.
Подлежащее показывает о чем идет речь, в таблице обычно располагают слева и представляют собой название строк.
Сказуемое располагают сверху таблицы и представляют собой название граф, т.е. показывают какими признаками обладает объект исследования.
Вид таблицы зависит от ее содержания, целей построения:
1. простые – в подлежащем отсутствуют группировки и содержится перечень объектов (например табл. 1). Подлежащее – форма собственности (табл. 4 – число детей). Сказуемое – число предприятий, (табл. 4 – количество семей).
2. групповые – в них подлежащее содержит группировки, а сказуемое задает признаки, которые характеризуются (табл. 2, 3).
3. комбинационные – содержит группировки единиц в совокупности по двум и более признакам.
Таблица Х
Общий макет таблицы
Подлежащее
Сказуемое
название граф
1
221
3
4 (млн.р.)
5 (в%)
Боковые заголовки
15,0
16
17,162
16,7
Итого:
Итого:
Всего:
Источник:
Образец оформления «Источника»:
• ссылка на журнал, книгу: Морозов А. Анализ рождаемости в Москве//Вопросы статистики, 2004, №7, с. 16-20.
• cсылка на Интернет-статью: http://www.nic.ru22
Существуют правила построения таблиц:
1. Таблица должна иметь общий заголовок, в котором выражается: сам объект, признаки объекта, время и место, к которому относится статистический материал, единица измерения, если они общие для всей таблицы.
2. Число признаков в сказуемом должно быть ограничено.
3. Округление должно быть проведено с одинаковой степенью точности (см. табл. Х, максимально 4 знака после запятой).
4. Отсутствие данных могут быть обусловлены разными причинами и это по-разному отражается в таблице:
◦ если данный признак вообще не подлежит заполнению, то став. крест (см. таб. Х);
◦ если сведения отсутствуют, то ставится многоточие: « … »
◦ если отсутствует какое-либо явление, то ставится дефис (тире): « – »;
◦ для изображения очень малых чисел: « 0,00… ».
Для наглядности статистических данных, их отображение широко используются линейные графики, столбиковые диаграммы и реже используются точечные и объемные.
Exel – 4 шага к построению диаграммы.
ТЕМА 4.: Средние величины
• Вопрос 1. Сущность средних величин и две формулы средних;
• Вопрос 2. Средне арифметическое () и средне гармоническое (гармоникал);
• Вопрос 3. Геометрическое и квадратическое среднее;
• Вопрос 4. Структурные (непараметрические) средние.
Вопрос 1. Сущность средних величин и две формулы средних
Средняя величина – это показатель, который дает обобщающую характеристику варьирующего признака однородной совокупности.
Средняя величина характеризует всю совокупность в целом, а не отдельные ее величины, т.е. она отражает то общее, что присуще всем единицам совокупности.
Иными словами, среднее отражает типичный уровень признака и абстрагируется от индивидуальных особенностей, присущих отдельным единицам.
В среднем поглощаются все случайности, чем более однородна совокупность, тем средняя величина является надежной для данной статистической совокупности.
В том случае, если совокупность не однородна, то используется метод группировок и в каждой выделенной группе вычисляется средняя величина (аналитическая группировка).
Основные свойства средних величин:
1. Средняя характеризует всю совокупность в целом.
2. Средняя позволяет изучать динамику всех единиц совокупности сразу.
3. В аналитической группировке средняя позволяет изучать взаимосвязь между факторным (х) и результативным () признаками ().
Два условия применения средних величин:
1. совокупность должна быть однородной.
2. средняя должна быть рассчитана для совокупности, имеющей достаточно большой объем.
Формы средних:
1. степенная средняя
2. структурная средняя
(Формула 1)
– основная формула степенной средней.
(Формула 2)
– взвешенная, где
Z=-1 – это средняя гармоническая .(обратная величина);
Z=0 – средняя геометрическая;
Z=1 – средняя арифметическая;
Z=2 – средняя квадратическая;
Степенная средняя используется в 2-х видах:
1. простая средняя
2. взвешенная средняя
Простая используется в случае отсутствия весов (f), а взвешенная – при наличии весов, т.е. частот вариантов ряда (f) как в случае дискретных рядов и в случае интервальных.
Кроме степенной средней используется структурная средняя, которая позволяет выявить внутреннюю структуру ряда.
Вопрос 2. Средне арифметическое ()
и средне гармоническое (гармоникал)
Средне арифметическое – параметр, который характеризует средний уровень явления.
Бывает взвешенное и не взвешенное средне арифметическое.
(Формула 3)
– не взвешенная;
(Формула 4)
– взвешенная.
Пример 5. Имеется зарплата офис-менеджера в нефтяной компании (тыс. руб. в месяц). Рассчитать среднюю зарплату в неделю. Для расчета воспользуемся средне арифметической не взвешенной, где n – количество единиц в совокупности (см. формулу 3), получим:
Пример 6. Имеются данные о зарплате строителей в месяц. Рассчитать среднюю зарплату в месяц.
зарплата в мес., т.руб.
число строителей, чел.
1
2
32
20
33
35
34
14
40
6
Итого:
75
Варианты решения:
1. наглядный расчет:
xf
640
1155
476
240
2511
2. по формуле 4, по дискретному ряду рассчитываем средне взвешенную.
(тыс.руб.)
Пример 7.: Требуется определить средний возраст студента заочной формы обучения по данным, заданным в следующей таблице:
Возраст студентов, лет (х)
Число студентов, чел (f)
среднее значение интервала (x',xцентральн)
xi*fi
1
2
3
4
до 20
65
(18+20)/2=19
19*65=1235
20-22
125
21
2625
22-24
190
23
4370
24-26
80
25
2000
26 и старше
40
27
1080
Итого:
500
11310
Для вычисления средней в интервальных рядах сначала определяют среднее значение интервала как полу-сумму верхней и нижней границы, а затем рассчитывается средняя величина по формуле средне арифметическая взвешенная.
Выше дан пример с равными интервалами, причем 1-й и последний являются открытыми.
.
Ответ: средний возраст студента составляет 22,6 года или примерно 23 года.
Пример 8.: по примеру 7, только с неравными интервалами:
Возраст студентов, лет (х)
Число студентов, чел (f)
среднее значение интервала (x',xцентральн)
xi*fi
1
2
3
4
до 20
65
(18+20)/2=19
19*65=1235
20-22
125
21
2625
22-26
190
24
4560
26-30
80
28
2240
старше 30
40
(30+34)/2=32
1280
Итого:
500
11940
соседн.интервал
.
Основное свойство средне арифметической
Алгебраическая сумма отклонений индивидуальных вариантов значений признака от средней величины равной 0, т.е.
(Формула 5)
– отклонение каждого признака от средней величины.
(Формула 5)
– для взвешенной формулы.
Существует еще много других свойств средней величины, но нам необходимо «нулевое» свойство.
Средне гармоническое
Используется в тех случаях, когда статистическая информация не содержит частот (f) по отдельным вариантам, а содержит произведение вариантов на частоты, т.е. xi*fi=Mi, тогда формула средне гармонической имеет вид:
1. средняя гармоническая простая не взвешенная:
(Формула 6).
2. средне гармоническая взвешенная:
(Формула 7).
Пример 9.: необходимо рассчитать среднюю цену продажи трех товаров в городе, по данным, указанным в таблице:
Товар
Цена, руб. (х)
Сумма реализации, тыс.руб. (xi*fi=Mi)
Частоты (fi=Mi/xi)
1
2
3
4
А
30
600
20
В
20
1000
50
С
35
350
10
Итого:
1950
Обычно для того, чтобы вычислить среднюю величину пользуются логической формулой, необходимой для решения этой статистической задачи.
В нашем случае количество реализованного товара – это есть сумма реализации к средней цене.
В рассматриваемом примере числитель логической формулы известен, а знаменатель нет. Чтобы его найти воспользуемся формулой средне гармонической взвешенной (формула 7), т.к. цена различна:
(руб.) – средняя цена всех зубных паст (тюбиков).
Формулу средне гармонической взвешенной тут применить нельзя .
Средне арифметическое – расчет неверен.
Если прибегнем к средне арифметической взвешенной, то выйдем на нашу формулу, но сейчас эти частоты получили расчетным путем.
Если применить формулу средне арифметической , то величина не отображает объем реализации и является нереальной.
Пример 10. на гармоническую величину. Две машины осуществляют поставку товара. Они прошли один и тот е путь. Первая со скоростью 60 км/ч, а вторая машина – 80 км/ч. Вычислить среднюю скорость машин.
fi=2; xifi=Mi
– обратное значение варианта по формуле 6;
км/ч ,
Если применить формулу средней арифметической, то расчетная величина 70 км/ч не отражает реальную величину 68,6 км/ч.
Вопрос 3. Геометрическое и квадратическое среднее
Геометрическая средняя
Для ее расчета используется следующая формула:
(Формула 8)
– средне геометрическое не взвешенное, где П – произведение иксов i
(Формула 9)
– средне геометрическая взвешенная.
Пример 11.: Цены возросли на товар j в два раза.
- так считать нельзя!
(раза) – не взвешенная.
Пример 12.: В результате инфляции цены в первый год возросли в 2 раза, а во второй год в 1,5 раза. Найти средний рост цен на товары за каждый год, т.е. средний темп роста цен.
Логически темпы роста складывать нельзя и применение средне арифметической здесь неправомерно. Почему? 1,75*1,75=3,0625, а должно получиться 3,0, а если 1,73*1,73=3,0. В этом случае используем средне геометрическую простую не взвешенную.
Средне геометрическое используется в рядах динамики для определения средних темпов изменения явления.
(Формула 10),
где yn – это значение конечного уровня ряда, y0 – значение начального уровня ряда, а n – число коэффициента роста23.
Квадратическое среднее:
(Формула 11),
(Формула 12) – взвешенная.
Средне квадратическая используется не сама по себе, а для оценки отклонения вариантов от средней величины, т.е. для расчета сигмы – есть разность – простая, , тем самым подходим к рассмотрению дисперсии.
Сигма – это средне квадратическое отклонение от средней величины. В компьютере называется стандартным отклонением (годы)2).
,
.
Если сигма в квадрате, то получаем дисперсию:
, .
Вопрос 4. Структурные (непараметрические) средние
Мо – мода.
Ме – медиана (делит ранжированный ряд по середине).
Мода – наиболее часто встречающийся вариант ряда или вариант, имеющий max частоту.
Для дискретных рядов
Мо – определяется по частоте появления вариантов.
Пример 13.: Имеем следующие данные:
Группировка семей по числу детей, ед. (x)
Число семей, ед. (f)
1
2
6
1 (Мо=1)
28
2
22
3
20
4
13
5
8
6 и более
5
Итого:
102
наиболее часто встреч.
В интервальных рядах Мо рассчитывается по следующей формуле:
(Формула 13),
x0 – нижняя граница модального интервала,
h – величина интервала,
– частота модального интервала,
– частота интервала, предшествующему модальному,
– частота интервала, следующий за модальным.
Модальный интервал – это интервал, содержащий модальное значение24.
Пример 14.: Даны данные, рассчитать Мо.
Возраст студентов, лет
Число студентов, чел.
1
2
до 20
346
20-25
872
25-30
1054
30-35
781
35-40
212
40-45
121
45 и более
76
Итого:
3462
нижняя граница этого Мо интервала (fmo)
(лет).
Экономическая хар-ка: наиболее часто встречающийся возврат 27 лет.
Медиана – вариант, который делит вариационный ряд таким образом, что все варианты, лежащие слева от Ме меньше по величине, а все варианты, лежащие справа больше по величине.
Медианное значение признака – это значение, приходящееся на середину ранжированного ряда.
Главное свойство Ме: сумма абсолютных отклонений варианта от Ме меньше, чем от любой другой величины:
25.
Пример 15.: 9 торговых фирм реализовывали товар по следующим ценам (тыс.руб.): 4,4; 4,3; 4,4; 4,5; 4,3; 4,3; 4,6; 4,2; 4,6.
Проранжируем ряд:
< Me >
4,2; 4,3; 4,3; 4,3; 4,4; 4,4; 4,5; 4,6; 4,6
Мо=4,3 тыс.руб. (дискретный ряд, не расчетная Ме).
Медиана фактически выполняет роль средней величины в случае не однородной совокупности.
Она также используется в тех случаях, когда не позволяет объективно оценить изучаемую совокупность вследствие сильного расхождения max и min значения.
Заработная плата
Пример 16.: Допустим, что необходимо охарактеризовать средний доход группы людей из 100 человек, из которых 99 имеют доходы от 100 до 1000 $ в месяц, а месячный доход последнего сотового составляет 50 тыс. $:
1 2 3 4 … 50 51 … 99 100
100 102 103 104 … 162 164 … 1000 50000
Если взять средне арифметическую, то средний доход составляет 700$ – это не соответствует ни основной группе людей и не соответствует доходу сотового (аномального) человека, т.е. эта цифра ничего не отражает. Поэтому для определения среднего дохода необходимо использовать медианный доход, который 50-51 (полусумма) Ме=163$. Является объективной характеристикой доходов этой группы людей.
Для определения медианы находят номер медианной позиции ряда:
где
N – номер медианной позиции ряда и
n – число членов ряда, если n – нечетное.
В случае с зарплатой число членов ряда четно 100. В этом случае берется полусумма средних элементов ряда 162+164=163.
.
В случае интервальных рядов медиана находится по следующей формуле:
где
x0 – нижняя граница медианного интервала;
h – величина интервала;
– сумма частот, т.е. число членов ряда;
– частота медианного интервала;
– сумма накопленных частот интервала, предшествующие медианному.
Для определения медианных интервалов необходимо найти накопленные частоты и анализировать каждый интервал до тех пор пока его накопленная частота не превысит полу-суммы накопленных частот по Мо.
Пример 17.:
x
f
S
1
2
3
до 20
346
346
20-25
872
1218
25-30
1054
2272
30-35
781
3053
35-40
212
3265
40-45
121
3386
45 и более
76
3462
Итого:
3462
1731
т.е. одна половина студентов моложе 27,4 года, а другая половина старше 27,4 года.
ГРАФИК Мо, а Ме см. вначале этой лекции.
Ме
2 кв. 3/4
1 кв. Ме 3 кв.
3/4
Кроме Мо и Ме используется квартиль, который делит ранжированный ряд на 4 равные части, 2-й квартиль и есть Ме.
Дециль – 10 частей, перцентиль – 100 частей.
«13» октября 2007 г.
Пример 18: по оценкам студентов рассчитать средний балл студентов в целом.
Расчет x средне арифметической
Балл (х)
Число студентов (f)
Сумма баллов (xf)
Удельный вес (d для числа студентов в %)
Сумма баллов в долях (xd)
Удельный вес (d' численность студентов)
xd'
А
1
2
3=1*2
5=1*4
7=1*6
I
5
4
20
20,0
100
0,2
1,0
II
4
10
40
50,0
200
0,5
2,0
III
3
6
18
30,0
90
0,3
0,9
Итого:
20
78
100,0
390
1,0
3,9
Решение, 1-й способ:
Решение, 2-й способ:
Решение, 3-й способ:
Расчет x средне гармонической
Балл (х)
Сумма баллов (M=xf)
Число студентов, чел. (M/x) (частота)
Удельный вес суммы баллов в %
А
1
2
3=2/1
4
I
5
20
4
25,64
II
4
40
10
51,28
III
3
18
6
23,08
Итого:
78
20
100,00
Решение, 1-й способ:
Решение, 2-й способ:
ТЕМА 5. Статистическое изучение вариации
• Вопрос 1. Понятие вариации. Основные показатели;
• Вопрос 2. Правила сложения дисперсии и ее применение;
• Вопрос 3. Характеристика формы распределения.
Вопрос 1. Понятие вариации. Основные показатели
5 - интервал
I
95
100
105
II
75
100
125
25 - интервал
R1=10 – размах
R2=50 – размах
Вариация – колеблемость.
Вариация – это различия в индивидуальных значениях признака у единиц изучаемой совокупности.
Необходимость изучения вариации связано с тем, что с разной степенью точности определяет типичный уровень ряда, а именно: чем меньше различия между вариантами ряда, тем однороднее совокупность, если различия между вариантами ряда велики, то средняя может оказаться не надежной характеристикой.
Существует несколько показателей, позволяющих оценить колеблемость признака в совокупности.
1. Формула вычисления размаха вариации:
R=xmax – xmin Формула (1)
Экономический смысл: предельное значение амплитуды колебания признака.
2. Средне линейное отклонение – это сумма средне арифметической из абсолютных отклонений.
Формула (2)
Экономический смысл: абсолютное отклонение от средней величины.
3. Дисперсия – сигма – это средне арифметическое квадратов отклонений:
Формула (3)
4. Средне квадратическое отклонение
Формула (4)
Экономический смысл: среднее отклонение от средней величины.
Взвешенные формулы показателей вариации:
5.
Формула (5)
6. Дисперсия
Формула (6)
7.
Формула (7)
8. Удобная формула
Формула (8)
– средняя из квадратов х;
– квадрат среднего х.
9. для не сгруппированных данных
Формула (9)
10. для сгруппированных данных
Формула (10)
Наиболее удобно пользоваться формулами 8,9,10.
Пример 1. Фирма объявила конкурс и распределила претендентов по опыту работы. Рассчитать показатель вариации. Имеем следующие данные:
Группа кандидатов по опыту работы, лет (x)
Число кандидатов, чел. (f0)
Интервал (х') или (xцентр.)
Расчетные графы26
(xi-xср.)
(xi-xср.)2
(xi-xср.)2f
x2 вар-нт
x2f
1
2
3
4
5=4*4
6=5*2
7=3*3
8=7*2
до 4-х
10
3
-4,2
17,64
176,40
9
90
4-6
10
5
-2,2
4,84
48,40
25
250
6-8
50
7
-0,2
0,04
2,00
49
2450
8-10
20
9
1,8
3,24
64,80
81
1620
10 - более (10-12)
10
11
3,8
14,44
144,40
121
1210
Итого:
100
436,00
285
5620
Решение:
Этап 1. Вычислим средний опыт работы кандидатов, используем для этого формулу средне арифметической взвешенной:
Этап 2. Вычислим дисперсию по формуле 6. Заметим, что дисперсия всегда величина безразмерная:
Этап 3. Вычислим средне квадратическое отклонение (формула 7):
Экономический смысл: среднее отклонение от средней величины группы кандидатов по опыту работы отклоняется в ту или иную сторону на 2,1 года.
Этап 4. Вычислим размах по формуле 1: R=12-2=10 (лет)
Этап 5. Вычислим средне линейное отклонение по формуле 5 для взвешенных:
Этап 6.
Абсолютное отклонение каждого опыта работы кандидата от среднего опыта работы составляет 1,48.
Помимо абсолютных показателей вариации применяют относительные показатели вариации.
1. 27
2. минимальное отклонение
3.
Относительные показатели измеряют интенсивность колеблемости признака наиболее часто используется последний показатель.
Принята следующая оценочная шкала для оценки колебания признака:
колеблемость незначительная
колеблемость умеренная
колеблемость значительная
Совокупность однородная
для нормальных и близких к ним значения коэффициента вариации служит индикатором однородности совокупности.
Если коэффициент вариации меньше или равен 33%, то совокупность является однородной и средняя величина является надежной, типичной характеристикой в данной совокупности28.
Этап 7. Находим коэффициент вариации и понимаем, что совокупность является однородной и средняя величина является надежной типичной характеристикой в данной совокупности:
Вопрос 2. Правила сложения дисперсии и ее применение
Для описания влияния одних факторов на другие статистика использует специальные коэффициенты, которые можно получить на основе правила сложения дисперсии:
,
где – общая дисперсия; – показывает влияние факторного признака (дельта малая по x)
– средняя из внутригрупповых j дисперсий (прочие ф-ры)
Вид 1. Общая дисперсия характеризует вариацию признака, всей совокупности складывающейся под влиянием всех существующих (действующих) факторов как систематических, так и случайных. Рассчитывают по формулам 3,6, а наиболее удобные 8,9,10.
Вид 2. Менее групповая дисперсия () – измеряет систематическую вариацию признака, обусловленную влиянием фактора, по которому проводится группировка, т.е. изучает влияние факторов на колеблемость признака:
,
где – общая средняя для всей совокупности в целом;
k – количество выделенных групп;
– средняя величина j-ой группы;
nj – число единиц в j-ой группе.
Вид 3. – внутри групповая дисперсия – описывает вариацию признака, сложившуюся под влиянием всех остальных, не учитываемых в данном исследовании факторов.
Эта дисперсия случайна. Она не зависит от группировочного фактора и зависит от случайностей.
– средняя из внутри группировочных дисперсий
– считается по обычным формулам для диперсий, только эта дисперсия дл j группы.
На основании правила сложения дисперсии строятся показатели, описывающие влияние группировочного признака (признака фактора) на образование общей вариации.
1. эмпирический коэффициент детерминации :
Эмпирический коэффициент детерминации показывает на сколько обусловлен группировочный признак x, т.е. что положено в основании группировки.
2. ЭКО – показывает меру тесноты связи, эмпирически между изучаемым признаком корреляции и группировочным отношением признаком x.
. Чем ближе этта к 1, тем теснее связь.
Пример 2. Исследовать зависимость между собственными и привлеченными средствами коммерческих банков региона.
№ п/п
Собственные средства млн.руб. (факторный признак)
Привлеченные средства, млн. руб. (результативный признак)
1
2
3
1
70
300
2
90
400
3
140
530
4
110
470
5
75
255
6
150
650
7
90
20
8
60
240
9
95
355
10
115
405
итогов
нет
(факторный признак) x ср.)
(результативный признак) y ср.)
Разделим (произведем) группировку банков по величине собственных средств.
№ п/п
Собственные средства млн.руб. (факторный признак)
Привлеченные средства, млн. руб. (результативный признак)
1
2
3
1
до 100
300,400,255,320,240,355
2
более 100
530,470,650,405
k = 2 (группы)
Этап 1. Рассчитываем групповые средние по формуле средней арифметической:
Этап 2. Рассчитываем общую среднюю величину:
Этап 3. Рассчитываем внутригрупповую дисперсию:
, где xi – в расчет берется по всем элементам, а xj – по группе:
Этап 4. Рассчитаем среднюю из внутригрупповых дисперсий:
Этап 5. Определим межгрупповую дисперсию:
Этап 6. Находим общую дисперсию по правилам сложения дисперсий:
Общую дисперсию можно вычислить по всей совокупности в целом и проверить на совпадение с полученной по правилам сложения дисперсии.
Этап 7. Рассчитать эмпирический коэффициент детерминации и ЭКО:
Вывод: Различия в собственных средствах оказывает влияние на различия привлеченных средств в банках на 65,6%, а остальные (100-65,6=34,4%) объясняются вариацией всех других, отличных от x факторов, не учитываемых в данном исследовании.
ЭКО – показывает, что величина собственных средств существенно влияет на размер привлеченных банками средств.
Вопрос 3. Характеристика формы распределения
Пример 3. Даны данные
x
18
21
24
25
27
31
f
2
3
2
1
1
2
ГРАФИК 1, 229
Кривая нормального распределения.
Значения вариантов ряда концентрируются около средней величины30.
Близость частотной кривой к кривой нормального распределения оценивается с помощью показателей ассиметрии (As) и эксцесса (Ek).
Для нормального распределения выполняется равенство:
Согласно правилу 3-х сигм в интервале:
лежит 68,3%;
лежит 95,4% признаков! – наиболее часто применяются в статистике;
лежит 99,7% значений.
Это кривая теоретически нормального распределения.
Кривая эмпирического распределения может быть ассиметрична:
ГРАФИК 4,5.
Существуют специальные формулы расчета As, при этом, если показатель As>0, то As правосторонняя, если As<0 – левосторонняя, а если As=1 – кривая нормального распределения ассиметрии отсутствует31.
Существует оценочная шкала ассиметрии:
|As| ≤ 0,25 – незначительная ассиметрия;
0,25 < |As| ≤ 0,5 – заметная умеренная ассиметрия;
|As| > 0,5 – существенная ассиметрия
Коэффициент ассиметрии Присона
,
где Мо – наиб. часто встречающаяся вариация, – средне квадратич. отклонение.
Наряду с коэффициентом As существует коэффициент ассиметрии Пирсона, он измеряет ассиметрию, имеющуюся в центральной части ряда и определяется по формуле.
ГРАФИКИ 6,7
Кривая может быть более пологовершинной. Критерии крутизны – эксцесс.
График в) значения располагаются практически вдоль оси х.
График г) значения располагаются практически в центральной части ряда.
При Ek>0 – имеет скопление признака в центральной части ряда.
При Ek<0 – эмпирическая кривая лежит ниже кривой нормальной распределения и значит-но распределена и значения признака разбросаны по всему диапазону x.
При Ek=0 – кривая нормального распределения.
ТЕМА 6: Метод выборочного наблюдения
• Вопрос 1. Понятие о выборочном наблюдении и ошибках выборки;
• Вопрос 2. Способы формирования выборочной совокупности;
• Вопрос 3. Средняя и предельная ошибка выборки;
• Вопрос 4. Определение необходимого объема выборки
Вопрос 1. Понятие о выборочном наблюдении и ошибках выборки
Под выборочным наблюдением понимается не сплошное наблюдение, при котором рассматриваются не все единицы совокупности, а некоторым способом формируется некоторая совокупность, называемая выборочной или выборкой.
При обследовании выборочной совокупности обследуются обобщающие, оценивающие статистические параметры и на их основе получают оценки соответствующих параметров для генеральной совокупности, но при этом возникают ошибки, связанные с распространением выборочных значений на всю генеральную совокупность.
Обозначим показатели, характеризующие выборочную и генеральную совокупности:
№ п/п
Характеристики
Генеральная совокупность
Выборочная совокупность
1
2
3
4
1
Объем совокупности
N
n
2
Численность единиц, обладающих исследуемым свойством
М
m
3
Доли, единицы, обладающие исследуемым свойством
4
Средняя величина
5
Дисперсия
«20 октября» 2007 г.
Эти ошибки называются ошибками выборки, т.к. значения, отобранные в выборку являются случайными, следовательно, ошибки в выборке являются также случайными.
– число; – интервал.
Разность между генеральной средней и выборочной средней может оцениваться – средняя ошибка, – предельная ошибка. Средняя () ошибка является стандартной ошибкой является точечной величиной, которая выражается одним числом, а именно средним квадратическим отклонением от математического ожидания выборочной средней и рассчитывается в : , , .
Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя, т.е. предельная ошибка является интервальной:
Используются специальные обозначения (см.таблицу выше) и ошибка лежит в интервале: .
Вопрос 2. Способы формирования выборочной совокупности
Существует 5 видов выборки:
1. собственно случайная – отбор единиц из генеральной совокупности производится случайным образом.
Пример 1.: с помощью датчика «Что? Где? Когда?»
2. механическая выборка – сначала совокупность упорядочивается по определению признака, а потом из нее выбираются единицы через равные промежутки.
Пример 2.: каждая 5-я единица = 20%; каждая 10-я = 10%; 50-я = 2%.
3. типическая выборка – совок. предварительно распределяется на отдельные группы однотипных элементов, т.е. однородных по какому-либо признаку, а затем из каждой группы отбираются единицы пропорционально удельному весу каждой группы.
Пример 3.: выборка по национальности:
80% - русских;
10% - украинцев; от объема выборки будут браться их ответы
7% - латышей;
3% - прочие национальности.
4. серийная выборка – заключается в случае выбора не отдельных единиц, а групп единиц одинаковой численности, а затем из каждой группы и серии единиц обследуется случайным образом.
5. комбинированная выборка – используют различные виды выборки.
По способу выборки выделяют:
А) повторный отбор – после попадания единицы в выборку она вновь возвращается в генеральную совокупность (N) – если возвращается, то Т – постоянна (конфета = отказ от нее = возврат в вазу);
Б) бесповторный отбор – отобранная единицы в выборочную совокупность в генеральную больше не возвращается (конфета = съедена = в вазу не вернется).
Чаще всего в социально-экономических исследованиях применяется бесповторная выборка.
Вопрос 3. Средняя и предельная ошибка выборки
При использовании выборочного метода достоверность генеральных параметров (параметров генеральной совокупности) прежде всего зависит от репрезентативности выборки, т.е. от того, на сколько полно и адекватно представлена в выборке (n) генеральная совокупность (N).
Единицы отбираются в выборку случайным образом, а следовательно ошибки также случайны.
Выделяют ошибки:
А) средняя ошибка ;
Б) предельная ошибка ;
Применяют следующие формулы:
Для средней
Для доли
Повторный отбор
Бесповторный отбор
Предельная ошибка выборки – определяет границы в пределах, которых будет лежать генеральная средняя :
(Формула 1)
Таблица Лапласа
p
0,683
0,95432
0,997
t
1,0
2,0
3,0
где p – вероятность, а t – коэффициент доверия или кратности.
В математической статистике доказано, что предельная ошибка является кратной средней ошибкой с коэффициентом кратности t, значение которого зависит от доверительной вероятности p по таблице Лапласа.
t – еще называют в некоторых учебниках коэффициентом доверия.
Однократная будет всегда 68,3%.
р – доверительная вероятность, еще называют уровнем надежности.
Пример 4.: Для определения срока (средней) пользования краткосрочным кредитом в банке была произведена 5% механическая выборка, в которой попало 100 счетов. В результате обследования выборки установлено, что средний срок пользования краткосрочным кредитом составляет 30 дней, при средне квадратическом отклонении 9 дней. В 5-ти счетах из 100 срок пользования кредитом превысил 60 дней с вероятностью 0,954 (р=0,954, t=2) определить пределы, в которых будет находиться срок пользования краткосрочным кредитом по банку в целом, а также долю счетов со сроком пользования краткосрочным кредитом более 60 дней.
Решение:
n=100
N=2000 (n=100 ->5%->N=2000)
p=0,954, t=2,0
(дн.)
(дн.)
Вывод: т.е. с вероятностью 0,954 можно утверждать, что средний срок пользования краткосрочным кредитом в банке составляет от 28 до 32-х дней.
Для доли расчет предельной ошибки рассчитываем по формуле 1.
:
, где p – это доля в генеральной совокупности.
Ответ: с вероятностью 0,954 следует ожидать, что от 0,8% до 9,2% клиентов не вернут кредиты в средний срок 30 дней, а превысят 60 дней.
Вопрос 4. Определение необходимого объема выборки
Для планирования выборочного наблюдения необходимо знать объем выборки. Существуют специальные формулы для определения объема выборки:
Бесповторный отбор
Повторный отбор
Пример 5.: В микрорайоне проживает 2000 семей. Необходимо провести выборочное обследование методом случайного бесповторного отбора для нахождения среднего размера численности семьи. Определить необходимость объема выборки при условии, что с вероятностью р=0,954 ошибка выборки не превысит 1-го человека при среднеквадратическом отклонении 3 человека.
Решение:
N=2000
p=0,954, t=2,0 – 2-х кратная ошибка
Вывод: для того, чтобы обеспечить эту надежность (р=0,954) необходимо обследовать 35 семей.
ТЕМА 7. Корреляционно-регрессионный анализ
в социально-экономических явлениях
• Вопрос 1. Понятие о корреляционной связи. Виды и формы корреляционной связи;
• Вопрос 2. Корреляционный метод анализа взаимосвязи;
• Вопрос 3. Регрессионный метод анализа взаимосвязи;
• Вопрос 4. Пример построения однофакторной модели связи;
Вопрос 1. Понятие о корреляционной связи.
Виды и формы корреляционной связи
Выделяются факторные и результативные признаки.
Факторные связи проявляются в том. Что изменение величины факторного признака (x) ведет к изменению результативного признака (y), т.е.
x1, x2, …, xn
y1, y2, …, yn – но строго одно, однако существует редко, а в жизни, как правило, несколько.
x y
16 20
20 24 систематически
24 40
60 90
70 116
20
40
90 нет четкой взаимосвязи, следовательно, нет связи.
24
116
x1 соответствует y1; x2 соответствует y2; xn соответствует yn – строго определенное и одно.
Среди факторных связей различают:
1. функциональная связь – означает, что каждое возможное значение признака xi отвечает одно (или несколько) строго определенное значение yi, т.е. может задать связь:
yi=f(xi) (Формула 1)
Как только задан параметр xi, можно найти yi.
Например, y=kx, где k – коэффициент пропорции, x – издержки на выпуск продукции, т.е. затраты, y – объем продукции:
НО!!! В социально-экономических явлениях функциональная связь проявляется крайне редко, поскольку на результативный признак y, помимо изучаемого фактора x, воздействует целый ряд других факторов. НО!!! Проблема в чем? Действие этих факторов и сила действия этих факторов не известна и меняется в зависимости от некоторых обстоятельств.
Например, с ростом дохода на 20% нельзя однозначно утверждать, что расходы на питание также возрастут на 20%, т.к. в какой-то семье возрастет на 1%, в другой снизится на 0,5% => однозначная связь отсутствует.
2. стохастическая связь – каждому значению x соответствует уже множество значений y:
(Формула 2)
– при котором одному и тому же значению факторного признака (x) соответствует множество (некоторые) различных значений (y)
yi=f(xi)
причем, появление каждого результативного значения складывается не только под воздействием фактора x, но и других, не учитываемых в данных исследованиях факторов, т.е. появление каждого результативного значения xi случайно.
В экономических явлениях присутствуют стохастические связи между факторными и результативными признаками.
Модель стохастической связи
,
где – это некоторая функция, определяющая только ту часть значения (y), которая формируется под воздействием фактора (x),
а – это часть результативного значения (y), которое формируется под воздействием случайных факторов или эти факторы невозможно контролировать.
«27 октября» 2007 г.
Статистика изучает закономерные связи. Это связь может быть корреляционной и некорреляционной.
Среди стохастических связей выделяют:
1. статистические (закономерные)
2. нестатистические (хаотические)
Стохастическая связь – это такая связь, при которой одному и тому же значению характерного признака может соответствовать некоторое множество различных значений результативного признака.
Статистическая связь означает, что если значение факторного признака (х) понижается/возрастает, то возрастают/понижаются значения результативного признака, т.е. при статистической связи рассматриваются систематические закономерные изменения признаков (у).
1. Корреляционная связь – если с изменением фактора X происходит систематические изменения средних значений результативного признаков, то эта связь корреляционна между Х и средними значениями (статистическая связь).
2. Не корреляционная связь – если средние значения результативного признака (Y) меняются не систематически, но систематически меняются некоторые другие параметры, то связь является не корреляционной, но статистической (статистич. связь).
3. Хаотическая связь – если ни один обобщающий параметр не меняется систематически, то статистической связи нет (Броуновское движение).
В соответствии с формулой , когда каждому х, соответствует множество результативных значений, то принято брать некоторый обобщающий параметр, или , или дисперсию по - коэффициент детерминации, а в компьютере она обозначается как R2.
Прямая связь – с увелич-ем значения (Х), среднее значение (Y) также возрастет.
Обратная связь – с увелич-ем факторного знач. (Х) среднее значение (Y) уменьш.
Параболическая связь – значения доходят до экстремумов, а потом значения пониж.
Бывают однофакторные и многофакторные связи. Если корреляционная связь описывается зависимостью (Y) от одного фактора (Х), то она называется однофакторной корреляционной моделью (парная корреляция).
Если зависимость более чем одного фактора, то данная модель многофакторная:.
Вопрос 2. Корреляционный метод анализа взаимосвязи;
В анализе взаимосвязей фактора Х и результата Y возникает два вопроса:
1. Существует ли между X и Y корреляционная связь?
2. Установить степень влияния факторного признака на результативный, т.е. тесноту связи.
Для решения вопроса 1 существует 4 метода:
1. Графический метод33;
2. Метод параллельных рядов;
3. Метод корреляционных таблиц
4. Метод аналитической группировки34.
Графический метод заключается в построении корреляционного поля или эмпирической линии связи35. Ряд может быть интервальный.
Метод параллельных рядов:
Дан не ранжированный ряд.
x
3
3
4
5
5
6
7
y
2
2
2
8
6
6
10
Видим, что возрастает в значении 8, за исключением 8.
Этот метод применим лишь при малых объемах совокупности, когда выборка меньше или равна 30.
В этом случае значение Х располагается в возрастающем порядке, а значение Y – результат или систематически возрастает, или систематически убывает.
В нашем примере рост есть, но имеет одно отклонение.
Метод корреляционных таблиц.
Зависит ли площадь от цены
Xi
Yi
Общая площадь, кв.м. S
Продано квартир по цене, тыс. у.е.
9-11 (10)
11-13 (12)
13-15 (14)
15-17 (16)
17-19 (17)
А
1
2
3
4
5
6
7
до 25 (20-25)
26
12
2
-
-
40
10,8
25-30 (22,5)
4
9
12
5
-
30
13,2
30-35 (27,5)
-
4
6
10
4
24
15,2
35 и более (37,5)
-
-
-
-
6
6
18,0
Итого:
30
25
20
15
10
100
Используется в тех случаях, когда значения X и Y заданы в виде интервалов. В этом случае строится таблица, в которой производная группировка по факторному и результативному признакам.
По факторному группы располагаются в троках, по результативному в столбцах и на пересечении строк и столбцов появляется пара (Xi; Yi).
Xi – принадлежит i-ому интервалу факторного признака, а Yi – принадлежит i-ому интервалу результативного признака.
В нашем примере имеется взаимосвязь между распределением проданных квартир по размеру их общей площади S(x) и количеству проданных квартир по цене (y).
По виду корреляционной таблицы можно определить: существует ли связь между фактором X и результативным Y.
Если в корреляционной таблице частоты вдоль некоторой диагонали, то можно предположить, что связь имеет место.
Если (наш случай) диагональ направлена от левого верхнего угла к нижнему правому, то имеет место прямая корреляционная связь.
Если диагональ от верхнего правого к нижнему левому углу, то связь обратная корреляционная.
Если частоты не концентрируются вдоль какой-либо линии, то корреляционная связь отсутствует.
Метод аналитической группировки.
Строится по факторному признаку и для каждой выделенной группы находится среднее значение и строится таблица.
Аналитическая таблица зависимости между стоимостью и размером проданных квартир.
Размер, кв.м. (xi)
Количество проданных квартир (f)
Стоимость квартир
всего по группе, тыс. у.е.
в среднем по группе, тыс. у.е.
1
2
3
4
до 25
40
432,0
10,8
25-30
30
396,0
13,2
30-35
24
364,8
15,2
35 и более
6
108,0
18,0
Итого:
100
Рассчитаем среднее значение для 1 группы. В данному примере выделяются 4 группы факторных значений, следовательно необходимо найти 4 средних значения y (стоимость проданных квартир).
Поскольку использованы интервальные значения y и x, то при расчете средней надо брать центр интервала.
Расчет среднего значения по каждой группе произведем по формуле средне арифметической взвешенной: , в нашем случае x=y, и для 1-й группы берем центр интервала
Если при построении группировки (аналит.) с возрастанием значения x, возрастают средние значения , то имеет место прямая корреляционная связь.
Если с возрастанием x убывает, то имеет место обратная корреляц. связь.
Если систематически значения не изменяются, то корреляц. связи нет.
Задачи измерения тесноты связи решаются с использованием аналитической группировки и специальных коэффициентов, в качестве которых используются:
1. коэффициент эмпирической корреляции:
,
который измеряет вариацию результативного признака y только за счет влияния группировочного фактора x признака y, обусловленное влиянием всех воздействующих факторов.
2. коэффициент детерминации (мера и теснота):
36,
показывает меру влияния вариации фактора x на вариацию признака y.
3. линейный коэфф. корреляции, используется только в линейной связи:
– линейный коэффициент.
Шкала Чэддока
Величина коэффициента корреляции
Характер связи
0,1-0,3
слабая
0,3-0,5
умеренная
0,5-0,7
заметная
0,7-0,9
высокая
0,9-0,99
весьма высокая
1,0
функциональная связь
Вопрос 3. Регрессионный метод анализа взаимосвязи
Эмпирическая линия регрессии, построенная по точкам:
– сглаженная линия (уравнение прямой) – теоретические значения.
Регрессионный анализ заключается в нахождении формулы для выражения функции , причем эта функция должна быть приведена таким образом, чтобы расхождения между фактическими данными и полученными по формуле были минимальными.
, где – случайности отклонения, т.е.
– сглаживающая линия,
Изломы этой линии (штрих) указывает на действия случайных факторов, которые не учитываются в модели.
Для того чтобы абстрагироваться от влияния случайных факторов используют выравнивание ломаной линии по некоторой плавной сглаживающей кривой.
Эту сглаживающую линию называют теоретической линией регрессии (линия регрессии).
Она отражает теоретическую формулу связи. Эта связь возникает при условии полного взаимопоглощения всех прочих факторов случайных по отношению к фактору x.
Уравнение, которое описывает теоретическую линию регрессии называют уравнением регрессии.
Формула (1)
где f(x) – какая-то неизвестная функция, а – средняя величина признака, которая изменяется.
f(x) – функция, которая устанавливает вид однозначной зависимости между этими величинами – это расчетные теоретические значения.
Наиболее часто используются следующие типовые функции:
линейная Формула (2)
параболическая связь
и другие.
Наиболее часто применяется линейная зависимость:
, где а0 – свободный член, а1 – коэффициент регрессии, который указывает на сколько единиц в среднем меняется результативный признак при изменении факторного значения на единицу его измерения.
В математической статистике доказано, что
т.е. дает совпадение в сумме:
Используя критерий минимизации можно получить значения неизвестных, коэффициент уравнения регрессии:
Система нормальных уравнений:
Формула (3)
и, соответственно
расчет коэффициента регрессии a1 и свободного члена a0:
Формула (4)
При использовании других типовых функций образуются иные системы нормальных уравнений, для которых определены значения искомых параметров.
Решив уравнение регрессии и получив коэффициент уравнения, их необходимо проверить на неслучайность, т.е. статистическую значимость.
Вопрос 4. Пример построения однофакторной модели связи
Пример. Исследовать зависимость между суточной стоимостью туристической путевки и длительностью отдыха.
№ путевки
Длительность отдыха в днях (xi)
Суточная стоитмость путевки, у.е. (yi)
Расчетные графы
1
2
3
4=2*3
5=2*2
6
7
1
5
78
390
25
91,6
185,0
2
14
55
770
196
52,5
6,2
3
7
95
665
49
82,9
146,4
4
18
30
540
324
35,1
26,0
5
14
53
742
196
52,5
0,2
6
20
26
520
400
26,4
0,2
7
7
85
595
49
82,9
4,4
8
15
50
750
225
48,1
3,6
Итого:
100
472
4972
1464
472,0
372,0
100
80
60
40
20
5 10 15 20
Рассчитаем произведение фактора x на y и значение x2. Используем систему нормальных уравнений:
Подставим имеющиеся данные:
,
n=8, т.к. всего 8 путевок
,
Т.е. уравнение регрессии будет иметь вид:
-4,34 – это коэфф. регрессии, который означает, что с увеличением длительности отдыха на 1 день, суточная стоимость путевки в среднем дешевеет на 4,34 у.е.
Приведем в таблице расчет граф 6 и 7.
Аналогично рассчитаем другие значения и внесем в таблицу.
Д.З.: Построить график между хi и
Рассчитаем квадрат отклонения фактических данных от теоретических:
Остальные по аналогии
Сумма отклонений рассчитываемых значений признака от теоретических 372, означает, что в случае использования линейной зависимости мы не сделали расхождение меньше 372 у.е.
Проверка адекватности регрессионной модели – см. стр. 20-32 лабораторки №2, но на экзамене не будет.
Расчет линейного коэффициента корреляции:
Связь получилась весьма тесной обратной.
Значение коэффициента корреляции показывает, что в уравнении регрессии связь между суточной стоимостью путевок и длительностью отдыха является тесной и обратной.
ТЕМА 8: Ряды динамики
в анализе социально-экономических явлений
• Вопрос 1. Понятие и классификация рядов динамики
• Вопрос 2. Статистические показатели ряда динамики
• Вопрос 3. Метод скользящей средней
• Вопрос 4. Метод аналитического выравнивания
• Вопрос 5. Расчет индекса сезонности
Вопрос 1. Понятие и классификация рядов динамики
Значение ряда во времени.
Ряды динамики – это статистические данные, отражающие развитие изучаемого явления во времени.
Например, ряд динамики состоит из 2-х элементов:
1. показатели времени (t) – годы, кварталы и т.д.
2. значение уровня характеризующее состояние явления и статистические показатели
Год (t)
Производство тканей, млн.кв.м (у)
1
2
1999
256
2000
267
2001
279
2002
291
2003
305
Итого:
1398
Ряд на указанный момент или период. Подразумевается, что период 01.01.1999-31.12.1999, а не просто 1999 год, т.е. интервальный ряд.
Для моментных рядов данные будут приведены следующим образом, см. пример 8.2.2. Известны товарные остатки магазина на 1-е число каждого месяца:
период
товарные остатки, тыс.руб.
на
1 янв
620
на
1 фев
680
на
1 мар
690
на
1 апр
710
на
1 май
670
на
1 июн
720
на
1 июл
710
Итого:
4800
Классификация рядов динамики:
1. по способу выражения:
а) ряд абсолютных величин
б) ряд средних величин
в) ряд относительных величин
2. в зависимости от того, как уровни отражают состояние явления – моментные и интервальные.
3. в зависимости от расстояниями между уровнями ряда – равно отстоящие и не равно отстоящие ряды.
Сопоставимость уровней рядов динамики
Рассмотрим на примере. Для того, чтобы ряды динамики были приведены к сопоставимому виду использовать специальный прием – смыкание ряда динамики.
объем реализации, млн.руб.
период
1999
2000
2001
2002
2003
2004
2005
продукция 10 предприятий
120
125
130
140
-
-
-
продукция 12 предприятий
-
-
-
168
180
195
215
сомкнутый ряд
144
150
156
168
180
195
215
Непосредственно сопоставлять несомкнутый ряд нельзя, т.к. эти ряды относятся к разному числу предприятий.
Средние показатели ряда динамики
Различают следующие средние показатели:
- средний уровень ряда динамики
- средний абсолютный прирост
- средний темп роста
При изучении в рядах динамики основной тенденцией развития явления применяют различные приемы и методы:
1. метод укрупнения интервалов;
2. метод скользящей средней
3. метод аналитического выравнивания:
, где f(t) – некоторая функция зависимости во времени показателей ряда, мы принимаем линейную функцию.
В рядах динамики важное значение имеет изменение (выявление сезонных колебаний)
где – средняя для каждого месяца за изучаемый период, – это общий средний месячный уровень за изучаемый период.
Для того, чтобы исчислить сезонную волну, применяют индекс сезонности. Она представляет собой отклонение от оси параллельно оси t (12 месяцев) (абсцисс) во времени.
Материал, который дал нам преподаватель:
Ряды динамики это статистические данные, отображающие развитие изучаемого явления во времени.
Ряд динамики состоит из двух элементов: в нем указываются моменты времени (обычно дата) или периоды времени (год, квартал, месяц, сутки), к которым относятся приводимые статистические данные и статистические показатели уровни ряда, характеризующие состояние явления на указанный момент или за период.
Ряды динамики классифицируют следующим образом.
1. В зависимости от способа выражения уровней различают ряд абсолютных величин, ряд средних величин, ряд относительных величин.
2. В зависимости от того, как уровни ряда отражают состояние явления: на определенные моменты времени (начало месяца, квартала, года и т. п.) или за определенные интервалы времени (за сутки, месяц, год и т. п.), различают соответственно моментные и интервальные ряды динамики.
3. В зависимости от расстояния между уровнями ряды динамики могут быть с равноотстоящими уровнями и неравноотстоящими уровнями во времени.
4. В зависимости от наличия основной тенденции изучаемого процесса ряды динамики бывают стационарными и нестационарными.
5. По числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики.
Сопоставимость уровней рядов динамики. Уровни ряда динамики должны быть сопоставимы по методологии учета и расчета показателей, территориальным границам, кругу охватываемых объектов, единицам измерения и другим признакам. В тех случаях, когда уровни ряда динамики оказываются несопоставимы между собой, их необходимо привести к сопоставимому виду, применяя прием, который называют смыканием рядов динамики.
Для количественной оценки динамики социально-экономических явлений применяются следующие статистические показатели: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста.
Средние показатели ряда динамики являются обобщающей характеристикой его абсолютных уровней, абсолютной скорости и интенсивности изменения уровней ряда динамики.
Различают следующие средние показатели: средний уровень ряда динамики, средний абсолютный прирост, средний темп роста и прироста.
Методы расчета среднего уровня ряда динамики зависят от его вида и способов получения статистических данных.
Выявление основной тенденции ряда динамики. При изучении в рядах динамики основной тенденции развития явления применяются различные приемы и методы: метод укрупнения интервалов, метод скользящей средней, метод аналитического выравнивания.
Наиболее эффективный метод выявления основной тенденции развития аналитическое выравнивание. В этом случае уровни ряда динамики выражаются в виде функции времени:
Аналитическое выравнивание может быть осуществлено по любому рациональному многочлену. Функция выбирается на основе анализа характера закономерности динамики данного явления.
Колеблемость динамических рядов. Основная тенденция показывает, как систематические факторы воздействуют на уровень ряда динамики, а колеблемость уровней тренда служит мерой воздействия остаточных факторов.
Мерой колеблемости динамического ряда выступает средний квадрат отклонений фактических уровней, исчисленных по тренду. Ее можно измерить показателем среднего квадратического отклонения.
Относительной мерой колеблемости является коэффициент вариации, равный отношению среднего квадратического отклонения к среднему уровню ряда.
Измерение сезонных колебаний. При анализе рядов динамики важное значение имеет выявление сезонных колебаний. Этим колебаниям свойственны более или менее устойчивые изменения уровней ряда по внутригодовым периодам: месяцам, кварталам. Для выявления сезонных колебаний обычно анализируются месячные и квартальные уровни ряда динамики за год или несколько лет. При изучении сезонных колебаний используются специальные показатели индексы сезонности (Is):
где средняя для каждого месяца за изучаемый период;
общий средний месячный уровень за изучаемый период.
Совокупность исчисленных для каждого годового цикла индексов сезонности характеризует сезонную волну развития явления во внутригодовой динамике и наглядно может быть представлена графическим методом. При наличии ярко выраженной тенденции развития (увеличение или уменьшение уровней из года в год) применимы другие способы измерения сезонных колебаний, в частности, индексы сезонности определяются на основе методов, которые позволяют исключать влияние тенденции роста (падения).
В таких случаях фактические данные сопоставляются с выровненными, и индексы сезонности определяются по формуле:
где yi исходные уровни ряда;
выровненные (теоретические) уровни ряда;
n число годовых периодов.
Выравнивание может быть проведено методом аналитического выравнивания или методом скользящей средней.
Вопрос 2. Статистические показатели ряда динамики
Пример 8.2.1 Имеются следующие данные о динамике производства тканей в одном из регионов за 1999–2003 гг.:
Аналитические показатели уровня ряда получаются сравнением уровней между собой. Сравниваемый уровень принято называть текущим, а уровень, с которым происходит сравнение, базисным. За базу сравнения обычно принимают предыдущий уровень или начальный уровень ряда динамики.
При сравнении каждого уровня с предыдущим получаются цепные показатели. Если же сравнение ведется с одним уровнем (базой), то показатели называются базисными.
Для выражения абсолютной скорости роста (снижения) уровня ряда динамики исчисляют статистический показатель абсолютный прирост (y). Его величина определяется как разность двух сравниваемых уровней и вычисляется следующим образом:
y уi у0 базисные показатели;
y уi уi 1 цепные показатели,
где уi уровень i-го периода (кроме первого);
у0 уровень базисного периода;
уi 1 уровень предыдущего периода.
Абсолютное значение 1% прироста – это отношение абсолютного прироста на соответственно темп роста выраженный в процентах.
У нас в таблице для 2000 года этот показатель равен абсолютный прирост (4,3) делим на соответствующий темп прироста, равный 11:4,3=2,56.
Начальный уровень ряда всегда берется за 100%. Сравниваемый уровень называется текущий, а тот с которым сравнивают базисный.
В том случае, если сравниваемый уровень анализируется с начальным уровнем – это базисные показатели, а если с уровнем уi 1 с предыдущим, то это ценные показатели.
1998 – 20 – данных за 1997 год нет, поэтому 1998 год.
1999 – 25 – принят за 1 ед. Темп роста показателя базисный в 100% (1 ед.), т.е. абсолютного изменения уровней нет.
1998 – база сравнения.
Для нашего примера рассчитаем средний уровень по формуле средней арифметической простой:
Вывод: в среднем за год было произведено 279,6
В примере 1 абсолютный прирост по сравнению с 1999 г. составит:
■ в 2000 г. y 267 256 11 (млн м2);
■ в 2001 г. y 279 256 23 (млн м2) и т. д.
Рассчитаем цепные показатели абсолютного прироста для примера 1. Абсолютный прирост составит:
■ в 2000 г. по сравнению с 1999 г. y 267 256 11 (млн м2);
■ в 2001 г. по сравнению с 2000 г. y 279 267 12 (млн м2) и т. д.
Интенсивность изменения уровней ряда динамики оценивается отношением текущего уровня к предыдущему или базисному. Этот показатель называется коэффициентом роста, или темпом роста (Тр), и выражается в процентах:
базисные показатели;
цепные показатели.
Если Тр больше 100%, уровень растет, если меньше уровень уменьшается. Тр всегда положительное число.
В примере 1 темп роста составит:
■ в 2000 г. по сравнению с базисным 1999 г.:
■ в 2001 г. по сравнению с базисным 1999 г.:
Рассчитаем цепные показатели темпа роста для примера 1. Темп роста составит:
■ в 2000 г. по сравнению с базисным 1999 г.:
■ в 2001 г. по сравнению с 2000 г.:
Для выражения изменения величины абсолютного прироста уровней ряда динамики в относительных величинах определяется темп прироста (Тпр), который рассчитывается как отношение абсолютного прироста к базисному или предыдущему уровню:
базисные показатели;
цепные показатели.
Темп прироста может быть вычислен также путем вычитания из темпов роста 100%, т. е. Тпр Тр 100%.
Для примера 1 рассчитаем темп прироста:
■ в 2000 г. по сравнению с базисным 1999 г.:
Tпр 104,3% 100% 4,3%;
■ в 2001 г. по сравнению с базисным 1999 г.:
Tпр 109% 100% 9% и т. д.
Показатель абсолютного значения 1% прироста (|%|) определяется как результат деления абсолютного прироста на соответствующий темп прироста, выраженный в процентах.
или
0,01yi 1.
В примере 1 абсолютное значение прироста 1% составит:
■ в 2000 г. по сравнению с 1999 г.:
|%| 0,01y1999 г. 0,01 256 2,56 (млн м2);
■ в 2001 г. по сравнению с 2000 г.:
|%| 0,01y2000 г. 0,01 267 2,67 (млн м2) и т. д.
Приведенная в примере 1 таблица с вычислениями характеристик изменения уровней позволяет проводить анализ данного динамического ряда.
В примере 1 мы имеем интервальный ряд динамики с равноотстоящими уровнями во времени, поэтому средний уровень ряда рассчитаем по формуле средней арифметической простой:
где итог суммирования уровней за весь период;
n число периодов.
Для нашего примера рассчитаем средний уровень по формуле средней арифметической простой:
Средний объем производства тканей за пять лет составил:
Вывод: в среднем за год было произведено 279,6 млн.м2.
Средний абсолютный прирост определяется по формуле:
В примере 1 среднегодовой прирост производства тканей за 19992003 гг. равен:
Среднегодовой темп роста вычисляется по формуле средней геометрической:
где n число коэффициентов роста, yn – значение показателя в анализируемом периоде, y0 – значение базового уровня.
Среднегодовой темп роста производства тканей за 19992003 г. (пример 1) рассчитаем двумя способами: берем из таблицы – ценные темпы роста.
- отношение уровня конечного к начальному.
Тр и Тприроста (6-7 колонки – хвостики – сравнение со 100%). Колонка №6=4-100
Среднегодовой темп прироста получим, вычтя из среднего темпа роста 100%. В примере 1:
Если интервальный ряд динамики имеет неравноотстоящие уровни, то средний уровень ряда вычисляется по формуле средней арифметической взвешенной:
где t число периодов времени, в течение которых уровень не изменяется.
Для моментного ряда с равноотстоящими уровнями средний уровень ряда вычисляется по формуле средней хронологической.
Вычисление среднего уровня ряда
В примере 8.2.2 подчеркнем предлоги «на» – это подсказка. Данные суммировать экономически абсурдно, т.к. имеет место повторный счет, ряд моментный.
Пример 8.2.2. Известны товарные остатки магазина на 1-е число каждого месяца 2003 г.
В данном случае мы имеем моментный ряд с равноотстоящими уровнями, поэтому средний уровень ряда определим по формуле средней хронологической, которая рассчитывается следующим образом, т.е. уравновешиваем остатки и тогда это имеет экономический смысл37:
где n — число уровней ряда.
Средние товарные остатки за полугодие составят:
Пример 8.2.3 Известна численность работников предприятия на следующие даты:
В данном случае мы имеем моментный ряд динамики с разноотстоящими уровнями, поэтому средний уровень ряда рассчитаем по формуле средней хронологической для разноотстоящих уровней динамики, эта формула на подобии средней арифметической взвешенной:
Среднесписочная численность работников составит:
Вопрос 3. Метод скользящей средней
Покажем применение скользящей средней на следующем примере. Для примера 8.3.1 построим график зависимости (y) – урожайность зерновых центнер с гектара и (t) – время (год). Полученная ломанная по фактическим данным имеет по своей структуре значительные изгибы, изломы, впадины и не пригодна для анализов, применяют 3 метода «сглаживания» уровней ряда:
1. укрупнение интервалов
2. скользящая средняя
3. аналитическое выравнивание.
Тренд – плавное и устойчивое изменение уровня во времени.
Вышеперечисленные методы позволяют выявить линию тренда.
Пример 8.3.1. На основе данных об урожайности зерновых культур в хозяйстве за 1989–2003 гг. проведем сглаживание ряда методом скользящей средней.
Динамика урожайности зерновых культур в хозяйстве за 1989–2003 гг. и расчет скользящих средних
В этом примере графа 2 – урожайность 1, 2, 3-го годов: 19,5+23,4+25=67,9/3=22,6.
Поскольку средняя, поэтому ставим в 90-й год. Строим по третьей колонке – трехлетнее скользящее среднее. 4-я колонка – середины нет, центрируем интервалы, колонка 6.
Нужно дорисовать этот график, т.е. тут должно быть: аналитическое выравнивание, скользящая средняя, укрупнение интервалов.
1. Рассчитаем трехлетние скользящие суммы.
Находим сумму урожайности за 1989–1991 гг.:
19,5 23,4 25,0 67,9
и записываем это значение в 1991 г. Затем из этой суммы вычитаем значение показателя за 1989 г. и прибавляем показатель за 1992 г.:
67,9 – 19,5 22,4 70,8
и это значение записываем в 1992 г. и т. д.
2. Определим трехлетние скользящие средних по формуле простой средней арифметической:
Полученное значение записываем в 1990 г. Затем берем следующую трехлетнюю скользящую сумму и находим трехлетнюю скользящую среднюю: 70,8 : 3 23,6, полученное значение записываем в 1991 г. и т. д.
Аналогичным образом рассчитываются четырехлетние скользящие суммы. Их значения представлены в графе 4 таблицы данного примера.
Четырехлетние скользящие средние определяются по формуле простой средней арифметической:
Это значение будет отнесено между двумя годами — 1990 и 1991 гг., т. е. в середине интервала сглаживания. Для того чтобы найти четырехлетние скользящие средние центрированные, необходимо найти среднюю из двух смежных скользящих средних:
Эта средняя будет отнесена к 1991 г. Аналогичным образом рассчитываются остальные центрированные средние; их значения записываются в графу 6 таблицы данного примера
Суть метода скользящей средней состоит в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем средний уровень из того же числа уровней, начиная со второго, далее начиная с третьего и т. д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий.
Средняя из нечетного числа уровней относится к середине интервала. Если интервал сглаживания четный, то отнесение средней к определенному времени невозможно, она относится к середине между датами. Для того чтобы правильно отнести среднюю из четного числа уровней, применяется центрирование, т. е. нахождение средней из средней, которую относят уже к определенной дате.
Вопрос 4. Метод аналитического выравнивания
Рассмотрим применение метода аналитического выравнивания по прямой для выражения основной тенденции на примере.
Пример 8.4.1. Исходные и расчетные данные определения параметров уравнения прямой:
Год – Т, урожайность зерновых, ц/га – y.
Расчет необходимых значений дан в таблице примера. По итоговым данным определяем параметры уравнения:
А=T, 1=y
(по 5-й колонке)
Изломы мы убрали случайности, сделали уравнение для того, чтобы сделать прогноз на другие года (экстраполяция).
Уравнение прямой будет иметь вид, где t=8+восьмой уровень
1989-1993=19,5+23,4+25,0+22,4+25,5/5=23,16, средний 1991
1994-1998=28,8+26,6+30,4+20,7+35,8/5=28,34, средний 1996
1999-2003=36,0+25,6+32,5+35,0+27,2/5=31,26, средний 2001
Подставляя в уравнение принятые обозначения t, вычислим выровненные уровни ряда динамики (см. значения в таблице).
На основе данных таблицы рассчитаем показатели колеблемости динамических рядов, которые характеризуются средним квадратическим отклонением и коэффициентом вариации.
Среднее квадратическое отклонение можно измерить по формуле:
Используя данные нашего примера, рассчитаем показатель колеблемости урожайности зерновых культур за анализируемый период:
Коэффициент вариации исчисляется по формуле:
В нашем примере:
Уравнение прямой при аналитическом выравнивании ряда динамики имеет следующий вид:
где выровненный (средний) уровень динамического ряда;
a0, a1 параметры искомой прямой;
t условное обозначение времени.
Способ наименьших квадратов дает систему двух нормальных уравнений для нахождения параметров a0 и a1:
где у исходный уровень ряда динамики;
n число членов ряда.
Система уравнений упрощается, если значения t подобрать так, чтобы их сумма равнялась нулю, т. е. начало времени перенести в середину рассматриваемого периода.
Если то
Исследование динамики социально-экономических явлений и установление основной тенденции развития дают основание для прогнозирования (экстраполяции) определения будущих размеров уровня экономического явления. Используют следующие методы экстраполяции:
■ средний абсолютный прирост;
■ средний темп роста;
■ экстраполяцию на основе выравнивания по какой-либо аналитической формуле.
Вопрос 5. Расчет индекса сезонности
Покажем расчет индекса сезонности на примере.
Пример 8.5.1. Имеются следующие данные по строительной фирме об объеме выполненных работ по месяцам 2001–2003 гг. по сметной стоимости.
Для получения проведем осреднение уровней одноименных периодов по формуле простой средней арифметической, объем выполнения работ за три года по:
январь —
февраль —
…
декабрь —
Осредненные значения уровней ряда для каждого месяца годового цикла представлены в таблице данного примера.
Далее по исчисленным месячным средним уровням определяем общий средний уровень
где n — число месяцев.
Значение общего среднего уровня можно вычислить также по итоговым данным за отдельные годы:
где n — число лет;
— сумма среднегодовых уровней ряда динамики.
В завершение определим индексы сезонности по месяцам года по формуле:
январь —
февраль —
Рассчитанные индексы сезонности представлены в таблице примера.
Следовательно, минимальный объем выполненных работ строительная фирма имела в январе, а максимальный — в августе.
Для ряда внутригодовой динамики, в которой основная тенденция роста незначительна, изучение сезонности основано на методе постоянной средней, являющейся средней из всех рассматриваемых уровней. Самый простой способ заключается в следующем: для каждого года рассчитывается средний уровень, а затем с ним сопоставляется (в процентах) уровень каждого месяца.
Однако помесячные данные одного года из-за элемента случайности могут быть ненадежными для выявления закономерности колебаний. Поэтому на практике используются помесячные данные за ряд лет (обычно не менее трех лет). Тогда для каждого месяца рассчитывается средняя величина уровня за три года, затем определяются среднемесячный уровень для всего ряда и отношение средних для каждого месяца к общему среднемесячному уровню ряда (в процентах).
ТЕМА 9. Индексный метод
и его применение в анализе социально-экономических явлений
• Вопрос 1. Понятие индексов. Их виды;
• Вопрос 2. Расчет сводного индекса;
• Вопрос 3. Расчет среднеарифметического индекса;
• Вопрос 4. Расчет среднегармонического индекса;
• Вопрос 5. Расчет индексов средних величин;
2000 год – 10 (q0)
2001 год – 12 (q1)
Для индекса: (значит на 20% больше)
Индекс p:
2000 г. – 100 руб. (p0)
2001 г. – 120 руб. (p1)
Для индекса: (значит цена поднялась на 20%)
Вопрос 1. Понятие индексов. Их виды;
Индексы – важнейший обобщающий показатель. С их помощью можно измерить динамику социально-экономического явления за два или более периодов времени, динамику среднего показателя и сопоставить уровни явления в пространстве, по странам, экономическим районам, областям и т. д. Индексы используются для определения степени влияния изменений значений одних показателей на динамику других, а также для пересчета значений макроэкономических показателей из фактических цен в сопоставимые.
Простейший показатель, применяемый в индексном анализе, индивидуальный (синтетический) индекс, который характеризует изменение во времени или в пространстве отдельных однородных элементов совокупности. Например, индивидуальные индексы физического объема продукции, цен, себестоимости единицы продукции.
В экономических расчетах чаще всего используются сводные, или общие, индексы, которые характеризуют изменение совокупности в целом.
Построение этих индексов является содержанием индексной методологии, в которой сложились две концепции: синтетическая и аналитическая.
Согласно синтетической концепции особенность общих индексов состоит в том, что они выражают относительное изменение сложных явлений, отдельные части которых непосредственно несоизмеримы, и поэтому индексы показатели синтетические.
В соответствии с аналитической концепцией индексы трактуются как показатели, необходимые для измерения влияния изменения составных частей, факторов сложного явления на изменение уровня этого явления. Поэтому индексной методологией предусматривается определение влияния каждого из факторов путем элиминирования влияния других факторов на уровень изучаемого явления. Такие индексы – показатели аналитические.
Общие индексы строят для количественных и качественных показателей. В зависимости от цели исследования и наличия исходных данных используют различные формы построения общих индексов: агрегатную или средневзвешенную.
При построении агрегатного индекса необходимо решить проблему выбора весов, при этом руководствуются следующим правилом: если строится индекс количественного показателя, то веса берутся за базисный период; если строится индекс качественного показателя, то используются веса отчетного периода.
В статистической практике, помимо агрегатных, применяются средневзвешенные индексы: среднеарифметический и среднегармонический.
Индексный метод служит также для изучения динамики средних величин и выявления факторов, влияющих на динамику средних. С этой целью исчисляется система взаимосвязанных индексов: переменного, постоянного состава и структурных сдвигов.
Индекс переменного состава представляет собой отношение двух взвешенных средних величин с переменными весами, характеризующими изменение индексируемого (осредняемого) показателя.
Индекс переменного состава (Iпер.с) для качественных показателей имеет следующий вид:
Величина этого индекса характеризует изменения средневзвешенной средней за счет влияния двух факторов: осредняемого показателя у отдельных единиц совокупности и структуры изучаемой совокупности.
Индекс постоянного состава (Iп.с) учитывает изменения только индексируемой величины, показывает средний размер изменения изучаемого показателя у единиц совокупности и выглядит следующим образом:
Для расчета индекса постоянного состава можно использовать агрегатную форму индекса:
Индекс структурных сдвигов (Iстр.сдв) характеризует влияние изменения структуры изучаемого явления на динамику среднего уровня индексируемого показателя и рассчитывается по формуле:
Под структурными изменениями понимается изменение доли отдельных групп единиц совокупности в общей их численности (d).
В индексах средних уровней в качестве весов могут быть взяты удельные веса единиц совокупности Тогда систему индексов можно записать в виде:
Система взаимосвязанных индексов имеет следующий вид:
Iпер.с = Iп.с Iстр.сдв.
При изучении динамики социально-экономических явлений за некоторый интервал времени, включающий в себя более двух периодов времени, используется система индексов: цепные индексы с переменными весами; цепные индексы с постоянными весами, базисные индексы с переменными весами, базисные индексы с постоянными весами.
Для сравнения (сопоставления) показателей в пространстве (по странам, экономическим районам, областям и т. п.) применяются территориальные индексы.
В рыночной экономике особую роль играют индексы цен, которые позволяют оценить динамику цен на товары, измерить инфляцию при макроэкономических исследованиях, пересчитать важнейшие стоимостные показатели системы национальных счетов (СНС) из фактических цен в сопоставимые и др. Для решения различных задач могут быть использованы индексы цен Г. Пааше и Э. Ласпейреса. Весами в индексе Г. Пааше выступает количество продукции текущего периода, а в индексе цен Э. Ласпейреса количество продукции базисного периода.
Средняя геометрическая из произведения двух агрегатных индексов цен Э. Ласпейреса и Г. Пааше представляет собой индекс цен И. Фишера.
Пересчет в основных стоимостных показателях СНС из фактических цен в сопоставимые осуществляется с помощью индекса-дефлятора. В основе расчета индекса-дефлятора лежит формула Г. Пааше агрегатная формула с текущими весами.
Вопрос 2. Расчет сводного индекса;
Рассмотрим методику расчета сводных индексов на конкретном примере
Пример 9.2.1. Имеются следующие данные о реализации овощной продукции на городском рынке:
Объем продаж p0q0 – товарооборот в базисном периоде, p1q1 – товарооборот в октябре, p0q1 – продажа товаров, когда q в отчетном периоде по ценам базового периода – синтетика (нереальное).
Индексы складывать нельзя их только делят или перемножают.
Цены разных товаров, реализуемых в розничной торговле, складывать неправомерно, однако с экономической точки зрения допустимо суммировать их товарооборот. Если сравнивать товарооборот в текущем периоде с его величиной в базисном периоде, то получим сводный индекс товарооборота:
Это общая формула индекса. Нужно проанализировать товарооборот, где – вес индекса, т.е. то, с чем мы измеряем.
Рассчитаем индекс товарооборота для примера 1, расчет абсолютного прироста товарооборота:
Мы получим, что товарооборот в целом по рассматриваемой товарной группе в текущем периоде по сравнению с базисным уменьшился на 0,9% (10099,1).
На величину данного индекса оказывает влияние как изменение цен на товары, так и изменение объемов их реализации. Для того чтобы оценить изменение только цен (индексируемой величины), необходимо количество проданных товаров (веса индекса) зафиксировать на каком-либо постоянном уровне. При исследовании динамики таких качественных показателей, как цена, себестоимость, производительность труда, количественный показатель обычно фиксируют на уровне текущего уровня. Таким способом получают сводный индекс цен:
Числитель данного индекса содержит фактический товарооборот текущего периода. Знаменатель же представляет собой условную величину, показывающую, каким был бы товарооборот в текущем периоде при условии сохранения цен на базисном уровне. Поэтому соотношение этих двух категорий и отражает изменение цен. Изменение же количества реализованной продукции не влияет на величину индекса.
Синтетика
Вычислим сводный индекс цен для примера 1, Индекс цен Пааше:
q1 – это вес. Объем продукции становится неизменным, изменяется цена. Следим за изменение цены, применяем синтетику.
Следовательно, по данной товарной группе цены в октябре по сравнению с августом снизились на 31,7%.
Числитель и знаменатель сводного индекса цен можно интерпретировать с точки зрения потребителей. Числитель представляет собой сумму денег, фактически уплаченных покупателями за приобретенные в текущем периоде товары. Знаменатель же показывает, какую сумму покупатели заплатили бы за те же товары, если бы цены не изменились. Разность числителя и знаменателя будет отражать величину экономии (если знак «») или перерасхода (если знак «») покупателей от изменения цен:
Третьим индексом в данной индексной системе является сводный индекс физического объема реализации. Он характеризует изменение количества проданных товаров не в денежных, а в физических единицах измерения, Индекс цен Ласперес:
Весами в данном индексе выступают цены, которые фиксируются на базисном уровне.
Индекс физического объема реализации в примере 1 составит:
Физический объем реализации в октябре по сравнению с августом увеличился в 1,45 раза, или на 51 500 руб. (165 500 – 114 000).
Между рассчитанными индексами существует следующая взаимосвязь:
Ip Iq =Ipq.
Используя взаимосвязь индексов, проверим правильность вычислений в примере 1:
Ipq Ip Iq 0,683 1,452 0,991, или 99,1%.
Следовательно, снижение товарооборота (на 0,9%) обусловлено ростом объема проданной продукции (на 45,2%) и снижением цен (на 68,3%), что в абсолютном выражении составило 1000 руб. (52 500 51 500).
Мы рассмотрели применение агрегатных индексов в анализе товарооборота цен и физического объема реализации. При анализе результатов производственной деятельности промышленного предприятия приведенные сводные индексы соответственно называются индексом стоимости продукции, индексом оптовых цен и индексом физического объема продукции.
Для того, чтобы рассчитать нужно рассчитать индекс Ласпереса по условию 9.2.1. Продажа товаров в базисном периоде по ценам отчетного:
Индекс Ласпереса отражает изменение цен, строится по продажам товара в базисном периоде. Он показывает на сколько изменились цены в отчетном периоде по сравнению с базисным, но по той продукции, которой была реализована в базисном периоде.
Он выражает экономию или перерасход, который могли бы получить покупатели, т.е. во сколько раз товары базисного периода подорожали/подешевели в результате изменения цен на них в отчетном периоде.
В нашем случае индекс цен равен 0,697, т.е. на 30,3% снизились цены на товары в базисном периоде только в результате изменения цен.
Индекс физического объема реализации.
К примеру 9.2.1.
Числитель сводного индекса товарооборота – это товарооборот в отчетном периоде, а знаменатель товарооборот в базисном.
Разность числителя и знаменателя даст абсолютный прирост товарооборота.
Iq – индекс физического объема товарной массы:
Соизмерителем веса являются цены товаров в базисном периоде, для того, чтобы индекс показал только бы изменение проданных товаров (индекс физического объема, индекс изменения товарной массы и т.д.).
Адуктивная модель (факторная) товарооборота.
, - П
Переменный состав по отношении 2-х средних индексов
Индекс структуры анализируемой доли является
Вопрос 3. Расчет среднеарифметического индекса
Рассмотрим методику расчета среднеарифметического индекса на следующем примере.
Пример 9.3.1. Имеются следующие данные о реализации овощной продукции предприятия розничной торговли округа:
Среднеарифметические индексы чаще всего на практике применяются для расчета сводных индексов количественных показателей, а из качественных показателей индекс производительности труда Струмилина.
В примере 1 известен розничный товарооборот базисного периода, но отсутствуют данные о товарообороте текущего периода; кроме того, известно изменение физического объема реализации в текущем периоде по сравнению с базисным. В таком случае среднеарифметический индекс физического объема реализации овощной продукции можно рассчитать по следующей формуле:
Так как iqq0 q1, формула этого индекса преобразуется в формулу:
Индивидуальные индексы физического объема для примера 1 равны: 0,935; 0,920; 1,015.
Физический объем реализации данных товаров в среднем снизился на 3,6%.
Вопрос 4. Расчет среднегармонического индекса
Рассмотрим методику расчета среднегармонического индекса на следующем примере.
Пример 9.4.1. Имеются следующие данные о реализации отдельных видов товаров предприятия розничной торговли округа:
104,2 – 1,042
102,3 – 1,023
99 – 0,990
Среднегармонический индекс рассчитывается в том случае, когда известны только отчетные (текущие) данные, а базисные данные отсутствуют, и известно лишь изменение в процентах или в виде индивидуального индекса.
В примере 1 имеются данные о розничном товарообороте текущего периода, но отсутствуют базисные данные и определены индивидуальные индексы цен по каждой товарной группе, поэтому рассчитаем среднегармонический индекс цен:
Цены по данным товарным группам в текущем периоде по сравнению с базисным в среднем возросли на 1,9%.
Среднегармоническое, т.к. неизвестен знаменатель, а там неизвестен был числитель:
где p0 базисный, а гармоника (среднегармоническое), ip – индивидуальный индекс цен.
Вопрос 5. Расчет индексов средних величин
Рассмотрим методику расчета индексов средних величин на примере.
Пример. Имеются следующие исходные данные о реализации продукции торговыми предприятиями акционерного общества (данные условные):
Предприятия АО
Базисный период
Отчетный период
Расчетные графы, тыс.руб.
цена, руб. (p0)
продано, шт. (q0)
цена, руб. (р1)
продано, шт. (q1)
p0q0
p1q1
p0q1
1
2
3
4
5
6=2*3
7
8=2*5
1
60
110
70
95
6 600
6 650
5 700
2
80
140
90
160
11 200
14 400
12 800
Итого:
Х
250
Х
255
17 800
21 050
18 500
Вычислим индекс цен переменного состава:
Вывод: цена продукции на каждом предприятии в отчетном периоде возросла по сравнению с базисным. В целом по двум предприятиям средняя цена возросла на 15,9%.
Рассчитаем индекс структурных сдвигов:
Первая часть приведенной формулы позволяет ответить на вопрос, какой была бы средняя цена в отчетном периоде, если бы цены на каждом предприятии сохранились на базисном уровне. Вторая часть формулы отражает фактическую среднюю цену базисного периода.
Вывод: за счет изменения структуры проданных товаров, цены возросли на 1,9 в отчетном периоде по сравнению с базисным.
Определим индекс фиксированного или постоянного состава, который не учитывает изменение структуры продаж:
Вывод: за счет изменения цен товаров в отчетном периоде по сравнению с базисным средние цены возросли на 13,8%.
Проверим взаимосвязь: