Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Предмет и метод статистики
История, пути и направления статистической науки
Термин "статистика" появился в середине 18 века. Означал "государствоведение". Получил распространение в монастырях. Постепенно приобрел собирательное значение.
С одной стороны, статистика – это совокупность числовых показателей, характеризующих общественные явления и процессы (статистика труда, статистика транспорта).
С другой – под статистикой понимается практическая деятельность по сбору, обработке, анализу данных по различным направлениям общественной жизни.
С третьей стороны, статистика – это итоги массового учета, опубликованные в различных сборниках.
Наконец, в естественных науках статистикой называются методы и способы оценки соответствия данных массового наблюдения математическим формулам.
Таким образом, статистика – это общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной.
Ученые, внесшие вклад в развитие статистики
• Уильям Петти – основатель статистики. Его заслуга в том, что он впервые применил числовой метод для анализа закономерностей общественной жизни. Работа – "Политическая арифметика".
• Адольф Кетле – бельгийский статистик. Доказал, что даже кажущиеся случайности общественной жизни обладают внутренней закомерностью и необходимостью.
• К.Ф. Герман – русский статистик ("Всеобщая теория статистики").
• В.И. Ленин – теория группировок, теория статистического наблюдения.
• Целый ряд других ученых.
Предмет статистики
Статистика изучает количественно определенные качества массовых социально-экономических явлений.
Существует несколько точек зрения на статистику как на науку:
(1) Статистика – это универсальная наука, изучающая массовые явления природы и общества.
(2) Статистика – это методологическая наука, разрабатывающая методы исследования для других наук.
(3) Статистика – это общественная наука.
Явления общественной жизни – это сложное сочетание различных элементов.
• Общественные явления обладают вполне конкретными размерами.
• Общественным явлениям присущи определенные количественные соотношения, и существуют они независимо от того, изучает ли их статистика или нет.
Размеры и соотношения количества и качества отдельных явлений статистика выражает при помощи определенных понятий, статистических показателей. Числовое значение показателя, относящееся к определенному месту и времени, называют величиной показателя.
Отрасли статистики
Общая теория статистики – это лишь фундамент. В любой своей части она связана с другими науками.
Общая теория статистики
Демографическая
статистика
Экономическая статистика
Статистика образования
Медицинская статистика
Спортивная статистика
Статистикатруда
Статистика заработной платы
Статистика мат.-техн. снабжения
Статистика транспорта
Статистика связи
Статистика финансового кредита
Высшие финансовые вычисления
Статистика денежного обращения
Статистика
валютных курсов
Прочие
Статистика также разрабатывает теорию наблюдения.
Метод статистики
Метод статистики предполагает следующую последовательность действий:
• разработка статистической гипотезы,
• статистическое наблюдение,
• сводка и группировка статистических данных,
• анализ данных,
• интерпретация данных.
Прохождение каждой стадии связано с использованием специальных методов, объясняемых содержанием выполняемой работы.
Закон больших чисел
Массовый характер общественных законов и своеобразие их действий предопределяет необходимость исследования совокупных данных.
Массовые общественные явления - это явления, которые встречаются в больших количествах, но отличаются друг от друга величиной определенного признака.
Закон больших чисел порожден особыми свойствами массовых явлений. Последние в силу своей индивидуальности, с одной стороны, отличаются друг от друга, а с другой – имеют нечто общее, обусловленное их принадлежностью к определенному классу, виду. Причем единичные явления в большей степени подвержены воздействию случайных факторов, ежели их совокупность.
Закон больших чисел в наиболее простой форме гласит, что количественные закономерности массовых явлений отчетливо проявляются лишь в достаточно большом их числе.
Таким образом, сущность его заключается в том, что в числах, получающихся в результате массового наблюдения, выступают определенные правильности, которые не могут быть обнаружены в небольшом числе фактов.
Закон больших чисел выражает диалектику случайного и необходимого. В результате взаимопогашения случайных отклонений средние величины, исчисленные для величины одного и того же вида, становятся типичными, отражающими действия постоянных и существенных фактов в данных условиях места и времени.
Тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу лишь как массовые тенденции, но не как законы для каждого отдельного случая.
Статистическая закономерность
Статистические закономерности изучают распределение единиц статистического множества по отдельным признакам под воздействием всей совокупности факторов.
Статистическая закономерность выступает как объективная закономерность сложного массового процесса и является формой причинной связи. Она обнаруживается в итоге массового статистического наблюдения. Этим обуславливается ее связь с законом больших чисел.
Статистическая закономерность с определенной вероятностью гарантирует устойчивость средних величин при сохранении постоянного комплекса условий, порождающих данное явление.
Задачи статистики
(1) Разработка системы гипотез, характеризующих развитие, динамику, состояние социально-экономических явлений.
(2) Организация статистической деятельности.
(3) Разработка методологии анализа.
(4) Разработка системы показателей для управления хозяйством на макро- и микроуровне.
(5) Популяризовать данные статистического наблюдения.
Организация государственной статистики в РФ
Принципы организации государственной статистики в РФ:
1) централизованное руководство,
2) единое организационное строение и методология,
3) неразрывная связь с органами государственного управления.
Система государственной статистики имеет иерархическую структуру. Эта структура имеет федеральный, республиканский, краевой, областной, окружной, городской и районный уровни.
Госкомстат имеет управления, отделы, вычислительный центр.
В соответствии со ст. 71 Конституции РФ руководство статистикой в стране осуществляет Госкомстат как федеральный орган исполнительной власти.
Госкомстат РФ, его органы в республиках, краях, областях, автономных областях и округах, в городах Москве и Санкт-Петербурге, других городах и районах, а также подведомственные им организации, учреждения и учебные заведения составляют единую систему государственной статистики страны.
Формы и методы сбора и обработки статистических данных, методология расчета статистических показателей, установленные Госкомстатом, являются статистическими стандартами РФ.
В соответствии с положением основными задачами Госкомстата России являются:
1) предоставление официальной статистической информации Президенту, правительству, федеральному собранию РФ, федеральным органам исполнительной власти, общественности;
2) разработка научно обоснованной статистической методологии, соответствующей международным стандартам;
3) координация статистической деятельности в государстве;
4) разработка экономико-статистической информации, ее анализ, составление национальных счетов, проведение необходимых балансовых расчетов;
Основные функции Госкомстата России состоят в том, что он:
1) организует проведение государственных статистических наблюдений по разработанным им или согласованным с ним программам, формам и методикам;
2) обеспечивает функционирование ЕГРПО (Единого государственного регистра предприятий и организаций);
3) обеспечивает сбор, обработку, хранение и защиту статистической информации, соблюдение государственной и коммерческой тайны, необходимую конфиденциальность данных (конфиденциальный – секретный, доверительный);
4) сопоставляет основные социально-экономические показатели России с аналогичными показателями других стран, совместно с Центробанком составляет платежный баланс страны;
5) проводит единую техническую политику в области сбора, обработки и передачи статистической информации, в разработке и формировании федеральных программ по вопросам, порученным Госкомстату.
Понятие о международных статистических организациях.
Важное место в системе статистических наук занимает международная статистика. В зависимости от объекта исследования следует различать два ее понятия:
1) международная статистика в узком смысле слова изучает социально-экономические явления и процессы, протекающие на международном уровне между различными странами и объединениями стран (ЕС — Европейское сообщество, СНГ — Содружество Независимых Государств, ОЭСР — Организация экономического сотрудничества и развития, ОПЕК — Организация стран — экспортеров нефти, ЛАГ — Лига арабских государств и др.
2) международная статистика в широком смысле слова исследует все мировое хозяйство, т.е. социально-экономические явления и процессы, происходящие не только между странами и их объединениями, но и в отдельных странах.
Предметом международной статистики является изучение количественной стороны социально-экономических явлений, происходящих в мировой экономике. В связи с этим международная статистика призвана исследовать предпосылки, ход и результаты экономической деятельности. При этом выбор конкретного предмета исследования зависит от цели и задач, поставленных перед исследователями. В частности, в качестве предмета исследования могут выступать показатели национального богатства, показатели динамики и структуры ВВП, показатели жизненного уровня и т.д.
Объектом исследования в международной статистике является совокупность экономических единиц, обладающих изучаемым признаком. Например, объектом наблюдения может быть страна или группа стран; занятое, безработное или экономически активное население и т.д. Четкое определение предмета и объекта исследования является важнейшим условием соблюдения точности полученных результатов.
Международная статистика тесно связана с рядом научных дисциплин. Прежде всего необходимо отметить ее связь с современной экономической теорией, которая разрабатывает определения и методологию расчета важнейших экономических категорий и показателей, изучает закономерности и тенденции экономического развития различных стран.
Международная статистика использует разработки экономической теории для осуществления практических расчетов экономических показателей. Вместе с тем статистика обогащает экономическую теорию конкретной экономической информацией и практическими выводами, сделанными на основе этой информации. Такая взаимосвязь и взаимозависимость позволяет успешно развиваться и экономической теории, и международной статистике.
В своей практической деятельности международная статистика использует методы сбора, контроля, обработки и анализа экономической информации, которые разрабатываются общей теорией статистики и математической статистикой. Это дает возможность систематизировать полученную информацию, проверить ее качество и достоверность, вскрыть тенденции и закономерности развития социально-экономических явлений, осуществить прогноз развития экономической деятельности отдельных стран.
В свою очередь, общая теория статистики и математическая статистика используют результаты, полученные международной статистикой, для дальнейшей разработки и усовершенствования методологии сбора, обработки и анализа экономической информации.
Статистическое наблюдение
Понятие статистического наблюдения
Статистическое наблюдение – это сбор необходимых данных по явлениям, процессам общественной жизни. Но это не всякий сбор данных, а лишь планомерный, научно организованный, систематический и направленный на регистрацию признаков, характерных для исследуемых явлений и процессов. От качества данных, полученных на первом этапе, зависят конечные результаты исследования.
Формы статистического наблюдения
Различают две основные формы статистического наблюдения – отчетность и специально организованное наблюдение.
Отчетность – это такая форма наблюдения, при которой предприятия, организации представляют в статистические и вышестоящие органы постоянные сведения, характеризующие их деятельность. Отчетность предоставляется по заранее определенной программе в строго определенные сроки и содержит важнейшие показатели, необходимые в процессе ежедневной работы.
Специально организованное наблюдение – такое наблюдение, которое организуется со специальной целью на определенную дату для получения данных, которые в силу различных причин не собираются статистической отчетност, а также с целью проверки данных статистической отчетности.
Виды статистического наблюдения
По времени регистрации фактов статистическое наблюдение может быть непрерывным, периодическим и единовременным.
Непрерывное (текущее) наблюдение – ведется систематически (т.е. регистрация фактов производится по мере их свершения). Пример – ЗАГС.
Периодическое наблюдение – повторяется через определенные равные промежутки времени. Пример – перепись населения.
Единовременное наблюдение – производится по мере надобности без соблюдения определенной периодичности. Пример – оценка и переоценка основных фондов.
По охвату единиц совокупности выделяют сплошное и несплошное наблюдение.
Сплошным называется наблюдение, при котором исследованию подвергаются все единицы изучаемой совокупности.
Несплошным называется такое наблюдение, при котором исследованию подвергается только часть единиц изучаемой совокупности, отобранная определенным образом.
Виды несплошного наблюдения
• Анкетный способ
Исследуются какие-то осредненные показатели и распространяются на всю совокупность.
• Метод основного массива
Исследуются наиболее крупные единицы изучаемого явления.
• Метод направленного долевого отбора
• Выборочный метод
Его основой является случайный отбор. Результат гарантируется с определенной вероятностью р.
• Монографический метод
Подвергаются тщательному исследованию отдельные единицы совокупности, обычно представители новых типов, либо самые лучшие (худшие) единицы. Результаты переносятся на всю совокупность. Позволяет выявить тенденции.
Способы статистического наблюдения
Основанием для регистрации фактов могут служить либо документы, либо высказанное мнение, либо хронометражные данные. В связи с этим различают наблюдение:
• непосредственное (сами измеряют),
• документально (из документов),
• опрос (со слов кого-либо).
В статистике применяются следующие способы сбора информации:
• корреспондентский (штат добровольных корреспондентов),
• экспедиционный (устный, специально подготовленные работники)
• анкетный (в виде анкет),
• саморегистрация (заполнение формуляров самими респондентами),
• явочный (браки, дети, разводы) и т.д.
Программно-методологические вопросы статистического наблюдения
Каждое наблюдение проводится с конкретной целью. При его проведении необходимо установить, что подлежит обследованию. Надо решить следующие вопросы:
Объект наблюдения – совокупность предметов, явлений, у которых должны быть собраны сведения. При определении объекта указываются его основные отличительные черты (признаки). Всякий объект массовых наблюдений состоит их отдельных единиц, поэтому надо решить вопрос о том, каков тот элемент совокупности, который послужит единицей наблюдения.
Единица наблюдения – это составной элемент объекта, который является носителем признаков, подлежащих регистрации и основой счета.
Ценз – это определенные количественные ограничения для объекта наблюдения.
Признак – это свойство, которое характеризует определенные черты и особенности, присущие единицам изучаемой совокупности.
Программа наблюдения – это перечень признаков, подлежащих регистрации. Программа находит отражение в формуляре наблюдения. Выделяются организационные вопросы: перечень мероприятий, обеспечивающих правильность наблюдения, а также оргплан, где учитываются органы наблюдения, время наблюдения, порядок приема и сдачи материала, порядок получения информации.
Период наблюдения – время, в течение которого должна быть осуществлена регистрация.
Критическая дата наблюдения – дата, по состоянию на которую сообщаются сведения.
Критический момент – момент времени, по состоянию на который производится регистрация наблюденных фактов.
Статистическая сводка и группировка
Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве.
Второй этап статистической работы – статистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом. Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом. Проведение сводки включает три этапа:
1) предварительный контроль – это проверка данных;
2) группировка данных по заданным признакам – это определение производных показателей;
3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.
Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.
Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.
Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.
Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.
Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц.
От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:
1) выбирается группировочный признак для образования однородных групп;
2) определяется порядок формирования и число групп;
3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;
4) создаются макеты статистических таблиц для предоставления результатов сводки.
Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц. Сводка бывает децентрализованной и централизованной.
Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.
Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.
По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.
Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по существенным для них признакам.
Метод группировки основывается на двух категориях: группировочном признаке и интервале.
Группировочным признаком называется признак, по которому проводится объединение единиц изучаемой совокупности в группы.
Группировка может быть проведена по количественным и атрибутивным признакам. Интервал – это значение варьирующего признака, лежащее в определённых границах.
Интервалы бывают :
- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинаковая;
- неравные, когда, например, ширина интервала постепенно увеличивается, верхний интервал не закрыт вовсе;
- открытые, когда имеется только либо верхняя, либо нижняя граница;
- закрытые, когда имеется и верхняя и нижняя границы
Стат.группировка преследует цели: выделение социально-экономических типов; изучение структуры явления и структурных сдвигов, происходящих в нём; выявление связи и зависимости м-у явлениями.
Каждой из этих целей соответствует особый вид группировки: типологическая, структурная, аналитическая.
Типологическая группировка – это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений. Группировка строится по атрибутивному признаку.
Структурной наз-ся группировка, предназначенная для изучения состава однородной совокупности по варьирующему (количественному) признаку.
Группировка, выявляющая взаимосвязи м-у изучаемыми явлениями и их признаками наз-ся аналитической группировкой. Для построения группировки изучаемую совокупность расчленяют по факторному признаку. Факторные признаки обусловливают изменение явлений, а результативные изменяются под влиянием факторных. (Например, рост УК банка (факт. признак)приводит к росту прибыли (результат. признак)).
Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по группировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.
Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.
Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировочным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.
При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.
Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку. Различают группировки по используемой информации:
1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;
2) вторичные – это результат соединения или расчленения группировки.
Принципы построения группировок
Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.
Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.
В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.
Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.
Для определения числа групп можно воспользоваться формулой Стерджесса:
n =1+ 3,322 * lg N,
где n – число групп; N – число единиц совокупности
Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.
На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.
Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.
Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
h = R/n = ( х мах – х min ) / n,
где хмах ,хmin – максимальное и минимальное значение признака в совокупности;
n – число групп.
Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.
В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.
Ряды распределения
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).
Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается
где k - число вариантов значений признака
Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:
Графики являются наглядной формой отображения рядов распределения. Для изображения рядов применяются линейные графики и плоскостные диаграммы, построенные в прямоугольной системе координат.
Для графического представления атрибутивных рядов распределения используются различные диаграммы: столбиковые, линейные, круговые, фигурные, секторные и т. д.
Для дискретных вариационных рядов графиком является полигон распределения.
Полигоном распределения называется ломаная линия, соединяющая точки с координатами или где - дискретное значение признака, - частота, - частость.
График строится в принятом масштабе. Вид полигона распределения приведен на рис.1
Наглядное представление статистических данных
Результаты сводки и группировки материалов наблюдения, как правило, представляются в виде статистических таблиц. Значение статистических таблиц состоит в том, что позволяют охватить материалы статистической сводки в целом, и по существу являются системой мыслей об исследуемом объекте, излагаемого цифрами на основе определённого порядка.
По внешнему виду, статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки), которые в совокупности составляют как бы скелет таблицы.
Составленную таблицу, но не заполненную цифрами принято называть макетом таблицы.
Статистическая таблица имеет своё подлежащее и сказуемое.
Подлежащее таблицы показывает, о каком явлении идёт речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей.
Сказуемым таблицы называются показатели, с помощью которых изучается объект, т.е. подлежащее таблицы. В основном в сказуемом отражаются численные значения и характеристики изучаемого явления.
Обычно подлежащее расположено с левой стороны, а сказуемое с правой.
Виды статистических таблиц:
1. Простая таблица в подлежащем содержит перечисление единиц изучаемой совокупности. Сведения простой таблицы применяют и для оценки изменения какого-либо явления во времени.
2. Групповые статистические таблицы дают более информативный материал для анализа изучаемых явлений благодаря образованным в их подлежащем группам по существенному признаку или выявлению связи между рядом показателей.
3. Комбинационные таблицы - группировке подлежат по двум и более группировочным признакам.
Комбинационная таблица устанавливает взаимное действие на результативные признаки (показатели) и существующую связь между факторами группировки.
Одним из ответственных моментов построения статистических таблиц являются разработка сказуемого, определение его содержания, правильное установление связи между группировочными признаками и показателями, их характеризующими. В зависимости то задачи исследования и характера исходной информации сказуемое статистических таблиц бывает простым и сложным. Показатели сказуемого при простой разработке располагаются последовательно один за другим. Распределяя показатели на группы по одному или нескольким признакам в определенном сочетании, получают сложное сказуемое. Причем содержание и характер информации таблицы определяются не столько числом показателей сказуемого, сколько правильной их комбинацией и расположением.
Основные правила построения таблицы.
1. Заголовок таблицы.
2. Таблица должна быть не большой, легко обозримой.
3. Слова в таблице не сокращаются.
4. Строки подлежащего номеруются. А, Б, В, Г, Д и т.д.(большими).
5. Условные обозначения:
(-) – отсутствие явлений,
(…) – «нет сведений» (это нет информации о явлении).
(0,0) – при наличии информации по изучаемому явлению, числовое значение которого, составляет величину меньше принятой в таблице точности.
(х) – нет осмысленного содержания (значение не имеет смысла).
6. Одинаковая степень округления.
7. Если нет отдельной единицы измерения, то вводится отдельная графа.
8. Если в таблице приводятся данные расчетного порядка, необходимо сделать соответствующую оговорку.
9. Таблица должна иметь итоговые значения, как по вертикали, так и по горизонтали.
Анализ статистических данных начинают с итогов. Для обеспечения наглядности по данным таблицы строятся графики и диаграммы.
Значения графического метода в статистике
Важное значение при изучении коммерческой деятельности имеет графическое изображение статистической информации. Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.
Графический метод в статистике коммерческой деятельности является продолжением и дополнением табличного метода (то, что при чтении таблицы может остаться не замеченным, обнаруживается на графике).
Основные элементы статистического графика
В статистическом графике различают следующие основные элементы: поле графика, графический образ, пространственные и масштабные ориентиры, экспликация графика.
1. Полем графика является место, на котором он выполняется (это листы бумаги, географические карты, план местности и т.д.).
2. Географический образ – это символические знаки, с помощью которых изображаются статистические данные. Они весьма разнообразны: линии, точки, плоские геометрические фигуры ( и т.д.).
3. Пространственные ориентиры определяют размещение графических образов на поле графика.
4. Масштабные ориентиры статистического графика придают графическим образам количественную значимость, которая передаётся с помощью системы масштабных шкал.
5. Экспликация графика – это пояснение его содержания, включает в себя заголовок графика, объяснение масштабных шкал, пояснение отдельных элементов графического образа.
Заголовок графика в краткой и чёткой форме поясняет основное содержание изображаемых данных.
Помимо заголовка на графике дается текст, делающий возможным чтение графика, цифровые обозначения шкалы дополняются указанием единиц измерения.
Классификация статистических графиков.
Статистические графики классифицируются по ряду признаков: способу построения, форме применяемых графических образов, характеру решаемых задач. По способу построения статистические графики подразделяются на диаграммы, картограммы и картодиаграммы.
Существует множество видов графических изображений. Их классификация основана на ряде признаков, в основе которых:
• способ построения графического образа;
• геометрические знаки, изображающие статистические показатели;
• задачи, решаемые с помощью графического изображения.
Классификация статистических графиков по форме графического образа:
• Линейные (стат.кривые);
• Плоскостные (квадратные, секторные, точечные, фоновые и т.д.);
• Объемные (поверхностного распределения).
По способу построения статистические графики делятся на диаграммы и статистические карты.
Статистические карты – графики количественного распределения на конкретной территории. Они близки по содержанию с диаграммами, но строятся на контурной географической карте. Они предназначены для отражения пространственного распространения явления.
Диаграмма представляет чертёж, на котором статистическая информация изображается посредствам геометрических фигур или символических знаков.
В статистике коммерческой деятельности на рынке товаров и услуг наибольшее применение имеют линейные диаграмм. На оси абсцисс откладываются варианты изучаемого показателя (или показания времени), а по оси ординат – величина изучаемого показателя.
Важным достоинством линейных графиков является то, что на одном и том же поле графика можно изобразить несколько показателей, что позволяет сравнивать и выявлять специфику их развития во времени или характер изменения одного показателя по разным объектам в пространстве или территории.
Другим так же часто используемым в статистике коммерческой деятельности методом наглядного изображения статистической информации являются столбиковые диаграммы.
При построении столбиковых диаграмм используется, как и в линейных графиках, прямоугольная система координат. При этом каждое значение изучаемого показателя изображается в виде вертикального столбика. По оси абсцисс размещается основание столбиков, их ширина может быть произвольной, но обязательно одинаковой для каждого столбика. Высота столбиков (в соответствии с принятым по оси ординат масштабом) должна строго соответствовать изображаемым данным.
В статистике коммерческой деятельности находят применение и так называемые ленточные (полосовые) графики. В этих диаграммах основания столбиков располагаются вертикально, а масштабная шкала наносится на горизонтальную ось.
Широкое применение в статистике находят круговые диаграммы. В этих диаграммах площадь окружности принимается за величину всей изучаемой статистической совокупности, а площади отдельных секторов отображают удельный вес (долю) её составных частей. При этом, поскольку площади секторов пропорциональны их центральным углам, то для построения секторной диаграммы сумма всех углов (360) распределяется пропорционально удельным весам отдельных частей изучаемой совокупности. При процентном выражении состава изучаемой совокупности. При процентном выражении состава изучаемой статистической совокупности исходят из соотношения 1%=3,6графусов.
Если круг используется для сравнения площади отдельных секторов, диаграмма называется секторной. Они используются для наглядной иллюстрации структуры кого-то явления или процесса.
При изучении статистической информации о коммерческой деятельности на рынке товаров и услуг применяются так называемые радиальные диаграммы. Строятся они на базе померных координат. Началом отсчёта в них служит центр окружности, а носителями масштабных шкал является радиусы круга.
Выразительным является использование для построения диаграмм фигур – знаков. Если речь идет о яблочном соке фигурой могут быть яблоки.
Широкое применение имеют координатные диаграммы, в отличии от полосковых и столбчатых диаграмм они требуют масштабирования и по оси абсцисс и по оси ординат. Наиболее распространенными среди них являются линейные графики. На одном графике можно сравнить несколько показателей, но при этом число линий должно быть не более 4 линий.
Абсолютные и относительные величины
Абсолютные статистические величины показывают объем, размеры, уровни различных социально-экономических явлений и процессов. Они отражают уровни в физических мерах объема, веса и т.п. В общем абсолютные статистические величины – это именные числа. Они всегда имеют определенную размерность и единицы измерения. Последние определяют сущность абсолютной величины.
Типы абсолютных величин
(1) Натуральные – такие единицы, которые отражают величину предметов, вещей в физических мерах (вес, объем, площадь и т.д.).
(2) Денежные (стоимостные) – используются для характеристики многих экономических показателей в стоимостном выражении.
(3) Трудовые – используются для определения затрат труда (человеко-час, человеко-день)
(4) Условно-натуральные –единицы, которые используются для сведения воедино нескольких разновидностей потребительных стоимостей (т.у.т = 29,3 МДж/кг; мыло 40 % жирности).
Виды абсолютных величин
• Индивидуальные и суммарные. Индивидуальные – отражают размеры количественных признаков у отдельных единиц изучаемой совокупности, суммарные – итоговые значения признака по определенной части и совокупности в целом. (Н-р, инд.величина – численность работников каждого отдела, суммарная величина – численность работников всего предприятия).
• Моментные и интервальные. первые показывают фактическое наличие или уровень явления на определенный момент времени, дату (н-р, численность работников на 01.09.10г.); вторые – итоговый накопленный результат за период (Н-р, объем выданных кредитов за год).
Абсолютные величины отражают наличие тех или иных ресурсов, это основа материального учета. Они наиболее объективно отражают развитие экономики.
Абсолютные величины являются основой для расчета разных относительных статистических показателей.
Относительные статистические величины
Относительные статистические величины – обобщающий показатель. который дает числовую меру соотношения двух сопоставляемых величин. Так как многие абсолютные величины взаимосвязаны, то и относительные величины одного типа в ряде случаев могут определяться через относительные величины другого типа.
Основное условие правильного расчёта относительной величины - сопоставимость сравниваемых показателей и наличие реальных связей м-у изучаемыми явлениями. Таким образом, по способу получения относительные величины всегда величины производные, определяемые в форме коэффициентов. процентов, промилле и т.д.
Знаменатель (основание сравнения, база) – это величина, с которой производится сравнение.
Сравниваемая (отчетная, текущая) величина – это величина, которая сравнивается.
Относительная величина показывает, во сколько раз сравниваемая величина больше или меньше базисной или какую долю первая составляет по отношению ко второй. В ряде случае относительная величина показывает, сколько единиц одной величины приходится на единицу другой.
Важное свойство – относительная величина абстрагирует различия абсолютных величин и позволяет сравнивать такие явления, абсолютные размеры которых непосредственно несопоставимы.
Форма выражения относительных величин
В результате сопоставления одноименных абсолютных величин получают неименованные относительные величины. Они могут выражаться в виде долей, кратных соотношений, процентных соотношений, в виде промилле и т.д.
Результатом сопоставления разноименных величин являются именованные относительные величины. Их название образуется сочетанием сравниваемой и базисной абсолютных величин.
Выбор формы зависит от характера аналитической задачи, которая состоит в том, чтобы с наибольшей ясностью выразить соотношение.
Виды относительных величин
Все применяемые на практике относительные статистические величины подразделяются на следующие виды.
Относительная величина динамики (ОВД) показывает. во сколько раз текущий уровень (Y1) превышает предшествующий (базисный) (Y0) или какую долю от последнего он представляет:
ОВД=
Данный показатель может быть выражен кратным отношением или переведен в проценты.
Относительная величина планового задания (ОВП)
ОВП=
Показатель характеризует напряженность плана, т.е. во сколько раз намеченный уровень превысит достигнутый или сколько процентов от этого уровня составит.
Относительная величина реализации плана (ОВРП)
ОВРП=
где Yпл – уровень, планируемый на i-ый период.
ОВРП отражает фактический уровень в процентах или коэффициентах по сравнению с плановым. Между относительными величинами плана, реализации плана и динамики существует взаимосвязь:
ОВП*ОВРП=ОВД.
Относительная величина структуры (ОВС) представляет собой соотношение структурных частей (Yi) изучаемого объекта и их целого:
ОВС=
ОВС выражается в долях единицы или в процентах. Рассчитанные величины, соответственно называемые долями или удельными весами, показывают, какой долей обладает или какой удельный вес имеет та или иная часть в общем итоге
Относительная величина координации (ОВК)
ОВК=
Yб.с. - уровень части совокупности. выбранной за базу сравнения.
При этом в качестве базы сравнения выбирается та часть совокупности, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-то другой точки зрения. В результате получают, во сколько раз данная часть больше базисной, или сколько процентов от неё составляет, или сколько единиц данной структурной части приходится на единицу базисной структурной части.
Относительная величина интенсивности (ОВИ) – характеризует степень распространения изучаемого процесса или явления и представляет собой отношение исследуемого показателя (YА) к размеру присущей ему среды (Yср.А). Это всегда соотношение разноименных величин. Наиболее часто выражается в процентах и промилле. Обычно ОВИ рассчитывается в тех случаях, когда абсолютная величина оказывается недостаточной для формулировки обоснованных выводов о масштабах явлений, его размерах, насыщенности, плотности распределения:
ОВИ=
Относительная величина сравнения(ОВС) – представляет собой отношение одноименных величин, относящихся к различным объектам.
ОВС=
где YB,YC – показатели, характеризующие соответственно объекты В и С
Средние величины.
Средняя является обобщающей характеристикой совокупности по качественно однородному признаку.
Она отражает объективный уровень, достигнутый в процессе развития явления к определенному моменту или периоду.
Средняя представляет значение определенного признака в совокупности одним числом и элиминирует индивидуальные различия значений отдельных величин совокупности.
Необходимость сочетается со случайностью, поэтому средние величины связаны с Законом больших чисел. Суть этой связи в том, что при осреднении случайные отклонения индивидуальных величин от средней погашаются, а в средней отчетливо выявляется основная тенденция развития.
Важнейшая особенность средней величины – в том, что она относится к единице изучаемой совокупности и через характеристику единицы характеризует всю совокупность в целом.
Основные свойства средней величины:
(1) Она обладает устойчивостью, что позволяет выявлять закономерности развития явлений. Средняя облегчает сравнение двух совокупностей, обладающих различной численностью.
(2) Она помогает характеризовать развитие уровня явления во времени.
(3) Она помогает выявить и охарактеризовать связь между явлениями.
Средние позволяют исключить влияние индивидуальных значений признака, т.е. они являются абстрактными величинами. Поэтому средние должны употребляться на основе сгруппированных данных.
Расчет средней
К расчету средней предъявляются два основных требования:
(1) Среднюю нужно рассчитывать так, чтобы она погашала то, что мешает выявлению характерных черт и закономерностей в развитии явления, а не затушевывала развитие.
(2) Средняя может быть вычислена только для однородной совокупности. Средняя, вычисленная для неоднородной совокупности, называется огульной.
Одинаковые по форме и технике вычисления средние в одних случаях могут быть огульными, а в других – общими в зависимости от того, с какой целью они интерпретируются.
Говоря о методологии исчисления средних, не надо забывать, что средняя всегда дает обобщенную характеристику лишь по одному признаку. Каждая же единица совокупности имеет много признаков. Поэтому необходимо рассчитывать систему средних, чтобы охарактеризовать явление со всех сторон.
Расчет средних величин производится по правилам, которые разрабатываются математической статистикой. Задача ОТС – дать смысловую, преимущественно экономическую интерпретацию результатам расчетов, произведенных по формулам.
Признак, по которому производится осреднение, называется осредняемым признаком. Величина осредняемого признака у каждой единицы совокупности называется ее индивидуальным значением.
Значение признака, которое встречается у групп единиц или у отдельных единиц и не повторяется, называется вариантом признака
В статистике применяются следующие виды средних:
1) степенные средние – арифметическая, гармоническая, квадратическая, кубическая, геометрическая. Степенные средние исчисляются в двух формах: простой и взвешенной. Простая форма используется для расчёта средней величины по несгруппированным данным и имеет общий вид:
,
где Xi - варианта (значение) осредняемого признака; т – показатель степени средней (т = -1 для средней гармонической; 0 – арифметической; 1 – геометрической; 2 – квадратической; 3- кубической); n – число вариант.
Взвешенная по сгруппированным данным имеет общий вид:
,
где частота (численность единиц совокупности, имеющих одинаковое значение признака).
2) структурные средние – применяются для изучения внутреннего строения рядов распределения. К ним относятся мода, медиана, квартили, децили.
Выбор формы средней зависит от исходных данных и содержания определяемого показателя. Наибольшее распространение из степенных средних получили средние арифметическая, гармоническая, геометрическая.
Средняя арифметическая применяется:
- при наличии отдельных значений признака (Х) и их частоты (). В качестве частот могут выступать не только абсолютные, но и относительные величины (удельные веса);
- если известна объемная величина (W=X*) и частота ().
Свойства средней арифметической:
(1) Если от каждого варианта вычесть или к каждому варианту прибавить какое-либо произвольное постоянное число, то средняя увеличится или уменьшится на то же самое число.
(2) Если каждый вариант умножить (разделить) на какое-либо произвольное постоянное число, то средняя увеличится (уменьшится) во столько же раз.
(3) Если веса, или частоты, разделить или умножить на какое-либо произвольное постоянное число, то величина средней не изменится. Это свойство дает возможность заменять веса их удельными весами:
Если частоты не известны применяется средняя гармоническая.
Средняя гармоническая используется для расчёта среднего значения по последовательности цепных относительных величин динамики (Н-р, последовательность индексов цен по сравнению с предыдущим месяцем).
Формулы расчёта степенных средних:
- средняя арифметическая простая:
;
- средняя арифметическая взвешенная:
;
- средняя гармоническая взвешенная (простая формула не используется на практике):
;
- средняя геометрическая простая:
- средняя геометрическая взвешенная:
В качестве структурных средних чаще всего используется мода, медиана.
Мода – знач. признака, наиболее часто встречающееся в изучаемой совокупности. Для дискретных рядов распределения модой является значение признака с наибольшей частотой. Для интервальных вариационных рядов распределения мода рассчитывается по формуле:
где - нижняя граница модального интервала; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным.
Медианой называется величина признака, расположенного в середине упорядоченного вариационного ряда. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет значение признака, находящееся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из чётного числа членов, то медианой буте средняя арифметическая из двух значений признака, расположенных в середине ряда.
Для интервальных вариационных рядов медиана рассчитывается по формуле:
где - нижняя граница медианного интервала; - величина медианного интервала; - сумма частот ряда; - сумма накопленных частот ряда, предшествующих медианному интервалу; - частота медианного интервала.
Аналогично с нахождением медианы в интервальных вариационных рядах можно рассчитать квартиль и децили.
Квартиль – значение признака, делящее ранжированный ряд распределения на четыре равные части. Различают нижний квартиль, отделяющий ¼ часть совокупности с наименьшими значениями признака. И квартиль верхний, отсекающий ¼ часть с наибольшими значениями признака. Средним квартилем является медиана.
Расчёт нижнего и верхнего квартиля производится по формулам, аналогично медиане:
где ХК1, ХК3 - нижние границы интервалов, содержащих соответственно нижний и верхний квартили; iK1,iK3 - соответственно величины интервалов нижнего и верхнего квартилей; - сумма частот ряда; , - сумма накопленных частот ряда, предшествующих соответственно интервалам нижнего и верхнего квартилей; , - соответственно частоты интервалов нижнего и верхнего квартилей.
Дециль – значение признака, делящее ряд распределения на равных частей.
Средняя должна исчисляться не просто тогда, когда есть вариация признака, а тогда, когда мы располагаем качественно однородным вариационным рядом. Среднюю как обобщающую характеристику нельзя применять к таким совокупностям, отдельные части которых подчиняются различным законам распределения (или) развития в отношении величины распределяемого признака.
Показатели вариации.
Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.
Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.
Абсолютные показатели вариации включают:
• размах вариации
• среднее линейное отклонение
• дисперсию
• среднее квадратическое отклонение
Размах вариации — это разность между максимальным и минимальным значениями признака. Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности
Среднее линейное отклонение — это средняя арифметическая из абсолютных отклонений отдельных значений признака от средней.
Среднее линейное отклонение простое:
•
Среднее линейное отклонение взвешенное применяется для сгруппированных данных:
•
Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).
Среднее квадратическое отклонение
Наиболее совершенной характеристикой вариации является среднее квадратическое отклонение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:
Среднее квадратическое отклонение простое:
Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:
Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.
Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней величины.
В зависимости от исходных данных дисперсия вычисляется по ф-ле средней арифметической невзвешенной (простой) или взвешенной.
Невзвешенная (простая):
взвешенная:
Расчёт дисперсии может так же проводиться методом моментов:
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:
.
В отличии от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака совокупности и выражается в единицах измерения варьирующего признака (руб., тоннах, метрах и т.д.)
Для сравнения размеров вариации различных признаков, а также для сравнения степени вариации одноимённых признаков в нескольких совокупностях исчисляется относительный показатель вариации – коэффициент вариации:
По величине коэффициента вариации можно судить о степени вариации признаков, а следовательно, об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу. Если < 10% - вариация признака слабая; 10%< <25% - вариация средняя; >25% - вариация сильная.
Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую , внутригрупповую и межгрупповую , которые связаны м-у собой след. образом:
=+
где - средняя из внутригрупповых дисперсий.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию.
Межгрупповая дисперсия хар-ет систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием факторного признака, положенного в основание группировке. Рассчитывается по ф-ле:
где - групповая средняя; - общая средняя, рассчитанная для всей совокупности в целом; - число единиц совокупности, попавших в i-ую группу.
Внутригрупповая вариация отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтённых факторов и независящую от факторного признака, положенного в основание группировки. Расчёт внутригрупповой дисперсии осуществляется по ф-ле:
Из всех внутригрупповых дисперсий по ф-ле средней арифметической взвешенной определяется средняя внутригрупповая дисперсия:
Дисперсионный анализ позволяет оценить долю влияния вариации факторного признака на вариацию результативного признака. Для этого рассчитывается коэффициент детерминации:
Силу влияния факторного признака на результативный характеризует эмпирическое корреляционное отношение:
По абсолютной величине он может изменяться от 0 до 1. Если факторный признак не оказывает влияния на результативный, то . Если , то изменение результативного признака полностью обусловлено группировочным признаком.
Важным этапом дисперсионного анализа является оценка достоверности (значимости) полученного эмпирического корреляционного отношения. Для этого используется F-критерий Фишера:
где n – число единиц совокупности; т – число групп; п-т, т-1 – число степеней свободы соответственно внутригрупповой и межгрупповой дисперсий.
Если Fp>FT (FT - табличное значение F-критерия Фишера), то эмпирическое корреляционное отношение признаётся значимым
Выборочное наблюдение в статистике
Выборочное наблюдение относится к разновидности несплошного наблюдения. Оно охватывает отобранную часть единиц генеральной совокупности. Цель выборочного наблюдения - по отобранной части единиц дать характеристику всей совокупности единиц. Чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц), выборочное наблюдение должно быть специально организовано. Следователно, в отличие от генеральной совокупности, представляющей всю совокупность исследуемых единиц, выборочная совокупность представляет ту часть единиц генеральной совокупности, которая является объектом непосредственного наблюдения.
По понятным причинам выборочный метод может широко использоваться органами государственной статистики. Он позволяет при значительной экономии средств и затрат получать необходимую достоверную информацию. Гарантия репрезентативности обеспечивается применением научно обоснованных способов отбора единиц, которые подлежат обследованию.
Следует сразу же иметь в виду, что при сопоставлении показателей по результатам выборочного исследования с характеристиками для всей генеральной совокупности могут иметь место отклонения. Величина этих отклонений называется ошибкой наблюдения, которая может быть или ошибкой регистрации (несовершенство технических условий), или ошибкой репрезентативности (случайное или систематическое нарушение правил при отборе единиц).
В статистике приняты следующие условные обозначения:
N - объем генеральной совокупности;
п - объем выборочной совокупности;
- средняя в генеральной совокупности;
- средняя в выборочной совокупности;
р - доля единиц в генеральной совокупности;
w - доля единиц в выборочной совокупности;
- генеральная дисперсия;
S2 - выборочная дисперсия;
- среднее квадратическое отклонение признака в генеральной совокупности;
S - среднее квадратическое отклонение признака в выборочной совокупности.
Виды выборки, способы отбора и ошибки выборочного наблюдения
По способу отбора (способу формирования) выборки единиц из генеральной совокупности распространены следующие виды выборочного наблюдения:
• простая случайная выборка (собственно-случайная);
• типическая (стратифицированная);
• серийная (гнездовая);
• механическая;
• комбинированная;
• ступенчатая.
Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел.
Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц.
Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение.
Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице.
Комбинированная выборка основана на сочетании нескольких способов выборки.
Многоступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать.
Выборочный отбор может быть повторным и бесповторным. При повторном отборе вероятность выбора любой единицы не ограничена. При бесповторном отборе выбранная единица в исходную совокупность не возвращается.
Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.
Основной задачей при выборочном исследовании является определение ошибок выборки. Принято различать среднюю и предельную ошибки выборки. Для иллюстрации можно предложить расчет ошибки выборки на примере простого случайного отбора.
Расчет средней ошибки повторной простой случайной выборки производится следующим образом:
cредняя ошибка для средней
cредняя ошибка для доли
Расчет средней ошибки бесповторной случайной выборки:
средняя ошибка для средней
средняя ошибка для доли
Расчет предельной ошибки повторной случайной выборки:
предельная ошибка для средней
предельная ошибка для доли
где t - коэффициент кратности;
Расчет предельной ошибки бесповторной случайной выборки:
предельная ошибка для средней
предельная ошибка для доли
Следует обратить внимание на то, что под знаком радикала в формулах при бесповторном отборе появляется множитель, где N - численность генеральной совокупности.
Что касается расчета ошибки выборки в других видах выборочного отбора (например, типической и серийной), то необходимо отметить следующее.
Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.
При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:
Серийная выборка, как правило, проводится как бесповторная, и формула ошибки выборки в этом случае имеет вид
где - межсерийная дисперсия; s - число отобранных серий; S - число серий в генеральной совокупности.
Все вышеприведенные формулы применимы для большой выборки. Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок.
При расчете ошибок малой выборки необходимо учесть два момента:
1) формула средней ошибки имеет вид
2) при определении доверительных интервалов исследуемого показателя в генеральной совокупности или при нахождении вероятности допуска той или иной ошибки необходимо использовать таблицы вероятности Стьюдента, где Р = S (t, n), при этом Р определяется в зависимости от объема выборки и t.
В статистических исследованиях с помощью формулы предельной ошибки можно решать ряд задач.
1. Определять возможные пределы нахождения характеристики генеральной совокупности на основе данных выборки.
Доверительные интервалы для генеральной средней можно установить на основе соотношений
где - генеральная и выборочная средние соответственно; - предельная ошибка выборочной средней.
Доверительные интервалы для генеральной доли устанавливаются на основе соотношений
2. Определять доверительную вероятность, которая означает, что характеристика генеральной совокупности отличается от выборочной на заданную величину.
Доверительная вероятность является функцией от t, где
Доверительная вероятность по величине t определяется по специальной таблице.
3. Определять необходимый объем выборки с помощью допустимой величины ошибки:
Чтобы рассчитать численность п повторной и бесповторной простой случайной выборки, можно использовать следующие формулы:
(для средней при повторном способе);
(для средней при бесповторном способе);
(для доли при повторном способе);
(для доли при бесповторном способе).
Анализ рядов динамики
1. Понятие о рядах динамики
Ряд динамики (динамический ряд, временной ряд) представляет собой ряд расположенных в хронологической последовательности статистических величин, которые отражают развитие изучаемых явлений. Каждый ряд динамики имеет два основных элемента:
• время (t);
• уровень ряда (yi), т.е конкретные значения показателя.
Уровни динамического ряда могут быть выражены абсолютными, средними и относительными величинами. Примером такого представления уровней ряда динамики являются данные об изменении отдельных социально-экономических показателей по РФ (табл. 1)
Социально-экономические показатели по РФ за 1998-2002 гг.
Показатели
1998
1999
2000
2001
2002
1. Объем промышленной продукции, трлн. руб.
1707
3150
4763
5881
6868
2. Начисленная среднемесячная зар.плата одного работника (номинальная), руб.
1051
1523
2223
3240
4426
3. Общая численность безработных (на конец периода), млн. человек
8,6
9,3
7,5
6,4
5,5
3.1 В % к экономически активному населению
11,9
12,9
10,5
9,0
7,6
Данные этой таблицы могут быть использованы для иллюстрации рядов динамики разного типа. Различают следующие виды динамики:
• моментные и интервальные;
• ряды с равно- и неравноотстоящими АО времени уровнями;
• стационарные и нестационарные.
Моментным яв-ся ряд динамики, уровни кот. характеризуют изучаемое явление в конкретный момент времени (см.стр.3). Такие ряды используются для описания величин типа запаса (остатки средств на счетах клиентов, объем собственных средств, объем основных фондов и т.д.).
Интервальным яв-ся ряд динамики, уровни кот. хар-ют накопленный результат изменения явлений за определенные промежутки времени (стр.1,2). Т.е. эти ряды используют для описания величин типа экономического потока, операции (% полученные, 5 уплаченные, комиссионные доходы и расходы, выпуск продукции, текущие затраты и т.п.). Уровни таких рядов обладают свойством суммарности, показатели моментных рядов такого свойства не имеют. Можно сложить показатели объема промышленной продукции за кварталы и получить итог производства за год. Но если за год сложить данные о числе рабочих на начало каждого квартала, полученная сумма не будет иметь реального смысла.
В рядах с равностоящими уровнями дата регистрации или окончания периодов представлены через равные, следующие друг за другом отрезки времени. В рядах с неравностоящими уровнями принцип равенства отрезков времени не соблюдается.
Ряды динамики, в изменении уровней которого не наблюдается общей направленности, является стационарным. Напротив нестационарный ряд отличается наличием общей направленности в изменении уровней изучаемого показателя. та4к уровни рядов динамики, кот. представлены в табл., имеют разнонаправленные тенденции изменения: объем промышленной продукции начисленная среднемесячная з.п. одного работника имеют тенденцию к росту. показатели общей численности безработных и их доли в общей численности экономически активного населения после небольшого подъема за 1999 г. имеют за 2000-2002 гг. тенденцию к снижению.
При построении и анализе динамических рядов необходимо учитывать требование сопоставимости данных как в рамках одного ряда, так и в разных динамических рядах, если их исследуют совместно. Сопоставимость уровней динамическо7го ряда рассматривают в нескольких аспектах:
• по кругу охватываемых объектов;
• по территории;
• по ие6тодологии расчета показателей.
При изучении динамики явлений для хар-ки особенности их развития на отдельных этапах рассчитывают производные показатели: абсолютный прирост, коэффициент роста, темп роста и прироста, абсолютное значение 1% прироста. Расчёт основан на сравнении уровней ряда динамики.
2. Показатели ряда динамики
В зависимости от базы сравнения различают: базисные показатели динамики – это результат сравнения текущих уровней с одним фиксированным уровнем, принятым за базу, они хар-ют окончательный результат всех изменений в уровнях ряда за период от базисного до текущего уровня. Обычно за базу сравнения принимают начальный уровень динамического ряда. Цепные показатели динамики – это результат сравнения текущих уровней с непосредственно предшествующими. Они хар-ют интенсивность изменения уровней от срока к сроку.
Абсолютный прирост равен разности между текущим уровнем и уровнем более раннего периода. Интерпритацию абсолютного прироста осуществляют в тех же единицах измерения, в кот. измеряют уровни ряда, с добавлением единицы времени, за кот. определено изменение. Если текущий уровень уменьшился по сравнению с предыдущим периодом, то абсолютный прирост, имея отрицательное значение, хар-ет абсолютную убыль уровня. Абсолютный прирост за единицу времени отражает абсолютную скорость изменения. формулы абсолютного изменения уровня динамического ряда следующие:
• цепного ;
• базисного ,
где - абсолютный прирост за t единиц времени; уi – текущий уровень ряда; уi-1 – уровень ряда, непосредственно предшествующий текущему; у0 – уровень ряда, кот. принят за базу сравнения.
Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных приростов равна соответствующему базисному приросту за весь период.
(стр1: сумма показателей цепных абсолютных приростов равна базисному абсолютному приросту за 1998 – 2002 гг. 1443+1613+1118+987=5161; 6868-1707=5161).
Для оценки эффективности изменения уровня динамического ряда используют относительные показатели динамики:
• коэффициент роста, выраженный в долях единицы;
• темп роста, выраженный в %.
Коэффициент роста Кр определяется по формулам:
• цепной ;
• базисный .
Взаимосвязь цепных и базисных коэффициентов роста заключается в следующем:
а) произведение цепных коэффициентов роста равно базисному коэффициенту роста за весь период.(стр.2 = 4,21 = ), т.е. ;
б) частное от деления последующего базисного коэффициента роста на предыдущий равна соответствующему цепному коэффициенту роста ( стр.1 разделив базисный коэффициент роста за 2001 г. на базисный коэффициент роста за 2000 г., получим цепной коэффициент роста за 2001 г. (3,445:2,790 = 1,2347), т.е .
Коэффициент роста показывает во сколько раз увеличился уровень динамического ряда по сравнению с базисным, а в случае уменьшения – какую часть базисного составляет сравниваемый уровень. Темпы и коэффициенты роста отличаются только единицами измерения. Формулы расчёта темпов роста следующие:
• цепной ;
• базисный .
Темпы прироста так же, как и темпы роста, исчисляются по годам (цепным методом) и накопленным итогом за длительный период (базисным методом):
цепного, , ;
базисного , ,
Темп прироста показывает, на сколько процентов изменилась величина уровня динамического ряда за изучаемый период времени. если она сокращается, то темпы прироста будут иметь отрицательный знак и хар-вать относительное уменьшение уровней ряда.
Для правильной интерпретации относительных показателей динамики явлений рекомендуется рассматривать их совместно с исходными уровнями ряда. (Н-р: по данным Банка России, число филиалов действующих кредитных организаций на территории РФ в 2003 г. составило 97% уровня 2002 г., т.е. оно уменьшилось на 3%. А число филиалов действующих кредитных организаций за рубежом за этот же период увеличилось на 33%. Но при этом число филиалов на тер-ии РФ на начало 2002 г. было 3433, а на начало 2003 г. стало 3326, в тоже время на эти же даты за рубежом их было всего 3, а стало 4).
Если уровень ряда принимает положительные и отрицательные значения, то темпы изменения и прироста не имеют экономической интерпретации и не рассчитываются.
Для цепных показателей прироста и его темпов рассчитывают показатель абсолютного значения одного процента прироста. Он равен отношению абсолютного прироста (цепного) к темпу прироста (цепному). Этот показатель может быть исчислен и иначе, т.е. как одна сотая часть предыдущего уровня:
.
Аналитическое значение данного показателя состоит в том, что при возрастающей скорости (и растущем уровне) темпы роста могут иметь тенденцию к уменьшению или оставаться без изменения. В результате абсолютное значение одного процента прироста будет расти. Чтобы правильно оценить значение показателя темпа, его нужно рассматривать на изолированно, а совместно с абсолютными показателями уровня и прироста.
Для анализа интенсивности изменения во времени одного явления по сравнения с другим рассчитывают коэффициент опережения (Коп). Он представляет собой отношение базисных темпов роста двух динамических рядов за одинаковые отрезки времени:
;
где К1, К2 – базисные темпы роста соответственно первого и второго рядов динамики.
Коэффициент опережения показывает, во сколько раз быстрее растет уровень одного ряда динамики по сравнению с уровнем другого. При таком сопоставлении уровни должны хар-ть тенденции одного направления.
Показатели динамики с переменной базой сравнения (цепные) используют для выявления типа изменения уровней ряда. В статистической практике в соответствии с показателями динамики разливают следующие типы изменений:
- равномерный рост или снижение (цепные абсолютные приросты одинаковые);
- ускоренный рост или снижение (цепные приросты систематически увеличиваются по абсолютной величине);
- замедленный рост или снижение (цепные приросты систематически уменьшаются тоже по абсолютной величине).
Чтобы получить обобщенную характеристику скорости темпов развития изучаемого явления в пределах рассматриваемого периода, рассчитывают средние показатели динамического ряда за единицу времени.
3. Средние характеристики ряда динамики
При анализе рядов динамики особое внимание следует уделять расчёту средних показателей динамики, кот. яв-ся его обобщающей хар-кой. Различают след. средние показатели: средний уровень ряда; средний абсолютный прирост; средний темп роста; средний темп прироста.
Методы расчёта среднего уровня () ряда динамики зависят от его вида. В интервальном ряду динамики с равностоящими уровнями расчёт среднего уровня производится по ф-ле средней арифметической простой:
;
с неравностоящими уровнями – по формуле средней арифметической взвешенной:
,
где - средние уровни в интервале м-у датами; t – интервал времени; n – число уровней ряда динамики.
Для моментного ряда с равностоящими уровнями средний уровень рассчитывается по формуле средней хронологической:
.
Средняя хронологическая для неравностоящих уровней моментного ряда вычисляется по формуле:
Средний абсолютный прирост может быть рассчитан по ф-ам:
;
.
Средний коэффициент роста исчисляется по формуле средней геометрической:
,
или
Средний темп роста представляет собой средний коэффициент роста, выраженный в процентах ().Отсюда средний темп прироста .
Методы анализа основной тенденции (тренда) ряда динамики
Каждый динамический ряд может быть представлен в виде составляющих:
• тренд –основная тенденция развития явления;
• циклические колебания. в т.ч. сезонные;
• случайные колебания.
Важной задачей статистического изучения динамических рядов яв-ся определение основной тенденции развития. Для этого чаще всего используются методы:
• укрупнения интервалов;
• скользящей средней;
• аналитическое выравнивание.
Укрупнение интервалов – ряд динамики разделяют на неск. достаточно большое число равных интервалов. Если средние уровни по интервалам не позволяют увидеть тенденцию развития явления, переходят к расчёту уровней за большие промежутки времени, увеличивая длину каждого интервала (одновременно уменьшая их кол-во).
Скользящая средняя – исходные уровни заменяют средними величинами, кот. получают из данного уровня и нескольких симметрично расположенных. Целое число уровней, по кот. рассчитывается среднее значение, наз-ся интервалом сглаживания. (Н-р, если интервал сглаживания 5, то расчёт скользящих средних будет следующий:, и т.д.)
Недостаток данного метода – ряд укорачивается и строится по средним значениям.
Наиболее эффективным яв-ся аналитическое выравнивание, при кот. уровни ряда динамики выражаются в виде функции времени: .
Аналитическое выравнивание может быть осуществлено по любому рациональному многочлену.
Выбор функции производится на основе анализа характера закономерностей динамики данного явления. (Н-р, линейная зависимосимость выбирается в тех случаях, когда в исходном временном ряду наблюдается более или менее постоянные абсолютные цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению. Линейная зависимость имеет вид: ,
где - параметры ур-ния; - показатель времени; - теоретическое значение выравниваемого показателя.
Это ур-ие решается методом наименьших квадратов, кот. дает след. систему уравнений для нахождения параметров :
{
Однако техника расчёта параметров ур-ия может быть упрощена.для этой цели показателю времени придают такие значения, чтобы их сумма была = 0, т.е. ур-ия системы имеют след. вид:
{
Основная тенденция (тренд) показывает, как воздействуют систематические факторы на уровень ряда динамики, а колеблемость уровней относительно тренда служит мерой воздействия остаточных факторов. Её можно измерить квадратическим отклонением и коэффициентом вариации
Важным яв-ся проверка правильности выбора функции выравнивания. Для этого можно рассчитать F-критерий или среднюю ошибку апроксимации, кот. вычисляется по ф-ле: не должно превышать 12-15%.
Уравнение тренда, а также средние показатели динамики могут быть использованы для экстраполяции – нахождения уровней за пределами изучаемого динамического ряда.
Нахождение прогнозных значений с помощью средних показателей динамики осуществляется по ф-ам:
где k – период экстраполяции, - средний коэффициент роста.
Полученные результаты представляют собой точечный прогноз. Однако поскольку прогноз должен иметь вероятностный хар-р. как и любое суждение о будущем, рассчитывают доверительный интервал прогноза:
где - предельная ошибка прогноза
если уровни ряда нумеруются от начала
при упрощенном способе расчёта параметров уравнение тренда
где - табличное значение коэффициента Стьюдента (для числа степеней свободы ((n-m), где m- число параметров уравнения); n – число уровней исходного ряда динамики.
Методы исследования сезонных колебаний
Если уровни ряда динамики регулярно с интервалом в один год отклоняются от его основной тенденции, а при отсутствии этой тенденции – от среднего уровня, то это говорит о наличии в ряду сезонных колебаний. Так, например, сезонно колеблются уровни цен на овощи и фрукты: при наличии инфляции – относительно основной тенденции, при ее отсутствии – относительно среднегодовой цены.
Изучение сезонных колебаний осуществляют двумя методами – на основе расчета индексов сезонности и на основе гармонического анализа.
· Индексный метод анализа сезонных колебаний уровней ряда динамики.
В основе метода лежит расчет для каждого сезонного периода времени (месяца или квартала) соответствующего значения индекса сезонности.
Индекс сезонности – это относительный показатель динамики, определяющий, во сколько раз фактическое значение уровня за отдельный сезонный период времени отличается от значения уровня, соответствующего основной тенденции, а при ее отсутствии – от среднего значения уровня, рассчитанного на всем множестве сезонных периодов.
Порядок расчета индексов сезонности определяется наличием или отсутствием в ряду динамики основной тенденции и временными рамками ряда.
При отсутствии основной тенденции индекс сезонности для каждого месяца (квартала) рассчитывают по одной из формул:
по данным за один год
где номер сезонного периода времени; соответствующий ему уровень; средний уровень за год;
по данным за ряд лет
где: средний уровень за одноимённые сезонные периоды времени; средний уровень за все годы.
При наличии основной тенденции используют следующие формулы:
· по данным за один год
где теоретический уровень (уровень основной тенденции), соответствующий сезонному периоду с номером и рассчитанный по уравнению тренда или на основе метода скользящей средней (второй вариант – менее точный);
· по данным за ряд лет
,
где Т – число лет.
Обычно индексы сезонности выражают в процентах и используют в дальнейшем при построении сезонной волны. Сезонная волна – это график в виде ломаной кривой, описывающей зависимость величины индекса сезонности от сезонного периода времени. Она наглядно отображает характер сезонных колебаний уровней.
Индексный метод в статистических исследованиях
Индексы являются важнейшим видом обобщающих статистических показателей. Они используются для характеристики динамики явлений, сравнений по различным территориям, при контроле и разработке плановых заданий. Наравне со средними величинами они представляют собой один из самых распространенных видов статистических показателей. Слово «индекс» (index) в переводе с латыни означает указатель, показатель. В статистике этот термин имеет специфическое значение. Индекс – это относительная величина, характеризующая изменение сложных общественных явлений во времени, пространстве или по сравнению с планом.
Индекс является результатом сравнения двух одноименных величин, поэтому необходимо различать величину сравнения (числителя индексного отношения) и базу сравнения (знаменатель). Выбор базы сравнения определяется целью исследования; при изучении динамики в качестве базы используются данные какого-либо предыдущего периода; при контроле за выполнением плана – плановые данные; при территориальных сравнениях – данные другой территории.
Статистика изучает в основном сложные экономические явления, которые состоят из элементов непосредственно несоизмеримых. Так, если электромеханический завод производит несколько видов продукции, то данные о выпуске продукции в натуральном выражении суммировать нельзя. Для того, чтобы показать общее изменение выпуска по нескольким видам продукции и вычисляются индексы. С их помощью можно дать обобщенную характеристику изменения себестоимости, цен, выпуска по нескольким видам продукции.
При всем их разнообразии экономические индексы подразделяются на индивидуальные и общие индексы.
Индивидуальным называется индекс, характеризующий изменение объема производства, объема продажи, уровня производительности труда и т.д. в отношении какого-нибудь одного продукта.
Индивидуальные индексы:
цен ; себестоимости ; стоимости .
Общим (агрегатным) называется индекс, характеризующий общее (среднее) изменение объема производства, объема продаж, уровней цен и т.д. в отношении совокупности рядов товаров. Например, индексы, показывающие изменение общего объема производства различных видов продукции или изменение уровня цен различных видов товаров в целом. При расчете общих индексов возникает проблемы соизмерения показателей по отдельным товарам. Соизмеримость отдельных показателей достигается путем взвешивания, суть которого состоит в том, что при вычислении абстрагируются от влияния изменения одной из сторон изучаемого явления, принимая ее за неизменную величину. Так, при расчете индекса объема проданной продукции неизменными величинами будут цены, а при расчете индекса цен – количество проданной продукции. Та сторона изучаемого явления, от влияния изменения которой абстрагируются, принимая ее за неизменную, называется весами индекса.
К индексам объемных показателей относятся индексы физического объема продукции, численность рабочих, общий расход материалов. Они измеряют общий, суммарный объем того или иного явления.
Методы построения индексов объемных показателей рассмотрим на примере индекса физического объема продукции. При его исчислении ставится задача охарактеризовать изменение объема всей продукции, изготовленной предприятием или группой предприятий.
Индивидуальные индексы физического объема продукции характеризуют изменение выпуска по каждому виду продукции, их формула может быть записана следующим образом:
,
где и – выпуск продукции данного вида соответственно в отчетном и базисном периоде.
Чтобы индекс отражал только изменение индексируемого объемного показателя, веса в его числителе и знаменателе фиксируются на уровне одного и того же периода. В данном случае, для того, чтобы показать изменение объема продукции, необходимо устранить изменение цен. Это достигается тем, что продукция отчетного и базисного периода исчисляется в одинаковых (фиксированных) ценах.
Общий индекс физического объема продукции:
,
где – индексируемая величина; – вес; – цены сопоставимые (базисные).
К индексам качественных показателей относятся индексы цен, индексы себестоимости продукции, индексы средней заработной платы, индексы производительности труда, индексы удельных расходов материалов. Эти индексы характеризуют показатели, которые носят расчетный характер. Они измеряют интенсивность, эффективность явления и являются либо средними, либо относительными величинами.
Перед общим (агрегатным) индексом качественного показателя ставится задача измерить не только относительное изменение уровня, но и абсолютную величину того экономического эффекта, который получен в текущем периоде в результате этого изменения. В данном случае сумму экономии покупателей за счет снижения цен, или сумму их дополнительных расходов, если цены повысились.
Для получения общего индекса цен нужно построить его так, чтобы отразилось влияние только фактора изменения цен, и было бы исключено влияние изменения количества проданных товаров. Это возможно в том случае, если для обоих сравниваемых периодов количество проданных товаров будет взято одинаковое. Количество проданных товаров следует брать в текущем периоде, так как только на приобретении этого количества потребитель может экономить в результате снижения цен или перерасходовать в результате их повышения.
Общий индекс цен:
– индекс цен Пааше,
где – индексируемая величина; – веса.
В числителе индекса дана суммарная стоимость проданных в текущем периоде товаров по ценам текущего периода, а в знаменателе – стоимость того же количества товаров, но рассчитанная по ценам базисного периода.
Экономия (перерасход) от изменения цен:
.
В статистике используются и другие формы представления общих индексов цен – Ласпейреса и Фишера:
– индекс цен Ласпейреса,
– индекс цен Фишера.
Если при исчислении индексов сравниваемых периодов три и более, то возникает вопрос о выборе базы сравнения. В зависимости от базы сравнения различают цепные и базисные индексы.
Цепные индексы получают путем сопоставления индексируемого показателя любого периода с показателем предшествующего ему периода. Базисные индексы вычисляются путем сравнения индексируемого показателя каждого периода с соответствующим показателем периода, принятого за базу сравнения.
Цепные и базисные индексы могут быть как индивидуальные, так и общие.
Между цепными и базисными индексами существует определенная взаимосвязь, которая для индивидуальных индексов проявляется всегда, а для агрегатных индексов – лишь при определенных условиях.
Базисные индивидуальные индексы:
; ; .
Цепной индивидуальный индекс:
; ; .
Последовательное перемножение цепных индивидуальных индексов дает возможность получить базисный индекс:
.
Базисный агрегатный индекс физического объема продукции:
; .
Цепной агрегатный индекс физического объема продукции:
; .
Последовательно перемножение цепных агрегатных индексов физического объема продукции дает возможность получить базисный индекс:
.
Агрегатные индексы качественных показателей всегда являются индексами с переменными весами, так как при их исчислении всегда используются веса отчетного периода. Поэтому цепной метод исчисления базисных индексов для них не приемлем.
Агрегатный способ исчисления общих индексов является основным, но не единственным в статистике. В ряде случаев из-за отсутствия некоторых данных нельзя произвести расчет по формуле агрегатного индекса. Это может иметь место в том случае, если нет данных об абсолютном значении индексируемой величины, т.е. величины показателя, характеризующего ту сторону явления, изменение которой изучается (например, при исчислении индекса физического объема продукции нет данных об объеме производства в целом). В этом случае применяются средние индексы.
Мы знаем, что индивидуальный индекс физического объема выражается , следовательно, . Если в формуле агрегатного индекса заменить на выражение , то получим формулу среднего арифметического индекса физического объема:
В тех случаях, когда нет данных о количестве проданных товаров, нельзя исчислить агрегатный индекс цен, но если известны индивидуальные индексы цен, а также имеются данные о продажах в текущем периоде в ценах текущего периода, таким образом, можно исчислить средний гармонический индекс цен.
Из формулы индивидуального индекса цен , определим . Если в агрегатном индексе цен заменить в знаменателе на , то получим формулу среднего гармонического индекса цен:
.
Изменение структуры изучаемой совокупности оказывает влияние на динамику экономических явлений. Рассмотрим это положение на примере изменения цен на всех рынках на какой-то один товар. Изменение цен может быть результатом двух факторов: изменения уровня цен на отдельных рынках и изменения в соотношении количества данного товара, реализованного на отдельных рынках с разным уровнем цен на этот товар.
Во-первых, определим результат совместного действия обоих факторов. В этом случае индекс цен на какой-то товар определяется, как отношение средней цены текущего периода к средней цене базисного периода. Для определения средних цен текущего и базисного периода в качестве весов принимается количество реализованного товара в соответствующих периодах:
.
Отношение двух взвешенных средних с изменяющимися (переменными) весами, показывающее изменение индексируемой величины, принято называть индексом переменного состава.
Чтобы определить изменение уровня цен в чистом виде, надо устранить влияние изменения структуры продаж:
.
Отношение средних взвешенных с одними и теми же весами называется индексом постоянного (фиксированного) состава.
Для определения влияния изменения соотношения количества проданного товара на разных рынках необходимо устранить влияние изменения цен на отдельных рынках, т.е. зафиксировать их на базисном уровне. Для этих целей рассчитывается индекс структурных сдвигов:
,
.
Все экономические явления находятся во взаимосвязи друг с другом. Так, стоимость выработанной продукции зависит от количества выработанной продукции и цены за единицу продукции. Также связаны и индексы, характеризующие изменения этого явления:
.
; .
Перемножим данные индексы:
. Следовательно, .
На основании двух индексов при единстве методологии их построения может быть исчислен третий. Так, если объем производства возрос на 10%, а цена снизилась на 5%, то изменение стоимости составит: 1,1 · 0,95 = 1,157 или 115,7%.
Индексный метод широко используется при анализе роли отдельных факторов в динамике какого-либо сложного явления. При этом индексный метод позволяет определить размер абсолютного изменения сложного явления за счет каждого фактора в отдельности.
Сложным явлением следует считать такой показатель, который может быть представлен как произведение двух и более показателей. Предположим, что сложное явление А представляет собой произведение двух показателей: a и b, т.е. А = a · b.или . Изменение сложного явления может быть представлено индексом.
или .
Абсолютное изменение явления под влиянием всех факторов представляет разность между числителем и знаменателем:
или .
Задача заключается в том, чтобы выявить влияние каждого фактора в отдельности. Для этого индекс сложного явления разлагают на частные индексы, характеризующие роль каждого фактора.
Сущность метода обособленного изучения факторов заключается в том, что при выявлении роли каждого фактора сложное явление в отчетном периоде берется в том виде, какой бы оно имело, если бы изменился один данный фактор, а прочие бы остались неизменными (на уровне базисного периода).
Роль каждого фактора определим:
или ,
абсолютное отклонение:
или
или ,
абсолютное отклонение:
или .
Общее изменение явления А может быть представлено как произведение частных индексов.
, или .
В результате суммирования абсолютных отклонений получается неразложимый остаток, который можно рассматривать как результат совместного действия всех факторов.
При последовательно-цепном методе используется система взаимосвязанных частных индексов. При этом методе, выявляя влияние качественного фактора, объемный фактор при построении индекса сохраняют на уровне отчетного периода; при построении индекса объемного фактора качественный фактор берется на уровне базисного периода.
Статистическое изучение взаимосвязей
В процессе статистического исследования зависимостей находятся причинно-следственные отношения между явлениями, что позволяет выделять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственная связь - это связь явлений и процессов, когда изменение одного из них - причины - ведет к изменению другого - следствия.
Причина - это совокупность условий, обстоятельств, действие которых приводит к появлению следствия. Если между явлениями действительно существует связь, то эти условия обязательно должны реализовываться вместе с действиями причин. Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Поэтому при их изучении необходимо выявить главные, основные причины.
Статистика разработала много методов изучения связей, выбор которых зависит от целей исследования и от поставленных задач. Признаки по их значению для изучения взаимосвязей делятся на два класса. Признаки, которые приводят к изменению других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменение которых вызвано действием факторных, называют результативными.
Различают два типа связей между различными явлениями: функциональную или жестко детерминированную и статистическую или стохастически детерминированную.
Если с изменением значения одной переменной вторая меняется строго определенным образом, т.е. значение одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменной, связь между ними является функциональной.
Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но её среднее значение или статистические массовые характеристики изменяются по определенному закону - связь является статистической.
Корреляционной связью называют важнейший частный случай статистической связи, который состоит в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение у.
Изучение корреляционной связи имеет 2 цели:
- измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной.
- измерение тесноты связи двух (или большего числа) признаков между собой.
В статистике принято различать следующие зависимости:
Парная корреляция - связь между 2 признаками (результативным и факторным или двумя факторными)
Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
Множественная корреляция - зависимость результативного и двух и более факторных признаков, включенных в исследование.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции. Эти коэффициенты дают возможность количественно определить "полезность" факторных признаков при построении уравнений множественной регрессии, а также служат оценкой соответствия уравнения регрессии выявленным причинно-следственным связям..
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или несколько независимых величин, а множество всех факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной).
Уравнение регрессии, или статистическая модель связи социально-экономических явлений выражается в общем случае уравнением:
, которое адекватно отражает реальное моделируемое явление при соблюдении следующих требований их построения:
Совокупность исследуемых исходных данных должна быть однородной .
возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.
все факторные признаки должны иметь количественное выражение.
наличие достаточно большого объема исследуемой выборочной совокупности.
отсутствие количественных ограничений на параметры модели связи.
постоянство временной и территориальной структуры изучаемой совокупности.
Одной из проблем построения уравнения регрессии является её размерность, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Практика выработала критерий, позволяющий установить количество факторных признаков, включаемых в модель. Число факторных признаков (k) должно быть в 5-6 раз меньше объема изучаемой совокупности.
По форме зависимости различают:
1) линейную регрессию, которая выражается уравнением прямой, вида:
нелинейную регрессию, которая выражается уравнениями вида:
парабола - ;
гипербола -
По направлению связи различают:
прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются.
обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины, зависимая соответственно уменьшается или увеличивается.
Корреляция и регрессия тесно связаны между собой: первая оценивает силу статистической связи, вторая исследует её форму.
2. Парная регрессия на основе метода наименьших квадратов и метода группировок.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой :
параболы - ;
гиперболы -
Определить тип уравнения можно, исследуя зависимость графически или аналитически: если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то связь - линейная, а при обратной связи - гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативный - значительно быстрее, то используется параболическая, или степенная регрессия.
Оценка параметров уравнения регрессии (а0, а1, а2) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
Будем считать, что две величины Х и У взаимосвязаны между собой, причем У находится в некоторой зависимости от Х, т.е. У - зависимая величина, а Х - независимая.
Сущность метода заключается в нахождении параметров (а0, а1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению:
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
где n - объем исследуемой совокупности (число единиц наблюдения)
В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (невыделенных для исследования) факторов, параметр а1 (в уравнениях параболы и а2) показывает насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Если связь нелинейная и описывается уравнением параболы второго порядка, то
В данном случае задача сводится к определению неизвестных параметров а0, а1, а2
Значения величин Х и У представлены двумя рядами данных:
У1 У2 У3 … Уn
X1 X2 X3 … Xn
Если бы все значения, полученные по данным наблюдениям лежали бы на строго на кривой, то для них было бы справедливо равенство:
Однако на практике имеем отклонение эмпирических данных и теоретических:
где - разность между данными наблюдения и данными, полученными по уравнению связи.
Оценка обратной зависимости между Х и У может быть осуществлена на основе уравнения гиперболы:
Проделав аналогичные рассуждения (как в линейной регрессии) для нахождения параметров гиперболы, можно получить систему уравнений:
Решение вопроса о возможности использования метода наименьших квадратов для изучения связей между явлениями зависит от свойства оценок, получаемых с помощью этого метода. Даже при сравнительно небольшом числе наблюдений применение метода наименьших квадратов позволяет получить достоверные оценки. Этот метод может также использоваться в случаях проведения анализа косвенных наблюдений, являющихся функциями многих неизвестных.
3. Множественная (многофакторная) регрессия.
Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т.е. требуется определить аналитическое выражение связи между результативным признаком (У) и факторными признаками (х1, х2, … , хк), найти функцию
Построение моделей множественной регрессии включает 3 этапа:
выбор формы связи (уравнения регрессии);
отбор факторных признаков;
обеспечение достаточного объема совокупности для получения оценок.
Практика построения многофакторных моделей показывает, что все реально существующие зависимости можно описать, используя 5 типов моделей:
линейная -
степенная -
показательная -
параболическая -
гиперболическая -
где Y1,2,3,…,k - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
х1, х2, …, хк - факторные признаки;
а0, а1, …, ак - параметры модели (коэффициенты регрессии)
Важным этапом построения является отбор и последующее включение факторных признаков. Сложность заключается в том, что все факторные признаки находятся в зависимости один от другого. Отбор признаков осуществляется при помощи двух методов: метода экспертных оценок и шаговой регрессии.
Метод экспертных оценок основан на расчете и анализе непараметрических показателей связи: ранговых коэффициентов корреляции Спирмена, Кендалла и конкордации.
Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициенты регрессии не изменяются (или меняются несущественно), то включение данного признака в уравнение регрессии необходимо. Если же при включении в модель факторного признака коэффициенты регрессии меняют величину, свой знак на противоположный, множественный коэффициент корреляции не возрастает, то данный факторный признак нецелесообразен.
Аналитическая форма выражения связи результативного признака и ряда факторных называется уравнением регрессии. Параметры уравнения могут быть найдены графически или аналогично парной корреляции - методом наименьших квадратов.
4. Оценка тесноты связи.
Измерение тесноты и направления связи между признаками предлагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторов.
Линейный коэффициент корреляции был впервые введен в начале 90-х гг. 19 века Пирсоном, Эджвортом и Велдоном и характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.
В расчете этого коэффициента учитывается величина отклонений индивидуальных значений признаков от средней величины: и . Однако, сопоставляемые полученные величины могут быть выражены в различных единицах измерения или могут различны по величине. Поэтому сравнивают нормированные отклонения:
и
Для получения обобщающей характеристики тесноты связи берут среднее произведение нормированных отклонений:
Формула линейного коэффициента корреляции может быть представлена в следующем виде:
Используя математические свойства средней, получаем:
Преобразования данной формулы позволяют получить следующую формулу линейного коэффициента корреляции:
или
где n - число наблюдений
Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:
или
Коэффициент корреляции может быть выражен через дисперсии слагаемых:
Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Линейный коэффициент корреляции изменяется в пределах от -1 до 1. При этом оценку линейного коэффициента корреляции можно представить в таблице:
Значение линейного коэффициента корреляции
Характер связи
Интерпретация связи
r=0
Отсутствует
-
0 < r < 1
Прямая
С увеличением Х увеличивается У
-1 < r < 0
Обратная
С увеличением Х уменьшается У, и наоборот
r=1
Функциональная
Каждому значению факторного признака строго соответствует одно значение результативного признака
По степени тесноты связи различают количественные критерии оценки тесноты связи на основе шкалы Чеддока:
Величина коэффициента корреляции при наличии
Характер связи
прямой связи
обратной связи
от 0,1 до 0,3
от -0,3 до -0,1
практически отсутствует
от 0,3 до 0,5
от -0,5 до -0,3
слабая
от 0,5 до 0,7
от -0,7 до -0,5
умеренная
от 0,7 до 0,9
от -0,5 до -0,7
сильная
0,9 до 0,99
от -0,99 до -0,9
весьма сильная
В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.
Эмпирическое корреляционное отношение рассчитывается по данным группировки, когда δ2 характеризует отклонения групповых средних результативного показателя от общей средней:
(7)
где η - корреляционное отношение;
σ2 - общая дисперсия
- средняя из частных (внутригрупповых) дисперсий;
- межгрупповая дисперсия (дисперсия групповых средних)
В основе расчета корреляционного отношения лежит правило сложения дисперсий, при этом средняя из межгрупповых дисперсий отражает вариацию результативного признака У под влиянием всех неучтенных при анализе факторов, т.е. носит остаточный характер. Поэтому её часто называют остаточной дисперсией.
Отсюда формула корреляционного отношения принимает вид (выражаем межгрупповую дисперсию через общую и среднюю из внутригрупповых):
Корреляционное отношение изменяется в пределах от 0 до 1 и анализ степени тесноты связи полностью соответствует линейному коэффициенту корреляции. Теоретическое корреляционное отношение также может выражаться по формуле:
Корреляционное отношение является более универсальным показателем тесноты связи сравнению с линейным коэффициентом корреляции.
Для измерения тесноты связи при множественной корреляционной зависимости, т.е. при исследовании трех и более признаков одновременно, вычисляются множественный или совокупный и частные коэффициенты корреляции.
Множественный коэффициент корреляции рассчитывается при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.
В случае оценки связи между результативным (У) и двумя факторными признаками (х1 и х2) множественный коэффициент корреляции определяют по формуле:
где r - парные коэффициенты корреляции между признаками
Для измерения тесноты применяются коэффициент детерминации. Он равен квадрату корреляционного отношения и обозначается буквой η2
В числителе формулы стоит сумма квадратов отклонений фактических значений признака у от индивидуальных расчетных показателей. Эта сумма не может равняться нулю, если связь не является функциональной. При неверной формуле или ошибки в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается.
С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле:
где - среднее значение соответствующего факторного признака;
- среднее значение результативного признака;
аi - коэффициент регрессии при соответствующем факторном признаке.
Коэффициент эластичности показывает, на сколько в среднем изменится значение результативного признака при изменении факторного признака на 1\%.
Интерпретировать корреляционные показатели строго следует лишь в терминах вариации отклонений от средней величины. Если же необходимо измерение изменений признака во времени, то метод корреляционно-регрессионного анализа требует значительного изменения. Модели на основе этого метода обладают слабыми экстраполяционными свойствами и не отражают тенденции развития и пригодны лишь для построения краткосрочных прогнозов.
5. Проверка значимости параметров регрессии.
Проверка статистической значимости всех параметров, полученных в процессе корреляционно-регрессионного анализа, основывается на предположении, что все эти параметры, а точнее, их значения являются конкретными числовыми реализациями некоторых случайных величин. И для каждого конкретного значения параметра можно оценить как вероятность превышения найденной величины, так и вероятность того, что в процессе расчета могли получить меньшее значение параметра. Здесь используется принцип практической невозможности маловероятных событий. Если найденная величина параметра все-таки попала в зону маловероятных значений, то с достаточной для практики строгостью данное значение параметра можно считать неслучайным или статистически значимым. Если же конкретное значение параметра попадает в область весьма вероятных значений, то это говорит о случайности вычисленного параметра,, его статистической незначимости - доверие к такому параметру уменьшается. Проверка значимости сводится к сравнению полученного значения с тем числом, которое отделяет область маловероятных значений от весьма вероятных.
В настоящее время большинство расчетов по корреляционно-регрессионному анализу выполняется с помощью пакетов прикладных программ по статистике. Соответствующие пакеты обеспечивают такую проверку, сообщая граничную величину t-критерия Стьюдента и (или) F-критерия Фишера.
Для парной регрессии значения критериев определяются следующим образом.
Значимость линейного коэффициента корреляции r и параметров a0 и а1 в уравнении Y=a0+a1X оценивается на основе t-критерия Стьюдента
значимость параметра а0 определяется из уравнения
Для оценки значимости уравнения регрессии в целом, особенно при нелинейных зависимостях, используют F-критерий:
, где и носит название индекса детерминации.
где m - число параметров уравнения регрессии (число линейных уравнений, по которым определялись параметры уравнения регрессии)
Расчетное значение t-критерия сравнивается по абсолютной величине с граничным (табличным) значением распределения Стьюдента при (n-m) степенях свободы и заданном уровне значимости (чаще всего принимают α=0,01 или α=0,05). Если фактическое значение t-критерия больше табличного, то данный параметр считается значимым. Аналогично сравнивается с табличным расчетное значение F-критерия при заданном уровне значимости α и k1 = n-m степенях свободы.
При проверке значимости эмпирического корреляционного отношения m - число групп, выделенных в процессе группировки по факторному признаку, а вместо R2 в формулу F-критерия подставляют величину η2.
Социально-экономическая статистика, или статистика, — это: 1) отрасль знаний — наука, представляющая собой сложную и разветвленную систему научных дисциплин (разделов), обладающих определенной спецификой и изучающих количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной; 2) отрасль практической деятельности — сбор, обработка, анализ и публикация массовых данных о явлениях и процессах общественной жизни; 3) совокупность цифровых сведений, характеризующих состояние массовых явлений и процессов общественной жизни или их совокупность; 4) отрасль статистики, использующая методы математической статистики для изучения социально-экономических процессов и явлений.
Объектом изучения социально-экономической статистики является общество во всем многообразии его форм и проявлений. Это связывает социально-экономическую статистику со всеми другими науками, изучающими общество, протекающие в нем процессы закономерности его развития, — с политической экономией, экономикой промышленности, сельского хозяйства, социологией и др. В этом общем для всех общественных наук объекте каждая из них находит свой специфический аспект изучения — какие-либо характерные существенные свойства, стороны, отношения явлений общественной жизни, определенные сферы деятельности людей и т.п.
Явлениям общественной жизни наряду с качественной определенностью присуща и количественная определенность. Обе эти стороны неразрывно связаны между собой. В каждый данный исторический момент социальные и экономические явления имеют определенные размеры, уровни, между ними существуют определенные количественные соотношения.
Таковы, например, численность населения страны на определенную дату, соотношение между численностью мужчин и женщин, темпы роста валового внутреннего продукта, темпы его прироста и многое другое. Вот эти объективно существующие размеры, уровни, количественные отношения, находящиеся в состоянии непрерывного движения и изменения, представляющие собой в общем количественную сторону экономических и социальных явлений, закономерности их изменения, и составляют предмет познания социально-экономической статистики.
Социально-экономическая статистика изучает количественную сторону массовых социальных и экономических явлений в неразрывной связи с их качественной стороной, т.е. качественно определенные количества и проявляющиеся в них закономерности. Она изучает производство в единстве производительных сил и производственных отношений, влияние природных и технических факторов на количественные изменения в общественной жизни, влияние развития общества, производства на окружающую среду.
Социально-экономическая статистика изучает производство, потребление материальных и духовных благ в обществе, закономерности их изменения, экономические и социальные условия жизни людей.
При помощи системы количественных показателей социально-экономическая статистика дает характеристику качественных сторон явлений общественных отношений, структуры общества и т.п.
Предметом изучения социально-экономической статистики являются и процессы, протекающие в народонаселении, — рождаемость, браки, продолжительность жизни и т.п.
В статистических данных проявляются характерные особенности, тенденции, закономерности развития социальных и экономических явлений и процессов, связи и взаимозависимости между ними.
Социально-экономическая статистика выработала систему научных понятий, категорий и методов, посредством которых она познает свой предмет. Важнейшую часть этой системы составляет система основных показателей состояния и развития экономической и социальной жизни общества.
Многие явления становятся точно определенными, значимыми, лишь будучи статистически выраженными, т.е. представленными в форме количественных статистических показателей. Нельзя, например, составить ясного представления об урожайности какой-нибудь культуры в стране без обобщенного статистического выражения ее в виде средней урожайности или представить себе размеры производства автомобилей без статистических данных о выпуске автомобилей промышленностью страны и т.п.
Нельзя без количественных характеристик представить себе с достаточной ясностью и многие экономические категории общего характера, категории политической экономии. К. Маркс следующим образом разъясняет понятие строения отрасли и хозяйства в целом: «Многочисленные индивидуальные капиталы, вложенные в определенную отрасль производства, более или менее отличаются по своему строению друг о друга. Средняя из их индивидуальных строений дает нам строение всего капитала данной отрасли производства. Наконец, общая средняя из этих средних строений всех отраслей производства дает нам строение общественного капитала данной страны...».[ Маркс К., Энгельс Ф. Соч. Т. 23. С. 626—627.]
В статистических данных проявляются многие закономерности массовых социальных и экономических явлений в данных условиях места и времени, которые иначе не могут быть выявлены. Сила их действия также не может быть оценена без социально-экономической статистики. Такие закономерности называют статистическими. Их изучение составляет важную задачу статистической науки
Социально-экономическая статистика является в настоящее время сложной, широко разветвленной отраслью знания. Она представляет собой систему научных дисциплин, обладающих определенной спецификой и известной самостоятельностью. Основными разделами (отраслями) социально-экономической статистики как науки являются:
§ теория статистики, в которой рассматриваются вопросы сущности статистики как науки, ее предмета, общие категории, понятия, принципы и методы;
§ экономическая статистика и ее отраслевые статистики, изучающие экономику народного хозяйства в целом и отдельных его отраслей (статистика промышленности, сельского хозяйства, лесного хозяйства, транспорта, связи, строительства, водного хозяйства, геологии и разведки недр, торговли и др.);
§ социальная статистика и ее отраслевые статистики, изучающие социальные явления (политическая статистика, статистика уровня жизни и потребления материальных благ и услуг, жилищно-коммунального хозяйства и бытового обслуживания населения, народного образования, культуры и искусства, здравоохранения, физической культуры и социального обеспечения, науки и научного обслуживания, управления);
§ статистика населения, изучающая процессы и явления, происходящие в области народонаселения, — численность, состав населения, рождаемость, смертность, миграция населения и т.п.
Отрасли социально-экономической статистики как единой общественной науки взаимосвязаны, они дополняют и обогащают друг друга. Многие показатели статистики отдельных отраслей так богаты по содержанию, что могут быть использованы другими отраслями, ибо содержат в себе разностороннюю информацию. Выше мы указали на рождаемость, смертность, состав населения как явления, изучаемые статистикой населения. Вместе с тем эти же показатели важны для характеристики различных социальных процессов. Они необходимы и другим отраслям статистики, так как связаны со многими экономическими и социальными условиями жизни общества, зависят от них и в свою очередь оказывают на них определенное влияние. Естественно, что такого рода показатели изучаются несколькими отраслями статистики, каждая из которых использует свою, содержащуюся в этих показателях информацию.
Социально-экономическая статистика, базируясь на положениях политической экономии, исследует количественное выражение многих экономических категорий, динамику, структуру, взаимосвязи конкретных экономических явлений, закономерности их развития в данных условиях места и времени. Вместе с тем она обогащает политическую экономию статистическими данными, знанием фактов, знанием конкретного проявления законов общественного развития в определенных условиях места и времени, специфическими методами исследования. Без этого экономическая наука вообще обходиться не может.
Методологической основой социально-экономической статистики является диалектика. Опираясь на ее законы, социально-экономическая статистика разрабатывает специфические приемы, способы исследования, соответствующие природе изучаемых ею явлений и составляющие в целом метод социально-экономической статистики, или, иначе, ее методологии. Социально-экономическая статистика применяет в своих исследованиях методы дедукции и индукции.
Поскольку мы в данном учебнике рассматриваем социально-экономическую статистику как учебную дисциплину, т.е. в суженном виде — без теории статистики, то надо отметить, что в своих исследованиях социально-экономическая статистика использует методы и принципы теории статистики, опирается на них и развивает их. Это прежде всего метод массового статистического наблюдения, метод группировок, метод обобщающих показателей — абсолютных и относительных величин, средних величин, индексный метод и др. Большое значение в социально-экономической статистике имеет балансовый метод, метод математической статистики.
В изучении и анализе социально-экономических процессов и явлений широко применяются математические методы, например при анализе баланса межотраслевых связей, выявлении влияния различных факторов на повышение эффективности производства и т.д. Отраслевые статистики в их полном объеме в данном курсе не рассматриваются.
Явления и процессы, изучаемые социально-экономической статистикой, находятся в состоянии непрерывного движения, количественного и качественного изменения. Изменяются их размеры, структура, свойства, сущность и формы проявления, закономерности развития. Одновременно должны видоизменяться и статистические приемы и методы исследования применительно к изменениям, которые претерпевают сами явления и процессы, т.е. с учетом конкретных особенностей изучаемых объектов, места и времени.
В коренном совершенствовании и в расширении нуждаются и сферы применения статистических методов. Причем статистические методы, методы математической статистики, моделирования и прогнозирования необходимо применять в комплексе, что позволит сделать более глубокий анализ явлений и процессов, получить научно обоснованные выводы, более точно определить объективные тенденции и закономерности.
Реформирование общеметодологических основ статистики при переходе к рыночной экономике проявляется в изменении не только состава и экономического содержания показателей, но и методов их расчета.
В последние годы специалисты государственной статистики и других экономических ведомств совместно с учеными — статистиками и экономистами — проделали большую работу по совершенствованию методов расчетов традиционных показателей; обоснованию методологии исчисления новых показателей, характеризующих зарождающиеся и развивающиеся рыночные отношения в российской экономике; созданию необходимой методической документации.
Для приближения методологии статистического учета к международной практике в государственной статистике с 1992 г. стали использовать относительный показатель — «индекс физического объема», отражающий изменение массы произведенных материальных благ при исключении влияния динамики цен в текущем периоде по сравнению с базисным, что было особенно актуально в условиях высокого уровня денежной инфляции.
В связи с тем что в экономике России происходят существенные институциональные изменения, формируется негосударственный сектор экономики, привлекаются иностранные капиталы, появляются предприятия малого бизнеса и большое число физических лиц, занимающихся самостоятельной хозяйственной деятельностью, стало невозможным использовать сплошные методы учета деятельности предприятий; возникла необходимость обеспечения объективного отражения процессов, происходящих в экономике, иным путем. Полноту учета надо было компенсировать научно обоснованными методами дорасчетов статистических показателей. Такие методы были разработаны. Они позволяют:
во-первых, проводить дорасчеты на неучтенный круг хозяйствующих субъектов. К ним в основном относятся малые предприятия (не представляющие статистические отчеты как в течение года, так и по его итогам) и физические лица, осуществляющие хозяйственную деятельность. Эти объекты, как показали обследования, зачастую не регистрируются в соответствующих органах исполнительной власти, что затрудняет учет их деятельности, особенно по стоимостным показателям;
во-вторых, проводить дорасчеты до полного круга отчитывающихся предприятий и организаций по отдельным категориям учетных единиц (малым, совместным, иностранным и другим предприятиям и организациям). Сбор и разработка данных по этим предприятиям в течение года осуществляются в более поздние, чем по остальным предприятиям, сроки. Вместе с тем имеется потребность в данных за определенный временной период по полному кругу отчитывающихся предприятий;
в-третьих, рассчитать данные по отдельным объектам, учет которых в течение года в стоимостном выражении не осуществлялся (например, в индивидуальном жилищном строительстве).
Задачи социально-экономической статистики
Задачи социально-экономической статистики определяются социально-экономическими потребностями общества. Социально-экономическая статистика решает широкий круг задач. Прежде всего это всестороннее и глубокое изучение состояния и развития экономики страны, различных социальных и экономических процессов, происходящих в ней, их закономерностей путем сбора, обработки, анализа и обобщения данных о них.
На каждом этапе развития перед социально-экономической статистикой встают специфические задачи, обусловленные характером самого этапа. В условиях перехода к рыночной экономике социально-экономическая статистика призвана решать новые важные задачи. Для этого требуется повышение ее качества и оперативности, совершенствование отчетности, углубление социально-экономического анализа.
Особое внимание должно быть уделено совершенствованию методологии анализа важнейших пропорций: между производством и потреблением, потреблением и накоплением, между производством средств производства и производством предметов потребления, между отдельными отраслями; изучению структуры экономики и технико-экономических сдвигов, научно-технического прогресса; выявлению диспропорций, могущих возникнуть в экономике; вскрытию и более полному использованию всех возможностей рыночной экономики. Большое значение имеет также оценка состояния экономики и уровня жизни населения.
На современном этапе, когда все более ограниченными становятся экстенсивные факторы развития экономики, исключительную важность приобретает задача социально-экономической статистики по анализу эффективности общественного производства.
Практическое решение этих задач призвана осуществлять система органов государственной статистики. В Положение о Государственном комитете Российской Федерации по статистике, были определены конкретные задачи, а именно:
§ разработка научно обоснованной статистической методологии, соответствующей потребностям общества на современном этапе, а также международным стандартам;
§ координация статистической деятельности федеральных органов исполнительной власти субъектов Российской Федерации, обеспечение условий для использования указанными органами официальных статистических стандартов при проведении ими отраслевых (ведомственных) статистических наблюдений;
§ разработка экономико-статистической информации, ее анализ, составление национальных счетов, необходимых балансовых расчетов;
§ гарантирование полноты и научной обоснованности всей официальной статистической информации;
§ предоставление всем пользователям равного доступа к открытой статистической информации путем распространения официальных докладов о социально-экономическом положении Российской Федерации, субъектов Российской Федерации, отраслей и секторов экономики, публикации статистических сборников и других статистических материалов.