Статистика
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Курс : Статистика
Статистика В.М. Гусаров Москва, Юнити , 2003г
Статистика В.С. Мхиторян , Москва, Экономист, 2005г.
Статистика И.И. Елисеева
Статистика М.Г.Назаров
Статистика Н.М. Харченко , Москва, «Дашков и К», 2008г.
Статистика Курс лекций, Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др Москва, Издательство «Инфра», издательство Новосибирской Гос. Академии, 1996г.
Общая теория статистики, М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев Москва, «Инфра - М» 1998г.
Теория статистики, Р.А. Шмойловой ,Москва, Финансы и статистика , 1996г.,
Общая теория статистики А.А. Спирин, О.Э.Башина ,Москва, Финансы и статистика, 1999г.
Общая теория статистики, Елисеева И.И., Юзбашев М.М., Москва, Финансы и статистика, 1999г.
«Финансы и статистика», 1988г.
Общая теория статистики, И.С. Пасхавер, А.Л. Яблочник, Москва, «Финансы и статистика», 1983г.
Общая теория статистики, Н.Н. Ряузов, Москва, « Статистика», 1971г.
Практикум по теории статистики, Р.А. Шмойлова, Финансы и статистика, Москва, Финансы и статистика, 2002г.
Практикум по теории статистики Г.Л. Громыко
Практикум по статистике. В.М. Симчеры, Москва, ЗАО
«Финстатформ», 1999г.
Практикум по общей теории статистики и с.х. статистике, А.П. Зинченко, Москва,
Тема 1. Введение в предмет статистики, этапы статистических исследований
1. История развития статистики. Предмет и метод статистики
Слово статистика произошло от латинского слова status – состояние, положение - явлений, процессов.
От корня этого слова произошли названия слов :
stato – государство
statista- статистик ( знаток государства )
statistica – статистика, определенная сумма знаний, сведений о государстве.
Статистическая практика уходит в глубь веков, ее возникновение относится к периоду образования классов, классового общества.
У истоков статистической науки стояли две школы : немецкая описательная ( Германия Конринг, Г Ахенваль и т. д. ) и английская школа политических арифметиков ( Граунт, В.Петти и др.).
Г.Ахенваль в 1749г. немецкий ученый выпустил книгу о государствоведении.
На Руси до 18 г. учетно – статистические операции носили бессистемный характер. В период царствования Петра, был введен текущий учет населения – (церковь регистрировала рождение, смерти, браков, православных); велся учет городов и городского населения. В 1724 введена обязательная регистрация новых фабрик, налажен учет внешней торговли, учет цен на хлеб и т.д.
После Петра 1732, 1736, 1741 проведены спец. переписи рабочих.
В 1802г(Александр1 Манифест об и создании министерств))создаются министерства, в частности на Министерство полиции(Кочубей Вик Павл), а затем на МВД (1819 объединились с МВД) возлагаются обязанности собирать данные по губерниям, областям, данные сводились в целом по России (Герман Карл Федорович).По каждому из министерств издаются ряд статистических сборников, например Министерство Финансов :публиковало: Ежегодник Министерства Финансов России, сборник :Статистика производств, облагаемых акцизом», Статистика акционерного дела, Статистика госфинансов. Так же министерство путей сообщения, сборник; Виды внутреннего судоходства России . и т.д.
В 1852г. образован Стат. Комитет при МВД.(министр МВД Бибиков Д,Г, а СК Милютин Николай Алексеевич(1859-1861), с 1858г. переименован – в ЦСК. Первый управляющий Милютин Николай Алексеевич(1858-1861г.г.) – А в 1863-1882 географ, экономист, статистик – (Семенов –Тян – Шанский(1906г.) , в руководстве правительственной статистики был около 33 лет.( управляющий, председатель Статистического совета). Под его руководством издавался статистический сборник «Статистический временник Российской империи», 1870 первый Статистический съезд в России. Всероссийская перепись населения проводилась в 1897г.,руководил которой непосредственно управляющий ЦСК –с 1883г. Троицкий Николай Александрович, бывший Рязанский губернатор и Семенов (как председатель стат совета при МВД-15 чел)(с 1906г. Тян – Шанский), что было результатом его 30 летних усилий.
Параллельно с губернскими комитетами по статистике образуются земства – (Земская статистика) земские статистики. (1858г.земский отдел был выведен из ЦСК , как отдельное учреждение, для управления крестьянами после реформы.
В 1900г. и 1908г. по инициативе В.Е. Варзара проведены две переписи промышленности, 1903 и 1910 – переписи с.х. машин и орудий, далее проводились переписи скота, с.х. предприятий (1916г.) и т.д.
Под руководством В.И. Ленина происходило становление Советской статистики. На Первом Всероссийском съезде статистиков июнь 1918г. – рассмотрен проект Положения о Гос. Статистике, а 25. 06. 18. Советское правительство приняло декрет «О государственной статистике », было создано Цент. Стат. Управление под руководством П.И. Попова, имеющий большую практику работы в земствах. Проводилась перепись населения в 1920, 1926г., выборочные обследования, вводится статистическая отчетность на предприятиях, создаются стат. бюро в губерниях и т.д.
Наиболее значимой работой ЦСУ 20- х это составление баланса народного хозяйства, хлебный баланс.
В то время работала целая плеяда видных ученых статистиков Немчинов В.С., Рябушкин Т.В., Журавский Д.П. , Старовский В. Н., Струмилин С.Г. Леонтьев и др. От 09. 07. 1994 г Постановлением правительства № 834 было утвержден Гос. комитет РФ по статистике. С 1988 г. Россия переходит на международную практику учета и отчетности- СНС- переход на основной блок счетов к 2010г.
Предметом статистики как науки - являются это особые признаки, получившие название объективных статистических показателей, характеризующие состояние, развитие общества, включая и материальные условия его жизни. Говоря объективные мы подразумеваем их существование как статистических фактов, подлежащих изучению.
С изменением состояния общества меняются и его объективные стат. показатели, одни – по содержанию, другие по форме, третьи по – величине и т. д.
По форме внешнего проявления признаки делятся на атрибутивные ( описательные, качественные), которые не поддаются числовому (количественному) выражению (пол, национальность)и количественные (объемные).(число студентов по специальностям)
Статистический показатель - это общий существенный признак, какого либо массового явления в его качественной, количественной, временной и пространственной определенности.
Время и пространство дает – конкретность признака.
Общая схема строения (состав) статистического показателя
Форма содержания (ОКОПФ; ОКФС и т.д)
Временная определенность
(когда?)
Качественная сторона (содержание показателя)
Пространственная
определенность
(где?)
Количественная сторона
(величина показателя)
Форма величины
А) абсолютная форма показателя
Единицы измерения абсолютных величин:
1. Натуральные – единицы, соответствуют естественным свойствам данного предмета (явления). Они выражаются в мерах массы, длины, площади, объема и т.п., а так же количеством ( числом ) единиц ( фактов). В них выражаются конкретные явления или их однородные группы.
2. Условные – единицы, с помощью которых качественно разнородные элементы, но имеющие определенную общность, приводятся в соизмеримое выражение ( корма - в кормовые единицы, поголовье скота – усл. гол., тракторы в условные тракторы, продукты питания – в калории и т.п.
Таблица 1- Общий объем производства мыла и моющих средств по видам
Виды мыла и моющих средств
Количество, шт.
Коэффициент перевода в ул.ед.
Количество продукции
в условно натуральном выражении, усл.ед.(шт)
Мыло хоз. 60% жирности
Мыло хоз. 40% жирности
Мыло туалетное 80% жирности
Стиральный порошок 10% жирности
Итого
500
250
1500
2500
-
1,50 (60 / 40)
1,00 (40 /40)
2,00 (80/40)
0,25(10 /40)
-
750
250
3000
625
4625
Для определения общего количества выработанной предприятием продукции в условно – натуральных единицах измерения, за условную ед. измерения возьмем – мыло 40% жирности.
3. Стоимостные, трудовые– единицы с помощью которых качественно разнородные материальные блага, имеющие лишь ту общность, что на их производство затрачен труд, приводятся к единому выражению - в рубли ( затраты труда).
4. Трудовые единицы – наиболее часто используется тыс. чел.ч; чел.дн.
Б) относительная форма показателя ( по назначению и сущности)
1. Простая форма – средние величины, коэффициенты соотношения (показатели интенсивности), показатели структуры, показатели динамики, показатели координации.( к-т – база сравнения =1., %,- база сравнения = 100, %%, - промилле, база сравнения за 1000; продецимилле – база сравнению за 10000 %%% ).
2. Составная (смешанная) форма
Валовой надой молока / 100 га. с.х. угодий. = Среднегод. удой молока на 1 корову Среднегод. поголовье коров на 100 га с.х. угодий.
3. Сложная форма ( индексы).
Средняя реальная з.пл. определяется исходя из средней номинальной, за вычетом налогов и обязательных платежей. деленной на индекс потребительских цен.
Большое внимание необходимо уделять единицам измерения.
В изучении статистических показателей следует учитывать ряд особенностей:
1. они носят исторический характер – меняются условия жизни населения, меняются и стат. показатели.
2. методология расчета стат. показателей непрерывно совершенствуется ( фед. прогр. и т. д. )
3. сочетание множества форм хозяйствования ( собственности )
государственная ( федеральная, субъектов федерации )
муниципальная
частная в различных ее проявлениях ( индивидуальная, кооперативная, акционерная, коллективная, коллективно- долевая).
4. Показатели абсолютной формы выражения в экономике необходимо как правило показателями относительной формы выражения.
Покажем на схеме взаимосвязь показателей финансово – хозяйственной деятельности
1.Показатели организационно – технического уровня производства
2.Показатели обеспеченности и эффективности использования ресурсов предприятия
3. Производство и реализация продукции, работ, услуг 4 Себестоимость продукции и окупаемость затрат
5.Показатели прибыли и рентабельности
6.Финансовое состояние
Метод статистики – есть статистический метод в конкретном применении к изучению той или иной отрасли, того или иного производства
1. стат. наблюдение – статистические органы разрабатывают различные формы, программы наблюдения с учетом специфики организаций, и форм собственности.
2.Метод группировок – существует, например ряд группировок организаций по ряду признаков (классификаций). Например, группировка организаций на малые, средние, крупные.
Для отнесения ЮР лиц к МП, Средним
1. Суммарная доля участия РФ, Субъетов РФ и иных участников в УК не должна быть более 25% (кроме инвестиционных фондов)
2. Средняя численность работников не должна превышать:
А) до 100чел. для МП, в т.ч микропредприятия 15 чел
Б) 101-250- средние предприятия
В) Св 250 крупные и особо крупные св 1000 чел.
3. Предельный размер выручки без НДС (пост правительства от 13.07.2015г. №702 ):
Микропредприятия 120млн. руб.МП – 800 млн.руб. Средние 2000 млрд .руб.
Так же учитывают предприятия на которых занято 15 чел (применяющие упрощенную систему налогообложения, учета и отчетности), группы предприятий
( включая финансово – промышленные группы и транснациональные компании), отдельно законодательно определенные совокупности предприятий (предприятия – монополисты, естественные монополии, холдинги). Предприятия до 15 чел. в будущем планируется опрашивать один раз по итогам года.
( балансовый, индексный, корреляционно- регрессионный анализ).
В практической деятельности при отсутствии необходимой информации абсолютные величины получают на основе балансовой увязки:
Зн + П = Р + В + Зк, где Р = Зн + П – Зк (баланс товарных запасов, кормов и т.д.)
Статистические органы собирают, обрабатывают, анализируют около 1млн. стат. показателей по отрасли с/х.
Изучение многообразия объективных статистических показателей по содержанию в тесной связи с их количественной стороной – выполняет социально экономическая статистика. Социальная статистика - изучает демографический состав населения, уровень потребления товаров, услуг, уровень доходов и т.д.
Экономическая статистика – включает в себя все отраслевой уровень, именно: промышленность, с/х, транспорт, торговля, финансы и т.д. так же различают уровень макро (экономика в целом) и микроуровень (отдельные предприятия)
Таким образом, социально- экономическая статистика в широком смысле слова охватывает все отраслевые статистики и статистику населения. В узком смысле слова – это наука, занимающаяся исследованием макроэкономических показателей (ВВП, ВНП, и т.д.).
Прикладная статистика – теория вероятности, математическая статистика, общая теория статистики
2.Этапы статистических исследований, и их характеристика
Статистическое исследование включает в себя 3 этапа:
1. Статистическое наблюдение
2. Статистическая сводка и группировка
3. Характеристика и анализ полученных сводных результатов
Статистическое наблюдение – это процесс планомерно организованного получения сведений о каждой единице массового явления. При проведении стат. наблюдения необходимо точно определить, что подлежит наблюдению, т.е. выбрать объект наблюдения. Объектом статистического наблюдения – называется совокупность явлений, процессов о котором должны быть собраны необходимые сведения (совокупность населения – объект наблюдения, а совокупность семей единица наблюдения. )
Единица наблюдения – это составной элемент объекта наблюдения, которая является носителем признаков подлежащих регистрации.
Единицы наблюдения обладают множеством характерных отличительных свойств, называемых в статистике признаком, которые можно учесть в рамках одного исследования.
Поэтому важной задачей организации статистического наблюдения является отбор наиболее существенных и информативных признаков. После того как определены объект , единица наблюдения , разрабатывается программа статистического наблюдения.
Программой статистического наблюдения – называется перечень признаков единицы наблюдения, регистрируемых в процессе проведения статистического наблюдения.
Документ в котором регистрируются ответы на вопросы программы называются формуляром статистического наблюдения (лист бумаги, на котором содержится перечень вопросов программы и оставлены свободные места для записи ответов с указанием шифров и кодов на них).
В статистике различают две системы формуляра наблюдения (формуляр карточка – регистрируются ответы по одной единице наблюдения) и (формуляр список – регистрируются ответы нескольких единиц наблюдения – н.р. переписные листы переписи населения, каждый из которых предназначен для регистрации нескольких лиц и характеризующих их признаков.), К программе статистического наблюдения составляется подробная инструкция. В частности для устранения погрешностей при проведении статистического наблюдения устанавливается критический момент времени , по состоянию на который производиться регистрация признаков. Обычно в качестве критического момента выбирают24 часа , т.е. момент перехода одних суток на другие.
Независимо от времени проведения наблюдения , сведения об объекте должны регистрироваться на критический момент времени. Все изменения после критического момента времени , во внимание не принимаются.
Так например при переписи населения 2002г.( с 9- 16 октября), в качестве критического момента выбраны были 24 часа- 0 часов 9 октября 2010г.), родившиеся после 24 часов регистрации не подлежали и в переписные листы не вносились, хотя те кто умер после 24 часов, но был жив на 24 часа включали в переписные листы
Статистические наблюдения классифицируются по ряду признаков:
Виды наблюдения:
По методу регистрации факта различают :
1. текущее(непрерывное) стат. наблюдение и
2. прерывное статистическое наблюдение
Прерывное – статистическое наблюдение можно подразделить на :
а) единовременное – когда наблюдение происходит от случая к случаю
б) периодическое - когда наблюдение повторяется через определенные интервалы. Например перепись населения 1920, 26, 39, 59. 70, 79, 89, выборочное соц – дем. обследование на 1 янв.85г., микроперепись населения 1994 г.,2002г.,2010г, 2006г. с.х.перепись. Ожидается в 2020г.
2. По степени охвата единиц наблюдения изучаемой совокупности, различают:
1. сплошное наблюдение, в данном случае изучению подлежат все единицы совокупности. – все население.
2. не сплошное, когда изучению подлежит какая то часть изучаемой совокупности. К нему прибегают тогда, когда нет возможности или нецелесообразно осуществлять сплошное наблюдение.
Виды не сплошного наблюдения:
1. наблюдение основного массива – предполагает исключение из состава совокупности мало значимых единиц, и отбор наиболее значимых ( изучается конъюнктура торговых оборотов, цен только на городских рынках, районных рынках.
2. выборочное наблюдение – наблюдение, при котором характеристика всей совокупности дается по некоторой ее части, отобранной в случайном порядке.
На практике применяют различные способы отбора, принципиально на два вида.:
1. Отбор не требующий расчленения генеральной совокупности (совокупность единиц подлежащая изучению) на части. К этому виду относятся:
а) простой случайный бесповторный отбор.
б) простой случайный повторный отбор
2. Отбор, при котором генеральная совокупность разбивается на части. К этому виду относятся :
а) типический отбор ( объекты отбираются не из всей совокупности а из каждой «типической части»
б) механический отбор( генеральная совокупность механически делится на столько групп, сколько объектов должно войти в выборку, и из каждой группы отбирается один объект)
в) серийный отбор (объекты отбирают из генеральной совокупности не по одному, а «сериями», которые затем подвергают сплошному обследованию.
Отклонение значения показателя обследуемой (выборочной) совокупности от его величины по исходной совокупности (генеральной совокупности) – называется ошибкой репрезентативности, которые характерны только для несплошного наблюдения. Ошибки репрезентативности бывают
3. Анкетное наблюдение
4. Монографическое наблюдение - когда наиболее детально, тщательно изучается одна единица изучаемой совокупности.
3. В зависимости от источников собираемых данных различают следующие виды наблюдений:
1. непосредственное – фиксация фактов, регистраторами в результате подсчета, осмотра .
2. документальное – в качестве источников информации используются документы.
3. опрос – базируется на данных , полученных в форме ответов опрашиваемых лиц.
При проведении статистического наблюдения применяют следующие способы наблюдения:
отчетный.
с 1..1. 98г. Госкомстатом введены новые формы текущего статистического наблюдения за деятельностью предприятий.
П1 – «Сведения о производстве и отгрузке товаров и услуг(месячная)»
П2 – «Сведения об инвестициях (квартальная)»
П3- «Сведения о финансовом состоянии организации (месячная)»
П4 –«Сведения о численности, зарплате и движении работников (месячная)»
Для малых предприятий – форма № П-М – Сведения об основных показателях деятельности малого предприятия - (квартальная) (ДАП – деловая активность предприятия). В отношении крупных и средних предприятий проводиться сплошное обследование, выборочное ежеквартальное обследование
экспедиционный – когда к каждой единице набл. посылаются регистраторы ( счетчики ), которые в спец. формулярах регистрируют сведения.
саморегистрации – опрашиваемые снабжаются инструкциями по заполнению анкетный – выдаются анкеты ( вопросники ).
Тема 2: Статистическая сводка и группировка
Статистическая сводка – это процесс обобщения данных статистического наблюдения, обеспечивающий процесс получения статистических показателей, как сводных признаков массового явления.
Статистическая группировка – это метод расчленения сложного массового явления на существенно различные группы, однородные по какому – либо признаку с целью всесторонней характеристики состояния, развития и взаимосвязи.
Признаки положенные в основу группировки – называются группировочными, а группировка по тому или иному признаку единиц совокупности приводит к рядам распределения.
Группировочные признаки могут иметь разный характер: одни признаки могут иметь количественное(числовое выражение) выражение, н.р. возраст населения, размер з\пл и т.д. и эти признаки называют количественными, а ряды распределения вариационными. Признаки которые не имеют количественного (числового) выражения, они отражают определенные свойства качества единиц совокупности - называют качественными, а ряды распределения атрибутивными (н.р.- группировка по полу, национальности).
Ряд распределения – это простейшая группировка, представляющая собой распределение численности единиц совокупности по значению какого либо признака.
Различают дискретные ( группировочный признак целое число ), и интервальные вариационные ряды ( группировочный признак принимает значение интервала ).
Виды рядов
Атрибутивный Вариационный
Дискретный Интервальный
Интервал может быть: равным, и неравным: (прогрессивно возрастающим или прогрессивно убывающим, а так же интервалы могут быть замкнутыми (закрытыми), когда указаны нижняя граница т.е. «от» и верхняя т.е. «до», и открытыми, когда указана лишь одна из границ группы.
Если в группировке применяются равные интервалы, то их величина рассчитывается по формуле -: h = Х мах – Хmin / к , где h – ( шаг) величина интервала, к – число групп.
п= 1 + 3,322 1 гр. Х мин + п ; 2 гр. И т.д.
Исключительное значение метода группировок в статистике было сформировано русским ученым Д,П, Журавским (1810-1856), который определил статистику как науку о счете по категориям , по группам.
В производственно – экономической области группировки не только позволяют выявить наличие связи, но и оценить силу, степень этой связи и как правило должны предшествовать корреляционно-регрессионному анализу. Таким образом наиболее эффективное изучение связей признаков, может быть достигнуто путем сочетания метода группировок с методом корреляционно-регрессионного анализа.
По количеству изучаемых признаков группировки делятся на простые- когда основании группы образуется по одному признаку и сложные. Сложная группировка может выполнятся как 1) комбинационная и 2) многомерная
Комбинационные – если группы образованные по одному признаку разбиваются на подгруппы по другому признаку. В этом случае все единицы распределяются на группы сначала по одному признаку, а затем внутри из каждой выделенных групп – на подгруппы по другому признаку.
Многомерная – если группировка осуществляется не последовательно по отдельным признакам, а одновременно по комплексу признаков.
Например (комбинационная группировка) когда группы водителей по уровню квалификации разбиваются на подгруппы (по проценту выполнения норм выработки.)
Зависимость з.пл. водителей от квалификации и процента выполнения норм выработки
Группы водителей по
уровню квалификации
Подгруппы водителей
по проценту выполнения норм выработки
Число водителей в группе
Общая сумма заработной платы, руб
Средняя зарплата одного водителя, руб.
Изменение средней з.пл. по сравнению с низшей подгруппой, %
2 класс.
Итого по 1 гр.
100-110
св.110
3
2
5
5042,0
3986,4
9028,4
1680,7
1993,2
1805,2
100,0
118,6
-
1 класс
Итого по 2 гр.
100-110
св.110
4
3
7
7995,9
6681,3
14677,2
1999,0
2227,1
2096,7
118,9
132,5
-
Всего
12
23705,6
1975,5
-
По поставленным задачам исследования группировки делят:
типологические – когда исследуемая совокупность делится на качественно однородные группы и на этой основе выявляются экономические типы явлений, хозяйства, предприятия и т.п
Н.Р.: распределение населения по общественным группам ( рабочие, служащие и т.д. ), по формам собственности, работникам занятым умственным и физическим трудом и т.д.
Если единицы совокупности группируются по территориальному признаку – такие ряды называются территориальными. Они дают представление о размещении, или о степени размеренности явлений, процессов в пространстве.
Н.Р. наибольший уровень безработицы по республике на начало 2004г. (от трудоспособного населения в трудоспособном возрасте), зарегистрирован
Камбарском – 5,62%, Селтинском – 4, 71%, Ярском 4, 41% Шарканском -4,2%, наименьший остается в Як – Бодьинском, Малопургинском, Завьяловском в г. Ижевске – 0,86%. (2002 – 0, 91).
Группировка единиц в пределах одного типа явления или однокачественной совокупности – называется структурной. Задачей данной группировки является это:
1. изучение состава (структуры) совокупности по какому либо варьирующему признаку.
2.изучение в пределах этой совокупности взаимосвязей варьирующих признаков.
Н.Р.: изучение состава населения по возрасту, профессиональным качествам, по национальности.
Аналитические группировки позволяют установить и изучить связь между результативными и факторными признаками единиц однотипной совокупности (например – зависимость урожайности от себестоимости – группировка по себестоимости). Ряд авторов считает, что связь между признаками изучается только с помощью аналитических группировок, однако для изучения связи используются все др. виды группировок, но роль аналитических группировок особенно велика.
При построении таких группировок 1 из 2- х взаимосвязанных показателей рассматривается как фактор влияющий на другой – в данном случае урожайность, а другой рассматривается как результат влияния 1- го показателя – объем выпуска продукции.
Следует иметь ввиду, что наличие факторного и результативного признаков в аналитических группировках рассматривается для каждого конкретного анализируемого случая особо. Так, что в первом случае служит факторным признаком, в другом случае может выступать как результативным признаком (например себестоимость), но в основу группировки аналитической и особо ценной комбинационной группировки ложиться факторный признак, т.е. группировка осуществляется по факторному признаку.
Для того чтобы выявить зависимость между показателями необходимо, сгруппировать данные по факторному признаку, и для каждой выделенной группы рассчитать среднее значение факторного и результативного признака, а затем проследить за изменением последнего.
Схема проведения группировки:
1. определяются факторный (Х) и результативный признак(У)
2. строится ранжированный ряд по факторному признаку (Х)
3. определяются интервалы групп, используя шаг
4. составляется вспомогательная группировочная таблица
5. определяется взаимосвязь между факторным и группировочным признаком, на основании их средних значений
6. делается вывод между изучаемыми признаками
Таблица 1- Группировка х-в по внесению минеральных удобрений на 1 га посева зерновых культур (вспомогательная группировочная таблица)
Группы х-в по внесению минеральных удобрений на 1 га посева зерновых культур,кг.
Номер предприятия
(итог)
Валовой сбор, тыс.т.
Площадь, тыс.га.
Внесено минеральных удобрений, тыс.т.
Внесено органических удобрений, тыс.т.
До 10
ОАО»Нива»
ОАО «Свобода»
15.4
20,2
1,6
2,4
0,013
0,020
3,36
3,84
Итогои1 гр.
127
150,4
140,3
1,4
286,2
10- 100
24,2
24,8
2,3
2,3
0,028
0,029
5,06
5,09
Итого 2 гр
240
364,7
300,9
10,6
848,7
Св. 100
36,2
41,8
2,9
3,2
0,30
0,34
7,83
9,28
Итого 3 гр.
80
215,5
79,6
8,8
220,5
Итого
447
730,6
520,8
20,8
1355,4
Таблица 2- Влияние внесения минеральных удобрений на урожайность зерновых культур в хоз-х (зависимость урожайности зерновых культур от уровня внесения минеральных удобрений)
Гр. Х-в по внесению минеральных удобрений, кг.
Число х-в в группе
В среднем на 1 га.
внесено минеральных удобрений, кг.
внесено органических
удобрений, т.
урожайность, ц.\га.
До 10
127
9,97
2,04
10,7
10-100
240
35,20
2,82
12,1
Св. 100
80
133,99
2,77
27,1
Итого
447
39,94
2,6
14,03
Вывод: чем больше уровень вносимых минеральных удобрений, тем выше урожайность зерновых культур. Данный вид группировки можно отнести к аналитической, т.к. она показывает взаимосвязь между факторным и результативным признаком. Распределение единиц наблюдения должно соответствовать нормальному закону распределения.
Число единиц наблюдения, (Т)
Кривая Гаусса (закон нормального распределения) t=
Помимо аналитической группировки практическую ценность имеют комбинационные группировки, когда группы по одному признаку разбиваются на подгруппы по другому признаку.
Таблица 3- Влияние внесения минеральных удобрений на урожайность зерновых культур в х-х (зависимость урожайности зерновых культур от уровня внесения минеральных удобрений)
Гр. Х-в по внесению минеральных удобрений, кг.
Число х-в в группе
В среднем на 1 га.
подгруппы по уровню внесения орг удобр., т
внесено минеральных удобрений, кг.
в %
к 1гр
внесено органических
удобрений, т
урожайность, ц.\га.
До 10
Итого по 1 гр.
0,7-1,2
1,2-1,5
Св.1,5
35
27
25
127
9,97
100
2,04
10,7
10-100
240
35,20
2,82
12,1
Св. 100
80
133,99
2,77
27,1
Итого
447
39,94
2,6
14,03
Часто в процессе исследований группировки необходимо изменить, т.е. провести вторичную группировку. Она представляет собой объединение уже имеющихся групп в новые – в более крупные группы по тому же признаку, или изменение нижних границ прежних групп, для того чтобы сопоставить с другой..
Вторичная группировка или перегруппировка может быть проведена следующими способами:
1. способ долевой перегруппировки, когда за каждой группой закрепляется определенная доля единиц совокупности
2. способ преобразования интервалов исходной группировки
3. приведение двух группировок с различными интервалами к единому виду
Имеются следующие данные :
Таблица1 -Группировка акционеров по размеру дивидендов на одну акцию
Первый район Второй район
№ группы
Группы акционеров по размеру дивидендов, тыс. руб.
Удельный вес акционеров группы, в % к итогу
№ группы
Группы акционеров по размеру дивидендов, тыс. руб.
Удельный вес акционеров группы, в % к итогу
1
10-40
18
1
10-60
10
2
40-80
12
2
60-120
20
3
80-120
40
3
120-200
40
4
120-160
25
4
200-300
30
5
160-200
5
5
-
6
Итого
100
6
Итого
100
В результате перегруппировки получаем следующие сопоставимые данные
Таблица 2- Вторичная группировка акционеров по размеру дивидендов на одну акцию
№ группы
Группы акционеров по размеру дивидендов, тыс. руб.
Удельный вес акционеров группы, % к итогу
второй район первый район
Расчет
1
10-60
10
24
18+0,5×12=24
2
60-120
20
46
0,5×12+40=46
3
120-200
40
30
25+5=30
4
200-300
30
-
-
Итого
100
100
100
Акционеры второго района имеют наиболее высокие размеры дивидендов ( 120 тыс. руб. и более выплачивают 70% акционеров этого района, а в первом - только 30%).
Тема Графики их виды, статистические таблицы самостоятельно
Тема: 2 Относительные величины и их характеристика
Относительные величины - это обобщающие показатели, представляющие числовую меру соотношения абсолютных величин.
ОВ = V / база
Относительные величины получают в форме коэффициентов, процентов, промилле, продецимилле и т. д.
По назначению и сущности выражаемых соотношений различают следующие виды относительных величин.
Простые Составные Сложные
1.Структуры Производство Коров на Удой на Индексы
2.Координации молока на 100 га = 100 га × 1 корову
3.Сравнения
4.Интенсивности
5.Дифференциации
6.Выполнения плана
7.Выполнения планового задания
8.Динамики
Таблица 1- Численность населения г. РФ на 1 января 2016г, тыс.чел.
Группы населения по возрасту
Численность населения
В том числе
мужчины
женщины
Всего:
в т.ч.
146804
68044
78760
Моложе трудоспособного
Возраста (0-15)
26895
18,32%
13794
13101
Трудоспособное (16-54(59))
83224
56,69%
43470
39754
Старше трудоспособного возраста
(55;60)
36685
24,99%
10780
25905
м/ж Всего: 864
мл.труд.возр.=1053
труд.возр.= 1093
старше труд. Возр.= 416
Трудоспособное население – (16- 55-60 лет)
На основании данных таблицы дать оценку населения города с использованием относительных величин.
1. ОВ структуры, определяется как отношение части к целому.
ОВ= часть / целое
Н.Р.Численность всего населения - 100%
Моложе трудосп. возраста – 18,32%
Трудоспособное – 56,69%
Старше трудоспособного – 24,99%
Н.Р. Уд. вес мужчин -46,35% Уд вес женщин – 53,65%
2. ОВ координации, показывает отношение частей целого между собой.
ОВ = часть целого / часть целого
Н.Р. М /Ж или Ж/М На 1 мужч.- 1, 157 женщ. Или на 1 женщину – 0, 864 мужчины.
3. ОВ сравнения , при помощи ее сравнивают одноименные явления, относящиеся к разным объектам.
ОВ = явление «А» / явление «В»
Н.Р. население одного города можно сравнить с населением другого города (временной срез должен быть один и тот же).
Город Сарапул – население на 1 января 2016г. - 98569 чел. г. Ижевск 643496 чел. (ОВ= 643496/98569=6,53)
ОВ = 650,3/ 106,0 = 6,13 Население Китая 1382 млн.чел., России 146,5 млн.чел.(1382/146,5 = 9,43)
4. ОВ интенсивности – показывают степень распространения явления в определенной среде.
ОВ = явление / среду
Н.Р. S города Ижевска – 418 км 2
ОВ= 643,5 / 318 = 2024 чел. / км 2
5. ОВ динамики - сравнивают одно и тоже явление, но за разные периоды или моменты времени. Выражают в процентах , с одним знаком после запятой.
ОВ = явление «1» / явление «0», где
«1» – отчетные данные;
«0» - базисные данные (прошлые).
Н.Р. в 1989г население города Ижевска было – 634, 7 тыс. чел.
ОВ = 650,3 / 634,7 = 102,5%.
6. Относительная величина дифференциации – рассчитывается сопоставлением двух взаимосвязанных рядов, один из которых характеризует структуру совокупности, а другой размер какого либо признака этих единиц.
ОВ = ряд характеризующий структуру / ряд характеризующий размер признака
Н.Р. Таблица
Население и производство мяса
Численность населения, % Производство мяса на душу
населения в месяц, кг
19,0 0, 682
64,5 0,756
16,4 0, 448
100,0 0, 629
7. Относительная величина выполнения плана – рассчитывается как отношение фактически достигнутого в данном периоде уровня к запланированному на данный период.
Вып. пл. = У ф 16 /Упл. 16
8. Относительная величина планового задания –отражает отношение уровня, запланированного на предстоящий период к уровню фактически сложившемуся в предшествующем периоде. Н.р.У пл.16 /У ф 15
P.S. взаимосвязь: произведение ОВ пл.зад. и ОВ вып. Пл. дает ОВ динамики.
Относительная величина динамики - сравнивают одного и тоже явление, но за разные периоды или моменты времени.
явление 1 / явление 0 , где 1 – фактические данные, 0 базисные (прошлые) данные
Когда за базу сравнения берется предшествующий период – цепные, когда за базу сравнения берется базисный период – базисные.
Тема 3: Средние величины и их характеристика
Средние величины характеризуют типический размер признака, приходящийся на единицу изучаемой совокупности. Чтобы быть типической (типичной)- репрезентативной) – средняя должна быть рассчитана по однородной совокупности.
Статистическая средняя определяется из соотношения общего объема явления к численности совокупности.
Средняя = объем явления / численность совокупности Хср. = W/ n
W = f× х = х с р.× n ,
где Х – (Х1, Х2, ……Хп )- варианта (значения признака)
Хср -. средняя величина из вариант
n - число вариант
f – веса ( частота ) – как часто встречается варианта
f = n - объем совокупности
W- объем явления Х f
В практике исчисления рассчитывают следующие типы и виды средних величин, которые могут быть простыми и взвешенными:
1. степенные средние 2. структурные средние
(квантили порядка случайных величин)
◦ ср. арифметическая - медиана
◦ ср. гармоническая - мода
◦ ср. геометрическая -квартиль
- квинтиль
◦ ср. квадратическая -дециль
-процентиль
◦ ср. хронологическая
В математической статистике широко используются квантили случайных величин, которые делят область изменения случайной величины Х соответственной на 4, 5, 10, 100 частей. Квантили некоторых порядков имеют специальные названия : медиана является квантилем порядка ½. и т.д.
В основе степенных средних лежит степенная средняя:
- простая - взвешенная
Показатель степени m – определяет вид средней.
Если m = 1 –степенная средняя преобразуется в среднюю арифметическую (простую и взвешенную)
m =0 – степенная средняя преобразуется в среднюю геометрическую (простую и взвешенную)
m = -1 – степенная средняя преобразуется в среднюю гармоническую (простую и взвешенную)
m = 2– степенная средняя преобразуется в среднюю квадратическую (простую и взвешенную)
Таблица1- Формулы степенных средних
Показатель
степени
Название средней
Средняя
простая
взвешенная
-1
Средняя гармоническая
Средняя геометрическая
1
Средняя арифметическая
2
Средняя квадратическая
Как видно по данным таблицы взвешенная средняя учитывает то, что отдельные варианты значения признака Х имеют различную численность поэтому каждый вариант «взвешивают» по своей частоте - на нее умножают.
Частоты f –статистическими весами. Следует учитывать, что статистический вес это понятие более широкое, чем частота так как в качестве весов иногда может быть доля (удельный вес).
Между степенными средними существует определенная взаимосвязь:
- чем больше показатель степени –m , тем большее значение имеет средняя величина при одних и тех же исходных данных. Это свойство называется мажорантностью средних.
Ср. арифметическая может быть как простой так и взвешенной.
1. Ср. ариф. простая на практике вычисляется тогда, когда совокупность данных строго однородна, когда каждое индивидуальное значение признака встречается один, или одинаковое число раз ( когда нет частот, весов.) .
Хср = Сумма Х \ п
Н.р. З.пл. за май отч. года 72 слесарей (руб). 1300, 1700. 1250, 1440, 2200 2700 2750, определить средний месячный заработок слесарей. .
133340 / 7 = 1905, 7 руб.
Средняя арифметическая взвешенная вычисляется в тех случаях, когда конкретные значения вариант признака представлены разным числом единиц наблюдения, т.е. данные представлены в виде рядов распределения или группировок, или когда вычисляется средняя из средних.
Имеется распределение студентов по результатам экзамена по статистике (дискретный ряд распределения):
х
5
4
3
f
8
16
6
Хср = 4,07
Имеется распределение работников цеха по среднегодовой заработной плате (дискретный ряд распределения)
Таблица 1- Исходные данные
цех
Сргод.з/пл., руб.
Среднесписочная числ. раб., чел.
1
2
3200
2890
50
38
3
3100
62
Определить среднегодовой уровень заработной платы по трем цехам завода.
Вычисление средней арифметической взвешенной из групповых средних осуществляется по формуле:
Если ряд распределения представлен виде интервального ряда среднее значение признака определяется по средней арифметической взвешенной.
Среднег з.пл, руб. Численность работников, чел
1-3 20
3-5 26
5-10 30
10-15 15
15-20 14
Св.20 4
Х ц= 1+3/2 = 2
Последний интервал берется по шагу предыдущего интервала, если он неизвестен. Св. 20 = (20 – 25) Хц=
В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными( в процентах или в долях единицы) , тогда формула средней арифметической взвешенной будет иметь вид:
, где если частоты в долях тогда, и формула средней запишется
Для финансирования проекта было привлечено несколько источников финансирования. Определить среднюю цену привлеченного капитала.
Источники финансирования
Структура источников финансирования, %
Цена источника, млн..руб.
Кредиты
Эмиссия акций
Бюджетные средства
20
50
30
12
15
-
Хср = d
Хср= 12×0,2 + 15× 0,5 + 0×0,3 =9,9 млн.руб.
d=
2. Средняя гармоническая, является величиной обратной средней арифметической, из обратных значений признака. Она может быть простой и взвешенной и применяется в тех случаях, когда известны варианты значения признака (Х) и Объемы явления (W), но неизвестны веса (частота), т.е f=
Если произведения Х × f =W равны между собой или равны единице, а так же если веса у каждого значения признака равны , тогда применяется средняя гармоническая простая.
Известны затраты на производство и себестоимость единицы продукции по трем заводам отрасли.
№ завода
Затраты на производство продукции, всего тыс.руб.
Себестоимость ед.продукции, руб.
1
600
20
2
600
23
3
600
22
Определить среднюю себестоимость единицы продукции по трем заводам отрасли.
=
В остальных случая, когда произведения W не равны между собой, применяется ср. гармоническая взвешенная.Она используется как правило, при расчете общей средней из групповых средних.
Известны затраты на производство и себестоимость единицы продукции по трем заводам отрасли
№ завода
Затраты на производств всего, тыс.руб.
Себестоимость ед.продукции, руб.
1
600
20
2
460
23
3
440
22
Хср.=
!!! При затруднении выбора средней для расчетов – средней арифметической или средней гармонической, следует учитывать, что исходные данные для расчета – различны.
Но вместе с тем затруднение выбора обусловлено тем, что в основе лежит одна и та же логическая формула. Логическая формула вытекает из сущности средней, ее социально – экономического содержания. Средняя величина это отношение. Поэтому прежде чем оперировать цифрами, нужно выяснить, соотношением каких показателей является средняя. Это исходное соотношение необходимо записать словами в виде формулы, называемой логической формулой средней.
Средняя себестоимость 1 изделия =
Средняя з.пл 1 рабочего =
Ср. геометрическая - применяется главным образом для нахождения среднего коэффициента или темпа роста в интервальных динамических рядах.
Например: имеются следующие данные темпов роста потребительских цен в УР (цепные) 2017г.,%
янв
февр
март
апр
май
июнь
июль
авг
сент
окт
нояб
дек
102,5
101,2
100,7
100,4
100,6
Определить предполагаемый уровень инфляции за 2017г. В УР, если сохраниться тенденция:
1. предшествующих 5 мес.
=
За год 1,0107712=1,137-темп роста потребительских цен
Инфляция за год = 113,7-100=13,7%
Как измениться стоимость жизни населения УР (покупательная способность рубля)
за 5 мес. 2017г. =
Стоимость жизни населения жителей Удмуртии снизилась на 5,2 %
Ср. хронологическая применяется – применяется для исчисления среднего уровня в моментных рядах динамики.
Ср квадратическая, в экономических исследованиях применяется для определения среднего квадратического отклонения:
Средняя хронологическая Средняя хронологическая применяется в моментных рядах динамики, т.е. когда данные даны на определенный момент (дату, время).
Средний уровень моментного ряда для равных периодов времени определяется по средней хронологической вида:
Например:
Средний остаток готовой продукции на складе предприятия составляет тыс.руб.:
1.01.17
200
1.02.17
240
1.03.17
280
1.04.17
100
1.05.17.
80
Определить средний остаток оборотных средств за первый квартал 2007г.
Средний уровень ряда динамики в моментных рядах динамики с неравными интервалами определяется по формуле вида:
Х ср- средние уровни в интервале между датами
t- интервал времени (число месяцев между датами)
х ср. = х=х/2
Расчет средневзвешенного количества обыкновенных акций в обращении:
По состоянию на 1 января 2017 г. в обращении АО находилось 4000 обыкновенных акций . В марте 2017г общество дополнительно разместило по рыночной стоимости 300 шт. акций., а в мае 2017г. выкупило у акционеров 200 шт.обыкновенных акций. Определить сколько в 2017 г. находилось в обращении штук обыкновенных акций.
Средневзвешенное количество обыкновенных акций за 2012г.4000×3+4300×2 +4100×7 /12 = 4108 шт.
Структурные средние применяют для характеристики рядов распределения. Ряд распределения показывает распределение совокупности по какому-либо признаку в пространстве и состоящего из 2-х элементов (Х-вар-та, f-частота, f - частотность.).
Ряд распределения можно представить в табличной форме, в графической или аналитической, т.е. с помощью различных показателей.
1) Показателей центра распределения
2) Показателей степени вариации
3) Показателей форм распределения.
Для неоднородной совокупности характеристику центра распределения лучше всего представить в виде структурных средних (Мо, Ме и т.д.), расчет которых покажем на примере данных таблицы.
Структурные средние применяются в характеристике рядов распределения.
Р.Р. – показывает распределение единиц совокупности по какому либо признаку в пространстве.
Р.Р. состоит из 2 –х элементов (Х- варианта, f- частота).
В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают два типа Р.Р.
Р.Р. , построенные по количественному признаку – вариационные
Р.Р. по качественному – атрибутивными.
Различают дискретные вариационные ряды распределения, признак целое число и интервальные вариационные ряды – признак в виде интервала.
Р.Р. – можно представить в табличной, в графической форме и аналитически, т.е. с помощью различных показателей, в том числе и структурных.
Дать оценку распределений предприятий по величине прибыли, используя следующие данные таблицы:
Таблица 1- Распределение предприятий по величине прибыли
Группы предприятий по величине прибыли, тыс.руб.
Число предприятий в группе
Х центр.
Кумулятивные частоты
S
До 60
15
50
750
15
36
540
19440
60-80
30
70
2100
45
16
480
7680
80-100
25
90
2250
70
4
100
400
100-120
20
110
2200
90
24
480
11520
Более 120
10
130
1300
100
44
440
19360
Итого
100
86
8600
-
-
2040
58400
S – кумулятивные (накопленные) частоты или частости.
Для анализа Р.Р. – применяют аналитические показатели:
1. Показатели центра распределения
2. Показатели степени вариации
3. Показатели формы распределения
Для того чтобы определить показатели центра распределения - средние показатели по группам, необходимо закрыть интервалы и определить Х центр ( по арифметической простой).
=тыс. руб. средняя величина прибыли на одно предприятие в данной совокупности предприятий.
Так как средняя очень чувствительна к аномальным значениям признака, следовательно необходимы другие показатели для оценки уровня признака в совокупности. Такими показателями являются структурные средние.
Для устранения влияния аномальных значений показателя рассчитывают «усеченные» средние, т.е. при расчете отбрасывают по 5% единиц совокупности с обоих концов.
Для неоднородной совокупности характеристику центра распределения представлять лучше в виде Моды или Медианы.
Мода ()- это то, что чаще всего наблюдаем.
Это значение признака, чаще всего встречающееся у единиц совокупности. Частота встреч определяется по частоте – f.
Для дискретных рядов мода – это вариант с наибольшей частотой.
Для интервальных рядов моду рассчитывают:
тыс.руб.
В данной совокупности предприятий чаще всего встречаются предприятия имеющие прибыль 75 тыс.руб.
Обычно в статистике имеют дело с одномодальными распределениями, где один максимум. Для симметричных одномодальных распределений мат ожидание, мода и медиана совпадают. Отметим, что для большинства одномодальных распределений мат ожидание, мода и медиана располагаются на числовой оси в том порядке, что они здесь перечислены или в обратном «алфавитное правило» Таким образом медиана лежит между математическим ожиданием и модой, причем ближе к мат ожиданию. Для одномодальных распределений определена специальная мера асимметрии – к-т асимметрии Пирсона S= (MX – Mo) / среднее квадратическое отклонение. Для симметричных распределений к-т=0, он характеризует степень отклонений моды от математического ожидания.
Медиана ()- это значение признака у единицы совокупности расположенной в центре.
Номер медианы для нечетного объема определяется:
n- число членов ряда
Для четного
В дискретном ряду распределения Медиана - это значение признака у единицы совокупности расположенной в центре.
В интервальном ряду распределения-:
S=80+тыс.руб.
50% предприятий имеют прибыль более(менее) 84 тыс.руб.
Для симметричных распределений характерно совпадение Хср, моды и медианы
Если Мо >Х ср –ряд будет иметь левостороннюю асимметрию (вытянутость), а если Мо < Хср.- правостороннюю асимметрию. В умеренно ассиметричных рядах соотношение между указанными показателями выражается следующим образом:
Аналогично медиане вычисляются значения признака , делящие совокупность на 4 равные (по числу единиц) части - квартили, на 5 равных частей – квинтели, на 10 равных частей – децили, на 100 – перцентили.
Квартиль делит изучаемую совокупность на 4 равные части
/-------/-------/-------/------/
Q1 µе Q3
Q1= 60+тыс.руб.
25% предприятий имеют прибыль менее чем 66,7 тыс.руб. и 25 % более чем 105 тыс.руб.
Q3= 100+тыс.руб.
Дециль – делит изучаемую совокупность на 10 равных частей.
. .
/---/---/---/---/---/---/---/---/---/---/
Д1 Д9
Д1=40+
Д9= 100+тыс.руб.
10% предприятий имеют прибыль менее 53,3 тыс.руб. и 10% предприятий более 120 тыс. руб.
Определить прибыль предприятия находящегося на 93 месте
93 = 120+ тыс.руб.
Децильный размах применяют для оценки дифференциации населения по
уровню доходов.
ДКД = Децильный коэффициент дифференциации доходов.
Отношение 10% самого обеспеченного населения к 10% самого необеспеченного населения, т.е. во сколько раз доходы 10% самого обеспеченного населения выше 10% самого необеспеченного населения.
Коэффициент фондовой дифференциации =
Перцентиль – делит изучаемую совокупность на 100 частей.
Для наглядности вариационные Р.Р. изображают графически с помощью полигона (преимущественно дискретные ряды) и гистограммы (интервальные ряды).
«Гиста» - ткань, клетка.
По накопленным частотам (частостям)строится кумулята и огива .Кумулята отражает характер нарастания частот или частостей от группы к группе.
При построении кумуляты из верхней границы у каждого интервала на оси абсцисс восстанавливаются перпендикуляры, соответствующие по высоте накопленным частотам или частости. Затем последовательно соединяются вершины перпендикуляров.
Тема 4: Вариация, показатели вариации
Для оценки надежности средней
Динамика. Ряды динамики. Аналитические показатели РД
Методы обработки РД для определения основной тенденции (тренда) развития.
1. Характеристика рядов динамики
2. Аналитические показатели рядов динамики
3. Методы определения тенденций (тренда) в рядах динамики (оценка, прогнозирование)
4. Анализ взаимосвязанных рядов динамики.
1. Характеристика рядов динамики
Динамика - это изменение анализируемого явления во времени.
Ряд динамики – это числовые значения представленные во времени.
Он состоит из двух элементов.
1- это период ( или даты времени).
2 элемент – показатели ( уровни ряда динамики) –у.
Первый показатель - начальный уровень, последний показатель – конечный.
Уровни ряда динамики могут быть выражены абсолютными, средними или относительными величинами. Для наглядного представления ряда динамики широко используют графики, чаще всего линейные диаграммы.
Ряды динамики могут быть двух видов; интервальные и моментные.
Интервальный ряд динамики – показатели уровней ряда приводятся за определенный период времени (месяц, квартал, год).
Особенностью интервальных рядов динамики из абсолютных величин является то, что их уровни можно суммировать, получая новые числовые значения объема явления, относящиеся к более длительным периодам.
Моментный ряд – показатели уровней ряда динамики приводятся на определенный момент (дату ) времени.
Уровни моментных рядов динамики нельзя суммировать, т.к. последующий уровень полностью или частично включает в себя предыдущий. Однако разность уровней имеет смысл - (т.е. наблюдается увеличение или уменьшение уровней).
Важнейшим условием правильности формирования рядов динамики является сопоставимость уровней:
1. единая методология их исчисления для всех периодов
2. одинаковые и равноценные единицы измерения.
3. сопоставимость временных периодов.
4. неизменная территория.
2. Аналитические показатели рядов динамики
Для изучения интенсивности изменения уровней ряда во времени исчисляют аналитические показатели динамики - абсолютные и относительные:
1. абсолютные приросты (сокращения), т.е. абсолютное изменение ( Баз, Цепн)
2. абсолютное ускорение или замедление
3. К –ты роста (снижения), т.е. относительное изменение баз, цеп.
4. К-ты прироста (снижения) баз, цеп.
5. Темпы роста ( снижения) баз, цеп.
6. Темпы прироста (снижения) баз, цеп.
7. Абсолютное значение (содержание) 1 % абсолютного прироста , цеп.
8. Темпы наращения - пункты роста (относительное ускорениеТр)
9. К-ты опережения (отставания) – применяют в анализе двух взаимосвязанных рядов динамики
Как видно выше по данным показателям 6 показателей могут быть с постоянной и переменной базой, т.е базисные и цепные.
Для характеристики интенсивности развития за длительный период времени рассчитывают средние показатели динамики - по 6 показателям.
1. Абсолютный прирост (сокращение),т.е абсолютное изменение характеризует увеличение или уменьшение уровня ряда за определенный период.
∆у ц=Уį – Уį-1
∆у б=Уį – У0
Цепные и базисные абсолютные приросты связаны между собой : сумма последовательных цепных абсолютных приростов равна базисному, т.е общему приросту за весь промежуток времени:
4+ 5+6+6+7= 28
2. К-т роста (снижения), отношение двух уровней, показывает во сколько раз сравниваемый уровень больше уровня, с которым производиться сравнение(если к –т больше единицы) или какую часть уровня, с которым производиться сравнение составляет сравниваемый уровень (если он меньше единицы).
Кр ц=
Между цепными и базисными коэффициентами роста существует взаимосвязь : ( произведение цепных к- ов роста равно базисному, а частное от деления последующего базисного коэффициента роста на предыдущий равно соответствующему цепному коэффициенту роста ). Проверка взаимосвязи на примере:
3. Коэффициент прироста (снижения)
4. Темп роста (сокращения) - это к-т роста выраженный в процентах
5. Темп прироста (сокращения) - показывает на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу, вычисляется :
как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения. н.р. 4 :80 =5; 5 :80 = 6; 9: 80 = 11,2
6. Тр – 100 = %
7. Абсолютное значение (содержание)1% абс. Прироста- рассчитывают как отношение абсолютного прироста к темпу прироста за тот же период времени, %
А% = 0,8; 0, 84 и т.д
8. Темп наращения -пункты роста – представляют собой разность базисных темпов роста (темпов прироста), двух смежных периодов.
Пункты роста, в отличие от темпов прироста можно складывать, в результате чего получают темп прироста соответствующего периода по сравнению с базисным. По таблице сумма пунктов равна 35, что соответствует темпу прироста в 97 г по сравнению с 92г.
9. К-т опережения =
Кр (наиб) / Кр (наим)
К опережения Тприр (наиб ) / Тприр (наим). Показывает во сколько раз быстрее растет (отстает) уровень одного ряда динамики по сравнению с другим.
Средний уровень ряда:
1. для интервального ряда – ср ариф простая
2. для моментного ряда :
- с равными интервалами – ср. хронологич.
- с неравными интервалами – ср ариф вз. (У ср = Сумма у × t | сумма t
Взаимосвязь м\у базисными и цепными КР:
- произведение цепных коэф- ов Кр, дает базисный Кр.
- отношение посл. Баз Кр К пред.баз Кр, дает Кр цепной.
В анализе взаимосвязанных рядов динамики применяют коэффициент опережения.
Год
Средняя урожай-ность, ц с 1 га
Абсолютный прирост,
ц с 1 га
Коэффициент роста
Коэффициент прироста
Темп роста,
%
Темп прироста, %
Абсолютное значение одного процента прироста,
ц с 1 га
Процентные пункты (роста, снижения), %
базисный
цепной
базисный
цепной
базисный
цепной
базисный
цепной
базисный
цепной
2010
76,40
-
-
-
-
-
-
-
-
-
-
-
-
2011
90,10
13,70
13,70
1,18
1,18
0,18
0,18
117,93
117,93
17,93
17,93
0,76
-
2012
98,10
21,70
8,00
1,28
1,09
0,28
0,09
128,40
108,88
28,40
8,88
0,90
10,47
2013
95,60
19,20
-2,50
1,25
0,97
0,25
-0,03
125,13
97,45
25,13
-2,55
0,98
-3,27
2014
79,90
3,50
-15,70
1,05
0,84
0,05
-0,16
104,58
83,58
4,58
-16,42
0,96
-20,55
2015
88,30
11,90
8,40
1,16
1,11
0,16
0,11
115,58
110,51
15,58
10,51
0,80
10,99
2016
84,70
8,30
-3,60
1,11
0,96
0,11
-0,04
110,86
95,92
10,86
-4,08
0,88
-4,71
2017
91,10
14,70
6,40
1,19
1,08
0,19
0,08
119,24
107,56
19,24
7,56
0,85
8,38
Итого в среднем
2,10
2,10
1,03
1,03
0,03
0,03
103,00
103,00
3,00
3,00
0,70
-
Таблица 1- Аналитические показатели ряда динамики
Средние показатели динамики
Наименование показателя
Метод расчета
1. Средний уровень ряда
а) для интервального ряда абсолютных величин
б) для моментного ряда с равными интервалами
для моментного ряда динамики с неравными интервалами
2. Средний абсолютный прирост
3. Средний коэффициент роста
4. Средний коэффициент прироста
5. Средний темп роста
6. Средний темп прироста
7. Средняя величина 1% абсолютного прироста
Тпр = - характеризует абсолютный прирост в относительных величинах.
На основе полученных данных таблицы можно сделать вывод об увеличении урожайности картофеля за период 2010-2017 гг. на 14,70 ц с 1 га. За весь период наблюдается, как снижение, так и увеличение урожайности, то есть прирост урожайности имеет как положительную динамику, так и отрицательную. Наиболее интенсивное увеличение произошло в2011г по сравнению с 2010г. . и 2015 г. по равнению с 2014 г, когда урожайность увеличилась на 11 % или на 8,3 ц с 1 га.
Усредненные показатели констатируют, что урожайность картофеля за указанный период в среднем каждый год увеличивается на 2,10 ц с 1 га, или 3%.
Между рассчитанными аналитическими показателями существует определенная взаимосвязь:
1. Цепные и базисные абсолютные приросты связаны между собой :
сумма последовательных цепных абсолютных приростов равна базисному, т.е общему приросту за весь промежуток времени:
= 14,7
2. Между цепными и базисными Кр существует взаимосвязь :
произведение последовательных цепных к- ов роста равно базисному коэффициенту роста за весь период- , а частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста 1,19: 1,11 ==1,08 Проверка взаимосвязи на примере: 0,961,08 = 1,19
3. Зная значение А% можно восстановить неизвестные значения уровней ряда динамики, разделив А% на 100
4. Пункты роста – представляют собой разность базисных темпов роста (темпов прироста), двух смежных периодов.
Пункты роста, в отличие от темпов прироста можно складывать, в результате чего получают темп прироста соответствующего периода по сравнению с базисным. По таблице сумма пунктов равна 35, что соответствует темпу прироста в 97 г по сравнению с
5. К-ты опережения (отставания) – применяют в анализе двух взаимосвязанных рядов динамики
К-т опережения = Кр (наиб) / Кр (наим)
К опережения Тприр (наиб ) / Тприр (наим).
Показывает во сколько раз быстрее растет (отстает) уровень одного ряда динамики по сравнению с другим.
3. Методы обработки рядов динамики для определения основного тренда(тенденции) развития
Уровни РД в период времени t принимают те или иные значения в результате действия разных факторов.
Фактическую величину уровня динамического ряда можно представить как функцию трех компонент:
1. Тенденции ряда, обусловленной влиянием общих факторов , определяющих основное направление развития за длительный период времени – тренд ряда
2. Периодических колебаний, вызванных особенностями существования явления (сезонность, сезонные колебания)
3. Случайные колебания, связанные с действием второстепенных факторов
Это разложение уровней ряда динамики на составляющие можно выразить как : Yt=ft +fp+g (функция тренда, функция периодических колебаний, случайная компонента)
yt - уровни ряда динамики определяемые по соответствующему уравнению на момент времени t.
G –случайная компонента
В связи с тем, что основная тенденция в развитии некоторых явлений (в то числе и урожайности) затушевывается периодическими колебаниями отдельных факторов (например, сезонность, метеорологических условий), важное значение в анализе динамических рядов имеют приемы выявления общей тенденции.
Таким образом любой уровень ряда динамики формируется под влиянием необходимых и случайных факторов, поэтому выявить тенденцию (тренд) означает любыми методами устранить случайные и выявить необходимые факторы. Существует несколько таких приемов(методов).
Например: метод укрупнения периодов
Метод средней скользящей
Метод аналитического выравнивания по ряду функций.
Метод укрупнения периодов используется как правило если, РД задан малыми временными интервалами, не позволяющими визуально наблюдать тенденцию ряда: ( например суточные приросты скота колеблются и четко тенденция не видна). Метод укрупнения интервалов позволяет осуществить переход к большим промежуткам времени: например суточные данные заменяют пятидневными, декадными, месячными, месячные квартальными, годовыми – трех, пятилетними.
Месяц
1
2
3
4
5
6
7
8
9
10
11
12
Выпуск продукции, тыс.шт.
2
2,2
2,1
2,5
2,3
2,7
2,6
2,5
3,0
3,2
2,9
3,3
Укрупним интервалы до квартала и найдем объем выпуска продукции за квартал и в среднем за месяц.
Квартал
Всего, тыс.руб.
В среднем за месяц, тыс. шт.
1
6,3
2,1
2
7,5
2,5
3
8,1
2,7
4
9,4
3,1
Месячные данные о выпуске продукции колеблются, а квартальные прослеживают четкую тенденцию.
Метод укрупнения периодов укорачивает ДР, вместо 12 уровней имеем 4 , устранить данный недостаток можно , если по укрупненным интервалам рассчитывать скользящие(подвижные) средние. Скользить необходимо последовательно на единицу времени. При нечетном периоде скольжения сглаженный ряд укорачивается на n -1 уровней , т.е. при 3 членной – будет короче на 2 уровня, при 5 на 4 уровня.
Начинают сглаживание с трехчленной скользящей средней, и если тенденция не проявилась , то период скольжения увеличивают до 5 и т.д.
Метод скользящей средней выявляет тенденцию, но не представляет ее виде математической функции, которая позволяет уравнение полученное (тренд) использовать в прогнозировании. Это позволяет осуществить метод аналитического выравнивания.
Суть метода аналитического выравнивания состоит в замене фактических(эмпирических) данных динамического ряда сглаженными (теоретическими) найденными по соответствующей математической функции.
Практическая значимость уравнения тем выше, чем меньше фактические уровни ряда динамики отклоняются от теоретических, определяемых по определенной функции. Если функция будет выбрана неверно то отклонения фактических уровней от теоретических будет не только следствием случайности, но и воспроизведут в себе последствия неправильно определенного тренда. Поэтому важное значение имеет выбор уравнения
Закономерность изменения явления можно представить как функцию времени.
yt = f(t) + G
t –(независимая переменная) условное обозначение времени(уровней РД)
Вид уравнения определяется характером динамики явления может зависеть:
от целей исследования
от логического анализа, проведенного по исходным уровням ряда динамики.
Например, логический анализ при выборе вида уравнения может быть основан на рассчитанных показателях динамики. В частности в статистике выбрано правило выбора степени полинома модели развития.
Согласно которого:
Если относительно стабильны абсолютные приросты (1-е разности уровней относительно равны, т.е постоянны) - сглаживание проводится по уравнению прямой( полином первого порядка)
Если абсолютные приросты равномерно увеличиваются (вторые разности уровней приблизительно равны) сглаживание проводят на параболе второго порядка(полином второго порядка).
При ускоренно-возрастающих (замедляющихся) абсолютных приростах ( постоянны 3 разности) – параболу третьего порядка
При относительно стабильных темпах роста, т.е. когда цепные темпы роста постоянны – показательная функция. Для класса экспоненциальных кривых (простая показательная или равносильная ей экспонента у= , в отличие от полиномов, характерной является зависимость приростов от величины самой функции. Эти кривые хорошо описывают процессы, имеющие лавинообразный характер.
Е= 2,7183
Вычислительный процесс нахождения параметров уравнения при сохранении полной идентичности конечных результатов может быть значительно упрощен, если ввести обозначения дат ( периодов времени) с помощью натуральных чисел t, с тем чтобы t=0 .
Уровни РД в ед времени (мес., кв., годы) можно обозначить t – следующим образом:
Год/
t
06
07
08
09
10
11
12
∑t
Экономическая интерпретация а1
1. Нечетное(четное)
1
2
3
4
5
6
7
∑t≠0
Ср ∆у
2. Нечетное
-3
-2
-1
1
2
3
∑t=0
Ср ∆у
-2,5
-1,5
-0,5
0,5
1,5
2,5
3. Четное
-5
-3
-1
1
3
5
∑t=0
½ср. ∆у
Интерпретация параметров уравнения тренда зависит от обозначения параметром t уровней РД.
На практике выбор формы прямой может быть основан на анализе графического изображения уровней ряда динамики (линейная диаграмма) и так же на математических критериях таких как: - ошибка аппроксимации , где
у – фактические (эмпирические) уровни ряда динамики
yt – теоретические (выровненные) уровни ряда динамики
n – число (количество) уровней ряда динамики
m (L) – число (количество) параметров уровней ряда динамики
Коэффициент вариации V =
Т.к. 1-2 метода не дали более точной оценки тренда развития, наиболее прогрессивным методом является метод аналитического выравнивания по ряду функции, выбор которого можно основывать, как отмечалось выше, графический и логический анализ, рассчитывают 1, 2 , 3 разности.
Таблица 2- Методы обработки динамики урожайности картофеля для выявления основного тренда
Год
Урож-ть ц/га yi
1- разности
2-е разности
Метод упр периодов (3 года)
Метод ср скользящей
Методы аналит.выравн. по ур-ю прямой, параболы
Теор.РД по ур-ю прямой yt
(y-yt)2
Теор.РД по ур-ю динамики yt
(y-yt)2
Cр знач.
Cр. знач.
t
t2
t4
yt
yt2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2010
76,4
-
-
-7
49
2401
687
86,74
107
78,22
11,68
2011
90,1
13,7
-
=264,6
88,2
264,6
88,2
-5
25
625
87,11
8,94
82,73
54,29
2012
98,1
8,0
-5,7
283,8
94,4
-3
9
81
87,48
112,84
85,09
169,16
2013
95,6
-2,5
-10,5
273,6
91,2
-1
1
1
88,84
60,19
2014
79,9
-15,7
-13,2
=263,8
87,9
263,8
87,9
1
1
1
88,21
69,02
2015
88,3
8,4
24,1
252,9
84,3
3
9
81
88,57
0,08
2016
84,7
-3,6
-12
264,1
88
5
25
625
88,94
17,98
2017
91,1
6,4
10
49
2401
89,31
3,25
Итого
704,9
t=0
168
6216
704,2
379,29
704,2
404,14
Год
Урож-ть ц/га yi
1- разности
2-е разности
Метод укр периодов (3 года)
Метод ср скользящей
Методы аналит.выравн. по ур-ю прямой, параболы
Теор.РД по ур-ю прямой yt
(y-yt)2
Теор.РД по ур-ю парабалы yt
(y-yt)2
ср знач.
ср. знач.
t
t2
t4
yt
yt2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2010
76,4
-
-
-3
9
81
229,2
687,6
87,26
117,94
80,66
18,15
2011
90,1
13,7
-
=264,6
88,2
264,6
88,2
-2
4
16
-180,2
360,4
87,37
7,45
87,37
7,45
2012
98,1
8,0
-5,7
283,8
94,4
-1
1
1
-98,1
98,1
87,48
112,78
91,44
44,36
2013
95,6
-2,5
-10,5
273,6
91,2
87,59
64,16
92,87
7,45
2014
79,9
-15,7
-13,2
=263,8
87,9
263,8
87,9
1
1
1
79,9
79,9
87,70
60,84
91,66
138,3
2015
88,3
8,4
24,1
252,9
84,3
2
4
16
176,6
353,2
87,81
0,24
87,81
0,24
2016
84,7
-3,6
-12
3
9
81
254,1
762,3
87,92
10,37
81,32
11,42
Итого
613,1
t=0
28
196
3,1
2341,5
613,13
373,78
613,13
227,37
Таблица 3- Методы обработки динамики урожайности картофеля для выявления основного тренда
Типы уравнений тренда:
Наиболее часто используются полиномы К степени, а так же экспоненты, различного рода кривые с насыщением и др.
В общем виде полином к степени:
yt=a0+a1t+a2t2 + …….а к tк
если к=1 получаем полином первой степени (линейный тренд)
yt = а0+а1t
где а0 – начальный уровень РД при∑ t= 0 ( средний уровень РД при ∑t≠ 0)
а1 – средний абсолютный прирост в единицу времени t (скорость роста)
если к=2 получаем полином второй степени (уравнение параболы второго порядка)
yt=a0+a1t+a2t2
где а2 – ускорения роста
если к=3 получаем полином третей степени (уравнение параболы третьего порядка)
yt=a0+a1t+a2t2 + a3t3
где а3 – изменения ускорения
Полиномы высоких степеней требуют достаточно длинных временных рядов, чтобы параметры тренда были статистически надежными: на каждый параметр
должно приходиться 6-7 временных рядов, следовательно парабола третьего порядка должна содержать ряд хотя бы 20 лет., поэтому отдают предпочтение функциям с меньшим числом параметров.
Так, например, чтобы решить уравнение тренда прямой вида yt=a0+a1t необходимо определить параметры а0. a1 используем метод наименьших квадратов Суть которого состоит в определении таких коэффициентов (параметров) , при которых сумма квадратов отклонений расчетных значений (выровненных)от фактических (эмпирических) была бы минимальной.
n- длина временного ряда
у – фактические (эмпирические) уровни ряда динамики
yt – теоретические (выровненные) уровни ряда динамики
Решается система нормальных уравнений.
Рассмотрим наиболее часто встречающиеся виды трендовых моделей, используемые для аналитического выравнивания в таблице
Виды трендовых моделей
Наименование функции
Вид функции
Система нормальных уравнений для нахождения параметра уравнения
Линейная
yt = а0+а1t
y=na0+a1t
yt=a0t+a1t2
Парабола 2-го порядка
yt=a0+a1t+a2t2
y = na0+a1t+a2t2
yt=a0t+a1t2+at3
y t2=a0t2+a1t3+a2t4
Показательная
(экспоненциальная кривая)
yt=a0a1t
lgy=nlga0+lga1t
lgyt=lga0t+lga1t2
Гипербола
yt=a0+a1
y=na0+a1
y=a0+a1
Коэффициенты (параметры многочлена) полиномов высоких степеней имеют следующую интерпретацию:
А0- характеристика среднего уровня ряда динамики (начальный уровень ряда динамики при t =0)
А1 – позволяет оценить скорость роста ( в среднем за период)
А2- ускорения роста
А3- изменения ускорения
t –(независимая переменная) условное обозначение времени
Обычно в экономических исследованиях применяют полином не выше третьего порядка. Использовать полиномы высоких степеней нецелесообразно , т.к. полученные функции будут отражать случайные отклонения ( что противоречит смыслу тенденции) и они требуют достаточно длинных временных рядов, чтобы параметры тренда были статистически надежными на каждый параметр при t должно приходиться 6- 7 временных единиц. Следовательно парабола третьего порядка должна содержать ряд хотя бы 20 лет., поэтому отдают предпочтение функциям с меньшим числом параметров
Приведем пример расчета 2-х трендов.
а0-? у = na0+a1t
a1-? yt = a0t+a1t
итого у = 613,1
а0 =
а1 =
yt = 87,59+0,11t
Из данных уравнения тренда наглядно видно, что в среднем за год с 2010- по 2016гг. наблюдаемая тенденция тренда роста урожайности картофеля на 0,11 ц/га.
Для оценки теоретических (выровненных) уровней ряда динамики используют ошибку аппроксимации (среднее квадратическое отклонение тренда) и их коэффициенты вариации.
, где
у – фактические (эмпирические) уровни ряда динамики
yt – теоретические (выровненные) уровни ряда динамики
n – число (количество) уровней ряда динамики
m (L) – число (количество) параметров уровней ряда динамики
теоретические уровни ряда динамики:
y(t=-7) = 87,59+0,11 (4)=72,19
Так как коэффициент вариации не превышает 25%, следует, что данный динамический ряд устойчив и данная модель может использоваться в прогнозировании.
Определим параметры уравнения тренда (параболы)
уt = a0+a1t+a2t2
Для того чтобы определить решим систему нормальных уравнений и введем условное обозначение временных дат t так, t = 0 и t3 = 0
Подставим значения в систему нормальных уравнений параболы и получим:
613,1 = 7а0 + 28 а2
613,13 = 28 а1
а0 = 87,59
а1 = 0,11
а2 = -1,32
Определим ошибку аппроксимации:
Syt =
Так как коэффициент вариации чем на уровне прямой
Следов парабола более точно определяет характер изменения временного ряда.
Данное уравнение тренда прямой можно использовать в прогнозировании, т.к. оно точнее отражает тенденцию. Метод экстраполяции вперед в будущее и метод интерполяции назад в прошлое.
При прогнозе следует определить на основании какого числа ряда уровня динамики можно построить уравнение тренда, каким может быть горизонт 1/3 исходных уровней ряда динамики.
.
Показательная(экспонентная) кривая. Показательная функция приводиться к линейному виду путем логарифмирования и замены
Для оценки степени близости эмпирических (фактических) уровней к теоретическим , определяют ошибку аппроксимации
Вопрос о возможности применения построенных моделей в целях анализа и прогнозировании явления может быть решен только после оценки точности модели( о точности можно судить по величине ошибки(погрешности) аппроксимации и к- та вариации, а также после проверки адекватности ( критерий Дарбина – Уотсона)- проверка гипотезы об отсутствии автокорреляции первого порядка)
Уравнение тренда применяют при прогнозировании, т.е определения уровней ряда динамики за его пределами. Прогноз может быть точечным ( по уравнению тренда) или интервальным ( по ошибке аппроксимации).
При прогнозе следует определить:
1. на основании какого числа уровней ряда динамики можно построить уравнение тренда.
2. Каким может быть горизонт прогнозирования ( период упреждения)
Период не должен превышать 1/3 числа уровней, на основе которых построено уравнение тренда.
Стьюдент – псевдоним английского математика и статистика Уильяма С. Госсета-разработавшего метод статистических гипотез и проверки гипотез t –распределения, не являющегося нормальным
n-m-(К) = (V) число степеней свободы вариации (число элементов статистической совокупности , вариация которых свободна (неограниченна).
Если n= 8 и m = 2, то число степеней свободы равно 6. Тогда при доверительной вероятности равной ) – 0,95 (т.е. при уровне значимости случайностей ά =0,05), коэффициент доверия (Стьюдента) t ά = 2,45
Уровень значимости применительно к проверке статистических гипотез - это вероятность с которой может быть опровергнута гипотеза о том или ином законе распределения.
Так, двум доверительным вероятностям 0,95 и 0,99 соответствует 5% и 1% уровни значимости, т.е ά=0,05 и ά= 0,01. В социально – экономических исследованиях уровень значимости ά принимают обычно равным 0,05.
График
При сравнении квартальных и месячных данных часто обнаруживается периодические колебания, возникающие под влиянием смены года – сезонные колебания или сезонные волны – индекс сезонности:
К=8-1=7(число степеней свободы – т.е число элементов совокупности вариация которых неограниченна)
К-т доверия
Приложение 4 ( Значения функции F (t) для распределения Стьюдента в зависимости от t числа к – степеней свободы).
Уравнение тренда применяют при прогнозировании, т.е определения уровней ряда динамики за его пределами. Прогноз может быть точечным ( по уравнению тренда) или интервальным ( по ошибке аппроксимации).
При прогнозе следует определить:
3. на основании какого числа уровней ряда динамики можно построить уравнение тренда.
4. Каким может быть горизонт прогнозирования ( период упреждения)
Период не должен превышать 1/3 числа уровней, на основе которых построено уравнение тренда.
Тема 5: Индексы
1. Понятие об индексах, индексы индивидуальные и общие
Для оценки изменения некоторых явлений, процессов , рассмотренных ранее относительных, средних величин недостаточно, для более глубокой оценки применяют индексы.
Индекс – с латинского означает показатель
Статистический индекс – это сложный относительный показатель, характеризующий изменение 2 –х совокупностей (сложных массовых явлений), состоящих из непосредственно несоизмеримых элементов:
- во времени (1/0 – динамические индексы),
- пространстве (территориальные индексы)
- или по сравнению с какой нибудь базой (эталоном) сравнения (плановым, нормативным , прогнозным уровнем).
Основные задачи которые решаются с помощью индексов:
1. характеристика общего изменения сложного массового явления(показателя) или формирующих его отдельных показателей
2. выявление с помощью индексов влияние отдельных факторов на изменение динамики сложного массового явления(н.р. влияние цен, физического объема на объем товарооборота).
Первоосновой не суммарности элементов сложных массовых явлений является : натурально – вещественная форма содержания продукции, т.е. нельзя непосредственно складывать тонны мяса, с тоннами картофеля и т.д.
Не суммарность можно преодолеть путем введения дополнительных показателей:
цена ед. товара. продукции;
себестоимость ед. продукции, товара;
затраты труда на ед. продукции;
В данном примере можно складывать производимую продукцию только в стоимостном выражении и для этого вводят дополнительные показатели ( цена продукции).
Индексы классифицируют по трем признакам:
- по степени охвата элементов совокупности
- по содержанию изучаемых объектов
- методам расчета общих индексов
По степени охвата элементов совокупности индексы делят на индивидуальные и общие ( сводные (групповые)).
Индивидуальный индексы – показывают изменение (соотношение) отдельных элементов совокупности. Например: изменение цены или объема продаж какого –то одного продукта. Индивидуальный индекс выражается значком _ I = р1/р0
Период, уровень которого сравнивается, называется отчетным или текущим периодом и обозначается – 1.
Период, с уровнем которого производится сравнение, называется базисным и обозначается – 0.
В статистической литературе в теории индексного метода принято обозначать, цену - р, себестоимость - , количество продукции - , затраты времени – на ед. продукции - , затраты времени на производство всей продукции – Т или количество работников -Т.
Существует два способа расчета индивидуальных индексов :
цепной и базисный. При цепном способе, база сравнения постоянно меняется, т.е. она переменна, и бывает, как правило, соседнего, прошлого периода. При базисном способе – база сравнения не меняется, остается постоянной , какого то одного периода ( н.р. первоначального ).Индексы, рассчитанные цепным способом – называют цепными. Индексы рассчитанные базисным способом – базисные.
Для индивидуальных индексов действует следующее правило:
произведение цепных индексов дает базисный индекс, и, наоборот, частное от деления базисных индексов последующих к предыдущему дает , дает цепной индекс. Рассчитав цепной индекс можно, без труда перейти к базисным, а имея базисные , к цепным без прямого расчета.
Пример :
Общие – показывают изменение всех элементов совокупности. Если индексы охватывают не все элементы сложного явления, а лишь часть, то их называют групповыми (сводными), т.е они показывают соотношение отдельной группы единиц.
Пример:
В зависимости от содержания объектов исследования, индексы подразделяют на индексы объемных и качественных показателей:
к объемным показателям относят показатели количества, объема, т. е. физического объема продукции данного вида. численность рабочих, общие затраты труда или рабочего времени на производство продукции, общий расход материалов данного вида. Соответственно рассчитывают индекс физического объема, численности рабочих и т. д., Эти показатели являются первичными показателями.
к качественным показателям относят показатели, характеризующие уровень явления в расчете на единицу совокупности ( цена ед. продукции, себестоимость ед. продукции, затраты рабочего времени на единицу продукции, выработка продукции в ед. времени). Данные показатели являются вторичными ( расчетными - которые получают делением объемных показателей). Соответственно рассчитывают индекс: цен, себестоимости и т. д.
По методам расчета (общих и групповых индексов) различают индексы агрегатные, средние из индивидуальных и индексы средних величин.
2. Агрегатные индексы
Основой всякого общего, сводного индекса является его агрегатная форма. т.к. числитель и знаменатель дроби представляет собой агрегаты. т.е. соединения разнородных элементов.
Общий( сводный) индекс состоит из 2 элементов:
1. один из которых индексируемая величина
2. второй элемент со измеритель ( вес)
Показатель, для которого исчисляется индекс, называется индексируемой величиной. Показатель, который вводится в целях соизмерения, называется со измерителем или весом .В агрегатных индексах числитель и знаменатель дроби представляет собой сложную совокупность:
числитель – сумма произведения индексируемой величины отчетного периода на веса
знаменатель – сумма произведения индексируемой величины базисного периода на тот же самый вес. Особенностью индексов и индексного метода является устранение влияния изменения весов ( элиминирование) путем их фиксирования в числителе и знаменателе индекса на одном и том же уровне.
Существуют основные правила построения индексов агрегатных форм:
1.При записи общего индекса на 1 месте пишется индексируемая величина, на втором месте – вес или со измеритель.
2.в индексах изменяется индексируемая величина, а вес остается неизменным, как в числите так и в знаменателе. ( происходит элиминирование – устраняется влияние весов).
3. в индексах качественных показателей, индексируемой величиной является сам качественный показатель, а со измерителем является количественный показатель, который фиксируется на уровне отчетного периода, как в числителе так и в знаменателе. Пример:
4. в индексах количественных показателей, индексируемой величиной является сам количественный показатель, а со измерителем качественный показатель, который фиксируется на уровне базисного года, как в числителе так и в знаменателе. Пример:
5. Разница между числителем и знаменателем дроби индекса, дает изменение анализируемого явления в абсолютном выражении.
Вид продукцииции
2018г.
2019г.
Расчетные значения
Индив. индекс пр. произв. труда
Произведено, тыс. шт.
Затраты
времени на ед. продукции, чел.час
Произведено, тыс. шт.
Затраты
времени на ед. продукции, чел.час
Пример расчета агрегатного индекса производительности труда:
2. Средний арифметический и средний гармонический индексы.
Практическое их применение зависит от исходной статистической информации, когда происходит преобразование агрегатного индекса в среднеарифметический и среднегармонический индексы (средние из индивидуальных).
Т.е. агрегатный индекс может быть вычислен и при помощи индивидуальных индексов, потому что всякий общий индекс является средневзвешенной из индивидуальных индексов. Необходимость расчета данных индексов, возникает тогда, когда по элементам, входящих в индекс, неизвестны отдельные значения например: себ, объема продукции, затр. тр. на ед продукц. и т.д. , а имеются индивидуальные индексы: и объем сложного массового явления.
Если, у исходного агрегатного индекса условная величина в знаменателе, то преобразуем в средне гармоническую форму. Если условная величина, в числителе, то преобразуем в среднеарифметическую форму. преобразование происходит за счет индивидуального индекса.
3. Индексы средних величин
(Индексы переменного и фиксированного состава )
В ряде случаев приходится изучать динамику общественной жизни, уровни которых выражены средними величинами ( ср. себестоимостью, средней з/пл. и т. д. Необходимость расчета этих индексов возникает в том случае, когда динамика средних показателей отражает не только изменение усредняемого признака, но и изменение структуры совокупности.
Для средних величин качественных показателей рассчитывают индексы:
переменного состава;
фиксированного состава
структурных сдвигов
I переменного состава - это отношение средних величин качественного показателя
Индекс переменного состава отражает динамику среднего показателя, как за счет индексируемой величины, так и за счет изменения весов, по которым взвешивается средняя.
Для того чтобы исключить влияние изменения структуры совокупности на динамику средних величин, можно для двух периодов рассчитать средние по одной и той же структуре. Такие средние называют стандартизированными, а отношение представляет собой индекс фиксированного состава.
Индекс структурных сдвигов – отражает динамику среднего показателя лишь за счет изменения весов
Между рассмотренными индексами существует следующая взаимосвязь:
4. Индексные системы
Тема6 : Статистическое изучение взаимосвязи ( корреляционный и регрессионный методы анализа)
В природе и обществе явления и процессы связаны друг с другом и зависят друг от друга. Связи и зависимости общественных явлений изучаются различными методами. Основным и важнейшим методом выявления и измерения связей является метод группировок, так же статистика широко использует сопоставление параллельных рядов, балансовый, индексный, графический методы. Большое значение в данной области исследований имеют дисперсионный и корреляционно – регрессионный методы анализа.
В общем виде задача статистики в области изучения взаимосвязи состоит не только в количественной оценке их наличия и определение формы связи, но и аналитического выражения влияния факторных признаков на результативный признак (уравнение регрессии)
Для решения данной задачи применяют методы корреляционного и регрессионного анализа.
Задачи корреляционного анализа:
1. изучение тесноты связи между признаками (факторными и результативным)
2. определение неизвестных причинных связей (влияние неучтенных (прочих) связей)
3. оценка факторов, оказывающих наибольшее влияние на результативный фактор
Задачи регрессионного анализа:
1. выбор и построение модели, то есть нахождение уравнения регрессии
2. оценка и анализ результатов модели, т.е. параметров уравнения регрессии:
а 0 ; а1 ; а2 ……аn
Связи и зависимости между явлениями могут быть функциональными и стохастическими.
Функциональной называется связь, при которой определенному значению одного признака (факторного) всегда соответствует одно или несколько определенных значений другого признака (результативного).
Данная связь является полной, точной, строгой. Функциональные связи достаточно часто встречаются в области естественных наук (физика, химия и т.д.). Например зависимость между давлением и объемом газа, между площадью круга и радиусом и т.д. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Стохастическая связь – это связь, при которой с изменением факторного признака меняется распределение единиц совокупности по результативному признаку.
Частным случаем стохастической связи является корреляционная связь, при которой каждому значению факторного признака могут соответствовать несколько значений результативного признака, образующих ряд распределения.
В отличие от функциональной связи корреляционная связь проявляется не в каждом отдельном случае, а при большом числе наблюдений, в среднем.
Это – неполная, - приближенная связь.
Например в экономике: связь между урожайностью и количеством вносимых удобрений. Для каждого конкретного поля, участка одно и тоже количество вносимых удобрений вызовет разный прирост урожайности, так при взаимодействии находиться еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – н.р. когда анализируется большое количество площадей – тогда обнаруживается прямая зависимость: увеличение массы вносимых удобрений ведет к росту урожайности.
Таким образом коррялиционные связи обнаруживаются не в единичных случаях, а только в массовых явлениях, в отдельных случаях ее может не быть.
Этапы проведения корреляционно – регрессионного анализа
1 этап: Теоретическое обоснование наличия связи между изучаемыми признаками и сбор массива данных.
Теоретическое обоснование направлено на выбор факторов , т.е. производиться отбор факторов, построение рабочей гипотезы и сбор массива данных.
Для проведения отбора факторов исходной предпосылкой является проведение предварительного логического, теоретического отбора факторов (вплоть до использования категорий философии).
В корреляционно - регрессионную модель желательно включать факторы одного уровня:
1 уровень - Общеэкономические факторы, например прибыль, рентабельность, себестоимость всей продукции, среднегодовая стоимость основных средств(капитала) и др.
2уровень - Технико – экономические факторы, н.р. трудоемкость продукции, уровень вносимых удобрений, расход кормов, себестоимости един6ицы продукции, урожайность, продуктивность и др.
3 уровень - Технологические , н.р. агротехника, качество почв, породный состав скота, сроки выполнения работ и др.
Первый уровень факторов определяет второй , а второй уровень соответственно третий. Слияние факторов различных уровней ведет к очень высокой тесноте связи. Например нельзя коррелировать такие факторы как прибыль, трудоемкость продукции, породный состав скота и т.д.
В модель лучше всего включать факторы которые характеризуют интенсивность развития явления, т.е. показатели рассчитанные на какую то базу, н.р. на 1 ед. продукции, на одного человека, на 100 га площади и т.д.
Сбор массива данных
Номер
предприятия
У
Х1
Х2 ……….Хn
1
2
3
.
.
.
10
n
Требования к факторам:
1. На каждый фактор Х должно приходиться 8 – 10 единиц наблюдения
( предприятий, периодов времени – месячные , квартальные данные, годы ) и т.д. Н.р. если 2 фактора включается в модель берется 16 - 20 единиц наблюдения.
2. Факторы должны быть сопоставимы (либо все расчетные либо все объемные) , нельзя проследить влияние на урожайность, наличие удобрений вносимых на всю площадь.
2 этап : Определение формы связи доведенное до выбора уравнения связи Yx=fx
Существует ряд приемов (способов) определения формы связи, н.р. самый простой это теоретический и графический способы.
Так например чем больше размер ОК предприятия (фактор), тем больше при прочих равных условиях , оно выпускает продукции (результативный признак), поэтому зависимость между ними может быть выражена уравнением прямой.
Увеличение количества вносимых удобрений приводит, при прочих равных условиях, к росту урожайности, но чрезмерное внесение их без изменения других элементов , снижает урожайность , такая зависимость может быть выражена параболой второго порядка, где а0 –характеризует начало кривой, а1 – угол наклона кривой; а2- степень ускорения или замедления кривизны параболы. Однако при помощи теоретического анализа не всегда удается установить форму связи, большое значение играет графический способ (график поля корреляции).
Связи могут быть:
1. В зависимости от направления действия - прямыми и обратными;
2.По аналитическому выражению (форме) связи - прямолинейными и криволинейными; Прямолинейная связь – с возрастанием факторного признака происходит непрерывное возрастание (или убывание) результативного признака. Графически такая связь представляется прямой линией.
При криволинейной связи – с возрастанием факторного признака возрастание (или ) убывание результативного признака происходит неравномерно или направление его меняется на обратное. Геометрически такие связи представляются кривыми линиями
( параболы, гиперболы и т.д.)
3. По количеству факторов, действующих на результативный признак, связи различают - однофакторные и многофакторные (Записать уравнение регрессии однофакторного и многофакторного )
Коэффициенты регрессии показывают как изменяется результативный признак при увеличении факторного признака на 1ед.
Н.р. У – урожайность картофеля; Х1- уровень вносимых удобрений;
Х2 – трудоемкость продукции .
Ух1х2= - 3.4 + 6.6 Х1 – 3,2Х2
Данное уравнение регрессии можно использовать в прогнозировании, н.р. можно предположить какой будет уровень урожайности при тех или иных значениях (уровнях вносимых удобрений и трудоемкости продукции).
3 этап: Оценка тесноты связи
Т.е. меры колеблеемости результативного признака относительно среднего значения при одной и той же величине факторного признака.
Показатели тесноты связи между признаками зависят от шкалы, по которой измерены признаки.
Основные шкалы:
1. Номинальная шкала (наименований) предназначена для описания принадлежности объектов к определенным социальным группам. Эти наименования могут быть как смысловыми (ИТР, Рабочие ) так и кодовыми (цифры, буквы) – данная шкала задает отличие у единиц совокупности.
Оценка тесноты связи осуществляется с помощью коэффициентов:
1. К-та Ассоциации
2. К-та Контингенции
3. К-та взаимной сопряженности (Пирсона и Чупрова )
2. Шкала порядковая (ординальная) – задает не только различие между единицами совокупности, но и их иерархию и применяется для измерения упорядочения объектов по одному или нескольким признакам
Н.р. Классификация работников не только по категориям персонала, но и тарифному разряду. Не только ФИО студентов, но их экзаменационные оценки.
Оценка тесноты связи осуществляется с помощью коэффициентов:
1. Коэфф- т рангов Спирмена (-ро)
2. Коэфф-т корреляции Кенделла (-тау)
3. Коэфф-т конкордации (- дабл ю) – применяют для оценки согласованности мнений экспертов
3. Шкала количественная (интервальная), задает не только иерархию, но и расстояние между объектами. Используется для описания количественных показателей – заработная плата, демографические характеристики, стоимость потребительской корзины и т.д.)
Оценка тесноты связи осуществляется с помощью коэффициентов:
1. Линейный коэффициент корреляции (только для линейной формы связи)
2. Индекс корреляции (эмпирическое корреляционное отношение)- для линейной и криволинейной формы связи - -этто
3. Коэффициент детерминации – этто
Выявления связи между признаками осуществляется следующим образом: выдвигается нулевая статистическая гипотеза Н0- об отсутствии связи между признаками, рассчитывается соответствующий критерий (t- Стьюдента, если число наблюдений n 30) F – Фишера), затем проверяется, превосходит ли расчетный (фактический) коэффициент - критическое (табличное) – по таблицам критических значений , где уровень значимости наиболее часто применяют в экономических исследованиях = 0,05 .
Если Коэфф-т фактический больше > коэфф – та табличного, то гипотеза об отсутствии связи отвергается, т.е связь присутствует.
Расчет линейного коэффициента корреляции для не сгруппированных данных можно рассчитывать по следующим формулам парного коэффициента корреляции : R
1.
+ прямая – обратная
2. R==
3 Rу/х1= =
+ прямая – обратная
Множественный коэффициент корреляции:
Rу/х1х2=
< 0,45 (45%)- связь слабая ; 0,45 - 0, 75- средняя ; >0,75 – тесная (сильная)
Теснота корреляционной связи, как и любой другой может быть измерена при помощи эмпирического корреляционного отношения, при линейной и криволинейной связи. В основе расчета корреляционного отношения лежит правило сложения дисперсий., т.е.
, где
межгрупповая дисперсия (факторная) показывает вариацию результативного признака за счет влияния факторного признака.
общая, показывает вариацию результативного признака за счет влияния всех факторов.
остаточная дисперсия( средняя из внутригрупповых), показывает вариацию результативного признака за счет влияния неучтенных факторов.
Следует различать эмпирическое корреляционное отношение от теоретического.
Теоретическое корреляционное отношение - представляет собой относительную величину, которая получается в результате сравнения среднего квадратического отклонения выровненных значений результативного признака, т.е. рассчитанных по уравнению регрессии, со средним квадратическим отклонением эмпирических (фактических) значений результативного признака
где,
, тогда
;
= ост=, тогда формула теоретического корреляционного отношения примет вид:
При криволинейных связях теоретическое корреляционное отношение называют часто индексом корреляции
Коэффициент детерминации Д=R2
Д =
Коэффициент детерминации показывает на % результативный признак У зависит от влияния факторных признаков. Применительно к данному примеру оценки тесноты связи между урожайностью и уровнем вносимых удобрений, трудоемкостью продукции Д = 0,48 = 48%, т.е. урожайность картофеля на 48% зависит (обусловлена ) влиянием данных факторов, и на 52% от прочих неучтенных факторов.
Задача:
Обосновать гипотезу и определить форму связи между размером товарооборота и затратами на рекламу
1. Производиться отбор факторов, строится рабочая гипотеза и сбор массива данных.
Гипотеза: Примем Н0- нулевую гипотезу, т.е. об отсутствии связи. А так же воспользуемся категорией философии:
- между затратами на рекламу и размером товарооборота связь есть, т.к. реклама это двигатель торговли
Таблица 1- Исходные данные для корреляционно – регрессионного анализа
N
Затраты на рекламу, тыс. руб.
(х)
Размер товарооборота, тыс.руб.
(У)
Х2
У2
ух
(
1
4
4
16
16
16
4,34
0,12
13,396
2
4
5
16
25
20
4,34
0,44
13,396
3
5
6
25
36
30
5,56
0,19
5,954
4
6
6
36
36
36
6,78
0,61
1,488
5
8
8
64
64
64
9,22
1,49
1,488
6
8
10
64
100
80
9,22
0,64
1,488
7
10
12
100
144
120
11,66
0,12
13,396
8
11
13
121
169
143
12,88
0,01
23,814
Итого
56
64
442
590
509
64,0
3,59
74,43
Собрали массив данных, строим поле корреляции, где
по шкале абсцисс (Х) – откладываем затраты на рекламу
По оси ординат (У) – размер товарооборота
(Ломаная регрессия, получается в результате соединения точек отрезками). Анализируя ломанную линию , можно предположить, что возрастание размера товарооборота идет равномерно, пропорционально затратам на рекламу. В основе данной зависимости лежит прямолинейная связь, которая выражается линейным уравнением.
Ух= а0 + а1х
Данную систему можно решить используя систему нормальных уравнений, метод наименьших квадратов (МНК)
либо: а1=
а0=
=
а0= а1= =
=8=3536-3136=400
= 4072 – 3584 =488
=28288-28504=-216
тема 7: выборочный метод наблюдения в статистике
1. понятие о выборочном наблюдении, его задачи
статистическое наблюдение можно организовать сплошное и несплошное. сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности и связано с большими трудовыми и материальными затратами. изучение не всех единиц совокупности, а лишь некоторой части, по которой следует судить о свойствах всей совокупности в целом, можно осуществить несплошным наблюдением. в статистической практике самым распространенным является выборочное наблюдение.
выборочное наблюдение — это такой вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.
совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели — генеральными.
совокупность отобранных единиц именуют выборочной совокупностью, и все ее обобщающие показатели — выборочными.
имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. наиболее существенны из них следующие:
• экономия времени и средств в результате сокращения объема работы;
• сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);
• необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);
• достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.
преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выборочного метода. такими принципами являются: обеспечение случайности (равной возможности попадания в выборку) отбора единиц и достаточного их числа. соблюдение этих принципов позволяет получить объективную гарантию репрезентативности полученной выборочной совокупности. понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.
основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. при этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.
ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). их можно избежать при правильной организации и проведении наблюдения.
ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т. е. между величинами выборных и соответствующих генеральных показателей.
для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.
по виду различают индивидуальный, групповой и комбинированный отбор. при индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе — качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.
по методу отбора различают повторную и бесповторную выборки.
при повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). повторная выборка в социально-экономической жизни встречается редко. обычно выборку организуют по схеме бесповторной выборки.
при бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т. е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.
способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.
по степени охвата единиц совокупности различают большие и малые (n<30) выборки.
в практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.
основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:
n—объем генеральной совокупности (число входящих в нее единиц);
п — объем выборки (число обследованных единиц);
— генеральная средняя (среднее значение признака в генеральной совокупности);
— выборочная средняя;
p — генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);
w — выборочная доля;
— генеральная дисперсия (дисперсия признака в генеральной совокупности);
s2 — выборочная дисперсия того же признака;
— среднее квадратическое отклонение в генеральной совокупности;
s — среднее квадратическое отклонение в выборке.
2. ошибки выборки
при выборочном наблюдении должна быть обеспечена случайность отбора единиц. каждая единица должна иметь равную с другими возможность быть отобранной. именно на этом основывается собственно-случайная выборка.
к собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного способа, например, с помощью таблицы случайных чисел. случайный отбор — это отбор не беспорядочный. принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо фактор, кроме случая. примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. причем всем номерам обеспечивается равная возможность попадания в выборку. при этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
доля, выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
так, при 5%-ной выборке из партии деталей в 1000 ед. объем выборки п составляет 50 ед., а при 10%-ной выборке -100 ед. и т.д. при правильной научной организации выборки ошибки репрезентативности можно свести к минимальном значениям, в результате — выборочное наблюдение становится достаточно точным.
собственно-случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.
рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.
применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).
выборочная доля (w), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:
w = т/п.
например, если из 100 деталей выборки (и = 100), 95 деталей оказались стандартными (т =95), то выборочная доля
w = 95 / 100 = 0,95 .
для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.
ошибка выборки или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:
• для средней количественного признака
(1)
• для доли (альтернативного признака)
(2)
ошибка выборки свойственна только выборочным наблюдениям. чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.
выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. поэтому определяют среднюю из возможных ошибок — среднюю ошибку выборки.
от чего зависит средняя ошибка выборки! при соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.
средняя ошибка выборки также зависит от степени варьирования изучаемого признака. степень варьирования, как известно, характеризуется дисперсией или w(1 -w) — для альтернативного признака. чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. при нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т. е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.
зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х,р) неизвестны, и следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (1), (2).
при случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:
• для средней количественного признака
(3)
• для доли (альтернативного признака)
(4)
поскольку практически дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются
значением дисперсии s2 , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:
• для средней количественного признака
(5)
• для доли (альтернативного признака)
(6)
однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (5) и (6), будут приближенными. но в теории вероятностей доказано, что генеральная дисперсия выражается через выборочную следующим соотношением:
(7)
так как п / (n -1) при достаточно больших п — величина, близкая к единице, то можно принять, что = s2, а следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (5) и (6). и только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент п/(п-1) и исчислять среднюю ошибку малой выборки по формуле:
(8)
при случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на 1-(п/n), поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:
• для средней количественного признака
(9)
• для доли (альтернативного признака)
(10)
так как п всегда меньше n, то дополнительный множитель 1 - (n / n) всегда будет меньше единицы. отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. в то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5%-ной выборке он равен 0,95; при 2%-ной — 0,98 и т.д.). поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (5) и (6) без указанного множителя, хотя выборку и организуют как бесповторную. это имеет место в тех случаях, когда число единиц генеральной совокупности n неизвестно или безгранично, или когда п очень мало по сравнению с n, и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.
механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы.
при организации механического отбора единицы совокупности предварительно располагают (обычно в списке) в определенном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо показателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через определенный итервал. при этом размер интервала в генеральной совокупности равен обратному значению доли выборки. так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1 : 0,02), при 5 %-ной выборке — каждая 20-я единица (1 : 0,05), например, сходящая со станка деталь.
при достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. поэтому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной выборки (9), (10).
для отбора единиц из неоднородной совокупности применяется, так называемая типическая выборка, которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.
при обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
типическая выборка обычно применяется при изучении сложных статистических совокупностей. например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдельных отраслях экономики, производительности труда рабочих предприятия, представленных отдельными группами по квалификации.
типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки,
при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
среднюю ошибку выборки находят по формулам:
• для средней количественного признака
(повторный отбор); (11)
(бесповторный отбор); (12)
• для доли (альтернативного признака)
(повторный отбор); (13)
(бесповторный отбор), (14)
где — средняя из внутригрупповых дисперсий по выборочной совокупности;
- средняя из внутригрупповых дисперсий доли (альтернативного
признака) по выборочной совокупности.
серийная выборка предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы.
применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.
поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.
среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:
(повторный отбор); (15)
(бесповторный отбор), (16)
где r - число отобранных серий; r - общее число серий.
межгрупповую дисперсию серийной выборки вычисляют следующим образом:
где — средняя i-й серии; - общая средняя по всей выборочной совокупности.
средняя ошибка выборки для доли (альтернативного признака) при серийном отборе:
(повторный отбор); (17)
(бесповторный отбор). (18)
межгрупповую (межсерийную) дисперсию доли серийной выборки определяют по формуле:
(19)
где w i - доля признака в i-и серии; - общая доля признака во всей выборочной совокупности.
в практике статистических обследований помимо рассмотренных ранее способов отбора применяется их комбинация (комбинированный отбор).
3. распространение выборочных результатов на генеральную совокупность
конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.
выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.
в каждой конкретной выборке расхождение между выборочной средней и генеральной, т. е. может быть меньше средней ошибки выборки , равно ей или больше ее.
причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). поэтому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью р.
предельную ошибку выборки для средней () при повторном отборе можно рассчитать по формуле:
(20)
где t - нормированное отклонение — «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;
— средняя ошибка выборки.
аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:
(21)
при случайном бесповторном отборе в формулах расчета предельных ошибок выборки (20) и (21) необходимо умножить подкоренное выражение на 1 - (n / n).
формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.
на основании теоремы п.л. чебышева (с уточнениями а.м. ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.
применительно к нахождению среднего значения признака эта теорема может быть записана так:
(22)
а для доли признака:
(23)
где (24)
таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.
значения функции ф(t) при различных значениях t как коэффициента кратности средней ошибки выборки, определяются на основе специально составленных таблиц. приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема (n 30):
t 1,000 1,960 2,000 2,580 3,000
ф(t) 0,683 0,950 0,954 0,990 0,997
предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом t (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95). так, при t = 1 предельная ошибка составит = . следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1.
при t = 2 с вероятностью 0,954 она не выйдет за пределы ±2 ,
при t = 3 с вероятностью 0,997 — за пределы ±3 и т.д.
как видно из приведённых выше значений функции ф (t) (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т. е. 3 крайне мала и равна 0,003, т. е. 1—0,997. такие маловероятные события считаются практически невозможными, а потому величину = 3можно принять за предел возможной ошибки выборки.
выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.
предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
• для средней (25)
• для доли (26)
это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от - до +
аналогичным образом может быть записан доверительный интервал генеральной доли:
наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
• для средней, %: (27)
• для доли, %: (28)
рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах.
задача 1. для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (s= 6).
необходимо с вероятностью р = 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации.
решение. предельную ошибку = tопределяем по формуле повторного отбора (6.20), так как численность генеральной совокупности n неизвестна. из представленных значений ф (t) (см. с. 98) для вероятности р = 0,954 находим t = 2.
следовательно, предельная ошибка выборки, дней:
предельная относительная ошибка выборки, %:
генеральная средняя будет равна = ± , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:
таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.
задача 2. среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) малообеспеченных оказалось 300 семей.
требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе.
решение. выборочная доля (доля малообеспеченных семей среди обследованных семей) равна:
по представленным ранее данным ф(t) для вероятности 0,997 находим t = 3 (см. с. 99). предельную ошибку доли определяем по формуле бесповторного отбора (механическая выборка всегда является бесповторной):
предельная относительная ошибка выборки, %:
генеральная доляа доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства:
в нашем примере:
таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.
задача 3. для определения урожайности зерновых культур проведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные данные (табл.6.1). необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйствам региона.
таблица 6.1
распределение урожайности по хозяйствам региона, имеющим различную форму собственности
хозяйства (по формам собственности)
количество обследованных хозяйств
f
средняя урожайность, ц/га
xi
дисперсия урожайности
в каждой группе
si2
коллективные акционерные общества крестьянские (фермерские)
30
50
20
18
20
28
15
25
40
итого
100
—
—
решение. поскольку обследованные хозяйства региона сгруппированы по формам собственности, предельную ошибку средней урожайности определяем по формуле для типической выборки, осуществляемой методом повторного отбора (численность генеральной совокупности n неизвестна):
в этой формуле неизвестна средняя из внутригрупповых дисперсий.
она исчисляется по формуле:
по представленным ранее (см. с. 98) данным ф (t) для вероятности р =0,954 находим t = 2.
тогда предельная ошибка выборки, ц/га:
генеральная средняя: = ± . для нахождения ее границ вначале нужно исчислить среднюю урожайность по выборочной совокупности , ц/га:
предельная относительная ошибка выборки, %:
доверительные пределы генеральной средней исчисляем, исходя из двойного неравенства:
таким образом, с вероятностью 0,954 можно гарантировать, что средняя урожайность зерновых культур по региону будет не менее чем 20 ц/га, но и не более чем 22 ц/га.
определение необходимого объема выборки. при проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. формулы для определения необходимой численности выборки п легко получить непосредственно из формул ошибок выборки.
так, из формул предельной ошибки выборки для повторного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:
• для средней количественного признака
(29)
• для доли (альтернативного признака)
(30)
аналогично из формул предельной ошибки выборки для бесповторного отбора находим, что
(для средней); (31)
(для доли). (32)
эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки.
для расчета объема выборки нужно знать дисперсию. она может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, тогда для определения дисперсии надо провести специальное выборочное обследование небольшого объема.
задача 4. для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам.
сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?
решение. рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.31), учитывая, что t = 2 при р = 0,954:
таким образом, выборка численностью 47 чел. обеспечивает заданную точность при бесповторном отборе.
выборочный метод широко используется в статистической практике для получения экономической информации.
большую актуальность приобретает выборочный метод в современных условиях перехода к рыночной экономике. изменения в характере экономических отношений, аренда, собственность отдельных коллективов и лиц обусловливают изменения функций учета и статистики, сокращение и упрощение отчетности. вместе с тем, возрастающие требования к менеджменту усиливают потребность в обеспечении надежной информацией, дальнейшего повышения ее оперативности. все это обусловливает более широкое применение выборочного метода в экономике.
в отечественной статистике уже накоплен определенный опыт выборочных обследований.