Данные сквозной задачи

👀 1768 просмотров
📌 1728 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Данные сквозной задачи», doc

Загружаем конспект в формате doc

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Данные сквозной задачи», Word формат

Данные сквозной задачи Таблица 0. Данные о деятельности банков одного из регионов РФ Номер банка Кредитные вложения, млн. руб. Прибыль банков, млн. руб. 1 614 256 2 396 168 3 681 252 4 543 221 5 540 210 6 706 278 7 576 214 8 537 169 9 744 288 10 523 213 11 375 150 12 429 208 13 552 218 14 642 227 15 618 238 16 653 254 17 704 251 18 759 293 19 384 158 20 492 195 21 610 237 22 591 239 23 555 191 24 603 236 25 528 215 26 795 303 27 615 228 28 589 230 29 627 265 30 698 245 Итого 17679,00 6850,0 Задание 1 По исходным данным: 1. Постройте статистический ряд распределения организаций (предприятий) по признаку – Кредитные вложения, образовав 5 групп с равными интервалами. 2. Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану. Сделайте выводы по результатам выполнения задания. Задание 2 По исходным данным: 1. Установите наличие и характер связи между признаками Кредитные вложения и прибыль банков в среднем на 1 банк методом аналитической группировки, образовав пять групп с равными интервалами по факторному признаку. 2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения. Сделайте выводы по результатам выполнения задания. Задание 3 По результатам выполнения задания 1 с вероятностью 0,954 определите: 1. Ошибку выборки среднего размера кредитных вложений и границы, в которых будет находиться среднего размера кредитных вложений банков в генеральной совокупности. 2. Ошибку выборки доли банков с размером кредитных вложений 627,0 млн. руб. и более и границы, в которых будет находиться генеральная доля. Тема 1. Предмет, метод и задачи статистики. 1.1. Предмет, методы, задачи статистики Термин «статистика» происходит от латинского «status»,которое вошло в употребление в Германии в середине 18 века. Впервые статистику стал преподавать Готфрид Ахенваль в 1746 г. СТАТИСТИКА – наука, которая изучает количественную сторону массовых социально-экономических явлений в неразрывной взаимосвязи с их качественной стороной, а также количественное выражение закономерностей развития процессов в конкретных условиях места и времени. ПРЕДМЕТ СТАТИСТИКИ – количественная сторона массовых социально-экономических явлений и процессов, которая изучается неразрывно с их качественной стороной. Особенность статистики как науки 1. Характеризует структуру социально-экономических явлений 2. Изучает явления во взаимосвязи с другими явлениями и обнаруживает причины такой взаимосвязи 3 Изучает общественные явления как в статике, так и в динамике 4. Исследует не отдельные факты, а массовые социально-экономические процессы и явления 5. Изучает количественную сторону в конкретных условиях места и времени, т.е. размеры явлений и тенденции их развития Методы статистики Закон больших чисел – объективный закон, согласно которому одновременное действие большого числа случайных факторов приводит к результату почти независимо от каждого случая. Закономерности проявляются лишь в массе явлений при обобщении данных по большому числу единиц. 1.2. Основные понятия статистической науки: стат. совокупность, варьирующие признаки, стат. закономерность, стат. показатель. Так как статистика имеет дело с массовыми явлениями, то основным понятием является статистическая совокупность. Статистическая совокупность - определенное множество единиц совокупности, которые количественно отличаются друг от друга своими характеристиками, но объединены какой-либо качественной основой. Могут быть однородными и разнородными. Иначе говоря, это совокупность объектов или явлений, изучаемых статистикой, которые имеют один или несколько общих признаков и различаются между собой по другим признакам. Так, например, при определении объема розничного товарооборота все предприятия торговли, осуществляющие продажу товаров населению, рассматриваются как единая статистическая совокупность — "розничная торговля". Отдельные объекты или явления, образующие статистическую совокупность, называются единицами совокупности. Например, при проведении переписи торгового оборудования единицей наблюдения является торговое предприятие, а единицей совокупности - их оборудование (прилавки, холодильные агрегаты и т.д.). Явления и процессы в жизни общества изучаются статистикой посредством статистических показателей. Статистический показатель - это количественная оценка свойства изучаемого явления. Одной из важных категорий статистической науки является понятие признака. Признак - это характерное свойство изучаемого явления, отличающее его от других явлений. В разных отраслях статистики изучаются разные признаки. Так, например, объектом изучения является предприятие, а его признаками - вид продукции, объем выпуска, численность работающих и т.д. Или объект - отдельный человек, а признаки - пол, возраст, национальность, рост, вес и т.д. Таким образом, статистических признаков, т.е. свойств, качеств объектов наблюдения очень много. Все их многообразие принято делить на две большие группы: признаки качества и признаки количества. Качественный признак (атрибутивный) - признак, отдельные значения которого выражаются в виде понятий, наименований. Профессия — токарь, слесарь, технолог, учитель, врач и т.д. Военнообязанный или невоеннообязанный Пол – мужской, женский Количественный признак - признак, определенные значения которого имеют количественные выражения. Рост - 185, 172, 164, 158. Вес - 105, 72, 54, 48. Каждый объект изучения может обладать целым рядом статистических признаков, но от объекта к объекту одни признаки меняются, другие остаются неизменными. Меняющиеся признаки от одного объекта к другому принято называть варьирующими. Именно эти признаки изучаются в статистике, поскольку неизменяющийся признак изучать неинтересно. Предположим, что в вашей группе только мужчины, у всех один признак (пол — мужской) и по этому признаку больше сказать нечего. А если есть и женщины, то уже можно посчитать их процент в группе, динамику изменения численности женщин по месяцам учебного года и др. Переходим к следующему показателю. Вариация - это многообразие, изменяемость величины признака у отдельных единиц совокупности наблюдения. Вариация признака - пол - мужской, женский; военнообязанный или невоеннообязанный Вариация з/п - 10000, 100000, 1000000. Отдельные значения признака называются вариантами этого признака. Тема 2. Статистическое наблюдение. Абсолютные и относительные величины 2.1. Понятие статистического наблюдения. Требования к собираемой информации. 2.2. Основные виды, формы и способы наблюдения. 2.3. Точность наблюдения и контроль данных наблюдения. 2.4. Абсолютные и относительные величины 2.1. Понятие стат. наблюдения. Требования к собираемой информации. Статистическое наблюдение — это начальная стадия экономико-статистического наблюдения. Она представляет собой научно организационную работу по собиранию массовых первичных данных о явлениях и процессах общественной жизни. Любое статистическое наблюдение осуществляется с помощью оценки и регистрации признаков единиц совокупности в соответствующих учетных документах. Таким образом, полученные данные представляют собой факты, которые так или иначе характеризуют явления общественной жизни. Статистическое наблюдение должно отвечать следующим требованиям. 1. Наблюдаемые явления должны иметь научную и практическую ценность, выражать определенные социально-экономические типы явлений. 2. Непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к рассматриваемому вопросу, так как явления находятся в постоянном изменении, развитии. В том случае, если отсутствуют полные данные, анализ и выводы могут быть ошибочными. 3. Для обеспечения достоверности статистических данных необходима тщательная всесторонняя проверка (контроль) качества собираемых фактов. 4. Для того, чтобы создать наилучшие условия для получения объективных материалов, необходима научная организация статистического наблюдения. Статистическое наблюдение осуществляется в двух формах: путём предоставления отчётности и проведения специально организованных статистических наблюдений. 2.2. Основные виды, формы и способы наблюдения. Специально организованное статистическое наблюдение представляет собой сбор сведений посредством переписей, единовременных учётов и обследований. Примером специально организованного статистического наблюдения могут быть: перепись населения, всякого рода социологические обследования, переписи промышленного оборудования, остатки материалов и другие переписи в промышленности, в сельском хозяйстве, строительстве, на транспорте, в торговле и т.д. Виды статистического наблюдения различаются по времени регистрации данных и по степени охвата единиц исследуемой совокупности. По характеру регистрации данных во времени различают наблюдение непрерывное, или текущее, и прерывное (периодическое). Последнее, в свою очередь подразделяется на наблюдение периодическое и наблюдение единовременное. Текущим (непрерывным) является такое наблюдение, которое ведётся систематически. При этом регистрация фактов производится по мере их свершения, например, регистрация актов гражданского состояния, учёт произведённой продукции, отпуска материалов со склада, выручки магазинов. При текущем наблюдении нельзя допускать значительного разрыва между моментом возникновения факта и моментом его регистрации. Прерывным (периодическим) является такое наблюдение, которое повторяется через определённые промежутки времени. Например, ежегодные переписи скота, проводимые по состоянию на 1 января. Единовременное (разовое) наблюдение проводится по мере надобности, время от времени, без соблюдения строгой периодичности или вообще проводится единожды. Примером могут служить социально-экономические выборочные обследования, проводимые Научно-исследовательским институтом по изучению спроса на товары народного потребления и конъюнктуры торговли. По степени охвата единиц изучаемой совокупности различают сплошные и несплошные статистические наблюдения. Сплошным называют такое наблюдение, при котором обследованию подвергаются все без исключения единицы изучаемой совокупности. Примером сплошного наблюдения может служить Всероссийская перепись населения. Путем сплошного наблюдения осуществляется получение отчетности от предприятий и учреждений. Несплошным называют такое наблюдение, при котором обследованию подвергаются не все единицы изучаемой совокупности, а только заранее установленная их часть, например, изучение торговых оборотов и цен на городских рынках. Основным видом несплошного наблюдения является выборочное. Выборочным наблюдением называется наблюдение, при котором характеристика всей совокупности фактов дается по некоторой их части, отобранной в случайном порядке. В промышленности его используют для контроля качества продукции, в сельском хозяйстве — при выявлении продуктивности скота, в контрольных проверках — при переписи скота и других работах. В торговле с его помощью изучают эффективность новых, передовых форм торговли, спрос населения и степень его удовлетворения. Постоянно проводятся выборочные обследования бюджетов домохозяйств. 2.3. Точность наблюдения и контроль данных наблюдения. Всякое статистическое наблюдение ставит задачу получения таких данных, которые точнее бы отражали действительность. Отклонения, или разности между исчисленными показателями и действительными (истинными) величинами исследуемых явлений нашли отражение в показателях, называемых ошибками, или погрешностями. В зависимости от характера и степени влияния на конечные результаты наблюдения, а также исходя из источников и причин возникновения неточностей, допускаемых в процессе статистического наблюдения, обычно выделяют ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они подразделяются на случайные и систематические и могут быть как при сплошном, так и несплошном наблюдении. Случайные ошибки — ошибки регистрации, которые могут быть допущены как опрашиваемыми в их ответах, так и регистраторами при заполнении бланков. Систематические ошибки могут быть преднамеренными, так и непреднамеренными. Преднамеренные ошибки получаются в результате того, что опрашиваемый, зная действительное положение дела, сознательно сообщает неправильные данные. Непреднамеренные ошибки вызываются различными случайными причинами (небрежностью или невнимательностью регистратора, неисправностью измерительных приборов и т.д.). Ошибки репрезентативности возникают в результате того, что состав отобранной для обследования части единиц совокупности недостаточно полно отображает состав всей изучаемой совокупности, хотя регистрация сведений по каждой отобранной для обследования единице была проведена точно. Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки возникают из-за того, что совокупность отобранных единиц наблюдения неполно воспроизводит всю совокупность в целом. Систематические ошибки возникают вследствие нарушения принципов случайного отбора единиц изучаемой совокупности. Для выявления и устранения допущенных при регистрации ошибок может применяться счётный и логический контроль собранного материала. Счётный контроль заключается в проверке точности арифметических расчётов, применявшихся при составлении отчётности или заполнении формуляров обследования. Логический контроль заключается в проверке ответов на вопросы программы наблюдения путём их логического осмысления или путём сравнения полученных данных с другими источниками по этому же вопросу. Указанные приемы проверки статистических данных путем счетного и логического контроля могут быть использованы при проверке как материалов специальных статистических наблюдений. . 2.4. Абсолютные и относительные величины Для характеристики массовых явлений статистика использует статистические величины (показатели). Они подразделяются на абсолютные, относительные и средние. Результаты статистических наблюдений представляют собой абсолютные величины, отражающие уровень развития какого-либо явления или процесса. Абсолютные величины обозначаются X, а их общее количество в статистической совокупности N. Абсолютные величины всегда имеют свою единицу измерения (размерность), присущую изучаемому явлению. Широко распространены следующие виды единиц измерения: • натуральные, подразделяющиеся на простые (например, штуки, тонны, метры) и сложные (составные), представляющие собой комбинацию двух разноименных величин (например, киловатт-час); • условно-натуральные (например, алкогольные напитки учитываются в декалитрах 100% спирта, а различные виды топлива соизмеряют по условному топливу с теплотворной способностью 7000 ккал/кг или 29,3 МДж/кг ); • стоимостные, позволяющие соизмерить в денежной форме товары, которые нельзя соизмерить в натуральной форме (доллары США, рубли и т.д.). Количество единиц с одинаковым значением признака обозначается f и называется частота. Суммируя число всех единиц с одинаковыми значениями признака, получаем N. Анализируя абсолютные величины, например, статистические данные о торговле, необходимо сопоставлять эти данные во времени и пространстве, исследовать закономерности их изменения и развития, изучать структуру совокупностей. С помощью абсолютных величин эти задачи не выполнимы, в этом случае необходимо использовать относительные величины. Относительная величина – это результат деления (сравнения) двух абсолютных величин. В числителе дроби стоит величина, которую сравнивают, а в знаменателе – величина, с которой сравнивают (база сравнения). Например, если явка студентов сегодня на лекцию составила 80 чел., а на предыдущую лекцию пришло 50 чел., то относительная величина покажет, что явка увеличилась в 80/50 = 1,6 раза, при этом базой сравнения является явка студентов на предыдущую лекцию. Полученная относительная величина выражена в виде коэффициента, который показывает, во сколько раз сравниваемая величина больше базисной. В данном примере база сравнения принята за единицу. В случае если основание принимается за 100, относительная величина выражается в процентах (%), если за 1000 – в промилле (‰). Выбор той или иной формы относительной величины зависит от ее абсолютного значения: • если сравниваемая величина больше базы сравнения, то выбирают форму коэффициента (как в вышеприведенном примере - выражается в "разах"); • если сравниваемые величины примерно близки по значению, то относительную величину выражают в процентах (%); • если сравниваемая величина значительно больше по значению базы сравнения, то относительную величину выражают в промилле (‰). Различают следующие виды относительных величин, для краткости именуемые в дальнейшем индексами: • динамики; • структуры; • координации; • сравнения; • интенсивности. Индекс динамики показывает изменение явления во времени и представляет собой отношение значений изучаемого явления в отчетный (анализируемый) период (момент) времени к базисному (предыдущему). Данный индекс определяется по формуле (2.4.1.) где цифры означают: 1 – отчетный или анализируемый период, 0 – прошлый или базисный период. Критериальным значением индекса динамики служит единица (или 100%), то есть если он больше 1, то имеет место рост (увеличение) явления во времени, а если равен 1 – стабильность, ну а если меньше 1 – наблюдается спад (уменьшение) явления. Еще одно название индекса динамики – коэффициент (темп) роста, вычитая из которого единицу (100%), получают темп изменения (темп прироста) с критериальным значением 0, который определяется по формуле Если T>0, то имеет место рост явления; Т=0 – стабильность, Т<0 – спад. В рассмотренном выше примере про явку студентов был рассчитан именно индекс динамики, показавший, что явка студентов увеличилась в 1,6 раза или на 60%. Разновидностями индекса динамики являются индексы планового задания и выполнения плана, рассчитываемые для планирования различных величин и контроля их выполнения. Индекс планового задания – это отношение планового значения изучаемого показателя к базисному. Он определяется по формуле (2.4.2.) где X’ – планируемое значение; Xо – базисное значение признака. Для определения процента выполнения плана необходимо рассчитать индекс выполнения плана, то есть отношение наблюдаемого значения признака к плановому (оптимальному, максимально возможному) значению по формуле (2.4.3.) Индекс структуры (доля) – это отношение какой-либо части объекта (совокупности) ко всему объекту. Он определяется по формуле (2.4.4.) Например, если в группе из 50 студентов 40 человек женского пола, то их доля составит d = 40/50 = 0,8 или 80%. Индекс координации – это отношение какой-либо части объекта к другой его части, принятой за основу (базу сравнения). Он определяется по формуле (2.4.5.) Например, если в группе из 50 студентов 40 человек женского пола, значит 10 человек - мужского, тогда индекс координации лиц женского пола составит 40/10 = 4, то есть лиц женского пола в 4 раза больше в группе, чем мужского. Индекс сравнения – это сравнение (соотношение) разных объектов по одинаковым признакам. Он определяется по формуле (2.4.6.) где А, Б – сравниваемые объекты. Например, если в одной аудитории присутствует 50 студентов, а в соседней 20, то индекс сравнения составит 50/20 = 2,5, то есть в одной аудитории в 2,5 раза больше находится студентов, чем в другой. Индекс интенсивности – это соотношение разных признаков одного объекта между собой. Он определяется по формуле (2.4.7.) где X – один признак объекта; Y – другой признак этого же объекта. Например, показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, цены единицы продукции и т.д. ТЕМА 3. СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ. 3.1. СТАТИСТИЧЕСКАЯ СВОДКА, ЕЕ СОДЕРЖАНИЕ, ЗАДАЧИ, РОЛЬ В АНАЛИЗЕ ИНФОРМАЦИИ. 3.2. ГРУППИРОВКА - ОСНОВА СТАТИСТИЧЕСКОЙ СВОДКИ. ВИДЫ ГРУППИРОВКИ, ИХ ПРИМЕНЕНИЕ В СТАТИСТИКЕ. 3.3. СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ВИДЫ И ХАРАКТЕРИСТИКИ. 3.4. ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ. 3.1. СТАТИСТИЧЕСКАЯ СВОДКА, ЕЕ СОДЕРЖАНИЕ, ЗАДАЧИ, РОЛЬ В АНАЛИЗЕ ИНФОРМАЦИИ СВОДКА выполняется на 2-ом этапе статистического наблюдения, ее цель - СИСТЕМАТИЗАЦИЯ первичных данных и получение в результате характеристики ВСЕГО объекта при помощи обобщающих показателей. Н. возраст студентов: - 1. до 25 лет; 2. старше 25 лет. СВОДКА- комплекс последовательных операций по обобщению конкретных единичных фактов для выявления ТИПИЧНЫХ черт и закономерностей, присущих совокупности в ЦЕЛОМ. В результате сводки происходит переход от конкретных, случайных данных к обобщающей характеристике этих данных. Н. переход от конкретного возраста каждого студента к среднему возрасту всех студентов. По глубине и точности обработки первичных данных выделяют: 1. простую сводку - операцию, которая состоит только в подсчете итогов по совокупности единиц наблюдения (средний возраст студента); 2. сложную - комплекс операций, включающий: а) группировку единиц наблюдения; б) подсчет итогов по каждой группе и по всему объекту в целом; в) представление результатов в виде статистических таблиц и графиков. По форме обработки первичных данных выделяют: 1. централизованную - весь первичный материал поступает в ОДНУ организацию и подвергается в ней анализу от начала и до конца; 2. децентрализованную - отчеты организаций сводятся отдельными статистическими органами, а полученные результаты поступают в вышестоящие органы и т.д. до Федеральной службы государственной статистики, где определяются итоговые показатели национальной экономики в целом. По технике выполнения выделяют: 1. автоматизированную; 2. ручную. 3.2. ГРУППИРОВКА - ОСНОВА СТАТИСТИЧЕСКОЙ СВОДКИ. ВИДЫ ГРУППИРОВКИ, ИХ ПРИМЕНЕНИЕ В СТАТИСТИКЕ Группировка - разделение единиц изучаемой совокупности на качественно однородные группы по определенным признакам, существенным для данной статистической задачи. Признак, который лежит в основе группировки, называется группировочным признаком или основанием группировки. Схема 3.2.1. задачи, решаемые с помощью группировок В зависимости от решаемых задач выделяют ТРИ вида группировок: 1. типологические - разбиение РАЗНОРОДНОЙ совокупности на отдельные КАЧЕСТВЕННО ОДНОРОДНЫЕ ГРУППЫ и выявление на этой основе различных типов явлений. При ее выполнении должен быть заранее известен ПЕРЕЧЕНЬ типов явлений, на которые разбивается исследуемая совокупность, т.е. предварительно должен быть произведен теоретический анализ явления. Например: группировка по национальности; по отраслям производства; по секторам экономики; по формам собственности. Пример типологической группировки Таблица 3.2.1. Группы предприятий по формам собственности № п/п Группы предприятий по формам собственности (описательные значения) Число предприятий, тыс. ед. Число предприятий, в % 1 Государственная собственность 151,0 151/3348*100=4,5 2 Муниципальная собственность 217,0 217/3348*100=6,5 3 Частная собственность 2510,0 75,0 4 Собственность общественных и религиозных организаций и объединений 223,0 6,6 5 Прочие формы собственности 247,0 7,4 ИТОГО: 3348,0 100,0 Вывод: наибольший удельный вес имеют предприятия с частной формой собственности (75,0%), а наименьшую долю (4,5%) – государственные предприятия. 2. Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку. Примером могут служить группировки предприятий по среднегодовой стоимости основных производственных фондов и т.д. Состав населения может быть сгруппирован по полу, по возрасту, по уровню образования, по роду занятий и т.д. С их помощью могут быть выделены и изучены групп предприятий, для вычисления специальных демографических показателей и т.д. Пример структурной группировки Таблица 3.2.2. Группировка банков по величине кредитных вложений одного из регионов РФ № группы Группа банков по величине кредитных вложений, млн. руб. Число банков в абсолютном выражении, в % 1 2 3 4 1 375,00 - 459,00 4 4/30*100=13,3 2 459,00 - 543,00 5 16,7 3 543,00 - 627,00 11 36,7 4 627,00 - 711,00 7 23,3 5 711,00 - 795,00 3 10,0 Итого 30 100,0 Основное назначение: выявление тенденции изменения структурных сдвигов. Вывод: наибольшая величина кредитных вложений приходится на группу банков №3 с величиной 543,0 - 627,0 млн. руб. 3. Аналитическая группировка - это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные - это признаки, под воздействием которых изменяются результативные. (в нашем случае – величина кредитных вложений, млн. руб.) Результативные – это признаки, которые изменяются под влиянием факторных (в нашем случае – прибыль банков, млн. руб.). Взаимосвязь проявляется в том, что с РОСТОМ ФАКТОРНОГО ПРИЗНАКА СИСТЕМАТИЧЕСКИ ВОЗРАСТАЕТ ИЛИ УБЫВАЕТ РЕЗУЛЬТАТИВНЫЙ ПРИЗНАК. Особенности: 1). Единицы группируются по факторному признаку, а не по результативному; 2) каждая выделенная группа характеризуется СРЕДНЕЙ величиной (величинами) результативного признака. Таблица 3.2.3. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вложений, млн.руб. Число банков, f Прибыль банка, млн. руб. Всего В среднем по группе на 1 банк 1 2 3 4 гр.5=гр.4:гр.3 1 375,00 - 459,00 ИЛИ (до 459,00) 4 684,000 684/4= 171,000 2 459,00 - 543,00 5 1002,000 200,400 3 543,00 - 627,00 11 2508,000 228,000 4 627,00 - 711,00 7 1772,000 253,143 5 711,00 - 795,00 ИЛИ (свыше 711,00) 3 884,000 294,667 итого 30 6850,00 228,333 Как рассчитать общее среднее значение результативного признака «Прибыль банков» в среднем на 1 банк 6850/30=228,333 (млн.руб.) Аналитическая группировка показывает, что с ростом кредитных вложений () систематически возрастает прибыль В СРЕДНЕМ на 1 банк (), следовательно, можно считать, что между величиной кредитных вложений и прибылью банков в целом ИМЕЕТСЯ ВЗАИМОСВЯЗЬ. При разбиении совокупности на группы главным вопросом является определение количества групп. Если в основании группировки лежит описательный признак (см. табл.3.2.1.) – форма собственности, то количество выделяемых групп определяется теоретическим анализом. Если в основании группировки лежит количественный признак (табл.3.2.2., 3.2.3.), то производят специальные расчеты, чтобы определить количество групп и величину интервала группировки. Интервал – значения варьирующего признака, лежащие в определенных границах. Интервал имеет величину (ширину), верхнюю и нижнюю границу или хотя бы одну из них. Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале. Величина интервала (ширина) – представляет собой разность между верхней и нижней границами интервала. Схема 3.2.2. Виды интервалов группировки Кроме указанных 3-х видов группировки существуют комбинированные группировки. Образование групп по двум и более признакам, взятым в определенном сочетании, называется комбинированной группировкой. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей. Применение комбинированных группировок обусловлено многообразием экономических явлений, а также необходимостью их всестороннего изучения. Но увеличение числа группировочных признаков ограничивается уменьшением наглядности, что снижает эффективность использования статистической информации. Примером комбинированной группировки может служить разделение образованных групп по формам хозяйствования на подгруппы по уровню рентабельности (доходности) или по другим признакам (производительность труда, фондоотдача и т.д.). Техника проведения аналитической группировки. Рассмотрим применение метода группировки на примере сквозной задачи Имеются данные о работе 30 банков одного из регионов РФ (табл. 3.2.4.). В качестве изучаемого признака возьмем величину кредитных вложений и построим к нему ряд распределения с равными закрытыми интервалами Таблица 3.2.4. Данные о деятельности банков одного из регионов РФ Номер банка Кредитные вложения, млн. руб. Прибыль банков, млн. руб. 1 614 256 2 396 168 3 681 252 4 543 221 5 540 210 6 706 278 7 576 214 8 537 169 9 744 288 10 523 213 11 375 150 12 429 208 13 552 218 14 642 227 15 618 238 16 653 254 17 704 251 18 759 293 19 384 158 20 492 195 21 610 237 22 591 239 23 555 191 24 603 236 25 528 215 26 795 303 27 615 228 28 589 230 29 627 265 30 698 245 Итого 17679,00 6850,0 Таблица 3.2.5. Вспомогательная таблица для построения интервального ряда распределения по признаку «Кредитные вложения банков» В Excel - Номер банка Кредитные вложения, млн.руб Прибыль банков, млн.руб. 11 375 150 19 384 158 2 396 168 12 429 208 20 492 195 10 523 213 25 528 215 8 537 169 5 540 210 4 543 221 13 552 218 23 555 191 7 576 214 28 589 230 22 591 239 24 603 236 21 610 237 1 614 256 27 615 228 15 618 238 29 627 265 14 642 227 16 653 254 3 681 252 30 698 245 17 704 251 6 706 278 9 744 288 18 759 293 26 795 303 Итого 17679 6850 Построение интервального ряда распределения банков по объему кредитных вложений Для построения интервального вариационного ряда, характеризующего распределение банков по объему кредитных вложений, необходимо вычислить величину и границы интервалов ряда. При построении ряда с равными интервалами величина интервала h определяется по формуле: , (3.2.1.) где – наибольшее и наименьшее значения признака в исследуемой совокупности, k- число групп интервального ряда. Число групп k задается в условии задания или рассчитывается по формуле Г.Стерджесса k=1+3,322 lg n, (3.2.2.) где n - число единиц совокупности. Определение величины интервала по формуле (3.2.1.) при заданных k = 5, xmax = 795 млн руб., xmin = 375 млн руб.: При h = 84 млн. руб. границы интервалов ряда распределения имеют следующий вид (табл. 3.2.5.): Таблица 3.2.5. Границы интервалов Для построения интервального ряда необходимо подсчитать число банков, входящих в каждую группу (частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов (это 459, 543, 627, 711 млн. руб.). Отнесение таких единиц к одной из двух смежных групп осуществим по принципу полуоткрытого интервала [ ). Т.к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и нижняя, и верхняя границы. Процесс группировки единиц совокупности по признаку Объем кредитных вложений представлен во вспомогательной (разработочной) таблице 3.2.6. (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2 курсовой работы). Например, объем кредитных вложений в размере 458,999 млн. руб. – отнесем к ПЕРВОЙ группе; в размере 459,000 млн. руб. – отнесем к ВТОРОЙ группе; в размере 626,905 млн. руб. – отнесем к ТРЕТЬЕЙ группе; в размере 626,999 млн. руб. – отнесем к ТРЕТЬЕЙ группе; в размере 627,905 млн. руб. – отнесем к ЧЕТВЕРТОЙ группе; Табл.3.2.6. Разработочная таблица для построения интервального ряда распределения и аналитической группировки № п/п Группы банков по величине кредитных вложений, млн. руб. № банка Кредитные вложения, млн. руб. Прибыль, млн. руб. 1 2 3 4 5 1 375,00 - 459,00 11 375 150 19 384 158 2 396 168 12 429 208 Итого 4 1584,00 684,00 2 459,00 - 543,00 20 492 195 10 523 213 25 528 215 8 537 169 5 540 210 Итого 5 2620,00 1002,00 3 543,00 - 627,00 4 543 221 13 552 218 23 555 191 7 576 214 28 589 230 22 591 239 24 603 236 21 610 237 1 614 256 27 615 228 15 618 238 Итого 11 6466,00 2508,00 4 627,00 - 711,00 29 627 265 14 642 227 16 653 254 3 681 252 30 698 245 17 704 251 6 706 278 Итого 7 4711,00 1772,00 5 711,00 - 795,00 9 744 288 18 759 293 26 795 303 Итого 3 2298,00 884,00 Всего 30 17679,00 6850,00 В Excel: группировка по «Группы банков по величине кредитных вложений, млн. руб.», » На основании данных разработочной таблицы построим аналитическую группировку зависимости кредитных вложений и прибыли банков Таблица 3.2.7. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вложений, млн.руб. Число банков, f Кредитные вложения банка, млн. руб. Прибыль банка, млн. руб. Всего В среднем по группе на 1 банк Всего В среднем по группе на 1 банк 1 2 3 4 Гр.5=гр.4:гр.3 6 гр.7=гр.6:гр.3 1 375,00 - 459,00 ИЛИ (до 459,00) 4 1584,000 1584/4= 396,000 684,000 684/4= 171,000 2 459,00 - 543,00 5 2620,000 524,000 1002,000 200,400 3 543,00 - 627,00 11 6466,000 587,819 2508,000 228,000 4 627,00 - 711,00 7 4711,000 673,000 1772,000 253,143 5 711,00 - 795,00 ИЛИ (свыше 711,00) 3 2298,000 766,000 884,000 294,667 итого 30 17679,000 589,300 6850,00 228,333 Аналитическая группировка показывает, что с ростом кредитных вложений систематически возрастает прибыль В СРЕДНЕМ на 1 банк, следовательно, можно считать, что между величиной кредитных вложений () и прибылью банков () в целом ИМЕЕТСЯ ВЗАИМОВСЯЗЬ. 3.3. СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ВИДЫ И ХАРАКТЕРИСТИКИ Результаты сводки могут быть представлены в виде статистических рядов распределения. Схема 3.3.1. Виды рядов распределения Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от вида признака, рассматриваемого как группировочный ряды могут быть вариационными (количественными) и атрибутивными (качественными). Атрибутивные признаки — это признаки, не имеющие количественной меры. Например, пол (мужской, женский), вид экономической деятельности, вид продукции, профессия рабочего и т.д. Количественные признаки — это признаки, имеющие количественное выражение у отдельных единиц совокупности, например, заработная плата рабочих, стоимость продукции промышленных предприятий, возраст людей, урожайность отдельных участков посевной площади и т.д. Пример атрибутивного ряда Табл.3.3.1. Распределение студентов по полу в группе 320 №п/п Пол студентов, () Число студентов, чел. () Число студентов в % к итогу, частость () Число студентов в долях к итогу, частость () 1 2 3 4 1 женский 28 28/35*100=80 28/35=0,8 2 мужской 7 7/35*100=20 7/35=0,2 Итого: 35 100 1,0 Вариационный ряд – ряд, построенный по количественному признаку, причем значения признака располагаются в порядке возрастания или в порядке убывания Схема 3.3.2 Элементы ряда распределения Варианта (а) – () значения группировочного признака в вариационном ряду распределения (в нашем случае – объем кредитных вложений, млн.руб.). Частота () – абсолютное значение случаев данного варианта, т.е. то число раз, сколько встречается элемент в статистической совокупности (т.е. в нашем случае - то число банков, которое встречается в совокупности в том или ином интервале). Частость – () - относительная доля каждой частоты в общей сумме частот, выраженнная в процентах или долях единицы (в нашем случае - тот процент (%) или доля банков, которое встречается в совокупности в том или ином интервале). Вариационные ряды могут быть дискретными или интервальными. Дискретный ряд распределения — это ряд, в котором варианты ()выражены целым числом. Пример дискретного ряда распределения Таблица 3.3.2. Распределение рабочих N–го цеха по разрядам Тарифный разряд () Число рабочих, чел. 1-й 10 2-й 20 3-й 40 4-й 60 5-й 50 6-й 20 Итого: 200 Интервальный ряд распределения — это ряд, в котором значения признака заданы в виде интервала. В интервальных рядах признак может меняться непрерывно от min до max значения, причем отличаться друг от друга на сколь угодно малую величину. Интервальный ряд применяется в тех случаях, если значения признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов () достаточно велико. Правило построения рядов распределения, выбор количества групп и величины интервалов такое же, как и при группировке. На основе групповых итоговых строк «Всего» табл. 3.2.6. формируется таблица 3.3.3., представляющая интервальный ряд распределения банков по объему кредитных вложений. Таблица 3.3.3. Распределение банков по объему кредитных вложений Номер группы Группы банков по объему кредитных вложений, млн. руб., Число банков, П О Д Л Е Ж А Щ Е Е СКАЗУЕМОЕ 1 375,00 - 459,00 4 2 459,00 - 543,00 5 3 543,00 - 627,00 11 4 627,00 - 711,00 7 5 711,00 - 795,00 3 Итого 30 Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё характеристики ряда, приведенные в графах табл. 3.3.4.: 1. Кумулятивные частоты групп в относительном выражении, накопленные (кумулятивные) частоты получаемые путем последовательного суммирования частот всех предшествующих (i-1) интервалов. 2. накопленные частости, рассчитываемые по формуле . (гр. 6 табл. 3.3.4.) Построим ряд распределения для сквозной задачи по признаку «Величина кредитных вложений» Ряд распределения банков по величине кредитных вложений Таблица 3.3.4. № группы Группа банков по величине кредитных вложений, млн. руб. Число банков, Накоплен-ная Накоплен-ная частость, % в абсолют-ном выраже-нии в % частота 1 2 3 4 5 6 1 375,00 - 459,00 4 13,3 4 13,3 2 459,00 - 543,00 5 16,7 4+5=9 13,3+16,7= 30,00 3 543,00 - 627,00 11 36,7 20 66,7 4 627,00 - 711,00 7 23,3 27 90,00 5 711,00 - 795,00 3 10,00 30 100,00 Итого 30 100,00 Аналогично рассчитывается и частость, в т.ч. и накопленная Сумма частот составляет объём ряда распределения (или объём статистической совокупности – суть одно и то же). , (3.3.1) В нашем случае где: i – порядковый номер группы в ряду распределения; k – число групп в ряду распределения. Объём признака для вариационного ряда распределения будет определяться как Ряд распределения может быть дополнен частостями (w) – частотами, выраженными в виде относительных величин структуры – коэффициентах (долях единицы) или процентах. Сумма частостей равна 1 (или 100%): (3.3.2.) Вывод. Анализ интервального ряда распределения изучаемой совокупности банков показывает, что распределение банков по объему кредитных вложений не является равномерным: преобладают банки с объемом кредитных вложений от 543 млн. руб. до 627 млн. руб. (это 11 банков, доля которых составляет 36,7%); 30% банков имеют кредитные вложения менее 543,0 млн. руб., а 90% – менее 711 млн. руб. Статистические ряды распределения позволяют систематизировать и обобщать статистический материал. Однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных. (см. выше.) 3.4. ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ Статистические таблицы – своего рода статистическое предложение, которое состоит из статистического подлежащего и статистического сказуемого. Статистические таблицы - это наиболее рациональная форма представления результатов статистической сводки и группировки. По внешнему виду статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали - графы (столбцы, колонки), которые в совокупности составляют скелет таблицы. Таблица, состоящая из строк и граф, которые еще не заполнены цифрами, называется макетом таблицы. Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы - это объект изучения, оно показывает, о чем идет речь в таблице, обычно располагается слева и представляет собой название содержания строк. Сказуемое таблицы - это система показателей, которыми характеризуется объект изучения, располагается сверху таблицы и представляет собой название граф, т.е. показывает, какими признаками характеризуется объект исследования. В таблице могут быть подведены итоги по графам и строкам. Правила построения статистических таблиц: 1. таблица должна иметь общий заголовок, в котором выражается: - объект изучения, - признаки, его характеризующие; - время и место, к которому относится статистический материал; - единицы измерения, если они общие для всей таблицы. 2.Число признаков в сказуемом должно быть ограниченным; 3. Округление чисел должно проводится с одинаковой степенью точности, в статистике принята точность до 0,001; при отражении относительных показателей – например, процентов, до 0,1; (у нас в курсовой), максимальная точность – до 0,0001 Нельзя писать в таблице: 15,016 16,2 17 или 15,016 16,200 17,000 или 15,02 16,20 17,00 или 15,0 16,0 17,0 или 15 16 17 4.отсутствие данных может быть обусловлено различными причинами и это по-разному должно отражаться в таблицах: а) если данный признак вообще не подлежит заполнению, то ставится знак (перекрест) Х; б) если сведения отсутствуют - …; в) если отсутствует какое-либо явление - ----; г) для отражения очень малых чисел пишут 0,00..; 1,97E-12 формат в Excel обозначение Е = 10, то: 1,97*10-12 или 0,00… 5. Если данные в таблице заимствованы из каких-либо источников, то источник указывается в конце таблицы под чертой: Источник: Обязательная часть таблицы - заголовок, показывающий, о чем идет речь в таблице, к какому месту и времени она относится. Название таблицы Наименование Наименование сказуемого подлежащего Заголовки сказуемого А 1 2 3 4 Боковые заголовки подлежащего Г р а ф ы Рис 3.4.1. Макет таблицы. В зависимости от построения подлежащего, таблицы делятся на три вида: простые, групповые и комбинационные. 1. Простыми таблицами называются такие, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных районов (территориальные таблицы) или периодов времени (хронологические таблицы). Пример простой таблицы Таблица 3.4.1. Группы предприятий по формам собственности № п/п Группы предприятий по формам собственности (описательные значения) Число предприятий, тыс. ед. В % 1 Государственная собственность 151,0 4,5 2 Муниципальная собственность 217,0 6,5 3 Частная собственность 2510,0 75,0 4 Собственность общественных и религиозных организаций и объединений 223,0 6,6 5 Прочие формы собственности 247,0 7,4 ИТОГО: 3348,0 100,0 2. Групповые статистические таблицы – в них подлежащее содержит группировку, а сказуемое – задает признаки, которыми характеризуются группы. Они более информативны, чем простые, т.к. благодаря образованным в их подлежащем группам по существенному признаку возможно выявить связи между рядом показателей. Таблица 3.4.2. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вложений, млн.руб. Число банков, f Прибыль банка, млн. руб. Всего В среднем по группе на 1 банк 1 2 4 5 гр.6=гр.5:гр.4 1 375,00 - 459,00 ИЛИ (до 459,00) 4 684,000 684/4= 171,000 2 459,00 - 543,00 5 1002,000 200,400 3 543,00 - 627,00 11 2508,000 228,000 4 627,00 - 711,00 7 1772,000 253,143 5 711,00 - 795,00 ИЛИ (свыше 711,00) 3 884,000 294,667 итого 30 6850,00 228,333 3. Комбинационные таблицы - подлежащее содержит группировку единиц совокупности по двум или более признакам, взятым в сочетании. Графическое представление статистических данных Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра (1731 — 1798). В своих работах он впервые применил способы графического изображения статистических данных (линейные, столбиковые, секторные и другие диаграммы). Статистический график - представляет собой чертеж, на котором при помощи условных геометрических фигур изображаются статистические данные, в результате этого достигается наглядная характеристика изучаемой статистической совокупности. Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой. В статистическом графике различают следующие основные элементы: • поле графика; • графический образ; • пространственные и масштабные ориентиры; • экспликация графика. Полем графика является место, на котором он выполняется. Это листы бумаги, географические карты, план местности и т.п. Поле графика характеризуется его форматом (размерами и пропорциями сторон). Размер поля графика зависит от его назначения. Графический образ — это символические знаки, с помощью которых изображаются статистические данные (линии, точки, прямоугольники, квадраты, круги и т.д.). В качестве графического образа выступают и объемные фигуры. Иногда в графиках используются негеометрические фигуры в виде силуэтов или рисунков предметов. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями и делят поле графика на части, соответствующие значениям изучаемых показателей. Масштабные ориентиры статистического графика придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал. Масштаб графика — это мера перевода численной величины в графическую (например, 1 см соответствует 100 тыс. руб.). При этом чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб. Масштабной шкалой является линия, отдельные точки которой читаются как определенные числа. Шкала, по которой отсчитываются уровни изучаемых показателей, как правило, начинается с 0. Последнее число, наносимое на шкалу, несколько превышает максимальный уровень, отсчет которого проводится по этой шкале. При построении графика допускается разрыв масштабной шкалы. Этот прием используется для изображения статистических данных, имеющих значения лишь в определенных значениях. Экспликация графика — это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа. Заголовок графика в краткой и четкой форме поясняет основное содержание изображаемых данных. Помимо заголовка, на графике дается текст, делающий возможным чтение графика. Цифровые обозначения шкалы дополняются указанием единиц измерения. Рассмотрим наиболее часто встречающиеся графики. Полигон распределения частот На основе данных табл. 3.4.3. построим полигон частот Таблица 3.4.3. Распределение размеров обуви у респондентов опроса № размера Число респондентов, чел. 41 10 42 20 43 40 44 60 45 50 46 20 Итого: 200 Полигон – используется для дискретных рядов распределения. В декартовой системе координат по оси абсцисс откладываются варианты (), по оси ординат – частоты (), полученные на пересечении точки соединяются прямыми линиями, в результате образуется ломаная линия, называемая полигоном частот. В нашей курсовой работе интервальный ряд, полигон НЕ СТРОИТСЯ!!! Гистограммы Для изображения интервального ряда распределения используется гистограмма. При ее построении на оси абсцисс откладываются величины интервалов (), а частоты () изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбцов должна быть пропорциональна частотам (). В результате получается график, на котором ряд распределения изображается в виде смежных друг с другом столбиков. В гистограмме не должно быть разрывов между столбцами. Построим на основе таблицы 3.3.3. Распределение банков по объему кредитных вложений гистограмму распределения банков по величине кредитных вложений. Excel – 4 шага к диаграмме. Таблица 3.3.3. Распределение банков по объему кредитных вложений Номер группы Группы банков по объему кредитных вложений, млн. руб., Число банков, П О Д Л Е Ж А Щ Е Е СКАЗУЕМОЕ 1 375,00 - 459,00 4 2 459,00 - 543,00 5 3 543,00 - 627,00 11 4 627,00 - 711,00 7 5 711,00 - 795,00 3 Итого 30 Кумулята Для изображения рядов распределения используется кумулятивная кривая (кривая сумм). При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда (), а по оси ординат – накопленные частоты (), которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную S-образную кривую линию, т.е. кумуляту или кривую сумм. На примере таблицы 3.3.4. построим кумуляту распределения банков по величине признака «кредитные вложения». Ряд распределения банков по величине кредитных вложений Таблица 3.3.4. № группы Группа банков по величине кредитных вложений, млн. руб. Число банков, Накоплен-ная Накоплен-ная частость, % в абсолют-ном выраже-нии в % частота 1 2 3 4 5 6 1 375,00 - 459,00 4 13,3 4 13,3 2 459,00 - 543,00 5 16,7 4+5=9 13,3+16,7= 30,00 3 543,00 - 627,00 11 36,7 20 66,7 4 627,00 - 711,00 7 23,3 27 90,00 5 711,00 - 795,00 3 10,00 30 100,00 Итого 30 100,00 Для студентов для построения кумуляты в верхних границах интервалов построить график со значениями абсцисс и ординат: 375 0 459 4 543 9 627 20 711 27 795 30 ТЕМА 4. СРЕДНИЕ ВЕЛИЧИНЫ 4.1. Сущность средних величин. Две формы средних величин. 4.2. Средняя арифметическая и средняя гармоническая, примеры их расчета. 4.3. Средняя гармоническая величина. 4.4. Структурные средние величины. 4.1. Сущность средних величин. Две формы средних величин. Средняя величина – показатель, который дает обобщающую характеристику варьирующего признака однородной совокупности. Свойства средней величины: 1. Средняя характеризует всю совокупность в целом, а не отдельные ее величины, т.е. она отражает то общее, что присуще всем единицам статистической совокупности. 2. Средняя величина отражает типичный уровень признака и абстрагируется от индивидуальных особенностей, присущих отдельным единицам. 3. В средней величине поглощаются все случайности. Типичность средней непосредственно связана с однородностью совокупности. Чем более однородна совокупность, тем более надежной величиной является ее средняя величина. Если совокупность не однородна, то используют метод группировок и в каждой выделенной группе вычисляют среднюю величину. Таким образом, групповые средние дополняют общую среднюю величину. Определить среднюю во многих случаях можно через исходное соотношение средней (ИСС) или ее логическую формулу: Общая формула степенной средней простой: (4.1.1.) (для несгруппированных данных) Общая формула степенной средней взвешенной: (для сгруппированных данных) (4.1.2.) В зависимости от экономического содержания определенного показателя и исходных данных в статистике наиболее часто применяются средние величины: Виды степенных средних Формула Условия применения Средняя арифметическая простая показатель степени z=1 Исходные данные не упорядочены, простой перечень единиц совокупности fI = 1 Средняя арифметическая взвешенная показатель степени z=1 Исходные данные заданы дискретным или интервальным рядом распределения fi ≠ 1 Средняя гармоническая: простая (невзвешенная) показатель степени z = -1 Исходные данные заданы обратными значениями признака Средняя гармоническая: взвешенная показатель степени z =-1 сложный вес; Исходные данные заданы значениями осредняемого признака хi и объемом осредняемого признака Mi : Mi = хifi Средняя квадратическая: простая (невзвешенная) показатель степени z =2 Используется для расчета среднего квадратического отклонения σ, если данные не упорядочены Средняя квадратическая взвешенная показатель степени z =2 Используется для расчета среднего квадратического отклонения σ, если данные упорядочены Средняя геометрическая: простая (невзвешенная) показатель степени z =0 Используются для расчета средних темпов роста, если данные заданы цепным темпами роста Средняя геометрическая взвешенная показатель степени z =0 Значения признака заданы моментным рядом динамики с равноотстоящими датами Правило мажорантности (старшинства) средних величин: степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные значения: чем больше показатель степени "", тем больше величина соответствующей средней. (4.1.3.) Для иллюстрации мажорантности рассмотрим пример. Студент ВУЗа получил в течение семестра всего две оценки: "3" и "2". Требуется рассчитать степенные средние всех видов и с их помощью проверить действие правила мажорантности. 1) (балла) 2) (балла) 3) (балла) 4) (балла) 2,55 > 2,50 > 2,45 > 2,41 4.2. средняя арифметическая и средняя гармоническая, примеры их расчета (4.2.1) средняя арифметическая простая (4.2.2) средняя арифметическая взвешенная Важнейшие свойства средней арифметической: 1. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю (так называемое "нулевое" свойство). – для несгруппированных данных; (4.2.3.) – для вариационного ряда распределения (4.2.4.) 2. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное (так называемое "минимальное" свойство). – для несгруппированных данных; (4.2.5.) – для вариационного ряда распределения (4.2.6.) 3. Если все варианты ряда распределения увеличить или уменьшить на одну и ту же величину или в одно и тоже число раз, то средняя увеличится или уменьшится на ту же величину, или в тоже число раз. "Нулевое" и "минимальное" свойства средней арифметической применяются: • для проверки правильности расчёта среднего уровня признака; • при изучении закономерностей изменения уровней ряда динамики; • для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками. Пример расчета средней арифметической простой На основании данных нашей сквозной задачи (табл. 0 и табл.3.2.4.) рассчитаем среднюю арифметическую величину кредитных вложений по 30 банкам одного из регионов РФ. (4.2.1) Вывод. Анализ полученных значений показателя говорит о том, что средний объем кредитных вложений банков составляет 589,3 млн. руб. Пример расчета средней арифметической взвешенной На основании данных ряда распределения банков по величине кредитных вложений (табл. 3.3.4.) рассчитаем среднюю арифметическую величину кредитных вложений по 30 банкам одного из регионов РФ. Табл.4.2.1. Расчетная таблица для расчета средней арифметической взвешенной величины объема кредитных вложений Группы банков по объему кредитных вложений, (варианта х), млн. руб. Серединное значение интервалов, Число банков, (веса) fj Произведение вариант на частоты 1 2 3 гр.4=гр.2*гр.3 375,00 - 459,00 417 4 1668 459,00 - 543,00 501 5 2505 543,00 - 627,00 585 11 6435 627,00 - 711,00 669 7 4683 711,00 - 795,00 753 3 2259 Итого 30 17550 Формула 4.2.2. Причина расхождения средних величин, рассчитанных по формулам 4.2.1. и 4.2.2., заключается в том, что по формуле 4.2.1. средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле 4.2.2. средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы). 4.3. Средняя гармоническая. Средняя гармоническая используется в случаях, когда статистическая информация НЕ СОДЕРЖИТ ЧАСТОТ f по отдельным вариантам, а содержит произведение вариантов на частоты. т.е. содержит величины xf=M. таблица 4.3.1. Данные об успеваемости студентов по дисциплине «Статистика» группы 351 за 1 семестр 2009/2010 уч. г. финансово-кредитного факультета ВЗФЭИ Балл студентов, чел. (варианта X) Сумма баллов, М=х*f Число студентов, чел. 3 18 6 4 40 10 5 20 4 Итого: 78 20 Расчет средней гармонической: =(балла) (4.3.1.) Пример. Две автомашины проделали равный путь с разной скоростью: первая машина со скоростью 90 км/час, вторая машина – со скоростью – 110 км/час. Рассчитать среднюю скорость автомобилей. Решение: на первый взгляд средняя скорость равна: , однако исходя из законов физики среднюю скорость необходимо рассчитать по формуле средней гармонической: объем ссуды, млн.руб. Ставка,% годовых 150000 12 20000 18 4.4. Структурные средние (Мода, Медиана) Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку. Мода (Мо) для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. Пример нахождения Моды в дискретном ряду распределения Таблица 4.4.1. Распределение рабочих N–го цеха по разрядам Тарифный разряд () Число рабочих, чел. 1-й 10 2-й 20 3-й 40 4-й 60 5-й 50 6-й 20 Итого: 200 Мо=4, т.к. частота является наиболее часто встречающейся в этой совокупности. Если в дискретном ряду все варианты встречаются одинаково часто, то в этом случае Мода отсутствует. Могут быть распределения, где не один, а два (или более) варианта имеют наибольшие частоты. Тогда ряд имеет две (или более) моды, распределение является бимодальным (или многомодальным),что указывает на качественную неоднородность совокупности по изучаемому признаку. Конкретное значение моды для интервального ряда рассчитывается по формуле: (4.4.1.) где хМo – нижняя граница модального интервала, h –величина модального интервала, fMo – частота модального интервала, fMo-1 – частота интервала, предшествующего модальному, fMo+1 – частота интервала, следующего за модальным. Таблица 4.4.2. Распределение банков по объему кредитных вложений Номер группы Группы банков по объему кредитных вложений, млн руб., х Число банков, f 1 375,00 - 459,00 4 2 459,00 - 543,00 5 fMo-1 3 хМo 543,00 - 627,00 11 fMo 4 627,00 - 711,00 7 fMo+1 5 711,00 - 795,00 3 Итого 30 Согласно табл.3.3.3. модальным интервалом построенного ряда является интервал 543,0 – 627,0 млн. руб., так как его частота максимальна (f3 = 11). Расчет моды по формуле (4.4.1): Вывод. Для рассматриваемой совокупности банков наиболее распространенный объем кредитных вложений характеризуется средней величиной 593,400 млн. руб. В интервальном ряду моду можно найти графически по гистограмме распределения. Для этого выбирают самый высокий прямоугольник. Затем правую вершину модального прямоугольника, соединим с правым верхним углом предмодального прямоугольника, а левую вершину модального прямоугольника с левым верхним углом послемодального прямоугольника, из точки пересечения опустим перпендикуляр на ось абсцисс, абсцисса точки пересечения и будет модой распределения Рис. 4.4.1. Определение моды графическим методом Медиана (Ме) – это значение признака, приходящееся на середину ранжированного ряда, по обе стороны от медианы находится одинаковое количество единиц совокупности. Главное свойство Медианы: (4.4.2.) Сумма абсолютных отклонений вариантов от Медианы меньше, чем от любой другой величины. Кумулята строится по накопленным частотам (табл. 3.3.4., графа 5 или 6) Ряд распределения № группы Группа банков по величине кредитных вложений, млн. руб. Число банков, Накопленная Накоплен-ная Частость, % в абсолютном выражении в % частота 1 2 3 4 5 6 1 375,00 - 459,00 4 13,3 4<15 13,3 2 459,00 - 543,00 5 16,7 SMе-1 9<15 30,0 3 хМе 543,00 - 627,00 fМе 11 36,7 20>15 66,6 4 627,00 - 711,00 7 23,3 27 90,0 5 711,00 - 795,00 3 10,00 30 100,00 Итого 30 100,00 Конкретное значение медианы для интервального ряда рассчитывается по формуле: , (4.4.3.) где хМе– нижняя граница медианного интервала, h – величина медианного интервала, – сумма всех частот, fМе – частота медианного интервала, SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному. Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 3.3.4 (графа 5 или 6). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины). В сквозной задаче медианным интервалом является интервал 543,0 – 627,0 млн. руб., так как именно в этом интервале накопленная частота S3 = 20 впервые превышает величину, равную половине численности единиц совокупности (=) банков Расчет значения медианы по формуле (4.4.3): млн. руб. Вывод. В рассматриваемой совокупности банков половина банков имеют в среднем объем кредитных вложений не более 588,818 млн. руб., а другая половина – не менее 588,818 млн. руб. Графически Медиану определяют следующим образом: из точки на шкале накопленных частот (частостей), соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является Медианой. Рис. 4.4.1. Определение медианы графическим методом Me Mo 375,0 585,0 588,818 593,400 795,0 Тема 5 Статистическое изучение вариации 5.1.Понятие вариации. Основные показатели вариации 5.2. Правило сложения дисперсий и его применение. 5.3. Характеристика формы распределения. (САМОСТОЯТЕЛЬНО!) 5.1. Понятие вариации. Основные показатели вариации Вариация – это различия в индивидуальных значениях признака у единиц изучаемой совокупности. Необходимость изучения вариации связана с тем, что средняя величина с разной степенью точности определяет типичный уровень ряда, а именно, чем меньше различия между вариантами ряда, тем однороднее совокупность, и значит, точнее и надежнее средняя величина. Если же различия между вариантами велики, то средняя может оказаться ненадежной, нетипичной характеристикой. Это говорит о необходимости оценивать различия между вариантами, т.е. колеблемость (вариацию) признака необходимо измерять. Пример двух рядов распределения Таблица 5.1.1. Данные о прибыли двух предприятий одной из отраслей промышленности за 2007-2009 гг., млн. руб. № предприятия Прибыль 2007 г. Прибыль 2008 г. Прибыль 2009 г. Предприятие 1 95 100 105 Предприятие 2 75 100 125 Как видно из таблицы, и у предприятия №1 и №2 среднегодовая прибыль составила 100 млн. руб. Однако в первом случае размах вариации прибыли составил 10 млн. руб. (105-95), а во втором случае – 50 млн. руб. (125-75) Следовательно, вариацию (колеблемость) средней величины необходимо изучать. Схема 5.1.1. Показатели вариации 1. Размах вариации (R) (амплитуда колебаний) – устанавливает предельное значение амплитуды колебаний признака. Размах вариации определяется как разность между максимальным и минимальным значениями признака в изучаемой совокупности, то есть это абсолютное отклонение. Имеет размерность изучаемого признака. (5.1.1.) Для сквозной задачи: Однако крайние значения признака могут быть аномальными для данной совокупности, обусловленными какими-то случайными обстоятельствами. Тогда размах вариации будет служить характеристикой только этих двух аномальных единиц совокупности. В этом случае, с целью дальнейшего изучения вариации единиц совокупности, аномальные единицы следует убрать из совокупности. 2. Среднее линейное отклонение () – средний модуль отклонения вариантов признака от средней арифметической величины признака. Сохраняет размерность изучаемого признака. Для расчета используется формула средней арифметической простой: – для несгруппированных данных (5.1.2.) и взвешенной: – для вариационного ряда распределения (5.1.3.) 3. Дисперсия (σ2) – средний квадрат отклонений вариантов признака от средней арифметической величины признака. Размерность для дисперсии не указывается, т.к. дисперсия – промежуточный показатель, рассчитываемый для определения среднего квадратического отклонения (σ). Дисперсию используют также и как самостоятельный показатель вариации, характеризующий меру вариации в очень однородных совокупностях – с незначительной колеблемостью. – для несгруппированных данных (5.1.4.) – для вариационного ряда распределения (5.1.5.) Упрощенные формулы для расчета дисперсии дисперсия равна среднему квадрату значений признака минус квадрат среднего значения признака. (5.1.6.) Или (5.1.7.) (5.1.8.) Среднее квадратическое отклонение и дисперсия (σ и σ2) – наиболее часто применяемые показатели вариации, так как они входят в большинство теорем теории вероятностей, служащей фундаментом математической статистики. Используя математические свойства дисперсии, расчётные формулы дисперсий можно привести к упрощённому виду. 4. Среднее квадратическое отклонение (σ) – корень из среднего квадрата отклонений вариантов признака от средней арифметической величины признака. Сохраняет размерность изучаемого признака. Это среднее отклонение от средней величины признака Для расчета σ используется формула средней квадратической простой: – для несгруппированных данных (5.1.9.) и взвешенной: – для вариационного ряда распределения (5.1.10.) По свойствам мажорантности средних величин среднее квадратическое отклонение всегда больше среднего линейного отклонения. Относительные показатели вариации 1. Коэффициент вариации (Vσ) – относительный показатель вариации, который определяется как отношение среднего квадратического отклонения и арифметической средней изучаемого показателя. (5.1.11.) Коэффициент вариации, как правило, рассчитывается в процентах и используется для оценки степени вариации признака. принята следующая шкала оценки колеблемости признака: Таблица 5.1.2. Шкала оценки колеблемости признака Значение коэффициента вариации, % Степень колеблемости признака 0-40 колеблемость незначительная 40-60 колеблемость умеренная более 60 колеблемость значительная Совокупность считается качественно однородной, если коэффициент вариации не превышает 0,33 (или 33%), и средняя величина исследуемого признака может считаться типичной, надёжной характеристикой статистической совокупности Таблица 5.1.3. Шкала оценки однородности совокупности Значение коэффициента вариации, % степень однородности совокупности 0-33 совокупность однородная более 33 совокупность неоднородная . Если же коэффициент вариации больше 0,33 (или 33%) то, следовательно, вариация исследуемого признака велика, и найденная средняя плохо представляет всю статистическую совокупность, не является её типичной, надёжной характеристикой, а сама совокупность является неоднородной по рассматриваемому признаку. Аналогично коэффициенту вариации рассчитывают другие относительные показатели вариации, которые в практике статистики применяются реже: 2. Показатель осцилляции: ; (5.1.12.) 3. Линейный коэффициент вариации: . (5.1.13) Рассчитаем показатели вариации для сквозной задачи: Таблица 5.1.4. Расчетная таблица для нахождения характеристик ряда распределения Группы банков по объему кредитных вложений, млн. руб. X Середина интервала Число банков, Произведение вариантов на частоты 1 2 3 гр.4= гр.2*гр.3 5 гр.6= гр.5*гр.5 гр.7= гр.6*гр.3 375,00 - 459,00 =417 4 417*4= 1668 417-585= -168 = 8224 8224*4= 112896 459,00 - 543,00 501 5 2505 -84 7056 35280 543,00 - 627,00 585 11 6435 627,00 - 711,00 669 7 4683 84 7056 49392 711,00 - 795,00 753 3 2259 168 28224 84672 Итого 30 17550 Х х 282240 Расчет средней арифметической взвешенной: Расчет среднего квадратического отклонения: Расчет дисперсии: σ2 =96,9952= 9408,030 (безразмерна!!!) Расчет коэффициента вариации: Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем кредитных вложений банков составляет 585 млн. руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 96,995 млн. руб. (или 16,6%), наиболее характерные значения объема кредитных вложений находятся в пределах от 488,005 млн. руб. до 681,995 млн. руб. (диапазон ).(см. табл. 3.2.5 -20 банков или 66,7% входят в этот интервал). Значение Vσ = 16,6% не превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно (=585 млн. руб., Мо=593,40 млн. руб., Ме=588,818 млн. руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема кредитных вложений банков (585 млн. руб.) является типичной, надежной характеристикой исследуемой совокупности банков. 5.2.Правило сложения дисперсий и его применение Для описания влияния одних факторов на другие статистика использует специальные коэффициенты, которые можно получить на основании правила сложения дисперсий. Существует три вида дисперсий Схема 5.2.1. Виды дисперсий Общая дисперсия характеризует вариацию результативного признака Х, сложившуюся под влиянием всех действующих на результативный признак Y факторов (систематических и случайных). Для нашей задачи: общая дисперсия отражает вариацию прибыли под влиянием и 1)объема кредитных вложений (наш факторный признак - х); и 2)прочих, неучтенных факторов. Этот показатель вычисляется по формуле , (5.2.1.) где yi – индивидуальные значения результативного признака; – общая средняя значений результативного признака; n – число единиц совокупности. Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности: (5.2.2.) или как средняя взвешенная по частоте групп интервального ряда: (5.2.3.) Для вычисления удобно использовать формулу (5.2.2.), т.к. в табл. 3.2.3. (графы 6 и 3 итоговой строки) имеются значения числителя и знаменателя формулы. Таблица 5.2.1. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вложений, млн.руб. Число банков, f Прибыль банка, млн. руб. Всего В среднем по группе на 1 банк 1 2 3 4 гр.5=гр.4:гр.3 1 375,00 - 459,00 4 684,000 684/4= 171,000 2 459,00 - 543,00 5 1002,000 200,400 3 543,00 - 627,00 11 2508,000 228,000 4 627,00 - 711,00 7 1772,000 253,143 5 711,00 - 795,00 3 884,000 294,667 итого 30 6850,00 228,333 Расчет по формуле (5.2.3): Для расчета общей дисперсии применяется вспомогательная таблица 5.2.1. Таблица 5.2.2. Вспомогательная таблица для расчета общей дисперсии Номер банка п/п Прибыль, млн. руб. 1 2 гр.3=гр.2-228.333 гр.4=гр.3*гр.3 1 256 256-228,333= 27,667 27,6672= 765,463 2 168 -60,333 3640,071 3 252 23,667 560,127 4 221 -7,333 53,773 5 210 -18,333 336,099 6 278 49,667 2466,811 7 214 -14,333 205,435 8 169 -59,333 3520,405 9 288 59,667 3560,151 10 213 -15,333 235,101 11 150 -78,333 6136,059 12 208 -20,333 413,431 13 218 -10,333 106,771 14 227 -1,333 1,777 15 238 9,667 93,451 16 254 25,667 658,795 17 251 22,667 513,793 18 293 64,667 4181,821 19 158 -70,333 4946,731 20 195 -33,333 1111,089 21 237 8,667 75,117 22 239 10,667 113,785 23 191 -37,333 1393,753 24 236 7,667 58,783 25 215 -13,333 177,769 26 303 74,667 5575,161 27 228 -0,333 0,111 28 230 1,667 2,779 29 265 36,667 1344,469 30 245 16,667 277,789 Итого: 6850 0,01 42526,667 Расчет общей дисперсии по формуле (5.2.1.): (безразмерна!!!) Межгрупповая дисперсия измеряет систематическую вариацию результативного признака (У), (Прибыли банка), обусловленную влиянием только признака-фактора Х (Объем кредитных вложений) (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Для нашей задачи: межгрупповая дисперсия отражает вариацию прибыли под влиянием только: 1)объема кредитных вложений (наш факторный признак - х); Показатель вычисляется по формуле , (5.2.5.) где –групповые средние, – общая средняя, –число единиц в j-ой группе, k – число групп. Для расчета межгрупповой дисперсии строится вспомогательная таблица 5.2.2. При этом используются групповые средние значения из табл. 5.2.3. (графа 7). Таблица 5.2.3. Вспомогательная таблица для расчета межгрупповой дисперсии Группы банков по размеру кредитных вложений, млн. руб. Число банков, Прибыль банков всего, млн. руб. Средняя прибыль банков по группе, млн. Руб. 1 2 3 4 гр.5=гр.4-228,333 гр6= гр5*гр5 гр7= гр6*гр2 375,00 - 459,00 4 684 171,000 171,0-228,333= -57,333 3287,073 3287,107*4= 13148,292 459,00 - 543,00 5 1002 200,400 -27,933 780,252 3901,260 543,00 - 627,00 11 2508 228,000 -0,333 0,111 1,221 627,00 - 711,00 7 1772 253,143 24,810 615,536 4308,752 711,00 - 795,00 3 884 294,667 66,333 4400,200 13200,600 итого 30 6850 228,333 34560,125 Расчет межгрупповой дисперсии по формуле (5.2.5.): Исходя из правила сложений дисперсий вычисляются показатели, оценивающие силу и тесноту связи между факторным и результативным признаком Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Для нашей задачи: насколько вариация прибыли (y) объясняется вариацией кредитных вложений (х) Показатель (этта квадрат) рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле , (5.2.6.) где – общая дисперсия признака Y, – межгрупповая (факторная) дисперсия признака Y. Значения эмпирического коэффициента детерминации изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.Чем ближе его значение к 1, тем связь теснее. Расчет эмпирического коэффициента детерминации по формуле (5.2.6.): или 81,3% Вывод. 81,3% вариации суммы прибыли банков обусловлено вариацией объема кредитных вложений, а 18,7% – влиянием прочих, неучтенных в данном исследовании факторов. Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаком Для нашей задачи: теснота связи между объемом кредитных вложений и суммой прибыли банков Эмпирическое корреляционное отношение (этта) вычисляется по формуле (5.2.7.) Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чеддока (табл. 14): Таблица 5.2.4. Шкала Чеддока  0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99 Характеристика силы связи Слабая Умеренная Заметная Тесная Весьма тесная Расчет эмпирического корреляционного отношения по формуле (5.2.7.): или 90,2% Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является весьма тесной. Правило сложения дисперсий: Правило сложения дисперсий: общая дисперсия признака (σ2) равна сумме межгрупповой дисперсии (δ2) и средней из внутригрупповых дисперсий () σ2 = δ2 + (5.2.8.) Правило сложения дисперсий имеет практическое значение при определении одной из дисперсий, если известны две другие. Например, зная общую и межгрупповую (факторную) дисперсии, можно определить среднюю дисперсию из внутригрупповых, характеризующую влияние неучтённых факторов. Рассчитаем внутригрупповую дисперсию и среднюю из внутригрупповых для сквозной задачи: Внутригрупповые дисперсии () характеризуют вариацию результативного признака под влиянием прочих, неучтенных факторов, рассчитываются для отдельных групп. Для нашей задачи: средняя из внутригрупповых дисперсий отражает вариацию прибыли под влиянием 1)прочих, неучтенных факторов. (5.2.9.) Средняя из внутригрупповых дисперсий (): (5.2.10.) 3. Расчёт внутригрупповых дисперсий () и средней из них (). (5.2.11) Для расчета внутригрупповой дисперсии составим вспомогательную таблицу: Таблица 5.2.5. Вспомогательная таблица для расчета внутригрупповой дисперсии Номер группы Группы банков по величине кредитных вложений, млн. руб. Число банков, f Прибыль банков, млн. руб. Значения прибыли банков в группе Всего по группе В среднем по группе на 1 банк 1 2 3 4 5 6=5:3 1 375,00 - 459,00 4 150,158, 168,208 684,000 171,000 2 459,00 - 543,00 5 195,213, 215,169, 210 1002,000 200,400 3 543,00 - 627,00 11 221,218, 191,214,230,239,236,237,256,228,238 2508,00 228,000 4 627,00 - 711,00 7 265,227,254,252,245,251,278 1772,00 253,143 5 711,00 - 795,00 3 288,293,303 884,00 294,667 итого 30 6850,00 228,333 Средняя из внутригрупповых дисперсий : Проверим правило сложения дисперсий: общая дисперсия признака (σ2) равна сумме межгрупповой дисперсии (δ2) и средней из внутригрупповых дисперсий () σ2 = δ2 + 1417,708=1152,019+265,6 5.3.Характеристика формы распределения См. Метод. Указания к лаб. Работе №2 стр. 30-33 Форма распределения признака в вариационных рядах распределения отражает закономерность изменения частот с ростом значений варьируемого признака. Приблизительное представление о форме распределения дают графики распределения: полигон и гистограмма. Обобщающие характеристики формы распределения получают, используя кривые распределения. Кривые распределения бывают эмпирические и теоретические. Эмпирическая кривая распределения – это фактическая кривая распределения, построенная по данным наблюдения, которая отражает как общие, так и случайные условия, определяющие распределение признака. Теоретическая кривая распределения – это кривая распределения, выражающая функциональную связь между варьирующим признаком и частотами. Анализировать эмпирическую кривую, на изменение которой повлияли в том числе и случайные условия, – довольно трудно. Поэтому исследователи переходят к теоретической кривой распределения, по характеру распределения наиболее приближённой к первой. Теоретическая кривая признана отражать основную закономерность распределения признака при полном погашении случайных причин. При выравнивании (аппроксимации) эмпирических вариационных рядов перед исследователем стоят три задачи: 1. Выяснение общего характера распределения. 2. Непосредственное выравнивание эмпирического распределения – замена эмпирической кривой на теоретическую. 3. Проверка соответствия найденного теоретического распределения эмпирическому. Если мы посмотрим на характер изменения частот при изменении варьирующего признака в наших вариационных рядах распределения банков по величине кредитных вложений и по прибыли, то мы можем увидеть определённую закономерность. При росте варьирующего признака в наших вариационных рядах частоты сначала растут, затем, достигнув максимального значения, начинают снижаться. Такое распределение характерно для нормального распределения. Поэтому в качестве идеального распределения в наших случаях мы можем взять нормальное распределение. Кривая нормального распределения будет для нас теоретической кривой. Кривая нормального распределения является наиболее распространённая формой распределения, по которой выравнивают эмпирическую кривую. Кривая нормального распределения выражается стандартным уравнением нормальной кривой: , (5.3.1.) где: t = – нормированные отклонения (5.3.2.) а число е ≈ 2,71828 – основание натуральных логарифмов. Особенности кривой нормального распределения: 1. Кривая имеет форму колокола. 2. Так как функция нормального распределения – чётная, то есть f(-t)=f(t), то кривая нормального распределения симметрична относительно максимальной ординаты, равной (при t=0). Абсцисса этой точки является центром распределения: . 3. Ветви кривой, приближаясь к оси абсцисс, уходят в, т.к. функция нормального распределения принимает бесконечно малые значения при t=. 4. Кривая имеет две точки перегиба при , находящиеся на расстоянии от (среднего квадратического отклонения) 5. При =const с увеличением  кривая становится более пологой. При  =const с изменением кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс. 6. В промежутке находится 68,3% всех значений признака. В промежутке находится 95,4% всех значений признака. В промежутке находится 99,7% всех значений признака (правило трёх ). Рис. 5.3.1. Кривая нормального распределения При сопоставлении эмпирической кривой с кривой нормального распределения необходимо проверить эмпирическую кривую на: - симметричность; - наличие одной нормальной вершины (не острой и не плоской). Эмпирические кривые распределения бывают симметричные и асимметричные. Для симметричных распределений частоты двух вариантов, равностоящих в обе стороны от центра, равны между собой. Рассчитанные для симметричных рядов характеристики: =Мо =Ме; ; ; Если эти характеристики нарушены, то это свидетельствует о наличии асимметрии распределения. Асимметричные кривые имеют правостороннюю или левостороннюю асимметрию – в зависимости от того, какая ветвь кривой вытянута (в первом случае – правая, во втором – левая). Для того, чтобы измерить асимметрию, рассчитывают показатели асимметрии. Наиболее известный среди них – структурный коэффициент асимметрии Пирсона: (5.3.3.) Если >0, то асимметрия правосторонняя. В этом случае MoMe>. В симметричных рядах , асимметрия отсутствует Для сквозной задачи: , следовательно ассиметрия левосторонняя. Наиболее точный коэффициент асимметрии – коэффициент, рассчитанный с использованием центрального момента распределения третьего порядка. (5.3.4.) Для симметричного распределения После оценки симметричности ряда распределения, переходят к оценке эксцесса. Эксцесс (в переводе с английского – излишество) – несовпадение вершины эмпирического распределения с вершиной кривой нормального распределения, когда она находится выше или ниже первой. Следует помнить, что симметричные ряды могут иметь не одну вершину, а, например, три или пять, но такое распределение не будет однородным, и его нельзя считать нормальным. Показатели эксцесса рассчитывают только для симметричных распределений, имеющих одну вершину. Сделаем выводы. При нормальном распределении средние показатели наиболее точно отражают характер изучаемого явления. Чем ближе данное распределение к нормальному, тем его средние характеристики становятся достовернее. Тема 6. Метод выборочного наблюдения 6.1.Понятие о выборочном наблюдении и ошибках выборки. 6.2.Способы формирования выборочной совокупности. 6.3.Средняя и предельная ошибки выборки. 6.4.Определение необходимого объема выборки. 6.1.Понятие о выборочном наблюдении и ошибках выборки Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность. Введем новые общепринятые обозначения: Таблица 6.1.1. Обозначения для выборочной совокупности № п/п Характеристики Генеральная совокупность Выборочная совокуп-ность 1. Число единиц N n 2. Средняя величина признака 3. Число единиц, обладающих определенным вариантом или вариантами изучаемого признака M m 4. Генеральная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака Основная задача организации выборочного наблюдения – обеспечить случайность отбора единиц генеральной совокупности в выборку. Схема 6.1.1. Преимущества выборочного наблюдения Цель выборочного наблюдения – определение характеристик генеральной совокупности – генеральной средней () и генеральной доли (). Показатели выборочной совокупности – выборочная средняя () и выборочная доля () отличаются от генеральных характеристик на величину ошибок выборки (см. ниже.) Схема 6.1.2. Классификация ошибок выборочного наблюдения 6.2.Способы формирования выборочной совокупности Схема 6.2.1. Классификация видов выборочного наблюдения 1. Собственно случайная выборка – отбор единиц из генеральной совокупности производится случайным образом. Какие-либо элементы систематизации исключены; 2. Механическая выборка – генеральная совокупность сначала упорядочивается по определенному признаку, и затем из нее выбираются единицы через равные промежутки. Например, через 5, 10, 20 единиц и т.д.; Например, при 1% отборе – каждая100-я единица; при 2% отборе – каждая 50-я единица; при 5% отборе – каждая 20-я единица; при 20% отборе – каждая 5-я единица; 3. Типическая (стратифицированная) выборка – предварительно совокупность разбивается по отдельным группам однотипных элементов, т.е. однородных по некоторому признаку, и затем из каждой группы отбираются единицы пропорционально удельному весу каждой группы. Например, группировка по национальности; 4. Серийная выборка – заключается в случайном выборе не отдельных единиц, а групп единиц одинаковой численности, затем из каждой группы и серии единицы обследуются сплошным способом. 5. Комбинированный способ – используются различные виды выборки. По способу отбора выборка имеет: 1) повторный отбор – попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, затем возвращается в генеральную совокупность и может быть отобрана повторно, т.е. в этом случае численность генеральной совокупности (N) не изменяется; 2) бесповторный отбор – попавшая в выборку единица подвергается обследованию и назад, в генеральную совокупность, не возвращается, т.е. в процедуре отбора более не участвует. Например – игра в лото. В социально-экономических исследованиях чаще всего применяется бесповторный отбор. 6.3 Средняя и предельная ошибки выборки Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε (эпсилон), которую называют ошибкой выборки (ошибкой репрезентативности). Принято вычислять два вида ошибок - среднюю (мю) и предельную (дельта малая ). Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.` Средняя ошибка выборки – это такое расхождение между средними выборочной и генеральной совокупностями , которое не превышает () плюс минус среднее квадратическое отклонение. Средняя ошибка выборки зависит от: 1. Объема выборки – чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки; 2. Степени варьирования признака (чем меньше вариация признака, а следовательно, и дисперсия, тем меньше ошибка выборки, и наоборот) Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле , (6.3.1.) где – общая дисперсия выборочных значений признаков, N – число единиц в генеральной совокупности, n – число единиц в выборочной совокупности. Предельная ошибка выборки - это максимально возможное расхождение выборочной и генеральной средних , т.е. максимум ошибки при заданной вероятности ее появления. -3 -2 - + +2 +3 Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя: , (6.3.2.) где – выборочная средняя, – генеральная средняя. Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности. В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683. В математической статистике доказано, что предельная ошибка выборки Δ кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой (6.3.3.) Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 6.3.1.): Таблица 6.3.1. Таблица функции Лапласа Доверительная вероятность P 0,683 0,866 0,954 0,988 0,997 0,999 Значение t 1,0 1,5 2,0 2,5 3,0 3,5 По результатам выполнения сквозной задачи с вероятностью 0,954 необходимо определить: 1) ошибку выборки средней величины объема кредитных вложений банков и границы, в которых будет находиться генеральная средняя. 2) ошибку выборки доли банков с объемом кредитных вложений 627 млн. руб. и выше, а также границы, в которых будет находиться генеральная доля. 3) необходимый объем выборки при заданной предельной ошибке выборки, равной 10 млн. руб. 1. Определение ошибки выборки для среднего объема кредитных вложений банков и границ, в которых будет находиться генеральная средняя По условию сквозной задачи выборочная совокупность насчитывает 30 банков, выборка 20% механическая, следовательно, генеральная совокупность включает (30*5)= 150 банков. Выборочная средняя , дисперсия определены в теме 5. Значения параметров, необходимых для решения задачи, представлены в табл. 6.3.2.: Таблица 6.3.2. Исходные параметры для расчета средней ошибки выборки Р t n N 0,954 2 30 150 585,000 9408,030 Расчет средней ошибки выборки по формуле (6.3.1.): , Расчет предельной ошибки выборки по формуле (6.3.3.): Определение по формуле (6.3.2.) доверительного интервала для генеральной средней: 585,0-31,678585,0+31,678 553,322 (млн. руб.) 616,678 (млн. руб.) Вывод. На основании проведенного выборочного обследования коммерческих банков региона с вероятностью 0,954 можно утверждать, что для генеральной совокупности банков средний объем кредитных вложений банка находится в пределах от 553,322 млн. руб. до 616,678 млн. руб. Для нашей сквозной задачи определим ошибку выборки для доли банков с объемом кредитных вложений 627 млн. руб. и выше, а также границы, в которых будет находиться генеральная доля Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой , (6.3.4.) где m – число единиц совокупности, обладающих заданным свойством; n – общее число единиц в совокупности. Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле , (6.3.5.) где w – доля единиц совокупности, обладающих заданным свойством; (1-w) – доля единиц совокупности, не обладающих заданным свойством, N – число единиц в генеральной совокупности, n– число единиц в выборочной совокупности. Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством: (6.3.6) По условию Задания 3 исследуемым свойством является равенство или превышение объема кредитных вложений банка величины 627 млн руб. Число банков с заданным свойством определяется из табл. 6.3.3. (графа 3): Распределение банков по объему кредитных вложений Номер группы Группы банков по объему кредитных вложений, млн.руб., х Число банков, f 1 375,00 - 459,00 4 2 459,00 - 543,00 5 3 543,00 - 627,00 11 4 627,00 - 711,00 7 5 711,00 - 795,00 3 Итого 30 m=10 Расчет выборочной доли по формуле (6.3.4.): Расчет по формуле (6.3.5.) предельной ошибки выборки для доли: Определение по формуле (6.3.5.) доверительного интервала генеральной доли: 0,179 0,487 (доли единицы) или 17,9% 48,7% (проценты) Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности банков доля банков с объемом кредитных вложений 627 млн. руб. и выше будет находиться в пределах от 17,9% до 48,7%. 6.4.Определение необходимого объема выборки Определение необходимого объема выборки с заданным значением допустимой предельной ошибки выборки, равной 10 млн. руб. Для собственно-случайной и механической выборки с бесповторным способом отбора необходимый объем выборки для средней количественного признака вычисляется по формуле: (6.4.1.) По условию сквозной задачи ошибка выборки не должна превышать 10,0 млн. руб. Параметры t, N и известны из решений предыдущих задач. Расчет необходимой численности выборки по формуле (6.4.1.): Вывод. Для того, чтобы обеспечить для среднего объема кредитных вложений банков предельную ошибку выборки, равную 10,000 млн. руб., необходимо из 150 банков, составляющих генеральную совокупность, отобрать в выборочную совокупность 107 банков. !!!Очень важно: N – необходимо брать только числа в единицах. Например, млн. чел. – 1000000 чел., тыс. чел. – 10000 чел, а не 1 млн. чел., 10 тыс. чел!!!! Тема 7. Корреляционно – регрессионный анализ социально-экономических явлений 7.1.Понятие о корреляционной связи. Виды и формы корреляционных связей. 7.2. Корреляционный метод анализа взаимосвязи. 7.3.Регрессионный метод анализа взаимосвязи. 7.4.Пример построения однофакторной регрессионной модели связи. 7.1. Понятие о корреляционной связи. Виды и формы корреляционных связей Среди многих форм связей, имеющих количественный характер и изучаемых количественными методами, особое место занимают факторные связи, для исследований которых применяются методы корреляционно-регрессионного анализа. По своему характеру факторные связи относятся к причинно-следственным связям, суть которых заключается в том, что одни явления (причины), протекая в определенных условиях, порождают другие явления (следствия). При изучении факторных связей среди взаимосвязанных признаков (показателей) выделяют факторные и результативные. К факторным признакам относят те, которые характеризуют явления-причины и явления-условия и при проведении статистического исследования рассматриваются как независимые. Результативные признаки характеризуют явления-следствия и являются зависимыми от факторных в том смысле, что изменение величины факторных признаков ведет к изменению величины результативного признака. Существуют различные виды и формы факторных связей. Их можно классифицировать по различным критериям – характеру, степени тесноты, направлению, виду аналитического выражения связи, количеству факторов в модели связи Функциональные связи Связь результативного признака Y с факторным признаком X называется функциональной, если каждому возможному значению xi признака X соответствует одно (или несколько) однозначно определенных значений yi признака Y. Математической моделью однофакторной функциональной связи служит уравнение yi=f(xi), (i=1,2,…,n) (7.1.1.) где xi, уi - факторного и результативного признаков соответственно, f - функция, определяющая зависимость результативного признака от факторного. В случае зависимости признака Y от нескольких факторных признаков X1,X2, … , Xm модель связи имеет вид: . (i=1,2, …, n) (7.1.2.) Характерная особенность функциональной связи состоит в том, что проявляется в каждом отдельном случае наблюдения и для каждой единицы исследуемой совокупности. При этом известен полный перечень всех факторов, влияющих на результативный признак Y, а также точный механизм их влияния, выраженный формулой функции f(х). Ввиду этого функциональные связи характеризуются как полные, жесткие, детерминированные, строго определенные. В области социально-экономических явлений факторные связи редко носят жестко детерминированный характер. Это объясняется тем, что наряду с существенными факторами, оказывающими основное, главное влияние на величину результативного признака, на него воздействуют и многие другие, в том числе случайные факторы, причем механизм влияния всех факторов в совокупности точно определить невозможно и появление каждого конкретного значения yi носит случайный характер. Связи, учитывающие случайный характер зависимости признаков, относят к числу стохастических (вероятностных). Стохастическая связь признаков – это связь, при которой одному и тому же значению хi фактора X (случайному или неслучайному) могут соответствовать различные случайные значения yi1, yi2, … ,yik результативного признака Y: (7.1.3.) Математическая модель однофакторной стохастической связи имеет вид уравнения (7.1.4.) где xi, yi – значения факторного и результативного признаков соответственно, - функция, определяющая ту часть значения признака yi, которая формируется под воздействием учтенного в модели фактора X; - часть значения признака yi, которая возникает вследствие действия неучтенных или неконтролируемых случайных факторов, а также возможных ошибок измерения признаков Х, Y. Если в модели учитывается зависимость признака Y от ряда факторов, то модель имеет вид (7.1.5.) Характерной особенностью стохастических связей является то, что они обнаруживаются не в каждом отдельном случае наблюдения, как при функциональных связях, а лишь при достаточно большом числе наблюдений. При стохастических связях не известен ни полный перечень факторных признаков, ни точное правило их взаимодействия с результативным признаком Y, поэтому эти связи характеризуются как неполные, нежесткие, случайные, недетерминированные, неопределенные. Примерами однофакторной стохастической связи являются зависимости потребления семьей продуктов питания от дохода семьи, оценок на экзаменах - от сложности учебных дисциплин, торговой выручки - от затрат на рекламу, себестоимости продукции - от объема производства. Разновидности стохастических связей представляет классификационная схема на рис.7.1.1. • корреляционные; • некорреляционные. Рис.2. Классификация факторных связей по их характеру Выводы: 1. Статистическая связь означает, что если с возрастанием значений факторного признака (х), то возрастают (убывают) и значения результативного признака (у), т.е. при статистической связи рассматриваются статистически закономерные изменения результативных признаков; 2. 3. Корреляционная связь – важнейший частный случай стохастической статистической связи, когда под воздействием вариации факторного признака Х закономерно изменяются средние значения результативного признака Y (усредняются значения , полученные под воздействием на Y фактора ); 3. Некорреляционная связь, но статистическая – частный случай стохастической статистической связи, когда средние значения результативного признака Y меняются не систематически, но систематически изменяется некоторый другой параметр. 4. Если ни один обобщающий параметр не меняется систематически, то статистической связи НЕТ! 7.2.Корреляционный метод анализа взаимосвязи В анализе взаимосвязей факторного признака (х) и результативного признака (у) возникает два вопроса: 1. Выявить, существует ли корреляционная связь между факторным признаком (х) и результативным признаком (у)?; 2. Установить степень этого влияния, т.е. определить тесноту связи. Для решения первого вопроса существует 4 метода: Схема 7.2.1. Методы выявления корреляционной связи Рассмотрим каждый из них. 1 Графический метод – заключается в построении поля корреляции – это точечный график, используемый для изображения связи признаков в совокупностях небольшого объема. При построении графика в декартовой системе координат по оси абсцисс в определенном масштабе наносятся значения факторного признака, а по оси ординат – результативного. На пересечении абсцисс и ординат отмечаются точки (xi, yi), совокупность которых и представляет корреляционное поле (рис.7.2.1). Рис. 7.3.1. Корреляционное поле кредитных вложений и прибыли банков По расположению точек корреляционного поля можно визуально выявить либо наличие, либо отсутствие корреляционной связи. 2. Метод параллельных рядов - здесь значения факторного признака (х) располагаются в возрастающем порядке и параллельно рядом выписывается ряд значений результативного признака (у). Сопоставление пар () позволяют установить имеет ли изменения результативного признака закономерный характер. На примере сквозной задачи выполним это. Для этого в исходных данных произведем сортировку по факторному признаку (х) – объему кредитных вложений Таблица 7.2.1. Группировка банков по объему кредитных вложений Номер предприятия Кредитные вложения, млн.руб Прибыль банков, млн.руб. 11 375 150 19 384 158 2 396 168 12 429 208 20 492 195 10 523 213 25 528 215 8 537 169 5 540 210 4 543 221 13 552 218 23 555 191 7 576 214 28 589 230 22 591 239 24 603 236 21 610 237 1 614 256 27 615 228 15 618 238 29 627 265 14 642 227 16 653 254 3 681 252 30 698 245 17 704 251 6 706 278 9 744 288 18 759 293 26 795 303 Визуально можно предположить существование корреляционной связи. 3. Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи. Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Объем кредитных вложений известны из табл. 8. Для результативного признака Y – Сумма прибыли величина интервала определяется по формуле (1) при k = 5, уmax = 303,0 млн руб., уmin =150,0 млн руб.: Границы интервалов ряда распределения результативного признака Y имеют следующий вид (табл. 7.2.2.): Таблица 7.2.2. Номер группы Нижняя граница, млн руб. Верхняя граница, млн руб. 1 150,0 180,6 2 180,6 211,2 3 211,2 241,8 4 241,8 272,4 5 272,4 303,0 Подсчитывая с использованием принципа полуоткрытого интервала [ ) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 7.2.3.). Таблица 7.2.3. Распределение банков по сумме прибыли Группы банков по сумме прибыли, млн. руб., Число банков, fj 150,0-180,6 4 180,6-211,2 4 211,2-241,8 12 241,8-272,4 6 272,4-303,0 4 Итого 30 Используя группировки по факторному и результативному признакам, строим корреляционную таблицу 7.2.5. Табл.7.2.4. Разработочная таблица для построения интервального ряда распределения и аналитической группировки № п/п Группы банков по величине кредитных вложений, млн. руб. № банка Кредитные вложения, млн. руб. Прибыль, млн. руб. 1 2 3 4 5 1 375,00 - 459,00 11 375 150 19 384 158 2 396 168 12 429 208 Итого 4 1584,00 684,00 2 459,00 - 543,00 20 492 195 10 523 213 25 528 215 8 537 169 5 540 210 Итого 5 2620,00 1002,00 3 543,00 - 627,00 4 543 221 13 552 218 23 555 191 7 576 214 28 589 230 22 591 239 24 603 236 21 610 237 1 614 256 27 615 228 15 618 238 Итого 11 6466,00 2508,00 4 627,00 - 711,00 29 627 265 14 642 227 16 653 254 3 681 252 30 698 245 17 704 251 6 706 278 Итого 7 4711,00 1772,00 5 711,00 - 795,00 9 744 288 18 759 293 26 795 303 Итого 3 2298,00 884,00 Всего 30 17679,00 6850,00 Таблица 7.2.5. Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений Группы банков по размеру кредитных вложений, млн руб X Группы банков по сумме прибыли, млн руб.Y 150,00 - 180,60 180,60 - 211,20 211,20 - 241,80 241,80 - 272,40 272,40 - 303,00 Итого 375,00 - 459,00 3 1 4 459,00 - 543,00 1 2 2 5 543,00 - 627,00 1 9 1 11 627,00 - 711,00 1 5 1 7 711,00 - 795,00 3 3 итого 4 4 12 6 4 30 Вывод. Анализ данных табл. 7.2.5. показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков. 4. метод аналитической группировки. При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь. Строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Объем кредитных вложений и результативным признаком Y – Сумма прибыли. Макет аналитической таблицы имеет следующий вид (табл. 7.2.6.): Пример аналитической группировки (табл. 7.2.5.). Таблица 7.2.6. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вложений, млн.руб. Число банков, f Прибыль банка, млн. руб. Всего В среднем по группе на 1 банк 1 2 3 4 гр.5=гр.4:гр.3 1 375,00 - 459,00 4 684,000 684/4= 171,000 2 459,00 - 543,00 5 1002,000 200,400 3 543,00 - 627,00 11 2508,000 228,000 4 627,00 - 711,00 7 1772,000 253,143 5 711,00 - 795,00 3 884,000 294,667 итого 30 6850,00 228,333 Вывод. Анализ данных табл. 7.2.6. показывает, что с увеличением объема кредитных вложений от группы к группе систематически возрастает и средняя прибыль по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками. Измерение корреляционной связи – см. п. 5.2. 7.3.Регрессионный метод анализа взаимосвязи Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия отражает теоретическую форму связи признаков X и Y, т.е. закономерность изменения средних значений признака Y в зависимости от изменения фактора X при условии полного взаимопоглощения всех прочих случайных по отношению к фактору X причин. Иначе говоря, теоретическая линия регрессии определяет основную тенденцию взаимосвязи признаков X и Y. Уравнение (7.3.1.) описывающее математически теоретическую линию регрессии, называют уравнением регрессии. В уравнении (7.1.3.) переменная - это средняя величина признака Y, меняющаяся по мере изменения фактора X, а функция f(x) устанавливает аналитический вид однозначной зависимости между вариациями x и . Таким образом, уравнение регрессии аппроксимирует (приближению характеризует) корреляционную связь признаков X и Y, представляя ее в форме функциональной зависимости. Правомерность моделирования стохастической корреляционной связи на основе функциональной зависимости (7) будет оправданной лишь в тех случаях, если корреляционная связь не столь значительно отстоит от функциональной, т.е. не дает значительной погрешности в отклонениях (yi -). Это требование порождает в теории корреляционной связи две главные задачи: ◦ определить теоретическую форму связи – подыскать такую форму функциональной зависимости (7), которая в наилучшей степени отвечает сущности обнаруженной корреляционной связи признаков; ◦ измерить тесноту связи – оценить, в какой мере изучаемая корреляционная связь приближается по своей силе к связи изучаемых функциональной. В однофакторных регрессионных моделях взаимосвязи социально-экономических явлений наиболее часто используются следующие типы математических функций, описывающих теоретическую линию регрессии и характеризующих механизм взаимодействия факторного и результативного признаков: = a0 + a1x - линейная, = a0 + a1 - гиперболическая, = a0 + a1lgx - логарифмическая, = a0 - степенная, = a0 + a1x + а2x2 - параболическая, = a0 + - показательная. Коэффициенты уравнений регрессии a0, a1, a2, … называют параметрами связи. Функциональные зависимости описывают типы кривых, применяемых для сглаживания ломаных эмпирических линий связи, причем операция сглаживания сводится, по существу, к нахождению численных значений параметров ak. Наиболее простой регрессионной моделью однофакторой корреляционной связи является линейная модель (7.3.2.) изображаемая графически прямой линией. Модель отражает линейную взаимосвязь признаков X и Y, когда с возрастанием значений Х происходит непрерывное, более или менее равномерное возрастание или убывание средних значений Y . Разброс фактических значений yi вокруг теоретических значений , рассчитанных по избранному для моделирования уравнению регрессии, обусловлен влиянием множества случайных факторов. Разности (7.3.3.) называемые остаточными величинами (или остатками), оценивают отклонения расчетных значений от фактических значений yi. Следовательно, при построении регрессионной модели численные значения коэффициентов ak выбранного типового уравнения регрессии (8) необходимо искать так, чтобы обеспечить наименьшие возможные остатки для всех случаев наблюдения (xi, yi). Для этой цели используется метод наименьших квадратов (МНК), который позволяет рассчитать параметры ak выбранного типового уравнения регрессии таким образом, чтобы теоретическая линия регрессии была бы в среднем наименее удалена от всех точек (xi, yi) по сравнению с любой другой теоретической линией регрессии, отвечающей выбранному типу функции связи (8). Согласно МНК, задача поиска значений параметров ak, минимизирующих сумму погрешностей (10), имеет вид min (7.3.4.) и решается как задача на экстремум - путем приравнивания нулю первых частных производных функции S по каждому искомому параметру ak уравнения регрессии. Это приводит к системе уравнений, называемой нормальной, решение которой дает численные значения параметров ak, минимизирующие функцию S. Таким образом, параметры связи ak, в силу их расчета по МНК, являются усредненными по всей совокупности наблюдений (xi, yi). Они отражают взаимосвязь признаков X и Y только в общем итоге, по всей совокупности в целом (для каждой индивидуальной пары (xi, yi) значения ak остаются неизвестными). При изучении многофакторных корреляционных связей методология их моделирования уравнениями регрессии аналогична рассмотренной. Уравнения многофакторной регрессии имеют вид …,xm=f(x1, x2 , … , xm) (7.3.5.) и позволяют приближенно оценить меру влияния на результативный признак Y каждого из включенных в модель факторов X при фиксированных (на среднем уровне) значениях остальных факторов, а также оценить влияние на Y различных сочетаний рассматриваемых факторов. 7.4. Пример построения однофакторной регрессионной модели связи Уравнение парной линейной корреляционной связи имеет следующий вид: , где - расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии; а0 - среднее значение признака Y в точке x=0; а0, а1 - коэффициенты уравнения регрессии (параметры связи). Гипотеза о линейной зависимости между признаками Х и Y выдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии. Уравнение парной линейной корреляции показывает среднее изменение результативного признака Y при изменении фактора Х на одну единицу его измерения, т.е. вариацию признака Y, которая приходится на единицу вариации фактора Х. Знак параметра указывает направление этого изменения. Коэффициенты уравнения а0, а1 отыскиваются методом наименьших квадратов (МНК). Как изложено в раздел II – Теоретические основы и методика корреляционно-регрессионного анализа данных (п.3 – Моделирование однофакторных корреляционных связей на основе функциональных зависимостей), в основу МНК положено требование минимальности сумм квадратов отклонений эмпирических значений yi от выровненных . При линейной зависимости критерий минимизации (7.4.1.) принимает вид: 7.4.1. Для нахождения значений параметров а0, а1, при которых функция двух переменных S может достигнуть минимума, приравнивают к нулю частные производные S по а0, а1 и тем самым получают систему 2-х уравнений с двумя неизвестными а0, а1: 7.4.2. Сократив каждое уравнение на –2, раскрыв скобки и перенеся члены с х в одну строку, а с y – в другую, для определения а0, а1 получают систему: Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии. Все суммы, необходимые для конкретизации нормальных уравнений, определяют по эмпирическим данным (xi, yi). Решая полученную систему, находят искомые параметры а0, а1 – коэффициенты линейного уравнения регрессии. Расчет коэффициента может быть выполнен по формулам: ; 7.4.3. . 7.4.4. Иногда эти коэффициенты удобнее вычислять по формулам: 7.4.5. 7.4.6. где - среднее из произведения; - среднее квадратов; - произведение средних; - квадрат средних. Построив линейное уравнение регрессии, следует проанализировать качество синтезированной регрессионной модели, оценить адекватность и практическую пригодность модели, дать ее экономическую интерпретации. Как уже отмечалось, на этапе регрессионного анализа определяется теоретическое выражение связи между признаками (форма связи). Для построения и анализа теоретической линии, определяемой на базе эмпирического материала, необходимо знать параметры уравнения регрессии. Рассмотрим более подробно определение параметров для линейного уравнения парной регрессии. Рассчитаем эти показатели: Линейное уравнение парной регрессии имеет вид: На базе данных таблицы Таблица 7.4.1. Вспомогательная таблица для расчета уравнения линейной регрессии Номер предприятия Кредитные вложения, млн.руб. Прибыль банков, млн.руб . у с крышкой 1 2 3 гр4=гр2*гр3 гр5=гр2*гр2 33,739+0,33*х 11 375 150 56250 140625 157,489 19 384 158 60672 147456 160,459 2 396 168 66528 156816 164,419 12 429 208 89232 184041 175,309 20 492 195 95940 242064 196,099 10 523 213 111399 273529 206,329 25 528 215 113520 278784 207,979 8 537 169 90753 288369 210,949 5 540 210 113400 291600 211,939 4 543 221 120003 294849 212,929 13 552 218 120336 304704 215,899 23 555 191 106005 308025 216,889 7 576 214 123264 331776 223,819 28 589 230 135470 346921 228,109 22 591 239 141249 349281 228,769 24 603 236 142308 363609 232,729 21 610 237 144570 372100 235,039 1 614 256 157184 376996 236,359 27 615 228 140220 378225 236,689 15 618 238 147084 381924 237,679 29 627 265 166155 393129 240,649 14 642 227 145734 412164 245,599 16 653 254 165862 426409 249,229 3 681 252 171612 463761 258,469 30 698 245 171010 487204 264,079 17 704 251 176704 495616 266,059 6 706 278 196268 498436 266,719 9 744 288 214272 553536 279,259 18 759 293 222387 576081 284,209 26 795 303 240885 632025 296,089 итого: 17679 6850 4146276 10750055 6846,24 1. Для построения линейного уравнения регрессии необходимо определить параметры этого уравнения: свободный член уравнения () и коэффициент регрессии (). С этой целью построим вспомогательную таблицу. Определим параметры уравнения линейной регрессии, n – количество банков 7.4.5. 7.4.6. где - среднее из произведения; - среднее квадратов; - произведение средних; - квадрат средних. В уравнении регрессии параметр показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков В нашем случае мы получили уравнение линейной зависимости 33,739+0,33*х а0 а1 Коэффициент регрессии а1 0,33 показывает, что при увеличении факторного признака Кредитные вложения на 1 млн. руб. значение результативного признака «Прибыль банков» увеличивается в среднем на 0,33 млн руб. Для построения теоретической линии зависимости рассчитаем этот показатель в таблице 7.4.1. Теперь графически построим корреляционное поле – затем график с выводом формулы. Затем ЭКО и ЭКД, см. тему 5. В Excel- поставить мышь на множество точек корреляционного поля, правой клавишей – добавить Линию тренда, тип, параметры и по индексу детерминации выбрать наиболее адекватную линию регрессии. ТЕМА 8. РЯДЫ ДИНАМИКИ 8.1. Понятие и классификация рядов динамики. Сопоставимость уровней и смыкание рядов динамики 8.2. Аналитические показатели изменения уровней ряда динамики 8.3. Средние показатели в рядах динамики 8.4. Экстраполяция в рядах динамики 8.5. Методы выявления сезонных колебаний 8.6. Методы анализа основной тенденции в рядах динамики 8.1. Понятие и классификация рядов динамики. Сопоставимость уровней и смыкание рядов динамики Ряд динамики - изменяющиеся во ВРЕМЕНИ (t) значения статистических показателей, расположенных в хронологическом порядке. Схема 8.1.1. Элементы ряда динамики Показатель уровня ряда (y) – значения статистического показателя; Показатель времени (t) – годы, кварталы, или моменты, т.е. на определенную дату! Существуют различные виды рядов динамики, их можно классифицировать по разным критериям: Таблица 8.1.1 Классификация видов рядов динамики Классификационные признаки Виды рядов динамики • Способ выражения уровней ряда (табл. 8.1.2.) • Ряды абсолютных величин • Ряды средних величин • Ряды относительных величин • Способ представления хронологии • Моментный ряд (табл. 8.1.4.) (НА…) • Интервальный ряд (табл.8.1.3.) (ЗА..) • Расстояние между периодами или датами • Равноотстоящие уровни во времени (табл. 8.1.3., 8.1.4.) • Неравноотстоящие уровни во времени (табл. 8.1.2.) Способ выражения уровней ряда Таблица 8.1.2 Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в РФ Показатели 2000 2001 2003 2005 2010 Виды ряда 1. Число квартир, тыс. 1190 1151 682 602 373 Ряд абсолютных величин 2. Средний размер квартир, кв. м. общей площади 49,9 54,4 60,8 68,2 81,1 Ряд средних величин 3. Удельный вес однокомнатных квартир от общего ввода, % 18 18 18 18 20 Ряд относительных величин Какой это ряд? Ответ: интервальный с неравноотстоящими уровнями. Способ представления хронологии в рядах динамики В зависимости от того, как выражают уровни ряда состояние явления на определенные моменты (начало месяца, квартала, года и т.п.) или его величину за определенные интервалы времени (например, за сутки, месяц, год), различают соответственно интервальные и моментные и ряды динамики. Пример интервального ряда динамики Таблица 8.1.3. Объем продажи сахара в одном из регионов РФ, тыс. тонн Годы (t) Продажа сахара (y) за 2004 (01.01.-31.12.) 850 за 2005 875 за 2006 906 за 2007 911 за 2008 931 2009 954 Пример моментного ряда динамики Таблица 8.1.4. Численность работников организации «Ода» за январь-май 2009 г., чел. Дата(t) Число работников, чел. (y) на 01.01. 850 на 01.02. 875 на 01.03. 906 на 01.04. 911 на 01.05. 931 на 01.06. 954 Для моментных и интервальных рядов по-разному рассчитываются уровни. Если ряд интервальный, то его уровни можно суммировать за определенный период времени, поскольку суммы не будут содержать повторный счет. На примере табл. 8.1.3. количество проданного сахара за 2004-2009 гг. составляет 5427 (тыс. тонн.). Если ряд моментный, то его уровни нельзя суммировать за определенный период времени, поскольку суммы будут содержать повторный счет, это является бессмысленным. На примере табл. 8.1.4.численность работников организации на 01.04. – 850+875+906=2631 (чел.), это экономическая бессмыслица!!! Расстояние между периодами или датами в рядах динамики Табл. 8.1.3., 8.1.4. – с равноотстоящими уровнями, а табл. 8.1.2. – с неравноотстоящими уровнями. При построении рядов динамики необходимо соблюдать условия сопоставимости уровней ряда Схема 8.1.3. Правила построения рядов динамики Прежде чем анализировать ряд динамики, необходимо убедиться в сопоставимости уровней ряда. Смыкание рядов динамики – объединение в один ряд (более длинный) двух или нескольких рядов динамики, уровни (у) которых исчислены по разной методике или разным территориальным границам. Для осуществления смыкания необходимо, чтобы для одного из периодов (переходного) имелись данные, исчисленные по разной методологии (или в разных границах). Таблица 8.1.5. Динамика объема реализуемой продукции фирм в сопоставимых ценах (млн. руб.) Объем реализации 2003 2004 2005 2006 2007 2008 2009 1 2 3 4 5 5 7 8 Продукция 12 организаций 1450 1480 1560 1680 Продукция 16 организаций 2352 2580 2720 2980 Сомкнутый ряд 2030 2072 2184 2352 2580 2720 2980 Непосредственно сопоставить показатели двух рядов нельзя, т.к. они относятся к разному числу фирм. Для смыкания рядов найдем коэффициент пересчета в том году, где есть данные по 2-м рядам (это 2006 год): Подлежат пересчету только уровни ряда (исходного) в той части ряда, где реальные уровни отсутствуют. Например, в сомкнутом ряде подлежат пересчету уровни 2003, 2004, 2005 гг. 8.2. Аналитические показатели изменения уровней ряда динамики Существует целый ряд показателей, которые характеризуют изменение уровней ряда динамики Схема 8.2.1. Аналитические показатели изменения уровней ряда динамики Аналитические показатели ряда динамики строятся на основе сравнения двух уровней ряда. Используют два способа сравнения уровней: 1) базисный способ, при котором каждый последующий уровень сравнивается с одним и тем же уровнем, принятым за базу сравнения (то есть база сравнения – постоянная); 2) цепной способ, при котором каждый последующий уровень сравнивается с предыдущим уровнем (то есть база сравнения – переменная). Соответственно различают: - базисные показатели, обозначаемые надстрочным индексом б; - цепные показатели, обозначаемые надстрочным индексом ц. Общеупотребительные обозначения уровней ряда динамики: yi – данный (текущий) уровень; yi-1– предыдущий уровень; y0 – базисный уровень; yn – конечный уровень; – средний уровень. К числу основных аналитических показателей рядов динамики, характеризующих изменения уровней ряда за отдельные промежутки времени, относятся следующие: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста. 1. Абсолютный прирост (∆у) характеризует, на сколько в абсолютном выражении увеличился или уменьшился уровень ряда за определенный промежуток времени. Показатель рассчитывается как разница между сопоставляемыми уровнями: ∆уiб = уi – уо (8.2.1.) ∆уiц = уi – уi-1. (8.2.2) Значение показателя со знаком “+” означает увеличение уровня, со знаком “-“ - снижение. Абсолютный прирост (сокращение) с переменной базой ∆уц иначе называют скоростью роста (сокращения). Примечание 1. Цепные и базисные абсолютные приросты взаимосвязаны: • сумма цепных абсолютных приростов равна базисному абсолютному приросту за весь исследуемый период: ; (8.2.3) • разность между двумя смежными базисными абсолютными приростами равна соответствующему цепному абсолютному приросту. 2. Темп роста (Тр) – показатель интенсивности изменения уровней ряда за определенный промежуток времени. Рассчитывается как относительная величина, выраженная в коэффициентах, по формулам , (8.2.4.) (8.2.5.) или в процентах – по формулам: (%) ,(8.2.6.) (%)(8.2.7.) Темп роста всегда число положительное. Если Тр=100%, то значение уровня не изменилось; если Тр>100%, то значение уровня повысилось, а если Тр<100% - понизилось. Примечание 2. Между цепными и базисными темпами роста существует взаимосвязь: • произведение цепных темпов роста равно базисному темпу роста за весь исследуемый период: • частное от деления двух смежных базисных темпов роста равно соответствующему цепному темпу роста. 3. Темп прироста (Тпр) – показатель, характеризующий относительную скорость изменения уровней ряда в единицу времени. Он показывает, на сколько процентов один уровень больше (или меньше) другого, принятого за базу сравнения. Рассчитывается путем вычитания 100% из соответствующего темпа роста (базисного или цепного): Тпрi=Трi-1(100) (%) (8.2.8.) 4. Абсолютное значение (содержание) 1 % прироста (А1%) показывает, сколько абсолютных единиц уровней ряда приходится на 1% прироста. Показатель рассчитывается как отношение цепного абсолютного прироста к соответствующему цепному темпу прироста или как одна сотая часть предыдущего уровня. (8.2.9.) Аналитические показатели годовых изменений уровней ряда, рассчитанные по формулам (8.2.1)-(8.2.9) для данных табл.1, приведены в табл.8.2.1. Таблица 8.2.1. Объем реализации по изделию «N» по одному региону РФ в сопоставимых ценах (тыс. тонн.) Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста, млн. руб. Базис-ный Цеп-ной Базисный Цепной Базисный Цепной 1 2 3 4 5 6 7 8 9 2004 850 - - 100 100 0,00 0,00 - 2005 875 25 25 102,9 102,9 (1,029) 2,9 2,9 8,50 2006 906 56 31 106,6 103,5 (1,035) 6,6 3,5 8,75 2007 911 61 5 107,2 100,6 (1,006) 7,2 0,6 9,06 2008 931 81 20 109,5 102,2 (1,022) 9,5 2,2 9,11 2009 954 104 23 112,2 102,5 (1,025) 12,2 2,5 9,31 Вывод. Как показывают данные табл. 8.2.1., объем реализации товара постоянно возрастал. В целом за исследуемый период объем реализации продукции возрос на 104,0 тыс. тонн (гр.3) или на 12,2% (гр.7). Рост объема реализации продукции носит волнообразный характер, что подтверждается изменяющимися значениями цепных абсолютных приростов - с 25,0 до 23,0 тыс. тонн. (гр.4) и цепных темпов прироста - с 2,9% до 2,5% (гр.8). Увеличение объемов реализации продукции подтверждается также систематически возрастающей величиной абсолютного значения 1% прироста - с 8,5 до 9,31 тыс. тонн (гр.9). ИСПРАВИТЬ!!!!4 столбец 8.3. Средние показатели в ряду динамики В табл. 8.2.1. представлены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени необходимо рассчитать средние показатели динамики. В анализе динамики развития явления в зависимости от вида исходного ряда динамики используются различные средние показатели динамики, характеризующие изменение явление за период в целом. 1. Средний уровень ряда динамики () характеризует типичную величину уровней ряда. Показатель рассчитывается по разным формулам для различных видов рядов динамики – интервальных, моментных, с равноотстоящими и неравноотстоящими уровнями. Для интервального ряда динамики с равноотстоящими уровнями времени средний уровень ряда определяется как простая арифметическая средняя из уровней ряда: (8.3.1.) где n- число уровней ряда. Пример: Таблица 8.3.1. Продажа сахара в одном из регионов РФ, тыс. тонн Годы (t) Продажа сахара (y) 1 2 2004 850 2005 875 2006 906 2007 911 2008 931 2009 954 Вывод: средний объем реализации сахара в одном из регионов РФ за 2004-2009 гг. составил 904,5 тыс. тонн В случае неравноотстоящих уровней для расчета среднего уровня используется средняя арифметическая взвешенная: ,(8.3.2.) где веса ti– длительность интервалов времени (дней,месяцев и т.д.) между смежными уровнями. Пример. Рассчитать среднесписочную численность работников за сентябрь месяц, если численность работников на 01.09. -200 чел., 07.09. принято 15 чел., 12.09. уволен 1 чел.; 21.09. принято 10 чел. Решение: рассчитаем период времени, когда изменялась численность персонала: Таблица 8.3.1. Вспомогательная таблица для расчета среднесписочной численности работников организации «А» Численность работников, чел.(у) Период времени, дни (t) y*t 200 6 (01.09.-06.09) 1200 200+15=215 5 (07.09-11.09) 215-1=214 9 (12.09.-20.09) 214+10=224 10 (21.09-30.09) Итого: 30 6441 Вывод: среднесписочная численность работников за сентябрь месяц составила 215 чел. Для моментного ряда динамики с равноотстоящими уровнями средний уровень ряда определяется по формуле средней хронологической простой: (8.3.3.) где n- число уровней ряда. Пример: Таблица 8.1.4. Численность работников организации «Ода» за январь-май 2009 г., чел. Дата(t) Число работников, чел. (y) 1 2 на 01.01. 850 на 01.02. 875 на 01.03. 906 на 01.04. 911 на 01.05. 931 на 01.06. 954 В случае неравноотстоящих уровней применяется формула средней хронологической взвешенной: (8.3.4.) (см. пример выше) 2. Средний абсолютный прирост () является обобщающей характеристикой индивидуальных абсолютных приростов и определяется как простая арифметическая средняя из цепных абсолютных приростов: (8.3.5.) где n- число уровней ряда. Абсолютный прирост, тыс. тонн. . Годы (t) Цепной за 2004 - 2005 25 2006 31 2007 5 2008 20 2009 23 где N - число цепных абсолютных приростов, у нас 6-1=5! Эта формула может быть преобразована исходя из взаимосвязи базисных и цепных абсолютных приростов (8.3.6.); n – число уровней ряда Для таблицы 8.1.6. Годы (t) Объем продаж товара, тыс. тонн 2004 850 2005 875 2006 906 2007 917 2008 931 2009 954 3. Средний темп роста () – это сводная обобщающая характеристика интенсивности изменения уровней ряда, показывающая во сколько раз изменялись уровни ряда в среднем за единицу времени. Показатель может быть рассчитан по формуле средней геометрической простой: , (8.3.7.) где величины Трiц выражены в коэффициентах роста, или же по формуле , (8.3.8.) когда отсутствует перелом в тенденции где n – число уровней ряда. или 102,3% 4. Средний темп прироста () рассчитывают исходя из среднего темпа роста: (8.3.9.) В нашем случае: Вывод. За исследуемый период средний объем реализации произведенной продукции составил 904,5 тыс. тонн. Выявлена положительная динамика реализации продукции: ежегодный рост объема реализации составлял в среднем 20,8 тыс. тонн или 2,3%. Особую осторожность при применении средних показателей следует соблюдать в тех случаях, когда появляется перелом в тенденции изменения уровней ряда динамики. Например, была тенденция роста, затем (по каким-либо причинам) – тенденция снижения. В таком случае сначала рассчитывают средние показатели для периода роста, затем – для периода снижения. 8.4. Экстраполяция в рядах динамики Экстраполяция – это один из способов статистического прогнозирования. Применение метода экстраполяции основано на инерционности развития социально-экономических явлений и заключается в предположении о том, что тенденция развития данного явления в будущем не будет претерпевать каких-либо существенных изменений. Прогноз, сделанный на период экстраполяции (период упреждения), больший 1/3 периода исследования не может считаться научно обоснованным. На основании ряда динамики годовых объемов реализации продукции (табл.1), необходимо сделать прогноз на последующие 2 года вперёд с использованием: • среднего абсолютного прироста; • среднего темпа роста; Прогнозирование уровня ряда динамики с использованием среднего абсолютного прироста осуществляется по следующей формуле: , (8.4.1.) где: – прогнозируемый уровень; t – период упреждения (число лет, кварталов и т.п.); yi – базовый для прогноза уровень – в нашем случае – последний уровень, за 6 год; – средний за исследуемый период абсолютный прирост (среднегодовой, среднеквартальный и т.п.). Прогнозируемый объем реализации продукции на 8 год (по данным шестилетнего периода) с использованием среднего абсолютного прироста, рассчитанного ранее, исчисляется следующим образом: Прогнозирование объемов реализации продукции с использованием среднего темпа роста Если в ряду динамики стабильны (примерно равны) цепные темпы роста, то экстраполяцию осуществляют через показатель среднего темпа роста. Прогнозирование уровня ряда динамики с использованием среднего темпа (коэффициента) роста осуществляется по следующей формуле: (8.4.1.) где: – средний за исследуемый период темп роста (среднегодовой, среднеквартальный и т.п.), выраженный в виде КОЭФФИЦИЕНТА! Прогнозируемый объем реализации продукции на восьмой год (по данным шестилетнего периода) с использованием среднего темпа роста, рассчитанного ранее, исчисляется следующим образом: Различия в прогнозных оценках возникли из-за того, что мы применили разные методики расчета этих значений. 8.5. Методы выявления сезонных колебаний В ряде случаев закономерно повторяются различия в уровнях ряда в зависимости от времени года. Задача заключается в том, чтобы измерить такие различия, чтобы они были не случайными, а закономерными, анализ надо проводить на основе нескольких лет (закон больших чисел – закономерность на фоне случайности). Рассмотрим на примере вычисление индекса сезонности. Пример. Имеются данные о расходе топлива в организации помесячно за 3 года. Рассчитать индексы сезонности и построить график сезонной волны. Таблица 8.4.1. Расчетная таблица для вычисления индекса сезонности Месяц Расход топлива за период, тыс. тн Сумма за три года, тыс. тн. Среднемес. расход за 3 г., тыс. тн. Индекс сезонности, % 2008 2009 2010 1 2 3 4 гр5= гр2+гр3+ гр4 гр6=гр5:3 гр7=гр6/средн.гр.6*100 январь 93 90 93 276 92 92/112,167*100=82,0 февраль 96 99 99 294 98 87,4 март 102 105 108 315 105 93,6 апрель 105 111 120 336 112 99,9 май 111 120 132 363 121 107,9 июнь 114 135 141 390 130 115,9 июль 129 126 150 405 135 120,4 август 120 123 144 387 129 115,0 сентябрь 114 126 138 378 126 112,3 октябрь 105 111 126 342 114 101,6 ноябрь 93 90 105 288 96 85,6 декабрь 87 81 96 264 88 78,5 Итого: 1269 1317 1452 4038 4038:36= 112,167 Х СУММА СРЕДНЯЯ СУММ из СРЕДНИХ В МЕСЯЦ Индекс сезонности – для расчетов необходимо иметь данные по периодам не менее чем за три года. Сущность метода заключается в определении средних по периодам и для всего анализируемого ряда . Приведем один из способов расчета индекса сезонности. Индекс сезонности рассчитывается: , где: - средние по периодам; - общий средний уровень ряда. Для нашей задачи (данные по январю): 1. рассчитаем сначала расход топлива всего за 3 года по итоговым графам: 1269+1317+1452=4038 (тыс.тонн) 2. затем рассчитаем средний месячный расход топлива в каждом месяце за 3 года (средняя из средних); 4038/36=112,167 (тыс. тонн). 3. исчислим индекс сезонности (в нашем примере для января) 4. на основе данных построим график сезонной волны. Гр. 8.5.1. график сезонной волны расхода топлива организацией (t). 8.6. Методы анализа основной тенденции в рядах динамики Тренд – основная достаточно устойчивая тенденция развития явления в ряду динамики, иначе говоря, плавное и устойчивое изменение уровней (у) во времени. На тренд оказывают влияние следующие составляющие: 1) характер тренда; 2) сезонная компонента; 3) случайная компонента. В ряде случаев уровни ряда меняются таким образом, что не видна общая тенденция их изменения. Чтобы ее уловить, необходимо иметь данные за длительный период времени, а основную тенденцию всегда определяет некоторый фактор f, но вместе с ним действуют другие факторы – случайные, разовые, периодические. График ряда обычно имеет форму ломаной с подъемами и спадами, уловить главную тенденцию можно с использованием трех методов, которые позволяют количественно отразить эту главную тенденцию: 1. Метод укрупнения интервалов – наиболее простой, основан на укрупнении периодов времени, т.е. на переходе от менее продолжительных периодов к более продолжительным. Средняя рассчитывается по укрупненным интервалам, поэтому она позволяет выявить и направление, и характер тренда. 2. Метод скользящей средней – заключается в том, что рассчитывается средний уровень первых несколько по счету уровней ряда, затем на втором шаге средняя рассчитывается для такого же числа уровней, но начиная со второго по счету, далее с третьего и так далее. Таким образом, средняя как бы «скользит» по временному ряду от его начала к концу, причем каждый раз один уровень отбрасывается в начале и добавляется следующий. В результате случайные отклонения сглаживаются. Недостаток – скользящая средняя не дает полного выравнивания ряда. 3. Метод аналитического выравнивания – заключается в том, чтобы фактические уровни ряда заменить уровнями, которые вычисляются на основе некоторой выбранной типовой математической функции в предположении, что она наилучшим образом описывает эмпирические данные. Иными словами, используется метод регрессионного анализа, когда в качестве факторного признака выступает время (t). В качестве типовой функции может быть: линейная; параболическая; гиперболическая и т.д. Расчет параметров этих функций производится с помощью МНК с помощью критерия минимизации: ; где: - выровненные уровни, которые располагаются на теоретической линии; - фактические уровни Линейное уравнение: Используя критерий минимизации и беря частные производные по неизвестным параметрам и получаем систему нормальных уравнений с двумя неизвестными и . При этом система нормальных уравнений примет вид: Рассмотрим на примере все три метода выравнивания: отсюда Таблица 8.6.1. Производство зерна в РФ, млн.тн. Годы t производство, млн. тн y Сред-няя за 3 года Сколь-зящая сумма за 5 лет, Сколь-зящая средняя за 5 лет, расчетные значения t t 2 yt y^=a0+a1*t. Где t -1-12.. 1998 172 - - 1 1 172 180,195 1999 176 184 - 2 4 352 182,971 2000 204 - 172+176+ +204+172++203=927 927/5= 185,4 3 9 612 185,748 2001 172 - 962 192,4 4 16 688 188,524 2002 203 194 984 196,8 5 25 1015 191,300 2003 207 - 975 195 6 36 1242 194,076 2004 198 - 989 197,8 7 49 1386 196,852 2005 195 193 999 199,8 8 64 1560 199,629 2006 186 - 1017 203,4 9 81 1674 202,405 2007 213 - 1014 202,8 10 100 2130 205,181 2008 225 211 - 11 121 2475 207,957 2009 195 - - 12 144 2340 210,733 Итого: 2346 78 650 15646 2345,572 Т.е. t – коэффициент тренда, он показывает, насколько в среднем будет изменяться уровень ряда через 1 год Тема 9. ЭКОНОМИЧЕСКИЕ ИНДЕКСЫ 9.1. Понятие о статистических индексах. Виды и классификация индексов. 9.2. Индивидуальные и общие индексы. Проблемы соизмерения индексируемых величин в агрегатных индексах. 9.3. Индексы средние из индивидуальных. 9.4. Взаимосвязь индексов. Индексный метод выявления влияния роли отдельных факторов. 9.5. Индексы постоянного и переменного состава. Индексы фиксированной структуры. 9.1. Понятие о статистических индексах. Виды и классификация индексов. Индекс – относительный показатель сравнения двух состояний простого или сложного явления, состоящего из соизмеримых или несоизмеримых элементов, во времени или пространстве. По характеру изучаемых явлений индексы подразделяются на: Индексы объемных показателей (индексы физического, измеренного в натуральных единицах объема производства или продажи товаров); Индексы качественных показателей (например, индексы цен, себестоимости, производительности труда, заработной платы и др.); Индексы сложных явлений (например, товарооборота, затрат на производство). При построении индексов необходимо иметь минимум два признака: Один ПЕРЕМЕННЫЙ; Другой ПОСТОЯННЫЙ, который позволяет взвесить переменный признак. Отличительной особенностью индексов как относительных величин является то, что с их помощью становится возможным соизмерить непосредственно несоизмеримые величины. Посредством индексов решаются три основные задачи: 1. измерить результаты изменения признаков с непосредственно несоизмеримыми элементами (например, изменение стоимости проданного товара в какой мере происходит за счет изменения цен и в какой мере за счет изменения объема продаж?); Например, вместе эти товары - растительное масло в литрах, яйцо диетическое в десятках, крупы в кг непосредственно соизмерить нельзя, от цен и количества перейдем к стоимости и затем соизмерим эти признаки; 2. измерить влияние факторов в динамике показателей; 3. измерить влияние структуры явлений на величину индексируемого признака. Любой индекс состоит из трех элементов: 1) индексируемый показатель – показатель, уровни которого сравниваются. Например, цена , количество продаж , объем товарооборота ; 2) сравниваемый уровень показателя – уровень показателя, который сравнивают с другим, его называют отчетным или текущим , ; 3) базисный уровень показателя – уровень, с которым происходит сравнение , ; Таблица 9.1.1. Условные обозначения, используемые в теории индексного метода Условное обозначение Расшифровка Цена за единицу товара (услуги) Количество (объем) какого-либо продукта (товара) в натуральном выражении Общая стоимость продукции данного вида (товарооборот) 1 Подстрочный символ показателя текущего (отчетного) периода Подстрочный символ показателя предшествующего (базисного) периода Схема 9.1.1. Классификация индексов 9.2. Индивидуальные и общие индексы. Проблемы соизмерения индексируемых величин в агрегатных индексах. Индивидуальный индекс – характеризует динамику уровня изучаемого явления во времени за два сравниваемых периода или выражает соотношение отдельных элементов совокупности. Таблица 9.2.1. Основные формулы вычисления индивидуальных индексов Индекс Основная формула индекс цен индекс объёма продукции индекс стоимости продукции Индексы никогда не подлежат суммированию, их значения следует только перемножать Пример 9.2.1. В текущем, отчётном году предприятие произвело 120 тыс.т. продукции вместо 100 тыс.т. в прошлом базисном, году. Цены за каждую тонну этой продукции снизились с 20 до 18 рублей; а её общая стоимость возросла с 2 000 до 2 160 тыс. руб. В данном примере можно вычислить три ИНДИВИДУАЛЬНЫХ индекса: индекс цен: раза или 90% от базы или снижение на 10% ;(9.2.1.) индекс объёма продукции: раза или рост 120% (+20% прироста);(9.2.2.) индекс стоимости продукции: раза или 108% (+8,0%)(9.2.3.) Вывод: в отчетном периоде по сравнению с базисным цены снизились на 10%, объем продукции возрос на 20%, стоимость продукции возросла на 8%. Общие индексы () – характеризуют обобщающие результаты совместного изменения всех единиц, образующих статистическую совокупность. Схема 9.2.1. Формы общих индексов При построении общих индексов возникает проблема: 1) что включить в один индекс, какие элементы объединяются в одном индексе? 2) необходимо правильно выбрать соизмеритель или вес, т.е. постоянный признак. Выбор веса зависит от того, какой признак исследуется – количественный или качественный. При построении общих индексов необходимо соблюдать правило ОБЩЕГО ВЕСА!!!! Схема 9.2.2. Правило весов при построении общих индексов Схема 9.2.3. Основные элементы агрегатного индекса Таблица 9.2.2. Основные формулы вычисления агрегатных индексов Индекс Формула расчета Что показывает индекс Что показывает разность между числителем и знаменателем Индекс цен Пааше (по отчетным весам) , где - стоимость продукции отчетного периода; - условная величина, показывающая какой была бы стоимость продукции в текущем периоде при условии сохранения цен на базисном уровне Влияние цен на стоимость товаров, произведенных в отчетном периоде (во сколько раз возросла (уменьшилась) стоимость продукции в отчетном периоде по сравнению с базисным периодом в результате изменения цен) На сколько денежных единиц изменилась стоимость продукции в результате роста (снижения) цен или на сколько товары в отчетном периоде стали дороже (дешевле), чем в базисном периоде Индекс цен Ласпейреса (по базисным весам) , где - условная величина, показывающая, какой была бы стоимость продукции предшествующего периода при условии цен на уровне отчетного периода Влияние изменения цен на стоимость количества товаров, произведенных в базисном периоде На сколько денежных единиц товары в базисном периоде стали дороже (дешевле) из-за изменения цен на них в отчетном периоде Индекс физического объема продукции , где: - стоимость продукции предшествующего периода Во сколько раз возросла (уменьшилась) стоимость продукции в отчетном периоде по сравнению с базисным периодом в результате изменения физического объема ее реализации На сколько денежных единиц изменилась стоимость продукции в результате роста (уменьшения) ее физического объема Индекс товарооборота продукции ; Во сколько раз возросла (уменьшилась) стоимость продукции в отчетном периоде по сравнению с базисным периодом за счет изменения цен на товары и объемов их реализации На сколько денежных единиц увеличилась (уменьшилась) стоимость продукции в текущем периоде по сравнению с базисным периодом за счет изменения цен на товары и объемов их производства или реализации На практике используются формулы индексов цен и Ласпейреса и Пааше, хотя они дают разные результаты, по значению, индекс цен Ласпейреса, как правило, больше индекса цен Пааше. Индекс цен Ласпейреса удобен для оперативной (недельной, месячной, квартальной) информации об изменении цен на определенный фиксированный набор товаров, когда пересчет каждый раз на текущий набор (количество) товаров сопряжен с большими затратами труда и времени, по индексу цен Ласпейреса рассчитывают индекс потребительских цен – индекс стоимости жизни. Формуле Пааше отдается предпочтение, когда индекс цен рассматривается в системе с индексом товарооборота и индексом физического объема. Пример 9.2.2. Таблица 9.2.3. Данные о реализации продукции в магазине «Звездочка» Продукт Ед. изм. Базисный период Отчетный период стоимость товаров базисного периода, руб. стоимость товаров отчетного периода, руб. продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. в базисных ценах, руб. в отчетных ценах, руб. в базисных ценах, руб. в отчетных ценах, руб. А В 1 2 3 4 гр5=гр2* гр1 гр6=гр4* гр1 гр7=гр2* гр3 гр8=гр.4*гр.3 Говядина кг 12800 150 15360 155 1920000 1984000 2304000 2380800 Свекла кг 4200 23 5040 25 96600 105000 115920 126000 Молоко л 1800 27 2160 29 48600 52200 58320 62640 Итого: Х Х Х Х 2065200 2141200 2478240 2569440 Определить: как в среднем изменились цены на все продукты (или какова средняя величина изменения цен на все продукты, рассчитаем сводный (общий) индекс цен в форме агрегатного индекса: Индекс цен по формуле Пааше: (9.2.4.) (1,037*100-100=+3,7 (%)) или 103,7%, т.е. реальный рост стоимости продукции за счет изменения цен в отчетной периоде по сравнению с базисным на все группы товаров В СРЕДНЕМ составил 1,037 раза или 103,7% или прирост +3,7%. Индекс цен по формуле Ласпейреса (9.2.5.) или 103,7%, т.е. цены по всем товарам в отчетном периоде по сравнению с базисным возросли на все группы товаров в среднем в 1,037 раза или на 3,7% Рассчитаем индекс физического объема продукции: (9.2.6.) или 120,0% В результате изменения физической массы товаров СРЕДНЕЕ увеличение количества продаж по всем товарам составило в отчетном периоде по сравнению с базисным 20,0%, т.е. физический объем реализации возрос в 1,2 раза. Вычислим общий индекс товарооборота: (раза) (9.2.7.) Выручка от продаж всех товаров в отчетном периоде по сравнению с базисным возросла и за счет изменения цен и за счет изменения физической массы проданных товаров в среднем в 1,244 раза или на 24,4% 9.3. Индексы средние из индивидуальных Средний индекс – это индекс, исчисленный как средняя величина из индивидуальных индексов. Эти индексы применяются в тех случаях, когда в исходной информации нет данных для расчетов индексов в агрегатной форме. Получают средний индекс путем замены в исходном агрегатном индексе индексируемого показателя его выражением, выведенным из индивидуального индекса. Если такая замена производится в ЧИСЛИТЕЛЕ исходного агрегатного индекса, то получаем средний арифметический индекс, а если в ЗНАМЕНАТЕЛЕ – средний гармонический индекс. Пример 9.3.1. Имеются данные о продаже овощей в магазине «7&11» Виды овощей Товарооборот в базисном периоде, тыс. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Свекла 6800 +4 1,04 (100+4):100=1,04 или (1,000+0,040)=1,040 Морковь 10500 +6 1,06 Капуста 4700 +12 1,12 Итого: 22000 - - Рассчитать индекс физического объема реализации в среднем по всем товарам. (9.2.6.), но у нас нет данных по числителю формулы, но: (9.2.2.), тогда . теперь подставим полученное выражение в формулу (9.2.6.) и получим: (9.3.1.) , т.е. физический объем реализации по всем товарам в среднем возрос в 1,067 раза или на 6,7% в отчетном периоде по сравнению с базисным периодом. Пример 9.3.2. Имеются данные о продаже фруктов в магазине «KL» Виды фруктов Товарооборот в отчетном периоде, тыс. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Груши 5800 +2 1,02 Виноград 9500 +6 1,06 Яблоки 4200 +15 1,15 Итого: 19500 - - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Исходный агрегатный индекс цен (Пааше) имеет вид: (9.2.4.) , но у нас нет данных знаменателя формулы, хотя: ,(9.2.1.), следовательно , тогда индекс цен Пааше примет вид: (9.2.7.) и получим: (+6,6%),т.е. цены в среднем по всем товарам возросли в отчетном периоде по сравнению с базисным периодом в 1,066 раза или на 6,6% Схема 9.3.1. Общее правило применения средних индексов 9.4. Взаимосвязь индексов. Индексный метод выявления влияния роли отдельных факторов. Все три индекса товарооборота цен (по Пааше) физического объема тесно связаны между собой: индекс товарооборота есть произведение индекса цен (по Пааше) и физического объема , проверим это: и (9.4.1.) проверим по условию нашей задачи =1,037*1,2=1,244 (Верно) у нас: (9.2.7.) Это взаимоотношение (9.4.1.) выражает индексную факторную модель, которая позволяет разложить индекс товарооборота по отдельным факторам: По индексу цен (Пааше) По индексу физического объема Кроме факторной модели существует возможность выразить изменение товарооборота в абсолютном выражении, разложив его по двум факторам, для этого необходимо в соответствующих формулах определить РАЗНОСТЬ между ЧИСЛИТЕЛЕМ и ЗНАМЕНАТЕЛЕМ формул: 1.Общий абсолютный прирост товарооборота на основе формулы выражается тогда = 2569440-2065200= +504240 (руб.) (9.2.8.), т.е. товарооборот в отчетном периоде по сравнению с базисным возрос и за счет изменения цен и за счет изменения физической массы проданных товаров на 504240 руб. 2. Абсолютный прирост товарооборота за счет изменения цен на основе формулы индекса цен Пааше 2569440-2478240=+91200 (руб.) (9.2.9.) Стоимость реализованной продукции в результате роста цен в отчетном периоде по сравнению с базисным по всем товарам возросла на 91200 руб. 3. Абсолютный прирост товарооборота за счет изменения физической массы проданного товара на основе формулы = 2478240-2065200= +413040 (руб.)(9.2.10.) составил 413040 руб. Сделаем проверку (9.2.11) 504240 = 91200 + 413040 (ВЕРНО!!!) Взаимосвязь между индексами можно получить также, если использовать формулы средних из индивидуальных индексов (средние арифметические и средние гармонические). 9.5. Индексы постоянного и переменного состава. Индексы фиксированной структуры. При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) СРЕДНЕЙ величины индексируемого показателя для определенной однородной совокупности. Например, средней номинальной заработной платы в отдельных видах экономической деятельности. Будучи сводной характеристикой качественного показателя, средняя величина складывается как под влиянием значений показателя у индивидуальных элементов (единиц), из которых состоит объект, так и под влиянием соотношения их весов (структуры объекта). Если любой качественный индексируемый показатель обозначить через , а его веса через , то динамику среднего показателя можно отразить как за счет изменения обоих факторов ( и ), так и за счет каждого фактора отдельно. В результате получим три различных индекса: Индекс переменного состава; Индекс фиксированного состава; Индекс структурных сдвигов. Все рассмотренные выше индексы рассчитывались по нескольким товарам, реализуемым в одном месте. Рассмотрим теперь случай, когда ОДИН товар реализуется в нескольких местах. Пример 9.5.1. Проведем анализ изменения цен реализации товара «А» в двух регионах Таблица 9.5.1. Реализация товара «А» в двух регионах Регион Июнь Июль Расчетные графы Цена, руб. Продано, тыс.шт. Доля продаж в базисном периоде Цена, руб. Продано, тыс.шт. Доля продаж в отчетном периоде Товаро- оборот в базисном периоде товарооборот в отчетном периоде товарооборот в отчетном периоде по базисным ценам А 1 2 3 4 5 6 Гр7= гр1*гр2 Гр8= Гр4*гр5 Гр9= гр1*гр5 Москва 12 16 0,516 14 17,5 0,593 192 245 210 С.Петербург 16 15 0,484 20 12 0,407 240 240 192 Итого х 31 1,000 х 29,5 1,000 432 485 402 Изменение средней цены (индекс цен переменного состава) в отчетном периоде по сравнению с базисным складывается под влиянием двух факторов: 1.изменения средней цены в двух регионах под влиянием изменения уровня цен в каждом регионе (без учета структурных сдвигов) (индекс цен постоянного состава); 2.изменения средней цены под влиянием изменения ДОЛИ продаж каждого региона с разным уровнем цен в общем объеме продаж (индекс структурных сдвигов) в отчетном периоде по сравнению с базисным 1. Индекс переменного состава отражает динамику среднего показателя (для однородной совокупности) за счет индексируемой величины у отдельных элементов (частей целого) и за счет изменения весов , по которым взвешиваются отдельные значения . 1. Индекс переменного состава отражает динамику среднего показателя (для однородной совокупности) за счет индексируемой величины у отдельных элементов (частей целого) и за счет изменения весов , по которым взвешиваются отдельные значения . Любой индекс переменного состава – это отношение двух средних величин для однородной совокупности (за два периода или по двум территориям). (9.5.1.) Вычислим индекс цен переменного состава (индекс отношения средних значений показателя): раза или 117,9% (9.5.1.) Из расчетов следует, что средняя цена товара «А» в двух регионах возросла в июле по сравнению с июнем в 1,179 раза или на 17,9%. 2. Индекс фиксированного (постоянного) состава отражает динамику среднего показателя лишь за счет изменения индексируемой величины при фиксировании весов на уровне, как правило,отчетного периода . (9.5.2.) Другими словами, индекс фиксированного состава исключает влияние изменения структуры (состава) совокупности на динамику средних величин, т.е. он характеризует динамику средних величин, рассчитанных для двух периодов по одной и той же фиксированной структуре весов. Вычислим индекс цен фиксированного состава, он не учитывает изменение структуры. раза или 120,6% (9.5.3.), Вывод: рост средней цены в двух регионах в отчетном периоде по сравнению с базисным под влиянием изменения уровня цен в каждом регионе (без учета структурных сдвигов) составил 1,206 раза или прирост на 20,6% (индекс цен постоянного состава) 3. Индекс структурных сдвигов характеризует динамику среднего показателя лишь за счет изменения весов при фиксировании индексируемой величины на уровне базисного периода : (9.5.3.) Вычислим индекс структурных сдвигов, он характеризует и изменение индивидуальных цен в местах продаж, и изменение структуры реализации по предприятиям розничной или оптовой торговли, рынкам, городам, регионам: раза или 97,8% снижение на 2,2%. (9.5.3.) Вывод: снижение средней цены под влиянием изменения ДОЛИ продаж каждого региона с разным уровнем цен в общем объеме продаж (индекс структурных сдвигов) в отчетном периоде по сравнению с базисным составил 2,2%. Первая часть этого выражения позволяет ответить на вопрос, какой была бы средняя цена в июле, если бы цены в каждом регионе сохранились бы на прежнем июньском уровне. Вторая часть отражает фактическую среднюю цену июня. В целом по полученному значению индекса мы можем сделать вывод, что за счет структурных сдвигов цены возросли в 0,978 раза или снизились на 2,2%. Между данными индексами существует взаимосвязь: (9.5.4.), проверим это выражение: 1,206 * 0,978 = 1,179 ВЕРНО!!! ПРАКТИЧЕСКОЕ ЗАНЯТИЕ Задача 01 Рассчитать аналитические и средние показатели годовых изменений уровней ряда, сделать соответствующие выводы. Таблица 1. Объем реализации по изделию «N» по одному региону РФ в тыс. тонн. Объем реализации, тыс. тонн. Абсолютный прирост, млн. руб. Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста,. Цепной Цепной Цепной 1 2 3 4 5 6 1 860,000 2 860*1.035=890.1 890-860=30 103.5 +3,5 8.6 3 890.1+12=902,1 +12 902,1/890.1*100=101.3 +1.3 8.9 4 902.1*1.024=923.75 21.65 102,4 +2.4 9.02 5 100.5 +0,5 923.75*1.005=928.36 4.6 9.24 Средний уровень ряда – Средний абсолютный прирост – Средний темп роста – Средний темп прироста - Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста,. Цепной Цепной Цепной 1 2 3 4 5 6 1 860 2 860*1,035=890,1 +30,1 103,5 +3,5 8,6 3 890,1+12=902,1 +12 902,1/890,1= 101,3 +1,3 8,9 4 902,1*1,024=923,750 +21,65 102,4 +2,4 9,02 5 923,750*1,005=928,369 +4,619 100,5 +0,5 9,24 Итого: Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс.тонн Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста,. Цепной Цепной Цепной 1 2 3 4 5 6 1 860 - - - - 2 860*1,035=890,1 30,1 103,5 3,5 8,6 3 890,1+12=902,1 12 101,3 1,3 8,901 4 902,1*1,024=923,75 21,65 102,4 2,4 9,021 5 923,75*1,005=928,369 4,619 100,5 0,5 9,238 Итого: 4504,319 68,369 1. Средний уровень ряда динамики () характеризует типичную величину уровней ряда. тыс.тонн где n- число уровней ряда. Вывод: средний объем реализации товара в одном из регионов. составил 900,864 тыс. тонн 2. Средний абсолютный прирост () где n- число уровней ряда. 3. Средний темп роста () – , где величины Трiц выражены в коэффициентах, или же по формуле , (8.3.8.) где n – число уровней ряда. или 101,9% 4. Средний темп прироста () рассчитывают с использованием среднего темпа роста: В нашем случае: % Вывод. Как показывают данные табл., объем товарооборота постоянно возрастал. В целом за исследуемый период объем реализации продукции возрос на……68,369…………….., тыс. тонн или на …7,95……………% .Рост объема реализации продукции носит …волнообразный…… характер, что подтверждается изменяющимися значениями цепных абсолютных приростов - с …30,1….. до ……4,619…… тыс. тонн. (гр.4) и цепных темпов прироста - с ……3,5%………… до ……0,5%……………….(гр.8). Увеличение объемов реализации продукции ……подтверждается………. также систематически возрастающей величиной абсолютного значения 1% прироста - с …8,6…… до ……9,238…тыс. тонн (гр.9). Задача 2 . Имеются данные о расходе топлива в организации поквартально за 3 года. Рассчитать индексы сезонности и построить график сезонной волны. Таблица 8.4.1. Расчетная таблица для вычисления индекса сезонности Квартал Расход топлива за период, тыс. тн Сумма за три года, тыс. тн. Средне- квартальный расход за 3 г., тыс. тн. Индекс сезонности, % 2008 2009 2010 1 2 3 4 гр5= гр2+гр3+ гр4 гр6=гр5/гр3 гр7=гр6/средн.гр.6*100 1 квартал 20 22 24 66 22 83,019 2 квартал 40 42 44 126 42 158,490 3 квартал 22 24 26 72 24 90,566 4 квартал 16 18 20 54 18 67,924 Итого: 98 106 114 318 26,5 399,999 СУММА СРЕДНЯЯ СУММ из СРЕДНИХ за квартал Задача 2 . Имеются данные о расходе топлива в организации поквартально за 3 года. Рассчитать индексы сезонности и построить график сезонной волны. Таблица 8.4.1. Расчетная таблица для вычисления индекса сезонности Квартал Расход топлива за период, тыс. тн Сумма за три года, ты. тн. Средне- квартальный расход за 3 г., тыс. тн. Индекс сезонности, % 2008 2009 2010 1 2 3 4 гр5= гр2+гр3+ гр4 гр6=гр5/гр3 гр7=гр6/средн.гр.6*100 1 квартал 20 22 24 66 22 83 2 квартал 40 42 44 126 42 158,5 3 квартал 22 24 26 72 24 90,6 4 квартал 16 18 20 54 18 67,9 Итого: 318 26,5 СУММА СРЕДНЯЯ СУММ из СРЕДНИХ за квартал Квартал Расход топлива за период, тыс. тн Сумма за три года, ты. тн. Средне- квартальный расход за 3 г., тыс. тн. Индекс сезонности, % 2008 2009 2010 1 2 3 4 гр5= гр2+гр3+ гр4 гр6=гр5/3 гр7=гр6/средн.гр.6*100 1 квартал 20 22 24 66 22 22/26,5*100=83,0 2 квартал 40 42 44 126 42 158,5 3 квартал 22 24 26 72 24 90,6 4 квартал 16 18 20 54 18 67,9 Итого: 98 106 114 318 318/12=26,5 СУММА СРЕДНЯЯ СУММ из СРЕДНИХ за квартал Индекс сезонности рассчитывается: , где: - средние по периодам; - общий средний уровень ряда. Для нашей задачи (данные по январю): 1.Рассчитаем сначала расход топлива всего за 3 года по итоговым графам : 66+126+72+54=318 (тыс.тонн) 2.Рассчитаем среднеквартальный расход топлива в каждом квартале за 3 года (средняя из средних); 318/12=26,5 (тыс.тонн). 3.Исчислим индекс сезонности (в нашем примере для первого квартала) 4. На основе данных построим график сезонной волны. Гр. 8.5.1. график сезонной волны расхода топлива организацией (t). Пример 3. Пример 3. Имеются данные о продажах в гипермаркете «7-11» Виды товарных групп Товарооборот в базисном периоде, млн. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Кондитерские изделия 212,4 +2,3 1,023 Фрукты 306,5 -0,5 0,995 Мясные изделия 850,7 +16,3 1,163 Итого: 1369,6 - - Рассчитать индекс физического объема реализации в среднем по всем товарам. Имеются данные о продажах в гипермаркете «7-11» Виды товарных групп Товарооборот в базисном периоде, млн. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Кондитерские изделия 212,4 +2,3 1,023 Фрукты 306,5 -0,5 0,995 Мясные изделия 850,7 +16,3 1,163 Итого: 1369,6 - - Имеются данные о продажах в гипермаркете «7-11» Виды товарных групп Товарооборот в базисном периоде, млн. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Кондитерские изделия 212,4 +2,3 1,023 Фрукты 306,5 -0,5 0,995 Мясные изделия 850,7 +16,3 1,163 Итого: 1369,6 - Рассчитать индекс физического объема реализации в среднем по всем товарам. , но у нас нет данных по числителю формулы, но: , тогда . теперь подставим полученное выражение в формулу и получим: , т.е. физический объем реализации по всем товарам в среднем возрос в 1,104 раза или на 10.4 % в отчетном периоде по сравнению с базисным периодом. Пример 4. Имеются данные о продаже товаров в магазине «Огонек» Виды товаров Товарооборот в отчетном периоде, млн. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Шоколад 100,5 -7,3 0,927 Пирожные 29,2 +16,5 1.165 Мороженое 44,6 +23,7 1.237 Итого: 174,3 - - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Имеются данные о продаже товаров в магазине «Огонек» Виды товаров Товарооборот в отчетном периоде, млн. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Шоколад 100,5 -7,3 0,927 (100-7,3)/100 Пирожные 29,2 +16,5 1,165 Мороженое 44,6 +23,7 1,237 Итого: 174,3 - - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Исходный агрегатный индекс цен (Пааше) имеет вид: , но у нас нет данных знаменателя формулы, хотя: , следовательно , тогда индекс цен Пааше примет вид: и получим: (+2,8%),т.е. цены в среднем по всем товарам возросли в отчетном периоде по сравнению с базисным периодом в 1,028 раза или на 2,8% Пример 9.2.2. Таблица 9.2.3. Данные о реализации продукции в магазине «7-11» Продукт Ед. изм. Базисный период Отчетный период стоимость товаров базисного периода, руб. стоимость товаров отчетного периода, руб. продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. в базисных ценах, руб. в отчетных ценах, руб. в базисных ценах, руб. в отчетных ценах, руб. А В 1 2 3 4 гр5=гр2* гр1 гр6=гр4* р1 гр7=гр2* гр3 гр8=гр.4*гр.3 Говядина кг 12 190 15 132 Свекла кг 42 45 50 26 Молоко л 90 27 98 29 Итого: Определить: как в среднем изменились цены на все продукты (или какова средняя величина изменения цен на все продукты, рассчитаем сводный (общий) индекс цен в форме агрегатного индекса: Индекс цен по формуле Пааше: (9.2.4.) или 103,7%,.т.е. реальное изменение стоимости продукции за счет роста цен в отчетной периоде по сравнению с базисным на все группы товаров В СРЕДНЕМ возрасло в 1,037 раза или на 3,7%. Индекс цен по формуле Ласпейреса (9.2.5.) или 103,7%, т.е. цены по всем товарам в отчетном периоде по сравнению с базисным возросли на все группы товаров в среднем в 1,037 раза или на 3,7% Рассчитаем индекс физического объема продукции: (9.2.6.) или на 20,0% В результате изменения физической массы товаров СРЕДНЕЕ увеличение количества продаж по всем товарам составило в отчетном периоде по сравнению с базисным 20,0%,т.е. физический объем реализации возрос в 1,2 раза Вычислим общий индекс товарооборота: (9.2.7.) Выручка от продаж всех товаров в отчетном периоде по сравнению с базисным возросла в среднем на 24,4% Дз-8 Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста, тыс. тонн Базис-ный Цеп-ной Базисный Цепной Базисный Цепной 1 2 3 4 5 6 7 8 9 1 1020 - - 100 100 0,00 0,00 - 2 +2 3 102,5 4 +1,8 5 -9 6 +2 7 0,998 8 +4 Имеются данные о продаже товаров в магазине «Огонек» Виды товаров Товарооборот в отчетном периоде, млн. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Молочные продукты 100,5 +0,5 1,005 Мясные изделия 92,7 -2,3 (100-2,3)/100=0,997 Крупы 44,8 - 1 Итого: 238 - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Исходный агрегатный индекс цен (Пааше) имеет вид: (9.2.4.) , но у нас нет данных знаменателя формулы, хотя: ,(9.2.1.), следовательно , тогда индекс цен Пааше примет вид: (9.2.7.) и получим: (-0,7%),т.е. цены в среднем по всем товарам снизились в отчетном периоде по сравнению с базисным периодом на 0,7% Имеются данные о продажах в гипермаркете «7-11» Виды товарных групп Товарооборот в базисном периоде, млн. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Кондитерские изделия 212,8 +0,5 (100+0,5)/100=1,005 Фрукты 306,5 -19,4 (100-19,4)/100=0,806 Мясные изделия 850,7 +19,9 (100+19,9)/100=1,199 Итого: 1370 - - Рассчитать индекс физического объема реализации в среднем по всем товарам. Рассчитать индекс физического объема реализации в среднем по всем товарам. (9.2.6.), но у нас нет данных по числителю формулы, но: (9.2.2.), тогда . теперь подставим полученное выражение в формулу (9.2.6.) и получим: (9.3.1.) , т.е. физический объем реализации по всем товарам в среднем возрос в 1,081 раза или на 8,1% в отчетном периоде по сравнению с базисным периодом. Пример 9.3.2. Имеются данные о продаже фруктов в магазине «KL» Виды фруктов Товарооборот в отчетном периоде, тыс. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Груши 5800 +2 1,02 Виноград 9500 +6 1,06 Яблоки 4200 +15 1,15 Итого: 19500 - - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Исходный агрегатный индекс цен (Пааше) имеет вид: (9.2.4.) , но у нас нет данных знаменателя формулы, хотя: ,(9.2.1.), следовательно , тогда индекс цен Пааше примет вид: (9.2.7.) и получим: (+6,6%),т.е. цены в среднем по всем товарам возросли в отчетном периоде по сравнению с базисным периодом в 1,066 раза или на 6,6% товар Ед. изм. Базисный период Отчетный период продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. А В 1 2 3 4 1 кг 12 85 7 89 2 кг 45 120 47 144 3 л 9 45 11 41 Итого: Таблица 9.2.3. Данные о реализации продукции в магазине «7-11» Продукт Ед. изм. Базисный период Отчетный период стоимость товаров базисного периода, руб. стоимость товаров отчетного периода, руб. продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. в базисных ценах, руб. в отчетных ценах, руб. в базисных ценах, руб. в отчетных ценах, руб. А В 1 2 3 4 гр5=гр2* гр1 гр6= гр4*гр1 гр7=гр2* гр3 гр8=гр.4*гр.3 1 кг 12 85 7 89 1020 1068 595 623 2 кг 45 120 47 144 5400 6480 5640 6768 3 л 9 45 11 41 405 369 495 451 Итого: х Х Х Х Х 6825 7917 6730 7842 Определить: как в среднем изменились цены на все продукты (или какова средняя величина изменения цен на все продукты, рассчитаем сводный (общий) индекс цен в форме агрегатного индекса: Индекс цен по формуле Пааше: (9.2.4.) или 16,5%,.т.е. реальное изменение стоимости продукции за счет роста цен в отчетной периоде по сравнению с базисным на все группы товаров В СРЕДНЕМ увеличилась в 1,165 раза или на 16,5%. Индекс цен по формуле Ласпейреса (9.2.5.) или 116,0%, т.е. цены по всем товарам в отчетном периоде по сравнению с базисным возросли на все группы товаров в среднем в 1,160 раза или на 16,0% Рассчитаем индекс физического объема продукции: (9.2.6.) или на -1,4% В результате изменения физической массы товаров СРЕДНЕЕ снижение количества продаж по всем товарам составило в отчетном периоде по сравнению с базисным 1,4%,т.е. физический объем реализации сократился в 0,986 раз Вычислим общий индекс товарооборота: (9.2.7.) Выручка от продаж всех товаров в отчетном периоде по сравнению с базисным возросла в среднем в 1,149 раза или на 14,9% 1.Общий абсолютный прирост товарооборота на основе формулы выражается тогда = 7842-6825= +1017 (руб.) (9.2.8.), т.е. товарооборот в отчетном периоде по сравнению с базисным возрос и за счет изменения цен и за счет изменения физической массы проданных товаров на 1017 руб. 2. Абсолютный прирост товарооборота за счет изменения цен на основе формулы индекса цен Пааше 7842-6730=+1112 (руб.) (9.2.9.) Стоимость реализованной продукции в результате роста цен в отчетном периоде по сравнению с базисным по всем товарам возросла на 1112 руб. 3. Абсолютный прирост товарооборота за счет изменения физической массы проданного товара на основе формулы = 6730-6825= -95 (руб.)(9.2.10.) составил -95 руб. Сделаем проверку (9.2.11) 1017 = 1112 + (-95) (ВЕРНО!!!) квартал Расход эл.энергии за период, тыс.кВт/час. Сумма за три года, тыс.кВт/час Среднемес. расход за 3 г., тыс.кВт/час. Индекс сезонности, % 2009 2010 2011 1 2 3 4 5 6 7 1 125 138 141 2 106 109 107 3 98 92 94 4 117 106 108 Итого: Задача 1 Задача 2 Ряд распределения организаций по численности работников Таблица1-пз № группы Группа организаций по численности персонала, чел. Число организаций, в абсолют-ном выраже-нии в % 1 2 3 4 1 До 50 2 2 50-75 19 3 75-100 54 4 100-125 21 5 Свыше 125 4 Итого 100 Определение ошибки выборки для средней численности персонала и границ, в которых будет находиться генеральная средняя По условию предыдущей задачи выборочная совокупность насчитывает 100 организаций, выборка 2% механическая, следовательно, генеральная совокупность включает = организаций. Значения параметров, необходимых для решения задачи, представлены в табл. 2-пз.: Таблица 2-ПЗ Исходные параметры для расчета средней ошибки выборки Р t n N 0,997 3 100 5000 89 397,75 Рассчитать среднюю ошибку выборки для среднесписочной численности персонала в генеральной совокупности и границы, в которых будет находиться генеральная средняя Расчет средней ошибки выборки по формуле (6.3.1.): , Расчет предельной ошибки выборки по формуле (6.3.3.): Определение по формуле (6.3.2.) доверительного интервала для генеральной средней: 89,0-5,92389,0+5,923 83,077 (чел.) 94,923 (чел.) Вывод. На основании проведенного выборочного обследования организаций с вероятностью 0,997 можно утверждать, что для генеральной совокупности организаций среднее значение среднесписочной численности персонала находится в пределах от 83,077 чел. до 94,923 чел. Для нашей задачи определим ошибку выборки для доли организаций с величиной численности персонала 100 чел и выше, а также границы, в которых будет находиться генеральная доля Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой , где m – число единиц совокупности, обладающих заданным свойством; n – общее число единиц в совокупности. Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле , где w – доля единиц совокупности, обладающих заданным свойством; (1-w) – доля единиц совокупности, не обладающих заданным свойством, N – число единиц в генеральной совокупности, n– число единиц в выборочной совокупности. Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством: (6.3.6) По условию задачи исследуемым свойством является равенство или превышение величины численности персонала 100 чел. Распределение банков по объему кредитных вложений № группы Группа организаций по численности персонала, чел. Число организаций, f 1 До 50 2 2 50-75 19 3 75-100 54 4 100-125 21 5 Свыше 125 4 Итого: 100 m=25 Расчет выборочной доли по формуле (6.3.4.): Расчет по формуле (6.3.5.) предельной ошибки выборки для доли: Определение по формуле (6.3.5.) доверительного интервала генеральной доли: 0,122 0,378 (доли единицы) или 12,2% 37,8% (проценты) Вывод. С вероятностью 0,997 можно утверждать, что в генеральной совокупности организаций доля организаций с численностью персонала 100 чел и выше будет находится в пределах от 12,2% до 37,8%. Таблица 5.1.4. Расчетная таблица для нахождения характеристик ряда распределения Группа организа-ций по численнос-ти персонала, чел. X Середина интервала Число организа- ций, Произведе- ние вариантов на частоты 1 2 3 гр.4= гр.2*гр.3 5 гр.6= гр.5*гр.5 гр.7= гр.6*гр.3 До 50 37.5 2 75 50-75 62.5 19 1187.5 75-100 87.5 54 4725 100-125 112.5 21 2362.5 Свыше 125 137.5 4 550 Итого 100 8900 39775 Расчет средней арифметической взвешенной: Расчет среднего квадратического отклонения: Расчет коэффициента вариации: Вывод: на основании полученного коэффициента вариации можно сделать вывод о том,что найденная среднее значение среднесписочной численности организации – 89,1 чел. является надежной ,типичной характеристикой для всей совокупности организации т.к. коэффициент вариации ≤ 33%. Пример3. Имеются данные о продаже товаров в магазине «А» Виды товаров Товарооборот в базисном периоде, тыс. руб. Изменение физического объема реализации в текущем периоде по сравнению с базисным, % Индексы физического объема реализации в текущем периоде по сравнению с базисным Конфеты «а» 125 +0,8 (100+0,8)/100= 1,008 Конфеты «б» 856 +11,9 1,119 Конфеты «в» 219 -0,5 0,995 Итого: 1200 - - Рассчитать индекс физического объема реализации в среднем по всем товарам. (9.2.6.), но у нас нет данных по числителю формулы, но: (9.2.2.), тогда . теперь подставим полученное выражение в формулу (9.2.6.) и получим: (9.3.1.) , т.е. физический объем реализации по всем товарам в среднем возрос в 1,085 раза или на 8,5% в отчетном периоде по сравнению с базисным периодом. Пример 9.3.2. Имеются данные о продаже круп в магазине «С» Виды круп Товарооборот в отчетном периоде, тыс. руб. Изменение цен в отчетном периоде по сравнению с базисным, % Индексы цен в текущем периоде по сравнению с базисным, Овсяная 8500 +2,3 Гречневая 16250 -1,5 Рис 4450 +8,7 Итого: - - Рассчитать индекс цен (по методу Пааше) в среднем по всем товарам. Исходный агрегатный индекс цен (Пааше) имеет вид: (9.2.4.) , но у нас нет данных знаменателя формулы, хотя: ,(9.2.1.), следовательно , тогда индекс цен Пааше примет вид: (9.2.7.) и получим: (+6,6%),т.е. цены в среднем по всем товарам возросли в отчетном периоде по сравнению с базисным периодом в 1,066 раза или на 6,6% Распределение организаций по размеру средмесячной заработной платы № группы Группа организаций по размеру средней месячной заработной платы, руб. Число организаций, f 1 До 15 2 2 15-30 6 3 30-45 32 4 45-60 7 5 Свыше 60 3 Итого: 50 Объем реализации по изделию «А» (кг) Годы (t) Объем реали-зации, кг. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-ние 1% при-роста, кг Базис-ный Цеп-ной Базисный Цепной Базисный Цепной 1 2 3 4 5 6 7 8 9 1 128 - 100 100 0,00 0,00 - 2 134 6 +6 104,7 104,7 4,7 4,7 1,28 3 145,658 17,658 +11,658 113,8 108,7 13,8 8,7 1,34 4 147,843 19,843 +2,185 115,5 101,5 15,5 1,5 1,46 5 147,104 19,104 -0,739 114,9 99,5 14,9 -0,5 1,48 6 143,279 15,279 -3,825 111,9 97,4 11,9 -2,6 1,47 Итого 845,884 х 15,279 х Вывод: средний объем реализации товара «А» за исследуемый период составил 140,981 кг. 2. Средний абсолютный прирост () является обобщающей характеристикой индивидуальных абсолютных приростов и определяется как простая арифметическая средняя из цепных абсолютных приростов: (8.3.5.) где n- число уровней ряда. Абсолютный прирост, тыс. тонн. . Годы (t) Цепной 1 - 2 +6 3 +11,658 4 +2,185 5 -0,739 6 -3,825 где N - число цепных абсолютных приростов, у нас 6-1=5! Эта формула может быть преобразована исходя из взаимосвязи базисных и цепных абсолютных приростов (8.3.6.); n – число уровней ряда Для таблицы 8.1.6. Годы (t) Объем продаж товара, тыс. тонн 1 128 2 134 3 145,658 4 147,843 5 147,104 6 143,279 3. Средний темп роста () – это сводная обобщающая характеристика интенсивности изменения уровней ряда, показывающая во сколько раз изменялись уровни ряда в среднем за единицу времени. Показатель может быть рассчитан по формуле средней геометрической простой: , (8.3.7.) где величины Трiц выражены в коэффициентах роста, или же по формуле , (8.3.8.) когда отсутствует перелом в тенденции где n – число уровней ряда. или 102,3% 4. Средний темп прироста () рассчитывают исходя из среднего темпа роста: (8.3.9.) В нашем случае: Вывод. За исследуемый период средний объем реализации товара «А» составил 140,981 кг. Выявлена волнообразная динамика реализации товара «А»: ежегодный рост объема реализации составлял в среднем 3,056 кг или 2,3%. Прогнозирование уровня ряда динамики с использованием среднего абсолютного прироста осуществляется по следующей формуле: , (8.4.1.) где: – прогнозируемый уровень; t – период упреждения (число лет, кварталов и т.п.); yi – базовый для прогноза уровень – в нашем случае – последний уровень, за 6 год; – средний за исследуемый период абсолютный прирост (среднегодовой, среднеквартальный и т.п.). Прогнозируемый объем реализации продукции на 8 год (по данным шестилетнего периода) с использованием среднего абсолютного прироста, рассчитанного ранее, исчисляется следующим образом: Прогнозирование объемов реализации продукции с использованием среднего темпа роста Если в ряду динамики стабильны (примерно равны) цепные темпы роста, то экстраполяцию осуществляют через показатель среднего темпа роста. Прогнозирование уровня ряда динамики с использованием среднего темпа (коэффициента) роста осуществляется по следующей формуле: (8.4.1.) где: – средний за исследуемый период темп роста (среднегодовой, среднеквартальный и т.п.), выраженный в виде КОЭФФИЦИЕНТА! Прогнозируемый объем реализации продукции на восьмой год (по данным шестилетнего периода) с использованием среднего темпа роста, рассчитанного ранее, исчисляется следующим образом: Различия в прогнозных оценках возникли из-за того, что мы применили разные методики расчета этих значений. Пример 9.2.2. Таблица 9.2.3. Данные о реализации продукции в магазине «В» Продукт Ед. изм. Базисный период Отчетный период стоимость товаров базисного периода, руб. стоимость товаров отчетного периода, руб. продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. в базисных ценах, руб. в отчетных ценах, руб. в базисных ценах, руб. в отчетных ценах, руб. А В 1 2 3 4 гр5=гр2* гр1 гр6=гр4* гр1 гр7=гр2* гр3 гр8=гр.4*гр.3 Цветы шт. Газ .вода Бут, шт. Конфеты Шт. Кор. Итого: Данные о реализации продукции в магазине «В» Продукт Ед. изм. Базисный период Отчетный период продано, ед. Цена за единицу, руб. продано, ед. Цена за единицу, руб. А В 1 2 3 4 Москва 890 25 760 32 Орел 180 35 220 38 Владимир 144 120 122 132 Итого: Определить: как в среднем изменились цены на все продукты (или какова средняя величина изменения цен на все продукты, рассчитаем сводный (общий) индекс цен в форме агрегатного индекса: Индекс цен по формуле Пааше: (9.2.4.) (1,037*100-100=+3,7 (%)) или 103,7%, т.е. реальный рост стоимости продукции за счет изменения цен в отчетной периоде по сравнению с базисным на все группы товаров В СРЕДНЕМ составил 1,037 раза или 103,7% или прирост +3,7%. Индекс цен по формуле Ласпейреса (9.2.5.) или 103,7%, т.е. цены по всем товарам в отчетном периоде по сравнению с базисным возросли на все группы товаров в среднем в 1,037 раза или на 3,7% Рассчитаем индекс физического объема продукции: (9.2.6.) или 120,0% В результате изменения физической массы товаров СРЕДНЕЕ увеличение количества продаж по всем товарам составило в отчетном периоде по сравнению с базисным 20,0%, т.е. физический объем реализации возрос в 1,2 раза. Вычислим общий индекс товарооборота: (раза) (9.2.7.) Выручка от продаж всех товаров в отчетном периоде по сравнению с базисным возросла и за счет изменения цен и за счет изменения физической массы проданных товаров в среднем в 1,244 раза или на 24,4% Проведем анализ изменения цен реализации товара «А» в двух регионах Таблица 9.5.1. Реализация товара «А» в двух регионах Регион Базисный период Отчетный период Расчетные графы Цена, руб. Продано, тыс.шт. Доля продаж в базисном периоде Цена, руб. Продано, тыс.шт. Доля продаж в отчетном периоде Товаро- оборот в базисном периоде товарооборот в отчетном периоде товарооборот в отчетном периоде по базисным ценам А 1 2 3 4 5 6 Гр7= гр1*гр2 Гр8= Гр4*гр5 Гр9= гр1*гр5 Москва 25 890 32 760 Орел 35 180 38 220 Владимир 120 144 132 122 Итого х х Вычислим индекс цен переменного состава (индекс отношения средних значений показателя): раза или 117,9% (9.5.1.) Из расчетов следует, что средняя цена товара «А» в двух регионах возросла в июле по сравнению с июнем в 1,179 раза или на 17,9%. 2. Индекс фиксированного (постоянного) состава отражает динамику среднего показателя лишь за счет изменения индексируемой величины при фиксировании весов на уровне, как правило,отчетного периода . (9.5.2.) Другими словами, индекс фиксированного состава исключает влияние изменения структуры (состава) совокупности на динамику средних величин, т.е. он характеризует динамику средних величин, рассчитанных для двух периодов по одной и той же фиксированной структуре весов. Вычислим индекс цен фиксированного состава, он не учитывает изменение структуры. раза или 120,6% (9.5.3.), Вывод: рост средней цены в двух регионах в отчетном периоде по сравнению с базисным под влиянием изменения уровня цен в каждом регионе (без учета структурных сдвигов) составил 1,206 раза или прирост на 20,6% (индекс цен постоянного состава) 3. Индекс структурных сдвигов характеризует динамику среднего показателя лишь за счет изменения весов при фиксировании индексируемой величины на уровне базисного периода : (9.5.3.) Вычислим индекс структурных сдвигов, он характеризует и изменение индивидуальных цен в местах продаж, и изменение структуры реализации по предприятиям розничной или оптовой торговли, рынкам, городам, регионам: раза или 97,8% снижение на 2,2%. (9.5.3.) Вывод: снижение средней цены под влиянием изменения ДОЛИ продаж каждого региона с разным уровнем цен в общем объеме продаж (индекс структурных сдвигов) в отчетном периоде по сравнению с базисным составил 2,2%. Первая часть этого выражения позволяет ответить на вопрос, какой была бы средняя цена в июле, если бы цены в каждом регионе сохранились бы на прежнем июньском уровне. Вторая часть отражает фактическую среднюю цену июня. В целом по полученному значению индекса мы можем сделать вывод, что за счет структурных сдвигов цены возросли в 0,978 раза или снизились на 2,2%. Между данными индексами существует взаимосвязь: (9.5.4.), проверим это выражение: 1,206 * 0,978 = 1,179 ВЕРНО!!!