«Теория статистики» - конспект лекции

Конспект лекции по дисциплине «Теория статистики», Word формат

Содержание Учебно-методическое обеспечение курса 2 Понятие о статистике 2 1. Абсолютные и относительные статистические величины 4 1.1. Абсолютные величины 4 1.2. Относительные величины 4 1.4. Методические указания по теме 6 1.5. Контрольные задания 7 2. Средние величины и показатели вариации 8 2.1. Понятие средней величины 8 2.2. Виды средних величин 8 2.3. Статистическое изучение вариации 11 2.4. Контрольные задания 19 3. Выборочное наблюдение 19 3.1. Понятие выборочного наблюдения 19 3.2. Способы формирования выборки 20 3.3. Средняя ошибка выборки 20 3.4. Предельная ошибка выборки 21 3.5. Необходимая численность выборки 21 3.6. Методические указания 22 3.7. Контрольные задания 23 4. РЯДЫ ДИНАМИКИ 23 4.1. Понятие о рядах динамики 23 4.2. Показатели изменения уровней ряда динамики 24 4.3. Средние показатели ряда динамики 25 4.4. Методы выявления основной тенденции (тренда) в рядах динамики 27 4.5. Оценка адекватности тренда и прогнозирование 30 4.6. Контрольные задания 31 5. Статистическое изучение взаимосвязей 32 5.1. Понятие корреляционной зависимости 32 5.2. Методы выявления и оценки корреляционной связи 34 5.3. Контрольные задания 41 6. ИНДЕКСЫ 41 6.1. Индивидуальные индексы 41 6.2. Простые общие индексы 43 6.3. Агрегатные общие индексы 43 6.4. Общие индексы как средние из индивидуальных 44 6.5. Индекс структурных сдвигов 45 6.6. Факторный анализ общей и частной выручки 45 6.7. Индексы фиксированного (постоянного) и переменного состава 46 6.8. Методические указания по теме 47 6.9. Контрольные задания 49 Приложения – статистические таблицы 50 Приложение 1. Значения интеграла Лапласа 50 Приложение 2. Значения t-критерия Стьюдента 51 Приложение 3. Значения F-критерия Фишера 52 Учебно-методическое обеспечение курса 1 Общая теория статистики: Учебник/ Под ред. И.И. Елисеевой. – 4-е изд., перераб. и доп. – М.: Финансы и статистика, 2002. – 480 с. 2 Статистика: Учеб. пособие / Под ред. В.Г. Ионина. – Изд. 2-е, перераб. и доп. – М.: ИНФРА-М, 2006. – 384 с. 3 Теория статистики: Учебник / Под ред. Г.Л. Громыко. – Изд. 2-е, перераб. и доп. – М.: ИНФРА-М, 2005. – 476 с. 4 Теория статистики: Учебник для вузов (под ред. Шмойловой Р.А.). – Изд. 4-е, доп., перераб. – М.: Финансы и статистика, 2007. – 656 с. 5 Чалиев А.А., Овчаров А.О. СТАТИСТИКА. Учебно-методическое пособие. Часть 1. – Нижний Новгород: Издательство Нижегородского госуниверситета, 2007.– 87 с. 6 http://www.chaliev.narod.ru – персональный сайт автора этого курса лекций Варианты заданий для контрольной работы выбираются по последней цифре в зачетной книжке: Последняя цифра зачетки 1 2 3 4 и т.д. Номер варианта контрольной работы 10 1 2 3 4 и т.д. Для получения оценки «ЗАЧТЕНО» за контрольную работу необходимо верно выполнить не менее 50% заданий (то есть задания к 3 темам из 6). Понятие о статистике В науку термин «статистика»1 ввел немецкий ученый Готфрид Ахенваль в 1746 году, заменив название курса «Государствоведение», преподававшегося в университетах Германии, на «Статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины. Несмотря на это, статистический учет велся намного раньше: проводились переписи населения в Древнем Китае, осуществлялось сравнение военного потенциала государств, велся учет имущества граждан в Древнем Риме и пр. У истоков статистической науки стояли 2 школы: немецкая описательная и английская школа политических арифметиков. Представители описательной школы (Конринг, Ахенваль, Шленцер) своей задачей считали описание достопримечательностей государства: территории, населения, климата, политического устройства, вероисповедания, торговли и т.п. – без анализа закономерностей и связей между явлениями. Представители школы политических арифметиков (Уильям Петти, Граунт, Галлей) своей главной задачей считали выявление на основе большого числа наблюдений различных закономерностей и взаимосвязей в изучаемых явлениях. Каждая школа развивалась своим путем, используя свои методы в исследованиях, но предмет изучения у них был общий – государство, общество и, в частности, массовые явления и процессы, происходящие в нем. Статистика сформировалась как наука в результате синтеза государствоведения и политической арифметики, причем от последней она взяла больше, поскольку статистика и в настоящее время призвана выявлять прежде всего различного рода закономерности в исследуемых явлениях. Однако представители этих двух школ не дошли до теоретического обобщения практики учетно-статистических работ, до создания теории статистики. Эта задача была решена позднее, в XIX веке бельгийским ученым Адольфом Кетле, который дал определение предмета статистики, раскрыл суть ее методов. Под влиянием идей Кетле возникло третье направление статистической науки – математико-статистическое, которое получило свое развитие в работах таких ученых как: англичане Гальтон, Пирсон, Госсет, Фишер, русские – Чебышёв, Марков, Ляпунов, Чупров и пр. В настоящее время данный термин употребляется в 4 значениях: 1) наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественным содержанием – учебный предмет в высших и средних специальных учебных заведений; 2) совокупность цифровых сведений, характеризующих состояние массовых явлений и процессов общественной жизни; статистические данные, представляемые в отчетности предприятий, организаций, отраслей экономики, а также публикуемых в сборниках, справочниках, периодической печати и в сети Интернет, которые являются результатом статистической работы; 3) отрасль практической деятельности («статистический учет») по сбору, обработке, анализу и публикации массовых цифровых данных о самых различных явлениях и процессах общественной жизни2; 4) некий параметр ряда случайных величин, получаемый по определенному алгоритму из результатов наблюдений, например, статистические критерии (критические статистики), применяющиеся при проверке различных гипотез (предположительных утверждений) относительно природы или значений отдельных показателей исследуемых данных, особенностей их распределения и пр.3 Как и любая другая наука, статистика имеет свой предмет и метод исследования. Статистика изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной или содержанием, а также исследует количественное выражение закономерностей общественного развития в конкретных условиях места и времени. Такое изучение основывается на системе категорий и понятий, отражающих наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира. Рассмотрим основные понятия, используемые в статистике. 1. Статистическая совокупность – множество социально-экономических объектов или явлений общественной жизни, объединенных качественной основой, но отличающихся друг от друга отдельными признаками. Таковы, например, совокупность домохозяйств, семей, предприятий и т.п. 2. Единица совокупности – первичный элемент статистической совокупности, являющийся носителем признаков и основой ведущегося при обследовании счета. 3. Признак единицы совокупности – свойства единицы совокупности, которые различаются способами их измерения и другими особенностями, что дает основание для их классификации 1. Таблица 1. Основная классификация признаков в статистике Параметр классификации Вид признака Пример признака По характеру выражения Описательные (атрибутивные) Цвет волос человека Количественные (числовые) Рост человека По способу измерения Первичные (объемные) Вес человека Вторичные (расчетные) Производительность труда По характеру вариации Альтернативные Пол человека Дискретные Возраст человека Интервальные Возраст группы людей По отношению ко времени Моментные Количество денег в кармане человека Периодные Заработная плата человека за месяц 4. Статистический показатель – понятие, отображающее количественные характеристики (размеры) или соотношения признаков общественных явлений. 5. Система статистических показателей – совокупность статистических показателей, отражающая взаимосвязи, которые объективно существуют между явлениями. Совокупность приемов, пользуясь которыми статистика исследует свой предмет, составляет метод статистики. Можно выделить 3 группы статистических методов (этапов статистического исследования): 1) статистическое наблюдение; 2) сводка (группировка) и 3) научный анализ исследуемых явлений. Научно организованный сбор сведений, заключающийся в регистрации тех или иных фактов, признаков, относящихся к каждой единице изучаемой совокупности, называется статистическим наблюдением. Обработка собранных первичных данных, включающая их группировку, обощение и оформление в таблицах, составляет второй этап статистического исследования, который называется сводкой. Существует 3 основных формы представления обработанных статистических данных: текстовая, табличная и графическая. На третьем этапе статистического исследования на основе итоговых данных сводки осуществляется научный анализ исследуемых явлений: рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т.п. На основе выявленных закономерностей делаются прогнозы на будущее. Люди по-разному относятся к статистической информации: одни не воспринимают ее, другие безоговорочно верят, а третьи согласны с мнением английского политика Дизраэли: «Существует 3 типа лжи: ложь, наглая ложь и статистика»4, однако ему же принадлежит следующее утверждение: «В жизни, как правило, преуспевает больше тот, кто располагает лучшей информацией»5 1. Абсолютные и относительные статистические величины 1.1. Абсолютные величины Результаты статистических наблюдений представляют собой абсолютные величины, отражающие уровень развития какого-либо явления или процесса (например, величина экспорта/импорта i-го товара в j-ю страну). Абсолютные величины обозначаются X, а их общее количество в статистической совокупности N. Абсолютные величины всегда имеют свою единицу измерения (размерность), присущую изучаемому явлению. Широко распространены следующие виды единиц измерения: 1) натуральные, подразделяющиеся на простые (например, штуки, тонны, метры) и сложные (составные), представляющие собой комбинацию двух разноименных величин (например, киловатт-час); 2) условно-натуральные (например, общая масса энергоносителей – дрова, торф, каменный уголь, нефтепродукты, природный газ – измеряется в т.у.т. – тонны условного топлива, поскольку каждый его вид имеет разную теплотворную способность, а за стандарт принято 29,3 МДж/кГ; общее количество школьных тетрадей измеряется в у.ш.т. – условные школьные тетради размером 12 листов; продукция консервного производства измеряется в у.к.б. – условные консервные банки емкостью 0,33 литра; продукция моющих средств приводится к условной жирности 40%.); 3) стоимостные, позволяющие соизмерить в денежной форме товары, которые нельзя соизмерить в натуральной форме (доллары США, рубли и т.д.). Количество единиц с одинаковым значением признака обозначается f и называется частота6. Очевидно, что суммируя число всех единиц с одинаковыми значениями признака7, получаем N, то есть (2): . (2) Анализируя абсолютные величины, например, статистические данные о торговле, необходимо сопоставлять эти данные во времени и пространстве, исследовать закономерности их изменения и развития, изучать структуру совокупностей. С помощью абсолютных величин эти задачи не выполнимы, в этом случае необходимо использовать относительные величины. 1.2. Относительные величины Относительная величина – это результат деления (сравнения) двух абсолютных величин. В числителе дроби стоит величина, которую сравнивают, а в знаменателе – величина, с которой сравнивают (база сравнения). Например, если сопоставить величины экспорта США и России, которые в 2005 году составили 904,383 и 243,569 млрд. долл. соответственно, то относительная величина покажет, что величина экспорта США в 3,71 раза (904,383/243,569) больше экспорта России, при этом базой сравнения является величина экспорта России. Полученная относительная величина выражена в виде коэффициента, который показывает, во сколько раз сравниваемая абсолютная величина больше базисной. В данном примере база сравнения принята за единицу. В случае если основание принимается за 100, относительная величина выражается в процентах (%), если за 1000 – в промилле (‰). Выбор той или иной формы относительной величины зависит от ее абсолютного значения: • если сравниваемая величина больше базы сравнения в 2 раза и более, то выбирают форму коэффициента (как в вышеприведенном примере); • если относительная величина близка к единице, то, как правило, ее выражают в процентах (например, сравнив величины экспорта России в 2006 и 2005 годах, которые составили 304,5 и 243,6 млрд. долл. соответственно, можно сказать, что экспорт в 2006 году составляет 125% от 2005 года [304,5/243,6*100%]); • если относительная величина значительно меньше единицы (близка к нулю), ее выражают в промилле (например, в 2004 году Россия экспортировала в страны-СНГ всего 4142 тыс. т нефтепродуктов, в том числе в Грузию 10,7 тыс. т, что составляет 0,0026 [10,7/4142], или 2,6‰ от всего экспорта нефтепродуктов в страны СНГ). Различают относительные величины динамики, структуры, координации, сравнения и интенсивности, для краткости именуемые в дальнейшем индексами. Индекс динамики8 характеризует изменение какого-либо явления во времени. Он представляет собой отношение значений одной и той же абсолютной величины в разные периоды времени. Данный индекс определяется по формуле (2): , (2) где цифры означают: 1 – отчетный или анализируемый период, 0 – прошлый или базисный период. Критериальным значением индекса динамики служит единица (или 100%), то есть если >1, то имеет место рост (увеличение) явления во времени; если =1 – стабильность; если <1 – наблюдается спад (уменьшение) явления. Еще одно название индекса динамики – индекс изменения, вычитая из которого единицу (100%), получают темп изменения (динамики)9 с критериальным значением 0, который определяется по формуле (2): . (2) Если T>0, то имеет место рост явления; Т=0 – стабильность, Т<0 – спад. В рассмотренном выше примере про экспорт России в 2006 и 2005 году был рассчитан именно индекс динамики по формуле (2): iД = 304,5/243,6*100% = 125%, что больше критериального значения 100%, что свидетельствует об увеличении экспорта. Используя формулу (2) получим темп изменения: Т = 125% – 100% = 25%, который показывает, что экспорт увеличился на 25%. Разновидностями индекса динамики являются индексы планового задания и выполнения плана, рассчитываемые для планирования различных величин и контроля их выполнения. Индекс планового задания – это отношение планового значения признака к базисному. Он определяется по формуле (2): , (2) где X’1 – планируемое значение; X0 – базисное значение признака. Например, таможенное управление перечислило в федеральный бюджет в 2006 году 160 млрд.руб., а на следующий год запланировали перечислить 200 млрд.руб., значит по формуле (2): iпз = 200/160 = 1,25, то есть плановое задание для таможенного управления на 2007 год составляет 125% от предыдущего года. Для определения процента выполнения плана необходимо рассчитать индекс выполнения плана, то есть отношение наблюдаемого значения признака к плановому (оптимальному, максимально возможному) значению по формуле (2): . (2) Например, на январь-ноябрь 2006 года таможенные органы запланировали перечислить в федеральный бюджет 1,955 трлн. руб., но фактически перечислили 2,59 трлн. руб., значит по формуле (2): iВП = 2,59/1,955 = 1,325, или 132,5%, то есть плановое задание выполнили на 132,5%. Индекс структуры (доля) – это отношение какой-либо части объекта (совокупности) ко всему объекту. Он определяется по формуле (2): (2) В рассмотренном выше примере про экспорт нефтепродуктов в страны СНГ, была рассчитана доля этого экспорта в Грузию по формуле (2): d=10,7/4142 = 0,0026, или 2,6‰. Индекс координации – это отношение какой-либо части объекта к другой его части, принятой за основу (базу сравнения). Он определяется по формуле (2): . (2) Например, импорт России в 2006 году составил 163,9 млрд.долл., тогда, сравнив его с экспортом (база сравнения), рассчитаем индекс координации по формуле (2): iК = 163,9/304,5 = 0,538, который показывает соотношение между двумя составными частями внешнеторгового оборота, то есть величина импорта России в 2006 году составляет 53,8% от величины экспорта. Меняя базу сравнения на импорт, по той же формуле получим: iК = 304,5/163,9 = 1,858, то есть экспорт России в 2006 году в 1,858 раза больше импорта, или экспорт составляет 185,8% от импорта. Индекс сравнения – это сравнение (соотношение) разных объектов по одинаковым признакам. Он определяется по формуле (2): , (2) где А, Б – сравниваемые объекты. В рассмотренном выше примере, в котором сопоставлялись величины экспорта США и России, был рассчитан именно индекс сравнения по формуле (2): iс = 904,383/243,569 = 3,71. Меняя базу сравнения (то есть экспорт России – объект А, а экспорт США – объект Б), по той же формуле получим: iс = 243,569/904,383 = 0,27, то есть экспорт России составляет 27% от экспорта США. Индекс интенсивности – это соотношение разных признаков одного объекта между собой. Он определяется по формуле (2): . (2) где X – один признак объекта; Y – другой признак этого же объекта Например, показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, цены единицы продукции и т.д. 1.3. Методические указания по теме Пример 1. Перевести в тонны условного топлива 23,8 млн. т. нефти с теплотворной способностью 45 Мдж/кГ. Решение. Учитывая стандартную теплотворную способность 29,3 МДж/кГ, определяем: 23,8*45/29,3 = 36,55 млн. т.у.т. Пример 2. Рассчитать индекс и темп изменения, если в марте произведено продукции 138 тонн, а в феврале 108 тонн. Решение. 2.1. Индекс изменения (динамики) по формуле (2): iд = 138/108 = 1,278 или 127,8% - рост, т.к. iд > 1. 2.2. Темп изменения по формуле (2): T = 1,278 – 1 = 0,278 или 27,8% - рост, т.к. tд > 0. Пример 3. Рассчитать индексы планового задания, выполнения плана и динамики, если выпуск продукции в отчетном году составил 20 млн.рублей. На следующий год планировалось 28 млн.рублей, а фактически получено 26 млн.рублей. Решение. 3.1. Индекс планового задания по формуле (2): iпз = 28/20 = 1,4. 3.2. Индекс выполнения плана по формуле (2): iВП = 26/28 = 0,928. 3.3. Индекс динамики по формуле (2) iд = 26/20 = 1,3 или 130% - рост, т.к. iд > 1. Пример 4. В составе ВВП региона 136,5 млр.рублей произведено товаров на 75,4 млр.рублей, оказано услуг на 51,6 млр.рублей и собрано налогов 9,5 млр.рублей. Рассчитать относительные величины структуры и координации, приняв за основу производство товаров. Решение. 4.1. Индексы структуры (доли) по формуле (2): товары iСТ = 75,4/136,5 = 0,552 или 55,2%; услуги iСТ = 51,6/136,5 = 0,378 или 37,8%; налоги iСТ = 9,5/136,5 = 0,07 или 7%. Контроль: 0,552 + 0,378 + 0,07 = 1. 4.2. Индексы координации по формуле (2): услуги iК = 51,6/75,4 =0,684; налоги iК = 9,5/75,4 = 0,126. Пример 5. Запасы воды в озере Байкал составляют 23000 км3, а в Ладожском озере 911 км3. Рассчитать относительные величины сравнения этих озер. Решение. 5.1. Индекс сравнения озер Байкал с Ладожским по формуле (2): iС = 23000/911 = 25,25. 5.2. Индекс сравнения Ладожского озера с Байкалом по той же формуле: iC = 911/23000 = 0,0396 или 1/25,25 = 0,0396. Пример 6. Рассчитать относительную величину интенсивности ВВП в сумме 276611 млн.$ на душу населения в 147 млн.человек. Решение. Показатель интенсивности по формуле (2)iИН = 276611/147 = 1881,7 $/чел. 1.4. Контрольные задания Вариант 1. Определить общее производство моющих средств в условных тоннах по плану и фактически, а также процент выполнения плана по следующим данным: № п/п Вид продукта Жирность, % Физическая масса, т по плану фактически 1 Мыло хозяйственное 60 500 600 2 Мыло туалетное 80 1000 1500 3 Стиральный порошок 10 50000 40000 Вариант 2. По данным о численности жителей трех крупнейших городов России (тыс.чел) определить индексы сравнения и динамики. Город Год 2004 2005 Москва 10391 10407 Санкт-Петербург 4624 4600 Новосибирск 1413 1406 Вариант 3. 1. По плану на 2005 год намечалось увеличение товарооборота на 3%. В 2005 году плановое задание перевыполнили на 600 млн.руб. или на 2,5%. Определить фактический прирост товарооборота (в млн.руб.) в 2005 году по сравнению с 2004. 2. По данным о товарообороте из предыдущей задачи, состоящего из реализации собственной продукции и продажи покупных товаров, определить относительные величины координации и структуры собственной и покупной продукции в 2004 и 2005 годах, если известно, что доля собственной продукции в 2004 году составила 65%, а в 2005 году она увеличилась на 10%. Вариант 4. Жилищный фонд и численность населения России следующие (на начало года): Год 2002 2003 2004 2005 Весь жилищный фонд, млн.м2 2853 2885 2917 2949 Численность населения, млн. чел. 145,6 145,0 144,2 143,5 Охарактеризовать изменение обеспеченности населения жилой площадью с помощью относительных величин. Вариант 5. Определить общий объем фактически выпущенной продукции по следующим данным по трем филиалам предприятия, выпускающих однородную продукцию: Номер филиала Планируемый объем выпуска продукции, млн. руб. Выполнение намеченного плана, % 1 500 104 2 750 92 3 250 116 Вариант 6. 1. В России в 2004 численность лиц женского пола (лжп) составила 77144,3 тыс.чел, а лиц мужского пола (лмп) – 67023,9 тыс.чел. Рассчитать относительные величины структуры и координации. 2. По плану объем продукции в отчетном году должен возрасти по сравнению с прошлым годом на 2,5%. План выпуска продукции перевыполнен на 3,0%. Определить фактический выпуск продукции в отчетном году, если известно, что объем продукции в прошлом году составил 25300 млн.руб. Вариант 7. По промышленному предприятию за отчетный год имеются следующие данные о выпуске продукции: Наименование продукции План на I квартал, тыс.т Фактический выпуск, тыс.т Отпускная цена за 1 т, у.е. январь февраль март Сталь арматурная 335 110 115 108 1700 Прокат листовой 255 75 90 100 2080 Определить процент выполнения квартального плана: 1) по выпуску каждого вида продукции; 2) в целом по выпуску всей продукции. Вариант 8. Определить процент выполнения плана по продажам условных школьных тетрадей по каждому виду тетрадей и в целом по магазину по следующим данным: Вид тетради Цена, руб./шт. Объем продаж, тыс.шт. по плану фактически Тетрадь общая 90 листов 20 50 40 Тетрадь общая 60 листов 16 100 130 Тетрадь общая 48 листов 13 200 350 Тетрадь общая 16 листов 9 700 500 Вариант 9. В России на начало 2005 года численность населения составила 144,2 млн.чел., в течение года: родилось 1,46 млн.чел., умерло – 2,3 млн.чел., мигрировало из других государств 2,09 млн.чел, мигрировало за границу – 1,98 млн.чел. Охарактеризовать изменение численности населения в 2005 году с помощью относительных величин. Вариант 10. Определить общий объем фактически выпущенной условной консервной продукции по следующим данным: Вид продукции Планируемый объем выпуска продукции, тыс.шт. Выполнение намеченного плана, % Томатная паста 1 л 500 85 Томатная паста 0,5 л 750 104 Томатная паста 0,2 л 250 130 2. Средние величины и показатели вариации 2.1. Понятие средней величины Статистическая совокупность содержит некоторое количество статистических величин, имеющих, как правило, разные значения и признаки, что делает невозможным сравнение нескольких совокупностей в целом. Для этой цели применяется средняя величина, как обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средняя величина всегда обобщает количественное выражение признака и погашает индивидуальные различия статистических величин совокупности, вызванные случайными обстоятельствами. Но по значению средней величины нельзя делать принципиальные выводы. Например, если один ученик имеет тетрадь в 48 листов, а другой - ни одной, то в среднем получается по 2 у.ш.т. на ученика. Но из этого нельзя заключать, что все ученики школьными тетрадями обеспечены. Главное значение средних величин состоит в их обобщающей функции, то есть замене множества различных индивидуальных значений признака средней величиной, характеризующей всю совокупность явлений. 2.2. Виды средних величин Виды средних величин различаются прежде всего тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным. Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объем признака в совокупности сохраняется неизменным. Иначе можно сказать, что средняя арифметическая величина – среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами совокупности. Исходя из определения, формула средней арифметической величины имеет вид (2): . (2) По формуле (2) вычисляются средние величины первичных признаков, если известны индивидуальные значения признака. Если изучаемая совокупность велика, исходная информация чаще представляет собой ряд распределения или группировку, как, например, табл. 2. Таблица 2. Распределение студентов группы дневного отделения по возрасту Возраст студентов, X 17 18 19 20 21 Число студентов, f 3 5 7 4 2 Средний возраст должен представлять собой результат равномерного распределения общего (суммарного) возраста всех студентов. Общий (суммарный) возраст всех студентов, согласно исходной информации табл. 2, можно получить как сумму произведений значений признака в каждой группе Xi, на число студентов с таким возрастом fi (частоты). Получим формулу (2): , (2) где i – число групп. Такую форму средней арифметической величины называют взвешенной арифметической средней10 в отличие от простой средней, рассчитанной по формуле (2). В качестве весов здесь выступают количество единиц совокупности в разных группах. Название «вес» выражает тот факт, что разные значения признака имеют неодинаковую «важность» при расчете средней величины. «Важнее», весомее возраст студентов 18, 19, 20 лет, а такие значения возраста как 17, 20 или 21 при расчете средней не играют большой роли – их «вес» мал. По формуле (2) по данным табл. 2 имеем: = 18,857 (лет). Как видим, средняя арифметическая величина может быть дробным числом, если даже индивидуальные значения признака могут принимать только целые значения. Ничего необычного для метода средних в этом не заключено, так как из сущности средней не следует, что она обязана быть реальным значением признака, которое могло бы встретиться у какой-либо единицы совокупности. Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимают середины этих интервалов, то есть исходят из предположения о равномерном распределении единиц совокупности по интервалу значений признака. Для открытых интервалов в первой и последней группе, если таковые есть, значения признака надо определить экспертным путем исходя из сущности, свойств признака и совокупности. При отсутствии возможности экспертной оценки значения признака в открытых интервалах, для нахождения недостающей границы открытого интервала применяют размах (разность между значениями конца и начала интервала) соседнего интервала (принцип «соседа»). Например, по данным табл. 3 можно минимальную и максимальную величину веса студентов определить затруднительно, поэтому воспользуемся принципом «соседа» – применим размах соседнего интервала, который у второго и предпоследнего составляет 10 кг, значит первый интервал будет от 55 до 65 кг, а последний – от 80 до 90 кг. Середины интервалов определяем как полусумму нижней и верхней границы интервалов. Таблица 3. Распределение группы студентов по весу Группы студентов по весу, кг Количество студентов, чел. Середина интервала Xi’ Xi’fi До 60 6 55 330 60 – 70 8 65 520 70 – 80 5 75 375 Более 80 2 85 170 Итого 21 66,429 1395 Средняя вес студентов, рассчитанный по формуле (2) с заменой точных значений признака в группах серединами интервалов, составил: кг, что и записано в итоговую строку в 3-м столбце табл. 3. Следует обратить внимание, что объемного показателя – это сумма, а итог по столбцам относительных показателей или средних групповых величин – средняя. Средняя арифметическая величина обладает свойствами, знание которых полезно как при ее использовании, так и при ее расчете. 1) Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю. 2) Если каждое индивидуальное значение признака умножить или разделить на постоянное число, то и средняя увеличится или уменьшится во столько же раз. Вследствие этого свойства индивидуальные значения признака можно сократить в c раз, произвести расчет средней и результат умножить на c. 3) Если к каждому индивидуальному значению признака прибавить или из каждого значения вычесть постоянное число, то средняя величина возрастет или уменьшится на это же число. Это свойство полезно использовать при расчете средней величины из многозначных и слабоварьирующих значений признака аналогично предыдущему свойству. 4) Если веса средней взвешенной умножить или разделить на постоянное число, средняя величина не изменится. Используя это свойство, при расчетах следует сокращать веса на их общий сомножитель либо выражать многозначные числа весов в более крупных единицах измерениях. 5) Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменную сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной. Ее формула следующая: . (2) Главной сферой применения квадратической средней в силу пятого свойства средней арифметической величины является измерение вариации признака в совокупности. Аналогично, если по условиям задачи необходимо сохранить неизменной сумму кубов индивидуальных значений признака при их замене на среднюю величину, мы приходим к средней кубической величине, имеющей вид: . (2) Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить геометрическую среднюю величину, имеющую следующий вид: . (2) Основное применение средняя геометрическая находит при определении средних относительных изменений, о чем сказано в теме «Ряды динамики». Геометрическая средняя величина дает наиболее точный результат осреднения, если задача также состоит в нахождении такого значения признака, который качественно был бы равноудален как от максимального, так и от минимального значения признака. Когда статистическая информация не содержит частот f по отдельным вариантам Xi совокупности, а представлена как их произведение Xf, тогда применяется формула средней гармонической взвешенной, для получения которой обозначим Xf=w, откуда f=w/X, и, подставив эти обозначения в формулу (2), получим формулу (2): . (2) Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны действительные веса f, а известно w=Xf. В тех случаях, когда вес каждого варианта w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой (2): . (2) Все рассмотренные выше виды средних величин принадлежат к общему типу степенных средних, имеющему следующий вид: =. (2) При m = 1 получаем среднюю арифметическую; при m = 2 – среднюю квадратическую; при m = 3 – среднюю кубическую; при m = 0 – среднюю геометрическую; при m = –1 – среднюю гармоническую. Чем выше показатель степени m, тем больше значение средней величины (если индивидуальные значения признака варьируют). В итоге, можно построить следующее соотношение, которое называется правилом мажорантности средних: ≤ ≤ ≤ ≤ . (2) 2.3. Статистическое изучение вариации Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота (ВО) варьируется по подразделениям Федеральной таможенной службы; величина экспорта (импорта) варьируется по направлениям экспорта (по разным странам-партнерам по внешней торговле), по видам товаров и т.п. Причиной вариации являются разные условия существования разных единиц совокупности. Например, огромное число причин влияет на масштабы внешней торговли различных стран мира. Для управления и изучения вариации статистикой разработаны специальные методы исследования вариации, система показателей, с помощью которой вариация измеряется, характеризуются ее свойства. Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) – упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака. Существует 3 вида ряда распределения: 1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака (например, таблица 4); если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (ели признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд); 2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака; 3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей). Построим ряд распределения внешнеторгового оборота (ВО) по таможенным постам России, для чего необходимо провести статистическое наблюдение, то есть собрать первичный статистический материал, который представляет собой величину ВО по таможенным постам. Результаты наблюдения ВО по 35 таможенным постам региона за отчетный период представим в виде ранжированного по возрастанию величины ВО ряда распределения (таблица 4). Таблица 4. Внешнеторговый оборот (ВО) по 35 таможенным постам, млн.долл. № поста ВО № поста ВО № поста ВО 1 24,16 13 54,12 25 65,31 2 27,06 14 54,91 26 69,24 3 29,12 15 55,74 27 71,39 4 31,17 16 55,91 28 77,12 5 37,08 17 56,07 29 79,12 6 39,11 18 56,80 30 84,34 7 41,58 19 56,93 31 86,89 8 44,84 20 57,07 32 91,74 9 46,80 21 58,39 33 96,01 10 48,37 22 59,61 34 106,84 11 51,44 23 59,95 35 111,16 12 52,56 24 62,05 Итого 2100,00 Построим интервальный ряд распределения ВО по таможенным постам, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной11. Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения. Чаще всего число групп в ряду распределения определяют по формуле Стерждесса (2) или (2): (2) или , (2) где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности. Из формулы Стерджесса видно, что число групп – функция объема данных (N). Зная число групп, рассчитывают длину (размах) интервала12 по формуле (2): , (2) где Xмax и Xmin — максимальное и минимальное значения в совокупности. В нашем примере про ВО по формуле Стерждесса (2) определим число групп: k = 1 + 3,322lg35 = 1+ 3,322*1,544 = 6,129 ≈ 6. Рассчитаем длину (размах) интервала по формуле (2): h = (111,16 – 24,16)/6 = 87/6 = 14,5 (млн.долл.). Теперь построим интервальный ряд с 6 группами с интервалом 14,5 млн.долл. (см. первые 3 столбца табл. 5). Таблица 5. Интервальный ряд распределения ВО по таможенным постам, млн.долл. i Группы постов по величине ВО Xi Число постов fi Середина интервала Хi’ Хi’fi Накопл. частота fi’ | Хi’ -| fi (Хi’ -)2 fi (Хi’ -)3 fi (Хi’ -)4 fi 1 24,16 – 38,66 5 31,41 157,05 5 147,071 4326,001 -127246,23 3742856,97 2 38,66 – 53,16 7 45,91 321,37 12 104,400 1557,051 -23222,31 346344,16 3 53,16 – 67,66 13 60,41 785,33 25 5,386 2,231 -0,92 0,38 4 67,66 – 82,16 4 74,91 299,64 29 56,343 793,629 11178,84 157461,90 5 82,16 – 96,66 4 89,41 357,64 33 114,343 3268,572 93434,47 2670891,13 6 96,66 – 111,16 2 103,91 207,82 35 86,171 3712,758 159966,81 6892284,32 Итого 35 2128,85 513,714 13660,243 114110,66 13809838,86 Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения таможенных постов в выборке по величине ВО приведено на рис. 1. Диаграмма такого типа называется гистограммой13. Рис. 1. Гистограмма распределения Рис. 2. Полигон распределения Данные табл. 5 и рис. 1 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения. Если имеется дискретный ряд распределения или используются середины интервалов (как в нашем примере про ВО – в таблице 5 в 4-м столбце рассчитаны середины интервалов как полусумма значений начала и конца интервала), то графическое изображение такого ряда называется полигоном (см. рис. 2)14, которое получается соединением прямыми точек с координатами Xi и fi. Вторым этапом статистического изучения вариации является расчет характеристик ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака, делящая совокупность на две равные части – со значением признака меньше медианы и со значением признака больше медианы15. В нашем примере про ВО (табл. 4) медиана – это 18-й таможенный пост из 35 с величиной ВО 56,8 млн.долл. Из этого примера видно принципиальное различие между медианой и средней величиной: медиана не зависит от значений на краях ранжированного ряда. Даже если бы ВО 35-го таможенного поста был в 10 раз больше, величина медианы не изменилась бы. Поэтому медиану часто используют как более надежный показатель типичного значения признака, нежели средняя арифметическая, если ряд значений неоднороден, включает резкие отклонения от средней. В интервальном ряду распределения для нахождения медианы применяется формула: , (2) где Ме – медиана; X0 – нижняя граница интервала, в котором находится медиана; h – величина (размах) интервала; – накопленная частота в интервале, предшествующем медианному; fMe – частота в медианном интервале. В табл. 5 медианным является среднее из 35 значений, т.е. 18-е от начала значение ВО. Как видно из столбца накопленных частот (6-й столбец), оно находится в третьем интервале. Тогда по формуле (2): (млн.долл.). Аналогично медиане вычисляются значения признака, делящие совокупность на 4 равные по численности части – квартили, которые обозначаются заглавной латинской буквой Q с подписным значком номера квартиля. Ясно, что Q2 совпадает с Ме. Для первого и третьего квартилей приводим формулы и расчет по данным табл. 5: (млн.долл.) (млн.долл.) Так как Q2 = Ме = 59,30 млн.долл., видно, что различие между первым квартилем и медианой (–15,87) больше, чем между медианой и третьим квартилем (12,89). Этот факт свидетельствует о наличии некоторой несимметричности в средней области распределения, что заметно и на рис. 1. Значения признака, делящие ряд на 5 равных частей, называются квинтилями, на 10 частей – децилями, на 100 частей – перцентилями. Эти характеристики применяются при необходимости подробного изучения структуры ряда распределения16. Безусловно, важное значение имеет такая величина признака, которая встречается в изучаемом ряду распределения чаще всего. Такую величину принято называть модой. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой. Обычно встречаются ряды с одним модальным значением признака. Если в ряду распределения встречаются 2 или несколько равных (и даже несколько различных, но больших чем соседние) значений признака, то он считается соответственно бимодальным или мультимодальным. Это свидетельствует о неоднородности совокупности, возможно, представляющей собой агрегат нескольких совокупностей с разными модами. В интервальном ряду распределения интервал с наибольшей частотой является модальным. Внутри этого интервала находят условное значение признака, вблизи которого плотность распределения (число единиц совокупности, приходящихся на единицу измерения варьирующего признака) достигает максимума. Это условное значение и считается точечной модой. Логично предположить, что такая точечная мода располагается ближе к той из границ интервала, за которой частота в соседнем интервале больше частоты в интервале за другой границей модального интервала. Отсюда получаем обычно применяемую формулу (2): , (2) где Мо – мода; Х0 – нижнее значение модального интервала; fMo – частота в модальном интервале; fMo-1 – частота в предыдущем интервале; fMo+1 – частота в следующем интервале за модальным; h – величина интервала. По данным табл. 5 рассчитаем точечную моду по формуле (2): (млн.долл.). К изучению структуры ряда распределения средняя арифметическая величина также имеет отношение, хотя основное значение этого обобщающего показателя другое. В интервальном ряду распределения ВО по таможенным постам средняя арифметическая рассчитывается как взвешенная по частоте середина интервалов X (расчет числителя – в 5-м столбце табл. 5) по формуле (2): == 2128,85/35 = 60,82 (млн.долл.). Различие между средней арифметической величиной (60,82), медианой (59,30) и модой (58,96) в нашем примере невелико. Чем ближе распределение по форме к нормальному закону, тем ближе значения медианы, моды и средней величины между собой. Третьим этапом статистического изучения вариации является расчет показателей размера и интенсивности вариации. Простейшим показателем является размах вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений (2): . (2) Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу сочетаний по два из всех единиц совокупности (в нашем примере про ВО число сочетаний составит ). Однако нет необходимости рассматривать, вычислять и осреднять все отклонения. Проще использовать среднюю из отклонений отдельных значений признака от среднего арифметического значения признака, а таковых в нашем примере про ВО всего 35. Но среднее отклонение значений признака от средней арифметической величины согласно первому свойству последней равно нулю. Поэтому показателем силы вариации выступает не арифметическая средняя отклонений, а средний модуль отклонений, или среднее линейное отклонение (2): . (2) В нашем примере про ВО по данным табл. 5 среднее линейное отклонение вычисляется как взвешенное по частоте отклонение по модулю середин интервалов от средней арифметической величины (расчет числителя произведен в 7-м столбце табл. 5), т.е. по формуле (2): (млн.долл.). (2) Это означает, что в среднем величина ВО в изучаемой совокупности таможенных постов отклонялась от средней величины ВО в РФ на 14,678 млн.долл. Простота расчета и интерпретации составляют положительные стороны показателя Л, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль отклонений, а среднее квадратическое отклонение, обозначаемое малой греческой буквой сигма () или s и вычисляемое по формуле (2) – для ранжированного ряда и по формуле (2) – для интервального ряда: ; (2) . (2) В нашем примере про ВО по данным табл. 5 среднее квадратическое отклонение величины ВО по формуле (2) составило (расчет числителя произведен в 8-м столбце табл. 5): (млн.долл.). Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Разница между ними тем больше, чем больше в изучаемой совокупности резких, выделяющихся отклонений, что служит индикатором «засоренности» совокупности неоднородными с основной массой элементами. Для нормального закона распределения отношение . В нашем примере про ВО: , т.е. в изучаемой совокупности наблюдаются некоторое число таможенных постов с отличающимися от основной массы величинами ВО. Квадрат среднего квадратического отклонения представляет собой дисперсию отклонений, на использовании которой основаны практически все методы математической статистики, ее формула имеет вид (2) – для несгруппированных данных (простая дисперсия) и (2) – для сгруппированных (взвешенная дисперсия): ; (2) . (2) Еще одним показателем силы вариации, характеризующим ее не по всей совокупности, а лишь в ее центральной части, служит среднее квартильное расстояние (отклонение), т.е. средняя величина разности между квартилями, определяемая по формуле (2): . (2) В нашем примере про ВО по формуле (2): (млн.долл.). Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним линейным отклонением и средним квартильным расстоянием служит для изучения структуры вариации: большое значение такого соотношения свидетельствует о наличии слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Для нашего примера про ВО соотношение Л/q = 1,021, что говорит о совсем незначительном различии силы вариации в центральной части совокупности и на ее периферии. Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации, которые вычисляются как отношение абсолютных показателей силы вариации, рассмотренных ранее, к средней арифметической величине признака, то есть показатели (2) – (2): • относительный размах вариации: ; (2) • линейный коэффициент вариации: ; (2) • квадратический коэффициент вариации: ; (2) • относительное квартильное расстояние: . (2) В нашем примере про ВО эти показатели составляют: = 87/60,82 =1,43, или 143%; = 14,678/60,82 = 0,241, или 24,1%; = 19,756/60,82 = 0,32, или 32%; d = 14,38/60,82 = 0,236, или 23,6%. Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава, она состоит в сравнении наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив17. Так, для совокупности таможенных постов вариация величины ВО может быть определена как слабая, если < 25%, умеренная при 25% < < 50% и сильная при > 50%. Различная сила, интенсивность вариации обусловлены объективными причинами, поэтому нельзя говорить о каком-либо универсальном критерии вариации (например, 33%), так как для разных явлений и признаков этот критерий различен. Например, цена продажи американского доллара в коммерческих банках Н.Новгорода 26 июля 2007 года варьировала от 25,45 до 26,00 при средней цене 25,595 руб., тогда по формуле (2) = (26,00–25,45)/25,595 = 0,021, или 2,1%. Такая малая вариация вызвана тем, что при значительном различии курса доллара немедленно произошел бы отлив покупателей из «дорогого» банка в более «дешевые». Напротив, цена килограмма говядины в разных регионах России варьирует очень сильно – на десятки процентов и более (это объясняется разными затратами на доставку товара из региона-производителя в регион потребитель). Четвертым этапом статистического изучения вариации является расчет моментов распределения и показателей его формы. Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 6) или просто моментов (нецентральные моменты в таможенной статистике практически не используются). Таблица 6. Центральные моменты Порядок момента Формула по несгруппированным данным по сгруппированным данным Первый μ1 Второй μ2 Третий μ3 Четвертый μ4 Величина третьего момента μ3 зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. При нормальном и любом другом строго симметричном распределении сумма положительных кубов строго равна сумме отрицательных кубов, поэтому на основе третьего момента строится показатель, характеризующий степень асимметричности распределения – коэффициент асимметрии (2): . (2) В нашем примере про ВО показатель асимметрии по формуле (2) составил (расчет числителя произведен в 9-м столбце табл. 5): = 0,423 > 0, т.е. асимметрия значительна. Английский статистик К.Пирсон на основе разности между средней арифметической величиной и модой предложил другой показатель асимметрии (2): . (2) В нашем примере по данным табл. 5 показатель асимметрии по формуле (2) составил: = 0,09. Показатель асимметрии Пирсона (2) зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии (2) – от крайних значений признака. Таким образом, в нашем примере про ВО в средней части распределения наблюдается меньшая асимметрия, чем по краям, что видно и по графику (рис. 2). Распределения с сильной правосторонней и левосторонней асимметрией показаны на рис. 3. Рис. 3. Асимметрия распределения С помощью момента четвертого порядка характеризуется еще более сложное свойство рядов распределения – эксцесс (от англ. «излишество»). Показатель эксцесса рассчитывается по формуле (2): . (2) Чаще всего эксцесс интерпретируется как «крутизна» распределения, что не совсем верно. График распределения может выглядеть сколь угодно крутым в зависимости от силы вариации признака: чем слабее вариация, тем круче кривая распределения при данном масштабе. Не говоря уже о том, что, изменяя масштабы по осям абсцисс и ординат, любое распределение можно искусственно сделать «крутым» и «пологим». Чтобы показать, в чем состоит эксцесс распределения, и правильно его интерпретировать, нужно сравнить ряды с одинаковой силой вариации (одной и той же величиной σ) и разными показателями эксцесса. Чтобы не смешать эксцесс с асимметрией, все сравниваемые ряды должны быть симметричными. Такое сравнение изображено на рис. 4. Рис. 4. Эксцесс распределения Наличие положительного эксцесса означает наличие слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Отрицательный эксцесс означает отсутствие такого «ядра». В нашем примере по формуле (2) эксцесс составил (расчет числителя произведен в 10-м столбце табл. 5): , т.е. величина ВО по таможенным постам варьирует сильнее, чем при нормальном распределении. Пятым этапом статистического изучения вариации является проверка соответствия ряда распределения теоретическому (нормальному, логнормальному, биномиальному, распределению Руассона и др.) с помощью критериев согласия, среди которых чаще всего применяют критерии Пирсона χ2, Колмогорова и Романовского. Данный этап не входит в программу изучения для студентов заочного отделения (в случае необходимости – см. конспект лекций для дневного отделения). 2.4. Контрольные задания Имеются следующие данные по группе из 20 студентов заочного отделения (таблица 7): Таблица 7. Варианты выполнения контрольного задания № п/п Вариант 1 2 3 4 5 6 7 8 9 10 Рост, см Вес, кг Доход, у.е./мес. IQ (тест Айзенка) Тет-радь, листов Воз-раст, лет Соот-ношение «рост/вес» Стаж работы, мес. Кол-во друзей, чел. Время решения контрольной, час. 1 159 45 430 95 24 20 3,533 26 5 8,5 2 160 61 640 115 32 25 2,623 63 7 6,2 3 161 56 610 111 24 28 2,875 94 10 6,8 4 162 48 330 97 24 19 3,375 16 4 12,0 5 162 54 420 105 60 23 3,000 49 2 7,5 6 164 58 290 98 16 20 2,828 14 6 10,0 7 166 51 480 109 90 26 3,255 78 9 7,2 8 169 62 610 120 24 19 2,726 10 5 4,2 9 170 70 840 122 48 30 2,429 130 10 3,5 10 170 72 330 92 24 20 2,361 20 3 9,5 11 171 73 560 110 16 28 2,342 86 8 7,8 12 171 64 450 102 48 21 2,672 29 4 8,0 13 172 73 350 108 32 26 2,356 75 7 6,0 14 174 68 310 100 48 21 2,559 22 4 4,8 15 176 81 380 104 64 20 2,173 32 1 8,6 16 176 84 340 104 48 19 2,095 21 5 10,0 17 178 76 660 128 90 27 2,342 96 8 4,5 18 181 90 450 106 48 26 2,011 70 9 12,5 19 183 68 540 105 32 23 2,691 59 6 10,5 20 192 95 750 117 60 27 2,021 98 4 6,5 Построить интервальный ряд распределения признака и его график, рассчитать среднее значение признака и изучить его вариацию. 3. Выборочное наблюдение 3.1. Понятие выборочного наблюдения Выборочный метод используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением. Например, дегустация, испытание кирпичей на прочность и т.п. Выборочное наблюдение используется также для проверки результатов сплошного. Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают п, во всей ГС – N. Отношение n/N называется относительный размер или доля выборки. Качество результатов выборочного наблюдения зависит от репрезентативности выборки, т.е. от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.. 3.2. Способы формирования выборки 1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному объему выборки. На практике вместо жеребьевки используют генераторы случайных чисел. Данный способ отбора может быть повторным (когда каждая единица, отобранная в выборку, после проведения наблюдения возвращается в ГС и может быть вновь подвергнута обследованию) и бесповторным (когда обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно). При повторном отборе вероятность попадания в выборку для каждой единицы ГС остается неизменной, а при бесповторном отборе она меняется (увеличивается), но для оставшихся в ГС после отбора из нее нескольких единиц, вероятность попадания в выборку одинакова. 2. Механический отбор: отбираются единицы генеральной совокупности с постоянным шагом N/п. Так, если она генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица. 3. Стратифицированный (расслоенным) отбор осуществляется из неоднородной генеральной совокупности, когда ее предварительно разбивают на однородные группы, после чего производят отбор единиц из каждой группы в выборочную совокупность случайный или механическим способом пропорционально их численности в генеральной совокупности. 4. Серийный (гнездовой) отбор: случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение. 3.3. Средняя ошибка выборки После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним относят среднюю величину изучаемого признака и долю единиц, обладающих каким-либо значением этого признака. Однако, если ГС произвести несколько выборок, определив при этом их обобщающие характеристики, то можно установить, что их значения будут различными, кроме того, они будут отличаться и от реального их значения в ГС, если такое определить с помощью сплошного наблюдения. Другими словами, обобщающие характеристики, рассчитанные по данным выборки, будут отличаться от их реальных значений в ГС, поэтому введем следующие условные обозначения (табл. 8). Таблица 8. Условные обозначения Показатель Совокупность генеральная выборочная Число единиц совокупности N n Среднее значение Доля единиц, обладающих каким-либо значением признака d Доля единиц, не обладающих каким-либо значением признака 1-d 1- Дисперсия Разность между значением обобщающих характеристик выборочной и генеральной совокупностей называется ошибкой выборки, которая подразделяется на ошибку регистрации и ошибку репрезентативности. Первая возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая возникает из-за несоблюдения принципа случайности отбора единиц в выборку. Ее сложнее обнаружить и устранить, она гораздо больше первой и потому ее измерение является основной задачей выборочного наблюдения. Для измерения ошибки выборки определяется ее средняя ошибка по формуле (2) для повторного отбора и по формуле (2) – для бесповторного: = ; (2) = . (2) Из формул (2) и (2) видно, что средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение. 3.4. Предельная ошибка выборки Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна . Каждое из отклонений от имеет определенную вероятность. При выборочном обследовании реальное значение в ГС неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . Она определяется в долях средней ошибки с заданной вероятностью, т.е. = t, (2) где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки. Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной ГС вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице: при . (2) А. М. Ляпунов доказал, что независимо от характера распределения генеральной ГС при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа: , (2) где – нормированное отклонение выборочной средней от генеральной средней. Значения P (интеграла Лапласа) для разных t рассчитаны и имеются в специальной таблице, которая приведена в Приложении 1. Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t по Приложению 1 и рассчитывают предельную ошибку выборки по формуле (2). После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (2) – для среднего значения, и по формуле (2) – для доли единиц, обладающих каким-либо значением признака: или (–) (+) (2) или (–) d (+) (2) Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики. 3.5. Необходимая численность выборки Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность. Ее можно получить из формул средней и предельной ошибок в зависимости от типа выборки. Так, подставляя формулы сначала (2) и затем (2) в формулу (2) и решая ее относительно численности выборки, получим следующие формулы: для повторной выборки n = ; (2) для бесповторной выборки n = . (2) Вариация () значений признака к началу выборочного наблюдения как правило неизвестна, поэтому ее берут приближенно одним из способов: 1) берется из предыдущих выборочных наблюдений; 2) по правилу «трех сигм», согласно которому в размахе вариации укладывается примерно 6 стандартных отклонений (H/ = 6, отсюда = Н2 /36); 3) если приблизительно известна средняя величина изучаемого признака, то = 2 /9; 4) если неизвестна дисперсия доли единиц, обладающих каким-либо значением признака, то используется ее максимально возможная величина = 0,25. 3.6. Методические указания Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 9): Таблица 9. Результаты бесповторного выборочного наблюдения на предприятии Доход, у.е. до 300 300-500 500-700 700-1000 более 1000 Число рабочих 8 28 44 17 3 С вероятностью 0,950 определить: 1) среднемесячный размер дохода работников данного предприятия; 2) долю рабочих предприятия, имеющих месячный доход более 700 у.е.; 3) необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.; 4) необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%. Решение. Для расчета обобщающих характеристик выборки построим вспомогательную таблицу 10. Таблица 10. Вспомогательные расчеты для решения задачи X f Х’ X’f (Х’ -)2 (Х’ -)2f до 300 8 200 1600 137641 1101128 300 - 500 28 400 11200 29241 818748 500 - 700 44 600 26400 841 37004 700 - 1000 17 850 14450 77841 1323297 более 1000 3 1150 3450 335241 1005723 Итого 100 57100 4285900 По формуле (2) рассчитаем средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (2) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: = 4285900/100 = 42859. Теперь можно определить среднюю ошибку выборки по формуле (2): = = 19,640 (у.е.). В нашей задаче = 0,950, значит t = 1,96. Тогда предельная ошибка выборки по формуле (2): = 1,96*19,64 = 38,494 (у.е.). Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в ГС необходимо определить их долю: w = 20/100 = 0,2 или 20%, а затем ее дисперсию по формуле = w(1-w) = 0,2*(1–0,2) = 0,16. Тогда можно рассчитать среднюю ошибку выборки по формуле (2): = = 0,038 или 3,8%. А затем и предельную ошибку выборки по формуле (2): = 1,96*0,038 = 0,075 или 7,5%. Доверительный интервал среднего дохода находим по формуле (2): 571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е. Аналогично определяем доверительный интервал для доли по формуле (2): 0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%. В нашей задаче выборка бесповторная, значит, воспользуемся формулой (2), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (= 42859) и доли рабочих с доходами более 700 у.е. (= 0,16): nб/повт = = 62 (чел.), nб/повт= = 197 (чел.). Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%. 3.7. Контрольные задания Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная бесповторная выборка лицевых счетов, в результате которой в таблице 11 получено распределение клиентов по размеру вкладов. Таблица 11. Варианты выполнения контрольного задания С вероятностью 0,954 определить: 1) средний размер вклада во всем банке; 2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.; 3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.; 4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%. 4. РЯДЫ ДИНАМИКИ 4.1. Понятие о рядах динамики Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов). Ряд динамики – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке). Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают через y. Первый член ряда y1 называют начальным (базисным) уровнем, а последний yn – конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t. Ряды динамики, как правило, представляют в виде таблицы (см. табл. 12) или графически (см. рис. 5), причем по оси абсцисс строится шкала времени t, а по оси ординат – шкала уровней ряда y. Таблица 12. Внешнеторговый оборот (ВО) России за период 2000-2006 гг. Год 2000 2001 2002 2003 2004 2005 2006 Млрд. долл. США 149,9 155,6 168,3 212,0 280,6 368,9 468,4 Рис. 5. Внешнеторговый оборот (ВО) России за период 2000-2006 гг. Данные табл. 12 и рис. 5 наглядно иллюстрируют ежегодный рост внешнеторгового оборота (ВО) в России за период 2000-2006 гг. 4.2. Показатели изменения уровней ряда динамики Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений уровней во времени, для рядов динамики рассчитывают показатели изменения уровней ряда динамики: • абсолютное изменение (абсолютный прирост); • относительное изменение (темп роста или индекс динамики); • темп изменения (темп прироста). Все эти показатели могут определяться базисным способом, когда уровень данного периода сравнивается с первым (базисным) периодом, либо цепным способом – когда сравниваются два уровня соседних периодов. Абсолютное изменение (абсолютный прирост) уровней рассчитывается как разность между двумя уровнями ряда по формуле (2) – для базисного способа сравнения или по формуле (2) – для цепного. Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше уровня какого-либо предшествующего периода, и, следовательно, может иметь знак «+» (при увеличении уровней) или «–» (при уменьшении уровней). ; (2) . (2) В табл. 13 в столбце 3 рассчитаны базисные абсолютные изменения по формуле (2), а в столбце 4 – цепные абсолютные изменения по формуле (2). Таблица 13. Анализ динамики ВО России Год y , % ,% 2000 149,9 2001 155,6 5,7 5,7 1,038 1,038 3,8 3,8 2002 168,3 18,4 12,7 1,123 1,082 12,3 8,2 2003 212,0 62,1 43,7 1,414 1,260 41,4 26,0 2004 280,6 130,7 68,6 1,872 1,324 87,2 32,4 2005 368,9 219,0 88,3 2,461 1,315 146,1 31,5 2006 468,4 318,5 99,5 3,125 1,270 212,5 27,0 Итого 1803,7 318,5 3,125 Между базисными и цепными абсолютными изменениями существует взаимосвязь: сумма цепных абсолютных изменений равна последнему базисному изменению, то есть . (2) В нашем примере про ВО подтверждается правильность расчета абсолютных изменений по формуле (2): = 318,5 рассчитана в итоговой строке 4-го столбца, а = 318,5 – в предпоследней строке 3-го столбца табл. 13. Относительное изменение (темп роста или индекс динамики) уровней рассчитывается как отношение (деление) двух уровней ряда по формуле (2) – для базисного способа сравнения или по формуле (2) – для цепного. ; (2) . (2) Относительное изменение показывает во сколько раз уровень данного периода больше уровня какого-либо предшествующего периода (при >1) или какую его часть составляет (при <1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения (если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%. В табл. 13 в столбце 5 рассчитаны базисные относительные изменения по формуле (2), а в столбце 6 – цепные относительные изменения по формуле (2). Между базисными и цепными относительными изменениями существует взаимосвязь: произведение цепных относительных изменений равно последнему базисному изменению, то есть . (2) В нашем примере про ВО подтверждается правильность расчета относительных изменений по формуле (2): = 1,038*1,082*1,260*1,324*1,315*1,270 = 3,125 рассчитано по данным 6-го столбца, а = 3,125 – в предпоследней строке 5-го столбца табл. 13. Темп изменения (темп прироста) уровней – относительный показатель, показывающий, на сколько процентов данный уровень больше (или меньше) другого, принимаемого за базу сравнения. Он рассчитывается путем вычитания из относительного изменения 100%, то есть по формуле (2): , (2) или как процентное отношение абсолютного изменения к тому уровню, по сравнению с которым рассчитано абсолютное изменение (базисный уровень), то есть по формуле (2): . (2) В табл. 13 в столбце 7 рассчитаны базисные темпы изменения ВО по формуле (2), а в столбце 8 – цепные темпы изменения по формуле (2). Все расчеты в табл. 13 свидетельствуют о ежегодном росте ВО России за период 2000-2006 гг. 4.3. Средние показатели ряда динамики Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении динамики изменений того или иного показателя ВЭД в разные периоды, в разных странах и т.д. Обобщенной характеристикой ряда динамики служит прежде всего средний уровень ряда . Для разных видов рядов динамики он рассчитывается неодинаково. Ряды динамики бывают равномерные (с равными интервалами времени между уровнями), для которых средний уровень определяется по простой формуле средней величины, и неравномерные (с неравными интервалами), для которых используются формулы средних взвешенных (по интервалам времени) величин. В интервальном ряду динамики (в котором время задано в виде промежутков времени, к которым относятся уровни) определяется по формуле средней арифметической, а в моментном ряду (в котором время задано в виде конкретных моментов времени или дат, к которым относятся уровни) – по формуле средней хронологической. В табл. 14 приводятся виды рядов динамики и соответствующие формулы для расчета их среднего уровня . Таблица 14. Виды средних величин, применяемых при расчете среднего уровня Вид ряда динамики Название средней величины Формула средней величины Номер формулы Равномерный интервальный Арифметическая простая (2) Равномерный моментный Хронологическая простая (2) Неравномерный интервальный Арифметическая взвешенная (2) Неравномерный моментный Хронологическая взвешенная (2) В нашем примере про ВО России за период 2000-2006 гг. имеем равномерный интервальный ряд динамики, поэтому его средний уровень определяем по формуле (2): = 1803,7/7 = 257,671, то есть ВО России в период 2000-2006 гг. составлял ежегодно в среднем 257,671 млрд. долл. США. Кроме среднего уровня ряда рассчитываются и другие средние показатели: • среднее абсолютное изменение (средний абсолютный прирост); • среднее относительное изменение (средний темп роста); • средний темп изменения (средний темп прироста). Каждый из этих показателей может рассчитываться базисным и цепным способом. Базисное среднее абсолютное изменение – это частное от деления последнего базисного абсолютного изменения на количество изменений уровней (2); цепное среднее абсолютное изменение уровней ряда – это частное от деления суммы всех цепных абсолютных изменений на количество изменений (2): Б = (2) Ц = (2) По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность. Очевидно, что числители формулы (2) и (2) равны между собой по формуле (2), значит, среднее абсолютное изменение не зависит от способа расчета (базисный или цепной), так как результат получится одинаковый. В нашей задаче по формуле (2) или (2): = 318,5/6 = 53,083, то есть ежегодно в среднем ВО растет на 53,083 млрд. долл. Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (2), а цепное среднее относительное изменение – по формуле (2): Б== (2) Ц= (2) Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашем примере про ВО: = = 1,209, то есть ежегодно в среднем в период 2000-2006 гг. ВО России растет в 1,209 раза. Вычитанием 100% из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики. В нашем примере про ВО: = 1,209 – 1 = 0,209, то есть ежегодно в среднем в период 2000-2006 гг. ВО России растет на 20,9%. 4.4. Методы выявления основной тенденции (тренда) в рядах динамики Одна из основных задач изучения рядов динамики – выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случаях проявляется наглядно, в других – может маскироваться колебаниями случайного или неслучайного характера. Поэтому, чтобы сделать правильные выводы о закономерностях развития того или иного показателя, надо суметь отделить тренд от колебаний, вызванных случайными кратковременными причинами. На основании выделенного тренда можно экстраполировать (прогнозировать) развитие явления в будущем. С этой целью (устранить колебания, вызванные случайными причинами) ряды динамики подвергают обработке. Существует несколько методов обработки рядов динамики, помогающих выявить основную тенденцию изменения уровней ряда, а именно: метод укрупнения интервалов, метод скользящей средней и аналитическое выравнивание. Во всех методах вместо фактических уровней при обработке ряда рассчитываются иные (расчетные) уровни, в которых тем или иным способом взаимопогашается действие случайных факторов и тем самым уменьшается колеблемость уровней. Последние в результате становятся как бы «выравненными», «сглаженными» по отношению к исходным фактическим данным. Такие методы обработки рядов динамики называются сглаживанием или выравниванием рядов динамики. Простейший метод сглаживания уровней ряда – укрупнения интервалов, для определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда относятся к коротким промежуткам времени. Например, если имеются данные о ежесуточном производстве мороженого на предприятии за месяц, то, естественно, в таком ряду возможны значительные колебания уровней, так как чем меньше период, за который приводятся данные, тем больше влияние случайных факторов. Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени, например до 5 или 10 дней, и для этих укрупненных интервалов рассчитать общий или среднесуточный объем производства (соответственно по пятидневкам или декадам). В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной. По своей сути метод скользящей средней похож на метод укрупнения интервалов, но в данном случае фактические уровни заменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих m уровней ряда. Например, если принять m=3, то сначала рассчитывается средняя величина из первых трех уровней, затем находится средняя величина из 2-го, 3-го и 4-го уровней, потом из 3-го, 4-го и 5-го и т.д., т.е. каждый раз в сумме трех уровней появляется новый уровень, а два остаются прежними, что и обусловливает взаимопогашение случайных колебаний в средних уровнях. Рассчитанные из m членов скользящие средние относятся к середине (центру) каждого рассматриваемого интервала. Сглаживание методом скользящей средней можно проводить по любому числу членов m, но удобнее, если m – нечетное число, так как в этом случае скользящая средняя сразу относится к конкретной временнОй точке – середине (центру) интервала. Если же m – четное, то скользящая средняя относится к промежутку между временнЫми точками: например, при сглаживании по четырем членам (m=4) средняя из первых четырех уровней будет находиться между второй и третьей временной точкой, следующая – между третьей и четвертой и т.д. Тогда, чтобы сглаженные уровни относились непосредственно к конкретным временнЫм точкам, из каждой пары смежных промежуточных значений скользящих средних находят среднюю арифметическую, которую относят к временной точке, находящейся между смежными. Такой прием двойного расчета сглаженных уровней называется центрированием. Недостатком метода скользящей средней является то, что сглаженный ряд укорачивается по сравнению с фактическим с двух концов: при нечетном m на (m-1)/2, а при четном m – на m/2 с каждого конца. Применяя этот метод, надо помнить, что он сглаживает (устраняет) лишь случайные колебания. Если же, например, ряд содержит сезонную волну (см. 6.6), она сохранится и после сглаживания методом скользящей средней. Кроме того, этот метод сглаживания, как и метод укрупнения интервалов не позволяет выражать общую тенденцию изменения уровней в виде математической модели. Наиболее совершенным методом обработки рядов динамики в целях устранения случайных колебаний и выявления тренда является выравнивание уровней ряда по аналитическим формулам (или аналитическое выравнивание). Суть аналитического выравнивания заключается в замене эмпирических (фактических, исходных) уровней yi теоретическими , которые рассчитаны по определенному уравнению, принятому за математическую модель тренда, где теоретические уровни рассматриваются как функция времени: = f(t). При этом каждый фактический уровень yi рассматривается обычно как сумма двух составляющих: , (2) где f(t) = - систематическая составляющая, отражающая тренд и выраженная определенным уравнением; - случайная величина, вызывающая колебания уровней вокруг тренда. Задача аналитического выравнивания сводится к следующему: 1) определение на основе фактических данных формы (вида) гипотетической функции = f(t), способной наиболее адекватно отразить тенденцию развития исследуемого показателя; 2) нахождение по эмпирическим данным параметров указанной функции (уравнения); 3) расчет по найденному уравнению теоретических (выравненных) уровней. В аналитическом выравнивании наиболее часто используются простейшие функции, представленные в табл. 15, где обозначено - теоретические (выравненные) уровни (читается как «игрек, выравненный по t»); t – условное обозначение времени (1, 2, 3 …); a0, a1, a2, ... – параметры аналитической функции; k – число гармоник (при выравнивании по ряду Фурье). Выбор той или иной функции для выравнивания ряда динамики осуществляется на основании графического изображения эмпирических данных. Если по тем или иным причинам уровни эмпирического ряда трудно описать одной функцией, следует разбить анализируемый период на отдельные части и затем выровнять каждую часть по соответствующей кривой. Таблица 15. Виды математических функций, используемые при выравнивании Название функции Вид функции Формула Прямая линия (2) Парабола 2-го порядка или (2) Парабола 3-го порядка (2) Гипербола (2) Показательная (2) Степенная (2) Ряд Фурье (2) Нередко один и тот же ряд можно выровнять по разным аналитическим функциям и получить довольно близкие результаты. В нашем примере про ВО России можно произвести выравнивание и по прямой линии, и по параболе. Чтобы решить вопрос о том, использование какой кривой дает лучший результат, обычно сопоставляют суммы квадратов отклонений эмпирических уровней от теоретических (остатки), рассчитанным по разным функциям, то есть: . (2) Та функция, при которой эта сумма минимальна, считается наиболее адекватной, приемлемой. Однако сравнивать непосредственно суммы квадратов отклонений можно в том случае, если сравниваемые уравнения имеют одинаковое число параметров. Если же число параметров k разное, то каждую сумму квадратов делят на разность (n – k), выступающую в роли числа степеней свободы, и сравнивают уже квадраты отклонений уровней, рассчитанные на одну степень свободы (т.е. остаточные дисперсии на одну степень свободы). Параметры искомых уравнений (a0, a1, a2, ...) при аналитическом выравнивании могут быть определены по-разному, но наиболее распространенным методом является метод наименьших квадратов (МНК). При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней y от теоретических уровней : . (2) В частности, при выравнивании по прямой вида (2) параметры и отыскиваются по МНК следующим образом. В формуле (2) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными. В соответствии с вышеизложенным найдем частные производные: Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений: (2) где n – количество уровней ряда; t – порядковый номер в условном обозначении периода или момента времени; y – уровни эмпирического ряда. Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда18. Например, при нечетном числе уровней (как в нашем примере про ВО России – 7 уровней) серединная точка времени (год, месяц) принимается за нуль, тогда предшествующие периоды обозначаются соответственно –1, –2, –3 и т.д., а следующие за средним (центральным) – соответственно 1, 2, 3 и т.д. (см. 3-й столбец табл. 16). При четном числе уровней два серединных момента (периода) времени обозначают –1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д. При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений (2) упрощается до следующих двух уравнений, каждое из которых решается самостоятельно: (2) Как видим, при такой нумерации периодов параметр представляет собой средний уровень равномерного интервального ряда, то есть формулу (2). Определим по формуле (2) параметры уравнения прямой для нашего примера про ВО России, для чего исходные данные и все расчеты необходимых сумм представим в табл. 16. Таблица 16. Вспомогательные расчеты для линейного тренда Год y t t2 yt 2000 149,9 -3 9 -449,7 97,557 2739,775 25636,584 11614,681 2001 155,6 -2 4 -311,2 150,929 21,822 11394,038 10418,577 2002 168,3 -1 1 -168,3 204,300 1296,000 2848,509 7987,252 2003 212 257,671 2085,879 0,000 2085,879 2004 280,6 1 1 280,6 311,043 926,768 2848,509 525,719 2005 368,9 2 4 737,8 364,414 20,122 11394,038 12371,795 2006 468,4 3 9 1405,2 417,786 2561,806 25636,584 44406,531 Итого 1803,7 28 1494,4 1803,700 9652,171 79758,263 89410,434 Из табл. 16 получаем, что: a0 = 1803,7/7 = 257,671 и a1 = 1494,4/28 = 53,371. Отсюда искомое уравнение тренда: =257,671+53,371t. В 6-м столбце табл. 16 приведены теоретические (трендовые) уровни, рассчитанные по этому уравнению, а в итоге 7-го столбца – остатки по формуле (2). Для иллюстрации построим график эмпирических и трендовых уровней – рис. 6. Рис. 6. Эмпирические и трендовые уровни ряда динамики ВО России 4.5. Оценка адекватности тренда и прогнозирование Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическим (табличным) значением FТ (Приложение 3). При этом расчетный критерий Фишера определяется по формуле (2): , (2) где k – число параметров (членов) выбранного уравнения тренда. Для проверки правильности расчета сумм в формуле (2) можно использовать следующее равенство (2): . (2) В нашем примере про ВО равенство (2) соблюдается (необходимые суммы рассчитаны в трех последних столбцах табл. 16): 89410,434 = 9652,171 + 79758,263. Сравнение расчетного и теоретического значений критерия Фишера ведется при заданном уровне значимости (вероятности сделать неверный прогноз) с учетом степеней свободы: и . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд. Проверим тренд на адекватность в нашем примере про ВО по формуле (2): FР = 79758,263*5/(9652,171*1) = 41,32 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ = 6,61 находим по Приложению 3 в 1-ом столбце [= k – 1 = 2 – 1 = 1] и 5-й строке [= n – k = 5]). Как уже было отмечено ранее, в нашем примере про ВО России можно произвести выравнивание не только по прямой линии, но и по параболе, чего делать не будем, так как уже найденный линейный тренд адекватно описывает тенденцию. При составлении прогнозов уровней социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (2): , (2) где – точечный прогноз, рассчитанный по модели тренда; – коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n–1 (Приложение 2)19; – ошибка аппроксимации, определяемая по формуле (2): . (2) Спрогнозируем ВО России на 2007 и 2008 годы с вероятностью 0,95 (значимостью 0,05), для чего найдем ошибку аппроксимации по формуле (2): == 43,937 и найдем коэффициент доверия по распределению Стьюдента по Приложению 2: = 2,4469 при = 7 – 1= 6. Прогноз на 2007 и 2008 годы с вероятностью 0,95 по формуле (2): Y2007 = (257,671+53,371*4)2,4469*43,937 или 363,630), то σr рассчитывается по формуле (2): . (2) Обычно, если >3, то r считается значимым (существенным), а связь – реальной. Задавшись определенной вероятностью, можно определить доверительные пределы (границы) r = (), где t – коэффициент доверия, рассчитываемый по интегралу Лапласа (см. Приложение 1). 2. Если число наблюдений небольшое (n<30), то σr рассчитывается по формуле (2): , (2) а значимость r проверяется на основе t-критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (2) и сопоставляется c tТАБЛ. . (2) Табличное значение tТАБЛ находится по таблице распределения t-критерия Стьюдента (см. Приложение 2) при уровне значимости α=1-β и числе степеней свободы ν=n–2. Если tРАСЧ> tТАБЛ , то r считается значимым, а связь между х и у – реальной. В противном случае (tРАСЧ< tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно. В нашей задаче число наблюдений небольшое, значит, оценивать существенность (значимость) линейного коэффициента корреляции будем по формулам (2) и (2): = 0,349/3,162 = 0,110; = 0,937/0,110 = 8,482. Из приложения 2 видно, что при числе степеней свободы ν = 12 – 2 = 10 (в 10-й строке) и вероятности β = 95% (уровень значимости α =1 – β = 0,05) tтабл=2,2281, а при вероятности 99% (α=0,01) tтабл=3,169, значит, tРАСЧ > tТАБЛ, что дает возможность считать линейный коэффициент корреляции r = 0,937 значимым. 5. Подбор уравнения регрессии26 представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х. Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими. Они обычно обозначаются или (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x). Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей. Для аналитической связи между х и у могут использоваться виды уравнений, приведенные в таблице 15 (при условии замены t на x). Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями. Выбрав тип функции (таблица 15), по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным. Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е. . Поставив данное условие, легко определить, при каких значениях a0, a1 и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Данный метод уже использовался нами в теме 6 «Статистическое изучение динамики ВЭД», поэтому, воспользуемся формулой (2) для нахождения параметров теоретической линии регрессии, заменив параметр t на x: (2) Выразив из первого уравнения системы (2) a0, получим27: . (2) Подставив (2) во второе уравнение системы (2), затем разделив обе его части на n, получим: . (2) Применяя 3 раза формулу средней арифметической, получим: . (2) Раскрыв скобки и перенеся члены без a1 в правую часть уравнения, выразим a1: . (2) Параметр a1 в уравнении линейной регрессии называется коэффициентом регрессии, который показывает на сколько изменяется значение результативного признака y при изменении факторного признака x на единицу. Исходные данные и расчеты для нашего примера представим в таблице 22. Таблица 22. Вспомогательные расчеты для нахождения уравнения регрессии № п/п x y x2 xy 1 27,068 172,17 732,677 4660,298 187,124 223,612 2657,453 2 29,889 200,90 893,352 6004,700 202,377 2,181 1317,497 3 33,158 232,10 1099,453 7695,972 220,052 145,147 346,774 4 34,444 231,83 1186,389 7985,153 227,006 23,274 136,153 5 37,299 246,53 1391,215 9195,322 242,443 16,706 14,202 6 37,554 236,99 1410,303 8899,922 243,821 46,669 26,495 7 37,755 233,40 1425,440 8812,017 244,908 132,441 38,864 8 37,909 256,43 1437,092 9721,005 245,741 114,256 49,940 9 38,348 261,89 1470,569 10042,958 248,115 189,761 89,122 10 39,137 259,36 1531,705 10150,572 252,381 48,710 187,871 11 40,370 253,62 1629,737 10238,639 259,048 29,459 415,076 12 46,298 278,87 2143,505 12911,123 291,100 149,580 2748,498 Итого 439,229 2864,09 16351,437 106317,681 2864,115 1121,795 8027,945 По формуле (2): = 5,407. По формуле (2): a0 = 238,674 – 5,407*36,602 = 40,767. Отсюда получаем уравнение регрессии:=40,767+5,407x, подставляя в которое вместо x эмпирические значения факторного признака (2-й столбец таблицы 22), получаем выравненные по прямой линии теоретические значения результативного признака (6-й столбец таблицы 22)28. Для иллюстрации различий между эмпирическими и теоретическими линиями регрессии построим график (рисунок 9). Рис. 9. График эмпирической и теоретической линий регрессии Из рисунка 9 видно, что небольшие различия между эмпирической и теоретической линиями регрессии существуют, поэтому необходимо оценить существенность коэффициента регрессии и уравнения связи, для чего определяют среднюю ошибку параметров уравнения регрессии и сравнивают их с этой ошибкой. Расчет ошибок параметров уравнения регрессии основан на использовании остаточной дисперсии, характеризующей расхождение (отклонение) между эмпирическими и теоретическими значениями результативного признака. Для линейного уравнения регрессии () средние ошибки параметров a1 и a2 определяются по формулам (2) и (2) соответственно: , (2) , (2) . (2) Значимость параметров проверяется путем сопоставления его значения со средней ошибкой. Обозначим это соотношение как t: , (2) При большом числе наблюдений (n>30) параметр ai считается значимым, если >3. Если выборка малая (n<30), то значимость параметра ai проверяется путем сравнения с табличным значения t-критерия Стьюдента при числе степеней свободы ν=n-2 и заданном уровне значимости α (Приложение 2). Если рассчитанное по формуле (2) значение больше табличного, то параметр считается значимым. В нашем примере по формуле (2): = 9,669. Находим среднюю ошибку параметра a0 по формуле (2): = 3,06. Теперь находим среднюю ошибку параметра a1 по формуле (2): =0,639. Теперь по формуле (2) для параметра a0: =13,3. И по той же формуле для параметра a1: =8,46. Так как выборка малая, то задавшись стандартной значимостью α=0,05 находим в 10-й строке Приложения 2 табличное значение tα=2,23, которое значительно меньше полученных значений 13,3 и 8,46, что свидетельствует о значимости обоих параметров уравнения регрессии. Наряду с проверкой значимости отдельных параметров осуществляется проверка значимости уравнения регрессии в целом или, что то же самое, проверка адекватности модели с помощью критерия Фишера по Приложению 3. Данный метод уже использовался нами для проверки адекватности уравнения тренда в предыдущей теме, поэтому воспользовавшись формулой (2) в нашем примере получим29: Сравнивая расчетное значение критерия Фишера Fр = 71,56 с табличным Fт = 4,96, определяемое по Приложению 3 при числе степеней свободы ν1 = k – 1 = 2 –1 = 1 и ν2 = n – k = 12 – 2 = 10 (т.е. 1-й столбец и 10-я строка) и стандартном уровне значимости α=0,05, можно сделать вывод, что уравнение регрессии значимо. 6. Коэффициент эластичности показывает, на сколько процентов изменяется в среднем результативный признак y при изменении факторного признака x на 1%. Он рассчитывается на основе уравнения регрессии: , (2) где – первая производная уравнения регрессии y по x. Коэффициент эластичности – величина переменная, т.е. изменяется с изменением значений фактора x. Так, для линейной зависимости : . (2) Применительно к рассмотренному уравнению регрессии, выражающему зависимость величины таможенных платежей в федеральный бюджет от величины стоимостного внешнеторгового оборота (= 40,767 + 5,407x), коэффициент эластичности по формуле (2): . Подставляя в данное выражение разные значения x, получаем и разные значения Э. Так, например, при x = 40 коэффициент эластичности = 0,84, а при x = 50 соответственно = 0,87 и т.д. Это значит, что при увеличении внешнеторгового товарооборота x с 40 до 40,4 млрд.долл. (т.е. на 1%), величина таможенных платежей возрастет в среднем на 0,84% прежнего уровня; при увеличении x с 50 до 50,5 млрд.долл. (т.е. на 1%) y возрастет на 0,87% и т.д. 5.3. Контрольные задания На основе исходных данных контрольных заданий по теме 2 (таблица 7) и таблицы 23 определить наличие и характер корреляционной связи между признаками x и y. Таблица 23. Варианты выполнения контрольного задания При-знак Вариант 1 2 3 4 5 6 7 8 9 10 x Рост Доход Возраст IQ Доход Возраст рост/вес Стаж Доход IQ y Вес Вес Доход Доход Тетрадь рост/вес Кол-во друзей Доход Кол-во друзей Время решения 6. ИНДЕКСЫ 6.1. Индивидуальные индексы Индекс – относительная величина, показывающая, во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. В статистическом анализе индексы используются не только для сопоставления уровней явлений, но и для установления значимости причин, вызывающих их изменение. Если анализируются простые явления или не имеет значения структура сложных явлений, то применяются индивидуальные индексы. Например, такие простые явления как количество проданного товара q и его цена р своим произведением образуют такое сложное явление, как выручка от продаж Q=qp. Сравнение их значений по отдельности для конкретного товара в отчетном периоде времени относительно какого-либо базисного периода и дает индивидуальные индексы: • количества товара iq = q1 /q0 ; • его цены ip = p1/p0 ; • выручки от продаж iQ = Q1 /Q0 . Очевидно, что индивидуальный индекс сложного явления формируется из таких индексов простых его составляющих по типологической формуле его определения. То есть iQ=iqip (2) Подставив сюда индивидуальный индекс выручки, записываем: Q1/Q0= iqip откуда получаем, что Q1= iqipQ0 (2) Формула (2) представляет собой двухфакторную мультипликативную модель сложного явления, позволяющую находить его изменение под влиянием каждого фактора в отдельности. Мультипликативной она называется потому, что содержит только действие умножения. Если в формуле только сложение, или вычитание, или оба этих действия, то она называется аддитивной моделью. Если в формуле только деление, то она называется кратной моделью. Если в формуле сложение и вычитание с умножением и делением в любом сочетании, то она называется смешанной моделью. Общее изменение выручки равняется =Q1-Q0, а ее изменение от каждого фактора определяется следующим образом. От изменения количества товара при постоянной цене (ip = 1) оно равно q= iqQ0 - Q0 = (iq –1) Q0, (2) а при изменении еще и цены оно будет равным p= Q1 - Q0 -q = iqipQ0 - Q0 - (iq –1) Q0= iq(ip –1) Q0, (2) Так, если выручка от продаж возросла с Q0 = 8 млн. руб. в предыдущем периоде до Q1 =12,18 млн. руб. в последующем при увеличении количества проданного товара на 5% (iq =1,05) и повышении цены на 45% (ip =1,45), то можно по формуле (2) записать, что Q1 = 1,05*1,45*8 = 12,18 млн. руб. При этом весь прирост выручки в сумме = 12,18-8=4,18 млн. руб. вызван увеличением обоих факторов. За счет изменения количества проданного товара он по формуле (2) составил q =(1,05-1)8=0,4 млн. руб., а за счет изменения цены по формуле (2) равняется p =1,05(1,45-1)8 =3,78 млн. руб. Для контроля отмечаем, что сумма факторных изменений выручки равна общему: 0,4+3,78=4,18 млн. руб. Формулы (2) и (2) получены исходя из того, что в основной формуле выручки количество товара - первый фактор, а цена - второй. Если эти факторы поменять местами, то выручка и ее общее изменение останутся прежними, но изменения от каждого фактора будут другими. Так, если основываться на формуле выручки вида Q = pq, то ее изменение за счет цены, как первого фактора, по аналогии с формулой (2) будет равняться p = (ip –1) Q0 , (2) Изменение выручки за счет количества товара, как второго фактора, по аналогии с формулой (2) определится по выражению q= ip(iq –1) Q0. (2) Суммарное по факторам изменение выручки по-прежнему равняется ее общему изменению. В рассмотренном примере, считая цену первым фактором и применяя формулу (2), определяем, что изменение выручки за счет повышения цены равняется p = (1,45-1)8 = 3,6 млн. руб. Изменение выручки за счет увеличения количества проданного товара, как второго фактора, по формуле (2) равно q = 1,45(1,05-1)8 = 0,58 млн. руб. Общее изменение выручки осталось прежним: 3,6+0,58=4,18 млн. руб. В связи с различными факторными изменениями выручки в зависимости от места фактора в ее основной формуле, встает вопрос, какую же формулу выручки применять для анализа. Это зависит от конкретной экономической ситуации. Если увеличение выручки обеспечивается главным образом за счет роста количества проданного товара при более или менее стабильной цене, то товар считается первым фактором, а цена — вторым. Если же увеличение выручки достигается в основном повышением цен без увеличения и даже при снижении количества проданного товара, то цена считается первым фактором, а товар — вторым. Значит, очередность анализа по факторам вытекает из вида формулы сложного явления. Так, если материальные затраты М на выпуск продукции определяются как произведение ее количества q, удельного расхода материала т и его цены р, то типологическая формула имеет вид М = qmp, (2) а трехфакторная мультипликативная модель запишется как M1=iqimipM0. (2) Следовательно, можно записать следующие формулы факторных изменений материальных затрат Меняя факторы местами в основной формуле (2), можно получать другие факторные формулы. Но всегда общее изменение материальных затрат, равное сумме факторных изменений, будет одинаковым. Подобные мультипликативные модели можно формировать для неограниченного числа факторов. 6.2. Простые общие индексы Индекс становится общим, когда в основной формуле показывается неоднородность изучаемого явления. Например, анализируется изменение выручки от продаж не одного, а всех или нескольких видов товаров. Тогда общий индекс количества проданных товаров будет равен = (2) Аналогично по ценам = (2) Аналогично по выручке == (2) Однако здесь двухфакторная мультипликативная модель не может выглядеть как в случае индивидуальных индексов, потому что произведение простых общих индексов количества товаров и цен не равно общему индексу выручки. То есть и убеждаемся в этом неравенстве, подставив значения общих индексов из формул (2) – (2). В самом деле: Как видим, в числителе и знаменателе левой части произведения сумм, а в числителе и знаменателе правой части сумма произведений и они, конечно, не адекватны. Это вызвано тем, что записанные выше общие индексы простых явлений не отражают взаимосвязи между собой в сложном явлении и потому считаются не объективными. Поэтому они помечены штрихом и названы простыми общими индексами. 6.3. Агрегатные общие индексы Объективность общим индексам придает их запись в агрегатном виде, предложенная Ласпейресом и Пааше. Агрегатный общий индекс Ласпейреса для количества товаров как первого фактора выручки определяется по формуле = (2) Аналогично можно записать агрегатный общий индекс Ласпейреса для цен как первого фактора выручки, то есть = (2) В формулах Ласпейреса знаменатели по существу одинаковые, представляя собой выручку базисного периода, а числители разные. В формуле (2) это отчетная выручка в базисных ценах (количесгво товаров отчетное, а цены — базисные), в формуле (2) наоборот — базисная выручка в отчетных ценах (цены отчетные, а количество товаров — базисное). Агрегатные общие индексы Пааше применяются ко вторым факторам мультипликативных моделей. Поэтому такой индекс для цен как второго фактора выручки определяется по формуле = (2) Аналогично можно записать агрегатный общий индекс Пааше для количества товаров как второго фактора выручки, то есть = (2) В формулах Пааше числители по существу одинаковые, представляя собой выручку отчетного периода, а знаменатели аналогичны числителям формул Ласпейреса. Для облегчения запоминания студентами формул Ласпейреса и Пааше предлагаю обратить внимание на букву «ш» в слове «Пааше», которая напоминает «111» - так обозначены отчетные периоды в общей формуле (две единицы – в числителе, а одна – в знаменателе). В формуле же Ласпейреса – три нуля (наоборот к формуле Пааше). Произведения количественного индекса Ласпейреса и ценового индекса Пааше, а также ценового индекса Ласпейреса и количественного индекса Пааше дают общий индекс выручки . (2) Однако вид этих формул показывает, что однофакторные индексы Ласпейреса и Пааше не равны между собой. То есть не равными являются количественные индексы Ласпейреса и Пааше и ценовые. Американский экономист Гершенкрон обширными расчетами установил, что по одному и тому же фактору индекс Ласпейреса обычно больше индекса Пааше и это открытие названо эффектом Гершенкрона. Но в статистике должно быть одно значение индекса, поэтому американский экономист Фишер предложил применять среднюю геометрическую величину из индексов Ласпейреса и Пааше, определяя ее по формулам: для количества товаров = (2) для цен = (2) 6.4. Общие индексы как средние из индивидуальных Помимо записи общих индексов в агрегатном виде, на практике часто используют формулы их расчета как величин, средних из соответствующих индивидуальных индексов. Используя их формулы, можем записывать, что q1 = q0iq и p1 = p0ip, а также, что q0 =q1/iq и р0=р1/ip. Подставив отчетные значения количества товара и цены в формулу общего индекса выручки, получим IQ===. (2) Значит, общий индекс выручки можно определять только через ее базисные значения с умножением в числителе на индивидуальный индекс выручки по конкретному товару. Теперь подставим базисные значения количества товара и цены в формулу общего индекса выручки. Тогда получим IQ =. (2) Значит, общий индекс выручки можно определять только через ее отчетные значения с делением в знаменателе на индивидуальный индекс выручки по конкретному товару. Аналогично через индивидуальные индексы количества товара и цены можно выразить агрегатные общие индексы Ласпейреса и Пааше. 6.5. Индекс структурных сдвигов Выше изложенные общие индексы применимы к изучению явлений, образованных как разными, так и однородными процессами. В последнем случае динамику итога можно показать через простые общие индексы отдельных факторов. Для доказательства в формуле количественного индекса Ласпейреса числитель умножим и разделим на , а знаменатель – на . Тогда будем иметь ===, (2) где= - простой общий индекс количества товаров; =– доля или удельный вес конкретного товара в общем количестве; =- агрегатный общий индекс структуры, доли или удельного веса, часто называемый индексом структурных сдвигов. Следовательно, количественный индекс Ласпейреса равняется произведению простого общего индекса количества товаров и индекса структурных сдвигов. То есть =, (2) откуда для определения индекса структурных сдвигов получается довольно простая формула =/. (2) Используя формулу (2) в двухфакторной модели общего индекса выручки, получим его трехфакторную мультипликативную модель вида IQ ==. (2) Трехфакторная модель возможна к широкому применению в экономическом анализе для установления количественного влияния каждого фактора на вариацию сложного явления. 6.6. Факторный анализ общей и частной выручки Приравнивая правую часть полученной трехфакторной модели и среднюю часть формулы (2), записываем выражение =, из которого заключаем, что общую выручку отчетного периода можно определить через общую выручку базисного периода и общие индексы по мультипликативной формуле =. (2) Эта формула в точности соответствует мультипликативной модели (2), что позволяет применять соответствующие формулы факторных изменений. Так, изменение общей выручки за счет изменения общего количества товаров определится по формуле =. (2) Изменение общей выручки за счет изменения долей конкретных товаров (структурных сдвигов) определяется по формуле =. (2) И наконец изменение общей выручки за счет изменения цен определяется по формуле =. (2) Естественно, сумма факторных изменений должна равняться общему итоговому изменению. То есть для контроля правильности анализа проверяется выполнение условия =-=++. (2) Факторный анализ изменения выручки по отдельному товару в составе общего товарооборота ведется на основе следующей трехфакторной мультипликативной модели =, (2) где = — индивидуальный индекс доли конкретного товара. Следовательно, изменения выручки по конкретному товару за счет изменения каждого фактора могут определяться по формулам: за счет изменения общего количества товаров (товарооборота) =; (2) за счет изменения доли конкретного товара =; (2) за счет изменения цены конкретного товара =. (2) Естественно, факторные изменения выручки по конкретному товару в сумме должны равняться полному изменению выручки по этому товару. То есть для контроля правильности анализа проверяется выполнение условия =-=++. (2) где j — признак конкретного товара. Кроме того, полные изменения выручки по каждому товару в сумме должны равняться общему изменению выручки по всему товарообороту. То есть для контроля правильности анализа дополнительно проверяется выполнение условия =. При этом для облегчения необходимого контроля результаты факторного анализа представляются в виде факторной таблицы, рассмотренной ниже в методических указаниях по теме. 6.7. Индексы фиксированного (постоянного) и переменного состава В полученной трехфакторной модели (2) второй и третий индексы запишем подробно по формулам их определения, а третий еще и сократим на . Тогда сначала будем иметь IQ =====, а, произведя очевидное сокращение и обозначив =- индекс переменного состава, (2) получим общий индекс выручки в виде формулы IQ =. (2) = называется индексом фиксированного (постоянного) состава. (2) Следовательно, общий индекс выручки есть произведение простого общего индекса количества товаров и индекса переменного состава, который показывает изменение средних цен, т.е. . Из формулы (2) можно заключить, что индекс переменного состава есть частное от деления общего индекса выручки на простой общий индекс количества товаров, тогда как ценовый индекс Пааше наравне с формулой Error: Reference source not found возможно определять как отношение общего индекса выручки и количественного индекса Ласпейреса. Изложенные математические выкладки позволяют общий индекс выручки определять следующими семью способами =======. Результат расчета любым способом должен быть одинаковым и это яркий пример того, что истина всегда одна, хотя пути ее достижения могут быть разными. 6.8. Методические указания по теме Процесс определения всевозможных индексов и факторного анализа сложного явления рассмотрим на примере двух фирм, выпускающих однородный продукт. Исходные данные приведены в табл. 24. В табл. 24 итоговое количество продукта есть сумма его количества по фирмам, а итоговая цена представляет собой среднюю арифметическую взвешенную величину, найденную по формуле (2). Таблица 24. Результаты работы двух фирм по выпуску однородного продукта Фирма Базисный период (база) Отчетный период (отчет) Количество продукта q0, тыс.ед. Отпускная цена p0, руб/ед. Количество продукта q1, тыс.ед. Отпускная цена p1 , руб/ед. 1 100 20 140 15 2 150 22 160 25 Итого 250 21,20 300 20,23 Так, для базисного периода она равна == (100*20+150*22)/(100+150) = 5300/250 = 21,20 руб./ед. Для отчетного периода средняя цена равняется == (14*15+160*25)/(140+160) = 6100/300 = 20,23 руб./ед. После этого в табл. 25 ведется расчет индивидуальных индексов. Таблица 25. Определение выручки и индивидуальных индексов Выручка и индексы База по фирмам Отчет по фирмам 1 2 1 2 Выручка Q, тыс. руб. 100*20=2000 150*22=3300 140*15=2I00 160*25=4000 Изменение выручки , тыс. руб. 2100-2000=100 4000-3300=700 Доля фирм в количестве продукта d 100/250=0,4 150/250=0,6 140/300=0,467 160/300=0,533 Индивидуальные индексы: количества iq 140/100=1,4 160/150=1,067 отпускных цен ip 15/20=0,75 25/22=1,136 доли фирм id 0,467/0,4=1,167 0,533/0,6=0,889 выручки iQ 2100/2000=1,05 4000/3300=1,212 Из табл. 25 заключаем, что общая выручка по периодам составляет: = 2000+3300 =5300 тыс. руб.; = 2100+4000 =6100 тыс. руб. Ее абсолютное изменение равно =6100-5300=800 тыс. руб., а общий индекс изменения равняется = 6100/5300 = 1,151. Контроль правильности расчетов по табл. 25 заключается в следующем. 1. Общее изменение выручки должно равняться сумме ее частных изменений: = 100+700 = 800 тыс. руб. 2. Произведение факторных индивидуальных индексов по периодам должно равняться соответствующему индивидуальному индексу выручки: iQ1=1,4*0,75 =1,05; iQ2= 1,067*1,136 = 1,212. 3. Сумма долей количества продукта по периодам должна равняться единице: =0,4+0,6 = 1; =0,467+0,533=1. Затем переходим к расчету простых и агрегатных общих индексов. Простой общий индекс количества продукта - по формуле (2) =(140+160)/(100+150)=300/250=1,2. Агрегатный общий количественный индекс Ласпейреса - по формуле Error: Reference source not found ==6320/5300=1,192. Агрегатный общий ценовый индекс Пааше - по формуле Error: Reference source not found ==6100/6320=0,965. Контроль по формуле IQ = = 1,192*0,965 = 1,151. Агрегатный общий ценовый индекс Ласпейреса - по формуле Error: Reference source not found ==5250/5300=0,9905. Агрегатный общий количественный индекс Пааше — по формуле Error: Reference source not found =6100/5250=1,162. Контроль по формуле IQ = = 0,9905*1,162 =1,151. Средняя геометрическая величина из индексов Ласпейреса и Пааше (по методике Фишера) по формулам (2) и (2) ==1,1769 ==0,9777 Общий индекс выручки как средний из ее индивидуальных индексов: — с использованием только базисной выручки — по формуле (2) IQ==1,151. — с использованием только отчетной выручки — по формуле (2) IQ==1,151. Индекс структурных сдвигов — по формуле ===21,07/21,2=0,994. Контроль по формуле == 1,2*0,994*0,965 = 1,151. Индекс переменного состава — по формуле (2) ===20,33/21,2=0,959. Контроль по формуле == 1,2*0,959=1,151. Далее выполняется факторный анализ общей выручки. Так ее изменение за счет изменения общего количества продукта определится по формуле (2) = (1,2-1)*5300 = 1060 тыс. руб. Изменение общей выручки за счет структурных сдвигов в количестве продукта находится по формуле (2) = 1,2*(0,994-1)*5300 = -40 тыс. руб. Изменение общей выручки за счет изменения отпускных цен - по формуле (2) =1,2*0,994*(0,965-1)*5300 = -220 тыс. руб. Контроль по формуле (2): = 1060-40-220 = 800 тыс. руб. Результаты факторного анализа общей выручки заносятся в табл. 26. Наконец, ведется факторный анализ изменения частной выручки по формулам (2) – (2). Так у первой фирмы изменение выручки за счет изменения общего количества продукта равно =(1,2-1)*2000 = 400 тыс. руб. Аналогично у второй фирмы = (1,2-1)*3300 = 660 тыс. руб. Контроль: =400+660=1060 тыс.руб. У первой фирмы изменение выручки за счет структурных сдвигов в количестве продукта равно =1,2*(1,167-1)*2000 = 400 тыс. руб. Аналогично у второй фирмы =1,2*(0,889-1)*3300 = -440 тыс. руб. Контроль: =400-440= -40 тыс.руб. У первой фирмы изменение выручки за счет изменения отпускной цены равно =1,2*1,167*(0,75-1)*2000 = -700 тыс. руб. Аналогично у второй фирмы =1,2*0,889*(1,136-1)*3300 = 480 тыс. руб. Контроль: = -700+480= -220 тыс.руб. Результаты факторного анализа частной выручки также заносятся в табл. табл. 23, в которой все числа оказались взаимно согласованными. Таблица 26. Результаты факторного анализа сложного явления Фирма Изменение выручки, тыс.руб. В том числе за счет изменения количества продукта структурных сдвигов отпускных цен 1 100 400 400 -700 2 700 660 -440 480 Итого 800 1060 -40 -220 Таблица. 23 свидетельствует о правильности проведенного факторного анализа, поскольку в ней факторные изменения выручки, как по столбцам, так и по строкам в сумме равняются ее изменениям по отдельным факторам, фирмам и в целом. 6.9. Контрольные задания Имеются данные (табл. 27) о продажах минимаркетом 3-х видов однородных товаров (A, B и C). Таблица 27. Варианты выполнения контрольного задания Вид товара Цена за единицу товара, руб. Объем продаж, тыс. штук Вид товара Цена за единицу товара, руб. Объем продаж, тыс. штук 1 квартал 2 квартал 1 квартал 2 квартал 1 квартал 2 квартал 1 квартал 2 квартал 1 вариант 6 вариант А 102 105 205 195 А 130 125 138 198 В 56 51 380 423 В 50 56 339 264 С 26 30 510 490 С 20 21 613 511 2 вариант 7 вариант А 112 109 202 260 А 107 110 220 189 В 51 48 365 420 В 46 44 490 550 С 22 26 477 316 С 18 20 720 680 3 вариант 8 вариант А 99 103 198 182 А 95 98 264 197 В 55 59 370 361 В 48 50 360 294 С 20 18 502 456 С 26 25 448 640 4 вариант 9 вариант А 99 109 188 182 А 89 92 360 294 В 55 56 380 385 В 58 56 410 482 С 20 21 508 444 С 24 25 558 593 5 вариант 10 вариант А 120 110 170 220 А 120 125 150 108 В 60 58 350 390 В 44 46 513 461 С 19 20 550 490 С 16 19 891 550 Рассчитать всевозможные индексы, выполнить факторный анализ выручки от продажи товаров. По итогам расчетов сделать аргументированные выводы. Приложения – статистические таблицы Приложение 1. Значения интеграла Лапласа t Сотые доли 1 2 3 4 5 6 7 8 9 0,00 0,0000 0,0080 0,0160 0,0239 0,0319 0,0399 0,0478 0,0558 0,0638 0,0717 0,10 0,0797 0,0876 0,0955 0,1034 0,1113 0,1192 0,1271 0,1350 0,1428 0,1507 0,20 0,1585 0,1663 0,1741 0,1819 0,1897 0,1974 0,2051 0,2128 0,2205 0,2282 0,30 0,2358 0,2434 0,2510 0,2586 0,2661 0,2737 0,2812 0,2886 0,2961 0,3035 0,40 0,3108 0,3182 0,3255 0,3328 0,3401 0,3473 0,3545 0,3616 0,3688 0,3759 0,50 0,3829 0,3899 0,3969 0,4039 0,4108 0,4177 0,4245 0,4313 0,4381 0,4448 0,60 0,4515 0,4581 0,4647 0,4713 0,4778 0,4843 0,4907 0,4971 0,5035 0,5098 0,70 0,5161 0,5223 0,5285 0,5346 0,5407 0,5467 0,5527 0,5587 0,5646 0,5705 0,80 0,5763 0,5821 0,5878 0,5935 0,5991 0,6047 0,6102 0,6157 0,6211 0,6265 0,90 0,6319 0,6372 0,6424 0,6476 0,6528 0,6579 0,6629 0,6680 0,6729 0,6778 1,00 0,6827 0,6875 0,6923 0,6970 0,7017 0,7063 0,7109 0,7154 0,7199 0,7243 1,10 0,7287 0,7330 0,7373 0,7415 0,7457 0,7499 0,7540 0,7580 0,7620 0,7660 1,20 0,7699 0,7737 0,7775 0,7813 0,7850 0,7887 0,7923 0,7959 0,7995 0,8029 1,30 0,8064 0,8098 0,8132 0,8165 0,8198 0,8230 0,8262 0,8293 0,8324 0,8355 1,40 0,8385 0,8415 0,8444 0,8473 0,8501 0,8529 0,8557 0,8584 0,8611 0,8638 1,50 0,8664 0,8690 0,8715 0,8740 0,8764 0,8789 0,8812 0,8836 0,8859 0,8882 1,60 0,8904 0,8926 0,8948 0,8969 0,8990 0,9011 0,9031 0,9051 0,9070 0,9090 1,70 0,9109 0,9127 0,9146 0,9164 0,9181 0,9199 0,9216 0,9233 0,9249 0,9265 1,80 0,9281 0,9297 0,9312 0,9328 0,9342 0,9357 0,9371 0,9385 0,9399 0,9412 1,90 0,9426 0,9439 0,9451 0,9464 0,9476 0,9488 0,9500 0,9512 0,9523 0,9534 2,00 0,9545 0,9556 0,9566 0,9576 0,9586 0,9596 0,9606 0,9615 0,9625 0,9634 2,10 0,9643 0,9651 0,9660 0,9668 0,9676 0,9684 0,9692 0,9700 0,9707 0,9715 2,20 0,9722 0,9729 0,9736 0,9743 0,9749 0,9756 0,9762 0,9768 0,9774 0,9780 2,30 0,9786 0,9791 0,9797 0,9802 0,9807 0,9812 0,9817 0,9822 0,9827 0,9832 2,40 0,9836 0,9840 0,9845 0,9849 0,9853 0,9857 0,9861 0,9865 0,9869 0,9872 2,50 0,9876 0,9879 0,9883 0,9886 0,9889 0,9892 0,9895 0,9898 0,9901 0,9904 2,60 0,9907 0,9909 0,9912 0,9915 0,9917 0,9920 0,9922 0,9924 0,9926 0,9929 2,70 0,9931 0,9933 0,9935 0,9937 0,9939 0,9940 0,9942 0,9944 0,9946 0,9947 2,80 0,9949 0,9950 0,9952 0,9953 0,9955 0,9956 0,9958 0,9959 0,9960 0,9961 2,90 0,9963 0,9964 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 3,00 0,9973 0,9974 0,9975 0,9976 0,9976 0,9977 0,9978 0,9979 0,9979 0,9980 3,10 0,9981 0,9981 0,9982 0,9983 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 3,20 0,9986 0,9987 0,9987 0,9988 0,9988 0,9988 0,9989 0,9989 0,9990 0,9990 3,30 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,40 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 0,9995 3,50 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 0,9997 Приложение 2. Значения t-критерия Стьюдента при уровне значимости : 0,10, 0,05, 0,01 Число степеней свободы ν  Число степеней свободы ν  0,1 0,05 0,01 0,1 0,05 0,01 1 6,314 12,706 63,66 18 1,734 2,101 2,878 2 2,92 4,3027 9,925 19 1,729 2,093 2,861 3 2,353 3,1825 5,841 20 1,725 2,086 2,845 4 2,132 2,7764 4,604 21 1,721 2,08 2,831 5 2,015 2,5706 4,032 22 1,717 2,074 2,819 6 1,943 2,4469 3,707 23 1,714 2,069 2,807 7 1,895 2,3646 3,5 24 1,711 2,064 2,797 8 1,86 2,306 3,355 25 1,708 2,06 2,787 9 1,833 2,2622 3,25 26 1,706 2,056 2,779 10 1,813 2,2281 3,169 27 1,703 2,052 2,771 11 1,796 2,201 3,106 28 1,701 2,048 2,763 12 1,782 2,1788 3,055 29 1,699 2,045 2,756 13 1,771 2,1604 3,012 30 1,697 2,042 2,75 14 1,761 2,1448 2,977 40 1,684 2,021 2,705 15 1,753 2,1315 2,947 60 1,671 2 2,66 16 1,746 2,1199, 2,921 120 1,658 1,98 2,617 17 1,74 2,1098 2,898 1,645 1,96 2,576 Приложение 3. Значения F-критерия Фишера при уровне значимости  = 0,05 ν1 ν2 1 2 3 4 5 6 8 12 24 1 161,5 200 215,7 224,6 230,2 234 238,9 243,9 249 254,3 2 18,5 19 19,16 19,25 19,3 19,33 19,37 19,41 19,45 19,5 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,9 2,71 10 4,96 4,1 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,2 3,09 2,95 2,79 2,61 2,4 12 4,75 3,88 3,49 3,26 3,11 3 2,85 2,69 2,5 2,3 13 4,67 3,8 3,41 3,18 3,02 2,92 2,77 2,6 2,42 2,21 14 4,6 3,74 3,34 3,11 2,96 2,85 2,7 2,53 2,35 2,13 15 4,54 3,68 3,29 3,06 2,9 2,79 2,64 2,48 2,29 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,24 2,01 17 4,45 3,59 3,2 2,96 2,81 2,7 2,55 2,38 2,19 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15 1,92 19 4,38 3,52 3,13 2,9 2,74 2,63 2,48 2,31 2,11 1,88 20 4,35 3,49 3,1 2,87 2,71 2,6 2,45 2,28 2,08 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,42 2,25 2,05 1,81 22 4,3 3,44 3,05 2,82 2,66 2,55 2,4 2,23 2,03 1,78 23 4,28 3,42 3,03 2,8 2,64 2,53 2,38 2,2 2 1,76 24 4,26 3,4 3,01 2,78 2,62 2,51 2,36 2,18 1,98 1,73 25 4,24 3,38 2,99 2,76 2,6 2,49 2,34 2,16 1,96 1,71 26 4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,3 2,13 1,93 1,67 28 4,2 3,34 2,95 2,71 2,56 2,44 2,29 2,12 1,91 1,65 29 4,18 3,33 2,93 2,7 2,54 2,43 2,28 2,1 1,9 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,09 1,89 1,62 35 4,12 3,26 2,87 2,64 2,48 2,37 2,22 2,04 1,83 1,57 40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2 1,79 1,52 45 4,06 3,21 2,81 2,58 2,42 2,31 2,15 1,97 1,76 1,48 50 4,03 3,18 2,79 2,56 2,4 2,29 2,13 1,95 1,72 1,44 60 4 3,15 2,76 2,52 2,37 2,25 2,1 1,92 1,7 1,39 70 3,98 3,13 2,74 2,5 2,35 2,23 2,07 1,89 1,67 1,35 80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,88 1,65 1,31 90 3,95 3,1 2,71 2,47 2,32 2,2 2,04 1,86 1,64 1,28 100 3,94 3,09 2,7 2,46 2,3 2,19 2,03 1,85 1,63 1,26 125 3,92 3,07 2,68 2,44 2,29 2,17 2,01 1,83 1,6 1,21 150 3,9 3,06 2,66 2,43 2,27 2,16 2 1,82 1,59 1,18 200 3,89 3,04 2,65 2,42 2,26 2,14 1,98 1,8 1,57 1,14 300 3,87 3,03 2,64 2,41 2,25 2,13 1,97 1,79. 1,55 1,1 400 3,86 3,02 2,63 2,4 2,24 2,12 1,96 1,78 1,54 1,07 500 3,86 3,01 2,62 2,39 2,23 2,11 1,96 1,77 1,54 1,06 1000 3,85 3 2,61 2,38 2,22 2,1 1,95 1,76 1,53 1,03 3,84 2,99 2,6 2,37 2,21 2,09 1,94 1,75 1,52

Теория статистики

Тебе могут подойти лекции