Основы юридической статистики

👀 1252 просмотра
📌 1211 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Основы юридической статистики», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Основы юридической статистики», Word формат

Основы юридической статистики Вопросы лекции 1. Понятие юридической статистики 1 2. Первичная обработка материалов массовых статистических наблюдений 2 3. Графическое представление статистического распределения 4 4. Числовые характеристики статистического распределения 7 5. Ряды динамики 9 5.1. Понятие о рядах динамики и их виды 9 5.2. Показатели, характеризующие тенденцию динамики 12 5.3. Расчет параметров тренда 14 5.4. Показатели колеблемости 17 5.5. Прогнозирование на основе тренда и колеблемости 18 6. Статистические взаимосвязи 20 6.1. Функциональная и корреляционная зависимости 20 6.2. Условия применения корреляционно-регрессионного анализа 22 6.3. Задачи корреляционно-регрессионного анализа 23 6.4. Парная линейная корреляция 25 1. Понятие юридической статистики Статистика – это общественная наука, изучающая количественную сторону массовых общественных явлений и процессов в неразрывной связи с их качественной стороной, в конкретных условиях места и времени.1 Массовые общественные явления и процессы представляют собой, например, производство и потребление товаров, внутреннюю и внешнюю торговлю, рождаемость и смертность, доходы и расходы населения и т.д. Каждое из этих явлений и процессов состоит из большого количества однородных единиц, которые вместе взятые в конкретных условиях места и времени представляют собой статистическую совокупность. Изучение статистической совокупности с учетом индивидуальности каждой ее единицы и составляет основную задачу статистической науки. Как отрасль практической деятельности статистика предполагает сбор, обработку, анализ и публикацию данных, характеризующих наблюдаемый объект. Статистика позволяет определить меру взаимосвязи между явлениями и процессами. В основе статистической методологии лежит совокупность количественных и качественных приемов анализа изучаемых явлений и процессов. Она широко использует математику, как наиболее точный инструмент исследования. Общая теории статистики является методологической наукой, которая разрабатывает и определяет общие принципы и методы статистического исследования. Отраслевые статистики – статистика промышленности, труда, транспорта, юридическая статистика и т.д. используют методы общей статистики. Юридическая статистика – отрасль статистической науки, имеющая дело с количественными показателями правовой и иной юридически значимой деятельности.2 2. Первичная обработка материалов массовых статистических наблюдений Исходным пунктом исследования, проводимого с использованием статистических методов, является статистическое наблюдение, то есть научно организованный сбор информации о признаках исследуемых объектов. Статистическое наблюдение, проведенное на основе официального учета или путем специально организованного изучения, дает большое число сведений. Но эти данные разрозненны, для дальнейшего изучения их нужно систематизировать. Научная разработка и систематизация материалов статистического наблюдения является первым этапом проведения первичной обработки и называется статистической сводкой. Составными элементами сводки являются: 1) разработка системы показателей, характеризующих преступность или другое социально-правовое явление в целом и ее отдельные группы (показатели могут быть количественными или качественными); 2) статистическая группировка полученных данных; 3) подсчет групповых и общих итогов; 4) оформление результатов в виде статистических таблиц или графиков. В юридической статистике применяются три вида группировок: типологическая, вариационная (или структурная) и аналитическая. Под типологической группировкой понимают расчленение изучаемой совокупности преступлений, преступников или других явлений, имеющих юридическое значение, на отдельные качественно однородные совокупности по важнейшим существенным качественным признакам. Например, это деление преступлений по категориям тяжести (небольшой тяжести, средней тяжести, тяжкие и особо тяжкие), личности виновных (мужчины и женщины, взрослые и несовершеннолетние, ранее судимые и несудимые) и т. д. Качественные признаки нередко переплетаются между собой, образуя сложную типологическую группировку деяний. Вариационная, группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений, правонарушителей, гражданских исков и других показателей. При такой группировке однородная совокупность расчленяется по величине изменяющегося (варьирующегося) признака. Если в основе типологической группировки лежат качественные признаки, то в основу вариационной положены количественные (возраст правонарушителей, сроки наказания, суммы ущерба, суммы иска и т. д.). Аналитическая группировка юридически значимых показателей позволяет обнаружить взаимосвязь и зависимость изучаемых явлений и процессов. В определенной мере эта задача решается и типологической, и структурной группировками. Но аналитическая группировка данных специально предназначена для решения этой задачи. Пример 1. Пусть имеются данные о возрасте 100 рецидивистов, осужденных за грабеж и разбой: 18, 20, 32, 23, 20, 24, 22, 18, 29, 23, 19, 21, 18, 23, 18, 24, 27, 31, 19, 25, 27, 21, 28, 25, 16, 17, 27, 21, 19, 20, 19, 25, 18, 27, 22, 23, 19, 31, 32, 27, 19, 22, 30, 17, 22, 19, 18, 24, 20, 22, 17, 29, 21, 27, 17, 31, 25, 20, 24, 19, 26, 28, 21, 18, 26, 21, 20, 23, 26, 23, 19, 25, 21, 20, 18, 25, 33, 18, 33, 19, 33, 28, 31, 22, 30, 19, 26, 18, 29, 20, 29, 19, 23, 32, 17, 20, 33, 21, 33, 19. Проведем вариационную группировку данных. После их упорядочивания в порядке возрастания получим следующий ряд: 16, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 33, 33. Операция упорядочивания ряда числовых данных по возрастанию (убыванию) называется его ранжированием. После сводки материалы наблюдения принимают следующий вид, для большего удобства записываемый в виде таблицы. таблица 1 Наблюдаемые значения возраста (х1=16, х2=17, ..., х18=33) называются вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом или рядом распределения. Числа наблюдений в начале примера – это числа лиц n1, n2, ..., n18 называются частотами. Относительной частотой называется отношение числа наблюдений данной варианты (ni) к общему числу наблюдений (), т.е. . Отметим, что сумма относительных частот равна единице: . Вычислим относительные частоты. таблица 2 Теперь можно, например, подсчитать, сколько в России преступников, совершивших преступление в возрасте 18 лет. Доля 18-летних преступников 0,1. Умножив общее число лиц, нарушивших уголовный закон, на 0,1 получим искомое число. Перечень вариант и соответствующих им частот называют статистическим распределением выборки. При соблюдении всех правил проведения выборочного исследования статистическое распределение выборки является экспериментальным отражением соответствующего закона распределения случайной величины и может служить основанием для анализа действующих факторов и закономерностей. Вариационные ряды бывают дискретные и интервальные (непрерывные). Вариационный ряд называется дискретным, если в нем указаны конкретные значения варьируемого признака. Вариационный ряд называется интервальным (непрерывным), если предполагается, что варианты могут принимать любое значение в рамках указанных интервалов. При построении интервального ряда необходимо выбрать оптимальное число групп. Малое число групп снижает разнообразие значений признака, а большое число групп может исказить форму распределения случайными колебаниями частот. Длина интервала должна быть постоянной для всех групп. Количество интервалов также зависит от объема выборки. В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал. Рекомендуемое число интервалов для выборок разного объема: таблица 3 Объем выборки 10-20 30-50 60-90 100-200 300-400 Число интервалов (k) 5 6-7 8 9 10 3. Графическое представление статистического распределения Статистические таблицы высокоинформативны, но проникновение в их цифровое содержание требует времени. Большей наглядностью обладают графики, составленные на основе табличных данных. Графическое изображение даже самых сложных статистических показателей делает их не только наглядными, но доходчивыми и понятными с первого взгляда. График позволяет быстро уловить важнейшие тенденции и закономерности изучаемого явления. В статистических графиках обычно применяется система прямоугольных координат в двумерном или трехмерном изображении с заданным масштабом. В статистических графиках, как правило, применяются прямолинейные масштабные шкалы. В связи с этим на осях абсцисс и ординат в условных масштабах откладываются соответствующие единицы измерения. График должен иметь заголовки и словесные пояснения. Он обязательно должен содержать наименования масштабных шкал: название отложенных на них единиц измерения и другие необходимые пояснения. В зависимости от целей графика, его количественной базы и применяемых геометрических знаков графики могут быть точечными (совокупность точек), линейными, столбиковыми, полосовыми, квадратными, круговыми и т. д. Линейные графики имеют широкое распространение в уголовно-правовой и криминологической статистике для изображения динамики преступности, осужденных, заключенных и т. д. Секторные диаграммы наглядно раскрывают структуру явления и структурные сдвиги в нем в зависимости от территории, времени и других обстоятельств. Данные диаграммы строятся в виде круга, разделенного на отдельные сектора, каждый из которых характеризует какую-то часть целого явления и занимает площадь круга пропорционально удельному весу этой части, которая принимается за 100%. Пример такой диаграммы (построенной по данным с официального сайта Федеральной службы государственной статистики РФ www.gks.ru3 изображен на рисунке 1. Рис. 1. Структура преступности в РФ Для графического изображения статистического распределения пользуются полигонами, гистограммами, кумулятами и огивами. Для построения полигона частот (относительных частот) на оси ОX откладывают значения вариант хi, на оси ОY- значения частот ni (относительных частот ). Пример 2. Полигон относительных частот статистического распределения по возрасту 100 преступников – рецидивистов (таблица 2). Рис. 2. Полигон относительных частот Полигоном обычно пользуются в случае небольшого количества вариант. В случае большого количества вариант и в случае непрерывного распределения признака чаще строят гистограммы. Для этого интервал разбивают на несколько частичных интервалов и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-ый интервал. Затем вычисляют отностительные частоты на каждом интервале по формулам: , и плотности частот по формулам: , где m – длина интервала. Затем на этих интервалах, как на основаниях, строят прямоугольники с высотами, равными плотностям. Таким образом, площади прямоугольников равны соответствующим относительным частотам. Пример 3. В таблице 4 представлен интервальный вариационный ряд с усредненными показателями для многих стран4, который отражает связь между варьирующим возрастом и изменением частот (процентами лиц, совершивших преступления). Таблица 4 Возраст, лет До 15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-60 Преступления, % 3 11 22 26 19 10 5 3 1 Построим гистограмму данного статистического распределения. Рис. 3. Гистограмма По данным мировой, российской и региональной статистики наблюдается практически одна и та же тенденция распределения правонарушителей по возрасту: с начала возраста уголовной ответственности идет рост преступной активности, в 25—30 лет (с некоторыми колебаниями) ее уровень достигает апогея, а затем наступает постепенное снижение. В этом проявляется определенная закономерность изменения частот в вариационных рядах, называемая закономерностью распределения, которая выявляется в больших совокупностях, где случайные отклонения взаимоуничтожаются. Графические представления статистического распределения широко используются при выдвижении гипотезы о соответствии наблюдаемых характеристик тому или иному закону распределения, в этом и заключается основная суть анализа вариационных рядов 4. Числовые характеристики статистического распределения Средние величины и их применение в юридической статистике. С помощью средних величин можно сравнивать интересующие нас совокупности юридически значимых явлений по тем или иным количественным признакам и делать из этих сравнений необходимые выводы. Например, сопоставить судебную практику назначения уголовных наказаний в двух районах, схожих по уровню и структуре преступности. Средняя величина в статистике представляет собой обобщенную характеристику совокупности однородных явлений по какому-либо одному количественно варьирующему признаку. Средние статистические величины имеют несколько видов, но все они относятся к классу степенных средних, т. е. средних, построенных из различных степеней вариантов: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая. В юридической статистике самое широкое применение находит средняя арифметическая. Она используется при оценке нагрузки оперативных работников, следователей, прокуроров, судей, адвокатов, других сотрудников юридических учреждений; расчете абсолютного прироста (снижения) преступности, уголовных и гражданских дел и других единиц измерения; обосновании выборочного наблюдения и т. д. Средней арифметической вариационного ряда называется сумма произведений всех вариант на соответствующие частоты, деленная на сумму частот: , где хi – варианты дискретного ряда или середины интервалов непрерывного ряда распределения; ni – частоты вариант в вариационном ряду. Средняя величина дает общую характеристику усредняемого признака, но не показывает, насколько она типична для данной совокупности. Показатели вариации признака. Показатели вариации (изменения, колебаний) позволяют измерить изменение величины количественного признака от одного объекта исследуемой совокупности к другому. Размах вариации – это разность между максимальным и минимальным значениями признака где R - размах вариации; хmax – максимальное значение признака; хmin – минимальное значение признака. Следует отметить, что размах вариации весьма неустойчив и поэтому может служить лишь для грубой оценки. Выборочная дисперсия Dв характеризует рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения. Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонений вариант от их среднего арифметического значения : Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии: Коэффициент вариации: Коэффициент вариации является критерием типичности средней. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений. Пример 4. В таблице 5 представлены данные о наказании за умышленное убийство за 1996 г.5 Вычислить числовые характеристики (среднее арифметическое, выборочную дисперсию и выборочное среднее квадратическое отклонение) данного интервального ряда распределения. Таблица 5 Сроки лишения свободы, xi До 1 года 1 - 2 2 - 3 3 - 5 5 - 8 8 - 10 10 - 15 Число осужденных, ni 10 3 16 78 516 1259 2921 Рассчитаем средний срок лишения свободы, то есть среднюю арифметическую. Для этого преобразуем интервальный ряд в дискретный. Найдем середины интервалов: Дальнейшее вычисление проводится по формуле для подсчета средней арифметической. (г.) Вычислим значение выборочной дисперсии и выборочного среднего квадратического отклонения. Найдем коэффициент вариации . Он показывает, что изменчивость вариационного ряда значительна. 5. Ряды динамики 5.1. Понятие о рядах динамики и их виды Ежедневный, ежемесячный и ежегодный сбор огромного статистического материала был бы абсолютно неоправданным, если его всесторонне не анализировать по «вертикали» (структура, состояние, взаимосвязи) и по «горизонтали» (тенденции, динамика, сезонность), «назад» (ретроспектива, интерполяция) и «вперед» (экстраполяция, прогноз). Анализ динамики юридически значимых явлений за длительный период времени дает возможность понять их развитие в прошлом, настоящем и возможном будущем, оценить эффективность деятельности юридических учреждений и спланировать ее на перспективу. Грамотный статистический анализ рядов динамики — залог объективных выводов об изучаемых статистических явлениях. Ряды динамики, или временные ряды, представляют собой ряды числовых значений конкретных статистических величин за какой-то определенный отрезок времени (месяц, квартал, год, пятилетие и т. д.). В ряду динамики имеется два основных показателя: показатель времени (шкала времени) и уровень ряда (шкала уровня ряда). Уровень ряда, обычно обозначаемый символом «y», изначально выражен в абсолютных показателях, на основе которых в процессе аналитической работы рассчитывается множество производных обобщающих величин, относительных и средних. Динамический интервальный ряд содержит значения показателей за определенные периоды времени. В интервальном ряду уровни можно суммировать, получая объем явления за более длительный период, или так называемые накопленные итоги. Приведем пример интервального динамического ряда – числа зарегистрированных преступлений, связанных с незаконным оборотом наркотиков в Российской Федерации (в единицах) за год с 1996г. по 2010 г. (табл. 6). Данные взяты с официального сайта Федеральной службы государственной статистики РФ www.gks.ru. Таблица 6 год 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Число преступлений 96762 184832 190127 216364 243572 241598 189576 181688 150096 175241 212019 231218 232613 238523 222564 Динамический моментный ряд отражает значения показателей на определенный момент времени (дату времени). В моментных рядах исследователя может интересовать только разность явлений, отражающая изменение уровня ряда между определенными датами, поскольку сумма уровней здесь не имеет реального содержания. Накопленные итоги здесь не рассчитываются. Приведем пример моментного ряда (таблица 7), источник данных - официальный сайт Федеральной службы государственной статистики РФ www.gks.ru). Таблица 7 Численность постоянного населения Российской Федеpации (человек) на 1 января год 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Кол-во человек 146890128 146303611 145649334 144963650 144168205 143474219 142753551 142220968 142008838 141903979 141914509 Важнейшим условием правильного построения динамических рядов является сопоставимость уровней рядов, относящихся к различным периодам. Уровни должны быть представлены в однородных величинах, должна иметь место одинаковая полнота охвата различных частей явления. Чтобы избежать искажения реальной динамики, в статистическом исследовании проводятся предварительные расчеты (смыкание рядов динамики), которые предшествуют статистическому анализу динамических рядов. Под смыканием рядов динамики понимается объединение в один ряд двух и более рядов, уровни которых рассчитаны по разной методологии или не соответствуют территориальным границам и т.д. Смыкание рядов динамики может предполагать также приведение абсолютных уровней рядов динамики к общему основанию, что нивелирует несопоставимость уровней рядов динамики. Анализируя таблицу 6 можно заключить, что в целом зарегистрированных преступлений, связанных с незаконным оборотом наркотиков в Российской Федерации растет. Однако это процесс неоднозначный. В некоторые периоды времени исследуемый показатель возрастает незначительно, а в некоторые даже снижается. Таким образом, определить рост числа данных преступлений можно лишь в среднем, как тенденцию. В отдельные же годы уровни отклоняются от основной тенденции, образуя тем самым колебания. Тенденция динамики связана с действием долговременно существующих причин и условий развития, хотя, конечно, после какого-то периода эти причины и условия тоже могут измениться и породить уже другую тенденцию развития изучаемого объекта. Колебания же, напротив, связаны с действием краткосрочных или циклических факторов, влияющих на отдельные уровни динамического ряда, и отклоняющих уровни от тенденции то в одном, то в другом направлении. Например, тенденция роста числа раскрываемых преступлений связана с укреплением кадровой и материально-технической базы органа внутренних дел, совершенствованием методов раскрытия преступлений. Колеблемость исследуемого признака вызвана миграцией населения и преступных групп, естественной сменой кадров и т.п. При статистическом изучении динамики необходимо четко разделить ее два основных элемента - тенденцию и колеблемость, чтобы дать каждому из них количественную характеристику с помощью специальных показателей. Смешение тенденции и колеблемости ведет к неверным выводам о динамике. Если из таблицы 6 произвольно взять данные за отдельные годы и сравнить их друг с другом, можно получить «выводы», прямо противоположные истине. Например, если сравнить число преступлений в 2003 г. со значением показателя в 1996 г., то получим, что за 7 лет он вырос на 181688-96762=84926 преступлений, если этот же год сравнить с 1997 г., то получим, что за 6 лет, из которых этих же лет (мы исключили из рассмотрения только 1996 год), значение исследуемого признака уменьшилось на 184832-181688=3144 единиц. Тенденцию и колебания наглядно показывает график (рис. 4). По оси абсцисс всегда отражается время, по оси ординат - уровни. На рисунке видно, что рост числа преступлений, связанных с незаконным оборотом наркотиков в Российской Федерации характеризуется линейной тенденцией, а колеблемость была хаотической, без явной цикличности. Рис. 4. Динамический ряд 5.2. Показатели, характеризующие тенденцию динамики Система показателей, характеризующих тенденцию динамики, должна определять следующие свойства этой тенденции: величину изменения уровня, как в абсолютном, так и в относительном выражении; равномерность или неравномерность изменения уровня; выражать тенденцию в форме некоторого достаточно простого уравнения, наилучшим образом аппроксимирующего фактическую тенденцию динамики. Абсолютное изменение уровней или абсолютный прирост - это разность между сравниваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. Если эта база непосредственно предыдущий уровень, показатель называют цепным, если за базу взят, например, начальный уровень, показатель называют базисным. Формулы абсолютного изменения уровня: цепной вариант: ; базисной вариант: . Абсолютное изменение уровня, не является постоянной величиной, т.е. изменяется с некоторым ускорением. Ускорение рассчитывается для цепного варианта и представляет собой разность между абсолютным изменением за данный период и абсолютным изменением за предыдущий период одинаковой длительности: Для сравнения развития разных объектов, особенно если их абсолютные характеристики различны, используют относительные показатели динамики. Меньший уровень абсолютного прироста еще не есть меньший темп развития, и это показывает относительная характеристика тенденции динамики - темп роста. Темп роста - это отношение сравниваемого уровня (более позднего) к уровню, принятому за базу сравнения (более раннему). Темп роста исчисляется в цепном варианте - к уровню предыдущего года, а в базисном варианте - к одному и тому же, обычно начальному уровню. Он говорит о том, сколько процентов составляет сравниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу. Формулы темпа роста: цепной вариант: базисный вариант: Относительным приростом называется отношение абсолютного прироста к предыдущему или базисному уровню. Формулы относительного прироста: цепной вариант: базисный вариант: Можно выделить следующие основные соотношения между цепными и базисными показателями: Сумма цепных абсолютных изменений равна базисному абсолютному изменению: Произведение цепных темпов изменения равно базисному темпу изменения Сумма цепных темпов прироста не равна базисному темпу прироста. Значения цепных темпов прироста, рассчитанных каждый к своей базе, различаются не только числом процентов, но и величиной абсолютного изменения, составляющей каждый процент. Поэтому складывать или вычитать цепные темпы прироста нельзя. Для обобщения характеристик тенденции за длительный период и по различным периодам необходимы средние показатели динамики - средний уровень ряда, средние абсолютные изменения и ускорения, средние темпы роста. Средний уровень интервального динамического ряда определяется как простая арифметическая средняя уровней за равные промежутки времени: или как взвешенная арифметическая средняя уровней за неравные промежутки времени, длительность которых и является весами. Средний уровень, рассчитываемый для моментального ряда называют хронологической средней и вычисляют по формуле: Средний абсолютный прирост определяется как частное от деления базисного абсолютного изменения на число осредняемых отрезков времени от базисного до сравниваемого периода: Средний темп изменения определяется как геометрическая средняя из цепных темпов роста за n лет или из базисного темпа роста за указанный период времени: Средний темп роста так же, как и средний прирост, следует сопровождать указанием двух единиц времени: периода, который им характеризуется, и периода, на который рассчитан темп. Например, среднегодовой темп за последнее десятилетие; среднемесячный темп за полугодие и т.п. 5.3. Расчет параметров тренда Понятие «тренд» было введено в статистику английским статистиком Гукером, которым он предложил обозначать уравнение тенденции. Первым шагом в определении тренда необходимо выявить тип тенденции, а эта задача не является чисто математической. Наличие колебаний уровней крайне усложняет выявление типа тенденции и требует всестороннего подхода к этой проблеме, прежде всего качественного изучения характера развития объекта. При этом необходимо учитывать условия развития объекта в изучаемом периоде и характер действия основных факторов развития. В крупных системах, где действует большое количество факторов, резкие, скачкообразные изменения в ряду динамики крайне редки. Большие и сложные системы обладают значительной инерцией, и для скачкообразного, резкого изменения тенденции такой системы требуются большие затраты ресурсов. Напротив, в масштабе несложных систем вполне возможны резкие изменения, переходы от одной тенденции к другой. Одним из основных типов уравнений тренда является линейная форма тренда: где - уровни, освобожденные от колебании, выровненные по прямой; b - начальный уровень тренда в момент или период, принятый за начало отсчета времени t; a - среднегодовой абсолютный прирост (среднее изменение за единицу времени); константа тренда. Линейный тренд хорошо отражает тенденцию изменений при действии множества разнообразных факторов, изменяющихся различным образом по разным закономерностям. Равнодействующая этих факторов при взаимопогашении особенностей отдельных факторов (ускорение, замедление, нелинейность) часто выражается в примерно постоянной абсолютной скорости изменения, т.е. в прямолинейном тренде. Параметры тренда рассчитываются из следующих соотношений: Если поместить начало отсчета в середину динамического ряда, то t будет равняться нулю и формулы существенно упростятся: , . В статистических исследования используются и другие формы трендов – параболические, экспоненциальные, логарифмические, степенные, гиперболические и логистические. Параболическая форма тренда выражает ускоренное или замедленное изменение уровней ряда с постоянным ускорением. Такой характер развития можно ожидать при наличии важных факторов прогрессивного развития, например снятии ограничений. Экспоненциальный тренд выражает тенденцию ускоренного (замедленного) и все более ускоряющегося (замедляющегося) возрастания уровней. Развитие любого объекта по экспоненциальному закону может продолжаться только небольшой исторический период времени, ибо ресурсы для любого процесса развития всегда встретят ограничения. Логарифмический тренд пригоден для отображения тенденции замедляющегося роста уровней при отсутствии предельного возможного значения. Замедление роста становится все меньше и меньше, и при достаточно большом t логарифмическая кривая становится мало отличимой от прямой линии. Логарифмический тренд пригоден для отображения эффективности системы при ее совершенствовании без качественных, коренных преобразований. Степенная форма - гибкая, пригодная для отображения изменений с разной мерой пропорциональности изменений во времени. Гиперболический тренд выражает тенденцию замедляющегося снижения (или роста) уровня, стремящегося к некоторому пределу. Логистическая кривая имеет форму латинской буквы S положенной на бок, отчего еще называется S-образной кривой. Она имеет два перегиба: от ускоряющегося роста к равномерному (вогнутость) и от равномерного роста посреди периода к замедляющемуся (выпуклость). Устойчивость тенденции можно оценить с помощью коэффициента корреляции рангов Ч. Спирмена, который считается по формуле: . При полном совпадении (полной противоположности) рангов уровней и номеров периодов по их хронологическому порядку коэффициент Спирмена равен +1 (-1), что соответствует полной устойчивости возрастания (убывания) уровней. Пример 5. Определим устойчивость тенденции по данным из таблицы 6 - числа зарегистрированных преступлений, связанных с незаконным оборотом наркотиков в Российской Федерации (в единицах) за год с 1996г. по 2010 г. Промежуточные результаты оформим в виде следующей таблицы. Таблица 8 Расчетное значение коэффициента корреляции по рангам составит: , что свидетельствует о слабой устойчивости наблюдаемой тенденции и довольно сильной колеблемости. 5.4. Показатели колеблемости Изучение колебаний уровней динамического ряда имеет важное значение для анализа и регулирования сезонных социальных процессов. Различают три основных типа колебаний. Пилообразная или маятниковая колеблемость состоит в попеременных отклонениях уровней от тренда в одну и в другою сторону (рис. 5). Рис. 5. Пилообразная колеблемость Циклическая долгопериодическая колеблемость состоит в том, что отклонения уровней от тренда сначала постепенно увеличиваются, затем постепенно уменьшаются, и меняя свой знак на противоположный вновь начинают увеличиваться (рис. 6). Такая колеблемость свойственна, например, солнечной активности и связанными с ней процессами на Земле. Рис. 6. Циклическая долгопериодическая колеблемость Случайно распределенная во времени колеблемость возникает при наложении нескольких колебаний с различными циклами, но может проявляться в результате хаотичных колебаний основного действующего фактора (рис. 7). Рис. 7. Случайно распределенная во времени колеблемость Основными показателями силы колебания уровней являются: амплитуда отклонений уровней отдельных периодов или моментов от тренда, среднее абсолютное отклонение уровней от тренда, среднеквадратическое отклонение уровней от тренда. Относительное линейное отклонение от тренда и коэффициент колеблемости вычисляются путем деления соответствующих абсолютных показателей на средний уровень за весь изучаемый период. Среднее линейное отклонение вычисляется из соотношения: , где yi – фактический уровень; - выровненный уровень (тренд); n – число уровней; p – число параметров тренда (для линейной формы тренда p=2). Среднеквадратическое отклонение вычисляется из соотношения: . 5.5. Прогнозирование на основе тренда и колеблемости Прогнозирование возможных в будущем значений признаков изучаемого объекта - одна и основных задач статистических методов исследования. Ведущую роль здесь играет расчет прогнозов на основе тренда и колеблемости динамического ряда. Методика статистического прогноза по тренду и колеблемости основана на их экстраполяции, т.е. на предположении, что параметры тренда и колебаний сохраняются до прогнозируемого периода. Это справедливо, если система развивается эволюционно в достаточно стабильных условиях. Обычно рекомендуют, чтобы срок прогноза не превышал одной трети длительности базы расчета тренда. В качестве первого шага прогнозирования вычисляется точечный прогноз – значение тренда при подстановке в его уравнение номера соответствующего года. На втором шаге рассчитывается средняя ошибка прогноза положения тренда на соответствующий год: , где ti – номер года прогноза. Пример 6. По данным таблицы 6 (числа зарегистрированных преступлений, связанных с незаконным оборотом наркотиков в Российской Федерации (в единицах) за год с 1996г. по 2010 г.) рассчитать параметры уравнения тренда, построить график, спрогнозировать число преступлений, связанных с незаконным оборотом наркотиков в 2011 году. Решение. Промежуточные результаты сведем в таблицу. Таблица 9 По формулам подсчитаем параметры уравнения тренда: ; . Таким образом, уравнение тренда имеет следующий вид: Построим график динамического ряда с линией тренда (для упрощения построений воспользуемся табличным процессором MS Excel). Рис. 8. Графическое изображение динамического ряда и линии тренда Для расчета прогноза на 2011 год необходимо подставить в уравнение тренда номер временного периода для этого года – 16. Окончательно получаем точечный прогноз по числу раскрытых краж: Средняя ошибка прогноза составит: . Для получения прогноза с уровнем надежности 0,9 следует среднюю ошибку умножить на величину t-критерия Стьюдента, равную 1,77 (при числе степеней свободы k=15-2=13). Следовательно, с вероятностью 0,9 можно утверждать, что ожидаемое значение данных преступлений составит 234960  64122,68 или от 170837,41 до 299082,78 случаев. 6. Статистические взаимосвязи 6.1. Функциональная и корреляционная зависимости Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей. Изучение разнообразных явлений сопровождается выяснением закономерностей, которым подчиняются характерные для данных явлений количественные соотношения или связи. Различают два типа связей: функциональную и статистическую. Функциональной зависимостью некоторой величины Y от нескольких переменных х1, х2,…, хn называется связь, в соответствии с которой Y зависит только от перечисленных переменных х1, х2,…, хn и каждому значению переменных х1, х2,…, хn соответствует только одно значение Y. Понятия функции недостаточно, чтобы описать всевозможные причинные связи, с которыми жизнь нас сталкивает повседневно. В реальном мире все явления и процессы связаны между собой, и нет такого конечного числа переменных х1, х2,…, хn, которые абсолютно полно определяли бы собою случайную величину Y, в силу чего функциональная зависимость является абстракцией, упрощающей действительность. Например, совершенно очевидно, что между ростом и весом человека существует зависимость, но мы знаем сколько угодно людей, у которых одинаковый рост, но разный вес. Следовательно, зависимость веса от роста не является функциональной. Статистической зависимостью величины Y от нескольких переменных х1, х2,…, хn называется связь, в соответствии с которой при изменении значения факторных переменных х1, х2,…, хn результативная переменная Y может принимать любые значения с некоторыми вероятностями, но ее среднее значение или иные статистические характеристики изменяются по определенному закону. Статистическая связь между различными показателями предполагает, что каждый из них имеет случайную вариацию индивидуальных значений относительно средней величины. В статистике явления, влияющие на другие, называются факториальными, а те, которые изменяются под воздействием факториальных явлений или зависят от них — результативными. Если бы эти термины были приемлемы в социологии права или криминологии, то показатели преступности следовало бы отнести к результативным явлениям, а ее причины и условия — к факториальным. Примером могут служить многочисленные данные, показывающие зависимость преступности от уровня воспитания, наличия в семье обоих родителей, пьянства, безработицы и т. п. Корреляционной связью двух переменных X и Y называют частный случай статистической связи, состоящий в том, что разным значениям факторной переменной X соответствуют различные средние значения результативной переменной Y. Корреляционная связь между признаками может возникать тремя путями. Во-первых, она может проявиться как причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, признак X - уровень безработицы, признак Y - уровень преступности. Во-вторых, она может проявиться между двумя следствиями общей причины. Известен пример, приведенный А.А.Чупровым6: если в качестве признака X взять число пожарных команд в городе, а за признак Y - сумму убытков за год в городе от пожаров, то между признаками X и Y в совокупности городов России имеется прямая корреляция. В среднем, чем больше пожарников в городе, тем больше и убытков от пожаров! Данную корреляцию нельзя интерпретировать как связь причины и следствия; оба признака - следствия общей причины - размера города. В-третьих, корреляция возникает при взаимосвязи признаков, каждый из которых может выступать и как причина, и как следствие. Такова, например, корреляция между уровнем производительности труда и уровнем оплаты одного часа труда (тарифной ставкой). С одной стороны, чем выше производительность труда, тем выше и оплата. Но с другой стороны, установленные тарифные ставки выступают в качестве стимулирующего фактора по отношению к производительности труда. В такой системе каждый признак может выступать и в роли независимой переменной X, и в качестве зависимой переменной Y. Если рассматривается взаимосвязь двух переменных, в которой случайную вариацию имеет лишь один из признаков, а значения другого являются строго определенными, то говорят о регрессии, а не о статистической связи. Например, при анализе динамических рядов можно измерять регрессию уровня преступности на номера лет, но нельзя говорить о корреляции между ними и применять показатели корреляции с соответствующей им интерпретацией. 6.2. Условия применения корреляционно-регрессионного анализа Первым условием возможности изучения корреляции является общее условие всякого статистического исследования - наличие данных по достаточно большой совокупности явлений. Какое именно число явлений достаточно для анализа корреляционной связи, зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считают, что число наблюдений должно быть не менее, чем в 5-6, а лучше - не менее, чем в 10 раз больше числа факторов7. При большом числе наблюдений вступает в действие закон больших чисел, обеспечивающий взаимное погашение случайных отклонений от закономерного характера исследуемой связи. Вторым условием возможности изучения корреляционной связи служит условие, обеспечивающее достоверное выражение закономерности в средней величине, для чего необходима качественная однородность исследуемой совокупности. Например, не следует объединять в одну совокупность преступления, совершаемые обычными гражданами, с преступлениями, совершаемыми лицами, отбывающими наказание в исправительно-трудовых учреждениях, поскольку указанные преступления имеют существенные отличия. Третьим условием корреляционного анализа является необходимость подчинения распределения совокупности по результативному Y и факторному X признакам нормальному закону распределения. Это условие связано с используемым при корреляционном анализе математическим аппаратом, дающим достоверную оценку параметров корреляции только при нормальном распределении. Однако на практике это условие чаще всего выполняется приближенно, но и в этом случае получаемые результаты обладают достаточной надежностью8. При значительном отклонении распределений признаков от нормальных нельзя оценивать надежность корреляции, используя параметры данного распределения или распределения Стьюдента9. 6.3. Задачи корреляционно-регрессионного анализа Изучение корреляционной связи преследует две цели: 1) Определение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной. 2) Измерение тесноты связи двух признаков между собой. Основным методом достижения первой цели является метод наименьших квадратов, разработанный К.Ф.Гауссом10. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной Y от ее значений, вычисленных по уравнению связи с факторным признаком X. Для измерения тесноты связи могут применяться различные показатели, основным из которых является коэффициент детерминации. Данный коэффициент вычисляется как отношение межгрупповой дисперсии результативного признака (характеризует влияние различий группировочного факторного признака на среднюю величину результативного признака) к общей дисперсии результативного признака (характеризует влияние на него всех причин и условий) и позволяет оценить влияние факторного признака на результативный. , где k - число групп по факторному признаку; N - число единиц совокупности; yi - индивидуальные значения результативного признака; fi - частота в j-ой группе; - средние групповые значения результативного признака; - среднее значение результативного признака; Корреляционный анализ позволяет с одной стороны, используя уравнение корреляционной связи, измерить зависимость между вариацией результативного признака и вариацией факторного признака, а с другой - используя меры тесноты связи, измерить долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака. К задачам, традиционно решаемым с помощью корреляционно-регрессионного метода, относятся: 1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе тех или иных мер тесноты связи факторных признаков с результативным признаком. 2. Задача оценки деятельности по эффективности использования имеющихся ресурсов. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами деятельности. 3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков. Такая задача решается путем подстановки ожидаемых значений факторных признаков в уравнение связи и вычисления ожидаемых значений результативного признака. Приходится решать и обратную задачу - вычисление необходимых значений факторных признаков для обеспечения планового или желаемого значения результативного признака в среднем по совокупности. Эта задача обычно не имеет единственного решения в рамках данного метода и должна дополняться постановкой и решением оптимизационной задачи на нахождение наилучшего по определенному критерию варианта из множества возможных решений. 4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач. Например, при разработке критериев оценки деятельности основных служб органов внутренних дел. При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. К числу таких особенностей относятся проблемы разделения влияния каждого из действующих факторов на результативный признак, необходимость специально обосновывать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата и некоторые другие. Следует так же помнить, что метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. 6.4. Парная линейная корреляция Простейшей системой корреляционной связи является линейная связь между двумя признаками - парная линейная корреляция. Подобные системы встречаются в тех случаях, когда среди всех действующих факторов выделяется один важнейший, который и определяет вариацию результативного признака, а нелинейные формы связей без особого ущерба могут быть преобразованы в линейные. Зависимость , называется уравнением регрессии y по x или линейной корреляционной зависимостью между y и x. где – среднее значение результативного признака Y при определенном значении факторного признака X; b – свободный член уравнения; а – коэффициент регрессии, характеризующий вариацию Y, приходящуюся на единицу вариации X. Коэффициенты уравнения регрессии рассчитываются по методу наименьших квадратов. Параметр a определяется из соотношения , где – среднее значение случайной величины xy; и – средние значения факторного и результативного признаков соответственно; x – среднее квадратичное отклонение признака X; xi и yi - индивидуальные значения соответствующих признаков. Параметр b выражают из уравнения регрессии и вычисляют, подставляя средние значения признаков X и Y и найденное значение параметра а: . При парной связи ее теснота измеряется с помощью коэффициента корреляции: Соотношение между значением модуля коэффициента корреляции и теснотой связи представлено в таблице 10. Таблица 10 Значение модуля коэффициента корреляции Характер связи 0,00 – 0,30 крайне слабая или отсутствует 0,30 – 0,50 слабая 0,50 – 0,70 средняя 0,70 – 0,99 сильная Рассматривая возможные значения коэффициента корреляции, следует учитывать, что нулевая величина этого коэффициента соответствует полному отсутствию какой-либо связи. Это возможно при полном взаимном погашении положительных и отрицательных отклонений признаков от их средних величин. Поскольку вероятность этого крайне мала для любой реальной совокупности, кроме бесконечно большой, то коэффициент корреляции для реальной совокупности отличен от нуля и при отсутствии связи! Значение коэффициента корреляции, равное 1 (или -1) соответствует функциональной связи. Чем ближе связь к функциональной, тем ближе абсолютная величина коэффициента корреляции к единице. Отрицательное значение коэффициента корреляции свидетельствует об обратной зависимости. Значение коэффициента корреляции можно посчитать с помощью функции КОРРЕЛ, встроенной в табличном процессоре MS Excel, это облегчит рутинные математические подсчеты. Так же в MS Excel можно построить на графике и эмпирическую ломаную, и уравнение регрессии. Пример 7. Определение корреляции между числом преступлений, связанных с незаконным оборотом наркотиков, в Новосибирской и Омской областях (данные взяты с официального сайта Федеральной службы государственной статистики РФ www.gks.ru и приведены в таблице 11 (в ед., значение показателя за год)). Таблица 11. Можно изобразить графически динамические ряды данного вида преступлений в Новосибирской и Омской области (см. рис. 9). Рис. 9. Динамика преступлений, связанных с незаконным оборотом наркотиков в Новосибирской и Омской областях Проанализировав график, можно предположить, что эти данные будут коррелировать между собой. Рассчитав коэффициент корреляции, получаем, что , это означает, что корреляционная связь между признаками прямая и сильная. Изобразим графически эмпирические данные и построим прямую регрессии. Табличный процессор MS Excel позволяет нам автоматически строить прямую регрессии и указывать ее уравнение на диаграмме. Рис. 10. Корреляционная зависимость числа преступлений, связанных с незаконным оборотом наркотиков Новосибирской и Омской областях