Общая теория статистики
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Министерство науки и высшего образования РФ
ФГБОУ ВО Сочинский государственный университет
Факультет экономики и процессов управления Кафедра «Экономики и менеджмента»
Е.В.Гордеева
СТАТИСТИКА
КОНСПЕКТ ЛЕКЦИЙ
ПО ДИСЦИПЛИНЕ «СТАТИСТИКА»
(Раздел 1 «Общая теория статистики»)
Сочи, 2019
Оглавление
Раздел 1.Общая теория статистики 3
Лекция 1. Предмет, метод и история возникновения статистики 3
Лекция 2. Статистическое наблюдение 6
Лекция 3. Статистические показатели 7
Лекция 4. Сводка и группировка 9
Лекция 5. Абсолютные и относительные величины 11
Лекция 6. Средние величины 13
Лекция 7. Вариация 19
Лекция 8. Индексы 23
Лекция 9. Ряды динамики 27
Лекция 10. Корреляционно-регрессионный анализ 29
Лекция 11. Выборочное наблюдение 32
Список рекомендуемой литературы 35
Раздел 1.Общая теория статистики
Лекция 1. Предмет, метод и история возникновения статистики
Статистика включает в себя четыре раздела:
1. Общая теория статистики;
2. Социально-экономическая статистика (СЭС);
3. Статистика финансов;
4. Система национальных счетов (СНС).
Термин “статистика” возник во 2-ой половине 18 века в связи с познанием государств, описанием их особенностей, достопримечательностей. К этому же времени относится начало преподавания предмета статистики в университетах Германии.
История развития человечества показала, что без статистических данных невозможно управление государством, развитие отдельных отраслей и секторов экономики.
Необходимость сбора и обобщения множества данных о населении страны, предприятиях, банках и прочих учреждениях приводит к образованию специальных статистических служб – учреждений государственной статистики.
Слово “статистика” используется в нескольких значениях:
1. прежде всего, как синоним слова “данные”. Именно в этом смысле можно сказать статистика смертности, рождаемости;
2. статистикой называется отрасль знаний, объединяющая принципы и методы работы с числовыми данными, характеризующими массовые явления;
3. статистикой называется также отрасль практической деятельности, направленной на сбор, обработку, анализ числовых данных.
Слово “статистика” произошло от латинского слова “status” − состояние, положение вещей.
В научный обиход слово “статистика” вошло в 18 веке и первоначально употреблялось в значении государствоведение.
В настоящее время статистика может быть определена как собирание, представление, анализ и интерпретация числовых данных.
Греческий философ Аристотель (384-322 до н.э.) одним из первых составил описание 157 городов и государств своего времени.
С середины 19 века благодаря усилиям великого бельгийца − математика, астронома, статиста Адольфа Кетле были выработаны правила переписи населения.
В 1885 г. был основан Международный Статистический Институт, действующий сегодня.
Статистика как наука исследует не отдельные факты, а массовые социально-экономические явления и процессы.
Предметом статистического изучения выступают совокупности множества однокачественных варьирующих явлений. В это определение входят три основные черты совокупности любых явлений:
− во-первых, это множество явлений;
− во-вторых, это множество явлений, объединённых общим качеством;
− в-третьих, это множество варьирующих явлений, отличающихся по своим характеристикам.
Можно дать более простое определение предмета статистики – это количественная сторона массовых общественных явлений и процессов.
Объект статистики называют статистической совокупностью.
Статистическая совокупность – множество единиц, обладающих массовостью, однородностью, определённой целостностью, взаимозависимостью состояний отдельных единиц и наличием вариаций. Каждый отдельно взятый элемент этого множества называется единицей статистической совокупности, которая характеризуется свойствами, именуемыми в статистике признаками. Но существует и вариация признаков, т.е. единицы совокупности обладают индивидуальными особенностями и различиями, отличающих их друг от друга. Именно наличие вариации предопределяет необходимость статистики.
Итак, статистика как наука изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени, т.е. предметом статистики выступают размеры и количественные соотношения социально-экономических явлений, закономерности их связи и развития.
Количественную характеристику статистика выражает через числа, которые называются статистическими показателями. Статистический показатель отражает результат измерения у единицы совокупности и совокупности в целом.
Различают следующие показатели как измерители:
− натуральные;
− условно натуральные;
− стоимостные (денежные);
− трудовые.
Важной категорией статистики является статистическая закономерность – форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью вероятности.
Приёмы и способы, с помощью которых статистика изучает свой предмет, образуют статистическую методологию, под которой понимается система приёмов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.
Важно уяснить, что статистическое исследование состоит из следующих стадий:
1. статистическое наблюдение;
2. сводка и группировка результатов наблюдения;
3. анализ полученных обобщённых показателей.
Методы, используемые в статистике
− массовые статистические наблюдения;
− статистические показатели (система статистических показателей);
− сводка и группировка;
− статистические таблицы;
− графики статистики;
− абсолютные и относительные величины;
− средние величины;
− вариация;
− индексы;
− корреляционно-регрессионный анализ;
− ряды динамики;
− выборочное наблюдение.
Таблица №1: “Основная классификация признаков статистики”
по характеру их выражения
по способу измерения
по отношению к характеризуемому объекту
по характеру вариации
по отношению ко времени
1.описательные
2.количественные
1.первичные (учитываемые)
2.вторичные (расчётные)
1.прямые (непосредственные)
2.косвенные
1.альтернативные
2.дискретные
3.непрерывные
1.моментные
2.интервальные
Лекция 2. Статистическое наблюдение
Статистическое наблюдение – научно организованный массовый сбор данных о явлениях и процессах общественной жизни, может проводиться любыми способами.
Схема №1: “Составляющие статистического наблюдения”
СТАТИСТИК
↓
ИНСТРУМЕНТАРИЙ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
↓
ОБЪЕКТ НАБЛЮДЕНИЯ
↓
ДАННЫЕ НАБЛЮДЕНИЯ
Таблица №2:” Классификация статистического наблюдения”
формы
виды
способы
1.периодическая
отчётность
2.специально
Организованное наблюдение
1.по охвату:
1.1.сплошное
1.2.несплошное
1.2.1.выборочное
1.2.2.основного массива
1.2.3.монографическое
2.по времени:
2.1.текущее (непрерывное)
2.2.периодическое
2.3.единовременное
1.непосредственный
2.документальный
3.опрос
3.1.анкеиный
3.2.экспедиционный
3.3.саморегистрации
3.4.корреспондентский
4.эксперимент
1) Периодическая отчётность – специально разработанные и утверждённые Министерством труда… формы, которые подлежат заполнению и представлению в органы государственной статистики всеми без исключения предприятиями, организациями, учреждениями. Сроки представления статистической отчётности не позднее 15-го числа каждого месяца, следующего за отчётным периодом (месяцем).
Исключение составляют малые предприятия, которые сдают отчётность ежеквартально. Количество и содержание статистических форм зависит от вида деятельности предприятия, организации, учреждения.
2) в специально организованном наблюдении различают:
− программно-методологическую часть: цель, объект, программа наблюдения;
Программа – перечень вопросов, на которые необходимо получить ответы.
− организационную часть: выбор формы, вид, способа, времени проведения наблюдения, подбор персонала, его обучение.
Различают:
− объективное время – это период, за который проводится наблюдение;
− субъективное время – это период, в течение которого проводится наблюдение;
− если процесс быстрый, то объективное время конкретизируется в критический момент времени (конкретное время – 0ч.00мин).
Таблица №3: “Ошибки статистического наблюдения”
ошибки регистрации
ошибки репрезентативности
случайные
систематические
средние
предельные
преднамеренные
непреднамеренные
при повторном и бесповторном отборе
1) Ошибки регистрации присущи сплошному наблюдению. Они подразделяются на:
1. Случайные;
2. Систематические.
Случайными могут быть ошибки: описка, арифметическая ошибка.
Систематические ошибки подразделяются на:
- преднамеренные (умышленные);
- непреднамеренные (на основании неточных сведений, приблизительных расчётов, т.е. допущенных несознательно).
2) Ошибки репрезентативности присущи только выборочному наблюдению. Они возникают, когда в выборку не попадают те единицы совокупности, которые могут значительно повлиять на результат наблюдения.
Лекция 3. Статистические показатели
Схема №2: “Атрибуты статистического показателя”
Таблица №4: “Классификация видов статистических показателей”
по качественной стороне показателя
по количественной стороне показателя
по отношению к характеризуемому свойству
1.показатели свойств конкретных объектов
2.показатели статистических свойств любых массовых явлений и процессов
1.абсолютные
2.относительные
1.прямые
2.косвенные
Абсолютные показатели характеризуют те явления, процессы и объекты, за которыми мы наблюдаем, можем их увидеть и подсчитать.
Относительные показатели мы можем получить в виде характеристики наблюдаемого нами объекта расчётным путём из абсолютных показателей.
Схема №3: “Система статистических показателей промышленности”
абсолютные показатели:
В - выпуск продукции
Т - численность рабочих
Ф - основные производственные фонды (ОПФ)
Р - фонд оплаты труда
М - материальные затраты
относительные показатели:
- производительность труда - зарплатаотдача
- фондоотдача - материалоотдача
- трудоёмкость - число рабочих, приходящихся на 1 единицу ОПФ
- фондоёмкость - фондовооружённость
- зарплатаёмкость - средняя зарплата
- материалоёмкость
- материальные затраты, приходящиеся на 1-ого работника
- стоимость материальных затрат, приходящихся на 1 единицу ОПФ
М+Р=С - себестоимость - затраты на 1 руб. выпускаемой продукции
В-С=П – прибыль - прибыль, приходящаяся на 1-ого работника
Лекция 4. Сводка и группировка
Простейшей группировкой являются ряды распределения.
Схема №4: “Ряды распределения”
ряды распределения
↓ ↓
вариационные атрибутные
(количественные) (качественные)
↓ ↓
дискретные интервальные
(прерывные) (непрерывные)
Величина х называется вариантой. Количество раз, которое повторяется каждая варианта, называется её частотой.
Интервалы и интервальные ряды бывают открытыми (до 100, …, свыше 180) и закрытыми (80-100,…, 180-200), возрастающими и убывающими, равными и неравными. Чтобы работать с открытым интервальным рядом, его необходимо условно закрыть, используя интервальный шаг в равных интервальных рядах. В неравных интервальных рядах – последующий шаг для нижней границы и предыдущий шаг для верхней границы.
Величина равного интервала определяется по формуле:
Число групп при группировке можно определить не только по существенным обоснованным признакам, но и математическим путём с использованием формулы Стерджесса: n=1+3,322 lgN, где n-количество групп, N-число единиц совокупности.
По виду группового признака различают следующие группировки:
1. Типологическая: распределение единиц разнородной совокупности на качественно однородные группы, в основе которых лежит атрибут, или качественный признак (распределение общества по классам);
2. Структурная: расчленение однородной совокупности по количественному признаку (распределение рабочих по квалификации, студентов по курсам);
3. Аналитическая: распределение единиц однородной совокупности на группы и подгруппы по двум или нескольким взаимосвязанным признакам. При этом независимый признак называется факторным (х), а зависимый – результативным (y). В статистике она имеют наибольшее значение (зависимость между продажами путёвок работниками и их стажем работы).
Пример:
стаж работы в годах (х)
объём продаж путёвок работниками (y)
до 5
5-10
10-15
свыше 15
380000
410000
450000
430000
Статистические таблицы
Одной из разновидностей сводки и группировки являются статистические таблицы. Каждая таблица должна иметь заголовок, т.е.свое название (если таблица простая, можно над таблицей в правом верхнем углу написать единицы измерения). В каждой таблице различают подлежащее (то, что изучается) и сказуемое (показатели, характеризующие подлежащее). Подлежащее расположено в таблице в виде строк, в ее левой части. Оно является предметом изучения каких-либо показателей, наблюдений (оценочная ведомость). Сказуемое расположено в виде столбцов таблицы, в ее верхней части, которые характеризуют наше наблюдение за показателями, т.е. подлежащим.
Заголовок ед.измерения
сказуемое
итого
подлежащее
итого
Каждая таблица (особенно расчётная) может иметь итоговые строку и столбец, которые могут выполнять функцию контроля.
Тблица № 5: “Классификация таблиц”
(Правило построения таблиц).
Лекция 5. Абсолютные и относительные величины
В результате исследования статистической совокупности получают показатели, которые могут быть абсолютными или относительными.
Абсолютные величины – показатели, которые выражают разряды, уровни, объёмы и т.д. изучаемых явлений и процессов. Они всегда выражаются именованными числами (кг, м, шт, л). В этом их коренное отличие от относительных величин. Их единицы измерения называют натуральными.
Относительные величины – показатели, характеризующие количественные соотношения двух сопоставленных абсолютных и относительных величин. Относительные величины могут выражаться в коэффициентах (если за базу принимается единица), в процентах (если за базу принимается 100%), в промилле (если за базу принимается1000‰), а также через относительные натуральные сложные показатели (км/ч, руб/чел, чел/дней).
Правило действия с относительными величинами
Все действия с относительными числами необходимо проводить, выразив их в виде коэффициентов, а не процентов. В расчётах пользоваться не темпами прироста, а темпами роста.
Виды относительных величин
Относительное изменение во времени называется динамикой.
1. Относительная величина плановой динамики (планового задания) – отношение планового уровня текущего года к фактическому значению в предыдущем периоде.
2. Относительная величина выполнения плана – отношение фактического значения к плановому за один и тот же период.
3. Относительная величина динамики – отношение двух фактических значений текущего года к базисному.
Пример: Найти недостающие абсолютные и относительные величины
№ фирмы
А.фактическое оказание услуг за 2004 г.
2005 г.
относительные величины
плановое значение
фактическое значение
плановой динамики
выполнения плана
Динамики
а
b
c
d/a
c/b
c/a
1
2
3
4
10
20
30
21,05
11
18
31,5
20
12
21
32,4
22
110%
90%
105%
95%
109%
117%
103%
110%
120%
105%
108%
104,5%
Вспомогательные формулы: b=a*b/a; c=a*c/a; c=b*c/b; a=b:b/a; c/a=c/b*b/a; b/a=c/a*c/b
4. Относительная величина структуры – отношение каждого элемента ряда к итогу.
Пример:
№
выпуск продукции
относительная величина структуры
1
2
3
4
итог:
20
30
120
30
200
20:200=10%
30:200=15%
120:200=60%
30:200=15%
100%
5. Относительная величина координации – отношение каждого элемента ряда к элементу, принятому за базу сравнения.
Пример:
№
выпуск продукции
относительная величина координации
1
2
3
4
20
30
120
70
20:120=16,7%
30:120=25%
120:120=100%
70:120=58,3%
6. Относительная величина сравнения – сопоставление двух объектов за один и тот же период.
7. Относительная величина интенсивности – в отличие от всех прочих имеет единицу измерения и представляет собой отношение двух разноимённых показателей.
Лекция 6. Средние величины
Среди показателей, характеризующих статистические совокупности, важное место занимают средние величины.
Средняя величина – показатель, который даёт обобщённую (усреднённую) характеристику единиц изучаемой совокупности. В средней величине отражается то общее, что имеется в каждой единице совокупности.
Сущность статистической обработки методом средней величины заключается в замене индивидуальных значений признака их средним показателем. При этом общий объём совокупности остаётся неизменным.
Пример: есть данные о выработке 5 рабочих: 135, 141, 153, 159, 162. Определить среднюю выработку. .
Средние величины, которые необходимо знать наизусть:
- средняя арифметическая;
- средняя гармоническая;
- средняя хронологическая;
- средняя квадратическая, кубическая;
- средняя геометрическая;
- структурные средние: мода, медиана.
1. Средняя арифметическая: чаще всего в статистике и социально-экономических исследованиях применяется арифметическая величина.
Средняя арифметическая простая рассматривается в случаях, когда значение признака повторяется один или одинаковое число раз в ряде распределения:
, где n-количество единиц совокупности.
Средняя арифметическая взвешенная применяется в случаях, когда каждое значение признака повторяется неодинаковое число раз, или частота ряда распределения превышает единицу хотя бы для одного признака:
, где f-вес.(сколько раз повторяется каждая еденица совокупности)
2. Средняя гармоническая: в ряде случаев бывают известны варианты (x) и произведения варианты на частоту (x∙f), в то время как сами частоты (f) неизвестны, тогда применяется средняя гармоническая, которая бывает простой и взвешенной. .
Произведение x∙f выражается через сложный экономический показатель M (M= x∙f). Для расчёта средней величины, когда x∙f =M=1, применяется средняя гармоническая простая: .
Если x∙f =M≠ 1, то для расчёта применяется средняя гармоническая взвешенная: .
Средняя гармоническая – величина, обратная средней арифметической, из обратных значений признака.
Свойства средних величин
1. Если от каждой варианты отнять или прибавить одно и то же число, то средняя увеличится или уменьшится на то же число.
2. Если каждую варианту увеличить или уменьшить в a раз, то средняя увеличится или уменьшится в столько же раз.
3. Если все частоты увеличить или уменьшить в a раз, то средняя не изменится.
4. Если все частоты увеличить или уменьшить на a, то средняя изменится непредсказуемо.
5. Средняя арифметическая суммы нескольких величин равна суме средних арифметических этих величин.
6. Алгебраическая сумма отклонений значений признака от средней арифметической всегда равна нулю.
Пример: Найти среднюю урожайность в 2003 и 2004 гг.
№ колхоза
2003 г.
2004 г.
урожайность (ц/га)
площадь (га)
урожайность (ц/га)
Валовой сбор(ц)
1
2
3
40
50
60
1000
2000
3000
38
49
65
40000
100000
150000
Решение:
, где f-вес
(ц/га)
.
(ц/га)
3. Средняя хронологическая: применяется для расчёта средней величины, если исходные данные представлены на определённые даты, моменты времени:
Пример: Найти среднюю стоимость ОПФ
дата
1.01
1.02
1.03
1.04
1.05
1.06
стоимость ОПФ
100
120
110
120
140
140
Решение:
, , ,
, .
Приведем все расчеты к одному знаменателю: Х=
4. Средняя квадратическая: применяется для измерения вариации признака в совокупности:
,
5. Средняя кубическая: .
6. Средняя геометрическая: применяется чаще всего для определения средних темпов роста в единицу времени: , ,
Пример: Рассчитайте среднегодовые темпы роста
показатели
год
1995
1996
1997
1998
1999
выпуск продукции
20
22
26
50,1
100,2
х1
х2
х3
х4
х5
коэффициент роста выпуска продукции
−
1,1
1,2
1,9
2
k1
k2
k3
k4
Решение:
, где m=n-1.
.
Средняя геометрическая, чаще всего, применяется в экономических расчетах, но учитывает только начало и конец ряда и недостаточно точно отражает динамику изменения, т.е. она не учитывает сумму ряда.
7. Средняя кумулятивная: .
Формула кумулятивной средней более чётко отражает динамику изменений и помогает увидеть сумму ранжированного ряда.
Все рассмотренные средние величины (кроме средней хронологической) являются степенными средними и выводятся из следующей формулы: , где получается при
k=-1 − средняя гармоническая;
k=0 − средняя геометрическая;
k=1 − средняя арифметическая;
k=2 − средняя квадратическая;
k=3 − средняя кубическая.
Все эти показатели рассчитываются для варьирующего признака для простых средних. Если все значения признака в ряде распределения одинаковы, то все значения средних равны. Между указанными средними величинами имеет место зависимость (для одного ряда распределения):
− это неравенство называется правилом мажорантности средних величин.
8. Структурные средние:
1) Структурное среднее мода (Mо) – наиболее часто встречающееся значение ряда, другими словами, мода – это варианта, имеющая наибольшую частоту. В дискретных рядах мода определяется визуально, в интервальных рядах визуально определяется модальный интервал, а мода (точечная) определяется по формуле: , где
x0 − нижняя граница модального интервала;
i − шаг интервального ряда;
fMо − частота модального интервала;
fMо-1 − частота интервала, предшествующего модальному;
fMо+1 − частота интервала, следующего за модальным.
Пример: Найти Мо в дискретном и интервальном рядах.
интервальный ряд:
% выполнения плана
До 100
100-140
140-180
свыше 180
кол-во рабочих
20
80
150
50
.
2) Структурное среднее медиана (Mе) – значение, которое делит ранжированный ряд пополам.
В нечётных, чётных и дискретных рядах медиана определяется визуально, но в дискретных рядах она определяется с помощью накопленных частот. В интервальном ряду медианный интервал находится визуально, с помощью накопленных частот, а сама медиана (точечно) по формуле: , где
x0 − нижняя граница медианного интервала;
i −шаг интервального ряда;
∑f − сумма накопленных частот;
SMe-1 − сумма частот, накопленных до медианного интервала;
fMe − частота медианного интервала.
Пример: Найти Ме в нечетных, четных, дискретных, интервальных рядах.
нечётный ряд: чётный ряд:
число детей в семье
1
2
3
4 и более
число детей в семье
1
2
3
4
5 и более
дискретный ряд:
разряд
1
2
3
4
5
6
∑
кол-во рабочих
10
20
60
70
30
10
200
интервальный ряд:
% выполнения плана
до 100
100-120
120-140
140-160
160-180
св.180
∑
кол-во рабочих
20
50
70
120
140
100
500
.
Если х сред. равно Мо = Ме – это симметричное распределение, если х сред не равно Мо, не равно Ме – распределение ассиметричное.
Лекция 7. Вариация
Для каждой единицы изучаемой совокупности интересующий нас признак принимает различные значения, т.е. варьирует.
Вариация – это колебания признака в ряде распределения.
Показатели вариации
1. Размах вариации (R) – разность между максимальным и минимальным значениями совокупности: .
2. Среднее линейное отклонение (d) – средняя арифметическая абсолютная величина отклонений значений признака от его средней величины: ; .
3. Дисперсия () – среднее арифметическое квадратов отклонений значений признака от его средней величины..
Дисперсия − единственный из показателей вариации, не имеющий единицы измерения:
; ;
; ; , где
; − начальный момент первого порядка,
; − начальный момент второго порядка.
i – величина интервала;
A – варианта с наибольшей частотой.
4. Среднее квадратическое отклонение () – арифметическое значение корня квадратного из дисперсии: ; .
Отметим, что отношение (для прогноза).
5. Коэффициент вариации (V) – отношение среднего квадратического отклонения к средней арифметической, выраженное в процентах: .
Этот коэффициент показывает долю колебания признака от средней арифметической. Применяется для сравнения вариаций признака в различных совокупностях и для характеристики колебаний различных признаков в одной совокупности. Также он характеризует степень однородности совокупности и качества средних величин.
Если V от 0% до 20%, то совокупность однородная, и среднюю можно использовать смело.
Если V от 20% до 50%, то совокупность средней однородности, и среднюю необходимо использовать осторожно.
Если V более 50%, то совокупность неоднородная, и средней пользоваться нельзя для прогнозирования перспективных показателей признака.
Целесообразно расчёт каждой средней величины дополнять расчётом коэффициента вариации для характеристики степени однородности совокупности и оценки качества средней величины.
Свойства дисперсии
1. Если каждую варианту увеличить или уменьшить в k раз, то дисперсия увеличится или уменьшится в k2 раз.
2. Если каждую варианту увеличить или уменьшить на одну и ту же величину, то дисперсия не изменится.
3. Если все частоты увеличить или уменьшить в несколько раз, то дисперсия не изменится.
4. Дисперсия равна средней арифметической квадратов вариант без квадрата средней арифметической.
Дисперсия альтернативного признака
Если в совокупности исследуется доля единиц, обладающих тем или иным альтернативным признаком, то дисперсия этой доли определяется по формуле: , где .
p – доля единиц совокупности, обладающих данным признаком, ;
m – число единиц совокупности, обладающих данным признаком;
n – число наблюдений.
Пример: выпущена продукция, в объёме которой доля пригодных изделий составляет 0,8, оставшиеся – бракованные изделия. Определить дисперсию альтернативного признака.
= 0,8 ∙ 0,2 = 0,16.
Межгрупповая и внутригрупповая дисперсии
На вариацию признака влияют различные факторы: систематические и случайные. В статистике определяется количественное воздействие случайных факторов при помощи различных видов дисперсий.
Предположим, совокупность S разбита на непересекающиеся группы по возрастанию признака (S1 ,S2 ,…,Sn).
S1()
S() S2()
…………
Sn()
Дисперсия всей совокупности называется общей дисперсией. Она характеризует влияние колебания признака от воздействия всех факторов: случайных и систематических.
Дисперсия каждой группы, на которые разбита совокупность, называется внутригрупповой и рассчитывается по формуле дисперсии: , где
− дисперсия i-ой группы;
− значение ряда.
Среднее арифметическое из внутригрупповых дисперсий рассчитывается по формуле: и называется средней внутригрупповой дисперсией. Она характеризует влияние случайных факторов на величину общей вариации, т.е. всех факторов, за исключением того, который положен в основу группировки.
Межгрупповой дисперсией называется среднее арифметическое квадратов отклонений внутригрупповых средних от общей средней., рассчитывается по формуле. . Она характеризует влияние систематических факторов, положенных в основу группировки, на величину общей вариации.
Правило сложения дисперсий
Если совокупность разбита на непересекающиеся группы S1 ,S2 ,…,Sn, то общая дисперсия равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии: (четвёртый способ нахождения дисперсии)
Отношение межгрупповой дисперсии к общей, выраженное в процентах, называется коэффициентом детерминации: .
Корень квадратный из него характеризует долю общей вариации, обусловленную влиянием признака, положенного в основу группировки, в общей совокупности всех факторов и называется эмпирическим корреляционным отношением: . (этта)
Пример: имеются данные о производительности труда 10 работников в зависимости от стажа работы. Определить зависимость выработки работника от стажа работы:
этапы работы
количество деталей в смену
количество работников
менее 5 лет
11, 8, 9, 12, 11, 9
6
5 лет и выше
9, 12, 10, 13
4
(ед.), (ед.),
(деталей);
;
,
,
, ;
, .
Таким образом, производительность труда рабочих зависит от стажа работы на 31%, а от всех остальных, случайных, факторов – на 69%.
Лекция 8. Индексы
Индексом называется относительная величина, которая характеризует изменение явления во времени или пространстве, а также степень выполнения плана.
Индексы получают в результате сравнения двух величин. При этом если сравнивается какая-то часть явления, то получаем индивидуальный индекс (i), если явление в целом, и при этом сопоставляются сложные показатели, то получаем общий (агрегатный) индекс (I):
; .
Агрегатные и средневзвешенные индексы
Для построения общих индексов несопоставимые показатели необходимо сделать сопоставимыми. Это достигается путём приведения к стоимости, затратам и некоторым другим сопоставимым показателям.
Между индексами всегда имеет место та же зависимость, что и между показателями, которые они выражают: pq = p ∙ q, следовательно, Ipq = Ip ∙ Iq.
Разница между числителем и знаменателем индекса – есть абсолютное изменение явления в целом или его части, которую этот индекс выражает:
Взаимосвязь : pq = p +q =pqp + pqq.
Правило построения индекса
По методике, принятой в отечественной статистике, при индексировании качественных показателей (цены, себестоимости, производительности труда) количественные берутся в отчётном периоде в числителе и знаменателе индекса, а при индексировании количественных показателей (объёма, трудозатрат) качественные берутся в базисном периоде: ; , .
Такие общие индексы, как правило, называются индексами Пааше. В зарубежной статистике используются индексы Ласпейреса, где показатели фиксируются наоборот.
Если нам известны некоторые данные о стоимости товара отчётного и базисного периодов, об изменении цен этих товаров в отчётном году по сравнению с базисным, изменение объёма в отчётном периоде по сравнению с базисным:
Пример. Даны следующие данные ; ; . Найти: ,
Решение:
, ; , ;
; .
Агрегатный индекс переходит в форму средневзвешенного, если в нем используется индивидуальный индекс.
Средневзвешенный индекс, в котором индивидуальный индекс используется как делитель, носит название средневзвешенного гармонического.
Средневзвешенный индекс, в котором индивидуальный индекс используется в качестве сомножителя, называется средневзвешенным арифметическим.
Цепные и базисные индексы
Цепные индексы – отношение любого явления текущего периода к предыдущему: .(; ; )
Базисные индексы – отношение любого явления текущего периода к базисному:
. (; ; )
Индексы постоянного, переменного состава и структурных сдвигов
Индексом постоянного состава называется индекс, рассчитанный с весами, зафиксированными на уровне одного какого-либо периода, и показывающий изменение только индексируемой величины, причём среднее изменение (изменение всреднем) индексируемой величины (т.е. рассматриваемой части явления):
− общий индекс (цены), индекс постоянного состава или агрегатный индекс (цены), индекс (общий) цены.
Индексом переменного состава называется индекс, характеризующий соотношение средних уровней изучаемого явления в разные периоды времени и показывающий изменение среднего уровня явления (изменений средней цены):
− средней цены; − среднего объёма.
Индекс структурных сдвигов – индекс, характеризующий влияние изменения структуры изучаемого явления на динамику среднего уровня этого явления: .
Между данными индексами существует взаимосвязь: ;
Замечание.
Эти индексы рассчитываются только для одноимённых показателей, если они даны для двух и более объектов за два периода времени, или они могут рассчитываться для нескольких видов товаров на одном предприятии.
Индексы динамики и выполнения плана
− индекс динамики; − индекс выполнения плана.
Классификация индексов по названию
; − индексы товарооборота;
; − индексы затрат на производство;
; − индексы себестоимости;
; − индексы трудоёмкости;
; − индексы физического объёма;
; − индексы цены;
; − индексы производительности труда в трудовой форме;
; − в стоимостной форме, где
i – индивидуальный индекс;
I – общий индекс;
p – цена;
q – физический объём;
t – трудоёмкость;
T – суммарные затраты времени;
w – производительность труда;
z – себестоимость единицы продукции;
zq – затраты на производство;
pq – объём произведённой продукции, товарооборот;
q0 – физический объём в базисном периоде;
q1 – физический объём в отчётном периоде.
Индексы сложных экономических явлений
Система взаимосвязанных индексов даёт возможность провести факторный анализ, т.е. определить влияние ряда факторов на изменение результативного показателя (в абсолютном или относительном выражении).
Обозначим через Y объём продукции, произведённой предприятием за год;
через a – среднесписочную численность работников;
через b – среднее число дней, отработанных одним работником за год;
через c – среднюю продолжительность рабочего дня в часах;
через d – среднечасовую выработку одного работника в рублях.
По имеющимся данным составим модель сложного экономического явления, результат которого зависит от нескольких факторов: Y = a ∙ b ∙ c ∙ d.
– этот индекс показывает изменение результативного показателя за счет всех факторов в относительном выражении.
– разница между числителем и знаменателем данного индекса показывает изменение результативного показателя в абсолютном выражении (за счет всех факторов).
Метод цепных подстановок показывает как происходит изменение за счет всех факторов и за счет каждого отдельного фактора.
Относительные изменения:
Абсолютные изменения:
Этот метод применяется в экономическом анализе.
Лекция 9. Ряды динамики
Динамика – изменение явления во времени.
Для выражения абсолютной скорости роста (снижения) уровня ряда динамики рассчитывают статистический показатель – абсолютный прирост (). Его величина определяется как разность двух сравниваемых уровней. Она вычисляется по формулам:
1. ; 2. , где
yi – уровень i-ого года, y0 – уровень базисного года.
Интенсивность изменения уровней ряда динамики оценивается отношением текущего уровня к предыдущему или базисному, которое всегда представляет собой положительное число. Этот показатель принято называть темпом роста (Тр). Он выражается в процентах и рассчитывается по формулам:
3. ; 4. .
Для выражения изменения величины абсолютного прироста уровня ряда динамики в относительных величинах определяется темп прироста (Тпр), который рассчитывается как отношение абсолютного прироста к предыдущему или базисному и определяется по формулам:
5. ; 6. .
Темп прироста может быть вычислен также путём вычитания из темпов роста 100%:
Тпр = Тр -100%.
Показатель абсолютного значения одного процента прироста (I%I) определяется как результат деления абсолютного прироста на соответствующий темп прироста, выраженный в процентах:
7. или .
Расчёт этого показателя имеет экономический смысл только на цепной основе.
Расчёт среднего уровня динамики (с равноотстоящими уровнями во времени) производится по формуле средней арифметической простой:
8. .
Средний абсолютный прирост определяется по цепным абсолютным приростам по формуле:
9. или .
Среднегодовой темп роста вычисляется по формуле средней геометрической:
10. или , где m=n-1 – число коэффициентов роста.
Среднегодовой темп прироста получаем при вычитании из среднего темпа роста 100%:
11. .
Пример:
показатели
1992
1993
1994
1995
1996
производство станков, тыс. шт.
200
205
208
215
220
1. абсолютный прирост, цепной, тыс. шт.
-
5
3
7
5
2. абсолютный прирост, базисный, тыс. шт.
-
5
8
15
20
3. темпы роста, цепные, %
-
102,5%
101,4%
103,3%
102,3%
4. темпы роста, базисные, %
-
102,5%
104%
107,5%
110%
5. темпы прироста, цепные, %
-
2,5%
1,4%
3,3%
2,3%
6. темпы прироста, базисные, %
-
2,5%
4%
7,5%
10%
7. абсолют. содержание 1% прироста, шт.
-
2000
2140
2120
2170
8. средний уровень ряда, тыс. шт.
(200+205+208+215+220) = 209,6
9. средний абсолютный прирост, тыс. шт.
(220-200):4 = 5; (5+3+7+5):4 = 5
10. среднегодовой темп роста, %
11. среднегодовой темп прироста, %
102,4%-100% = 2,4%
Приёмы обработки и анализа рядов динамики
Схема №5: “Разновидности рядов динамики”
ряды динамики
↓
↓
↓
периодические:
моментные:
средних величин:
1. с равными интервалами
(с помощью среднеарифметичес- кой простой);
2. с неравными интервалами (с помощью среднеарифметичес-кой взвешенной).
1. с равными интервалами (с помощью среднехронологичес- кой простой);
2. с неравными интервалами (с помощью среднехронологичес-кой взвешенной).
1. с равными интервалами (с помощью средней геометричес- кой простой);
2. с неравными интервалами (с помощью средней геометричес-кой взвешенной).
Схема №6: “Выявление основной тенденции ряда динамики”
приёмы и методы выявления основной тенденции развития ряда динамики
метод укрупнения интервалов
метод скользящей средней
аналитическое выравнивание
основан на укрупнении периодов времени, к которым относятся уровни ряда
основан на замене абсолютных данных средним арифметическим за определённые периоды
уровни ряда выражаются в виде функции времени:
= f(t)
Лекция 10. Корреляционно-регрессионный анализ
Зависимости бывают функциональными или корреляционными.
Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменение средних величин.
Пример: Аналитическая группировка.
группы заводов по стоимости ОПФ
количество заводов
фонды (млн. руб.)
Товарная продукция (млн. шт.)
всего (∑)
всего (∑)
0,8-3,8
4
8,7
2,2
12,9
3,2
3,8-6,8
13
62,4
4,8
94
7,2
6,8-9,8
9
70,5
7,8
101,7
11,3
9,8-12,8
4
48,1
12
76,4
19,1
итого:
30
189,7
-
285
-
Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).
Задачи корреляционного анализа
1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);
2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).
3. Оценка тесноты связи между факторными и результативными признаками;
4. Оценка качества полученного уравнения (модели).
Способы выбора формы связи между факторными и результативными признаками
1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.
2. При помощи аналитической группировки.
3. Графическое изображение показателей (графический анализ).
4. Графическое изображение корреляционной таблицы.
Схема №7: “Классификация корреляционной зависимости”
↓
↓
парная - корреляционная зависимость между двумя признаками:
1. прямолинейная (линейная) отображается уравнением: y = a+bx
2. криволинейная:
2.1. параболическая: y = a+bx+cx2
2.2. гиперболическая: y = a+b ∙ 1/x
2.3. степенная: y = axb
многофакторная – корреляционная зависимость между несколькими признаками, отображается следующими уравнениями:
y = a+bx1+cx2+dx3
y = ax1b ∙ x2c ∙ x3d…
Для составления парной корреляционно-регрессионной модели (= a+bx) нам необходимо определить коэффициенты регрессии (a, b, c,…). Для этого составим систему уравнений, выразив один коэффициент через другой, и решим её.
Правило составления алгоритма системы уравнений
1. Составим квадратичную матрицу из коэффициентов регрессии.
2. Слева, отступив на столбец и строку, сверху – на строку и столбец, запишем наши неизвестные.
3. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n – количество наблюдений.
a = …
b = …
Показатели корреляции
Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.
1. При прямолинейной парной зависимости теснота связи оценивается по парному коэффициенту корреляции: или .
Коэффициент корреляции имеет пределы: .
Если , то существует Если r=0, то связь отсутствует.
функциональная зависимость.
r=1 r=-1 r=0
Если r > 0, то связь прямая; если r < 0, то связь обратная.
Коэффициент корреляции характеризует корреляционную зависимость.
Оценка тесноты связи
Если: r < 0,1 – связь отсутствует;
0,1 ≤ r ≤ 0,3 – связь слабая;
0,3 ≤ r ≤ 0,5 – связь заметная;
0,5 ≤ r ≤ 0,7 – связь умеренная;
0,7 ≤ r ≤ 0,9 – связь высокая;
0,9 ≤ r ≤ 0,99 – связь весьма высокая.
2. При криволинейной зависимости теснота связи оценивается индексом корреляции:
.
3. Чтобы учесть колеблемость отдельных факторов и привести их в единую систему измерения (освободиться от различной размерности), рассчитываются β коэффициенты: .
Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).
4. Коэффициент эластичности показывает, на сколько процентов изменится результатирующий показатель, при изменении x на 1%: .
5. Коэффициент детерминации: ,
6. - эмпирическое корреляционное отношение.
Лекция 11. Выборочное наблюдение
Выборочное наблюдение – способ несплошного наблюдения, при котором обсуждается не вся совокупность, а лишь часть её, отобранная по определённым правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность.
Таблица №6: “Выборочное наблюдение”
Ошибки выборочного наблюдения называются ошибками репрезентативности. Размер ошибки выборки т методы её определения зависят от вида и схемы отбора.
Таблица №7: “Ошибки выборочного наблюдения”
способы отбора
ошибки
для многозначного признака
для альтернативного признака
повторный отбор
средняя
предельная
бесповторный отбор
средняя
предельная
Различают четыре вида отбора совокупности единиц наблюдения:
1. Случайный – жеребьёвки (тиражи выигрышей).
2. Механический – вся совокупность разбивается на равные по объёму группы по случайному признаку, затем из каждой группы берётся одна единица.
3. Типический – совокупность разбивается по существенному типическому признаку на качественно однородные группы, затем из каждой группы выделяется количество единиц пропорционально удельному весу группы. Типический отбор даёт более точные результаты, чем случайный и механический.
4. Серийный (гнездовой) – отбору подлежат не отдельные единицы совокупности, а целые группы (серии, гнёзда), отобранные случайным и механическим способами. В каждой группе проводится сплошное наблюдение, а результаты переносятся на всю совокупность.
Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.
Повторный отбор – каждая отобранная единица и серия возвращается во всю совокупность и может вновь попасть в выборку, что представляет собой схему “возвращённого шара”.
Бесповторный отбор – каждая обследованная единица изымается и не возвращается в совокупность, что даёт более точные результаты по сравнению с повторным отбором, т.к. при одном и том же объёме выборки охватывается большее количество единиц обследуемой совокупности.
Количество отобранных единиц обычно определяется, исходя из принятой доли выборки.
Доля выборки - отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности.
Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей:
1. Среднюю величину количественного признака;
2. Относительную величину альтернативного признака (долю или удельный вес единиц, которые отличаются от всех других единиц данной совокупности только наличием изучаемого признака).
Выборочная доля (ω''омега’’ − частость) определяется отношением числа единиц, обладающих изучаемым признаком (m) к общему числу единиц выборочной совокупности (n): .
Ошибка выборки (E) представляет собой разность соответствующих выборочных и генеральных характеристик.
Для средних количественного признака: .
Для доли альтернативного признака: .
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе полученных результатов.
Выборочные средние и относительные величины распространяются на генеральные совокупности с учётом предела их возможной ошибки.
Фактические расхождения, т.е. разница между выборочной средней и генеральной средней, могут рассматриваться как некая предельная ошибка, связанная со средней ошибкой и гарантированная с определённой вероятностью P.
P = Ф(t), где t – коэффициент доверия.
t
1,0
1,96
2,0
2,58
3
P = Ф(t)
0,683
…
0,954
…
0,997
Для стабильного процесса t=2, для нестабильного процесса t=3.
Предельная ошибка выборки позволяет определить предельные значения характеристик выборки и их доверительные интервалы:
;
, .
Список рекомендуемой литературы
1. Бендина Н.В. Общая теория статистики. /Конспект лекций/. М., ПРИОР, 2001.
2. Гинзбург А.И. Статистика /Учебное пособие/. М., СПб, ПИТЕР, 2003.
3. Голуб Л.А. Социально-экономическая статистика. /Учебное пособие/. М., ВЛАДОС, 2001.
4. Елисеева И.И., Юзбашев М.М. Общая теория статистики. М., Финансы и статистика, 2002.
5. Ефимов М.Е., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики. М., Финансы и статистика, 2003.
6. Ефимова М.Р., Бычкова С.Г. Социальная статистика. М., Финансы и статистика, 2003.
7. Общая теория статистики. /Под ред. О.Э. Башиной, А.А. Спирина. М., Финансы и статистика, 2002.
8. Плошко Б.Г. Группировка и система статистических показателей. М., 1978.
9. Практикум по теории статистики. Учебное пособие. /Под ред. Р.А. Шмойловой. М., Финансы и статистика, 2003.
10. Салин В.Н., Шпаковская Е.П. Социально-экономическая статистика. Учебник. М., Юристъ,2004 .
11. Статистика. Учебник. /Под ред. И.И.Елисеевой. (Рек. УМО). Проспект, М., 2004.
12. Теория статистики. /Под ред. Р.А. Шмойловой. М., Финансы и статистика, 2003.