Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
(слайд) Тема 3. Средние величины.
1. Статистические ряды распределения, элементы. Виды статистических рядов
распределения.
2. Сущность и значение средней величины. Виды средних величин.
(слайд) 1. Статистические ряды распределения, элементы. Виды статистических
рядов распределения.
(слайд) Результатом группировки и сводки статистических материалов выступают
ряды цифр или статистические ряды данных. Они могут характеризовать изменение
размеров массового общественного явления во времени – статистические ряды
динамики, либо распределение единиц совокупности по значениям признака в
статике – статистические ряды распределения.
(слайд) Таким образом, статистический ряд распределения – это упорядоченное
распределение единиц изучаемой совокупности по группам по значениям
варьирующего группировочного признака.
(слайд) Элементами статистического ряда распределения выступают:
признак (xi) – качественная особенность единицы совокупности,
частота или вес (fi) – характеризует, сколько раз или как часто встречается
данное значение признака (xi) в совокупности.
(слайд) Классификация статистических рядов распределения осуществляется по
значениям признака:
атрибутивные статистические ряды распределения - если значения признака
выражаются словом (атрибутивный признак) (профессия, образование),
вариационные статистические ряды распределения – если значения признака
выражаются числом (количественный признак - варианта) (возраст, заработная
плата).
(слайд) В свою очередь вариационные статистические ряды распределения
делятся на:
- дискретные (прерывные) вариационные статистические ряды распределения –
если значения признака представлены отдельными (дискретными) числами,
- интервальные (непрерывные) вариационные статистические ряды распределения
– если значения признака представлены диапазонами (интервалами).
(слайд) Интервал описывается границами (нижней и верхней) и имеет длину.
Нижней границей называется наименьшее значение признака в интервале, а
верхней – наибольшее. Длина i–того интервала (hi) – это разница между верхней (xi
max) и нижней (xi min) границами интервала.
hi = xi max - xi min
[1]
(слайд) Таким образом, интервальные вариационные статистические ряды
распределения далее можно классифицировать:
а) по записи границ интервала,
б) по длине интервала:
(слайд) а) по записи границ интервала:
- с закрытыми границами – когда интервал описывается двумя границами: и нижней
и верхней (например, 200 - 500, 500 - 800),
- с открытыми границами – когда интервал описывается только одной границей:
либо нижней, либо верхней (например, менее 200, 500 и более),
(слайд) б) по длине интервала:
- равные – длины всех интервалов равны между собой,
- неравные – длины интервалов не равны между собой.
(слайд) Пример 1. Имеется следующий список студентов группы (таблица 1)
Таблица 1
2
Список студентов группы
Номер
Фамилия, Имя
1.
Акимов Иван
2.
Алексеев Павел
3.
Баландина Ирина
4.
Васильев Владислав
5.
Волченко Юлия
6.
Евтушенко Наталья
7.
Лавникова Олеся
8.
Лебедева Мария
9.
Рожков Александр
10.
Смирнова Анна
11.
Соловьева Виктория
12.
Юников Артем
Сгруппируйте студентов группы по полу. Определите вид статистического ряда
распределения. Сделайте вывод.
(слайд) Решение.
1. Определим группировочный признак.
Признак – это качественная особенность единицы совокупности.
Так как наблюдали студенческую группу (статистическая совокупность),
то единицей совокупности выступает студент,
каждый студент характеризуется полом,
таким образом, признак – пол.
2. Определим число групп.
Группировочным признаком выступает пол,
значения признака описываются словами (мужской, женский),
следовательно, пол - это атрибутивный признак.
При группировке по атрибутивному признаку число групп соответствует числу
значений признака.
В нашем примере их будет две.
(слайд) 3. Распределим единицы совокупности по группам согласно значениям
признака (таблица 2)
Таблица 2
Распределение студентов группы по полу
Пол
Номер студента
мужской
1, 2, 4, 9, 12
женский
3, 5, 6, 7, 8, 10, 11
(слайд) 4. Подведем итоги по группам и по совокупности в целом. Результат
группировки оформим в таблицу (таблица 3)
Таблица 3
Распределение студентов группы по полу
Численность студентов, человек
Всего
12
в том числе:
юноши
5
девушки
7
Таким
образом,
нами
построен
атрибутивный
статистический
ряд
распределения, который состоит из:
признака (x) – пол
частоты (или веса) (f) – численность студентов.
3
На основании группировки можно сделать следующий вывод: в данной
студенческой группе преобладает численность девушек.
(слайд) Пример 2. Имеются следующие данные об успеваемости 14 студентов
группы по статистике (таблица 4):
Таблица 4
Экзаменационные оценки студентов группы
Номер
Экзаменационная
Номер
Экзаменационная
студента
оценка
студента
оценка
1.
5
8.
3
2.
4
9.
2
3.
3
10.
4
4.
3
11.
4
5.
4
12.
4
6.
5
13.
5
7.
2
14.
3
Сгруппируйте
студентов
группы
по успеваемости.
Определите
вид
статистического ряда распределения. Сделайте вывод.
Решение.
(слайд) 1. Определим группировочный признак.
Признак – это качественная особенность единицы совокупности.
Так как наблюдали студенческую группу (статистическая совокупность),
то единицей совокупности выступает студент,
каждый студент характеризуется экзаменационной оценкой,
таким образом, признак – экзаменационная оценка.
2. Определим число групп.
Группировочным признаком выступает экзаменационная оценка,
значения признака описываются числами (2, 3, 4, 5),
следовательно, экзаменационная оценка - это количественный признак или
варианта.
По количественному признаку можно осуществить 2 вида группировок:
- дискретную (прерывную)– если значения признака представлены отдельными
(дискретными) числами,
- интервальную (непрерывную)– если значения признака представлены диапазонами
(интервалами).
Так как, в нашем примере вариация (изменчивость) признака невелика и
прерывна, то осуществим дискретную группировку.
Тогда получим четыре группы.
(слайд) 3. Распределим единицы совокупности по группам согласно значениям
признака (таблица 5)
Таблица 5
Распределение студентов группы по экзаменационным оценкам
Экзаменационная оценка
Номер студента
2
7, 9
3
3, 4, 8, 14
4
2, 5, 10, 11, 12
5
1, 6, 13
(слайд) 4. Подведем итоги по группам и по совокупности в целом. Результат
группировки оформим в таблицу (таблица 6)
Таблица 6
Распределение студентов группы по экзаменационным оценкам
4
Численность студентов, человек
Всего
14
в том числе имеющие
экзаменационную оценку:
2
2
3
4
4
5
5
3
Таким образом, нами построен дискретный вариационный статистический ряд
распределения, который состоит из:
признака (x) – экзаменационная оценка – представлен дискретным числом,
частоты (или веса) (f) – численность студентов.
На основании группировки можно сделать следующий вывод: крайние значения
признака (неудовлетворительно и отлично) встречаются редко, большинство
студентов получают средние баллы.
(слайд) Пример 3. Имеются следующие данные об оплате труда в 12 промышленных
организациях (таблица 7):
Таблица 7
Оплата труда,
тыс. рублей
Номер
Оплата одного
Номер
Оплата одного
организации
человеко – дня
организации
человеко – дня
1.
1,6
7.
2,1
2.
2,6
8.
1,5
3.
1,1
9.
1,8
4.
1,7
10.
1,9
5.
1,3
11.
1,2
6.
1,4
12.
2,3
Сгруппируйте промышленные организации по размеру оплаты труда, образовав
три группы. Определите вид статистического ряда распределения. Сделайте
выводы.
(слайд) Решение.
1. Определим группировочный признак.
Признак – это качественная особенность единицы совокупности.
Так как наблюдали промышленные организации (статистическая совокупность),
то единицей совокупности выступает промышленная организация,
каждая промышленная организация характеризуется оплатой труда,
таким образом, признак – оплата труда.
(слайд) 2. Так как число групп предложено в условии задачи, то на данном этапе
определим длину интервала.
Длина (h) равного интервала определяется по формуле:
h=
x max − x min
k
[2]
где xmax - максимальное значение признака в совокупности
xmin –минимальное значение признака в совокупности,
k – число групп.
(слайд) В нашем примере:
h=
x max − x min 2,6 − 1,1 1,5
=
=
= 0,5
k
3
3
[3]
5
Таким образом, длина равного интервала составляет 0,5 тыс. рублей.
(слайд) 3. Определим границы интервалов:
1-ый интервал 1,1 – 1,6
2-ой интервал 1,6 – 2,1
3-ий интервал 2,1 – 2,6.
При таком обозначении возникает проблема:
одно и то же значение признака описывает 2 интервала: один раз как нижняя
граница предшествующего интервала и другой – как верхняя граница последующего
(значения признака 1,6 и 2,1). В какую группу отнести единицу совокупности с таким
«пограничным» значением признака (организации 1, 7)?
(слайд) В этом случае руководствуются правилом:
нижняя граница интервала – включительна, верхняя – исключительна.
[1,1 – 1,6)
[1,6 – 2,1)
[2,1 – 2,6)
И тогда возникает следующая проблема:
куда отнести единицу совокупности, имеющую наибольшее значение признака в
совокупности (организация 2)?
Данную проблему решают открытием границ, т.е. последний интервал описывают
только одной границей – нижней (2,1 и более). Тогда открывают и первый интервал,
описывая его только верхней границей (менее 1,6).
Примечание: промежуточные интервалы всегда остаются закрытыми.
(слайд) Таким образом, окончательный вид интервалов следующий:
менее 1,6
1,6 – 2,1
2,1 и более
(слайд) 4. Распределим единицы совокупности по группам согласно значениям
признака (таблица 7)
Таблица 7
Распределение промышленных организаций по оплате труда
Оплата одного человеко – дня,
Номер организации
тыс. рублей
менее 1,6
3, 5, 6, 8, 11
1,6 – 2,1
1, 4, 9, 10
2,1 и более
2, 7, 12
(слайд) 5. Подведем итоги по группам и по совокупности в целом. Результат
группировки оформим в таблицу (таблица 8)
Таблица 8
Распределение промышленных организаций по оплате труда
Число организаций
Всего
12
в том числе по оплате одного
человеко – дня, тыс. рублей:
менее 1,6
5
1,6 – 2,1
4
2,1 и более
3
Таким образом, нами построен интервальный вариационный статистический ряд
распределения с интервалами с открытыми и закрытыми границами, который
состоит из:
признака (x) – оплата труда – представлен равными интервалами с открытыми
и закрытыми границами,
6
частоты (или веса) (f) – число промышленных организаций.
На основании группировки можно сделать следующий вывод: наибольшую
оплату труда имеет наименьшее количество промышленных организаций.
(слайд) 2. Сущность и значение средней величины. Виды средних величин.
Средняя величина – это один из самых распространенных приемов обобщений, в
которых находят выражение действие общих условий, закономерность развития
изучаемого явления. Средняя величина позволяет через единичное и случайное
выявить общее в развитии общественного явления.
(слайд) Средняя величина - это наиболее обобщенная характеристика
совокупности по количественно-варьирующему признаку в расчете на единицу
однородной совокупности.
Правило: средние величины должны исчисляться на основе массового
обобщения фактов и применяться к качественно однородным совокупностям.
Средняя величина отражает то общее, типичное, что складывается в отдельном
изучаемом явлении, поэтому она должна дополняться другими аналитическими
показателями, так как за общими благополучными средними могут скрываться
серьезные недостатки.
Каждая средняя величина характеризует совокупность только по какому-либо
одному признаку. Чтобы получить полное представление об изучаемом явлении
(совокупности по ряду признаков), надо рассчитать систему средних величин.
Средние величины измеряются в тех же единицах, что и признак.
(слайд) В зависимости от способа расчета выделяют следующие виды средних
величин:
средняя арифметическая,
средняя гармоническая,
средняя квадратическая (применяется при исчислении показателей
вариации)
средняя хронологическая (применяется для расчета среднего уровня ряда в
моментных статистических рядах динамики с равными периодами времени между
наблюдениями),
средняя геометрическая (применяется при исчислении средних темпов роста
в статистических рядах динамики).
(слайд) Средняя арифметическая – отношение объема варьирующего признака к
числу единиц совокупности:
объем варьирующего признака
[4]
средняя =
число единиц совокупности
(слайд) Используется две ее формы: простая и взвешенная:
(слайд) простая – когда объем варьирующего признака рассчитывается как
сумма значений признака каждой единицы совокупности:
x=
где x - среднее значение признака,
∑ (сигма) - знак суммы,
x - значение признака (варианта)
∑x – объем варьирующего признака,
n - число единиц совокупности.
∑x
n
[5]
7
Средняя арифметическая простая применяется в случаях, когда имеются
значения признака по каждой единице совокупности, т.е. на индивидуальных
данных.
(слайд) Пример 4 (на основе данных примера 2). Имеются следующие данные об
успеваемости 14 студентов группы по статистике (таблица 4):
Таблица 4
Экзаменационные оценки студентов группы
Номер
Экзаменационная
Номер
Экзаменационная
студента
оценка
студента
оценка
1.
5
8.
3
2.
4
9.
2
3.
3
10.
4
4.
3
11.
4
5.
4
12.
4
6.
5
13.
5
7.
2
14.
3
Рассчитайте среднюю экзаменационную оценку студенческой группы по
статистике. Сделайте вывод.
Решение.
Так как нам предложены индивидуальные данные, то рассчитаем среднюю
экзаменационную оценку студенческой группы по статистике по формуле средней
арифметической простой, где значениями признака (х) будут выступать
экзаменационные оценки, а числом единиц совокупности (n) - численность студентов
в группе:
∑ x = 5 + 4 + 3 + 3 + 4 + 5 + 2 + 3 + 2 + 3 + 4 + 4 + 4 + 5 + 3 = 51 = 3,6
(слайд) x =
[6]
n
14
14
Таким образом, средняя экзаменационная оценка студенческой группы по
статистике составляет 3,6 балла (напоминаем, что значения показателей при
анализе приводятся с точностью до десятых).
(слайд) взвешенная – когда объем варьирующего признака рассчитывается как
сумма произведений значений признака на частоту (вес) (f), а число единиц
совокупности (n) рассчитывается как сумма частот (n = Σf):
x=
∑x⋅f
∑f
[7]
Средняя арифметическая взвешенная применяется в случаях, когда имеются
значения признака (x) - качественная особенность единицы совокупности и частота
(вес) (f) - число единиц совокупности, обладающих данным значением признака.
Указанные характеристики выступают элементами статистического ряда
распределения, а так как средняя величина - это наиболее обобщенная
характеристика совокупности по количественно-варьирующему признаку, то вариационного статистического ряда распределения.
(слайд) Таким образом, сфера применения средней арифметической взвешенной
– вариационные статистические ряды распределения. Которые делятся на два вида:
•
дискретные - если значения признака представлены отдельными
(дискретными) числами,
•
интервальные - если значения признака представлены диапазонами,
интервалами.
8
(слайд) Пример 5 (на основе решения примера 2) Имеется следующее
распределение студентов группы по экзаменационным оценкам по статистике
(таблица 6)
Таблица 6
Распределение студентов группы по экзаменационным оценкам
Численность студентов, человек
Всего
14
в том числе имеющие
экзаменационную оценку:
2
2
3
4
4
5
5
3
Рассчитайте среднюю экзаменационную оценку студенческой группы по
статистике. Сделайте вывод.
Решение.
(слайд) Так как нам предложен дискретный вариационный статистический ряд
распределения, который состоит из признака (x) – экзаменационная оценка и
частоты (веса) (f) – численность студентов, то среднюю экзаменационную оценку
студенческой группы по статистике рассчитаем по формуле средней
арифметической взвешенной:
x=
∑x⋅f
∑f
=
2 ⋅ 2 + 3 ⋅ 4 + 4 ⋅ 5 + 5 ⋅ 3 4 + 12 + 20 + 15 51
=
=
= 3,6
2+4+5+3
14
14
[8]
Таким образом, средняя экзаменационная оценка студенческой группы по
статистике составляет 3,6 балла.
При этом можно отметить, что средняя арифметическая взвешенная – это
результат математического преобразования средней арифметической простой,
когда сумма одинаковых слагаемых (в нашем случае значений признака)
представляется как произведение значения повторяющегося слагаемого на его
количество.
(слайд) Пример 6 (на основе решения примера 3). Имеется следующее
распределение промышленных организаций по оплате труда (таблица 8)
Таблица 8
Распределение промышленных организаций по оплате труда
Число промышленных организаций
Всего
12
в том числе по оплате одного
человеко – дня, тыс. рублей:
менее 1,6
5
1,6 – 2,1
4
2,1 и более
3
Рассчитайте средний уровень оплаты труда в промышленных организациях.
Сделайте вывод.
Решение.
(слайд) Так как нам предложен интервальный вариационный статистический ряд
распределения, который состоит из признака (x) – оплата труда и частоты (веса) (f) –
число промышленных организаций, то средний уровень оплаты труда в
промышленных организациях необходимо рассчитывать по формуле средней
арифметической взвешенной (формула [7]).
9
x=
∑x⋅f
∑f
[7]
Однако для ее использования значения признака должны быть представлены в
виде дискретных (отдельных) чисел, в нашем же примере они представлены в виде
интервалов.
(слайд) Так как каждый интервал описывается двумя границами (нижней и
верхней), то можно рассматривать каждую группу как отдельную совокупность, в
которой признак имеет два значения: в виде нижней границы интервала и в виде
верхней. Далее, средняя – это наиболее обобщенная характеристика совокупности
по количественно-варьирующему признаку, следовательно, по каждой группе
рассчитаем среднее значение признака по формуле средней арифметической
простой:
xi =
x imax + x imin
2
[9]
Примечание: открытые интервалы (т.е. описанные только одной границей –
верхней или нижней) закрываются по правилу:
- первый - по длине второго,
- последний – по длине предпоследнего.
Так как нам предложено всего три интервала, то длина второго интервала будет
определяющей для закрытия и первого интервала и последнего.
Длина i–того интервала (hi) – это разница между верхней (xi max) и нижней (xi min)
границами интервала определяется по формуле [1]:
hi = xi max - xi min
[1]
Тогда,
[10]
h2 = 2,1 – 1,6 = 0,5
и нижняя граница первого интервала составляет 1,1
x1 min = x1 max – h2 = 1,6 – 0,5 = 1,1
[11]
а верхняя граница последнего интервала составляет 2,6
x3 max = x3 min + h2 = 2,1 + 0,5 = 2,6
[12]
(слайд) Таким образом, интервалы будут выглядеть следующим образом:
1,1 – 1,6
1,6 – 2,1
2,1 – 2,6
Рассчитаем середины интервалов по формуле средней арифметической простой
(формула [8]):
x 1max + x 1min 1,1 + 1,6 2,7
=
=
= 1,35
2
2
2
x 2 max + x 2 min 1,6 + 2,1 3,7
=
=
= 1,85
x2 =
2
2
2
x 3 max + x 3 min 2,1 + 2,6 4,7
=
=
= 2,35
x3 =
2
2
2
x1 =
[13]
[14]
[15]
(слайд) Таким образом, наши исходные данные в виде интервального
вариационного статистического ряда распределения (таблица 8) мы представили в
виде дискретного вариационного статистического ряда распределения (таблица 9):
Таблица 9
Распределение промышленных организаций по оплате труда
Середина
Число промышленных
10
интервала, x
Всего
в том числе по оплате одного
человеко – дня, тыс. рублей:
менее 1,6
1,1 – 1,6
1,6 – 2,1
1,6 – 2,1
2,1 и более
2,1 – 2,6
1,35
1,85
2,35
организаций, f
12
5
4
3
(слайд) Воспользуемся формулой средней арифметической взвешенной:
x=
∑x⋅f
∑f
=
1,35 ⋅ 5 + 1,85 ⋅ 4 + 2,35 ⋅ 3 6,75 + 7,4 + 7,05 21,2
=
=
= 1,767 [16]
5+4+3
12
12
Таким образом, средний уровень оплаты труда в промышленных организациях
составляет 1,8 тыс. рублей.
(слайд) Итак, обобщим результаты решения примеров 5 и 6 о применении
формулы средней арифметической взвешенной на вариационных статистических
рядах распределения:
•
на дискретных (т.е. значения признака представлены отдельными
(дискретными)
числами)
среднее
значение
признака
рассчитывается
непосредственно по формуле средней арифметической взвешенной,
•
на интервальных (т.е. значения признака представлены диапазонами,
интервалами) для применения формулы средней арифметической взвешенной
необходимо значения признака представить в виде дискретных чисел, т.е. перейти
от интервального вариационного статистического ряда распределения к
дискретному.
(слайд) Для этого по каждому интервалу значений признака рассчитывается
среднее значение признака в интервале (как наиболее обобщенная характеристика
совокупности по количественно-варьирующему признаку) по формуле средней
арифметической простой:
xi =
x imax + x imin
2
[17]
где x i - среднее значение признака в i-том интервале,
xi max – верхняя граница i- го интервала,
xi min – нижняя граница i- го интервала.
При этом открытые интервалы (т.е. описанные только одной границей – верхней
или нижней) закрывают по правилу:
- первый - по длине второго,
- последний – по длине предпоследнего.
(слайд) Свойства средней арифметической:
сумма отклонений значений признака от среднего значения признака равна
нулю:
или
∑ (x − x ) = 0
∑ (x − x ) ⋅ f = 0
[18]
[19]
если все частоты разделить или умножить на какое-либо число, то средняя
арифметическая от этого не изменится:
11
1
⋅∑x⋅f
m
=
=
x=
1
f
⋅∑f
∑m
m
f
∑x⋅m
∑x⋅f
∑f
[20]
(слайд) Средняя гармоническая (как частный случай средней арифметической) –
используется в случаях, если известны значения варьирующего признака (х), и
объем варьирующего признака (произведение признака на частоту – f=ω), но нет
информации о числе единиц совокупности. В практике чаще всего применяется в
форме взвешенной:
x=
∑x⋅f
x⋅f
∑
x
=
∑ω
ω
∑x
[21]
(слайд) Пример 7. Имеются следующие данные о цене единицы продукции и общей
стоимости продукции по промышленной организации в разрезе участков за отчетный
период (таблица 10):
Таблица 10
Цена единицы продукции и стоимость произведенной продукции
промышленной организации в отчетном периоде,
рублей
№ участка
Цена единицы продукции
Стоимость произведенной продукции
1
680
10200
2
840
16800
3
710
29820
4
750
26250
Рассчитайте среднюю цену единицы продукции в целом по промышленной
организации. Сделайте вывод.
Решение.
(слайд) Исходя из условия задачи, мы располагаем информацией о цене
единицы продукции и стоимости произведенной продукции.
Так как цена – это характеристика единицы совокупности, следовательно, это
признак (x). Стоимость произведенной продукции получена произведением цены
единицы продукции на количество продукции, следовательно, это объем
варьирующего признака ( f=ω).
Таким образом, нам предложен дискретный вариационный статистический ряд
распределения, который состоит из признака (x) – цена единицы продукции и
объема варьирующего признака (ω) – стоимость произведенной продукции. При
этом, мы не располагаем информацией о количестве произведенной продукции,
следовательно, для расчета
среднего
значения признака необходимо
воспользоваться формулой средней гармонической взвешенной:
x=
∑ω =
ω
∑x
83070
83070
10200 + 16800 + 29820 + 26250
=
=
= 741,7
10200 16800 29820 26250 15 + 20 + 42 + 35
112
+
+
+
680
840
710
750
[22]
Таким образом, средняя цена единицы продукции в целом по промышленной
организации составляет 741,7 рубля.
12
(слайд) Средняя квадратическая – корень квадратный из среднего квадрата
значений признака (применяется как показатель вариации признака):
x = x2
[23]
(слайд) - в форме простой, если средний квадрат значений признака рассчитывался
по формуле средней арифметической простой, т.е. на индивидуальных данных:
x
2
∑x
=
и тогда
x=
2
[24]
n
∑x
2
n
[25]
- в форме взвешенной, если средний квадрат значений признака рассчитывался по
формуле средней арифметической взвешенной:
∑x ⋅f
∑f
2
x=
[26]
(слайд) Cредняя хронологическая – как отношение суммы половины первого и
последнего значений признака и полных промежуточных значений признака к числу
единиц совокупности, уменьшенному на единицу (применяется для расчета
среднего уровня ряда в моментных статистических рядах динамики с равными
периодами времени между наблюдениями):
1
1
x 1 + x 2 + ... + x n −1 + x n
2
x= 2
n −1
[27]
(слайд) Средняя геометрическая – корень n-ой степени из произведения (П)
значений признака (х1, х2, …, xn) (применяется при исчислении средних темпов роста
в статистических рядах динамики):
x = n x 1 ⋅ x 2 ⋅ ... ⋅ x n = n Пx
[28]
(слайд) Тема 4. Статистическое изучение вариации.
1. Понятие вариации. Причины и необходимость изучения вариации.
2. Показатели вариации.
(слайд) 1. Понятие вариации. Причины и необходимость изучения вариации.
Вариация (лат. variatio изменение) – это несовпадение значений показателя у
разных объектов.
(слайд) Вариация признака – различие индивидуальных значений признака у
единиц совокупности. Возникает в результате того, что каждый изучаемый объект
находится в конкретных условиях места и времени и развивается согласно своим
особенностям под влиянием различных факторов и их сочетаний.
Исследование вариации в статистике имеет большое значение, так как помогает
познать сущность изучаемого явления и, следовательно, дает важную информацию
для принятия научно обоснованных управленческих решений.
13
Средние величины дают обобщающую точечную характеристику изучаемого
признака совокупности, но не раскрывают строения совокупности, не показывают,
как располагаются около них индивидуальные значения признака (сосредоточены ли
они вблизи средней величины или значительно отклоняются от нее). Средние
величины в двух совокупностях могут быть одинаковыми, но в одном случае
индивидуальные значения отличаются от них мало, а в другом – эти отличия велики,
т.е. в одном случае вариация мала, в другом – велика. И это имеет весьма важное
значение для характеристики надежности средних величин.
Чем больше значения отдельных единиц совокупности различаются между
собой, тем больше они отличаются от своих средних величин, и наоборот, - чем
меньше значения признака отличаются друг от друга, тем меньше они отличаются от
средних, которые в таком случае могут реально представлять всю совокупность.
Таким образом, при анализе исследуемой совокупности, полученные средние
величины необходимо дополнить показателями, измеряющими отклонения от
средних и показывающих степень надёжности последних, т.е. показателями
вариации.
Определив характер вариации в исследуемой совокупности, можно сказать,
насколько она однородна, и, следовательно, насколько характерными являются
рассчитанные средние величины.
(слайд) Степень близости значений отдельных единиц к среднему значению
признака измеряется рядом абсолютных и относительных показателей вариации.
2. Показатели вариации.
(слайд) I. Абсолютные показатели (размах вариации, среднее линейное
отклонение, дисперсия (средний квадрат отклонений), среднее квадратическое
отклонение).
(слайд) Размах вариации – разница между наибольшим и наименьшим
значениями признака:
R = xmax - xmin
[1]
Самый простой показатель по расчёту, но улавливает только крайние
отклонения, не отражает отклонений значений признака внутри ряда. Измеряется в
тех же единицах, что и признак.
Рассмотрим практику расчета размаха вариации на примерах 4, 5 и 6 темы 3.
(слайд) Пример 4. Имеются следующие данные об успеваемости 14 студентов
группы по статистике (таблица 4 темы 3):
Таблица 4
Экзаменационные оценки студентов группы
Номер
Экзаменационная
Номер
Экзаменационная
студента
оценка
студента
оценка
1.
5
8.
3
2.
4
9.
2
3.
3
10.
4
4.
3
11.
4
5.
4
12.
4
6.
5
13.
5
7.
2
14.
3
Рассчитайте размах вариации значений признака. Дайте пояснение полученному
значению.
Решение.
14
(слайд) Признак – качественная особенность единицы совокупности. В нашей
задаче каждая единица совокупности характеризуется экзаменационной оценкой (х).
Наибольшее значение признака – 5 баллов, а наименьшее – 2 балла.
Таким образом,
R = xmax - xmin = 5 – 2 = 3
[2]
т.е. разница между наибольшей и наименьшей экзаменационной оценкой студентов
группы составила 3 балла.
Данная методика расчета показателя используется и в дискретных вариационных
статистических рядах распределения (пример 5 тема 3)
(слайд) Пример 5. Имеется следующее распределение студентов группы по
экзаменационным оценкам по статистике (таблица 6 темы 3)
Таблица 6
Распределение студентов группы по экзаменационным оценкам
Численность студентов, человек
Всего
14
в том числе имеющие
экзаменационную оценку:
2
2
3
4
4
5
5
3
В интервальных статистических рядах распределения методика расчета
показателя несколько усложняется.
(слайд) Пример 6. Имеется следующее распределение промышленных организаций
по оплате труда (таблица 8 темы 3)
Таблица 8
Распределение промышленных организаций по оплате труда
Число промышленных организаций
Всего
12
в том числе по оплате одного
человеко – дня, тыс. рублей:
менее 1,6
5
1,6 – 2,1
4
2,1 и более
3
Рассчитайте размах вариации значений признака. Дайте пояснение полученному
значению.
Решение.
(слайд) Признаком (x) выступает – оплата труда.
Однако значения признака представлены интервалами с отрытыми и закрытыми
границами. Для определения наименьшего значения признака в совокупности и
наибольшего необходимо закрыть границы первого и последнего интервалов по
соответствующей методике. В результате получим следующие значения интервалов:
1,1 – 1,6
1,6 – 2,1
2,1 – 2,6
Тогда,
R = xmax - xmin = 2,6 – 1,1 = 1,5
[3]
т.е. разница между наибольшим и наименьшим уровнем оплаты труда составляет
1,5 тыс. рублей.
15
(слайд) Среднее линейное отклонение - это средняя арифметическая из
отклонений индивидуальных значений признака от среднего значения признака, без
учёта знака этих отклонений.
(слайд) По свойству средней арифметической сумма фактических отклонений
от средней равна нулю, так как сумма отрицательных отклонений равна сумме
положительных отклонений и для решения этой проблемы используется модуль:
(слайд) в форме простой для индивидуальных данных:
d=
∑| x − x |
n
[4]
в форме взвешенной для сгруппированных данных
d=
∑ | x − x | ⋅f
∑f
[5]
Показатель даёт обобщающую характеристику распределения отклонений,
учитывает различия всех единиц совокупности. Чем оно меньше в данной
совокупности, тем однороднее её показатели, по сравнению с показателями другой
сравниваемой совокупности. Измеряется в тех же единицах, что и признак.
Однако в практике статистической деятельности не применяется, т.к.
превращение отрицательного числа в положительное через модуль не является
математическим решением.
(слайд) Дисперсия (средний квадрат отклонений) (σ2 – сигма в квадрате) - это
средняя арифметическая из возведенных в квадрат отклонений значений признака
от среднего значения признака:
(слайд) в форме простой для индивидуальных данных:
σ
2
∑ (x − x)
=
2
[6]
n
в форме взвешенной для сгруппированных данных
σ
2
∑ (x − x)
=
∑f
2
⋅f
[7]
Дисперсия показывает среднее значение отклонений в квадрате значений
признака от его среднего значения, следовательно, не имеет экономической
единицы измерения.
(слайд) Среднее квадратическое отклонение (σ – сигма) - это квадратный корень
из дисперсии:
σ = σ2
[8]
Среднее квадратическое отклонение характеризует вариацию признака в
абсолютном выражении, измеряется в тех же единицах, что и признак (варианта) и
показывает, на сколько единиц измерения признака в среднем конкретные значения
признака отклоняются от их среднего значения.
Среднее квадратическое отклонение является критерием надёжности средней
величины: чем оно меньше, тем лучше среднее значение признака отражает
изучаемую совокупность.
Кроме того, если средние величины отражают тенденцию развития, т.е. влияние
главных факторов на изменение значений признака, то среднее квадратическое
отклонение измеряет силу воздействия прочих факторов.
Рассмотрим практику расчета дисперсии и среднего квадратического отклонения
на примерах 4, 5 и 6 темы 3.
16
(слайд) Пример 4 темы 3. Имеются следующие данные об успеваемости 14
студентов группы по статистике (таблица 4 темы 3):
Таблица 4
Экзаменационные оценки студентов группы
Номер
Экзаменационная
Номер
Экзаменационная
студента
оценка
студента
оценка
1.
5
8.
3
2.
4
9.
2
3.
3
10.
4
4.
3
11.
4
5.
4
12.
4
6.
5
13.
5
7.
2
14.
3
Рассчитайте дисперсию и среднее квадратическое отклонение. Дайте пояснение
полученным значениям.
Решение.
(слайд) Так как нам предложены индивидуальные данные, то дисперсию будем
рассчитывать по формуле дисперсии простой
σ
2
∑ (x − x)
=
2
[6]
n
где x = 3,6.
(слайд) Для удобства оформим расчеты в рабочую таблицу (таблица 1)
Таблица 1
2
Экзаменационная
Номер студента
(x − x)
x−x
оценка, x
1.
5
5 – 3,6 = 1,4
1,96
2.
4
4 – 3,6 = 0,4
0,16
3.
3
3 – 3,6 = -0,6
0,36
4.
3
3 – 3,6 = -0,6
0,36
5.
4
4 – 3,6 = 0,4
0,16
6.
5
5 – 3,6 = 1,4
1,96
7.
2
2 – 3,6 = -1,6
2,56
8.
3
3 – 3,6 = -0,6
0,36
9.
2
2 – 3,6 = -1,6
2,56
10.
4
4 – 3,6 = 0,4
0,16
11.
4
4 – 3,6 = 0,4
0,16
12.
4
4 – 3,6 = 0,4
0,16
13.
5
5 – 3,6 = 1,4
1,96
14.
3
3 – 3,6 = -0,6
0,36
Сумма
13,24
(
(слайд) Тогда,
σ
2
∑ (x − x)
=
)
2
13,24
= 0,946
n
14
σ = σ 2 = 0,972
=
[9]
[10]
Таким образом, средний квадрат отклонений значений признака от среднего
значения признака составляет 0,9 и в среднем каждое значение признака
отклоняется от среднего значения признака на 1,0 балла, т.е. в среднем
17
экзаменационные оценки студенческой группы по статистике варьируют от среднего
балла (3,6) на 1,0 балла.
(слайд) Пример 5. Имеется следующее распределение студентов группы по
экзаменационным оценкам по статистике (таблица 6 темы 3)
Таблица 6
Распределение студентов группы по экзаменационным оценкам
Численность студентов, человек
Всего
14
в том числе имеющие
экзаменационную оценку:
2
2
3
4
4
5
5
3
Рассчитайте дисперсию и среднее квадратическое отклонение. Дайте пояснение
полученным значениям.
Решение.
(слайд) Так как нам предложен дискретный вариационный статистический ряд
распределения, то дисперсию будем рассчитывать по формуле дисперсии
взвешенной:
σ
2
∑ (x − x)
=
∑f
2
⋅f
[7]
(слайд) где x = 3,6.
Для удобства оформим расчеты в рабочую таблицу (таблица 2)
Экзаменационная
оценка, x
2
3
4
5
Сумма
Численность студентов,
человек, f
2
4
5
3
14
Тогда,
σ
2
∑ (x − x)
=
∑f
2
⋅f
=
(x − x)
2 – 3,6 = -1,6
3 – 3,6 = -0,6
4 – 3,6 = 0,4
5 – 3,6 = 1,4
13,24
= 0,946
14
Таблица 2
(x − x ) (x − x )
2
2,56
0,36
0,16
1,96
2
⋅f
5,12
1,44
0,80
5,88
13,24
[11]
σ = σ 2 = 0,972
[12]
Таким образом, средний квадрат отклонений значений признака от среднего
значения признака составляет 0,9 и в среднем каждое значение признака
отклоняется от среднего значения признака на 1,0 балла, т.е. в среднем
экзаменационные оценки варьируют от среднего балла (3,6) на 1,0 балла.
При этом отмечаем, что дисперсия взвешенная – это результат математического
преобразования дисперсии простой, когда сумма одинаковых слагаемых (в нашем
случае квадрата отклонений значений признака от среднего значения признака)
представляется как произведение значения повторяющегося слагаемого на его
количество.
18
(слайд) Пример 6. Имеется следующее распределение промышленных организаций
по оплате труда (таблица 8 темы 3)
Таблица 8
Распределение промышленных организаций по оплате труда
Число промышленных организаций
Всего
12
в том числе по оплате одного
человеко – дня, тыс. рублей:
менее 1,6
5
1,6 – 2,1
4
2,1 и более
3
Рассчитайте дисперсию и среднее квадратическое отклонение. Дайте пояснение
полученным значениям.
Решение.
(слайд) Так как нам предложен вариационный статистический ряд
распределения, то дисперсию необходимо рассчитывать по формуле дисперсии
взвешенной:
σ
2
∑ (x − x)
=
∑f
2
⋅f
[7]
Для ее использования значения признака должны быть представлены в виде
отдельных дискретных чисел, в нашем же примере они представлены в виде
интервалов.
(слайд) Воспользовавшись изученной в теме 3 методикой преобразования
интервальных вариационных статистических рядов распределения в дискретные
получим (таблица 3):
Таблица 3
Оплата одного человеко – дня,
Середина интервала, Число промышленных
тыс. рублей
x
организаций, f
менее 1,6
1,1 – 1,6
1,35
5
1,6 – 2,1
1,6 – 2,1
1,85
4
2,1 и более
2,1 – 2,6
2,35
3
А далее, на основании расчетов задачи 6 темы 3 где x = 1,767, рассчитаем
дополнительные показатели в рабочей таблице (таблица 4)
Таблица 4
2
2
Середина
Число промышленных
(
)
x
−
x
x
−
x
−
⋅f
x
x
интервала, x
организаций, f
1,35
5
1,35 – 1,77 = -0,42
0,1764
0,8820
1,85
4
1,85 – 1,77 = 0,08
0,0064
0,0256
2,35
3
2,35 – 1,77 = 0,58
0,3364
1,0092
Сумма
12
1,9168
(
Тогда,
σ
2
∑ (x − x)
=
∑f
2
⋅f
=
1,9168
= 0,160
12
σ = σ 2 = 0,4
)
(
)
[13]
[14]
(слайд) Таким образом, средний квадрат отклонений значений признака от
среднего значения признака составляет 0,2 и в среднем каждое значение признака
19
отклоняется от среднего значения признака на 0,4 тыс. рублей, т.е. в среднем
оплата труда варьирует от среднего уровня (1,8 тыс. рублей) на 400 рублей.
(слайд)
Дисперсия и среднее квадратическое отклонение являются
общепринятыми показателями для измерения вариации признака.
Однако, во-первых, являясь абсолютными величинами и, во-вторых, зависящими
от среднего значения признака, не могут выступать показателями для сравнения
вариации различных признаков. Для осуществления таких сравнений, а также
сравнения колеблемости одного и того же признака в различных совокупностях
используют относительный показатель вариации.
(слайд) II. Показатель относительного рассеивания.
Коэффициент вариации (V) – отношение среднего квадратического отклонения к
среднему значению признака:
V=
σ
⋅ 100%
x
[15]
Коэффициент вариации выступает как мера вариации значений признака вокруг
среднего значения признака, анализируется в процентах и показывает, на сколько
процентов в среднем конкретные значения признака отклоняются от их среднего
значения.
Используется для оценки типичности средних величин. Является критерием
надёжности среднего значения признака: если он больше 33 - 35%, то значения
признака сильно колеблются, следовательно, средняя менее надёжна, а
совокупность неоднородна.
Для наших примеров
(слайд) Примеры 4 и 5.
V=
σ
0,972
⋅ 100% =
⋅ 100% = 27,0%
x
3,6
[16]
σ
0,4
⋅ 100% =
⋅ 100% = 22,2%
x
1,8
[17]
т.е. в среднем экзаменационные оценки варьируют от среднего балла на 27,0%.
(слайд) Пример 6.
V=
т.е. в среднем оплата труда варьирует от среднего уровня на 22,2%.
Таким образом, изученные совокупности однородны, средние надежны, однако в
примере 6 вариация значений признака меньше, следовательно, совокупность более
однородна.