Описательная статистика
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
СТАТИСТИЧЕСКИЕ
МЕТОДЫ
УПРАВЛЕНИЯ
КАЧЕСТВОМ
ЛЕКЦИЯ
Описательная
статистика
1. Задачи описательной статистики
2. Методы описательной статистики с
точки зрения теоретических основ
статистических методов
3. Оценивание параметров
4. Средства и методы описательной
статистики:
• графики;
• таблицы.
1. Задачи
описательной
статистики
Описательная статистика или
дескриптивная статистика
(descriptive statistics) занимается:
■ обработкой эмпирических данных,
■ их систематизацией,
■ наглядным представлением в
форме графиков и таблиц, а также
■ их количественным описанием
посредством основных
статистических показателей.
В качестве данных для описательной статистики может быть
которая
общественного
мнения,
отражает
содержание
показатели
наблюдений:
экономической
и
опросы
финансовой
деятельности, характеристики производственных процессов и т.д.
И какова бы ни была генеральная совокупность наблюдений, из которой
черпаются
данные,
описательная
статистика
предлагает
наиболее
целесообразные способы, с помощью которых можно не только быстро
выделить основное содержание полученной информации, но и провести
дальнейший ее анализ с минимальной трудоемкостью.
■ Предположим, что имеется большая партия деталей, и надо дать заключение о том,
соответствует ли контролируемый размер 𝑿 техническим требованиям.
Можно провести
сплошное обследование
— проверить размер
каждой детали. Такой
подход требует слишком
больших материальных
затрат
альтернативный подход к
решению этой задачи —
отобрать из всей партии
сравнительно небольшое
число деталей и изучить
их характеристики
Совокупность отобранных объектов называется
выборкой, а количество отобранных объектов
генеральная
совокупность
— объемом выборки. Все множество объектов, из
которых производится выборка, называется
генеральной совокупностью.
2 случая
Генеральная
совокупность= выборке
Генеральная
совокупность ≠ выборке
Частный и очень редкий
случай
Самый распространенный
случай
• Например, на Марсе
посадили 29 яблонь и через
год измерили их рост в
метрах
выборка
Контролируемая случайная величина 𝑿 на генеральной совокупности имеет некоторую
функцию распределения 𝑭(𝒙), плотность распределения 𝒇(𝒙), математическое
ожидание 𝝁, дисперсию 𝝈𝟐 и другие характеристики, значения которых неизвестны.
Виды выборок
Вероятностная
выборка
это выборка,
вероятность
попадания в
которую для
каждого члена
генеральной
совокупности
(популяции)
одинакова и
задана заранее
Репрезентативная
выборка
это
вероятностная
выборка, для
которой задано
дополнительное
условие:
попадание в
выборку одного
из членов
генеральной
совокупности
никак не
сказывается на
вероятности
попадания в
выборку
остальных
членов
генеральной
совокупности.
Простая
случайная
выборка
Систематическая
выборка
Кластерная
выборка
Эффект дизайна
это выборка,
полученная
путем
случайного
отбора членов
генеральной
совокупности по
единому
реестру при
помощи
генератора
случайных чисел
или таблиц
случайных
чисел.
это выборка,
полученная
путем
систематическ
ого отбора
каждого n-го
члена
генеральной
совокупности по
единому
реестру, где n
(интервал
выборки)
зависит от
объема
генеральной
совокупности и
необходимого
объема выборки.
это сложный
метод
формирования
выборки при
отсутствии
единого реестра,
при которой
происходит
разделение
генеральной
совокупности по
территориально
му признаку на
отдельные блоки
(кластеры), в
которых в
дальнейшем
организуется
случайный или
систематический
отбор.
это влияние
метода
формирования
выборки на
необходимый
объем выборки.
Чем сложнее
метод
формирования,
тем сильнее
нарушается
условие
независимости
выбора, и тем
выше эффект
дизайна.
Для получения достоверных результатов выборка должна правильно
отражать пропорции генеральной совокупности, т.е. быть
репрезентативной.
Очевидно, если партия деталей изготовлена рабочими разной квалификации, а в
выборку попали лишь детали, изготовленные рабочим с более высокой квалификацией,
вряд ли можно ожидать правильные данные для всей партии деталей.
Можно показать, что выборка репрезентативна, если она отобрана из генеральной
совокупности случайным образом. На практике такой отбор не всегда легко осуществим,
поэтому используют различные способы отбора, обеспечивающие случайность в
большей или меньшей степени.
2. Методы
описательной
статистики с
точки зрения
теоретических
основ
статистических
методов
■ Результаты наблюдений
контролируемого размера в выборке
записываются в порядке их
регистрации 𝒙𝟏 , 𝒙𝟐, … , 𝒙𝒏;
n — объем выборки.
Вариационным называется ряд, составленный из элементов выборки в порядке их
возрастания: 𝒙(𝟏) ≤ 𝒙(𝟐) ≤ ⋯ ≤ 𝒙(𝒏)
При этом минимальный элемент выборки 𝒙𝒎𝒊𝒏 = 𝒙(𝟏) максимальный элемент
𝒙𝒎𝒂𝒙 = 𝒙(𝒏)
Разность между максимальным и минимальным элементами выборки называется
размахом:
𝑹 = 𝒙𝒎𝒂𝒙— 𝒙𝒎𝒊𝒏
(4.1)
При достаточно большом объеме выборки данные группируют — разбивают на
интервалы, как правило, одинаковой длины.
Количество интервалов к выбирается в зависимости от объема выборки, обычно от 8
до 20 интервалов.
Иногда используется эмпирическая формула
𝒌 = 𝟏 + 𝟑, 𝟑𝟐 lg 𝒏 .
(4.2)
𝒘 = 𝑫и = 𝑹/𝒌
(4.3)
Длина интервала
Количество 𝒏𝒊 элементов выборки, попавших в i-й интервал (𝒊 = 𝟏, 𝟐, … , 𝒌),
называется частотой.
Результаты расчета сводят в таблицу частот, в которой показывают границы интервалов,
середины 𝒛𝒊 . каждого интервала, частоты, относительные частоты 𝒏𝒊 / 𝒏, накопленные
относительные частоты
𝒏𝒊 / 𝒏 , а также относительные частоты, деленные на длину
интервала 𝒏𝒊 / 𝒘𝒏. Эти данные используются для графического представления
выборки.
Выборочным распределением называется распределение дискретной
случайной величины, принимающей значения 𝒙𝟏 , 𝒙𝟐, … , 𝒙𝒏 с вероятностями 𝟏/𝒏.
График выборочной функции распределения 𝑭(𝒙) строится по значениям
накопленных относительных частот.
Можно показать, что при
большом объеме выборки
выборочная функция
распределения является приближенной оценкой функции
распределения 𝑭(𝒙)
генеральной совокупности.
Гистограмма частот строится по значениям 𝒏𝒊 / 𝒘𝒏 и является приближенной оценкой
плотности распределения 𝒇(𝒙) генеральной совокупности.
Числовые характеристики выборочного распределения определяются по
аналогии с числовыми характеристиками дискретной случайной величины с учетом того,
что вероятности 𝒑𝒊 = 𝟏/𝒏
Обобщающий показатель, в котором проявляются общие, закономерные черты,
свойственные для всей совокупности изучаемого явления
(4.4)
Средний элемент вариационного ряда, если 𝒏 - нечетное число, или полусумма двух
средних элементов, если 𝒏 - четное число
(4.5)
Значение признака, которые чаще всего встречаются в вариационном ряду (для
унимодального – одновершинного распределения)
(4.6)
Среднее арифметическое квадратов отклонений значений выборки от выборочного
среднего
при 𝒏 ≤ 𝟐𝟎
(4.7)
при 𝒏 > 𝟐𝟎
Наиболее
распространённый
показатель
рассеивания
значений
случайной
величины относительно её математического ожидания
(4.8)
1. Характеристика распределения, которая сообщает о наличии или отсутствии
симметрии данных.
2. Тесно связана с расположением моды, среднего и медианы.
3. Если значение
моды, среднего и медианы совпадает, то распределение
симметрично и ассиметрия равна 0.
4. Изменяется в пределах от -3 до 3. Положителен при положительной ассиметрии,
отрицателен при отрицательной.
(4.9)
Крутость кривой распределения, которая определяется сопоставлением кривой с
кривой стандартного нормального распределения
𝝁𝟒
𝒆𝒙 = 𝟐 − 𝟑
𝝁 𝟐
(4.10)
Задача 1
По результатам контроля выборки из партии штампованных деталей получены
следующие значения длины в мм:
200, 198, 201, 203, 203, 204, 196, 200, 203, 198, 199, 197, 197, 199, 199,
196, 199, 200, 201, 200, 200, 200, 203, 200, 200, 199, 204, 202, 205, 199.
Построить таблицу частот, разбив данные на 6 интервалов, график выборочной
функции распределения и гистограмму частот. Вычислить выборочное среднее,
медиану, дисперсию и стандартное отклонение.
Решение
Строим вариационный ряд:
196, 196, 197, 197, 198, 198, 199, 199, 199, 199, 199, 199, 200, 200, 200,
200, 200, 200, 200, 200, 201, 201, 202, 203, 203, 203, 203, 204, 204, 205.
Минимальное значение ряда 𝟏𝟗𝟔,
максимальное 𝟐𝟎𝟓,
размах выборки 𝑹 = 𝟐𝟎𝟓 — 𝟏𝟗𝟔 = 𝟗,
длина интервала 𝒘 − 𝟗/𝟔 = 𝟏, 𝟓.
При построении таблицы частот в качестве нижней границы первого интервала принято
минимальное значение выборки.
При подсчете частот в случае совпадения элемента выборки с верхней границей
соответствующий элемент учитывался в данном интервале.
№ п/п
Границы
𝒛𝒊
𝒏𝒊
𝒏𝒊 /𝒏
1
2
3
4
5
6
196-197,5
197,5-199
199-200,5
200,5-202
202-203,5
203,5-205
196,75
198,25
199,75
201,25
202,75
204,25
4
8
8
3
4
3
0,133
0,267
0,267
0,100
0,133
0,100
𝒏𝒊 /𝒏
𝒏𝒊 /𝒘𝒏
0,133
0,400
0,667
0,767
0,900
1,000
0,089
0,178
0,178
0,067
0,089
0,067
Находим числовые характеристики.
Выборочное среднее:
𝒙 =
𝟏
𝟑𝟎
(𝟏𝟗𝟔 + 𝟏𝟗𝟔 + 𝟏𝟗𝟕 + … + 𝟐𝟎𝟒 + 𝟐𝟎𝟓) = 𝟐𝟎𝟎;
Выборочная медиана:
𝑴𝒆 = 𝟐𝟎𝟎
(среднее между 15-м и 16-м элементами вариационного ряда);
Выборочная дисперсия
𝑫 = 𝟒, 𝟔;
Выборочное стандартное отклонение
𝝈= 𝑫=
𝟒, 𝟔 = 𝟐, 𝟏𝟒
3. Оценивание
параметров
■ Предположим, что вид
распределения генеральной
совокупности известен
(нормальное,
экспоненциальное и т.п.). Тогда
задача статистики сводится к
оцениванию параметров этого
распределения по результатам
выборочных данных, в
частности, к оцениванию
математического ожидания,
дисперсии и т.д.
.
𝜽 неизвестного параметра 𝜽 называется приближенное
значение этого параметра, найденное по выборочным данным:
𝜽 = 𝜽 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 .
Точечная оценка должна быть
(по возможности)
состоятельной
Состоятельной
называется оценка, которая
при увеличении объема
выборки сходится по
вероятности к
оцениваемому параметру.
Оценка является
состоятельной, если при 𝑛 →
∞ выполняются соотношения
lim 𝑀 𝜃 = 𝜃
lim 𝐷 𝜃 = 0
несмещенной
Оценка называется
несмещенной, если ее
математическое
ожидание совпадает с
оцениваемым
параметром
𝑀 𝜃 =𝜃
эффективной
Эффективной
называется оценка,
имеющая при заданном
объеме выборки
минимальную
дисперсию.
Несмещенная оценка
является тем более
точной, чем меньшую
дисперсию она имеет.
Предположим, что случайная величина 𝑿 на генеральной совокупности имеет
математическое ожидание 𝒎 ( чаще всего его обозначают 𝝁) и дисперсию 𝝈𝟐 .
В качестве точечной оценки математического ожидания можно принять выборочное
среднее:
𝟏
𝝁 =𝒙 =
𝒏
𝒏
𝒙𝒊 .
𝒊=𝟏
Эта оценка является состоятельной и несмещенной.
(4.11)
Действительно,
𝟏
𝑴𝝁 =𝑴
𝒏
𝟏
𝑫𝝁 =𝑫
𝒏
При
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
𝟏
𝒙𝒊 =
𝒏
𝟏
𝒙𝒊 = 𝟐
𝒏
𝒏 → ∞ 𝒍𝒊𝒎 𝑫 𝝁 =
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
𝟏
𝑴 𝒙𝒊 =
𝒏
𝟏
𝑫 𝒙𝒊 = 𝟐
𝒏
𝝈𝟐
𝒍𝒊𝒎
𝒏
= 𝟎.
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
𝟏
𝝁 = 𝒏𝝁 = 𝝁
𝒏
𝟐
𝟏
𝝈
𝝈𝟐 = 𝟐 𝒏𝝈𝟐 =
𝒏
𝒏
Если же выборка взята из нормально распределенной генеральной совокупности, то
оценка (4.11) является и эффективной.
При обосновании состоятельности оценки мы получили важную формулу для дисперсии
выборочного среднего, которая будет использована в дальнейшем:
𝟐
𝝈
𝑫𝒙 =
𝒏
(4.12)
В качестве точечной оценки дисперсии 𝝈𝟐 генеральной совокупности принимается
специальная характеристика, называемая несмещенной дисперсией:
𝒏
𝟏
∗
𝟐
𝟐
𝝈 =𝒔 =
𝑫𝑿 =
𝒏−𝟏
𝒏−𝟏
𝒏
𝟐
(𝒙𝒊 − 𝒙)
𝒊=𝟏
(4.13)
Иногда в статистических расчетах важно не только найти оценку параметра, но и
охарактеризовать ее точность.
Для этого вводится понятие об
параметра.
Доверительным интервалом параметра 𝜽 называется интервал (𝜽𝟏 ,
истинное значение 𝜽 с заданной вероятностью
𝜽𝟐 ), содержащий
𝒑 = 𝟏—𝜶:
𝑷 𝜽𝟏 < 𝜽 < 𝜽𝟐 = 𝟏 − 𝜶
Число 𝒑 называется доверительной вероятностью, или надежностью оценки, и
принимается близким к единице: 𝟎, 𝟗; 𝟎, 𝟗𝟓; 𝟎, 𝟗𝟗.
Значение 𝜶 называется уровнем значимости.
(4.14)
Используя соотношения (4.12), (4.14), а также (3.17), для доверительного интервала
математического ожидания нормально распределенной генеральной совокупности при
известной дисперсии 𝝈
𝟐 можно получить следующее соотношение:
𝝈
𝒙−
𝒛𝟏−𝜶
𝒏
𝟐
𝝈
<𝝁<𝒙+
𝒛𝟏−𝜶
𝒏
𝟐
(4.15)
𝒛 - квантиль нормального распределения порядка 𝟏 − 𝜶 𝟐, определяемая по таблице.
При неизвестной дисперсии генеральной совокупности формула для доверительного
интервала математического ожидания нормально распределенной совокупности примет
вид:
𝒔
𝒙−
𝒕𝟏−𝜶
𝒏
𝟐
𝒔
𝒏−𝟏 <𝝁<𝒙+
𝒕𝟏−𝜶
𝒏
𝟐
𝒏−𝟏
(4.16)
где 𝒔 — квадратный корень из несмещенной дисперсии (4.13);
𝒕𝟏−𝜶
𝟐
𝒏 − 𝟏 - квантиль распределения Стьюдента с 𝒏 − 𝟏 степенью свободы
порядка 𝟏 − 𝜶 𝟐, определяемая по таблице.
По аналогии может быть получена формула для расчета доверительного интервала
дисперсии нормально распределенной генеральной совокупности при неизвестном
математическом ожидании:
𝟐
𝒏𝒔
𝝌𝟐 𝟏−𝜶 𝟐 (𝒏 − 𝟏)
𝟐
<𝝈 <
𝟐
𝒏𝒔
(4.17)
𝝌𝟐 𝜶 𝟐 (𝒏 − 𝟏)
где 𝝌𝟐 𝜶 𝟐 (𝒏 − 𝟏) - квантиль распределения хи-квадрата с 𝒏 − 𝟏 степенью свободы
порядка 𝜶 𝟐, определяемая по таблице.
Задача 2
Найти 95%-й доверительный интервал для математическою ожидания твердости
сплава (в условных единицах), если по результатам измерений получены следующие
значения:
14,2; 14,8; 14,0; 14,7; 13,9; 14,8; 15,1; 15,0; 14,5.
Решение
Объем выборки 𝒏 — 𝟗.
Выборочное среднее: 𝒙 =
𝟏𝟒,𝟐+𝟏𝟒,𝟖+⋯+𝟏𝟒,𝟓
𝟗
= 𝟏𝟒, 𝟓𝟔
Выборочная дисперсия:
𝑫𝒙
∗
(𝟏𝟒, 𝟐𝟐 + 𝟏𝟒, 𝟖𝟐 + … + 𝟏𝟒, 𝟓𝟐)
=
− 𝟏𝟒, 𝟓𝟔𝟐 = 𝟎, 𝟏𝟕
𝟗
Несмещенная дисперсия:
𝒔𝟐
𝟗 ∙ 𝟎, 𝟏𝟕
=
= 𝟎, 𝟏𝟗;
𝟖
𝒔 = 𝟎, 𝟒𝟑
доверительная вероятность: 𝒑 = 𝟎, 𝟗𝟓;
уровень значимости: 𝜶 = 𝟎, 𝟎𝟓; 𝟏 — 𝜶/𝟐 = 𝟎, 𝟗𝟕𝟓;
квантиль распределения Стьюдента: 𝒕𝟎
Тогда из (4.15): 𝟏𝟒, 𝟓𝟔
, 𝟗𝟕𝟓
(𝟖) = 𝟐, 𝟑𝟎𝟔 (по таблице).
− 𝟎, 𝟑𝟑 < 𝝁 < 𝟏𝟒, 𝟓𝟔 + 𝟎, 𝟑𝟑.
С вероятностью 0,95 математическое ожидание твердости сплава лежит в пределах от
𝟏𝟒, 𝟐𝟑 до 14,89.
4. Средства и
методы
описательной
статистики
Для удобства использования
информация о наблюдениях
должна быть упорядочена в
соответствии принятыми в
статистике принципами.
Методы статистического
описания по своей природе – не
что иное, как удобные способы
такого изложения. В качестве
основных средств описания
информации наиболее широко
используются графики и таблицы.
Графики
Преимущества
Графическое
представление данных
наблюдения является
наиболее наглядным и
удобным для обобщения,
что во многих случаях без
дальнейшего анализа
позволяет сделать
необходимые выводы или
определить явные причины
необычного поведения или
распределения данных.
Графические методы
описания весьма
чувствительны к
необычному поведению
данных, которые не просто
выявить при
количественном анализе.
Графические средства отображения наблюдений
столбчатые графики,
круговые диаграммы,
полигоны,
ленточные графики,
z- образные графики,
временные ряды,
карты сравнения,
контрольные карты,
графики накопленных частот (огивы),
диаграммы рассеяния (корреляционные поля),
многомерные графики и др.
Большинство из перечисленных средств широко применяется на предприятиях для
выявления отклонений, дефектов и причин несоответствий при обеспечении качества
продукции и процессов. Как правило, поиски причин несоответствий требуют
использования обширной информации, которая регистрируется как в форме графиков,
так и в виде таблиц.
При этом, учитывая системный характер работ по выявлению некачественной продукции,
на многих предприятиях разработаны типовые бланки для заполнения информации о
наблюдениях.
Такой форме регистрации данных отвечает контрольный листок.
- бумажный бланк, на котором заранее
напечатаны контролируемые параметры, с тем, чтобы можно было
легко и точно записать данные наблюдений или измерений.
Его назначение имеет две цели:
1. облегчить процесс сбора данных;
2. упорядочить их для последующей обработки
Рассмотрим некоторые типы контрольных листков в зависимости от назначения сбора
информации.
Контрольный листок для регистрации видов дефектов
Каждый раз, когда рабочий или
контролер обнаруживает дефект,
он делает пометку (штрих) на
бланке. На том же бланке в конце
рабочего дня фиксируются
итоговые данные по количеству
каждого типа дефектов.
НЕДОСТАТОК -
невозможность проведения расслоения данных.
Это недостаток можно компенсировать заполнением контрольного листка причин дефектов.
Контрольный листок для регистрации причин дефектов
Листок выполнен таким
образом, чтобы из него можно
было выбрать необходимую
информацию о дефектах,
допущенных не только по вине
рабочего или по причине
неправильной наладки станка,
но и определить появление
брака, вызванное усталостью
рабочего во второй половине
дня или изменением условий
работы. Очевидно, что анализ
причин дефектов при такой
регистрации данных
значительно облегчается.
Контрольный листок локализации дефектов
Позволяет оценить качество
отливки на наличие раковин
как вдоль оси заготовки, так
и по длине ее наружной и
внутренней поверхностей.
Такого типа контрольные
листки полезны для
диагноза процесса,
поскольку причины
дефектов часто можно
найти, только исследуя
места их возникновения.
Контрольный листок для
регистрации распределения измеряемого параметра
Позволяет выявить изменения в размерах детали после проведения механической
обработки.
Как правило,
такие листки
заполняются для
анализа
стабильности
технологического
процесса путем
построения
гистограмм.
В рассмотренных контрольных листках встречается все разнообразие регистрации
данных в виде таблиц и графиков.
На практике применение графиков для регистрации информации считается
предпочтительным, так как по ним легко оценить состояние процесса не только на данный
момент, но и спрогнозировать более отдаленный результат по тенденции процесса,
которую можно в нем обнаружить.
Такие графики называются временными рядами.
Такой вид регистрации данных широко применяется на производстве для проведения
анализа стабильности технологических процессов.
Очень удобны для анализа столбчатые графики, которые наглядно характеризуют
приоритеты тех или иных факторов при оценке какого-либо события. На рис. по высоте
столбиков легко определить главные стимулы покупки товара.
Еще более красноречив столбчатый график причин потерь клиентов фирмы «Ксерокс».
Эти графики позволяют сравнить эффективность действия разных факторов на один
показатель.
Частным случаем столбчатого графика является гистограмма распределения,
которая применяется для регистрации распределения какого-то показателя (частоты) от
одного фактора (коэффициент деформации).
Гистограммы
являются одним из
наиболее
эффективных средств
для оценки
вариабельности
технологической
системы.
Представляют собой кривые накопленных частот. На таком графике по оси ординат (Y)
откладывают либо общее количество, либо процент всех наблюдений, в которых значение
некоторой величины не превышает данного значения из интервала возможных
результатов.
По оси ординат (Y) откладывают
накопленные частоты.
Поскольку частоты не могут
принимать отрицательных значений,
кривые накопленных частот являются
монотонно неубывающими. Такой
кривой описывают вероятность
распределения параметра.
Большой популярностью, особенно в отчетной документации, пользуются круговые
графики. Ими выражают соотношение составляющих какого-либо целого параметра и
всего параметра в целом.
Например, соотношение отпускной цены
отдельно по ее составляющим и полной
отпускной ценой.
Глядя на график, можно сразу оценить
наиболее значимые составляющие цены.
Такие графики удобно использовать при
решении проблемы повышения
конкурентоспособности изделия за счет
снижения затрат по отдельным
составляющим в себестоимости продукции.
Применяется, как и круговой, для наглядного представления соотношения составляющих
какого-либо параметра, но вместе с этим он одновременно отражает изменение этих
составляющих во времени.
На рис. приведен пример ленточного графика соотношения сумм выручки от продажи по
отдельным видам изделий в порядке убывания их вклада в выручку и их изменения по
годам.
Доля выручки от продажи изделия С из года в год увеличивается, а доля выручки изделий
А и В – уменьшается.
Учитывая, что количество прибыльных изделий со временем снижается, то можно сделать
вывод о целесообразности разработки новых видов изделий.
Применяется для оценки общей тенденции при
регистрации данных по месяцам (объем сбыта,
объем производства и т.д.).
Z-образный график особенно нагляден при
отражении динамики изменения числа
дефектных изделий и их суммарного числа
относительно прошедших периодов, для
оценки характера изменения себестоимости
продукции и других случаев.
График строится следующим образом
откладываются
значения
параметра
(например,
объем выручки)
по месяцам (за
период одного
года)
• кривая 1
- вычисляется
кумулятивная
сумма за каждый
месяц, и
результаты
наносятся на
график
- вычисляются
итоговые
значения
параметра,
изменяющиеся
от месяца к
месяцу
(меняющийся
итог), которые
наносятся на
график . За
меняющийся итог
принимается
значение
параметра за год,
предшествующий
данному месяцу
• кривая 2
• кривая 3
Используются в виде графиков хода технологического процесса, т.е. отражают динамику процесса.
Контрольные карты сегодня являются наиболее распространенным средством описательной
статистики.
Являются самым удобным графическим отображением характера зависимости двух или
более величин.
В статистической
литературе этот график
часто называют
корреляционным
полем.
Таблицы
Как правило, наблюдаемая информация фиксируется как в графической,
так и в табличной форме. Табличная форма регистрации данных удобна для
проведения группировки экспериментальных данных. Такие таблицы называются
Таблицы
статистическими.
простые
сложные
Таблицы, применяемые при альтернативной группировке, когда одна группа данных
противопоставляется другой. Например, количество брака при изготовлении одинакового
количества деталей, допущенного разными рабочими, работающими на одном и том же станке
до обеда и после обеда в разные дни недели.
Из таблицы видно, что при одинаковом дневном качестве работы рабочий А с более высоким
качеством работает после обеда, а рабочий Б – до обеда, что, вероятно, вызвано их
психологическими особенностями.
Простые таблицы рекомендуется использовать, когда регистрируются численные
показатели, относящиеся к одному классу объектов.
Усложнение таблиц происходит за счет возрастания объема и степени
дифференцирования представленной информации. К сложным таблицам относятся
многопольные таблицы, в которых данные наблюдений в дальнейшем используются
для выяснения причинно-следственных отношений между варьирующими признаками.
Особую форму группировки данных представляют статистические ряды, или
численные значения показателя, расположенного в определенном порядке.
Статистические ряды
вариационные
атрибутивные,
ряды регрессии
ряды
ранжированных
значений признаков
ряды накопленных
частот
Например, вариационным рядом распределения называют двойной ряд чисел,
показывающий, каким образом числовые значения признака (𝒙) связаны с их
повторяемостью (𝒇) в данной выборке.
Описательная статистика имеет важное значение в
процессах статистического управления качеством не
только как банк данных по наблюдаемым и измеряемым
явлениям и событиям, но и как предварительный этап
анализа причин, вызывающих несоответствия и
отклонения параметров от нормативной документации.
В конечном счете, именно эти причины приводят к
отбраковке продукции и повышению затрат на ее
производство.
Спасибо за
внимание