Основные понятия математической статистики
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
государственное бюджетное образовательное учреждение высшего
профессионального образования «Тюменский государственный медицинский университет»
Министерства здравоохранения Российской Федерации
(ГБОУ ВПО Тюменский ГМУ Минздрава России)
Кафедра медицинской и биологической физики с курсом информатики
Лекция для студентов 1 курса
по специальности 31.05.02 «ПЕДИАТРИЯ»
Выполнила: доцент, к.б.н. Цокова Т.Н.
Статистическое распределение выборки и её основные числовые характеристики.
Вопросы:
1. Основные понятия математической статистики.
2. Основные числовые характеристики выборки.
3. Нормальное распределение. Функция Гаусса.
4. Погрешности измерений и их оценки.
1.Основные понятия мат. статистики.
Выборочный метод – один из основных методов математической статистики. Его
сущность заключается в том, что изучение большой совокупности объектов относительно
некоторого количественного признака Х производится по сравнительно небольшому
числу случайно отобранных объектов.
Генеральной совокупностью называется множество всех изучаемых объектов, из
которых производится выборка.
Выборочной совокупностью (выборкой) называется множество объектов, отобранных для
изучения из генеральной совокупности.
Выборка должна быть организована случайным образом, чтобы правильно
представлять генеральную совокупность.
Объемом совокупности называется количество объектов в совокупности. Объем
выборки n, как правило, значительно меньше объема N генеральной совокупности : n N.
Данные выборки записываются в виде таблицы, называемой статистическим
распределением выборки:
xi
ni
х1
n1
х2
n2
…
…
хk
nk
В первой строке перечислены все наблюдаемые значения признака Х в порядке их
возрастания (или убывания). Они называются вариантами xi ( i = 1, 2, 3, …, k). Во второй
строке указаны частоты ni соответствующих вариант xi . Они показывают, сколько раз
наблюдалось каждое значение признака Х.
Очевидно, что сумма всех частот ni равна объему выборки n:
2. Основные числовые характеристики выборки
Существуют точечные и интервальные оценки параметров распределения.
1
1. Средняя выборочная (среднее взвешенное значение признака в выборке):
к
xв
хi ni
i 1
n
1
( х1 n1 х2 n 2 ... хk n k ).
n
2. Дисперсия выборочная . Характеризует разброс (рассеяние) значений вариант
от выборочного среднего значения
xв
xi
и измеряется в квадратных единицах признака Х:
1 k
1
Dв ( хi xв ) 2 ni ( х1 xв ) 2 n1 ( х2 xв ) 2 n2 ... ( хк xв ) 2 nk .
n i 1
n
Для вычисления дисперсии используется также другая, часто более удобная
формула
D в x в2 ( x в ) 2 ,
где
1 k
x в x i ni ;
n i 1
1 k 2
x x i ni
n i 1
.
2
в
3. Среднее квадратическое отклонение выборки – характеристика рассеяния
значений признака в выборке от среднего выборочного в единицах признака Х:
в Dв
.
С помощью найденных выборочных характеристик
соответствующие генеральные характеристики
xв, Dв, в
x
– генеральная средняя;
D – генеральная дисперсия;
– генеральное среднее квадратическое отклонение.
Оценки имеют следующий вид (n<30):
x xв
;
Основные характеристики выборки
2
оцениваются
x в , Dв , в
лишь приближенно характеризуют генеральную совокупность и
могут оказаться далекими от соответствующих характеристик генеральной совокупности:
x среднее , D, . Поэтому для них используют интервальные оценки, когда неизвестная
характеристика заключена в некотором интервале с заданной надежностью
(вероятностью) p.
Доверительным интервалом на основе точечной оценки
φ* наз. интервал ( * - ,
* + ), который покрывает параметр φ с заданной надежностью P
P(| (φ * - φ | < ) =p
Значения надежности берутся, как правило, высокими: 0,9; 0,95; 0,99 или 0,999, что
соответствует 90; 95; 99 или 99,9%.
Интервальные
сл.величины:
оценки
математического
ожидания
для
нормально
распределённой
1) при n≤30 (9):
M (X ) X
t n, p S
n ,
где t n-1,p -коэффициент Стьюдента (таблица),
p- доверительная вероятность, равная 0,95.
2) при n>30 (10):
M ( X ) X 1,96
n;
Для определения вида распределения строят гистограмму.
Определение. Гистограмма – графическое представление частотного распределения
количественной случайной величины, сгруппированной в классы равной ширины
площадями прямоугольников.
Высоты каждого прямоугольника пропорциональны частотам классов, а ширина
ширина интервала, одинаковая для всех.
3
–
2. Нормальное распределение (распределение Гаусса).
4
f ( x)
1
2
e
( x x )2
2 2
функция Гаусса.
Это симметричная, быстро затухающая функция. Имеет куполообразную форму с
вершиной при x x ,
где x – определяет точку максимума и ось симметрии, расстояние от этой оси до точки перегиба ( M(X) = x , D(X) = ).
Особенности нормального распределения
а) Наиболее вероятны значения x, близкие к ожидаемому среднему значению
б) Отклонения от среднего значения x в обе стороны равновероятны.
в) Большие отклонения x от среднего значения x маловероятны.
x
Площадь под кривой Гаусса всегда равна единице, что соответствует полной
вероятности.
г) Поэтому при уменьшении увеличивается вероятность значений, близких к
рассеяние уменьшается, кривая Гаусса сжимается.
x,
график кривой Гаусса становится более расплывчатым, что
При увеличении
говорит об увеличении рассеяния.
Это распределение играет фундаментальную роль в теории ошибок измерений.
Согласно центральной предельной теореме закон распределения суммы большого
числа независимых СВ, влияние каждого из которых на всю сумму ничтожно мало,
близок к нормальному.
Доказана А.М.Ляпуновым (1857 – 1918) .
5
В случае x = 0, = 1 функция
Гаусса называется
плотностью нормированного и
( x)
центрированного распределения (локальная функция Лапласа)
вычисляется с помощью таблиц.
1
2
e x
2
/2
и
Правило «трех сигм».
P( X X
3 ) 0,9973 (99 ,7 %).
Этот результат называют правилом «трех сигм»:
почти достоверно (на 99,7%), что значения нормально распределенной случайной
x
величины отличаются от своего среднего значения
менее, чем на 3, то есть
практически все значения нормально распределенной случайной величины Х попадают в интервал: (
x - 3; x +3).
см. рис. 4.
4. Погрешности измерений и их оценки.
Классификация погрешностей
По форме представления
Абсолютная погрешность — ΔX является оценкой абсолютной ошибки измерения.
Величина этой погрешности зависит от способа её вычисления, который, в свою
очередь, определяется распределением случайной величины
Xmeas . При этом
неравенство:
ΔX > | Xmeas − Xtrue | ,
где Xtrue — истинное значение , а Xmeas — измеренное значение, должно выполняться с
некоторой вероятностью близкой к 1.
6
Если случайная величина Xmeas распределена по нормальному закону , то, обычно, за
абсолютную погрешность принимают её среднеквадратичное отклонение .
Абсолютная погрешность измеряется в тех же единицах измерения, что и сама величина.
Относительная погрешность — погрешность измерения, выраженная отношением
абсолютной погрешности измерения к действительному или измеренному значению
измеряемой величины:
,
.
Относительная погрешность является безразмерной величиной, либо измеряется в
процентах .
Приведённая погрешность — погрешность, выраженная отношением абсолютной
погрешности средства измерений к условно принятому значению величины,
постоянному во всем диапазоне измерений или в части диапазона. Вычисляется по
формуле
,*100 %
где Xn — нормирующее значение, которое зависит от типа шкалы измерительного
прибора и определяется по его градуировке:
— если шкала прибора односторонняя, то есть нижний предел измерений равен нулю, то
Xn определяется равным верхнему пределу измерений;
— если шкала прибора двухсторонняя, то нормирующее значение равно ширине
диапазона измерений прибора.
Приведённая
процентах .
погрешность является
безразмерной
величиной,
либо
измеряется
в
По причине возникновения
Инструментальные / приборные погрешности — погрешности, которые
определяются погрешностями применяемых средств измерений и вызываются
градуировки шкалы,
несовершенством принципа действия, неточностью
ненаглядностью прибора.
Методические погрешности — погрешности, обусловленные несовершенством
метода, а также упрощениями, положенными в основу методики.
Субъективные / операторные / личные погрешности — погрешности,
обусловленные степенью внимательности, сосредоточенности, подготовленности и
другими качествами оператора.
По способу измерения
7
Погрешность прямых измерений - вычисляются по формуле
где : t = Sxαs ; Sx — Средняя квадратическая погрешность среднего арифметического, а αs
— коэффициент Стьюдента , а А — число, численно равное половине цены деления
измерительного прибора.
Погрешность
косвенных
воспроизводимых
измерений
вычисляемой (не измеряемой непосредственно) величины:
—
погрешность
Если F = F(x1,x2...xn), где xi — непосредственно измеряемые независимые величины,
имеющие погрешность Δxi, тогда:
Погрешность косвенных невоспроизводимых измерений
- вычисляется по
принципу прямой погрешности , но вместо xi ставится значение полученное в
процессе расчётов.
Литература:
1.
8
Морозов, Ю.В. Основы высшей математики и статистики: учебник / Ю.В. Морозов.
Медицина, 2001
– М.: