Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ЛЕКЦИЯ 6
Непрерывные случайные величины
§ 6.1. Определение непрерывной случайной величины
Понятие закона распределения имеет смысл только в том случае, когда
случайная величина принимает конечное или счётное множество значений.
Если же значения случайной величины представляют «сплошное» множество точек на числовой прямой, то это понятие теряет свой смысл.
В то же время определение функции распределения F (x) как более общее понятие остаётся в силе.
Для того, чтобы ввести с помощью функции распределения новый класс
случайных величин, понадобится два понятия из мира математического
анализа:
Определение 6.1. Функция f (x) называется кусочно непрерывной на некотором множестве, если она непрерывна внутри множества за исключением конечного числа точек, а на границах множества
имеет односторонние пределы.
Определение 6.2. Функция f (x) называется кусочно дифференцируемой на некотором множестве, если её производная на этом
множестве имеет конечное число точек разрыва.
Так, например, функция f (x) = |x| является кусочно дифференцируемой функцией на отрезке [−1; 1].
y
y
1
1
x
−1
x
−1
1
1
−1
Рис. 6.1
Рис. 6.2
Она непрерывна на отрезке [0; 1] (рис. 6.1), а её производная
−1, если − 1 ≤ x < 0,
f (x) =
1, если
0 < x ≤ 1.
1
является кусочно непрерывной, имея разрыв первого рода в точке x = 0
(рис. 6.2).
1
В точках x = −1 и x = 1 речь идёт о соответствующих односторонних производных.
1
Зная о том, что представляют собой кусочно непрерывные и конечно
дифференцируемые функции, можно ввести следующее
Определение 6.3. Случайная величина X называется непрерывной, если её функция распределения F (x) является непрерывной, кусочно дифференцируемой функцией, производная которой кусочно непрерывна в области определения.
Восстановим сформулированные в предыдущей лекции свойства
функции распределения:
Свойство 10.1. ∀ x 0 ≤ F (x) ≤ 1.
Свойство 10.2. ∀ x1 , x2 : x1 < x2 ⇒ F (x1 ) ≤ F (x1 ).
Свойство 10.3. lim F (x) = 0.
x→−∞
Свойство 10.4. lim F (x) = 1.
x→∞
Эти свойства справедливы и для функции распределения непрерывной случайной величины.
Рассмотрим два следствия, вытекающие из этих свойств.
Следствие 6.1. Вероятность того, что случайная величина X примет значение из промежутка [a; b) равна приращению функции распределения на этом промежутке:
P (a ≤ X < b) = F (b) − F (a).
(6.1)
Это следствие вытекает из доказательства свойства ??, из которого следует, что
P (x1 ≤ X < x2 ) = F (x2 ) − F (x1 ).
(6.2)
Если в равенстве 6.2обозначить x1 = a, а x2 = b, то получится требуемое
утверждение.
Это следствие справедливо и для дискретных случайных величин. Но
если случайная величина является непрерывной, то оказывается, что
P (a ≤ X < b) = P (a < X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b).
(6.3)
Эти равенства вытекают из следующего следствия:
Следствие 6.2. Вероятность того, что непрерывная случайная величина X примет некоторое одно фиксированное значение x, равна нулю,
то есть
P (X = x) = 0.
Если предположить, что x − некоторое фиксированное число, совпадающее с x1 в формуле (6.2): x1 = x, а x2 = x + ∆x, то
P (x ≤ X < x + ∆x) = F (x + ∆x) − F (x).
2
Так как X − непрерывная случайная величина, то функция F (x) − непрерывная функция. Поэтому lim F (x + ∆x) = F (x). Следовательно,
∆x→0
P (X = x) = lim P (x ≤ X < x + ∆x) = 0.
∆x→0
Из равенств (6.3) вытекает что вероятность, того, что непрерывная случайная величины принимает значения из данного промежутка, не зависит
от принадлежности концов промежутка самому промежутку.
Замечание 6.1. Следует заметить, что если P (X = x) = 0, то это совсем не означает, что событие, при котором X = x, является невозможным
событием.Так как непрерывная случайная X в результате опыта обязательно принимает какое-нибудь возможное значение, то этим значением может
оказаться и x.
Задача 6.1. Случайная величина X задана функцией распределения
при
x ≤ 1,
0,
2
(x − 1) , при 1 < x ≤ 2,
F (x) =
1,
при
x > 2.
1) Построить график функции F (x);
2) найти вероятности того, что в результате опыта случайная величина X
примет значения, принадлежащие:
а) интервалу (1, 2; 1, 6);
б) отрезку [1, 7; 2, 3];
в) лучу {x : x > 1, 5};
г) лучу {x : x ≤ 1, 3}.
Решение. 1) Построим требуемый график (рис. 6.3).
F(x)
1
x
Рис. 6.3
1
2
2) С помощью формулы (6.1) вычислим требуемые вероятности:
а) P (1, 2 < X < 1, 6) = F (1, 6) − F (1, 2).
Так как 1, 2 ∈ (1; 2), то F (1, 2) = (1, 2 − 1)2 , то есть F (1, 2) = 0, 04.
Аналогично, F (1, 6) = (1, 6 − 1)2 ⇒ F (1, 6) = 0, 36.
Поэтому P (1, 2 < X < 1, 6) = 0, 36 − 0, 04 ⇒ P (1, 2 < X < 1, 6) = 0, 32.
б) Согласно формуле P (1, 7 ≤ X ≤ 2, 3) = F (2, 3) − F (1, 7).
Так как 1, 7 ∈ (1; 2), то F (1, 7) = (1, 7 − 1)2 , то есть F (1, 7) = 0, 49.
В силу того, что 2, 3 > 2, F (2, 3) = 1.
3
Поэтому P (1, 7 ≤ X ≤ 2, 3) = 1 − 0, 49 ⇒ P (1, 7 ≤ X ≤ 2, 3) = 0, 51.
в) Представим луч {x : x > 1, 5} в виде бесконечного интервала (1, 5; ∞).
Тогда, согласно формуле P (1, 5 < X < ∞) = F (∞) − F (1, 5).
Так как 1, 5 ∈ (1; 2), то F (1, 5) = (1, 5 − 1)2 , то есть F (1, 5) = 0, 25.
Так как F (∞) = 1,
то P (1, 5 < X < ∞) = 1 − 0, 25 ⇒ P (X > 1, 5) = 0, 75.
г) Как и в предыдущем задании, представим луч {x : x ≤ 1, 3} в виде
бесконечного множества (−∞; 1, 3].
Тогда, согласно той же формуле P (−∞ < X ≤ 1, 3) = F (1, 3) − F (−∞).
Так как 1, 3 ∈ (1; 2), то F (1, 3) = (1, 3 − 1)2 , то есть F (1, 3) = 0, 09.
Известно, что F (−∞) = 0.
Поэтому P (−∞ < X ≤ 1, 3) = 0, 09 − 0 ⇒ P (X ≤ 1, 3) = 0, 09.
Объединяя результаты а)-г), получаем
P (1, 2 < X < 1, 6) = 0, 32; P (1, 7 ≤ X ≤ 2, 3) = 0, 51;
P (X > 1, 5) = 0, 75;
P (X ≤ 1, 3) = 0, 09.
В начале лекции непрерывная случайная величина X была определена
с помощью функции распределения F (x). Этот способ задания не является
единственным.
§ 6.2. Плотность распределения вероятностей непрерывной
случайной величины
В качестве закона распределения возможных значений случайной величины, имеющего смысл только для непрерывных случайных величин,
введём понятие плотности распределения вероятностей.
Определение 6.4. Плотностью распределения вероятностей
непрерывной случайной величины называется первая производная её
функции распределения, то есть
f (x) = F (x).
Замечание 6.2. В силу определения плотность распределения f (x)
иногда называют дифференциальной функцией, а функцию распределения
F (x) − интегральной функцией (так как она является для функции плотности первообразной функцией)1 .
Замечание 6.3. Название плотность вероятности можно объяснить
следующим образом: Предположим, что отрезок [x; x + ∆x] является бесконечно малым. Из формулы (6.1) следует, что
P (x ≤ X ≤ x + ∆x) = F (x + ∆x) − F (x).
1
Из определения становится ясно, почему функция распределения должна быть дифференцируемой
в области определения.
4
С помощью формулы Лагранжа имеем, что
F (x + ∆x) − F (x) ≈ F (x)∆x = f (x)∆x.
Поэтому,
P (x ≤ X ≤ x + ∆x) ≈ f (x)∆x.
Следовательно, вероятность того, что случайная величина принимает
значение, принадлежащее отрезку [x; x + ∆x], приближённо равна произведению плотности вероятности в точке x на длину интервала ∆x.
С точки зрения механики плотность вероятности можно определить
так: представьте, что вероятность того, что случайная величина принимает
значения на участке [x; x + ∆x) есть некоторая масса, равная 1.
При этом эта масса распределена произвольным образом на данном
участке1 . Тогда средняя плотность, с которой распределена эта масса на
участке, будет равна отношению
P (x ≤ X ≤ x + ∆x)
.
∆x
А так как (см. 6.1)
P (x ≤ X ≤ x + ∆x) = F (x + ∆x) − F (x),
то средняя плотность равна
F (x + ∆x) − F (x))
.
∆x
«Заставив» ∆x → 0, получаем, что
F (x + ∆x) − F (x)
= F 0 (x) = f (x).
lim
∆x→0
∆x
Из этой аналогии массы и вероятности вытекает механический смысл
плотности вероятности.
6.2.1. Свойства плотности распределения
Так как плотность вероятности является производной неубывающей
функции F (x), то она обладает следующим свойством.
Свойство 6.1. Плотность распределения неотрицательная функция,
то есть
∀x ∈ (−∞; ∞) f (x) ≥ 0.
Поскольку F (x) является первообразной функцией для функции плот1
Если мы распределим массу дискретным образом, то сумма вероятностей, которые будут соответствовать событиям, при которых случайная величина принимает значения именно в этих точках, будет
равна 1. Поэтому и выбранная масса равна 1.
5
ности f (x) на любом отрезке [a; b], то согласно формуле Ньютона-Лейбница
Zb
f (x)dx = F (b) − F (a).
a
Поэтому в силу (6.1) имеем
Zb
P (a ≤ X ≤ b) =
f (x)dx.
(6.4)
a
С точки зрения геометрии вероятность, того,
y
что a ≤ X ≤ b, совпадает с площадью криволинейной трапеции, ограниченной графиком
функции плотности y = f (x), осью OX и прямыми x = a и x = b.
a c
Если взять a = −∞, а b = ∞, то получим
Рис. 6.4
достоверное событие X ∈ (−∞; ∞).
Зная, что его вероятность равна единице, получаем
Z∞
Свойство 6.2.
f (x)dx = 1.
y = f (x)
x
b
−∞
Задача 6.2. Функция плотности непрерывной случайной величины X
определена на всей числовой оси равенством
C
.
f (x) =
1 + 9x2
Определите значение параметра C.
Решение. Согласно свойству 6.2
Z∞
Cdx
= 1.
1 + 9x2
−∞
Используя свойство однородности несобственного интеграла вынесем константу C за знак интеграла
Z∞
Z∞
Cdx
dx
=
C
.
1 + 9x2
1 + 9x2
−∞
−∞
Далее вычислим значение интеграла
Zb
Z∞
b
dx
1
dx
= lim
= lim
arctg 3x
=
a
1 + 9x2 a → −∞ 1 + 9x2 a → −∞ 3
−∞
b→
∞a
b→
1
∞
1 π
π π
=
lim arctg 3b − lim arctg 3a =
− −
= .
b→∞
3 b→∞
3 2
2
3
6
Следовательно, = C ·
π
= 1.
3
3
.
π
Если в формуле (6.4) взять a = −∞, а b = x, то получим представление
функции распределения в интегральной форме1
Таким образом, значение параметра C =
Zx
F (x) =
f (t)dt.
(6.5)
−∞
Задача 6.3. Дана функция плотности
при
x ≤ 2,
0,
f (x) =
2x − 4, при 2 < x ≤ 3,
0,
при
x > 3.
Определите функцию распределения F (x).
Решение. Так как область определения функции плотности является
объединением трёх интервалов
(−∞; ∞) = (−∞; 2] ∪ (2; 3] ∪ (3; ∞),
то придётся верхнему пределу x из интегрального представления функции
F (x) (6.5) «прогуляться» по всем этим интервалам.
1. Предположим что x ∈ (−∞; 2). В этом случае f (x) = 0. Тогда
Zx
Zx
f (t)dt =
0dt = 0.
−∞
−∞
2
2. Допустим что x ∈ (2; 3]. Следовательно ,
x
Zx
Z2
Zx
f (t)dt =
0dt + (2t − 4)dt = 0 + (t2 − 4t) =
−∞
−∞
2
2
2
2
2
2
= x − 4x − (2 − 4 · 2) = x − 4x + 4 = (x − 2) .
3. Пусть x ∈ (3; ∞; ). Поэтому
Zx
Z2
Z3
Z∞
f (t)dt =
0dt + (2t − 4)dt + 0dt = 0 + 1 + 0 = 1.
−∞
−∞
2
3
Объединяя результаты пунктов 1.-3., получаем представление интегральной функции распределения3
1
Переменная интегрирования x обозначена через t, чтобы можно было отличить её и верхний предел
интегрирования.
2
Второй интеграл можно было вычислить проще, если вынести общий множитель 2:
Zx
Zx
(t − 2)2 x
(2t − 4)dt = 2 (t − 2)dt = 2 ·
= (x − 2)2 .
2
2
2
3
2
С точки зрения определения интегральной функции распределения непрерывной случайной ве-
7
при
x ≤ 2,
0,
2
F (x) =
(x − 2) , при 2 < x ≤ 3,
1,
при
x > 3.
§ 6.3. Числовые характеристики непрерывной случайной
величины
По аналогии с дискретными случайными величинами введём понятия
числовых характеристик непрерывных случайных величин.
6.3.1. Математическое ожидание непрерывной случайной
величины
Предположим, что непрерывная случайная величина X задана с помощью плотности распределения f (x). Допустим также, что все её возможные
значения лежат на отрезке [a; b]. По аналогии с определением интеграла
разобъём отрезок на n отрезков, имеющих длины ∆x1 , ∆x2 , . . . , ∆xn . Выберем на каждом из интервалов произвольную точку x̄i , (i = 1, n). Далее,
пользуясь тем, что число отрезков конечно, определим по аналогии с математическим ожиданием дискретной случайной величины следующую сумму:
x̄1 P (a < X ≤ x1 ) + x̄2 P (x1 < X ≤ x2 ) + · · · + x̄n P (xn−1 < X ≤ xn ).
Из замечания 6.3 следует, что для каждого из выбранных интервалов вероятность
P (xi−1 < X ≤ xi ) ≈ f (xi−1 )∆xi , (i = 1, n).
Следовательно, сумму можно переписать в новом виде:
x̄1 f (a)∆x1 + x̄2 f (x1 )∆x2 + · · · + x̄n f (xn−1 )∆xn
или в компактном виде
n
X
x̄i f (xi−1 )∆xi .
i=1
Пусть λ = max{∆x1 , ∆x2 , . . . , ∆xn }. Если «заставить» λ стремиться к нуn
лю, то левые концы отрезков xi−1 → xi , а вместе с ними и x̄i → xi .
В результате получаем
lim
λ→0
n
X
Zb
xi f (xi )∆xi =
i=1
xf (x)dx.
a
личины не мешает убедиться в том, что полученная функция действительно непрерывна. Для этого
нужно вычислить односторонние пределы в точках x = 2 и x = 3. Попробуйте эту проверку выполнить
самостоятельно.
8
Из этого равенства и следует
Определение 6.5. Математическим ожиданием непрерывной
случайной величины X, возможные значения которой принадлежат
отрезку [a; b], называется определённый интеграл
Zb
M (X) =
xf (x)dx.
(6.6)
a
В том случае, когда возможные значения непрерывной случайной величины X заполняют всю числовую ось, математическое ожидание1
Z∞
M (X) =
xf (x)dx.
(6.7)
−∞
Определённое таким образом математическое ожидание непрерывной
случайной величины обладает теми же свойствами ??-??, что и математическое ожидание дискретной случайной величины (это объясняется тем,
что предельный переход сохраняет свойства линейности2 ).
Задача 6.4. Непрерывная случайная величина X задана своей функцией плотности
0,
если x ≤ 0,
f (x) =
−2x
2e , если x ≥ 0.
Определите математическое ожидание X.
Решение. Согласно формуле (6.7)
Z∞
Z0
Z∞
Zb
x · 2e−2x dx =
x · 0dx + x · 2e−2x dx = 0 + 2 lim xe−2x dx =
M (X) =
b→∞
−∞
−∞
b
Z
du = dx,
b
− 1 lim xe−2x − e−2x dx =
=
=
2
1
2 b→∞
dv = e−2x dx, v = − e−2x
2
b
1
1
1
=2 −
0 − − lim e−2x
= .
2
2 b→∞
2
u = x,
Следовательно, M (X) = 0, 5.
Замечание 6.4. К характеристикам положения случайной величины
кроме математического ожидания относятся мода и медиана.
1
Z∞
|x|f (x)dx.
При этом предполагается, что существует интеграл
−∞
2
То есть предел суммы функций равен сумме их пределов (если они существуют), и константу
можно выносить из под знака предела.
9
Определение 6.6. Модой Mo дискретной случайной величины
называется наиболее вероятное её значение.
Например, если дискретная случайная величина X принимает следующие значения
X = {3, 4, 4, 5, 6 7, 8, 9},
то её мода Mo = 4.
Определение 6.7. Модой Mo непрерывной случайной величины
называется её значение, при котором плотность распределения имеет
максимум.
Так на рисунке 6.4 Mo = c.
Определение 6.8. Медианой Me непрерывной случайной величины называется её значение, при котором имеет место равенство
P (X < Me ) = P (X > Me ).
(6.8)
Из определения 6.8 вытекает следствие о связи между медианой Me распределения непрерывной случайной величины и интегральной функцией её
распределения.
1
Следствие 6.3. F (Me ) = .
2
Истинность этого равенства вытекает из равенства (6.8).
Перепишем это равенство подробнее.
P (−∞ < X < Me ) = P (Me < X < ∞).
Из формулы (6.1) следует что
P (−∞ < X < Me ) = F (Me ), а P (Me < X < ∞) = 1 − F (Me ).
Подставляя правые части последних двух равенств в равенство (6.8),
получаем новое равенство
F (Me ) = 1 − F (Me ),
из которого и следует истинность следствия.
Замечание 6.5. Следует заметить, что это следствие можно получить
с помощью геометрии.
С точки зрения геометрии, медиана − это абцисса точки, в которой
площадь, ограниченная функцией плотности (или многоугольником распределения), делится пополам. А так как вся площадь, ограниченная функцией плотности (или многоугольником распределения) и осью абцисс равна
единице, то функция распределения в точке, соответствующей медиане,
равна
F (Me ) = P (X < Me ) = 0, 5.
На рисунке 6.4 медиана совпадает с модой, поэтому Me = c.
Задача 6.5. Непрерывная случайная величина X задана своей функцией плотности
10
если x ≤ 1,
0,
2
f (x) =
−6x + 18x − 12, если 1 < x < 2,
0,
если x ≥ 2.
Определите медиану распределения случайной величины X.
Решение. Аналогично решению задачи 6.3 построим функцию распределения заданной случайной
величины
если x ≤ 1,
0,
3
2
F (x) =
−2x + 9x − 12x + 5, если 1 < x < 2,
1,
если x ≥ 2.
Далее, используя следствие 6.3, составим уравнение
1
−2x3 + 9x2 − 12x + 5 = .
2
Умножив обе части на 2 и вычтя единицу из обеих частей, получим уравнение с целыми коэффициентами
4x3 − 18x2 + 24x − 9 = 0.
Из курса элементарной алгебры известно что если уравнение с целыми
коэфффициентами имеет рациональный корень, то числитель корня является делителем свободного члена, а знаменатель − делителем старшего
коэффициента. На интервале (1; 2) таким числом является x = 1, 5.
Подставляя его вместо x в уравнение
3
2
3
3
3
27 81
4·
− 18 ·
+ 24 · − 9 = − +
− 36 + 9 = 0,
2
2
2
2
2
убеждаемся в том, что это число является корнем составленного уравнения1 .
Следовательно, медиана распределения Me = 1, 5 .
Замечание 6.6. Следует заметить, что если бы мы построили график
функции плотности, то могли бы увидеть симметрично расположенную
параболу, координата вершины которой определяет медиану и моду распределения заданной функции.
6.3.2. Дисперсия непрерывной случайной величины
Дисперсия непрерывной случайной величины определяется точно также, как и дисперсия дискретной случайной величины.
Определение 6.9. Дисперсией непрерывной случайной величины называется математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
√
√
3− 3
3+ 3
Составленное уравнение имеет еще два корня:
и
. Но эти корни не могут быть
2
2
медианами распределения, так как плотность вероятности в соответствующих им точкам равна нулю.
1
11
Если возможные значения случайной величины X лежат на [a; b], то
Zb
D(X) =
(x − M (x))2 f (x)dx.
(6.9)
a
Если же возможные значения случайной величины X заполняют всю
числовую ось, то
Z∞
D(X) =
(x − M (x))2 f (x)dx.
(6.10)
−∞
Так как математическое ожидание непрерывной случайной величины
обладает теми же свойствами, что и для дискретной, то для вычисления
дисперсии используется формула (??)
D(X) = M X 2 − (M (X))2 ,
(6.11)
в которой
M X
2
Zb
=
x2 f (x)dx.
(6.12)
a
Естественно, что сохраняются и свойства дисперсии ??-??.
Точно также, как и в случае с дискретной случайной величиной определяется среднее квадратическое определение непрерывной случайной величины.
Определение 6.10. Средним квадратическим отклонением непрерывной случайной величины от её математического ожидания
называется квадратный корень из дисперсии этой величины.
p
(6.13)
σ(X) = D(X).
Задача 6.6. Случайная величина X задана функцией распределения
x ≤ 0,
0, при
3
F (x) =
x , при 0 < x ≤ 1,
1, при
x > 1.
1)
2)
3)
4)
5)
Найти функцию плотности f (x);
Построить график f (x);
найти математическое ожидание M (X);
найти дисперсию D(X);
найти среднее квадратическое отклонение σ(X).
12
Решение. 1) Согласно определению 6.4 f (x) = F (x). Поэтому
при
x ≤ 0,
0,
f (x) =
3x2 , при 0 < x ≤ 1,
0,
при
x > 1.
2) График функции плотности на рис. 6.5 имеет следующий вид.
f (x)
3
x
1
Рис. 6.5
3) Так как случайная величина X определена на всей числовой прямой, то
согласно формуле (6.7 её математическое ожидание
Z∞
M (X) =
Z0
x · 0dx +
xf (x)dx =
−∞
Z1
−∞
Z1
=0+3
x · 3x2 dx +
3
x3 dx + 0 = x4
4
1
Z∞
x · 0dx =
1
3
= (1 − 0) = 0, 75.
4
4) Перед тем, как вычислить дисперсию согласно формуле (??), найдём
M X
2
Z∞
=
x2 f (x)dx =
−∞
Z0
x2 · 0dx +
−∞
Z1
=0+3
Z1
x2 · 3x2 dx +
3
x4 dx + 0 = x5
5
1
Z∞
x2 · 0dx =
1
3
= (1 − 0) = 0, 6.
5
Так как M (X) = 0, 75, то его квадрат (M (X))2 = 0, 5625. Следовательно,
D(X) = 0, 6 − 0, 5625 ⇒ D(X) = 0, 0375.
5) Подставляя найденное значение дисперсии в формулу (6.13), найдём
среднее квадратическое отклонение
p
σ(X) = 0, 0375 ⇒ σ(X) = 0, 19.
Объединяя результаты 3)-5), получаем
13
M (X) = 0, 75; D(X) = 0, 0375; σ(X) = 0, 19.
Рассмотрим наиболее популярные в технических приложениях распределения вероятностей непрерывной случайной величины.
§ 6.4. Равномерное распределение
6.4.1. Определение и график функции плотности равномерного
распределения
Определение 6.11. Распределение вероятностей непрерывной случайной величины называется равномерным, если функция плотности вероятностей определяется следующим
образом
0,
если
x ≤ a,
1
f (x) =
, если a < x < b,
b−a
0,
если
x ≥ b.
График (рис. 6.6) функции плотности равномерного распределения выглядит следующим образом.
f (x)
1
b−a
x
a
b
Рис. 6.6
6.4.2. Интегральная функция равномерного распределения
Используя интегральное представление функции распределения (6.5),
аналогично решению задачи 6.3 построим функцию равномерного распределения непрерывной случайной величины X.
Область определения функции плотности является объединением трёх
интервалов
(−∞; ∞) = (−∞; a] ∪ (a; b) ∪ [(b; ∞),
1. Предположим что x ∈ (−∞; a]. В этом случае f (x) = 0. Тогда
Zx
Zx
f (t)dt =
0dt = 0.
−∞
−∞
2. Допустим что x ∈ (a; b). Следовательно,
x
Zx
Za
Zx
dt
t
x−a
f (t)dt =
0dt +
=0+
=
.
b−a
b−a
b−a
−∞
−∞
a
a
14
3. Пусть x ∈ [b; ∞; ). Поэтому
Zx
Za
Zb
f (t)dt =
0dt +
−∞
−∞
dt
+
b−a
a
Z∞
0dt = 0 + 1 + 0 = 1.
b
Объединяя результаты пунктов 1.-3., получаем представление интегральной функции равномерного распределения непрерывной случайной величины X 1
если
x ≤ a,
0,
x−a
, если a < x < b,
F (x) =
(6.14)
b
−
a
1,
если
x ≥ b.
Построим график (рис. 6.7) интегральной функции равномерного распределения.
F(x)
1
x
a
b
Рис. 6.7
Далее определим числовые характеристики равномерного распределения.
6.4.3. Математическое ожидание равномерного распределения
Так как график функции плотности вероятностей непрерывной равномерно распределённой случайной величины X симметричен относительно
середины интервала (a; b), то математическое ожидание2
M (X) =
a+b
2
.
(6.15)
6.4.4. Дисперсия равномерного распределения
Для вычисления дисперсии равномерного распределения воспользуемся
формулой (6.11). Вычислим сначала
Z∞
Z∞
Za
Zb 2
x
dx
M (X 2 ) =
+ x2 · 0dx =
x2 f (x)dx =
x2 · 0dx +
b−a
−∞
−∞
a
1
b
Как и в задаче 6.3 не мешает убедиться в том, что полученная функция действительно непрерывна.
Для этого нужно вычислить односторонние пределы в точках x = a и x = b. Попробуйте эту проверку
выполнить самостоятельно.
2
Конечно, математическое ожидание ожидание можно найти и с помощью самой функции плотности по формуле (6.7).
15
b
1
b 3 − a3
b2 + ba + a3
3
=
x =
=
.
3(b − a) a 3(b − a)
3
Далее вычислим разность
2
b2 + ba + a3
a+b
2
2
M (X ) − M (X) =
−
=
3
2
b2 − 2ba + a2
4b2 + 4ba + 4a2 − 3a2 − 6ab − 3b2
=
.
=
12
12
«Сворачивая» числитель последней дроби с помощью формулы квадрат
разности, получаем формулу вычисления дисперсии равномерного распределения
(b − a)2
D(X) =
.
(6.16)
12
6.4.5. Среднее квадратическое отклонение равномерного
распределения
Зная дисперсию равномерного распределения, можно с помощью формулы (6.13) вычислить среднее квадратическое отклонение данного распределения. Извлекая квадратный корень из дисперсии, получаем
σ(X) =
b−a
√ .
2 3
(6.17)
Замечание 6.7. Из формул (6.15)-(6.17) видно, что, зная параметры
равномерного распределения a и b, можно получить все числовые характеристики распределения.
Но можно и наоборот, зная, например, математическое ожидание M (X)
и среднее квадратическое отклонение σ(X), решить обратную задачу определения параметров распределения.
Для этого достаточно составить и решить следующую систему уравнений
a+b
= M (X),
2
b−a
√ = σ(X).
2 3
Рассмотрим решение задач, связанных с равномерным распределением.
Задача 6.7. Цена деления шкалы вольтметра 0, 2 W. Показания вольтметра округляют до ближайшего целого деления. Найти вероятность того,
что допущенная ошибка превысит 0, 04 W.
Решение. Предположим, что случайная величина X есть ошибка округления, которая распределена равномерно между целыми показаниями шкалы вольтметра.
16
Ошибка округления превысит 0, 04, если истинные показания вольтметра окажутся в диапазоне (0, 04; 0, 2 − 0, 04). Следовательно, нужно определить вероятность того, что случайная величина будет принимать значения
из этого интервала.
Так как интегральная функция равномерного распределения определяется представлением (6.14), (в котором a = 0, а b = 0, 2) то, опираясь на
формулу вычисления вероятности (6.1) попадания значений случайной величины в заданный интервал, имеем
0, 16 − 0 0, 04 − 0
P (0, 04 < X < 0, 16) =
−
⇒ P (0, 04 < X < 0, 16) = 0, 6.
0, 2 − 0
0, 2 − 0
вероятность того, что допущенная
Таким образом, ошибка превысит 0, 04 W равна 0, 6.
Задача 6.8. В некотором городе трамвай ходит по расписанию с интервалом 10 минут. Какова вероятность того, что пассажир, подошедший
к остановке, будет ожидать трамвай более двух минут?
Решение. Пусть случайная величина Y определяет время ожидания
трамвая. Пассажир будет ожидать трамвай более двух минут, если он подойдет к остановке в течение первых двух минут после ухода очередного
трамвая, то есть в интервале времени (0; 2).
Поскольку случайная величина Y в данном случае распределена по равномерному закону с параметрами a = 0 и b = 10, то, используя формулы
(6.14) и (6.1), получаем
0, 2 − 0
0−0
P (0 < X < 2) =
−
⇒ P (0 < X < 2) = 0, 2.
10 − 0
10 − 0
В заключение отметим, что в реальных условиях равномерное распределение вероятностей случайной величины может встречаться при анализе
ошибок округления при проведении числовых расчетов (такая ошибка, как
правило, оказывается равномерно распределенной на интервале от −5 до
+5 единиц округляемого десятичного знака) или при определении времени
ожидания обслуживания при точно периодическом через каждые Т единиц времени включении ҝобслуживающего устройствањ, когда заявка на
обслуживание поступает случайно в этом интервале.
17
§ 6.5. Нормальное распределение
6.5.1. Определение и график функции плотности нормального
распределения
Определение 6.12. Распределение вероятностей непрерывной случайной величины называется нормальным или распределением Гаусса,
если функция плотности вероятностей определяется следующим образом
(x − a)2
−
2σ 2
1
f (x) = √ e
.
(6.18)
σ 2π
Чтобы построить график функции плотности нормального распределения нужно вспомнить элементы исследования функции из математического анализа.
Очевидно, что область определения Df = (−∞; ∞).
Рассмотрим поведение функции на границах области определения, вычислив следующие пределы:
(x − a)2
(x − a)2
−
−
2σ 2
2σ 2
1
1
lim √ e
= 0; lim √ e
= 0.
x→−∞ σ 2π
x→∞ σ 2π
Так как в бесконечности функция стремится к нулю, то график функции
имеет горизонтальную асимптоту y = 0, совпадающую с осью абсцисс.
Далее вычислим первую производную функции и найдём с её помощью
интервалы возрастания (убывания) и точки экстремума1 .
0
(x − a)2
(x − a)2
−
−
2σ 2
2σ 2
1
2(x − a)
1
√ e
·
.
=− √ e
2σ 2
σ 2π
σ 2π
−
(x − a)2
2σ 2
x−a
√ e
.
σ 3 2π
Приравнивая производную нулю, вычислим стационарную точку первой
производной
f 0 (x) = 0 ⇒ x − a = 0 ⇒ x = a.
Так как знаменатель дроби и множитель-экспонента положительны то
знаки первой производной определяются линейным числителем x − a.
Следовательно,
1
f 0 (x) = −
Если они, конечно, есть.
18
f 0 (x)
f (x)
Рис. 6.8
−
+
x
a
Из рис. 6.8 видно, что на интервале от минус бесконечности до a функция
возрастает, а на интервале от a до плюс бесконечности она убывает. Поэтому в точке x = a функция имеет максимум1 , который равен
1
f (a) = √ .
σ 2π
Для исследования функции на выпуклость нам понадобится вторая производная.
0
(x − a)2
−
2σ 2
1
− √ (x − a)e
=
σ 3 2π
(x − a)2
(x − a)2
−
−
2σ 2
2σ 2
1
2(x − a)
− √ e
− (x − a)
e
=
2
3
2σ
σ 2π
(x − a)2
−
2σ 2
(x − a)2
1
1−
e
=− √
.
σ2
σ 3 2π
Таким образом,
(x − a)2
−
2σ 2
(x − a)2
1
00
√
f (x) = −
1−
e
.
σ2
σ 3 2π
Найдем стационарные точки второй производной. Вторая производная обращается в нуль только тогда, когда в нуль обращается скобкасомножитель.
(x − a)2
= 0 ⇒ (x − a)2 − σ 2 = 0 ⇒ (x − a − σ)(x − a + σ) = 0.
1−
σ2
Следовательно, вторая производная имеет две стационарные точки
x1 = a − σ и x2 = a + σ,
симметрично расположенные относительно точки максимума x = a.
Так как первый и третий сомножители на знак второй производной
1
То, что эта функция имеет максимум, можно было догадаться из положительности экспоненты и
стоящей перед ней дроби. А то, что этот максимум будет в точке x = a, можно было определить из
симметрии функции отностительно этой точки ((−(x − a))2 = (x − a)2 ).
К сожалению, исследование на выпуклость графика так просто провести не удастся.
19
не влияют, то её знаки полностью определяются квадратным трёхчленом,
стоящим в скобках и представляющим разность квадратов. Графиком этого члена является парабола, ветви которой направлены вверх. Исходя из
этого, мы имеем следующее чередование знаков второй производной (рис.
6.9).
f 00 (x)
−
+
f (x)
+
x1
Рис. 6.9
x
x2
Таким образом, график функции плотности нормального распределения имеет две точки перегиба, отделяющие интервалы выпуклости вниз от
интервала выпуклости вверх.
Значения функции в точках перегиба равны
1
1
f (a − σ) = √
; f (a + σ) = √
.
σ 2eπ
σ 2eπ
Теперь мы имеем достаточно информации, чтобы построить схематический
график функции плотности вероятностей нормального распределения.
√1
σ 2π
f (x)
√1
σ 2eπ
x
Рис. 6.10
x1
a
x2
Из рис. 6.10 очевидно, что мода нормального распределения Mo = a
(см. определение 6.6). А так как график функции плотности симметричен
относительно прямой x = a, то площадь криволинейной трапеции слева
от прямой x = a равна площади криволинейной трапеции справа от этой
прямой. В силу этого согласно формуле (6.4)
P (X < a) = P (X > a).
Поэтому из определения 6.8 следует, что медиана нормального распределения
Me = a.
Поскольку в неотрицательности функции f (x) сомневаться не приходится, то осталось убедиться (см. свойство 6.2) в том, что
20
Z∞
f (x)dx = 1.
−∞
Подставив функцию плотности в интеграл, выполним следующие преобразования:
(x − a)2
t2
Z∞ −
Z∞ −
x−a
2σ 2
2
1
1
= t,
√
=√
e
dx =
e dt.
σ
σ 2π
2π
dx = σdt
−∞
−∞
Так как функция, стоящая под интегралом чётная, а пределы интегрирования симметричны относительно начала координат, то1
t2
t2
∞
∞
Z −
Z −
2
2
2
1
√
e dt = √
e dt.
2π
2π
−∞
Интеграл
2
Z∞
e
t2
−
2
t2
∞ −
∞
r
√
√ Z −z 2
√ π
√ Z
2
π
t
= 2 e
dz = 2
=
.
dt = 2 e d √
2
2
2
Подставляя полученное значение вместо интеграла в предыдущую строчку,
убеждаемся в том, что
1
√
σ 2π
Z∞
e
(x − a)2
−
2σ 2
dx = 1.
(6.19)
−∞
6.5.2. Нормированное нормальное распределение
Так как параметры a и σ нормального распределения тесно связаны
с метрическими единицами, используемыми в исследовании, и с масштабом изображения, то это оказывает большое влияние на общность любого
проводимого исследования. Чтобы этого избежать прибегают к процессу
нормирования3 .
1
См., например, В. И. Бидерман Математика : Элементы математического анализа. С. 146.
Z∞ −z 2
2
Интеграл e
dz называется интегралом Эйлера-Пуассона. Впервые был вычислен Л. Эйлером
в 1729 году. Позднее С. Д. Пуассон нашёл более простой способ его вычисления. Более подробно см.
В. А. Зорич Математический анализ : Учебник. Ч. II. − М. : Наука, 1984. − С. 424.
3
Эта ситуация имеет аналогию в школьной программе, когда классическую теорему Пифагора,
тесно связанную с квадратами единиц измерения, заменяют на безразмерные синус и косинус, разделив
на квадрат длины гипотенузы обе части известного равенства.
21
Определение 6.13. Нормальное распределение вероятностей непрерывной случайной величины называется нормированным, если параметры распределения фиксируют следующим образом:
a = 0, σ = 1.
В этом случае функция плотности приобретает более компактный вид функции Гаусса, с которой мы уже встречались ранее1 .
x2
−
2
1
fN (x) = √ e
,
(6.20)
2π
а само нормированное распределение очень часто обозначается N (x; 0; 1).
График функции плотности нормированного произведения симметричен
относительно оси OY и выглядит так:
√1
2π
fN (x)
√1
2eπ
x
Рис. 6.11
−1
1
Нормирование необходимо для того, чтобы закономерности нормального распределения привязать к универсальным единицам измерения случайной величины − среднеквадратическим (стандартным) отклонениям.
После нормирования случайное значение оказывается не просто наблюдаемой величиной (размер исследуемой величины, например), а отклонением
от средней арифметической (которая равна нулю), измеряемым в среднеквадратических отклонениях, что приводит к так называемому правилу
трёх сигм, которое мы рассмотрим ниже.
6.5.3. Интегральная функция нормального распределения
С помощью представления (6.5) определим интегральную функцию нормированного нормального распределения вероятностей
1
См. лекцию «Схема Бернулли».
22
1
FN (x) = √
2π
t2
Zx −
2
e dt.
(6.21)
−∞
Очевидно, что при x → −∞ FN (x) → 0. А при x → ∞ из равенства (6.19)
вытекает что FN (x) → 1. Таким образом, прямые y = 0 и y = 1 являются
горизонтальными асимптотами графика FN (x).
Из рис. 6.11 очевидно, что медиана Me = 0. Поэтому для нормирован1
ного нормального распределения FN (0) = (см. следствие 6.3).
2
Чтобы определить значения функции FN (x) выполним следующее преобразование
t2
t2
t2
x
x
Z −
Z −
Z −
2
2
2
e dt =
e dt + e dt.
−∞
−∞
Подставляя полученное разложение в формулу 6.21, имеем
t2
t2
x
−
−
Z
Z
2
2
1
1
FN (x) = √
e dt + √
e dt.
2π
2π
−∞
Присмотревшись внимательно, можно что второй интеграл в полученной сумме представляет интегральную функцию Лапласа1
t2
Zx −
2
Φ(x) = e dt.
Первый же интеграл суммы с точки зрения геометрии определяет площадь криволинейной трапеции, расположенной слева от оси ординат на
рис. 6.11. А так как эта площадь передставляет в силу симметрии половину
площади всей криволинейной трапеции на этом рисунке, то (см. формулу
6.4 и свойство 6.2)
t2
Z −
2
1
e dt = .
2
−∞
Поэтому
FN (x) =
1
1
+ Φ(x).
2
См. лекцию «Схема Бернулии».
23
Используя таблицу значений интегральной функции Лапласа1 , построим схематический график интегральной функции нормированного распределения нормальной случайной величины
FN (x)
1
1
2
x
Рис. 6.12
Рассмотрим интегральную функцию ненормированного нормального распределения
(t − a)2
x
−
Z
2σ 2
1
dt.
F (x) = √
e
σ 2π
−∞
t−a
Выполнив замену
= z, получим dt = σdz. При этом нижний предел
σ
x−a
интегрирования не изменится, а верхний примет новое значение
. Соσ
ответственно функция распределения примет новый вид
z2
x−a
Zσ −
2
1
e
dz.
F (x) = √
2π
−∞
Далее с помощью интегральной функции Лапласа её можно переписать в
виде
1
x−a
F (x) = + Φ
.
2
σ
При построения графика F (x) с помощью графика на рис. 6.12 нужно
учесть, что новый график не только сместится на a вдоль оси абсцисс, но и
1
деформируется за счёт коэффициента . Схематически этот график будет
σ
выглядеть примерно так2 (рис. 6.13).
1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. − C. 462.
Отразить на графике смещение по отношению к графику функции нормированного нормального
1
распределения, связанное с коэффициентом , без введения масштаба достаточно сложно, поэтому
σ
построение более точного графика при конкретных σ оставляем читателям в качестве самостоятельной
работы.
2
24
F(x)
1
1
2
x
a
Рис. 6.13
Далее определим числовые характеристики нормального распределения.
6.5.4. Математическое ожидание нормального распределения
Используя формулу (6.7), докажем теорему.
Теорема 6.1. Математическое ожидание нормально распределённой
непрерывной случайной величины равно параметру a.
Д о к а з а т е л ь с т в о. Вычислим значение интеграла
(x − a)2
x−a
∞
−
Z
= t;
2
2σ
1
σ
√
xe
dx = x = σt + a; =
σ 2π
−∞
dx = σdt
t2
t2
t2
−
Z∞ −
Z∞
Z∞ −
2
2
2
1
1
e dt .
= √
(σt + a)e σdt = √ σ
te dt + a
σ 2π
2π
−∞
−∞
−∞
Первый интеграл в скобке является интегралом от нечётной функции с
симметричными пределами интегрирования, поэтому он равен нулю1 .
Второй интеграл в скобке
√ есть интеграл Эйлера-Пуассона (см. сноску
на с. 21), поэтому он равен 2π.
Таким образом, после сокращения значения интеграла Пуассона-Эйлера
со знаменателем дроби перед скобками, получаем, что математическое ожидание нормально распределённой случайной величины
M (X) = a.
(6.22)
6.5.5. Дисперсия нормального распределения
Используя формулу вычисления дисперсии (6.10), докажем теорему
1
См., например, В. И. Бидерман Математика : Элементы математического анализа. С. 145.
25
Теорема 6.2. Дисперсия нормально распределённой непрерывной случайной величины равна σ 2 .
Д о к а з а т е л ь с т в о. С помощью аналогичной техники замены
переменной в интеграле, полагая M (X) = a, вычислим интеграл
(x − a)2
t2
x−a
∞
∞
−
−
Z
Z
= t;
2σ 2
2
1
1
σ
2
√
dx = x = σt + a; = √
(x − a) e
σ 2 t2 e σdt.
σ 2π
σ 2π
−∞
−∞
dx = σdt
3
После вынесения σ за знак интеграла представим подынтегральную функцию в виде произведения сомножителей
t2
t2
−
−
2
2
2
= t · te .
te
Так как
2
1 2
1
t
tdt = d(t ) = · 2d
2
2
2
воспользумся далее формулой интегрирования по частям
t2
u = t;
du = dt;
∞
−
2 Z
2
2
σ
t2 =
t
√
t2 e dt =
−
−
2π
2
2
−∞
dv = te dt; v = −e
t2
t2
∞
−
Z∞ − 2
2
σ2
e dt.
− −
= √ −t · e
2π
−∞
−∞
Подстановка1
t2
−
2
t·e
∞
∞
− −
= 0.
= lim b2 − lim a2 =
a→−∞ 2
b→∞ 2
∞
∞
−∞
e
e
1
1
1
1
= lim b2 − lim
=
+
= 0 + 0 = 0.
2
a
a→−∞
b→∞
∞
∞
2
2
be
ae
Интеграл, стоящий в скобках,
√ является уже знакомым интегралом Пуассона-Эйлера и поэтому равен 2π.
Умножив дробь, стоящую перед скобками на значение интеграла Пуассона-Эйлера, убеждаемся в истинности утверждения теоремы о том, что
дисперсия нормально распределённой случайной величины
b
a
D(X) = σ 2 .
1
∞
(6.23)
Здесь при вычислении пределов используется правило Лопиталя-Бернулли (см., например,
В. И. Бидерман Математика : Элементы математического анализа. С. 81.).
26
6.5.6. Среднее квадратическое отклонение нормального
распределения
Зная дисперсию нормального распределения, можно с помощью формулы (6.13) вычислить среднее квадратическое отклонение данного распределения. Извлекая квадратный корень из дисперсии, получаем
σ(X) = σ.
(6.24)
Замечание 6.8. Из формул (6.22)-(6.24) видно, что, зная параметры
нормального распределения a и σ, мы одновременно знаем его числовые
характеристики. Так, например, вид функции плотности
(x + 1)2
−
72
1
f (x) = √ e
6 2π
1
позволяет сказать , что математическое ожидание M (X) = −1, среднее
квадратическое отклонение σ(X) = 6, а дисперсия D(X) = 36.
6.5.7. Вероятность попадания нормально распределённой
случайной величины в заданный интервал
Предположим что непрерывная случайная величина X распределена по
нормальному закону с параметрами a и σ, а Φ(x) − интегральная функция
Лапласа. При этих условиях справедлива следующая
Теорема 6.3. Вероятность попадания нормально распределённой случайной величины X в заданный интервал (α; β) определяется равенством
β−a
α−a
P (α < X < β) = Φ
−Φ
.
(6.25)
σ
σ
Д о к а з а т е л ь с т в о. Согласно предположениям распределение
случайной величины X имеет своей функцией плотности вероятностей
(x − a)2
−
2σ 2
1
f (x) = √ e
.
σ 2π
Тогда из формулы (6.4) следует, что
(x − a)2
Zβ −
2σ 2
1
P (α < X < β) = √
e
dx.
σ 2π
α
1
В формуле 6.18 x − a = x + 1 = x − (−1), а 2σ 2 = 72 = 2 · 36 = 2 · 62 .
27
Используя стандартную замену
x−a
, x = σt + a, dx = dσ,
t=
σ
введём новые пределы интегрирования
α−a
β−a
tн =
, tв =
.
σ
σ
и, сократив σ, подставим в представление для вероятности
t2
β−a
Zσ − 2
2σ
1
P (α < X < β) = √
dt.
e
2π
α−a
σ
Далее, используя аддитивность отрезка интегрирования, представим интеграл в виде суммы
t2
t2
t2
β−a
β−a
Z0 − 2
Zσ − 2
Zσ − 2
2σ
2σ
2σ
dt =
dt +
dt.
e
e
e
α−a
σ
α−a
σ
Так как
Zr
ZR
ϕ(t)dt = −
r
ϕ(t)dt,
R
то, поменяв пределы интегрирования в первом слагаемом местами, получим
t2
t2
t2
β−a
β−a
α−a
Zσ − 2
Zσ − 2
Zσ − 2
2σ
2σ
2σ
e
e
e
dt =
dt −
dt. .
α−a
σ
Учитывая, что каждый из интегралов в правой части является значением
интегральной функции Лапласа в точке соответствующего верхнего предела интеграла, имеем требуемое равенство
α−a
β−a
−Φ
.
P (α < X < β) = Φ
σ
σ
6.5.8. Вероятность отклонения нормально распределённой
случайной величины от её центра рассеивания
Пусть центр рассеивания нормально распределённой случайной величины X равен a, а её среднее квадратическое отклонение равно σ. Тогда
отклонение случайной величины от её центра рассеивания меньше чем на
δ можно записать в виде неравенства1
1
Здесь δ > 0.
28
|X − a| < δ.
Сформулируем и докажем следующую теорему
Теорема 6.4. Вероятность отклонения случайной величины X от её
центра рассеивания a меньше чем на δ равна удвоенному значению интегральной функции Лапласа от отношения δ к среднеквадратическому
отклонению σ.
То есть
δ
.
(6.26)
P (|X − a| < δ) = 2Φ
σ
Д о к а з а т е л ь с т в о. Неравенство, определяющее отклонение, более
подробно можно переписать, сняв знак модуля,
a − δ < X < a + δ.
Полагая в условиях предыдущей теоремы 6.3 α = a − δ, а β = a + δ,
воспользуемся равенством (6.25)
a+δ−a
a−δ−a
P (a − δ < X < a + δ) = Φ
−Φ
.
σ
σ
Далее, приведя подобные, имеем
δ
δ
P (a − δ < X < a + δ) = Φ
−Φ − .
σ
σ
Учитывая, что функция Φ(x) является нечётной и поэтому Φ(−x)=-Φ(x),
получаем требуемое утверждение
δ
P (a − δ < X < a + δ) = 2Φ
.
σ
6.5.9. Правило трёх сигм
Исследование вероятности попадания значений нормально распределённой случайной величины в определённый интервал зависит от характеристики рассеивания случайной величины. При этом это связано как с единицами измерения этой величины, так и с тем, что одни случайные величины
теснее группируются вокруг среднего значения, а другие более разбросаны.
Универсальной характеристикой рассеивания является величина среднеквадратического отклонения σ.
Посмотрим, как будет выглядеть вероятность отклонения значений случайной величины от среднего значения a, если измерять это отклонение «в
сигмах».
Пусть в равенстве (6.26) отклонение δ = tσ (здесь t − коэффициент
кратности). Тогда равенство (6.26) можно будем переписать так
P (|X − a| < tσ) = 2Φ(t).
29
(6.27)
Далее, выбирая поочередно t равным 1, 2, 3, выясним, как располагаются значения нормально распределённой случайной величины относительно
своего среднего значения.
Пусть t = 1. Тогда
P (|X − a| < σ) = 2Φ(1).
Из таблицы значений интегральной функции Лапласа1 известно, что
Φ(1) = 0, 3413. Поэтому
P (|X − a| < σ) = 2 · 0, 3413 ⇒ P (|X − a| < σ) = 0, 6826.
То есть 68,26% значений нормально распределённой случайной величины располагаются от её математического ожидания на расстоянии, меньшем чем «сигма».
Предположим, что t = 2. Подставив его в формулу (6.27), находим
P (|X − a| < 2σ) = 2Φ(2).
Из таблицы значений интегральной функции Лапласа известно, что
Φ(2) = 0, 4772. Поэтому
P (|X − a| < 2σ) = 2 · 0, 4772 ⇒ P (|X − a| < 2σ) = 0, 9544.
То есть 95,44% значений нормально распределённой случайной величины располагаются от её математического ожидания на расстоянии, меньшем чем два «сигма».
Выберем t = 3. В этом случае
P (|X − a| < 3σ) = 2Φ(3).
Из таблицы значений интегральной функции Лапласа известно, что
Φ(3) = 0, 49865. Следовательно,
P (|X − a| < 3σ) = 2 · 0, 49865 ⇒ P (|X − a| < 3σ) = 0, 9973.
То есть 99,73% значений нормально распределённой случайной величины располагаются от её математического ожидания на расстоянии, меньшем чем три «сигма».
Это означает, что только 0,27% значений случайной величины отклоняются от её математического ожидания на расстояние большее чем три
«сигма».
События со столь малой вероятностью считаются практически невозможными. Поэтому в практических исследованиях при неизвестном распределении случайной величины, если случайная величина отклоняется от
среднего значения не более чем на три среднеквадратических отклонения,
считают, что есть основания предполагать, что случайная величина распределена по нормальному закону. Иначе, это предположение отвергают.
В заключение сформулируем следующее правило трёх сигм Если
случайная величина распределена по нормальному закону, то модуль её
1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. С. 463.
30
отклонения от математического ожидания не превышает утроенного
среднего квадратического отклонения.
6.5.10. Примеры решения задач, связанных с нормальным
распределением
Задача 6.9. Длина X некоторой детали представляет собой случайную
величину, распределенную по нормальному закону распределения, и имеет
среднее значение 20 мм и среднее квадратическое отклонение − 0,2 мм.
Найдите:
а) выражение плотности распределения;
б) вероятность того, что длина детали будет заключена между
19,7 и 20,3 мм;
в) вероятность того, что величина отклонения не превышает 0,1 мм;
г) какой процент составляют детали, отклонение которых от среднего
значения не превышает 0,1 мм;
д) каким должно быть задано отклонение, чтобы процент деталей,
отклонение которых от среднего не превышает заданного, повысился
до 54%;
е) интервал, симметричный относительно среднего значения, в котором
будет находиться X с вероятностью 0,95.
Решение
Из условия задачи для всех вопросов общими являются a = 20, σ = 0, 2.
а) Прежде чем подставить значения a = 20 и σ = 0, 2 в функцию плотности вероятностей нормального распределения (см. 6.18), вычислим
2σ 2 = 2 · (0, 2)2 ⇒ 2σ 2 = 0, 08.
Подставляя данные и найденное значения в представление (6.18), имеем
(x − 20)2
−
0, 08
1
√ e
f (x) =
.
0, 2 · 2π
б) Из условия задачи согласно формуле (6.25) β = 20, 3, α = 19, 7. Поэтому
после подстановки в формулу (6.25) имеем
20, 3 − 20
19, 7 − 20
0, 3
0, 3
Φ
−Φ
=Φ
−Φ −
=
0, 2
0, 2
0, 2
0, 2
3
= 2Φ
= 2Φ(1, 5) = 2 · 0, 4332 = 0, 8664.
2
(Значение Φ(1, 5) = 0, 4332 взято в таблице значений интегральной функции Лапласа1 ).
1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. С. 463.
31
в) Из условия задачи согласно формуле (6.26) δ = 0, 1. Таким образом,
после подстановки в формулу (6.26) имеем
0, 1
P (|X − 20| < 0, 1) = 2Φ
= 2Φ(0, 5) = 2 · 0, 1915 = 0, 383.
0, 2
(Значение Φ(0, 5) = 0, 1915 взято в таблице значений интегральной функции Лапласа1 ).
г) Из ответа на вопрос в) известно, что вероятность при отклонении меньше
0,1 мм равна 0,383. Следовательно, из 100 деталей в среднем 38,3 детали
будут иметь такое же отклонение. Поэтому 38% деталей имеют подобное
отклонение.
д) Так как процент отклонения составляет 54%, то из формулы (6.26) вытекает следующее уравнение
P (|X − 20| < δ) = 0, 54.
Сравнивая правую часть полученного уравнения
справой части формулы
δ
(6.26)
P (|X − 20| < δ) = 2Φ
,
0, 2
получаем новое уравнение
δ
= 0, 54.
2Φ
0, 2
Откуда следует, что
δ
= 0, 27.
Φ
0, 2
Просматривая в таблице значения интегральной функции Лапласа, находим, что 0, 27 = Φ(0, 74). Поэтому
δ
= 0, 74 ⇒ δ = 0, 74 · 0, 2 ⇒ δ = 0, 148.
0, 2
Следовательно, для повышения до 54 процентов числа деталей, для которых отклонение от среднего не превышало заданного, необходимо, чтобы
отклонение равнялось бы 0,148 мм.
e) Так как интервал, в котором будут находится значения нормально распределённой случайной величины X, симметричен относительно среднего
значения a = 20, то его можно описать с помощью двойного неравенства
20 − δ < X < 20 + δ
или с помощью неравенства с модулем
|X − 20| < δ.
Дальнейшее решение совпадает с ответом на вопрос д) при условии замены
числа 0,54 на 0,95. Поэтому составляем
уравнение
δ
2Φ
= 0, 95.
0, 2
1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. С. 462.
32
Из которого следует, что
δ
Φ
= 0, 475.
0, 2
Просматривая в таблице значения интегральной функции Лапласа, находим, что 0, 475 = Φ(1, 96). Поэтому
δ
= 1, 96 ⇒ δ = 1, 96 · 0, 2 ⇒ δ = 0, 392.
0, 2
В итоге, искомый интервал определяется так
(20 − 0, 392; 20 + 0, 392).
Следовательно, интервал (19, 608; 20, 392), в котором будет находится
X, симметричен относительно среднего значения.
Задача 6.10. Автомат изготавливает детали, которые отделом технического контроля считаются стандартными, если отклонение X от контрольного размера не превышает 0,8 мм. Каково наиболее вероятное число стандартных деталей среди изготовленных 150 деталей, если случайная
величина X распределена по нормальному закону с σ = 0, 4 мм?
Решение. Полагая в формуле (6.26) δ = 0, 8 и σ = 0, 4, вычислим вероятность отклонения X от контрольного размера a
0, 8
P (|X − a| < 0, 8) = 2Φ
⇒ P (|X − a| < 0, 8) = 2Φ(2).
0, 4
Из таблицы значений интегральной функции Лапласа1 ) следует, что
Φ(2) = 0, 4772. Поэтому
P (|X − a| < 0, 8) = 2 · 0, 4772 ⇒ P (|X − a| < 0, 8) = 0, 9544.
Округлив это число до сотых, будем считать P = 0, 95. Так как q = 1−P ,
то q = 0, 05.
Из схемы Бернулли известно, что наивероятнейшее число наступлений
события
nP − q ≤ m ≤ nP + P .
По условию n = 150. Подставляя данные в двойное неравенство
150 · 0, 95 − 0, 05 ≤ m ≤ 150 · 0, 95 + 0, 95,
после арифметических вычислений получаем
142, 45 ≤ m ≤ 143, 45.
Следовательно,
наиболее вероятное число стандартных деталей среди
изготовленных 150 деталей равно 143.
Задача 6.11. Рост взрослого человека является случайной величиной,
распределённой по нормальному закону. Согласно статистике среднее зна1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. С. 463.
33
чение роста взрослого шведа − 178 см, а среднее квадратическое отклонение − 6 см. Определите вероятность того, что хотя бы один из встреченных
пяти взрослых шведов имеет рост от 175 см до 185 см.
Решение. Из условия задачи согласно формуле (6.25) a = 178, σ = 6,
β = 185, α = 175.
Подставим
в указанную
формулу
данные значения
3
175 − 178
7
185 − 178
−Φ
=Φ
−Φ −
=
Φ
6
6
6
6
= Φ(1, 16) + Φ(0, 5) = 0, 3770 + 0, 1915 = 0, 5685.
(Значения Φ(1, 16) = 0, 3770 и Φ(0, 5) = 0, 1915 взяты в таблице значений
интегральной функции Лапласа1 . Учтено так же, что Φ(−x) = −Φ(x).)
Следовательно, вероятность того, что рост взрослого шведа меньше
175 см и больше 185 см, q = 1 − 0, 5685. То есть q = 0, 4315.
Вычислим вероятность Q того, что ни один из встреченных пяти взрослых
шведов не имеет рост от 175 см до 185 см.
Q = q 5 ⇒ Q = (0, 4315)5 ⇒ Q = 0, 015.
Так как данное событие является противоположным искомому, то нужная
вероятность
P = 1 − Q ⇒ 1 − 0, 015 ⇒ Q = 0, 985.
вероятность того, что хотя бы один из встреченных
Таким образом, пяти взрослых шведов имеет рост от 175 см до 185 см
равна 0,985.
Задача 6.12. Браковка шариков для подшипников происходит следующим образом: если шарик не проходит в отверстие диаметром d1 , но
проходит в отверстие диаметром d2 (d1 < d2 ), то он считается стандартным. Если хотя бы одно из этих условий не выполнено, шарик отправляется в брак. Диаметр шарика d является случайной величиной X, распреd1 + d2
делённой по нормальному закону с характеристиками M (X) =
и
2
d2 − d1
σ(X) =
. Определите вероятность того, что случайно выбранный
4
шарик будет забракован.
Решение. Из условия задачи согласно формуле (6.25)
d1 + d2 d2 − d1
a=
,
, β = d2 , α = d1 .
2
4
С помощью формулы (6.25) вычислим вероятность стандартности шарика
1
См., например, В. Е. Гмурман Теория вероятностей и математическая статистика. С. 462-463.
34
d2 − a
P (d1 < X < d2 ) = Φ
σ
d1 − a
−Φ
.
σ
Так как
d1 + d2
d2 − d1
=
, то
2
2
d2 − a d2 − d1 d2 − d1
=
:
= 2.
σ
2
4
Аналогично, вычислив
d1 − d2
d1 + d2
=
,
d1 − a = d1 −
2
2
найдём
d1 − a d1 − d2 d2 − d1
=
:
= −2.
σ
2
4
Подставляя найденные значения аргументов в правую часть формулы для
вероятности, имеем
d2 − a = d2 −
Φ(2) − Φ(−2) = 2Φ(2) = 2 · 0, 4772 = 0, 9544.
Следовательно, P (d1 < X < d2 ) = 0, 9544.
Так как нас интересует проивоположное событие, то его вероятность P
определяется вычитанием из единицы полученного значения.
Поэтому P = 1 − 0, 9544 ⇒ P = 0, 0456.
В итоге, имеем
вероятность того, что случайно выбранный шарик
будет забракован, равна 0,0456.
6.5.11. О роли нормального закона в теории вероятностей и её
приложениях
Нормальный закон распределения или закон Гаусса является наиболее
часто встречающимся на практике законом распределения. Объяснение
этому даёт следующая теорема, которую сформулируем без доказательства1 .
Теорема 6.5. Центральная предельная теорема Если случайная
величина X представляет собой сумму очень большого числа взаимно
независимых случайных величин, влияние каждой из которых на всю
сумму ничтожно мало, то X имеет распределение, близкое к нормальному2 .
Так, например, отклонение выходного параметра X (при известных допущениях) любого прибора от номинала можно представить в виде
1
История доказательства центральной предельной теоремы связана с работами П. С. Лапласа,
П. Л. Чебышева, А. А. Маркова А. М. Ляпунова, С. Н. Бернштейна, А. Я. Хинчина и др. математиков.
2
Формулировка А. М. Ляпунова.
35
суммы n элементарных отклонений , связанных с отдельными причинами
типа:
X1 − отклонение, вызванное влиянием температуры;
X2 − отклонение, вызванное влиянием влажности воздуха;
X3 − отклонение, вызванное ошибкой ввода какого-нибудь параметра;
X4 − отклонение, вызванное недостаточной чистотой материала изделия;
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
и так далее.
Число n этих отклонений велико, как и число n причин, вызывающих
суммарное отклонение X. При этом каждое из отдельных слагаемых X1 ,
X2 , . . . , Xn не оказывает влияния на рассеяние суммы, отличного от влияния других слагаемых (иначе были бы приняты меры для устранения этого
влияния).
Нормальное распределение распространено в технических приложениях: ошибки измерения параметров, ошибки выполнения команд, ошибки
ввода различных величин в техническое устройство распределены по нормальному закону.
Нормальный закон имеет широкое применение в биологии: вес, размер
и другие параметры представителей растительного и животного мира во
многих случаях имеют нормальное распределение, так как их разброс связан с суммарным воздействием многих факторов, каждый из которых не
имеет доминирующего влияния1 .
И, наконец, в самой математике как предельный закон он связан со
множеством распределений случайной величины и поэтому без него невозможны ни математическая статистика, ни теоретическая физика.
Литература.
1. Гмурман В.Е. Теория вероятностей и математическая статистика. −
М. : Высш.шк., 1997. − 479 с.
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и
математической статистике. − М. : Высш.шк., 1975. − 333 с.
3. Вентцель Е. С., Овчаров Л. А. Теория вероятностей и её инженерные
приложения. − М. : Наука, 1988. − 480 с.
c Бидерман В.И.
1
Естественно, и в мире людей: медицина, социология, экономика нормальный закон находит свои
приложения.
36