Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ЛЕКЦИЯ 5 (продолжение).
Закон больших чисел.
Неравенство Чебышева.
(Чебышев Пафнутий Львович (1821 – 1824) – русский математик)
На практике сложно сказать какое конкретное значение примет случайная
величина, однако, при воздействии большого числа различных факторов поведение
большого числа случайных величин практически утрачивает случайный характер и
становится закономерным.
Этот факт очень важен на практике, т.к. позволяет предвидеть результат опыта
при воздействии большого числа случайных факторов.
Однако, это возможно только при выполнении некоторых условий, которые
определяются законом больших чисел. К законам больших чисел относятся теоремы
Чебышева (наиболее общий случай) и теорема Бернулли (простейший случай), которые
будут рассмотрены далее.
Рассмотрим дискретную случайную величину Х (хотя все
справедливо и для непрерывных случайных величин),
распределения:
X
x1
x2
…
p
p1
p2
…
сказанное ниже будет
заданную таблицей
xn
pn
Требуется определить вероятность того, что отклонение значения случайной
величины от ее математического ожидания будет не больше, чем заданное число .
Теорема. (Неравенство Чебышева) Вероятность того, что отклонение
случайной величины Х от ее математического ожидания по абсолютной величине
меньше положительного числа , не меньше чем 1 D( X ) / 2 .
P( X
M (X )
) 1 D( X ) /
2
Доказательство этой теоремы приводить не будем, оно имеется в литературе.
Теорема Чебышева.
Теорема. Если Х1, Х2, …, Хn- попарно независимые случайные величины, причем
дисперсии их равномерно ограничены (не превышаю постоянного числа С), то, как бы
мало не было положительное число , вероятность неравенства
X1
X2
... X n
n
M ( X 1 ) M ( X 2 ) ... M ( X n )
n
будет сколь угодно близка к единице, если число случайных величин достаточно велико.
Т.е. можно записать:
lim P
n
X1
X2
... X n
n
M ( X 1 ) M ( X 2 ) ... M ( X n )
n
1
ЛЕКЦИЯ 6.
Часто бывает, что случайные величины имеют одно и то же математическое
ожидание. В этом случае теорема Чебышева несколько упрощается:
lim P
X1
X2
... X n
n
n
m
1
Дробь, входящая в записанное выше выражение есть не что иное как среднее
арифметическое возможных значений случайной величины.
Теорема утверждает, что хотя каждое отдельное значение случайной величины
может достаточно сильно отличаться от своего математического ожидания, но среднее
арифметическое этих значений будет неограниченно приближаться к среднему
арифметическому математических ожиданий.
Отклоняясь от математического ожидания как в положительную так и в
отрицательную сторону, от своего математического ожидания, в среднем
арифметическом отклонения взаимно сокращаются.
Таким образом, величина среднего арифметического значений случайной
величины уже теряет характер случайности.
Теорема Бернулли.
Пусть производится п независимых испытаний, в каждом из которых
вероятность появления события А равно р.
Возможно определить примерно относительную частоту появления события А.
Теорема. Если в каждом из п независимых испытаний вероятность р появления
события А постоянно, то сколь угодно близка к единице вероятность того, что
отклонение относительной частоты от вероятности р по абсолютной величине
будет сколь угодно малым, если число испытаний р достаточно велико.
lim P( m / n
p
n
) 1
Здесь т – число появлений события А. Из всего сказанного выше не следует,
что с увеличением число испытаний относительная частота неуклонно стремится к
m
вероятности р, т.е. lim
p . В теореме имеется в виду только вероятность
n
n
приближения относительной частоты к вероятности появления события А в каждом
испытании.
В случае, если вероятности появления события А в каждом опыте различны, то
справедлива следующая теорема, известная как теорема Пуассона.
Теорема. Если производится п независимых опытов и вероятность появления
события А в каждом опыте равна рi, то при увеличении п частота события А
сходится по вероятности к среднему арифметическому вероятностей рi.
2
Предельные теоремы.
Как уже говорилось, при достаточно большом количестве испытаний,
поставленных в одинаковых условиях, характеристики случайных событий и
случайных величин становятся почти неслучайными. Это позволяет использовать
результаты наблюдений случайных событий для предсказания исхода того или иного
опыта.
Предельные теоремы теории вероятностей устанавливают соответствие между
теоретическими и экспериментальными характеристиками случайных величин при
большом количестве испытаний.
В рассмотренном выше законе больших чисел нечего не говорилось о законе
распределения случайных величин.
Поставим задачу нахождения предельного закона распределения суммы
Yn
n
Xi
i 1
когда число слагаемых п неограниченно возрастает. Эту задачу решает Центральная
предельная теорема Ляпунова, которая была сформулирована выше.
В зависимости от условий распределения случайных величин Xi, образующих
сумму, возможны различные формулировки центральной предельной теоремы.
Допустим, что случайные величины Xi взаимно независимы и одинаково
распределены.
Теорема. Если случайные величины Xi взаимно независимы и имеют один и тот
же закон распределения с математическим ожиданием т и дисперсией 2, причем
существует третий апсолютный момент 3, то при неограниченном увеличении числа
испытаний п закон распределения суммы Yn
n
X i неограниченно приближается к
i 1
нормальному.
При доказательстве этой теоремы Ляпуновым использовались так называемые
характеристические функции.
Определение. Характеристической функцией
называется функция
g (t )
случайной величины Х
M (e itX )
эта функция представляет собой математическое ожидание некоторой
комплексной случайной величины U e itX , являющейся функцией от случайной
величины Х. При решении многих задач удобнее пользоваться характеристическими
функциями, а не законами распределения.
Зная закон распределения, можно найти характеристическую функцию по
формуле (для непрерывных случайных величин):
g (t )
e itx f ( x)dx
Как видим, данная формула представляет собой не что иное, как преобразование
Фурье для функции плотности распределения. Очевидно, что с помощью обратного
3
преобразования Фурье можно по характеристической функции найти закон
распределения.
Введение характеристических функций позволяет упростить операции с
числовыми характеристиками случайных величин.
В случае нормального распределения характеристическая функция имеет вид:
g (t )
e
t2 / 2
Сформулируем некоторые свойства характеристических функций:
1) Если случайные величины Х и Y связаны соотношением
Y aX
где а – неслучайный множитель, то
g y (t )
g x (at )
2) Характеристическая функция суммы независимых случайных величин равна
произведению характеристических функций слагаемых.
Случайные величины Xi, рассмотренные в центральной предельной теореме,
могут обладать произвольными распределениями вероятностей.
Если все эти случайные величины одинаково распределены, дискретны и
принимают только два возможных значения 0 или 1, то получается простейший случай
центральной предельной теоремы, известный как теорема Муавра – Лапласа.
Теорема. (Теорема Муавра – Лапласа) Если производится п независимых
опытов, в каждом из которых событие А появляется с вероятностью р, то для
любого интервала ( , ) справедливо соотношение:
P
Y
np
1
2
npq
2
2
( )
( )
где Y – число появлений события А в п опытах, q = 1 – p, Ф(х) –функция Лапласа,
(х ) - нормированная функция Лапласа.
Теорема Муавра – Лапласа описывает поведение биномиального распределения
при больших значениях п.
Данная теорема позволяет существенно упростить вычисление по формуле
биноминального распределения.
Расчет вероятности попадания значения случайной величины в заданный
интервал P(
Y
)
Cnk p k q n k при больших значениях п крайне затруднителен.
k
Гораздо проще воспользоваться формулой:
P(
Y
)
1
2
np
np
2npq
2npq
Теорема Муавра – Лапласа очень широко применяется при решении
практических задач.
4
Пример. Вероятность наступления события А в каждом испытании равна 0,3.
Используя неравенство Чебышева, оценить вероятность того, что в 10000 испытаниях
отклонение относительной частоты появления события А от его вероятности не
превзойдет по абсолютной величине 0,01.
В соответствии с неравенством Чебышева вероятность того, что отклонение
случайной величины от ее математического ожидания будет меньше некоторого числа
Dx
) 1
, ограничена в соответствии с неравенством P( X m x
.
2
Надо определить математическое ожидание и дисперсию числа появления
события А при одном опыте. Для события А случайная величина может принимать
одно из двух значений: 1- событие появилось, 0- событие не появилось. При этом
вероятность значения 1 равна вероятности р=0,3, а вероятность значения 0- равна
вероятности ненаступления события А
q=1 – p =0,7.
По определению математического ожидания имеем:
m x 0 q 1 p p 0,3
Дисперсия: D x
(0
p) 2 q
(1
p) 2 p
pq
0,3 0,7
0,21
В случае п независимых испытаний получаем m x np; D x npq; Эти формулы
уже упоминались выше.
В нашем случае получаем: m x 3000 ; D x 2100 ;
Вероятность отклонения относительной частоты появления события А в п
испытаниях от вероятности на величину, не превышающую =0,01 равна:
m
P
p
P( m np n ) P( m mx n ) P( m 3000 100)
n
Выражение полученное в результате этих простых преобразований представляет
собой не что иное, как вероятность отклонения числа т появления события А от
математического ожидания на величину не большую, чем =100.
В соответствии с неравенством Чебышева эта вероятность будет не меньше, чем
Dx
2100
1
1 0,21 0,79.
величина 1
2
10000
Пример. Сколько следует проверить деталей, чтобы с вероятностью, не меньшей
0,96, можно было ожидать, что абсолютная величина отклонения относительной
частоты годных деталей от вероятности детали быть годной, равной 0,98, не превысит
0,02.
Условие задачи фактически означает, что выполняется неравенство:
n
P
0,98 0,02 0,96
m
Здесь п- число годных деталей, т- число проверенных деталей. Для применения
неравенства Чебышева преобразуем полученное выражение:
5
P ( n 0,98 m
Dx
0,96
2
0,02 m
После домножения выражения, стоящего в скобках, на т получаем вероятность
отклонения по модулю количества годных деталей от своего математического
ожидания, следовательно, можно применить неравенство Чебышева, т.е. эта
Dx
вероятность должна быть не меньше, чем величина 1
, а по условию задачи
(0,02 m) 2
еще и не меньше, чем 0,96.
Dx
Таким образом, получаем неравенство 0,96 1
. Как уже говорилось в
(0,02 m) 2
предыдущей задаче, дисперсия может быть найдена по формуле D x mpq .
Итого, получаем: D x
0,02 m) 1
(0,02 m) 2
m
0,96 (0,02 m) 2 ; m 0,98 0,02
0,98 0,02
;
0,04 0,0004
0,04 (0,02 m) 2 ;
m 1225
Т.е. для выполнения требуемых условий необходимо не менее 1225 деталей.
Пример. Суточная потребность электроэнергии в населенном пункте является
случайной величиной, математическое ожидание которой равно 3000 кВт/час, а
дисперсия составляет 2500. Оценить вероятность того, что в ближайшие сутки расход
электроэнергии в этом населенном пункте будет от 2500 до 3500 кВт/час.
Требуется найти вероятность попадания случайной величины в заданный
интервал:
P(2500 X 3500) ?
Крайние значения интервала отклоняются от математического ожидания на одну
и ту же величину, а именно – на 500. Тогда можно записать с учетом неравенства
Чебышева:
Dx
P(2500 X 3500) P( X m x 500) 1
5002
Отсюда получаем:
2500
0,99
250000
Т.е. искомая вероятность будет не меньше, чем 0,99.
P 1
Пример. Среднее квадратическое отклонение каждой из 2500 независимых
случайных величин не превосходит 3. Оценить вероятность того, что абсолютная
величина отклонения среднего арифметического этих случайных величин от среднего
арифметического их математических ожиданий не превосходит 0,3.
Требуется найти вероятность
6
n
p
n
Xi
i 1
P
M xi
i 1
n
0,3
n
Неравенство Чебышева в случае суммы случайных величин имеет вид:
n
n
Xi
i 1
P
n
M xi
i 1
n
1
n
Dxi
i 1
2
n
2
Если среднее квадратическое отклонение не превосходит 3, то, очевидно, дисперсия не
превосходит 9. Величина по условию задачи равна 0,3.
n
Тогда p 1
i 1
2
n
D xi
2
1
9n
. Отсюда получаем при n=2500:
n 0,09
p 1 0,04 0,96
2
Пример. Выборочным путем требуется определить среднюю длину
изготавливаемых деталей. Сколько нужно исследовать деталей, чтобы с вероятностью,
большей чем 0,9, можно было утверждать, что средняя длина отобранных изделий
будет отличаться от математического ожидания этого среднего (средняя длина деталей
всей партии) не более, чем на 0,001 см.? Установлено, что среднее квадратическое
отклонение длины детали не превышает 0,04 см.
По условию если среднее квадратическое отклонение не превышает 0,04, то
дисперсия, очевидно, не превышает (0,04)2. Также по условию задано, что
n
p
Xi
i 1
P
n
mx
0,001
0,9
Если преобразовать соотношение, стоящее в скобках и после этого применить
неравенство Чебышева, получаем:
n
P
n
Xi
nmx
0,001n
1
i 1
n 2 0,0012
n 0,04 2
0,9
n 2 0,001 2
0,1 0,001 2 n 0,04 2
1
n
0,04 2
0,1 0,001 2
n 16000
7
Dxi
i 1
0,9
Т.е. для достижения требуемой вероятности необходимо отобрать более 16000
деталей.
Описанный подход, как видно, позволяет решить множество чисто практических
задач.
Пример. Вероятность того, что наудачу выбранная деталь окажется
бракованной, при каждой проверке одна и та же и равна 0,2. Определить вероятность
того, что среди 50 наугад выбранных деталей бракованных окажется не менее 6.
Для того, чтобы воспользоваться теоремой Муавра - Лапласа найдем
математическое ожидание и дисперсию количества бракованных деталей в 50 – ти
отобранных:
mx np 50 0,2 10
Dx
npq 50 0,2 0,8 8
Фактически в задаче требуется определить вероятность того, что бракованных деталей
будет не менее шести, но и, очевидно, не более 50- ти.
P (6
X
50)
1
2
50 10
6 10
16
16
1
2
(10)
(1)
0,5 (1 0,8427)
0,92135
Значения функции Лапласа находятся по таблице. Конечно, значения функции
Лапласа Ф(10) в таблице нет, но т.к. в таблицах указано, что Ф(3)=1,0000, то все
значения от величин, превышающих 3 также равны 1. Дополнительно см. функция
Лапласа.
Пример. Известно, что 60% всего числа изготавливаемых заводом изделий
являются изделиями первого сорта. Приемщик берет первые попавшиеся 200 изделий.
Чему равна вероятность того, что среди них окажется из от 120 до 150 изделий первого
сорта?
Вероятность того, что деталь окажется первого сорта, равна, очевидно, 0,6.
Математическое ожидание числа изделий первого сорта равно:
m x np 200 0,6 120
По теореме Муавра - Лапласа получаем:
P(120
X
150)
1
2
150 120
96
120 120
96
1
2
(3,0619)
(0)
0,5 (1 0)
Пример. Проверкой установлено, что 96% изделий служат не меньше
гарантируемого срока. Наугад выбирают 15000 изделий. Найти вероятность того, что
со сроком службы менее гарантируемого будет от 570 до 630 изделий.
Вероятность того, что срок службы изделия будет менее гарантированного
равна:
8
0,5
1 – 0,96 = 0,04
Математическое ожидание числа таких изделий равно m x
np 15000 0,04
600
По теореме Муавра - Лапласа получаем:
P (570
X
(0,88 )
630 )
1
2
2 (1,25 )
630
600
570
1152
2 0,3944
600
1152
1
2
(0,88 )
( 0,88 )
0,7888
Случайные процессы.
Система массового обслуживания состоит из некоторого числа обслуживающих
единиц или каналов, работа которых состоит в выполнении поступающих по этим
каналам заявок.
Примеры систем массового обслуживания весьма распространены на практике.
Это различные телефонные станции, ремонтные мастерские и проч. Вид и количество
поступающих на эти системы заявок различны и, вообще говоря, случайны.
Теория массового обслуживания описывает закономерности функционирования
таких систем.
Определение. процесс функционирования системы массового обслуживания
называется случайным процессом.
Чтобы оптимизировать процесс функционирования системы массового
обслуживания его надо изучить и описать математически.
Теория массового обслуживания является очень быстро развивающимся
разделом теории вероятностей, т.к. ее применение на практике чрезвычайно широко.
Случайный процесс, протекающий в системе массового обслуживания состоит в
том, что система в случайные моменты времени переходит из одного состояния в
другое. Меняется число заявок, число занятых каналов, число заявок в очереди и проч.
Определение. Если переход системы из одного состояния в другое происходит
скачком, а количество состояний системы (конечное или бесконечное) можно
пронумеровать, то такая система называется системой дискретного типа.
Если количество возможных состояний счетно, то сумма вероятностей
нахождения системы в одном из состояний равна 1.
p k (t ) 1
k
Совокупность вероятностей pk(t) для каждого момента времени характеризует
данное сечение случайного процесса.
Случайные процессы со счетным множеством состояний бывают двух типов: c
дискретным или непрерывным временем.
Если переходы системы из одного состояния в другое могут происходить только
в строго определенные моменты времени, то случайный процесс будет процессом с
9
дискретным временем, а если переход возможен в любой момент времени, то процесс
будет процессом с непрерывным временем.
Поскольку в реальности заявки на систему массового обслуживания могут
поступать в любой момент времени, то большинство реальных систем массового
обслуживания будут системами с процессом с непрерывным временем.
Для того, чтобы описать случайный процесс в системе с непрерывным временем
необходимо прежде всего проанализировать причины, вызывающие изменение
состояния системы. Эти причины определяются потоком заявок, поступающих на
систему.
Поток событий.
Определение. Потоком событий называется последовательность событий,
происходящих один за другим в какие- то моменты времени.
Характер событий, образующих поток может быть различным, а если события
отличаются друг от друга только моментом времени, в который они происходят, то
такой поток событий называется однородным.
Однородный поток можно изобразить последовательностью точек на оси,
соответствующей времени:
t1
t2
tn
Определение. Поток событий называется регулярным, если события следует
одно за другим через строго определенные промежутки времени.
Определение. Поток событий называется стационарным, если вероятность
попадания того ли иного числа событий на участок времени зависит только от длины
участка и не зависит от того, где именно на оси расположен этот участок.
Стационарность потока событий означает, что плотность потока постоянна,
отсутствуют промежутки времени, в течение которых событий больше чем обычно.
Классический пример – “час пик” на транспорте.
Определение. Поток событий называется потоком без последействий, если
для любых неперекрещивающихся участков времени число событий, попадающих на
один из них, не зависит от числа событий, опадающих на другие.
Отсутствие последействий означает, что заявки в систему поступают
независимо друг от друга. Поток выходных событий систем массового обслуживания
обычно имеет последействие, даже если входной поток его не имеет. Пример – вход
пассажиров на станцию метро – поток без последействия, т.к. причины прихода
отдельного пассажира не связаны с причинами прихода всех остальных, а выход
пассажиров со станции – поток с последействием, т.к. он обусловлен прибытием
поезда.
Последействие, свойственное выходному потоку следует учитывать, если этот
поток в свою очередь является входным для какой- либо другой системы.
10
Определение. Поток событий называется ординарным, если вероятность
попадания на элементарный участок t двух или более событий достаточно мало по
сравнению с вероятностью попадания одного события.
Условие ординарности означает, что заявки на систему приходят по одному, а не
парами, тройками и т.д. Однако, если заявки поступают только парами, только
тройками и т.д., то такой поток легко свести к ординарному.
Определение. Если поток событий стационарен, ординарен и без
последействий, то такой поток называется простейшим (пуассоновским) потоком.
Это название связано с тем, что в этом случае число событий, попадающих на
любой фиксированный интервал времени, распределено по распределению Пуассона.
В соответствии с этим законом распределения математическое ожидание числа
точек, попавших попадающих на участок времени , имеет вид:
a
- плотность потока – среднее число событий в единицу времени.
Вероятность того, что за время произойдет ровно т событий, равна
(
Pm ( )
)m
e
m!
Вероятность того, что в течение данного времени не произойдет ни одного
события, равна:
P0 ( ) e
Пусть Т – промежуток времени между двумя произвольными соседними
событиями в простейшем потоке. Найдем функцию распределения
F (t ) P(T t )
В соответствии с законом распределения Пуассона, получаем:
F (t ) 1 e
t
;
f (t )
e
t
;
Математическое ожидание, дисперсия и среднее квадратическое отклонение
этой величины соответственно равны:
mt
1
1
; Dt
2
;
1
t
;
Таким образом, для величины Т получили показательный закон распределения.
Пример. В бюро обслуживания в среднем поступает 12 заявок в час. Считая
поток заказов простейшим, определить вероятность того, что: а) за 1 минуту не
поступит ни одного заказа, б) за 10 минут поступит не более трех заказов.
11
Сначала найдем плотность (интенсивность) потока, выразив ее в количестве
12
заявок в минуту. Очевидно, эта величина равна
0,2 .
60
Далее находим вероятность того, что за время = 1 мин не поступит ни одной
заявки по формуле:
P0 ( ) e
e 0, 2 0,819
Вероятность того, что за 10 минут поступит не более трех заказов будет
складываться из вероятностей того, что не поступит ни одного заказа, поступит один,
два или ровно три заказа.
P(m
3)
3
m 0
(
)m
e
m!
e
2
2e
2
4
e
2
2
8
e
6
2
19
e
3
2
0,8571
Пример. В ресторан прибывает в среднем 20 посетителей в час. Считая поток
посетителей простейшим, и зная, что ресторан открывается в 11.00, определите:
а) вероятность того, что в 11.12 в ресторан придет 20 посетителей при условии,
что в 11.07 их было 18
б) вероятность того, что между 11.28 и 11.30 в ресторане окажется новый
посетитель, если известно, что предшествующий посетитель прибыл в 11.25.
Для ответ на первый вопрос фактически надо найти вероятность того, что в
промежуток от 11.07 до 11.12 ( = 5 минут) придет ровно 2 посетителя. При этом мы
знаем интенсивность потока посетителей = 20/60 = 1/3 посетителей в минуту.
Конечно, данная величина носит условный характер, т.к. посетители не могут
приходить по частям.
Искомая вероятность равна:
2
1
5
1
5
3
P2 (5)
e 3
0,2623
2!
Теперь перейдем ко второму вопросу. Нам не сказано, сколько именно новых
посетителей будет в промежутке от 11.28 до 11.30, главное чтобы был хоть один. Эта
2
вероятность равна 1 P0 (2) 1 e 3 0,4866 . Здесь Р0 (2) – вероятность того, что в
этом промежутке не будет ни одного посетителя.
12