Биномиальное распределение и распределение Пуассона.
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 1. Первоначальные понятия и определения теории вероятностей.
Лекция № 3. Биномиальное распределение и распределение Пуассона.
План:
§ 1. Испытания Бернулли.
§ 2. Биномиальное распределение.
§ 3. Максимальная вероятность в биномиальном распределении.
§ 4. Закон больших чисел.
§ 5. Приближённая формула Пуассона.
§ 6. Распределение Пуассона.
§ 1). Определение 1. Повторные независимые испытания называются
испытаниями Бернулли, если при каждом испытании имеется только два возможных
исхода и вероятности этих исходов остаются неизменными для всех испытаний.
Принято называть исходы «успехом» У, и «неудачей» Н, а их вероятности обозначать
соответственно p и q. Ясно, что p и q – неотрицательны, причём
(1)
p + q = 1.
Замечания:1). ПЭС для каждого испытания состоит из двух точек У и Н.
2). ПЭС для n испытаний Бернулли содержит 2n точек или последовательностей
из n символов У и Н; каждая точка представляет собой возможный исход составного
опыта.
Вывод 1: Иными словами, вероятность какой-либо последовательности равна
произведению, полученному из этой последовательности соответственной заменой
букв У и Н на p и q. Например, Р(УУНУН…ННУ) = ppqpq…qqp.
Примеры. 1). Наиболее известным примером испытаний Бернулли является
последовательное бросание правильной, т.е. симметричной монеты, тогда: p = q = . В
случае несимметричной монеты мы по-прежнему считаем последовательные бросания
независимыми, так что имеем модель испытаний Бернулли, в которой вероятность
успеха p может быть произвольной.
2). Повторные случайные извлечения красного шара из урны, содержащей при
каждом опыте r красных и b чёрных шаров, являются испытаниями Бернулли с
.
Испытания Бернулли – теоретическая схема, и только практика может показать,
подходит ли эта схема для описания данного физического опыта. Для промышленного
контроля качества продукции и т. п. схема испытаний Бернулли дает идеальный
стандарт, даже, несмотря на то, что этот стандарт никогда не достигается вполне
точно. Целью текущего контроля является обнаружение уже на ранней стадии
существенных отступлений от идеальной схемы и использование их как указаний на
угрожающее нарушение правильности работы машин.
1
§ 2). Часто представляет интерес лишь суммарное количество успехов,
достигнутых в последовательности из n испытаний Бернулли, независимо от порядка
их следования. Число успехов может быть равно 0, 1, …, n и нашей первой задачей
является определение соответствующих вероятностей.
Событие «n испытаний Бернулли привели k раз к успеху и (n – k) раз к неудаче»
содержит столько элементарных событий, сколькими способами можно k букв У
распределить по n местам, т. е.
точек, а каждая точка, по определению, имеет
вероятность
. Таким образом, доказана следующая
Теорема 1. Пусть
– это вероятность того, что n испытаний Бернулли с
вероятностью успеха p и вероятностью неудачи q = 1 – p привели k раз к успеху и (n –
k) раз к неудаче
. Тогда
(2)
Следствия из Т1: 1). Вероятность не иметь ни одного успеха равна
.
2). Вероятность иметь хотя бы 1 успех равна
1–
Считая p постоянной величиной, обозначим число успехов в n испытаниях через
; тогда
. Согласно общей терминологии,
является случайной
величиной, а функция (2) определяет распределение этой случайной величины; будем
называть
это
распределение
биномиальным
распределением.
Название
«биномиальное» связано с тем, что (2) представляет собой k-й член биномиального
разложения
. Это также доказывает, что
Биномиальное распределение затабулировано.
Пример (задача о снабжении энергией). Допустим, что n = 10 рабочих время от
времени используют электроэнергию. Чтобы получить первое приближение об
ожидаемой нагрузке, представим себе, что в любой момент времени каждому
рабочему с одной и той же вероятностью p может потребоваться единица энергии.
Если рабочие трудятся независимо, то вероятность того, что энергия потребуется
одновременно k рабочим, равна
. Если один рабочий потребляет энергию в
среднем 12 мин. В течение часа, то следует положить
. Тогда вероятность того,
что не менее семи рабочих одновременно будут использовать электроэнергию,
равна
Другими словами, если снабжение
рассчитано на 6 единиц энергии, то вероятность перегрузки равна
. Это
означает, что одна перегрузка приходится в среднем на 1157 мин., т.е. приблизительно
на 12 часов рабочего времени.
§ 3). Из формулы (2) видно, что
(3)
В соответствии с формулой (3) вероятность
больше предшествующей
вероятности
, если
, и меньше её, если
. Если
2
(4)
– целое число, то
число m, такое что
. Имеется только одно целое
Таким образом, доказана следующая
Теорема 2. Если k изменяется от 0 до n, то вероятность
сначала монотонно
возрастает, а затем монотонно убывает, достигая своего наибольшего значения при k =
m, исключая тот случай, когда при m = (n+1)p имеет место равенство
Замечания:1). Будем называть
максимальной вероятностью или
наивероятнейшим числом успехов.
2). Следует помнить, что больших значениях n все вероятности
малы,
включая и максимальную. Так, при 100 бросаниях правильной монеты
наивероятнейшее число выпадений герба равно m = 101 * 0,5 = 50, но вероятность
этого события меньше, чем 0,08.
Очевидно, что отношение, стоящее в правой части формулы (3) монотонно
убывает в возрастание k; таким образом, при
.
Полагая последовательно
получаем
(5)
и перемножая
неравенств,
(6)
При
дробь в скобках (6) меньше, чем 1, и суммирование по
конечной геометрической прогрессии со знаменателем
приводит к
. Отсюда вытекает, что
при
(7)
Эта формула позволяет оценивать правый «хвост» биномиального распределения, а
именно вероятность не менее чем r успехов. Аналогичные рассуждения в применении
к левому «хвосту» показывают, что при
(8)
Итак, доказана
Теорема 3. Если
неравенству (7); если
, то вероятность не менее чем r успехов удовлетворяет
, то вероятность не более чем s успехов удовлетворяет (8).
§ 4). Если Sn – число успехов в n испытаниях, то средняя доля успехов
должна
быть близка к р. Придадим этому утверждению точный смысл. Рассмотрим, например,
вероятность того, что
превосходит
фиксированное число. Эта вероятность совпадает с
произвольно малое, но
и равна левой
3
части (7), где r представляет собой наименьшее целое число, превосходящее
Неравенство (7) позволяет заключить, что
.
(9)
При возрастании n дробь в правой части (9) остается ограниченной. В то же время
, так как
для любого
, а таких членов
имеется приблизительно . Отсюда вытекает, что при неограниченном возрастании n
имеет место предельное соотношение
Используя формулу (8)
аналогично можно доказать, что
Объединяя эти неравенства,
получаем, что
(10)
Другими словами, вероятность того, что средняя доля успехов отклоняется от р
больше, чем на любое наперёд заданное число , стремится к нулю с возрастанием
n. Это одна из форм закона больших чисел, которая и служит основой для
интуитивного представления о вероятности как мере действительной частоты.
§ 5). Во многих приложениях встречаются испытания Бернулли, в которых n
относительно велико, р относительно мало, а произведение
(11)
не мало, но и не велико. В таких случаях удобна приближённая формула Пуассона для
, которую мы докажем.
Согласно следствию 1 из формулы (2)
, или, если подставить р из
(11),
.
(12)
Логарифмируя и раскладывая в ряд Тейлора, получаем
(13)
так что для больших n:
4