Теории вероятностей; случайные события; алгебра событий

👀 813 просмотров
📌 767 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Теории вероятностей; случайные события; алгебра событий», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Теории вероятностей; случайные события; алгебра событий», Word формат

Лекция 1. Предмет теории вероятностей. Случайные события. Алгебра событий. Относительная частота и вероятность случайного события. Полная группа событий. Классическое определение вероятности. Основные свойства вероятности. Основные формулы комбинаторики. В различных разделах науки и техники нередко возникают ситуации, когда результат каждого из многих проводимых опытов заранее предугадать невозможно, однако можно исследовать закономерности, возникающие при проведении серии опытов. Нельзя, например, точно сказать, какая сторона монеты окажется сверху при данном броске: герб или цифра – но при большом количестве бросков число выпадений герба приближается к половине количества бросков; нельзя заранее предсказать результат одного выстрела из данного орудия по данной цели, но при большом числе выстрелов частота попадания приближается к некоторому постоянному числу. Исследование вероятностных закономерностей массовых однородных явлений составляет предмет теории вероятностей. Основным интуитивным понятием классической теории вероятностей является случайное событие. События, которые могут произойти в результате опыта, можно подразделить на три вида: а) достоверное событие – событие, которое всегда происходит при проведении опыта; б) невозможное событие – событие, которое в результате опыта произойти не может; в) случайное событие – событие, которое может либо произойти, либо не произойти. Например, при броске игральной кости достоверным событием является выпадение числа очков, не превышающего 6, невозможным – выпадение 10 очков, а случайным – выпадение 3 очков. Алгебра событий. Определение 1.1. Суммой А+В двух событий А и В называют событие, состоящее в том, что произошло хотя бы одно из событий А и В. Суммой нескольких событий, соответственно, называется событие, заключающееся в том, что произошло хотя бы одно из этих событий. Пример 1. Два стрелка делают по одному выстрелу по мишени. Если событие А – попадание первого стрелка, а событие В – второго, то сумма А+В – это хотя бы одно попадание при двух выстрелах. Пример 2. Если при броске игральной кости событием Аi назвать выпадение i очков, то выпадение нечетного числа очков является суммой событий А1+А2+А3. Назовем все возможные результаты данного опыта его исходами и предположим, что множество этих исходов, при которых происходит событие А (исходов, благоприятных событию А), можно представить в виде некоторой области на плоскости. Тогда множество исходов, при которых произойдет событие А+В, является объединением множеств исходов, благоприятных событиям А или В (рис. 1). А В А+В Рис.1. Определение 1.2. Произведением АВ событий А и В называется событие, состоящее в том, что произошло и событие А, и событие В. Аналогично произведением нескольких событий называется событие, заключающееся в том, что произошли все эти события. Пример 3. В примере 1 ( два выстрела по мишени) событием АВ будет попадание обоих стрелков. Пример 4. Если событие А состоит в том, что из колоды карт извлечена карта пиковой масти, а событие В – в том, что из колоды вынута дама, то событием АВ будет извлечение из колоды дамы пик. Геометрической иллюстрацией множества исходов опыта, благоприятных появлению произведения событий А и В, является пересечение областей, соответствующих исходам, благоприятным А и В. А В АВ Рис.2. Определение 1.3. Разностью А\B событий А и В называется событие, состоящее в том, что А произошло, а В – нет. Пример 5. Вернемся к примеру 1, где А\ В – попадание первого стрелка при промахе второго. 2 Пример 6. В примере 4 А\В – извлечение из колоды любой карты пиковой масти, кроме дамы. Наоборот, В \А – извлечение дамы любой масти, кроме пик. А В А-В Рис.3. Введем еще несколько категорий событий. Определение 1.4. События А и В называются совместными, если они могут произойти оба в результате одного опыта. В противном случае (то есть если они не могут произойти одновременно) события называются несовместными. Примеры: совместными событиями являются попадания двух стрелков в примере 1 и появление карты пиковой масти и дамы в примере 4; несовместными – события А1 – А6 в примере 2. Замечание 1. Если изобразить графически области исходов опыта, благоприятных несовместным событиям, то они не будут иметь общих точек. Замечание 2. Из определения несовместных событий следует, что их произведение является невозможным событием. Определение 1.5. Говорят, что события А1, А2,…,Ап образуют полную группу, если в результате опыта обязательно произойдет хотя бы одно из событий этой группы. Замечание. В частности, если события, образующие полную группу, попарно несовместны, то в результате опыта произойдет одно и только одно из них. Такие события называют элементарными событиями. Пример. В примере 2 события А1 – А6 (выпадение одного, двух,…, шести очков при одном броске игральной кости) образуют полную группу несовместных событий. Определение 1.6. События называются равновозможными, если нет оснований считать, что одно из них является более возможным, чем другое. 3 Примеры: выпадение любого числа очков при броске игральной кости, появление любой карты при случайном извлечении из колоды, выпадение герба или цифры при броске монеты и т.п. Классическое определение вероятности. При изучении случайных событий возникает необходимость количественно сравнивать возможность их появления в результате опыта. Например, при последовательном извлечении из колоды пяти карт более возможна ситуация, когда появились карты разных мастей, чем появление пяти карт одной масти; при десяти бросках монеты более возможно чередование гербов и цифр, нежели выпадение подряд десяти гербов, и т.д. Поэтому с каждым таким событием связывают по определенному правилу некоторое число, которое тем больше, чем более возможно событие. Это число называется вероятностью события и является вторым основным понятием теории вероятностей. Отметим, что само понятие вероятности, как и понятие случайного события, является аксиоматическим и поэтому не поддается строгому определению. То, что в дальнейшем будет называться различными определениями вероятности, представляет собой способы вычисления этой величины. Определение 1.7. Если все события, которые могут произойти в результате данного опыта, а) попарно несовместны; б) равновозможны; в) образуют полную группу, то говорят, что имеет место схема случаев. Можно считать, что случаи представляют собой все множество исходов опыта. Пусть их число равно п ( число возможных исходов), а при т из них происходит некоторое событие А (число благоприятных исходов). Определение 1.8. Вероятностью события А называется отношение числа исходов опыта, благоприятных этому событию, к числу возможных исходов: р ( А)  т п - (1.1) - классическое определение вероятности. Свойства вероятности. Из определения 1.8 вытекают следующие свойства вероятности: Свойство 1. Вероятность достоверного события равна единице. Доказательство. Так как достоверное событие всегда происходит в результате опыта, то все исходы этого опыта являются для него благоприятными, то есть т = п, следовательно, Р(А) = 1. 4 Свойство 2. Вероятность невозможного события равна нулю. Доказательство. Для невозможного события ни один исход опыта не является благоприятным, поэтому т = 0 и р(А) = 0. Свойство 3. Вероятность случайного события есть положительное число, заключенное между нулем и единицей. Доказательство. Случайное событие происходит при некоторых исходах опыта, но не при всех, следовательно, 0 < m < n, и из (1.1) следует, что 0 < p(A) < 1. Пример. Из урны, содержащей 6 белых и 4 черных шара, наудачу вынут шар. Найти вероятность того, что он белый. Решение. Будем считать элементарными событиями, или исходами опыта, извлечение из урны каждого из имеющихся в ней шаров. Очевидно, что эти события удовлетворяют всем условиям, позволяющим считать их схемой случаев. Следовательно, число возможных исходов равно 10, а число исходов, благоприятных событию А (появлению белого шара) – 6 (таково количество белых шаров в урне). Значит, р( А)  т 6   0,6. п 10 Относительная частота. Статистическое определение вероятности. Классическое определение вероятности применимо только для очень узкого класса задач, где все возможные исходы опыта можно свести к схеме случаев. В большинстве реальных задач эта схема неприменима. В таких ситуациях требуется определять вероятность события иным образом. Для этого введем вначале понятие относительной частоты W(A) события A как отношения числа опытов, в которых наблюдалось событие А, к общему количеству проведенных испытаний: W ( A)  M , N (1.2) где N – общее число опытов, М – число появлений события А. Большое количество экспериментов показало, что если опыты проводятся в одинаковых условиях, то для большого количества испытаний относительная частота изменяется мало, колеблясь около некоторого постоянного числа. Это число можно считать вероятностью рассматриваемого события. Определение 1.9. Статистической вероятностью события считают его относительную частоту или число, близкое к ней. 5 Замечание 1. Из формулы (1.2) следует, что свойства вероятности, доказанные для ее классического определения, справедливы и для статистического определения вероятности. Замечание 2. Для существования статистической вероятности события А требуется: 1) возможность производить неограниченное число испытаний; 2) устойчивость относительных частот появления А в различных сериях достаточно большого числа опытов. Замечание 3. Недостатком статистического определения является неоднозначность статистической вероятности. Пример. Если в задаче задается вероятность попадания в мишень для данного стрелка (скажем, р = 0,7), то эта величина получена в результате изучения статистики большого количества серий выстрелов, в которых этот стрелок попадал в мишень около семидесяти раз из каждой сотни выстрелов. Основные формулы комбинаторики. При вычислении вероятностей часто приходится использовать некоторые формулы комбинаторики – науки, изучающей комбинации, которые можно составить по определенным правилам из элементов некоторого конечного множества. Определим основные такие комбинации. Определение 1.10. Перестановки – это комбинации, составленные из всех п элементов данного множества и отличающиеся только порядком их расположения. Число всех возможных перестановок Рп = п! (1.3) Пример. Сколько различных списков (отличающихся порядком фамилий) можно составить из 7 различных фамилий? Решение. Р7 = 7! = 2·3·4·5·6·7 = 5040. Определение 1.11. Размещения – комбинации из т элементов множества, содержащего п различных элементов, отличающиеся либо составом элементов, либо их порядком. Число всех возможных размещений (1.4) Апт  п(п  1)(п  2)...(п  т  1). Пример. Сколько возможно различных вариантов пьедестала почета (первое, второе, третье места), если в соревнованиях принимают участие 10 человек? Решение. А103  10  9  8  720 . Определение 1.12. Сочетания – неупорядоченные наборы из т элементов множества, содержащего п различных элементов (то есть наборы, отличающиеся только составом элементов). Число сочетаний С пт  п! . т!(п  т)! (1.5) 6 Пример. В отборочных соревнованиях принимают участие 10 человек, из которых в финал выходят трое. Сколько может быть различных троек финалистов? Решение. В отличие от предыдущего примера, здесь не важен порядок финалистов, следовательно, ищем число сочетаний из 10 по 3: С103  10! 8  9  10   120. 3!7! 6 Лекция 2. Геометрические вероятности. Теорема сложения вероятностей. Противоположные события. Условные вероятности. Теорема умножения вероятностей. Независимые события. Вероятность появления хотя бы одного события. Одним из недостатков классического определения вероятности является то, что оно неприменимо к испытаниям с бесконечным количеством исходов. В таких случаях можно воспользоваться понятием геометрической вероятности. Пусть на отрезок L наудачу брошена точка. Это означает, что точка обязательно попадет на отрезок L и с равной возможностью может совпасть с любой точкой этого отрезка. При этом вероятность попадания точки на любую часть отрезка L не зависит от расположения этой части на отрезке и пропорциональна его длине. Тогда вероятность того, что брошенная точка попадет на отрезок l, являющийся частью отрезка L, вычисляется по формуле: p l , L (2.1) где l – длина отрезка l, а L – длина отрезка L. Можно дать аналогичную постановку задачи для точки, брошенной на плоскую область S и вероятности того, что она попадет на часть этой области s: p s , S (2.1`) где s – площадь части области, а S – площадь всей области. В трехмерном случае вероятность того, что точка, случайным образом расположенная в теле V, попадет в его часть v, задается формулой: p v , V (2.1``) где v – объем части тела, а V – объем всего тела. Пример 1. Найти вероятность того, что точка, наудачу брошенная в круг, не попадет в правильный шестиугольник, вписанный в него. 7 Решение. Пусть радиус круга равен R , тогда сторона шестиугольника тоже равна R. При этом площадь круга S  R 2 , а площадь шестиугольника s 3 3 2 R . Следовательно, 2 p Ss  S 3 3 2 R  3 3 2   0,174. 2 2 R R 2  Пример 2. На отрезок АВ случайным образом брошены три точки: С, D и М. Найти вероятность того, что из отрезков АС, АD и АМ можно построить треугольник. Решение. Обозначим длины отрезков АС, АD и АМ через x, y и z и рассмотрим в качестве возможных исходов множество точек трехмерного пространства с координатами (х, у, z). Если принять длину отрезка равной 1, то эти множество возможных исходов представляет собой куб с ребром, равным 1. Тогда множество благоприятных исходов состоит из точек, для координат которых выполнены неравенства треугольника: x + y > z, x + z > y, y + z > x. Это часть куба, отрезанная от него плоскостями x + y = z, x + z = y, y+z=x х Рис.1. (одна из них, плоскость x + y = z, проведена на рис.1). Каждая такая плоскость отделяет от куба пирамиду, объем которой равен 1 1 1  1  . 3 2 6 Следовательно, объем оставшейся части v  1 3 1 1 v 1 1  . Тогда p   : 1  . 6 2 V 2 2 Теорема сложения вероятностей. Теорема 2.1 (теорема сложения). Вероятность р (А + В) суммы событий А и В равна Р (А + В) = р (А) + р (В) – р (АВ). (2.2) Доказательство. Докажем теорему сложения для схемы случаев. Пусть п – число возможных исходов опыта, тА – число исходов, благоприятных событию А, тВ – число исходов, благоприятных событию В, а тАВ – число исходов опыта, при которых происходят оба события (то есть исходов, благоприятных произведению АВ). Тогда число исходов, при которых имеет место событие 8 А + В, равно тА + тВ – тАВ (так как в сумме (тА + тВ) тАВ учтено дважды: как исходы, благоприятные А, и исходы, благоприятные В). Следовательно, вероятность суммы можно определить по формуле (1.1): р ( А  В)  т А  тВ  т АВ т А тВ т АВ     р( А)  р( В)  р( АВ), п п п п что и требовалось доказать. Следствие 1. Теорему 2.1 можно распространить на случай суммы любого числа событий. Например, для суммы трех событий А, В и С Р(А + В + С) = р(А) + р(В) + р(С) – р(АВ) – р(АС) – р(ВС) + р(АВС) (2.3) и т.д. Следствие 2. Если события А и В несовместны, то тАВ = 0, и, следовательно, вероятность суммы несовместных событий равна сумме их вероятностей: Р(А + В) = р(А) + р(В). (2.4) Определение 2.1. Противоположными событиями называют два несовместных события, образующих полную группу. Если одно из них назвать А, то второе принято обозначать А . Замечание. Таким образом, А заключается в том, что событие А не произошло. Теорема 2.2. Сумма вероятностей противоположных событий равна 1: р(А) + р( А ) = 1. (2.5) Доказательство. Так как А и А образуют полную группу, то одно из них обязательно произойдет в результате опыта, то есть событие А + А является достоверным. Следовательно, Р( А + А ) = 1. Но, так как А и А несовместны, из (2.4) следует, что Р(А + А ) = р(А) + р( А ). Значит, р(А) + р( А ) = 1, что и требовалось доказать. Замечание. В ряде задач проще искать не вероятность заданного события, а вероятность события, противоположного ему, а затем найти требуемую вероятность по формуле (2.5). Пример. Из урны, содержащей 2 белых и 6 черных шаров, случайным образом извлекаются 5 шаров. Найти вероятность того, что вынуты шары разных цветов. Решение. Событие А , противоположное заданному, заключается в том, что из урны вынуто 5 шаров одного цвета, а так как белых шаров в ней всего два, то этот цвет может быть только черным. Множество возможных исходов опыта найдем по формуле (1.5): п  С85  8! 6 7 8   56, 5!3! 6 9 а множество исходов, благоприятных событию А - это число возможных наборов по 5 шаров только из шести черных: т А  С65  6. Тогда р( А )  6 3 3 25  , а р( А)  1   . 56 28 28 28 Теорема умножения вероятностей. Определение 2.2. Назовем условной вероятностью р(В/А) события В вероятность события В при условии, что событие А произошло. Замечание. Понятие условной вероятности используется в основном в случаях, когда осуществление события А изменяет вероятность события В. Примеры: 1) пусть событие А – извлечение из колоды в 32 карты туза, а событие В – то, что и вторая вынутая из колоды карта окажется тузом. Тогда, если после первого раза карта была возвращена в колоду, то вероятность вынуть вторично туз не меняется: р( В)  р( А)  4 1   0,125. Если же 32 8 первая карта в колоду не возвращается, то осуществление события А приводит к тому, что в колоде осталась 31 карта, из которых только 3 туза. Поэтому р( В / А)  3  0,097. 31 2) если событие А – попадание в самолет противника при первом выстреле из орудия, а В – при втором, то первое попадание уменьшает маневренность самолета, поэтому р(В/А) увеличится по сравнению с р(А). Теорема 2.3 (теорема умножения). Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого при условии, что первое событие произошло: р (АВ) = р (А) · р (В/А). (2.6) Доказательство. Воспользуемся обозначениями теоремы 2.1. Тогда для вычисления р(В/А) множеством возможных исходов нужно считать тА (так как А произошло), а множеством благоприятных исходов – те, при которых произошли и А, и В ( тАВ ). Следовательно, р( В / А)  т АВ т АВ п    р( АВ) : р( А), откуда следует утверждение теоремы. тА п тА Пример. Для поражения цели необходимо попасть в нее дважды. Вероятность первого попадания равна 0,2, затем она не меняется при промахах, но после первого попадания увеличивается вдвое. Найти вероятность того, что цель будет поражена первыми двумя выстрелами. 10 Решение. Пусть событие А – попадание при первом выстреле, а событие В – попадание при втором. Тогда р (А) = 0,2, р (В/А) = 0,4, р (АВ) = 0,2·0,4 = 0,08. Следствие. Если подобным образом вычислить вероятность события ВА, совпадающего с событием АВ, то получим, что р (ВА) = р (В) · р (А/В). Следовательно, р (А) · р (В/А) = р (В) · р (А/В). (2.7) Определение 2.3. Событие В называется независимым от события А, если появление события А не изменяет вероятности В, то есть р (В/А) = р (В). Замечание. Если событие В не зависит от А, то и А не зависит от В. Действительно, из (2.7) следует при этом, что р (А) · р (В) = р (В) · р (А/В), откуда р (А/В) = р (А). Значит, свойство независимости событий взаимно. Теорема умножения для независимых событий имеет вид: р (АВ) = р (А) · р (В) , (2.8) то есть вероятность произведения независимых событий равна произведению их вероятностей. При решении задач теоремы сложения и умножения обычно применяются вместе. Пример. Два стрелка делают по одному выстрелу по мишени. Вероятности их попадания при одном выстреле равны соответственно 0,6 и 0,7. Найти вероятности следующих событий: А – хотя бы одно попадание при двух выстрелах; В – ровно одно попадание при двух выстрелах; С – два попадания; D – ни одного попадания. Решение. Пусть событие Н1 – попадание первого стрелка, Н2 – попадание второго. Тогда А = Н1 + Н2, В =Н1  Н 2  Н 1  Н 2 , С  Н 1  Н 2 , D  H 1  H 2 . События Н1 и Н2 совместны и независимы, поэтому теорема сложения применяется в общем виде, а теорема умножения – в виде (2.8). Следовательно, р(С) = 0,6·0,7 = 0,42, р(А) = 0,6 + 0,7 – 0,42 = 0,88, р(B) = 0,6·0,3 + 0,7·0,4 = 0,46 (так как события Н 1  Н 2 и Н 1  Н 2 несовместны), р(D) = 0,4·0,3 = 0,12. Заметим, что события А и D являются противоположными, поэтому р(А) = 1 – р(D). Вероятность появления хотя бы одного события. Теорема 2.4. Вероятность появления хотя бы одного из попарно независимых событий А1, А2,…, Ап равна р (А) = 1 – q1q2…qn , (2.9) где qi – вероятность события Аi , противоположного событию Аi . 11 Доказательство. Если событие А заключается в появлении хотя бы одного события из А1, А2,…, Ап, то события А и А1 А2 ... Ап противоположны, поэтому по теореме 2.2 сумма их вероятностей равна 1. Кроме того, поскольку А1, А2,…, Ап независимы, то независимы и А1 , А2 ,..., Ап , следовательно, р( А1 А2 ... Ап ) = р( А1 ) р( А2 )... р( Ап )  q1q2 ...qn . Отсюда следует справедливость формулы (2.9). Пример. Сколько нужно произвести бросков монеты, чтобы с вероятностью не менее 0,9 выпал хотя бы один герб? Решение. Вероятность выпадения герба при одном броске равна вероятности противоположного события (выпадения цифры) и равна 0,5. Тогда вероятность выпадения хотя бы одного герба при п выстрелах равна 1- (0,5)п . Тогда из решения неравенства 1- (0,5)п > 0,9 следует, что п > log210 ≥ 4. Лекция 3. Формула полной вероятности и формула Байеса. Схема и формула Бернулли. Приближение Пуассона для схемы Бернулли. Определение 3.1. Пусть событие А может произойти только совместно с одним из событий Н1, Н2,…, Нп, образующих полную группу несовместных событий. Тогда события Н1, Н2,…, Нп называются гипотезами. Теорема 3.1. Вероятность события А, наступающего совместно с гипотезами Н1, Н2,…, Нп, равна: n р ( А)   p ( H i ) p ( A / H i ), (3.1) i 1 где p(Hi) – вероятность i- й гипотезы, а p(A/Hi) – вероятность события А при условии реализации этой гипотезы. Формула (3.1) носит название формулы полной вероятности. Доказательство. Можно считать событие А суммой попарно несовместных событий АН1, АН2,…, АНп. Тогда из теорем сложения и умножения следует, что n р ( А)  р ( АН 1  АН 2  ...  АН п )  р ( АН 1 )  р ( АН 2 )  ...  р ( АН п )   p ( H i ) p ( A / H i ), i 1 что и требовалось доказать. Пример. Имеются три одинаковые урны с шарами. В первой из них 3 белых и 4 черных шара, во второй – 2 белых и 5 черных, в третьей – 10 черных шаров. Из случайно выбранной урны наудачу вынут шар. Найти вероятность того, что он белый. Решение. Будем считать гипотезами Н1, Н2 и Н3 выбор урны с соответствующим номером. Так как по условию задачи все гипотезы 12 1 3 равновозможные, то р( Н 1 )  р( Н 2 )  р( Н 3 )  . Найдем условную вероятность А при реализации каждой гипотезы: р( А / Н 1 )  3 2 1 3 1 2 1 5 , р( А / Н 2 )  , р( А / Н 3 )  0. Тогда р( А)       0   0,238. 7 7 3 7 3 7 3 21 Формула Байеса (теорема гипотез). Пусть известен результат опыта, а именно то, что произошло событие А. Этот факт может изменить априорные (то есть известные до опыта) вероятности гипотез. Например, в предыдущем примере извлечение из урны белого шара говорит о том, что этой урной не могла быть третья, в которой нет белых шаров, то есть р (Н3/А) = 0. Для переоценки вероятностей гипотез при известном результате опыта используется формула Байеса: p( H i ) p( A / H i ) . (3.2) p ( A) Действительно, из (2.7) получим, что p( A) p( H i / A)  p( H i ) p( A / H i ), откуда р ( Н i / A)  следует справедливость формулы (3.2). Пример. После двух выстрелов двух стрелков, вероятности попаданий которых равны 0,6 и 0,7, в мишени оказалась одна пробоина. Найти вероятность того, что попал первый стрелок. Решение. Пусть событие А – одно попадание при двух выстрелах, а гипотезы: Н1 – первый попал, а второй промахнулся, Н2 – первый промахнулся, а второй попал, Н3 – оба попали, Н4 – оба промахнулись. Вероятности гипотез: р(Н1) = 0,6·0,3 = 0,18, р(Н2) = 0,4·0,7 = 0,28, р(Н3) = 0,6·0,7 = 0,42, р(Н4) = 0,4·0,3 = 0,12. Тогда р(А/Н1) = р(А/Н2) = 1, р(А/Н3) = р(А/Н4) = 0. Следовательно, полная вероятность р(А) = 0,18·1 + 0,28·1 + 0,42·0 + 0,12·0 = 0,46. Применяя формулу Байеса, получим: р( Н 1 / А)  0,18  1 9   0,391. 0,46 23 Схема повторения испытаний. Формула Бернулли. Рассмотрим серию из п испытаний, в каждом из которых событие А появляется с одной и той же вероятностью р, причем результат каждого испытания не зависит от результатов остальных. Подобная постановка задачи называется схемой повторения испытаний. Найдем вероятность того, что в такой серии событие А произойдет ровно к раз (неважно, в какой 13 последовательности). Интересующее нас событие представляет собой сумму равно-вероятных несовместных событий, заключающихся в том, что А произошло в некоторых к испытаниях и не произошло в остальных п – к испытаниях. Число таких событий равно числу сочетаний из п по к, то есть С пк , а вероятность каждого из них: pkqn-k, где q = 1 – p – вероятность того, что в данном опыте А не произошло. Применяя теорему сложения для несовместных событий, получим формулу Бернулли: (3.3) pn (k )  Cnk  p k  q nk . Пример. Для получения приза нужно собрать 5 изделий с особым знаком на этикетке. Найти вероятность того, что придется купить 10 изделий, если этикетки с этим знаком имеют 5% изделий. Решение. Из постановки задачи следует, что последнее купленное изделие имеет особый знак. Следовательно, из предыдущих девяти эти знаки имели 4 изделия. Найдем вероятность этого по формуле Бернулли: p9 (4)  C94  (0,05) 4  (0,95) 5  0,0006092. Тогда р = 0,0006092·0,05 = 0,0000304. Приближение Пуассона для схемы Бернулли. Формула Бернулли требует громоздких расчетов при большом количестве испытаний. Можно получить более удобную для расчетов приближенную формулу, если при большом числе испытаний вероятность появления А в одном опыте мала, а произведение пр = λ сохраняет постоянное значение для разных серий опытов (то есть среднее число появлений события А в разных сериях испытаний остается неизменным). Применим формулу Бернулли: nk n(n  1)(n  2)...(n  k  1) k n(n  1)...(n  k  1)       p (1  p) nk    1   . k! k! n  n Найдем предел полученного выражения при n   : n k   1  2   k  1    nk  k k k         p n (k )  lim 1  1  1  ...1  1   lim1   1     e  1.   k! n  n  n   n  n   k! n n   n  k! k p n (k )  Таким образом, формула Пуассона p n (k )  k e   k! (3.4) позволяет найти вероятность к появлений события А для массовых (п велико) и редких (р мало) событий. 14 Лекция 4. Случайные величины. Закон распределения и функция распределения дискретной случайной величины. Биномиальное распределение и распределение Пуассона. Наряду с понятием случайного события в теории вероятности используется и более удобное понятие случайной величины. Определение 4.1. Случайной величиной называется величина, принимающая в результате опыта одно из своих возможных значений, причем заранее неизвестно, какое именно. Будем обозначать случайные величины заглавными буквами латинского алфавита (Х, Y,Z,…), а их возможные значения – соответствующими малыми буквами (xi, yi,…). Примеры: число очков, выпавших при броске игральной кости; число появлений герба при 10 бросках монеты; число выстрелов до первого попадания в цель; расстояние от центра мишени до пробоины при попадании. Можно заметить, что множество возможных значений для перечисленных случайных величин имеет разный вид: для первых двух величин оно конечно (соответственно 6 и 11 значений), для третьей величины множество значений бесконечно и представляет собой множество натуральных чисел, а для четвертой – все точки отрезка, длина которого равна радиусу мишени. Таким образом, для первых трех величин множество значений из отдельных (дискретных), изолированных друг от друга значений, а для четвертой оно представляет собой непрерывную область. По этому показателю случайные величины подразделяются на две группы: дискретные и непрерывные. Определение 4.2. Случайная величина называется дискретной, если она принимает отдельные, изолированные возможные значения с определенными вероятностями. Определение 4.3. Случайная величина называется непрерывной, если множество ее возможных значений целиком заполняет некоторый конечный или бесконечный промежуток. Дискретные случайные величины. Для задания дискретной случайной величины нужно знать ее возможные значения и вероятности, с которыми принимаются эти значения. Соответствие между ними называется законом распределения случайной величины. Он может иметь вид таблицы, формулы или графика. Таблица, в которой перечислены возможные значения дискретной случайной величины и соответствующие им вероятности, называется рядом распределения: xi pi x1 p1 … … x2 p2 15 xn pn … … Заметим, что событие, заключающееся в том, что случайная величина примет одно из своих возможных значений, является достоверным, поэтому n() p i 1 i  1. Пример. Два стрелка делают по одному выстрелу по мишени. Вероятности их попадания при одном выстреле равны соответственно 0,6 и 0,7. Составить ряд распределения случайной величины Х – числа попаданий после двух выстрелов. Решение. Очевидно, что Х может принимать три значения: 0, 1 и 2. Их вероятности найдены в примере, рассмотренном в лекции 3. Следовательно, ряд распределения имеет вид: хi 0 1 2 pi 0,12 0,46 0,42 Графически закон распределения дискретной случайной величины можно представить в виде многоугольника распределения – ломаной, соединяющей точки плоскости с координатами (xi, pi). x1 x2 x3 x4 x5 Функция распределения. Определение 4.4. Функцией распределения F(x) случайной величины Х называется вероятность того, что случайная величина примет значение, меньшее х: F (x) = p (X < x). (4.1) Свойства функции распределения. 1) 0 ≤ F(x) ≤ 1. Действительно, так как функция распределения представляет собой вероятность, она может принимать только те значения, которые принимает вероятность. 2) Функция распределения является неубывающей функцией, то есть F(x2) ≥ F(x1) при х2 > x1. Это следует из того, что F(x2) = p(X < x2) = p(X < x1) + p(x1 ≤ X < x2) ≥ F(x1). 16 F ( x)  0, lim F ( x)  1. В частности, если все возможные значения Х 3) xlim   x   лежат на интервале [a, b], то F(x) = 0 при х ≤ а и F(x) = 1 при х ≥ b. Действительно, X < a – событие невозможное, а X < b – достоверное. 4) Вероятность того, что случайная величина примет значение из интервала [a, b], равна разности значений функции распределения на концах интервала: p ( a < X < b ) = F(b) – F(a). Справедливость этого утверждения следует из определения функции распределения (см. свойство 2). Для дискретной случайной величины значение F(x) в каждой точке представляет собой сумму вероятностей тех ее возможных значений, которые меньше аргумента функции. Пример. Найдем F(x) для предыдущего примера:  0, x  0  0,12, 0  x  1  F ( x)   0,12  0,46  0,58, 1  x  2  0,58  0,42  1, x  2 Соответственно график функции распределения имеет ступенчатый вид: Биномиальное распределение. Вернемся к схеме независимых испытаний и найдем закон распределения случайной величины Х – числа появлений события А в серии из п испытаний. Возможные значения А: 0, 1, …, п. Соответствующие им вероятности можно вычислить по формуле Бернулли: (4.2) p( Х  k )  Cnk p k q nk ( p – вероятность появления А в каждом испытании). Такой закон распределения называют биномиальным, поскольку правую часть равенства (4.2) можно рассматривать как общий член разложения бинома Ньютона: ( p  q) n  Cnn p n  Cnn1 p n1q  ...  Cnk p k q nk  ...  Cn0 q n . Пример. Составим ряд распределения случайной величины Х – числа попаданий при 5 выстрелах, если вероятность попадания при одном выстреле равна 0,8. р(Х=0) = 1·(0,2)5 = 0,00032; 17 р(Х=1) = 5·0,8·(0,2)4 = 0,0064; р(Х=2) = 10·(0,8)2·(0,2)3 = 0,0512; р(Х=3) = 10·(0,8)3·(0,2)2 = 0,2048; р(Х=4) = 5·(0,8)4·0,2 = 0,4096; р(Х=5) = 1·(0,8)5 = 0,32768. Таким образом, ряд распределения имеет вид: х 0 1 2 3 4 5 р 0.00032 0.0064 0.0512 0.2048 0.4096 0.32728 Распределение Пуассона. Рассмотрим дискретную случайную величину Х, принимающую только целые неотрицательные значения (0, 1, 2,…, т,…), последовательность которых не ограничена. Такая случайная величина называется распределенной по закону Пуассона, если вероятность того, что она примет значение т, выражается формулой: р ( Х  т)  а т а е , т! (4.3) где а – некоторая положительная величина, называемая параметром закона Пуассона. Покажем, что сумма всех вероятностей равна 1:   ат  е а  е а  1 т ! т 0  р( Х  т)  е а  т 0 (использовано разложение в ряд Тейлора функции ех). Рассмотрим типичную задачу, приводящую к распределению Пуассона. Пусть на оси абсцисс случайным образом распределяются точки, причем их распределение удовлетворяет следующим условиям: 1) вероятность попадания некоторого количества точек на отрезок длины l зависит только от длины отрезка и не зависит от его расположения на оси ( то есть точки распределены с одинаковой средней плотностью); 2) точки распределяются независимо друг от друга (вероятность попадания какого-либо числа точек на данный отрезок не зависит от количества точек, попавший на любой другой отрезок); 3) практическая невозможность совпадения двух или более точек. Тогда случайная величина Х – число точек, попадающих на отрезок длины l – распределена по закону Пуассона, где а – среднее число точек, приходящееся на отрезок длины l. Замечание. В лекции 3 говорилось о том, что формула Пуассона выражает биномиальное распределение при большом числе опытов и малой вероятности события. Поэтому закон Пуассона часто называют законом редких явлений. 18 Лекция 5. Функция распределения и плотность случайной величины, их взаимосвязь распределение вероятностей. распределения и свойства. непрерывной Равномерное Определение и свойства функции распределения сохраняются и для непрерывной случайной величины, для которой функцию распределения можно считать одним из видов задания закона распределения. Но для непрерывной случайной величины вероятность каждого отдельного ее значения равна 0. Это следует из свойства 4 функции распределения: р(Х = а) = F(a) – F(a) = 0. Поэтому для такой случайной величины имеет смысл говорить только о вероятности ее попадания в некоторый интервал. Вторым способом задания закона распределения непрерывной случайной величины является так называемая плотность распределения (плотность вероятности, дифференциальная функция). Определение 5.1. Функция f(x), называемая плотностью распределения непрерывной случайной величины, определяется по формуле: f (x) = F′(x), (5.1) то есть является производной функции распределения. Свойства плотности распределения. 1) f(x) ≥ 0, так как функция распределения является неубывающей. x 2) F ( x)   f (t )dt , что следует из определения плотности распределения.  3) Вероятность попадания случайной величины в интервал (а, b) определяется формулой b р(а  X  b)   f ( x)dx. a Действительно, р(а  X  b)  F (b)  F (a)  b  a f ( x)dx     b f ( x)dx   f ( x)dx. a  4)  f ( x)dx  1 (условие нормировки). Его справедливость следует из того,  что   f ( x)dx  F (), а  lim F ( x)  1. x  5) lim f ( x)  0, так как F ( x)  const при x  . x  Таким образом, график плотности распределения представляет собой кривую, расположенную выше оси Ох, причем эта ось является ее горизонтальной асимптотой при x   (последнее справедливо только для случайных величин, множеством возможных значений которых является все множество действительных чисел). Площадь криволинейной трапеции, ограниченной графиком этой функции, равна единице. Замечание. Если все возможные значения непрерывной случайной величины сосредоточены на интервале [a, b], то все интегралы вычисляются в этих пределах, а вне интервала [a, b] f(x) ≡ 0. 19 Пример 1. Плотность распределения непрерывной случайной величины задана формулой f ( x)  C ,   x  . 1 x2 Найти: а) значение константы С; б) вид функции распределения; в) p (-1 < x < 1). Решение. а) значение константы С найдем из свойства 4:  С 1  х 2 dx  Сarctgx 1   1     C     C 1, откуда C  .  2 2 x x 1 1 dt  arctg t б) F ( x)   2  1  t  1   1 1  1 1  arctgx    arctgx  .  2  2 1 1 dx  arctgx в) p(1  x  1)   2  11  x  1  1 1        0,5.  4 4 Пример 2. Функция распределения непрерывной случайной величины имеет вид:  0, x  2  x  2 F ( x)   , 2 x4 2   1, x  4. Найти плотность распределения. Решение.  0, x  2  0, x  2     x  2  f ( x)    , 2  x  4  0,5, 2  x  4  2   0, x  4.  1, x  4   Равномерный закон распределения. Часто на практике мы имеем дело со случайными величинами, распределенными определенным типовым образом, то есть такими, закон распределения которых имеет некоторую стандартную форму. В прошлой лекции были рассмотрены примеры таких законов распределения для дискретных случайных величин (биномиальный и Пуассона). Для непрерывных случайных величин тоже существуют часто встречающиеся виды закона распределения, и в качестве первого из них рассмотрим равномерный закон. 20 Определение 5.2. Закон распределения непрерывной случайной величины называется равномерным, если на интервале, которому принадлежат все возможные значения случайной величины, плотность распределения сохраняет постоянное значение f(x) = const при a ≤ x ≤ b, f(x) = 0 при x < a, x > b. Найдем значение, которое принимает f(x) при x  [a, b]. Из условия нормировки следует, что b b  f ( x)dx   cdx  c(b  a)  1, откуда a f ( x)  c  a 1 . ba Вероятность попадания равномерно распределенной случайной величины на  интервал [ ,  ] (a      b) равна при этом 1  b  a dx  Вид функции распределения для нормального закона:   ba .  0, x  a  x  a F ( x)   , a xb b  a 1, x  b.  Пример. Автобусы некоторого маршрута идут с интервалом 5 минут. Найти вероятность того, что пришедшему на остановку пассажиру придется ожидать автобуса не более 2 минут. Решение. Время ожидания является случайной величиной, равномерно 1 5 распределенной в интервале [0, 5]. Тогда f ( x)  , p(0  x  2)  2  0,4. 5 Лекция 6. Нормальный закон распределения вероятностей. Нормальная кривая. Функция Лапласа. Вычисление вероятности попадания в заданный интервал нормальной случайной величины. Правило трех сигм. Показательное распределение. Функция надежности. Показательный закон надежности. Определение 6.1. Непрерывная случайная величина называется распределенной по нормальному закону, если ее плотность распределения имеет вид: f ( x)  1  2  e ( xa )2 2 2 . (6.1) Замечание. Таким образом, нормальное распределение определяется двумя параметрами: а и σ. График плотности нормального распределения называют нормальной кривой (кривой Гаусса). Выясним, какой вид имеет эта кривая, для чего исследуем функцию (6.1). 21 1) Область определения этой функции: (-∞, +∞). 2) f(x) > 0 при любом х (следовательно, весь график расположен выше оси Ох). 3) |lim f ( x)  0, то есть ось Ох служит горизонтальной асимптотой графика x|   при x  . 4) f ( x)   xa  3 2  ( xa )2 e  0 при х = а; 2 2  1 f ( x)  0 при x > a, f ( x)  0 при x < a. Следовательно,  a,   2   - точка  максимума. 5) f(x – a) = f(a – x), то есть график симметричен относительно прямой х = а. 6) f ( x)   1  3 2  e ( xa )2  ( x  a) 2  1  0  2   2 2 при x  a  , то есть точки  1   a   ,  являются точками перегиба.  2 e   Примерный вид кривой Гаусса изображен на рис.1. х Рис.1. Найдем вид функции распределения для нормального закона: x F ( x)   f (t )dt    1 2 x e  (t a )2 2 2 dt. (6.2)  Перед нами так называемый «неберущийся» интеграл, который невозможно выразить через элементарные функции. Поэтому для вычисления значений F(x) приходится пользоваться таблицами. Они составлены для случая, когда а = 0, а σ = 1. Определение 6.2. Нормальное распределение с параметрами а = 0, σ = 1 называется нормированным, а его функция распределения Ф( х )  х 1 2 е  t2 2 dt - (6.3)  - функцией Лапласа. 22 Замечание. Функцию распределения для произвольных параметров можно выразить через функцию Лапласа, если сделать замену: t  xa  , тогда xa F ( х)  1 2   е  t2 2 dt .  Найдем вероятность попадания нормально распределенной случайной величины на заданный интервал:  a   a  p (  x   )  F (  )  F ( )      .       (6.4) Пример. Случайная величина Х имеет нормальное распределение с параметрами а = 3, σ = 2. Найти вероятность того, что она примет значение из интервала (4, 8). Решение. 8 3  4 3 p (4  x  8)  F (8)  F (4)      .   (2,5)   (0,5)  0,9938  0,6915  0,3023.  2   2  Правило «трех сигм». Найдем вероятность того, что нормально распределенная случайная величина примет значение из интервала (а - 3σ, а + 3σ): p(а  3  x  а  3 )  3   3  0,9986  0,0014  0.9973. Следовательно, вероятность того, что значение случайной величины окажется вне этого интервала, равна 0,0027, то есть составляет 0,27% и может считаться пренебрежимо малой. Таким образом, на практике можно считать, что все возможные значения нормально распределенной случайной величины лежат в интервале (а - 3σ, а + 3σ). Полученный результат позволяет сформулировать правило «трех сигм»: если случайная величина распределена нормально, то модуль ее отклонения от х = а не превосходит 3σ. Показательное распределение. Определение 6.3. Показательным (экспоненциальным) называют распределение вероятностей непрерывной случайной величины Х, которое описывается плотностью  0, x  0 f ( x)   x e , x  0. (6.5) В отличие от нормального распределения, показательный закон определяется только одним параметром λ. В этом его преимущество, так как обычно параметры распределения заранее не известны и их приходится оценивать приближенно. Понятно, что оценить один параметр проще, чем несколько. 23 Найдем функцию распределения показательного закона: x F ( x)    x  f (t )dt   0  dt    e t dt  1  e x . Следовательно,  0, x  0 F ( x)    x 1  e , x  0. (6.6) Теперь можно найти вероятность попадания показательно распределенной случайной величины в интервал (а, b): (6.7) p(a  x  b)  e  a  e  b . -х Значения функции е можно найти из таблиц. Функция надежности. Пусть элемент (то есть некоторое устройство) начинает работать в момент времени t0 = 0 и должен проработать в течение периода времени t. Обозначим за Т непрерывную случайную величину – время безотказной работы элемента, тогда функция F(t) = p(T > t) определяет вероятность отказа за время t. Следовательно, вероятность безотказной работы за это же время равна R(t) = p(T > t) = 1 – F(t). (6.8) Эта функция называется функцией надежности. Показательный закон надежности. Часто длительность безотказной работы элемента имеет показательное распределение, то есть F(t) = 1 – e-λt . Следовательно, функция надежности в этом случае имеет вид: R(t) = 1 – F(t) = 1 – (1 – e-λt) = e-λt . Определение 6.4. Показательным законом надежности называют функцию надежности, определяемую равенством R(t) = e-λt , (6.9) где λ – интенсивность отказов. Пример. Пусть время безотказной работы элемента распределено по показательному закону с плотностью распределения f(t) = 0,1 e-0,1t при t ≥ 0. Найти вероятность того, что элемент проработает безотказно в течение 10 часов. Решение. Так как λ = 0,1, R(10) = e-0,1·10 = e-1 = 0,368. 24 Лекция 7. Основные числовые характеристики дискретных и непрерывных случайных величин: математическое ожидание, дисперсия и среднее квадратическое отклонение. Их свойства и примеры. Закон распределения (функция распределения и ряд распределения или плотность вероятности) полностью описывают поведение случайной величины. Но в ряде задач достаточно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный вопрос. Рассмотрим основные числовые характеристики дискретных случайных величин. Математическое ожидание. Определение 7.1. Математическим ожиданием дискретной случайной величины называется сумма произведений ее возможных значений на соответствующие им вероятности: М(Х) = х1р1 + х2р2 + … + хпрп . (7.1) Если число возможных значений случайной величины бесконечно, то  M ( X )   xi p i i 1 , если полученный ряд сходится абсолютно. Замечание 1. Математическое ожидание называют иногда взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов. Замечание 2. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольшего. Замечание 3. Математическое ожидание дискретной случайной величины есть неслучайная (постоянная) величина. В дальнейшем увидим, что это же справедливо и для непрерывных случайных величин. Пример 1. Найдем математическое ожидание случайной величины Х – числа стандартных деталей среди трех, отобранных из партии в 10 деталей, среди которых 2 бракованных. Составим ряд распределения для Х. Из условия задачи следует, что Х может принимать значения 1, 2, 3. p(1)  C81  C 22 C82  C 21 C83 1 7 7  , p ( 2 )   , p ( 3 )   . 3 3 3 15 15 C10 C10 C10 15 Тогда M ( X )  1 1 7 7  2   3   2,4. 15 15 15 Пример 2. Определим математическое ожидание случайной величины Х – числа бросков монеты до первого появления герба. Эта величина может 25 принимать бесконечное число значений (множество возможных значений есть множество натуральных чисел). Ряд ее распределения имеет вид: Х 1 2 … п … 2 п р 0,5 (0,5) … (0,5) … Тогда  2 п 3  п 1 1 1  1 1 1 1 М ( Х )   п   2     3     ...  п     ...   п   п  . 2 2 п1 2 2 2 2 п 1 2 п 1 2 ..+  1 1 1  1 1   ...  1  1    ...  п  ...   1  2  2 п  п 2  2 4  + 2 п 1 2 (при вычислении дважды использовалась формула суммы бесконечно убывающей геометрической S прогрессии: b1 1 q , откуда 1 1 1 1 1 1   ...  n  ...  1, 1    ...  n  ...  2 2 4 2 4 2 2 ). Свойства математического ожидания. 1) Математическое ожидание постоянной равно самой постоянной: М(С) = С. (7.2) Доказательство. Если рассматривать С как дискретную случайную величину, принимающую только одно значение С с вероятностью р = 1, то М(С) = С·1 = С. 2) Постоянный множитель можно выносит за знак математического ожидания: М(СХ) = С М(Х). (7.3) Доказательство. Если случайная величина Х задана рядом распределения xi x1 x2 … xn pi p1 p2 … pn то ряд распределения для СХ имеет вид: Сxi Сx1 Сx2 pi p1 p2 … … Сxn pn Тогда М(СХ) = Сх1р1 + Сх2р2 + … + Схпрп = С( х1р1 + х2р2 + … + хпрп) = СМ(Х). Определение 7.2. Две случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какие значения приняла другая. В противном случае случайные величины зависимы. Определение 7.3. Назовем произведением независимых случайных величин Х и Y случайную величину XY, возможные значения которой равны произведениям всех возможных значений Х на все возможные 26 значения Y, а соответствующие им вероятности равны произведениям вероятностей сомножителей. 3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий: M(XY) = M(X)M(Y). (7.4) Доказательство. Для упрощения вычислений ограничимся случаем, когда Х и Y принимают только по два возможных значения: xi x1 x2 pi p1 p2 уi gi у1 g1 Тогда ряд распределения для XY выглядит так: ХY x1 y1 x2 y 1 p p1g1 p2 g1 у2 g2 x1 y2 p1g2 x2 y2 p2g2 Следовательно, M (XY) = x1y1·p1g1 + x2y1·p2g1 + x1y2·p1g2 + x2y2·p2g2 = y1g1(x1p1 + x2p2) + + y2g2(x1p1 + x2p2) = (y1g1 + y2g2) (x1p1 + x2p2) = M(X)·M(Y). Замечание 1. Аналогично можно доказать это свойство для большего количества возможных значений сомножителей. Замечание 2. Свойство 3 справедливо для произведения любого числа независимых случайных величин, что доказывается методом математической индукции. Определение 7.4. Определим сумму случайных величин Х и Y как случайную величину Х + Y, возможные значения которой равны суммам каждого возможного значения Х с каждым возможным значением Y; вероятности таких сумм равны произведениям вероятностей слагаемых (для зависимых случайных величин – произведениям вероятности одного слагаемого на условную вероятность второго). 4) Математическое ожидание суммы двух случайных величин (зависимых или независимых ) равно сумме математических ожиданий слагаемых: M (X + Y) = M (X) + M (Y). (7.5) Доказательство. Вновь рассмотрим случайные величины, заданные рядами распределения, приведенными при доказательстве свойства 3. Тогда возможными значениями X + Y являются х1 + у1, х1 + у2, х2 + у1, х2 + у2. Обозначим их вероятности соответственно, как р11, р12, р21 и р22. Найдем М(Х +Y) = (x1 + y1)p11 + (x1 + y2)p12 + (x2 + y1)p21 + (x2 + y2)p22 = = x1(p11 + p12) + x2(p21 + p22) + y1(p11 + p21) + y2(p12 + p22). 27 Докажем, что р11 + р22 = р1. Действительно, событие, состоящее в том, что X + Y примет значения х1 + у1 или х1 + у2 и вероятность которого равна р11 + р22, совпадает с событием, заключающемся в том, что Х = х1 (его вероятность р1). Аналогично доказывается, что p21 + p22 = р2, p11 + p21 = g1, p12 + p22 = g2. Значит, M(X + Y) = x1p1 + x2p2 + y1g1 + y2g2 = M (X) + M (Y). Замечание. Из свойства 4 следует, что сумма любого числа случайных величин равна сумме математических ожиданий слагаемых. Пример. Найти математическое ожидание суммы числа очков, выпавших при броске пяти игральных костей. Найдем математическое ожидание числа очков, выпавших при броске одной кости: М(Х1) = (1 + 2 + 3 + 4 + 5 + 6)/6=3,5 Тому же числу равно математическое ожидание числа очков, выпавших на любой кости. Следовательно, по свойству 4 М(Х)=5/6 Дисперсия. Для того, чтобы иметь представление о поведении случайной величины, недостаточно знать только ее математическое ожидание. Рассмотрим две случайные величины: Х и Y, заданные рядами распределения вида Y 100 Х 49 50 51 р 0,1 0,8 0,1 p 0,5 0,5 Найдем М(Х) = 49·0,1 + 50·0,8 + 51·0,1 = 50, М(Y) = 0·0,5 + 100·0,5 = 50. Как видно, математические ожидания обеих величин равны, но если для Х М(Х) хорошо описывает поведение случайной величины, являясь ее наиболее вероятным возможным значением (причем остальные значения ненамного отличаются от 50), то значения Y существенно отстоят от М(Y). Следовательно, наряду с математическим ожиданием желательно знать, насколько значения случайной величины отклоняются от него. Для характеристики этого показателя служит дисперсия. Определение 7.5. Дисперсией (рассеянием) случайной величины называется математическое ожидание квадрата ее отклонения от ее математического ожидания: D(X) = M (X – M(X))². (7.6) Пример. Найдем дисперсию случайной величины Х (числа стандартных деталей среди отобранных) в примере 1 данной лекции. Вычислим значения квадрата отклонения каждого возможного значения от математического ожидания: (1 – 2,4)2 = 1,96; (2 – 2,4)2 = 0,16; (3 – 2,4)2 = 0,36. Следовательно, 28 D( X )  1,96  1 7 7 28  0,16   0,36    0,373. 15 15 15 75 Замечание 1. В определении дисперсии оценивается не само отклонение от среднего, а его квадрат. Это сделано для того, чтобы отклонения разных знаков не компенсировали друг друга. Замечание 2. Из определения дисперсии следует, что эта величина принимает только неотрицательные значения. Замечание 3. Существует более удобная для расчетов формула для вычисления дисперсии, справедливость которой доказывается в следующей теореме: Теорема 7.1. D(X) = M(X ²) – M ²(X). (7.7) Доказательство. Используя то, что М(Х) – постоянная величина, и свойства математического ожидания, преобразуем формулу (7.6) к виду: D(X) = M(X – M(X))² = M(X² - 2X·M(X) + M²(X)) = M(X²) – 2M(X)·M(X) + M²(X) = M(X²) – 2M²(X) + M²(X) = M(X²) – M²(X), что и требовалось доказать. Пример. Вычислим дисперсии случайных величин Х и Y, рассмотренных в начале этого раздела. М(Х) = (492·0,1 + 502·0,8 + 512·0,1) – 502 = 2500,2 – 2500 = 0,2. М(Y) = (02·0,5 + 100²·0,5) – 50² = 5000 – 2500 = 2500. Итак, дисперсия второй случайной величины в несколько тысяч раз больше дисперсии первой. Таким образом, даже не зная законов распределения этих величин, по известным значениям дисперсии мы можем утверждать, что Х мало отклоняется от своего математического ожидания, в то время как для Y это отклонение весьма существенно. Свойства дисперсии. 1) Дисперсия постоянной величины С равна нулю: D (C) = 0. (7.8) Доказательство. D(C) = M ((C – M(C))²) = M((C – C)²) = M(0) = 0. 2) Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат: D (CX) = C²D(X). (7.9) Доказательство. D (CX) = M ((CX – M (CX))²) = M((CX – CM(X))²) = M(C²(X – M(X))²) = = C²D(X). 3) Дисперсия суммы двух независимых случайных величин равна сумме их дисперсий: D(X + Y) = D(X) + D(Y). (7.10) 29 Доказательство. D(X + Y) = M(X² + 2XY + Y²) – (M(X) + M(Y))² = M(X²) + 2M(X)M(Y) + + M(Y²) – M²(X) – 2M(X)M(Y) – M²(Y) = (M(X²) – M²(X)) + (M(Y²) – M²(Y)) = D(X) + D(Y). Следствие 1. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме их дисперсий. Следствие 2. Дисперсия суммы постоянной и случайной величин равна дисперсии случайной величины. 4) Дисперсия разности двух независимых случайных величин равна сумме их дисперсий: D(X – Y) = D(X) + D(Y). (7.11) Доказательство. D(X – Y) = D(X) + D(-Y) = D(X) + (-1)²D(Y) = D(X) + D(Y). Дисперсия дает среднее значение квадрата отклонения случайной величины от среднего; для оценки самого отклонения служит величина, называемая средним квадратическим отклонением. Определение 7.6. Средним квадратическим отклонением σ случайной величины Х называется квадратный корень из дисперсии:   D(X ) . (7.12) Пример. В предыдущем примере средние квадратические отклонения Х и Y равны соответственно  х  0,2  0,447;  у  2500  50. Числовые характеристики непрерывных случайных величин. Распространим определения числовых характеристик случайных величин на непрерывные случайные величины, для которых плотность распределения служит в некотором роде аналогом понятия вероятности. Определение 7.7. Математическим ожиданием непрерывной случайной величины называется  М (Х )   xf ( x)dx. (7.13) Замечание 1. Общее определение дисперсии сохраняется для непрерывной случайной величины таким же, как и для дискретной (опр. 7.5), а формула для ее вычисления имеет вид:   D( Х )  x 2 f ( x)dx  M 2 ( X ). (7.14) Среднее квадратическое отклонение вычисляется по формуле (7.12). Замечание 2. Если все возможные значения непрерывной случайной величины не выходят за пределы интервала [a, b], то интегралы в формулах (7.13) и (7.14) вычисляются в этих пределах.  30 Пример. Плотность распределения случайной величины Х имеет вид:  0, x  2  3 2 f ( x)   ( x  6 x  8), 2  x  4  4  0, x  4. Найти М(Х), D(X), σ. Решение. 4 4 3 3  x4 2 3 2 M ( X )    x( x  6 x  8)dx     2 x  4 x   3; 42 4 4 2 4 4 3 2 2 3  x 5 3x 4 8 x 3    9  9,2  9  0,2; D( X )    x ( x  6 x  8)dx  9      42 4 5 2 3  2 Числовые характеристики случайных величин, некоторые стандартные законы распределения.   0,2  0,447. имеющих 1. Биномиальное распределение. Для дискретной случайной величины Х, представляющей собой число появлений события А в серии из п независимых испытаний (см. лекцию 6), М(Х) можно найти, используя свойство 4 математического ожидания. Пусть Х1 – число появлений А в первом испытании, Х2 – во втором и т.д. При этом каждая из случайных величин Хi задается рядом распределения вида Xi 1 pi q p Следовательно, М(Хi) = p. Тогда n n i 1 i 1 M ( X )   M ( X i )   p  np. Аналогичным образом вычислим дисперсию: D(Xi) = 0²·q + 1²·p – p²= p – p² = p(1 – p), откуда по свойству 4 дисперсии n D( X )   D( X i )  np(1  p )  npq. i 1 2. Закон Пуассона. а т а е Если р(Х = т) = т! , то   а т а а т1 а т е  ае  ае а е а  а   т 1 ( т  1)! М(Х) = т1 т! (использовалось разложение в ряд Тейлора функции ех). Для определения дисперсии найдем вначале  М(Х2) =  т2 т 1  а т а а т1 а е  а т е  т! (т  1)! т 1 31  а  (т  1)  1   а т1  а а т1 а  а т1 а  е  а  (т  1) е  е   а(а  1). (т  1)! (т  1)! т 1 ( т  1)!  т1  = т1 Поэтому D(X) = a² + a – a² = a. Замечание. Таким образом, обнаружено интересное свойство распределения Пуассона: математическое ожидание равно дисперсии (и равно единственному параметру а, определяющему распределение). 3. Равномерное распределение. Для равномерно распределенной на отрезке [a, b] непрерывной случайной величины b b 1 x2 M (X )   x dx  ba 2(b  a) a  a b2  a2 a  b  , 2(b  a) 2 то есть математическое ожидание равномерно распределенной случайной величины равно абсциссе середины отрезка [a, b] . Дисперсия 1 (a  b) 2 b 3  a 3 (a  b) 2 a 2  ab  b 2 a 2  2ab  b 2 D( X )   x dx       ba 4 3(b  a) 4 3 4 a b 2  (b  a) 2 12 . 4. Нормальное распределение. Для вычисления математического ожидания нормально распределенной случайной величины воспользуемся тем, что интеграл Пуассона  e  z2 2 dz  2 .  M (X )   1 2  1  2   ze  z2 2  xe  ( xa )2 2 2 dx  ( z   dz   a 2 e  z2 2 xa  ) a dz  0  2 1 2   (z  a)e  z2 2 dz   2  a (первое слагаемое равно 0, так как подынтегральная функция нечетна, а пределы интегрирования симметричны относительно нуля).  ( xa )2    2  D( X )  ( x  a ) e dx  z  ze 2 dz  (u  z , dv  ze 2 )     2  2      z  z  2   2     e 2 dz    0  2   2  z e 2 2  2       . 1   2 2  z2 z2 2 2 2   Следовательно, параметры нормального распределения (а и σ) равны соответственно математическому ожиданию и среднему квадратическому отклонению исследуемой случайной величины. 32 Лекция 8. Случайные векторы (системы нескольких случайных величин). Закон распределения вероятностей дискретной двумерной случайной величины. Функция распределения и плотность распределения двумерной случайной величины, их свойства. Вероятность попадания случайной точки в произвольную область. Отыскание плотностей вероятности составляющих двумерной случайной величины. Равномерное распределение на плоскости. Наряду с одномерными случайными величинами, возможные значения которых определяются одним числом, теория вероятностей рассматривает и многомерные случайные величины. Каждое возможное значение такой величины представляет собой упорядоченный набор нескольких чисел. Геометрической иллюстрацией этого понятия служат точки п-мерного пространства, каждая координата которых является случайной величиной (дискретной или непрерывной), или п-мерные векторы. Поэтому многомерные случайные величины называют еще случайными векторами. Двумерные случайные величины. 1. Дискретные двумерные случайные величины. Закон распределения дискретной двумерной случайной величины (Х, Y) имеет вид таблицы с двойным входом, задающей перечень возможных значений каждой компоненты и вероятности p(xi, yj), с которыми величина принимает значение (xi, yj): Х Y x1 x2 … xi … xn p(x1, y1) p(x2, y1) … p(xi, y1) … p(xn, y1) y1 … … … … … … … p(x1, yj) p(x2, yj) … p(xi, yj) … p(xn, yj) yj … … … … … … … p(x1, ym) p(x2, ym) … p(xi, ym) p(xn, ym) ym … При этом сумма вероятностей, стоящих во всех клетках таблицы, равна 1. Зная закон распределения двумерной случайной величины, можно найти законы распределения ее составляющих. Действительно, событие Х = х1 представляется собой сумму несовместных событий (X = x1, Y = y1), (X = x1, Y = y2),…, (X = x1, Y = ym), поэтому 33 р(Х = х1) = p(x1, y1) + p(x1, y2) +…+ p(x1, ym) (в правой части находится сумма вероятностей, стоящих в столбце, соответствующем Х = х1). Так же можно найти вероятности остальных возможных значений Х. Для определения вероятностей возможных значений Y нужно сложить вероятности, стоящие в строке таблицы, соответствующей Y = yj. Пример 1. Дан закон распределения двумерной случайной величины: Y X -2 3 6 -0,8 0,1 0,3 0,1 -0,5 0,15 0,25 0,1 Найти законы распределения составляющих. Решение. Складывая стоящие в таблице вероятности «по столбцам», получим ряд распределения для Х: Х -2 3 6 р 0,25 0,55 0,2 Складывая те же вероятности «по строкам», найдем ряд распределения для Y: Y -0,8 -0,5 p 0,5 0,5 2. Непрерывные двумерные случайные величины. Определение 8.1. Функцией распределения F(x, y) двумерной случайной величины (X, Y) называется вероятность того, что X < x, a Y < y: F( х, у ) = p ( X < x, Y < y ). y (8.1) Рис.1. Это означает, что точка (X, Y) попадет в область, заштрихованную на рис. 1, если вершина прямого угла располагается в точке (х, у). Замечание. Определение функции распределения справедливо как для непрерывной, так и для дискретной двумерной случайной величины. Свойства функции распределения. 1) 0 ≤ F(x, y) ≤ 1 (так как F(x, y) является вероятностью). 34 2) F(x, y) есть неубывающая функция по каждому аргументу: F(x2, y) ≥ F(x1, y), если x2 > x1; F(x, y2) ≥ F(x, y1), если y2 > y1. Доказательство. F(x2, y) = p(X < x2, Y < y) = p(X < x1, Y < y) + p(x1 ≤ X < x2, Y < y) ≥ ≥ p(X < x1, Y < y) = F(x1, y). Аналогично доказывается и второе утверждение. 3) Имеют место предельные соотношения: а) F(-∞, y) = 0; b) F(x, - ∞) = 0; c) F(- ∞, -∞) = 0; d) F( ∞, ∞) = 1. Доказательство. События а), b) и с) невозможны ( так как невозможно событие Х<- ∞ или Y <- ∞), а событие d) достоверно, откуда следует справедливость приведенных равенств. 4) При у = ∞ функция распределения двумерной случайной величины становится функцией распределения составляющей Х: F(x, ∞) = F1(x). При х = ∞ функция распределения двумерной случайной величины становится функцией распределения составляющей Y : F( ∞, y) = F2(y). Доказательство. Так как событие Y < ∞ достоверно, то F(x, ∞) = р(Х < x) = F1(x). Аналогично доказывается второе утверждение. Определение 8.2. Плотностью совместного распределения вероятностей (двумерной плотностью вероятности) непрерывной двумерной случайной величины называется смешанная частная производная 2-го порядка от функции распределения:  2 F ( x, y) f ( x, y)  xy . (8.2) Замечание. Двумерная плотность вероятности представляет собой предел отношения вероятности попадания случайной точки в прямоугольник со сторонами Δх и Δу к площади этого прямоугольника при х  0, у  0. Свойства двумерной плотности вероятности. 1) f(x, y) ≥ 0 (см. предыдущее замечание: вероятность попадания точки в прямоугольник неотрицательна, площадь этого прямоугольника положительна, следовательно, предел их отношения неотрицателен). 2) y x F ( x, y)    f ( x, y)dxdy  (cледует из определения двумерной плотности вероятности). 3) 35     f ( x, y)dxdy  1  (поскольку это вероятность того, что точка попадет на плоскость Оху, то есть достоверного события). Вероятность попадания случайной точки в произвольную область. Пусть в плоскости Оху задана произвольная область D. Найдем вероятность того, что точка, координаты которой представляют собой систему двух случайных величин (двумерную случайную величину) с плотностью распределения f(x, y), попадет в область D. Разобьем эту область прямыми, параллельными осям координат, на прямоугольники со сторонами Δх и Δу. Вероятность попадания в каждый такой прямоугольник равна f ( i ,i )xy , где ( i ,i ) - координаты точки, принадлежащей прямоугольнику. Тогда вероятность попадания точки в область D есть предел n интегральной суммы  i 1 f ( i ,i )xy , то есть p (( X , Y )  D )   f ( x, y )dxdy. D (8.3) Отыскание плотностей вероятности составляющих двумерной случайной величины. Выше было сказано, как найти функцию распределения каждой составляющей, зная двумерную функцию распределения. Тогда по определению плотности распределения x  d    f ( x, y )   dF ( x) dF ( x, )   f ( x, y)dy. f 1 ( x)  1      dx dx dx  (8.4) Аналогично находится  f 2 ( y)   f ( x, y)dx. (8.4′)  Условные законы распределения составляющих дискретной двумерной случайной величины. Рассмотрим дискретную двумерную случайную величину и найдем закон распределения составляющей Х при условии, что Y примет определенное значение (например, Y = у1). Для этого воспользуемся формулой Байеса, считая гипотезами события Х = х1, Х = х2,…, Х = хп, а событием А – событие Y = у1. При такой постановке задачи нам требуется найти условные вероятности гипотез при условии, что А произошло. Следовательно, 36 р( xi / y1 )  p( xi , y1 ) p( y1 ) . Таким же образом можно найти вероятности возможных значений Х при условии, что Y принимает любое другое свое возможное значение: р ( xi / y j )  p ( xi , y j ) p( y j ) . (8.5) Аналогично находят условные законы распределения составляющей Y: p ( y j / xi )  p ( xi , y j ) p ( xi ) . (8.5`) Пример. Найдем закон распределения Х при условии Y = -0,8 и закон распределения Y при условии Х = 3 для случайной величины, рассмотренной в примере 1. 0,1 1 0,3 3   0,2; р( x 2 / y1 )    0,6; 0,5 5 0,5 5 0,3 6 0,25 5 р( у1 / х 2 )   ; р( у 2 / х 2 )   . 0,55 11 0,55 11 р( x1 / y1 )  р( x3 / y1 )  0,1 1   0,2. 0,5 5 Условные законы распределения составляющих дискретной двумерной случайной величины. Определение 8.3. Условной плотностью φ(х/у) составляющих Х при данном значении Y = у называется  ( х / у)  f ( x, y )  f 2 ( y) распределения f ( x, y )   f ( x, y)dx . (8.6) Аналогично определяется условная плотность вероятности Y при Х = х:   ( у / х)  f ( x, y)  f 1 ( х) f ( x, y)   f ( x, y)dу  (8.6`) Равномерное распределение на плоскости. Система двух случайных величин называется равномерно распределенной на плоскости, если ее плотность вероятности f(x, y) = const внутри некоторой области и равна 0 вне ее. Пусть данная область – прямоугольник вида a  x  b, c  y  d . Тогда из свойств f(x, y) следует, что 1  1  S  (b  a)(d  c) f ( x, y )   np   внутри прямоугольника, вне его. Найдем двумерную функцию распределения: 37 1 ( x  a)( y  c) dxdy    (b  a)(d  c) c a (b  a)(d  c) y x F ( x, y )  при a < x < b, c < y < d, F(x, y) = 0, при x ≤ a или y ≤ c, F(x, y) = 1 при x ≥ b, y ≥ d. Функции распределения составляющих, вычисленные по формулам, приведенным в свойстве 4 функции распределения, имеют вид: F1 ( x)  xa , ba F2 ( y )  yc . d c Лекция 9. Некоторые числовые характеристики одномерных случайных величин: начальные и центральные моменты, мода, медиана, квантиль, коэффициенты асимметрии и эксцесса. Числовые характеристики двумерных случайных величин: начальные и центральные моменты. Корреляционный момент и коэффициент корреляции. Коррелированность и зависимость случайных величин. Определение 9.1. Начальным моментом порядка k случайной величины Х называется математическое ожидание величины Xk: νk = M (Xk). (9.1) 2 В частности, ν1 = М(Х), ν2 = М(Х ). Следовательно, дисперсия D(X) = ν2 – ν1². Определение 9.2. Центральным моментом порядка k случайной величины Х называется математическое ожидание величины (Х – М(Х))k: μk = M((Х – М(Х))k). (9.2) 2 В частности, μ1 = M(Х – М(Х)) = 0, μ2 = M((Х – М(Х)) ) = D(X). Можно получить соотношения, связывающие начальные и центральные моменты:  2   2   12 ,  3   3  3 2 1  2 12 ,  4   4  4 3 1  6 2 12  3 14 . Мода и медиана. Такая характеристика случайной величины, как математическое ожидание, называется иногда характеристикой положения, так как она дает представление о положении случайной величины на числовой оси. Другими характеристиками положения являются мода и медиана. Определение 9.3. Модой М дискретной случайной величины называется ее наиболее вероятное значение, модой М непрерывной случайной величины – значение, в котором плотность вероятности максимальна. Пример 1. Если ряд распределения дискретной случайной величины Х имеет вид: Х 1 2 3 4 р 0,1 0,7 0,15 0,05 то М = 2. 38 Пример 2. Для непрерывной случайной величины, заданной плотностью 1 f ( x)   (1  x 2 ) , модой является абсцисса точки максимума: распределения М = 0. Замечание 1. Если кривая распределения имеет больше одного максимума, распределение называется полимодальным, если эта кривая не имеет максимума, но имеет минимум – антимодальным. Замечание 2. В общем случае мода и математическое ожидание не совпадают. Но, если распределение является симметричным и модальным (то есть кривая распределения симметрична относительно прямой х = М) и имеет математическое ожидание, оно совпадает с модой. Определение 9.4. Медианой Ме непрерывной случайной величины называют такое ее значение, для которого p( X < Me ) = p( X > Me ). (9.3) Графически прямая х = Ме делит площадь фигуры, ограниченной кривой распределения, на две равные части. Замечание. Для симметричного модального распределения медиана совпадает с математическим ожиданием и модой. Определение 9.5. Для случайной величины Х с функцией распределения F(X) квантилью порядка р (0 < p < 1) называется число Кр такое, что F(Kp) ≤ p, F(Kp + 0) ≥ p. В частности, если F(X) строго монотонна, Кр: F(Kp) = p. Асимметрия и эксцесс. Если распределение не является симметричным, можно оценить асимметрию кривой распределения с помощью центрального момента 3-го порядка. Действительно, для симметричного распределения все нечетные центральные моменты равны 0 ( как интегралы от нечетных функций в симметричных пределах), поэтому выбран нечетный момент наименьшего порядка, не тождественно равный 0. Чтобы получить безразмерную характеристику, его делят на σ3 (так как μ3 имеет размерность куба случайной величины). Определение 9.6. Коэффициентом асимметрии случайной величины называется Sk  3 3 . 39 (9.4) Рис.1. Рис.2. В частности, для кривой, изображенной на рис.1, Sk > 0, а на рис.2 Sk < 0. Для оценки поведения кривой распределения вблизи точки максимума (для определения того, насколько «крутой» будет его вершина) применяется центральный момент 4-го порядка. Определение 9.7. Эксцессом случайной величины называется величина Ех  4  3. 4 (9.5) Замечание. Можно показать, что для нормального распределения 4 3 4 , и, соответственно, Ех = 0. Для кривых с более острой вершиной Ех >0, в случае более плоской вершины Ех < 0. Числовые характеристики двумерных случайных величин. Такие характеристики, как начальные и центральные моменты, можно ввести и для системы двух случайных величин. Определение 9.8. Начальным моментом порядка k, s двумерной случайной величины (Х, Y) называется математическое ожидание произведения Xk на Ys: αk,s = M (XkYs). (9.6) Для дискретных случайных величин  k , s   xik y sj pij , i j для непрерывных случайных величин  k ,s     x k y s f ( x, y)dxdy.  Определение 9.9. Центральным моментом порядка k, s двумерной случайной величины (Х, Y) называется математическое ожидание произведения (X – M(X))k на (Y – M(Y))s: μk,s = M((X – M(X))k(Y – M(Y))s). (9.7) Для дискретных случайных величин  k ,s   ( xi  M ( X )) k ( y j  M (Y )) s pij , i j 40 для непрерывных случайных величин  k ,s      ( x  M ( X )) k ( y  M (Y )) s f ( x, y)dxdy.  При этом М(Х) = α1,0, M(Y) = α0,1, D(X) = μ2,0, D(Y) = μ0,2. Корреляционный момент и коэффициент корреляции. Определение 9.10. Корреляционным моментом системы двух случайных величин называется второй смешанный центральный момент: Kxy = μ1,1 = M((X – M(X))(Y – M(Y))). (9.8) Для дискретных случайных величин К ху   ( xi  M ( X ))( y j  M (Y )) pij , i j для непрерывных случайных величин   К ху    ( x  M ( X ))( y  M (Y )) f ( x, y)dxdy.  Безразмерной характеристикой коррелированности двух величин является коэффициент корреляции rxy  случайных K xy  x y (9.9) Корреляционный момент описывает связь между составляющими двумерной случайной величины. Действительно, убедимся, что для независимых Х и Y Kxy = 0. В этом случае f(x,y) = =f1(x)f2(y), тогда     K xy   ( x  M ( X )) f1 ( x)dx  ( y  M (Y )) f 2 ( y)dy  1 ( x)  2 ( y)  0. Итак, две независимые случайные величины являются и некоррелированными. Однако понятия коррелированности и зависимости не эквивалентны, а именно, величины могут быть зависимыми, но при этом некоррелированными. Дело в том, что коэффициент корреляции характеризует не всякую зависимость, а только линейную. В частности, если Y = aX + b, то rxy = ±1. Найдем возможные значения коэффициента корреляции. Теорема 9.1. | rxy | 1. Доказательство. Докажем сначала, что | K xy |  x y . Действительно, если рассмотреть случайную величину Z1   y X   xY и найти ее дисперсию, то получим: D(Z1 )  2 x2 y2  2 x y K xy . Так как дисперсия всегда неотрицательна, то 2 x2 y2  2 x y K xy  0, K xy Отсюда  x y  rxy  0, откуда | K xy |  x y . что и требовалось доказать. 41 Лекция 10. Функции от случайных величин. Функция одного случайного аргумента, ее распределение и математическое ожидание. Функция двух случайных аргументов. Распределение суммы независимых слагаемых. Устойчивость нормального распределения. В предыдущих лекциях рассматривались некоторые законы распределения случайных величин. При решении задач часто удобно бывает представить исследуемую случайную величину как функцию других случайных величин с известными законами распределения, что помогает установить и закон распределения заданной случайной величины. Определение 10.1. Если каждому возможному значению случайной величины Х соответствует одно возможное значение случайной величины Y, то Y называют функцией случайного аргумента Х: Y = φ(X). Выясним, как найти закон распределения функции по известному закону распределения аргумента. 1) Пусть аргумент Х – дискретная случайная величина, причем различным значениям Х соответствуют различные значения Y. Тогда вероятности соответствующих значений Х и Y равны. Пример 1. Ряд распределения для Х имеет вид: Х 5 6 7 8 р 0,1 0,2 0,3 0,4 Найдем закон распределения функции Y = 2X² - 3: Y 47 69 95 125 р 0,1 0,2 0,3 0,4 (при вычислении значений Y в формулу, задающую функцию, подставляются возможные значения Х). 2) Если разным значениям Х могут соответствовать одинаковые значения Y, то вероятности значений аргумента, при которых функция принимает одно и то же значение, складываются. Пример 2. Ряд распределения для Х имеет вид: Х 0 1 2 3 р 0,1 0,2 0,3 0,4 Найдем закон распределения функции Y = X² - 2Х: Y -1 3 р 0,2 0,4 0,4 (так как Y = 0 при Х = 0 и Х = 2, то р (Y = 0) = р (Х = 0) + р (Х = 2) = 0,1 + 0,3 = 0,4 ). 3) Если Х – непрерывная случайная величина, Y = φ(X), φ(x) – монотонная и дифференцируемая функция, а ψ(у) – функция, обратная к φ(х), то плотность распределения g(y) случайно функции Y равна: g ( y )  f ( ( y )) |  ( y ) | . (10.1) 42 Пример. f ( x)  1 , Y  x3 2  (1  x ) . Тогда  ( у)  3  1  23  1 у , g ( y)    y   2 2 2 3  3y 3 (1  y 3 )  (1  y 3 )  1 Математическое ожидание функции одного случайного аргумента. Пусть Y = φ(X) – функция случайного аргумента Х, и требуется найти ее математическое ожидание, зная закон распределения Х. 1) Если Х – дискретная случайная величина, то n M (Y )  M ( ( x))    ( xi ) pi . i 1 (10.2) Пример 3. Найдем M(Y) для примера 1: M(Y) = 47·0,1 + 69·0,2 + 95·0,3 + 125·0,4 = 97. 2) Если Х – непрерывная случайная величина, то M(Y) можно искать по-разному. Если известна плотность распределения g(y), то  M (Y )   yg( y)dy. (10.3) Если же g(y) найти сложно, то можно использовать известную плотность распределения f(x):   M (Y )    ( x) f ( x)dx. (10.4) В частности, если все значения Х принадлежат промежутку (а, b), то  b M (Y )    ( x) f ( x)dx. а (10.4`) Функция двух случайных величин. Распределение суммы независимых слагаемых. Определение 10.2. Если каждой паре возможных значений случайных величин Х и Y соответствует одно возможное значение случайной величины Z, то Z называют функцией двух случайных аргументов X и Y : Z = φ(X, Y). Рассмотрим в качестве такой функции сумму Х + Y. В некоторых случаях можно найти ее закон распределения, зная законы распределения слагаемых. 1) Если X и Y – дискретные независимые случайные величины, то для определения закона распределения Z = Х + Y нужно найти все возможные значения Z и соответствующие им вероятности. 43 Пример 4. Рассмотрим дискретные случайные величины X и Y, законы распределения которых имеют вид: Х -2 1 3 Y 0 1 2 р 0,3 0,4 0,3 р 0,2 0,5 0,3 Найдем возможные значения Z: -2 + 0 = -2 ( р = 0,3·0,2 = 0,06), -2 + 1 = -1 (р = 0,3·0,5 = 0,15), -2 + 2 = 0 (р = 0,3·0,3 = 0,09), 1 + 0 = 1 (р = 0,4·0,2 = 0,08), 1 + 1 = 2 (р = 0,4·0,5 = 0,2), 1 + 2 = 3 (р = 0,4·0,3 = 0,12), 3 + 0 = 3 (р = 0,3·0,2 = 0,06), 3 + 1 = 4 (р = 0,3·0,5 = 0,15), 3 + 2 = 5 (р = 0,3·0,3 = 0,09). Сложив вероятности повторившегося дважды значения Z = 3, составим ряд распределения для Z: Z -2 -1 1 2 3 4 5 р 0,06 0,15 0,09 0,08 0,2 0,18 0,15 0,09 3) Если X и Y – непрерывные независимые случайные величины, то, если плотность вероятности хотя бы одного из аргументов задана на (-∞, ∞) одной формулой, то плотность суммы g(z) можно найти по формулам  g ( z)    f1 ( x) f 2 ( z  x)dx   f ( z  y) f 1 2 ( y)dy, (10.5) где f1(x), f2(y) – плотности распределения слагаемых. Если возможные значения аргументов неотрицательны, то   z z g ( z )   f1 ( x) f 2 ( z  x)dx   f1 ( z  y ) f 2 ( y )dy. Замечание. Плотность распределения суммы случайных величин называют композицией. двух (10.6) независимых Устойчивость нормального распределения. Определение 10.3. Закон распределения вероятностей называется устойчивым, если композиция таких законов есть тот же закон (возможно, отличающийся другими значениями параметров). В частности, свойством устойчивости обладает нормальный закон распределения: композиция нормальных законов тоже имеет нормальное распределение, причем ее математическое ожидание и дисперсия равны суммам соответствующих характеристик слагаемых. 44 Лекция 11. Нормальный закон распределения на плоскости. Линейная регрессия. Линейная корреляция. Определение 11.1. Нормальным законом распределения на плоскости называют распределение вероятностей двумерной случайной величины (X, Y), если f ( x, y )   1 2 x y 1  rxy2 e  ( xa )2 ( y a )2 x  a1 y  a2 1 1 2    2 rxy x y 2 (1 rxy2 )   x2  y2     (11.1) Таким образом, нормальный закон на плоскости определяется 5 параметрами: а1, а2, σх, σу, rxy, где а1, а2 – математические ожидания, σх, σу – средние квадратические отклонения, rxy – коэффициент корреляции Х и Y. Предположим, что rxy = 0, то есть Х и Y некоррелированы. Тогда из (11.1) получим: f ( x, y)  1 2 x y e  ( x a )2 ( y a )2 1 2  0 , 5   2  y2 x        1  x 2 e ( x  a1 ) 2 2 x2  1  y 2  ( y  a2 ) 2 e 2 y2  f1 ( x) f 2 ( y). Следовательно, из некоррелированности составляющих нормально распределенной двумерной случайной величины следует их независимость, то есть для них понятия независимости и некоррелированности равносильны. Линейная регрессия. Пусть составляющие Х и Y двумерной случайной величины (Х, Y) зависимы. Будем считать, что одну из них можно приближенно представить как линейную функцию другой, например Y ≈ g(Х) = α + βХ, (11.2) и определим параметры α и β с помощью метода наименьших квадратов. Определение 11.2. Функция g(Х) = α + βХ называется наилучшим приближением Y в смысле метода наименьших квадратов, если математическое ожидание М(Y - g(Х))2 принимает наименьшее возможное значение; функцию g(Х) называют среднеквадратической регрессией Y на Х. Теорема 11.1. Линейная средняя квадратическая регрессия Y на Х имеет вид: g( X )  my  r y ( X  m x ), x mx  M ( X ), m y  M (Y ), x  D( X ) ,  y  D(Y ) , r  (11.3) K xy  x y где - коэффициент корреляции Х и Y. Доказательство. Рассмотрим функцию F(α, β) = M(Y – α – βX)² (11.4) и преобразуем ее, учитывая соотношения M(X – mx) = M(Y – my) = 0, M((X – mx)(Y – my)) = Kxy = rσxσy: 45 F ( ,  )   y2   2 x2  2r x y   (m y    mx ) 2 . Найдем стационарные точки полученной функции, решив систему  F  2(m y    m x )  0,    F  2  x2  2r x y  0.    Решением системы будет  r y y ,  m y  r mx x x . Можно проверить, что при этих значениях функция F(α, β) имеет минимум, что доказывает утверждение теоремы. Определение 11.3. Коэффициент регрессии Y на Х, а прямая у  my  r  r y x называется коэффициентом y ( х  mx ) x - (11.5) - прямой среднеквадратической регрессии Y на Х. Подставив координаты стационарной точки в равенство (11.4), можно 2 2 найти минимальное значение функции F(α, β), равное  у (1  r ). Эта величина называется остаточной дисперсией Y относительно Х и характеризует величину ошибки, допускаемой при замене Y на g(Х) = α+βХ. При r  1 остаточная дисперсия равна 0, то есть равенство (11.2) является не приближенным, а точным. Следовательно, при r  1 Y и Х связаны линейной функциональной зависимостью. Аналогично можно получить прямую среднеквадратической регрессии Х на Y: х  mх  r х ( у  mу ) у (11.6) и остаточную дисперсию Х относительно Y. r  1 обе прямые регрессии совпадают. Решив систему из При уравнений (11.5) и (11.6), можно найти точку пересечения прямых регрессии – точку с координатами (тх, ту), называемую центром совместного распределения величин Х и Y. Линейная корреляция. Для двумерной случайной величины (Х, Y) можно ввести так называемое условное математическое ожидание Y при Х = х. Для дискретной случайной величины оно определяется как 46 m M (Y | X  x)   y j p( y j / x), j 1 (11.7) для непрерывной случайной величины –  M (Y | X  x)   y ( y / x)dy . (11.8) Определение 11.4. Функцией регрессии Y на Х называется условное математическое ожидание M(Y / x) = f(x). Аналогично определяется условное математическое ожидание Х и функция регрессии Х на Y.  Определение 11.5. Если обе функции регрессии Х на Y и Y на Х линейны, то говорят, что Х и Y связаны линейной корреляционной зависимостью. При этом графики линейных функций регрессии являются прямыми линиями, причем можно доказать, что эти линии совпадают с прямыми среднеквадратической регрессии. Теорема 11.2. Если двумерная случайная величина (Х, Y) распределена нормально, то Х и Y связаны линейной корреляционной зависимостью. Доказательство. Найдем условный закон распределения Y при Х = х  f ( x, y )   ( у / х)   f1 ( x)   , используя формулу двумерной плотности вероятности нормального распределения (11.1) и формулу плотности вероятности Х: f 1 ( x)  u Сделаем замену  ( y / x)  1 2  y  e x  a1 x , v 1  x 2 e ( x  a1 ) 2 2 x2  (11.9) y  a2 y . Тогда ( v  ru ) 2 2 (1 r 2 ) . 1  y 1  r 2 2 e      y  a2  r y ( x  a1 )      x    2 2 2 y (1 r ) 2 . Полученное распределение является нормальным, а его математическое M (Y / x)  a 2  r y ( x  a1 ) x есть функция регрессии Y на Х (см. ожидание определение 11.4)). Аналогично можно получить функцию регрессии Х на Y: M ( Х / у )  a1  r 47 х ( у  a2 ) у . Обе функции регрессии линейны, поэтому корреляция между Х и Y линейна, что и требовалось доказать. При этом уравнения прямых регрессии имеют вид у  а2  r y ( х  а1 ) x , х  а1  r х ( у  а2 ) у , то есть совпадают с уравнениями прямых среднеквадратической регрессии (см. формулы (11.5), (11.6)). Лекция 12. Распределения «хи-квадрат», Стьюдента и Фишера. Связь этих распределений с нормальным распределением. Рассмотрим некоторые распределения, связанные с нормальным и широко применяющиеся в математической статистике. Распределение «хи-квадрат». Пусть имеется несколько нормированных нормально распределенных случайных величин: Х1, Х2,…, Хп (ai = 0, σi = 1). Тогда сумма их квадратов n  2   X i2 i 1 (12.1) является случайной величиной, распределенной по так называемому закону «хи-квадрат» с k = n степенями свободы; если же слагаемые связаны каким-либо соотношением (например, степеней свободы k = n – 1. Плотность этого распределения  0, x  0; x k   1 1  e 2 x 2 , x  0. f ( x)   k  2 2  k   2 Х i  nX ), то число (12.2)  ( x)   t x 1e t dt Здесь - гамма-функция; в частности, Г(п + 1) = п! . Следовательно, распределение «хи-квадрат» определяется одним параметром – числом степеней свободы k. Замечание 1. С увеличением числа степеней свободы распределение «хиквадрат» постепенно приближается к нормальному. Замечание 2. С помощью распределения «хи-квадрат» определяются многие другие распределения, встречающиеся на практике, например, распределение случайной величины  - длины случайного вектора (Х1, Х2,…, Хп), координаты которого независимы и распределены по нормальному закону. 2 48 Распределение Стьюдента. Рассмотрим две независимые случайные величины: Z, имеющую нормальное распределение и нормированную (то есть М (Z ) = 0, σ( Z) = 1), и V, распределенную по закону «хи-квадрат» с k степенями свободы. Тогда величина Т Z V k (12.3) имеет распределение, называемое t – распределением или распределением Стьюдента с k степенями свободы. С возрастанием числа степеней свободы распределение Стьюдента быстро приближается к нормальному. Распределение F Фишера – Снедекора. Рассмотрим две независимые случайные величины U и V, распределенные по закону «хи-квадрат» со степенями свободы k1 и k2 и образуем из них новую величину F U / k1 V / k2 . (12.4) Ее распределение называют распределением F Фишера – Снедекора со степенями свободы k1 и k2. Плотность его распределения имеет вид  0, x  0; k1  2  x 2 f ( x)   C , k1  k 2  0 2  (k 2  k1 x)  k  k2   1  k1 k 2 2   C0  k  k   1  2  2  2 где k1 2 x  0, (12.5) k2 2 . Таким образом, распределение Фишера определяется двумя параметрами – числами степеней свободы. Лекция 13. Закон больших чисел. Неравенство Чебышева. Теоремы Чебышева и Бернулли. Изучение статистических закономерностей позволило установить, что при некоторых условиях суммарное поведение большого количества случайных величин почти утрачивает случайный характер и становится закономерным (иначе говоря, случайные отклонения от некоторого среднего поведения взаимно погашаются). В частности, если влияние на сумму отдельных слагаемых является равномерно малым, закон 49 распределения суммы приближается к нормальному. Математическая формулировка этого утверждения дается в группе теорем, называемой законом больших чисел. Неравенство Чебышева. Неравенство Чебышева, используемое для доказательства дальнейших теорем, справедливо как для непрерывных, так и для дискретных случайных величин. Докажем его для дискретных случайных величин. Теорема 13.1(неравенство Чебышева). p( | X – M(X)| < ε ) ≥ D(X) / ε². Доказательство. Пусть Х задается рядом распределения Х х1 х2 … р р1 р2 … (13.1) хп рп Так как события |X – M(X)| < ε и |X – M(X)| ≥ ε противоположны, то р ( |X – M(X)| < ε ) + р ( |X – M(X)| ≥ ε ) = 1, следовательно, р ( |X – M(X)| < ε ) = 1 - р ( |X – M(X)| ≥ ε ). Найдем р ( |X – M(X)| ≥ ε ). D(X) = (x1 – M(X))²p1 + (x2 – M(X))²p2 + … + (xn – M(X))²pn . Исключим из этой суммы те слагаемые, для которых |X – M(X)| < ε. При этом сумма может только уменьшиться, так как все входящие в нее слагаемые неотрицательны. Для определенности будем считать, что отброшены первые k слагаемых. Тогда D(X) ≥ (xk+1 – M(X))²pk+1 + (xk+2 – M(X))²pk+2 + … + (xn – M(X))²pn ≥ ε² (pk+1 + pk+2 + … + pn). Отметим, что pk+1 + pk+2 + … + pn есть вероятность того, что |X – M(X)| ≥ ε, так как это сумма вероятностей всех возможных значений Х, для которых это неравенство справедливо. Следовательно, D(X) ≥ ε² р(|X – M(X)| ≥ ε), или р (|X – M(X)| ≥ ε) ≤ D(X) / ε². Тогда вероятность противоположного события p( | X – M(X)| < ε ) ≥ D(X) / ε², что и требовалось доказать. Теоремы Чебышева и Бернулли. Теорема 13.2 (теорема Чебышева). Если Х1, Х2,…, Хп – попарно независимые случайные величины, дисперсии которых равномерно ограничены ( D(Xi) ≤ C), то для сколь угодно малого числа ε вероятность неравенства Х 1  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п )   п п будет сколь угодно близка к 1, если число случайных величин достаточно велико. 50 Замечание. Иначе говоря, при выполнении этих условий lim p( n  Х 1  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п )    )  1. п п Доказательство. Рассмотрим новую случайную величину X X 1  X 2  ...  X n n и найдем ее математическое ожидание. Используя свойства математического ожидания, получим, что  Х  Х 2  ...  Х п  М ( Х 1 )  М ( Х 2 )  ...  М ( Х п ) М 1  п п   . Применим к Х неравенство Чебышева:  X  X 2  ...  X n D 1 Х  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п ) n p( 1   )  1  2 п п    . Так как рассматриваемые случайные величины независимы, то, учитывая условие теоремы, имеем:  X  X 2  ...  X n  D( X 1 )  D( X 2 )  ...  D( X n ) Cn C D 1  2  .  n n n2 n   Используя этот результат, представим предыдущее неравенство в виде: Х 1  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п ) С   )  1 2 . п п п Перейдем к пределу при п   : p( lim p( n  Х 1  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п )    )  1. п п Поскольку вероятность не может быть больше 1, можно утверждать, что lim p( n  Х 1  Х 2  ...  Х п М ( Х 1 )  М ( Х 2 )  ...  М ( Х п )    )  1. п п Теорема доказана. Следствие. Если Х1, Х2, …, Хп – попарно независимые случайные величины с равномерно ограниченными дисперсиями, имеющие одинаковое математическое ожидание, равное а, то для любого сколь угодно малого Х 1  Х 2  ...  Х п а  п будет как угодно ε > 0 вероятность неравенства близка к 1, если число случайных величин достаточно велико. Иначе говоря, lim p ( n  Х 1  Х 2  ...  Х п  а  ) 1 п . 51 Вывод: среднее арифметическое достаточно большого числа случайных величин принимает значения, близкие к сумме их математических ожиданий, то есть утрачивает характер случайной величины. Например, если проводится серия измерений какой-либо физической величины, причем: а) результат каждого измерения не зависит от результатов остальных, то есть все результаты представляют собой попарно независимые случайные величины; б) измерения производятся без систематических ошибок (их математические ожидания равны между собой и равны истинному значению а измеряемой величины); в) обеспечена определенная точность измерений, следовательно, дисперсии рассматриваемых случайных величин равномерно ограничены; то при достаточно большом числе измерений их среднее арифметическое окажется сколь угодно близким к истинному значению измеряемой величины. Теорема Бернулли. Теорема 13.3 (теорема Бернулли). Если в каждом из п независимых опытов вероятность р появления события А постоянна, то при достаточно большом числе испытаний вероятность того, что модуль отклонения относительной частоты появлений А в п опытах от р будет сколь угодно малым, как угодно близка к 1: m  lim p  p     1. n   n  (13.2) Доказательство. Введем случайные величины Х1, Х2, …, Хп, где Xi – число появлений А в i-м опыте. При этом Xi могут принимать только два значения: 1(с вероятностью р) и 0 (с вероятностью q = 1 – p). Кроме того, рассматриваемые случайные величины попарно независимы и их дисперсии равномерно ограничены (так как D(Xi) = pq, p + q = 1, откуда pq ≤ ¼ ). Следовательно, к ним можно применить теорему Чебышева при Mi = p: lim p( n  Х 1  Х 2  ...  Х п  р  ) 1 п . Х 1  Х 2  ...  Х п т  п п , так как Xi Но принимает значение, равное 1, при появлении А в данном опыте, и значение, равное 0, если А не произошло. Таким образом, m  lim p  p     1, n   n  что и требовалось доказать. 52 m  p. Замечание. Из теоремы Бернулли не следует, что n n lim Речь идет лишь о вероятности того, что разность относительной частоты и вероятности по модулю может стать сколь угодно малой. Разница заключается в следующем: при обычной сходимости, рассматриваемой в математическом анализе, для всех п, начиная с некоторого значения, т  р  п неравенство выполняется всегда; в нашем случае могут найтись такие значения п, при которых это неравенство неверно. Этот вид сходимости называют сходимостью по вероятности. Лекция 14. Центральная предельная теорема Ляпунова. Предельная теорема Муавра-Лапласа. Закон больших чисел не исследует вид предельного закона распределения суммы случайных величин. Этот вопрос рассмотрен в группе теорем, называемых центральной предельной теоремой. Они утверждают, что закон распределения суммы случайных величин, каждая из которых может иметь различные распределения, приближается к нормальному при достаточно большом числе слагаемых. Этим объясняется важность нормального закона для практических приложений. Характеристические функции. Для доказательства центральной предельной теоремы используется метод характеристических функций. Определение 14.1. Характеристической функцией случайной величины Х называется функция g (t) = M ( eitX ) (14.1) Таким образом, g (t) представляет собой математическое ожидание некоторой комплексной случайной величины U = eitX, связанной с величиной Х. В частности, если Х – дискретная случайная величина, заданная рядом распределения, то n g (t )   e itxk p k k 1 . (14.2) Для непрерывной случайной величины с плотностью распределения f(x)  g (t )   e itx f ( x)dx. (14.3) Пример 1. Пусть Х – число выпадений 6 очков при одном броске игральной кости. Тогда по формуле (14.2)  g(t) = e it 0 5 5  e it it 1 1  e   . 6 6 6 53 Пример 2. Найдем характеристическую функцию для нормированной непрерывной случайной величины, распределенной по нормальному   f ( x)   закону  1 e 2  x2 2    . По формуле (14.3)  g (t )   e 1 itx 2   ( использовалась формула e e  x2 2 dx   Ax 2  2 Bx C dx    1 2  A e itx x2 2 dx  e  t2 2  e  AC  B 2 A и то, что i² = -1). Свойства характеристических функций. 1. Функцию f(x) можно найти по известной функции g(t) по формуле f ( x)  1 2  e itx g (t )dt. (14.4) Фурье, а  (преобразование (14.3) называется преобразованием преобразование (14.4) – обратным преобразованием Фурье ). 2. Если случайные величины Х и Y связаны соотношением Y = aX, то их характеристические функции связаны соотношением gy (t) = gx (at). (14.5) 3. Характеристическая функция суммы независимых случайных величин равна произведению характеристических функций слагаемых: для n Y   Xk k 1 g y (t )  g x1 (t )  g x2 (t )  ...  g xn (t ) (14.6) Теорема 14.1 (центральная предельная теорема распределенных слагаемых). Если Х1, Х2,…, Хп,… случайные величины с одинаковым законом математическим ожиданием т и дисперсией σ2, то при для одинаково - независимые распределения, неограниченном n Yn   X k k 1 увеличении п закон распределения суммы неограниченно приближается к нормальному. Доказательство. Докажем теорему для непрерывных случайных величин Х1, Х2,…, Хп (доказательство для дискретных величин аналогично). Согласно условию теоремы, характеристические функции слагаемых одинаковы:  g x (t )   e itx f ( x)dx.  Тогда по свойству 3 характеристическая функция суммы Yn будет 54 g yn (t )  g xn (t ). Разложим функцию gx(t) в ряд Маклорена:  g  (0)  g x (t )  g x (0)  g x (0)t   x   (t ) t 2  2  , где  (t )  0 при t  0 . Найдем  g x (0)     f ( x)dx  1, g x (0)   ixeitx f ( x)dx   t 0  i  xeitx f ( x)dx   t 0  i  xf ( x)dx  im.  Если предположить, что т = 0 (перенести начало отсчета в точку т ), то g x (0)  0 .  g x (0)    x 2 e itx f ( x)dx   t 0    x 2 f ( x)dx   2  (так как т = 0). Подставив полученные результаты в формулу Маклорена, найдем, что  2  g x (t )  1     (t ) t 2  2  . Zn  Yn  n , отличающуюся от Yn Рассмотрим новую случайную величину тем, что ее дисперсия при любом п равна 0. Так как Yn и Zn связаны линейной зависимостью, достаточно доказать, что Zn распределена по нормальному закону, или, что то же самое, что ее характеристическая функция приближается к характеристической функции нормального закона (см. пример 2). По свойству характеристических функций   2  t    t   t  t 2 g zn (t )  g yn     g x     1        2    n     n    n   n   2 n n     . Прологарифмируем полученное выражение:  2  t  t 2 k        , lim k  0. 2 n  ln g zn (t )  n ln(1  k ), 2 n   n     где Разложим ln(1  k ) в ряд при п → ∞, ограничившись двумя членами разложения, тогда ln(1 - k) ≈ - k. Отсюда  t2  t  t2  t2 t2  t  lim ln g zn (t )  lim n  (k )  lim      2     lim 2    n  n  n  n   2 2   n  n    ,   где последний предел равен 0, так как  (t )  0 при t  0 . Следовательно, 2 t t2  lim ln g zn (t )   lim g (t )  e 2 n  2 , то есть n zn - характеристическая функция нормального распределения. Итак, при неограниченном увеличении числа слагаемых характеристическая функция величины Zn неограниченно приближается к 55 характеристической функции нормального закона; следовательно, закон распределения Zn ( и Yn) неограниченно приближается к нормальному. Теорема доказана. А.М.Ляпунов доказал центральную предельную теорему для условий более общего вида: Теорема 14.2 (теорема Ляпунова). Если случайная величина Х представляет собой сумму очень большого числа взаимно независимых случайных величин, для которых выполнено условие: n b lim n  k 1 k 3  n 2   Dk   k 1  (14.7) где bk – третий абсолютный центральный момент величины Хк, а Dk – ее дисперсия, то Х имеет распределение, близкое к нормальному ( условие Ляпунова означает, что влияние каждого слагаемого на сумму ничтожно мало). Практически можно использовать центральную предельную теорему при достаточно небольшом количестве слагаемых, так как вероятностные расчеты требуют сравнительно малой точности. Опыт показывает, что для суммы даже десяти и менее слагаемых закон их распределения можно заменить нормальным. Частным случаем центральной предельной теоремы для дискретных случайных величин является теорема Муавра-Лапласа. Теорема 14.3 (теорема Муавра-Лапласа). Если производится п независимых опытов, в каждом из которых событие А появляется с вероятностью р, то справедливо соотношение:   Y  np p       (  )  ( ),   npq   (14.8) где Y – число появлений события А в п опытах, q = 1 – p. Доказательство. n Будем считать, что Y   Xi i 1 , где Хi – число появлений события А в i-м Z Y  my y опыте. Тогда случайную величину (см. теорему 14.1) можно считать распределенной по нормальному закону и нормированной, следовательно, вероятность ее попадания в интервал (α, β) можно найти по формуле p  Z     (  )  ( ) . Поскольку Y имеет биномиальное распределение, т у  пр, D y  npq,  y  npq 56 . Z Y  np npq Тогда . Подставляя это выражение в предыдущую формулу, получим равенство (14.8). Следствие. В условиях теоремы Муавра-Лапласа вероятность р n (k ) того, что событие А появится в п опытах ровно k раз, при большом количестве опытов можно найти по формуле: p n (k )  x k  np npq  ( x)  1 2 e 1 npq   ( x), (14.9) x2  2 где ,а (значения этой функции приводятся в специальных таблицах). Пример 3. Найти вероятность того, что при 100 бросках монеты число выпадений герба окажется в пределах от 40 до 60. Применим формулу (14.8), учитывая, что п = 0,5. Тогда пр = 100·0,5 = 50, npq  100  0,5  (1  0,5)  5. Y  50  2. 5 Тогда, если Следовательно, Y  50   p 40  Y  60  p  2   2    (2)   (2)  0,9772  0,0228  0,9544. 5   40  Y  60, 2  Пример 4. В условиях предыдущего примера найти вероятность того, что выпадет 45 гербов. Найдем x 45  50  1 5 , тогда 1 1 1 p100 (45)    (1)    (1)   0,2420  0,0484. 5 5 5 57

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

#Лекция

Теории вероятностей; случайные события; алгебра событий

Тебе могут подойти лекции

Теория вероятностей

Основные понятия теории вероятностей

Вероятностное пространство. Случайные величины. Математическое ожидание

Принятие решений в условиях неопределенности финансового рынка

Одномерные случайные величины, закон и функция распределения вероятностей

Теория вероятностей

Случайные события

Случайные величины.

Предмет теории вероятностей

Случайные величины, имеющие плотности. Функция распределения

Теории вероятностей; случайные события; алгебра событий

Тебе могут подойти лекции

Другие технические предметы

Помощь с написанием учебных работ