Комбинаторика
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1
Комбинаторика
Комбинаторика – это раздел математики, который занимается изучением
способов выбора и подсчёта комбинаций.
Основные правила, используемые в комбинаторике, – правило сложения и правило
умножения.
Рассмотрим два конечных множества 𝐴 и 𝐵. Пусть 𝑛(𝐴) – число элементов
множества 𝐴, 𝑛(𝐴) ∈ 𝑁; 𝑛(𝐵) – число элементов множества 𝐵, 𝑛(𝐵) ∈ 𝑁. Если
множество пустое, то 𝑛(∅) = 0.
Правило сложения. Если объект 𝛼 можно выбрать 𝑛(𝐴) числом способов, объект
𝛽 можно выбрать 𝑛(𝐵) числом способов, то выбор хотя бы одного из объектов 𝛼, 𝛽
можно произвести 𝑛(𝐴 + 𝐵) = 𝑛(𝐴) + 𝑛(𝐵) − 𝑛(𝐴 ⋅ 𝐵) числом способов.
Пример 1. Сколько чисел из первых 100 натуральных делится на 2 или на 3?
Пусть А – множество натуральных чисел из первых 100, делящихся на 2, 𝑛(𝐴) =
50 (каждое второе число); В – множество натуральных чисел из первых 100,
делящихся на 3, 𝑛(𝐵) = 33 (каждое третье). C – множество натуральных чисел из
первых 100, делящихся и на 2, и на 3, 𝑛(А𝐵) = 16 (каждое шестое).
𝑛(А + В) = 𝑛(А) + 𝑛(В) − 𝑛 (𝐴𝐵) = 50 + 33 – 16 = 67.
Правило умножения. Если объект 𝛼 можно выбрать 𝑛(𝐴) числом способов, объект
𝛽 можно выбрать 𝑛(𝐵) числом способов, то выбор 𝛼 и 𝛽 можно осуществить 𝑛(𝐴) ⋅
𝑛(𝐵) числом способов, при условии, что способы выбора 𝛼 и 𝛽 независимы.
Пример 2. 4 мальчика и 4 девочки садятся на 8 расположенных в ряд стульев,
мальчики садятся на стулья с нечётными номерами, девочки – с чётными. Сколько
существует способов одновременной рассадки мальчиков и девочек?
А = {мальчики} 𝑛 = 4. Между множеством мальчиков и множеством стульев с
нечётными номерами можно установить взаимно однозначное соответствие. 1-ый
мальчик может выбрать 1 из 4 стульев, 2-ой – 1 из 3, 3-ий – 1 из 2, 4-ый – 1 из 1. Всего,
по правилу умножения, выбор мальчиками стульев с нечётными номерами можно
осуществить 4321 = 24 способами. Аналогично, девочки могут выбрать стулья с
чётными номерами 24 способами. По правилу умножения, так как способы выбора
стульев мальчиками и девочками независимы, одновременный выбор стульев можно
осуществить 2424 = 576 способами.
Выборки без повторений
Рассмотрим конечное множество А, число элементов этого множества обозначим
𝑛 и назовём объёмом множества. Составим выборки по 𝑘 элементов множества А,
которые как объекты выборки не повторяются.
Размещения. Размещениями без повторений из п элементов множества А по k
элементов этого множества называются упорядоченные выборки без повторений,
составленные из элементов множества А, имеющие один и тот же объём 𝑘.
Обозначение: А𝑘𝑛 .
2
𝑛!
𝐴𝑘𝑛 =
(𝑛 − 𝑘)!
В размещениях при изменении состава элементов получаем новое размещение
(состав важен), при изменении порядка элементов получаем новое размещение
(порядок важен).
Пример 3. Сколько двузначных чисел можно составить из цифр 1, 4, 5, 8, 9, при
условии, что цифры в числе не повторяются?
А = {1, 4, 5, 8, 9}. 𝑛 = 5, 𝑘 = 2. Без повторений. Состав важен. Порядок важен.
Число всех выборок совпадёт с числом размещений без повторений из 5 элементов
по 2.
5!
1⋅2⋅3⋅4⋅5
𝑁 = 𝐴25 =
=
= 20
(5 − 2)!
1⋅2⋅3
Перестановки. Перестановками без повторений из п элементов множества А
по п элементов этого множества называются упорядоченные выборки без
повторений, составленные из элементов множества А, имеющие один и тот же объём
𝑛. Перестановки – частный случай размещений, когда 𝑛 = 𝑘.
Обозначение: 𝑃𝑛 .
𝑃𝑛 = 𝑛!
В перестановках изменить состав элементов нельзя (состав неважен), при
изменении порядка элементов получаем новую перестановку (порядок важен).
Пример 4. Сколько существует способов составления колонны из 5 автомобилей?
А = {автомобили} 𝑛 = 5, 𝑘 = 5. Без повторений. Состав неважен. Порядок
важен. Число всех выборок совпадёт с числом перестановок без повторений из 5
элементов по 5.
𝑁 = Р5 = 5! = 12345 = 120.
Сочетания. Сочетаниями без повторений из п элементов множества А по k
элементов этого множества называются неупорядоченные выборки без повторений,
составленные из элементов множества А, имеющие один и тот же объём k.
Обозначение: С𝑘𝑛
𝑛!
С𝑘𝑛 =
𝑘! (𝑛 − 𝑘)!
В сочетаниях при изменении состава элементов получаем новое сочетание
(состав важен), порядок элементов неважен.
Пример 5. Сколько матчей будет сыграно в футбольном чемпионате с участием
16 команд, если каждые 2 команды встречаются между собой один раз?
А = {команды} 𝑛 = 16, 𝑘 = 2. Без повторений. Состав важен. Порядок
неважен. Число всех выборок совпадёт с числом сочетаний без повторений из 16
элементов по 2.
16!
16!
15 ⋅ 16
2
𝑁 = С16
=
=
=
= 120
2! (16 − 2)! 2! 14!
1⋅2
3
Выборки с повторениями
Рассмотрим конечное множество А объёмом 𝑛. Составим выборки по 𝑘
элементов множества А, которые как объекты выборки могут повторяться.
Обозначим 𝑘𝑖 – число повторений элемента 𝑎𝑖 в выборке.
𝑛
𝑘 = ∑ 𝑘𝑖
𝑖=1
Размещения. Размещениями с повторениями из п элементов множества А по k
элементов этого множества называются упорядоченные выборки с повторениями,
составленные из элементов множества А, имеющие один и тот же объём k.
𝑘
Обозначение: 𝐴𝑛 .
𝑘
𝐴𝑛 = 𝑛𝑘
Пример 6. Сколько двузначных чисел можно составить из цифр 1, 4, 5, 8, 9?
А = {1, 4, 5, 8, 9} 𝑛 = 5, 𝑘 = 2. C повторениями. Состав важен. Порядок
важен. Число всех выборок совпадёт с числом размещений с повторениями из 5
элементов по 2.
2
𝑁 = 𝐴5 = 52 = 25
Перестановки. Перестановками с повторениями из п элементов множества А
по п элементов этого множества называются упорядоченные выборки с
повторениями, составленные из элементов множества А, имеющие один и тот же объём
𝑛. Обозначение: 𝑃𝑛 (𝑛1 , 𝑛2 , … 𝑛𝑡 )
𝑛!
𝑃𝑛 (𝑛1 , 𝑛2 , . . . 𝑛𝑡 ) =
𝑛1 ! ∙ 𝑛2 ! ∙. . .∙ 𝑛𝑡 !
Пример 7. Сколько существует шестизначных чисел, составленных из карточек
с цифрами 1, 4, 4, 4, 7, 7?
А = {1, 4, 4, 4, 7, 7} 𝑛 = 6, 𝑘 = 6. С повторениями. Состав неважен. Порядок
важен. Число всех выборок совпадёт с числом перестановок с повторениями из 6
элементов по 6.
6!
1⋅2⋅3⋅4⋅5⋅6
𝑁 = 𝑃6 (1,3,2) =
=
= 60
1! ∙ 3! ∙ 2! 1 ⋅ 1 ⋅ 2 ⋅ 3 ⋅ 1 ⋅ 2
Сочетания. Сочетаниями с повторениями из п элементов множества А по k
элементов этого множества называются неупорядоченные выборки с повторениями,
составленные из элементов множества А, имеющие один и тот же объём 𝑘.
𝑘
Обозначение: 𝐶𝑛 .
𝑘
𝑘
𝐶𝑛 = 𝐶𝑛+𝑘−1
Пример 8. В магазине продают цветы 3 наименований. Сколько существует
способов составления букета из 5 цветов?
А = {наименования цветов} 𝑛 = 3, 𝑘 = 5. С повторениями. Состав важен.
Порядок неважен. Число всех выборок совпадёт с числом сочетаний с повторениями из
4
3 элементов по 5.
7!
7!
6⋅7
=
=
= 21
5! (7 − 5)! 5! 2! 1 ⋅ 2
Основные понятия теории вероятностей
Теория вероятностей – это математическая дисциплина, изучающая случайные
явления и закономерности этих явлений.
Испытание – это реализация некоторой совокупности одних и тех же условий.
Событие есть результат испытания.
События, которые при определённых условиях могут произойти, а могут и не
произойти, - случайные события.
Достоверное событие – событие, которое в данном испытании обязательно
наступает.
Невозможное событие – то, которое в данном испытании не может наступить.
События обозначаются прописными (заглавными) латинскими буквами.
Пусть в некотором испытании могут произойти события А, В, С.
5
5
𝑁 = 𝐶3 = 𝐶3+5−1
= С57 =
Событие А, состоящее в ненаступлении события А в данном испытании,
называется противоположным событию А.
Пример 1. Испытание: студент сдаёт экзамен.
А – студент сдал экзамен, А - студент не сдал экзамен.
Пример 2. Испытание: студент сдаёт 2 экзамена.
В – студент сдал экзамены, получив одинаковые отметки, В – студент сдал
экзамены, получив различные отметки.
Суммой двух событий А и В называется событие С, состоящее в наступлении
хотя бы одного события А или В в данном испытании.
Сумма события А и ему противоположного есть событие достоверное.
Произведением двух событий А и В называется событие С, состоящее в
наступлении события А и события В одновременно в данном испытании.
Произведение события А и ему противоположного есть событие невозможное.
Событие А влечёт событие В, если в данном испытании, как только наступает
событие А, сразу же наступает событие В. Обозначение: А В. Если одновременно с
А В и В А, то события называются равносильными.
Разностью двух событий А и В называется событие С, состоящее в наступлении
события А и ненаступлении события В в данном испытании.
События А и В называются несовместимыми в данном испытании, если
наступление одного из этих событий исключает наступление другого, т.е. произведение
этих событий есть событие невозможное. Событие А и ему противоположное есть
несовместимые события.
Пусть в некотором испытании возможно появление n событий. События A1, A2, ...,
Аn образуют полную группу событий в данном испытании, если в результате
испытания хотя бы одно из них наступает, то есть сумма этих событий есть событие
5
достоверное.
Единичный (отдельный) исход испытания, который нельзя скомбинировать из
других, называется элементарным исходом. В противном случае событие называется
сложным (составным).
События полной группы называются попарно несовместимыми, если
произведение любых двух есть событие невозможное.
События называются равновозможными, если по условию испытания нет
основания считать какое-либо событие более возможным, чем другое.
Классическое определение вероятности
Пусть события А1 , А2 , . . . , А𝑛 образуют полную группу попарно несовместимых
событий. Те из событий А𝑘 , в результате которых наступает событие А, называются
благоприятными исходами событию А.
Классической вероятностью события А называется отношения числа
благоприятных исходов событию А к общему числу исходов в данном испытании,
образующих полную группу попарно несовместимых равновозможных элементарных
𝑚
событий. Обозначение: 𝑃(𝐴) = .
𝑛
Свойства вероятности:
1. 0 𝑃(𝐴) 1.
2.
Если событие А – достоверное, то вероятность этого события равна 1. Если
событие А – невозможное, то вероятность этого события равна 0. Если событие А –
случайное, то вероятность этого события 0 < Р(А) < 1.
3. Если событие А влечёт событие В, то Р(А) < Р(В).
𝑚 и 𝑛 находятся из задач комбинаторики, составленных для события и испытания
соответственно.
Пример. В классе 30 учащихся, из них 12 мальчиков. Известно, что к доске
должны быть вызваны 2 учащихся. Какова вероятность того, что это девочки?
Испытание: вызывают 2 учащихся из 30.
Событие А: вызвали 2 девочек из 18.
В = {учащиеся} n1 = 30; k1 = 2. Без повторений. Состав важен. Порядок неважен.
2
𝑛 = 𝐶30
=
30!
2!(30−2)!
=
29⋅30
1⋅2
= 435.
С = {девочки} n2 = 18; k2 = 2. Без повторений. Состав важен. Порядок неважен.
2
𝑚 = 𝐶18
=
18!
2!(18−2)!
=
17⋅18
1⋅2
= 153.
𝑃(𝐴) =
153
435
Геометрическое определение вероятности
Чтобы преодолеть недостаток классического определения вероятности, состоящий
в том, что оно не применимо к испытаниям с бесконечным числом исходов, вводят
геометрическое определение вероятности.
Пусть отрезок l составляет часть отрезка L. На отрезке L наудачу поставлена точка.
Вероятность попадания точки на отрезок l пропорциональна длине этого отрезка и не
зависит от его расположения относительно отрезка L. В этих предположениях
6
вероятность попадания точки на отрезок l определяется равенством
длина 𝑙
𝑃=
длина 𝐿
Аналогично определяется вероятность в случае плоских фигур. Пусть плоская
фигура g есть часть плоской фигуры G. На фигуру G наудачу брошена точка.
Вероятность попадания точки в g пропорциональна ее площади, не зависит от формы и
расположения фигуры g. Тогда вероятность попадания точки в g равна:
площадь 𝑔
𝑃=
площадь 𝐺
Теоремы о вероятности суммы и произведения событий
Теорема о вероятности суммы. Вероятность суммы двух событий равна сумме
вероятностей этих событий без вероятности их совместного наступления, то есть
Р(А + В) = Р(А) + Р(В) − Р(АВ)
Следствие 1. Если события А и В несовместимые, то вероятность суммы этих
событий равна сумме их вероятностей
Р(А + В) = Р(А) + Р(В).
Следствие 2. Если события А1 , А2 , . . . , А𝑛 образуют полную группу событий в
данном испытании, то Р(А1 ) + Р(А2 ) + Р(А𝑛 ) = 1.
Следствие 3. Для прямого и противоположного событий в данном испытании
𝑃(𝐴) = 1 − 𝑃(𝐴̄).
Теорема о вероятности произведения. Вероятность совместного наступления
двух событий равна произведению вероятности одного из них на условную вероятность
другого, вычисленную в предположении, что первое событие уже наступило, то есть
Р(АВ) = Р(А) ∙ РА (В) = Р(В) ∙ РВ (А).
События А и В называются независимыми, если появление одного из них не
изменяет вероятности другого.
Следствие. Если события А и В независимые, то вероятность произведения этих
событий равна произведению их вероятностей
Р(АВ) = Р(А) ∙ Р(В).
Свойства независимых событий:
1. Если события А и В независимые, то события А и 𝐵 - независимые.
2. Если события А и В независимые, то противоположные им события тоже
независимые.
Теорема. Вероятность совместного наступления конечного числа событий равна
произведению вероятности одного из них на условные вероятности других событий,
причём условная вероятность каждого следующего события вычисляется в
предположении, что все предыдущие уже наступили.
𝑃(𝐴1 ∙ 𝐴2 ∙ … ∙ 𝐴𝑛 ) = 𝑃(𝐴1 ) ∙ 𝑃𝐴1 (𝐴2 ) ∙ 𝑃𝐴1∙𝐴2 (𝐴3 ) ∙ … ∙ 𝑃𝐴1∙𝐴2∙…∙𝐴𝑛−1 (𝐴𝑛 )
События А1 , А2 , . . . , А𝑛 называются независимыми в совокупности, если каждое из
них и любое их произведение – независимые события.
7
Теорема. Если события А1 , А2 , . . . , А𝑛 являются независимыми в совокупности, то
вероятность произведения этих событий равна произведению вероятностей этих
событий.
𝑃(𝐴1 ∙ 𝐴2 ∙ … ∙ 𝐴𝑛 ) = 𝑃(𝐴1 ) ∙ 𝑃(𝐴2 ) ∙ 𝑃(𝐴3 ) ∙ … ∙ 𝑃(𝐴𝑛 )
Теорема. Вероятность появления хотя бы одного из событий А1 , А2 , . . . , А𝑛
независимых в совокупности, равна разности между единицей и произведением
вероятностей событий, противоположных данным.
̅̅̅1 ) ∙ 𝑃(𝐴
̅̅̅2 ) ∙ … ∙ 𝑃(𝐴
̅̅̅̅
𝑃(𝐴1 + 𝐴2 + ⋯ + 𝐴𝑛 ) = 1 − 𝑃(𝐴
𝑛)
Пример на теорему о вероятности суммы. В ящике находятся 20 одинаковых
деталей, имеющих номера от 1 до 20. Какова вероятность того, что наудачу вынутая
деталь окажется с номером, кратным 2 или 5?
Решение.
Испытание: выбирают наудачу одну деталь из 20.
Событие А: вынули деталь с номером, кратным 2 или 5.
Обозначим события:
А1 – вынута деталь с номером, кратным 2;
А2 – вынута деталь с номером, кратным 5.
10 1
4
1
𝑃(𝐴1 ) =
= , 𝑃(𝐴2 ) =
= ,
20 2
20 5
Событие А1 · 𝐴2 – вынута деталь с номером, кратным 2 и 5, то есть кратным 10.
2
1
𝑃(𝐴1 𝐴2 ) =
=
20 10
Событие 𝐴 = 𝐴1 + 𝐴2 – вынута деталь с номером, кратным 2 или 5. По теореме
сложения вероятностей для двух совместных событий находим
1
1
1
2
5
10
𝑃(𝐴) = 𝑃(𝐴1 + 𝐴2 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) − 𝑃(𝐴1 ⋅ 𝐴2 ) = + −
3
= .
5
Пример на теорему о вероятности произведения. В ящике 10 белых и 15 чёрных
шаров. Из этого ящика наудачу извлекают один шар, а затем, не возвращая первый шар,
извлекают второй. Найти вероятность того, что первый взятый шар белый, а второй
чёрный.
Решение. Испытание: из 25 шаров наудачу извлекают один шар, а затем, не
возвращая первый шар, извлекают второй.
Рассмотрим события:
𝐴 – первый взятый шар белый, а второй чёрный;
𝐴1 – первый взятый шар белый;
𝐴2 – второй взятый шар чёрный.
Событие А состоит в одновременном наступлении событий 𝐴1 и 𝐴2 , то есть
является их произведением. Так как первый взятый шар не возвращён обратно, то
события 𝐴1 и 𝐴2 зависимые.
По теореме умножения вероятностей для зависимых событий
8
𝑃(𝐴) = 𝑃(𝐴1 ⋅ 𝐴2 ) = 𝑃(𝐴1 ) ⋅ 𝑃𝐴1 (𝐴2 ).
Найдем вероятности 𝑃(𝐴1 ) и 𝑃𝐴1 (𝐴2 ) по классическому определению. Учитывая,
что всего в ящике было 10+15=25 шаров, из которых 10 белых, получаем, что
𝑃(𝐴1 ) =
10
25
2
= .
5
После того, как наступило событие 𝐴1 (извлекли белый шар), в ящике осталось 24
шара, из которых 15 чёрных, значит,
𝑃𝐴1 (𝐴2 ) =
15
24
5
= .
8
Тогда искомая вероятность события А будет равна:
2
5
1
5
8
4
𝑃(𝐴) = 𝑃(𝐴1 ) ⋅ 𝑃𝐴1 (𝐴2 ) = ⋅ = = 0,25.
Полная вероятность. Формула Байеса.
Пусть события Н1 , Н2 , . . . , Н𝑛 образуют полную группу попарно несовместимых
событий. Вероятность события А, вычисленная в предположении, что событие А может
произойти с каждым из событий Н1 , Н2 , . . . , Н𝑛 , называется полной вероятностью
события А.
𝐴 = Н1 𝐴 + Н2 𝐴 + . . . + Н𝑛 𝐴
𝑃(𝐴) = 𝑃(𝐻1 )𝑃𝐻1 (𝐴) + 𝑃(𝐻2 )𝑃𝐻2 (𝐴)+. . . +𝑃(𝐻𝑛 )𝑃𝐻𝑛 (𝐴)
Эта формула называется формулой полной вероятности, а события 𝐻1 , 𝐻2 , . . . , 𝐻𝑛 −
гипотезами.
Предположим, что испытание проведено и событие A при этом наступило. Тогда
вероятность одной из гипотез можно вычислить по формуле Байеса (формуле гипотез):
𝑃(𝐻𝑖 )𝑃𝐻𝑖 (𝐴)
𝑃𝐴 (𝐻𝑖 ) =
𝑃(𝐴)
Пример. В 3 группах была проведена контрольная работа. В 1-й группе из 30
человек 8 работ выполнено на «5», во 2-й из 28 – 6 работ на «5», в 3-й из 27 – 9. Найти
вероятность, что взятая наудачу работа из наудачу выбранной группы выполнена на «5».
Найти вероятность, что наудачу выбранная работа на «5» принадлежит 2-й группе.
Испытание: наудачу выбирают группу и наудачу выбирают работу.
А – наудачу выбранная работа выполнена на «5».
1
H1 – 1 группа, H2 – 2 группа, H3 – 3 группа. 𝑃(𝐻𝑖 ) = , 𝑖 = 1, 2, 3.
3
𝑃(𝐻1 ) + 𝑃(𝐻2 ) + 𝑃(𝐻3 ) = 1. События Н1, Н2, Н3 образуют полную группу
попарно несовместимых событий.
1
8
3
30
𝑃(𝐴) = 𝑃(𝐻1 )𝑃𝐻1 (𝐴) + 𝑃(𝐻2 )𝑃𝐻2 (𝐴) + 𝑃(𝐻3 )𝑃𝐻3 (𝐴) = ⋅
𝑃𝐴 (𝐻2 ) =
𝑃(𝐻2 )𝑃𝐻2 (𝐴)
𝑃(𝐴)
=
1 6
⋅
3 28
19
70
=
5
19
1
6
3
28
+ ⋅
1
9
3
27
+ ⋅
=
171
630
=
19
70
.
.
Схема Бернулли
Испытания называются независимыми, если при их повторении вероятность
события А, которое может произойти в каждом из испытаний, не меняется.
9
Независимость испытаний означает, что в каждом испытании рассматриваются 2
исхода: А и 𝐴, и в каждом испытании вероятность события А одинакова.
𝑃(𝐴) = 𝑝, 𝑃(𝐴̄) = 1 − 𝑝 = 𝑞.
Вероятность того, что событие А наступило в n независимых испытаниях ровно
k раз вычисляется по формуле: 𝑃𝑛 (𝑘) = 𝐶𝑛𝑘 𝑝𝑘 𝑞 𝑛−𝑘 - формула Бернулли.
Пример. Вероятность покупки бракованного комплекта посуды равна 0,1. Найти
вероятность того, что из 7 купленных комплектов 5 будет без брака.
Решение.
Испытание: покупают 7 комплектов посуды – 7 испытаний: покупка комплекта
посуды.
𝐵: из 7 купленных комплектов 5 без брака.
А: куплен комплект посуды без брака. Вероятность покупки комплекта без брака
𝑃(𝐴) = 𝑝 = 0,9, 𝑃(𝐴̅) = 𝑞 = 0,1.
Тогда искомая вероятность
𝑃(𝐵) = 𝑃7 (5) = 𝐶75 ∙ 0,95 ∙ 0,17−5 =
7!
5!∙2!
∙ 0,59049 ∙ 0,01 = 0,1240029
Случайные величины
Случайной величиной называется переменная величина, которая принимает
различные числовые значения в зависимости от случайных обстоятельств.
Случайные величины принято обозначать большими буквами (Х, 𝑌, 𝑍, …), а их
значения – соответствующими малыми буквами (𝑥𝑖 , 𝑦𝑗 , 𝑧𝑘 , . ..).
Случайная величина называется дискретной, если она может принимать только
отдельные изолированные значения. Например:
• количество выпавших очков при подбрасывании игрального кубика;
• число студентов, присутствующих на лекции,
• число бросаний монеты до первого появления «герба».
Случайная величина называется непрерывной, если она может принимать любые
значения из некоторого числового промежутка. Например:
• время ожидания автобуса определённого маршрута;
• вес человека;
• размер детали.
Любое соотношение или правило, устанавливающее связь между возможными
значениями случайной величины и соответствующими им вероятностями, называется
законом распределения вероятностей случайной величины.
Табличным способом можно задать только дискретную случайную величину. При
этом закон распределения задаётся в виде таблицы, в первой строке которой
перечислены все возможные значения случайной величины, а во второй –
соответствующие им вероятности:
10
. .
𝑥𝑖
𝑥1
𝑥2
𝑥𝑛
. ..
𝑝𝑖
𝑝1
𝑝2
𝑝𝑛
В этой таблице, называемой рядом распределения, сумма элементов второй строки
всегда равна единице, то есть
𝑛
∑ р𝑖 = 1
𝑖=1
Пример 1. В партии среди 8 деталей 5 стандартных. Наудачу взяты 4 детали.
Построить ряд распределения случайной величины Х – числа стандартных деталей из
числа отобранных.
Решение.
Испытание: наудачу берут 4 детали из 8.
Случайная величина Х – число стандартных деталей – может принимать значения:
1, 2, 3, 4. Вычислим вероятности, с которыми случайная величина принимает эти
значения. Для этого рассмотрим события:
А – отобраны одна стандартная деталь и три нестандартных;
В – отобраны две стандартные детали и две нестандартных;
С – отобраны три стандартные детали и одна нестандартная;
D – отобраны четыре стандартные детали.
Тогда
p1 = Р ( Х = 1) = P ( A) =
𝑝2 = Р(Х = 2) = 𝑃(𝐵) =
𝑝3 = Р(Х = 3) = 𝑃(𝐶) =
𝑝4 = Р(Х = 4) = 𝑃(𝐷) =
С15 ⋅С33
С48
С25 ⋅С23
С48
С35 ⋅С13
С48
С45 ⋅С03
С48
=
=
=
=
1
14
6
14
6
14
;
;
;
1
14
.
Составим ряд распределения числа стандартных деталей.
х𝑖
р𝑖
1
1⁄
14
2
6⁄
14
3
6⁄
14
4
1⁄
14
Проверим корректность полученного закона распределения:
4
∑ 𝑝𝑖 =
𝑖=1
1
6
6
1
+
+
+
=1
14 14 14 14
Графический способ. В этом случае дискретную случайную величину можно
задать в виде полигона распределения вероятностей, то есть в виде ломаной,
соединяющей точки с координатами (х𝑖 ; р𝑖 ).
Пример 2. Случайная величина задана рядом распределения
х𝑖
2
3
4
5
р𝑖
0,1
0,2
𝑝3
0,3
11
Найдите р3 и постройте полигон распределения вероятностей данной случайной
величины.
Решение. Сумма элементов второй строки ряда распределения всегда равна
единице, поэтому
р3 = 1 − (0,1 + 0,2 + 0,3) = 0,4.
Тогда полигон распределения вероятностей имеет вид, представленный на рисунке.
Аналитический способ. Задание случайной величины предполагает
использование интегральной или дифференциальной функции распределения.
Интегральная функция распределения случайной величины
Интегральной функцией распределения случайной величины Х называется
функция 𝐹(х), задающая вероятность того, что случайная величина Х примет значение
меньшее некоторого действительного числа х, то есть
𝐹(𝑥) = Р(Х < 𝑥),где х ∈ 𝑅.
Пример 3. Построить функцию распределения случайной величины, заданной в
примере 2, построить её график и найти её значения в точках х = 1, 𝑥 = 4, 𝑥 = 4,8.
Решение. Случайная величина задана рядом распределения
х𝑖
2
3
4
5
р𝑖
0,1
0,2
0,4
0,3
По определению функции распределения 𝐹(х) получаем, что если х ∈ (−∞; 2], то
𝐹(х) = 𝑃(𝑋 < 𝑥) = 0.
Если х ∈ (2; 3], то 𝐹(х) = 𝑃(𝑋 < 𝑥) = 𝑃(𝑋 = 2) = 0,1.
Если х ∈ (3; 4], то
𝐹(х) = 𝑃(𝑋 < 𝑥) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,3.
Если х ∈ (4; 5], то
𝐹(х) = 𝑃(𝑋 < 𝑥) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) = 0,7.
Если х ∈ (5; +∞), то
𝐹(х) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) = 1.
В результате получим
0, если 𝑥 ≤ 2;
0,1, если 2 < 𝑥 ≤ 3;
𝐹(х) = 𝑃(𝑋 < 𝑥) = 0,3, если 3 < 𝑥 ≤ 4;
0,7, если 4 < 𝑥 ≤ 5;
{1, если 𝑥 > 5.
График функции 𝐹(х) представлен на рисунке.
1.
2.
3.
4.
5.
6.
7.
8.
12
Вычислим значения функции распределения в заданных точках.
𝐹(1) = 𝑃(𝑥 < 1) = 0; 𝐹(4) = 𝑃(𝑥 < 4) = 0,3; 𝐹(4,8) = 𝑃(𝑥 < 4,8) = 0,7.
Функция распределения дискретной случайной величины является разрывной.
Свойства интегральной функции распределения
Областью определения интегральной функции распределения является множество
всех действительных чисел, то есть 𝐷(𝐹) = 𝑅.
Множество значений интегральной функции распределения содержится в отрезке
[0; 1], то есть 0 ≤ 𝐹(х) ≤ 1.
Вероятность того, что случайная величина примет значение из полуинтервала
[х1 ; х2 ), равна разности значений интегральной функции распределения на концах
этого промежутка, то есть Р(х1 ≤ Х < х2 ) = 𝐹(х2 ) − 𝐹(х1 ).
Интегральная функция распределения 𝐹(х) – неубывающая функция, то есть из
неравенства х1 < х2 вытекает неравенство 𝐹(х1 ) ≤ 𝐹(х2 ).
Если Х − непрерывная случайная величина, то её интегральная функция
распределения 𝐹(х) является непрерывной функцией.
Вероятность того, что непрерывная случайная величина Х принимает определённое
значение, равна нулю.
Если Х – непрерывная случайная величина, то Р(𝛼 < Х < 𝛽) = 𝑃(𝛼 ≤ Х < 𝛽) =
𝑃(𝛼 < Х ≤ 𝛽) = 𝑃(𝛼 ≤ Х ≤ 𝛽).
Предельные свойства функции 𝐹(х):
𝑙𝑖𝑚 𝐹(𝑥) = 0;
𝑙𝑖𝑚 𝐹(х) = 1.
𝑥→−∞
х→+∞
Дифференциальная функция распределения непрерывной случайной величины
(плотность распределения вероятности)
Первая производная интегральной функции распределения непрерывной
случайной величины называется дифференциальной функцией распределения этой
13
случайной величины или плотностью распределения вероятности 𝑓(𝑥), то есть
𝐹 ′ (𝑥) = 𝑓(𝑥).
График функции 𝑓(𝑥) называется кривой распределения.
Математические операции над случайными величинами
Случайные величины Х и 𝑌 называются независимыми, если закон распределения
вероятностей каждой из них не зависит от того, какие возможные числовые значения
принимает другая случайная величина. В противном случае величины называют
зависимыми.
Случайные величины 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 называются взаимно независимыми
(независимы в совокупности), если закон распределения каждой из них не зависит от
того, какие значения приняли оставшиеся случайные величины.
Произведение случайной величины Х на постоянный множитель С есть новая
случайная величина СХ, которая с теми же вероятностями, что и случайная величина Х,
принимает значения, равные произведению значений случайной величины Х на
постоянный множитель С.
Например, для дискретной случайной величины, имеющей закон распределения
Х
𝑝𝑖
𝑥1
𝑝1
…
…
𝑥𝑛
𝑝𝑛
,
закон распределения случайной величины 𝐶𝑋 имеет вид
𝐶𝑋
𝑝𝑖
𝐶𝑥1
𝑝1
…
…
𝐶𝑥𝑛
𝑝𝑛
𝑲-ая степень случайной величины Х есть новая случайная величина 𝑋 𝑘 , которая
с теми же вероятностями, что и случайная величина Х, принимает значения, равные 𝑘ой степени её значений. Закон её распределения, например, для дискретной случайной
величины Х запишется в виде:
𝑋𝑘
𝑝𝑖
𝑥1𝑘
𝑝1
…
…
𝑥𝑛𝑘
𝑝𝑛
Сумма случайных величин Х и 𝒀 есть новая случайная величина Х + 𝒀, которая
принимает все возможные значения вида 𝑥𝑖 + 𝑦𝑗 с вероятностями 𝑝𝑖𝑗 = 𝑃(𝑋 = 𝑥𝑖 и 𝑌 = 𝑦𝑗 ).
Разность случайных величин Х и 𝒀 есть новая случайная величина Х– 𝒀, которая
принимает все возможные значения вида 𝑥𝑖 − 𝑦𝑗 с вероятностями 𝑝𝑖𝑗 = 𝑃(𝑋 = 𝑥𝑖 и 𝑌 = 𝑦𝑗 ).
Произведение случайных величин Х и 𝒀 есть новая случайная величина Х ⋅ 𝒀, которая
принимает все возможные значения вида 𝑥𝑖 ⋅ 𝑦𝑗 с вероятностями 𝑝𝑖𝑗 = 𝑃(𝑋 = 𝑥𝑖 и 𝑌 = 𝑦𝑗 ).
Если Х и 𝑌 – зависимые случайные величины, то 𝑝𝑖𝑗 = 𝑃(𝑋 = 𝑥𝑖 ) ⋅ 𝑃𝑋=𝑥𝑖 (𝑌 = 𝑦𝑗 ).
Если Х и 𝑌 – независимые случайные величины, то 𝑝𝑖𝑗 = 𝑃(𝑋 = 𝑥𝑖 ) ⋅ 𝑃(𝑌 = 𝑦𝑗 ).
Числовые характеристики случайной величины
Математическое ожидание
Математическим ожиданием 𝑴𝑿 случайной величины 𝑋 называется среднее
значение этой случайной величины, взвешенное по вероятностям.
Если случайная величина 𝑋 является дискретной, то
14
𝑛(∞)
𝑀(𝑋) = ∑ 𝑥𝑖 𝑝𝑖
𝑖=1
Пример 4. Дискретная случайная величина Х задана рядом распределения
х𝑖
р𝑖
1
0,2
2
0,4
3
0,3
4
0,1
Найти 𝑀𝑋 .
Решение. Задана дискретная случайная величина, поэтому
4
𝑀𝑋 = ∑ 𝑥𝑖 𝑝𝑖
𝑖=1
Тогда 𝑀𝑋 = 1 ∙ 0,2 + 2 ∙ 0,4 + 3 ∙ 0,3 + 4 ∙ 0,1 = 2,3
Свойства математического ожидания
1. 𝑀𝐶 = 𝐶, где 𝐶 − 𝑐𝑜𝑛𝑠𝑡.
2. Постоянный множитель можно выносить за знак математического ожидания, то есть
𝑀(𝐶𝑋) = 𝐶 ∙ 𝑀𝑋.
3. Математическое ожидание суммы конечного числа случайных величин равно
сумме математических ожиданий этих величин, то есть
𝑀(𝑋1 + 𝑋2 +. . . +𝑋𝑘 ) = 𝑀(𝑋1 ) + 𝑀(𝑋2 )+. . . +𝑀(𝑋𝑘 ).
4. 𝑀(𝑋 − 𝑌) = 𝑀𝑋 − 𝑀𝑌.
5. Если 𝑋1 , 𝑋2 , . . . , 𝑋𝑘 – взаимно независимые случайные величины, то
𝑀(𝑋1 ∙ 𝑋2 ∙. . .∙ 𝑋𝑘 ) = 𝑀(𝑋1 ) ∙ 𝑀(𝑋2 ) ∙. . .∙ 𝑀(𝑋𝑘 )
6. Математическое ожидание отклонения значений случайной величины от её
математического ожидания равно нулю, то есть 𝑀(𝑋 − 𝑀𝑋) = 0
Дисперсия
Дисперсией 𝑫𝑿 случайной величины Х называется математическое ожидание
квадрата отклонения значений случайной величины Х от её математического ожидания,
то есть 𝐷𝑋 = 𝑀[(𝑋 − 𝑀𝑋)2 ].
Если Х – дискретная случайная величина, то
𝑛(∞)
𝐷(𝑋) = ∑ [𝑥𝑖 − 𝑀(𝑋)]2 𝑝𝑖
𝑖=1
Свойства дисперсии
1. 𝐷𝐶 = 0, где 𝐶 − 𝑐𝑜𝑛𝑠𝑡
2. 𝐷(𝐶𝑋) = 𝐶 2 𝐷𝑋.
3. Если 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 – взаимно независимые случайные величины, то
𝐷(𝑋1 + 𝑋2 +. . . +𝑋𝑘 ) = 𝐷(𝑋1 ) + 𝐷(𝑋2 )+. . . +𝐷(𝑋𝑘 )
4. Если Х и 𝑌 – независимые случайные величины, то 𝐷(𝑋 − 𝑌) = 𝐷𝑋 + 𝐷𝑌
5. Дисперсия случайной величины равна математическому ожиданию квадрата
случайной величины без квадрата её математического ожидания 𝐷𝑋 = 𝑀𝑋 2 − 𝑀2 𝑋
15
Среднее квадратическое отклонение
Средним квадратическим отклонением 𝜎𝑋 случайной величины Х называется
арифметический квадратный корень из дисперсии, то есть 𝜎𝑋 = √𝐷𝑋.
Основные понятия математической статистики
Математическая статистика – это прикладная наука, занимающаяся
разработкой методов сбора, описания и обработки результатов наблюдений
(испытаний) с целью изучения закономерностей массовых случайных явлений.
Задачи математической статистики:
1. указание методов сбора и группировки статистических сведений, которые
получены в результате экспериментов или наблюдений.
2. разработка методов анализа статистических данных: оценки неизвестных
вероятности события, а также функции и параметров распределения; оценка
зависимости случайной величины от других случайных величин; проверка
статистических гипотез о виде и величинах параметров неизвестного распределения.
На практике сплошное исследование (каждого объекта из интересующей
совокупности) проводят крайне редко. Обычно из всей совокупности случайно
отбирают ограниченное число объектов и подвергают их исследованию.
Генеральной совокупностью называется совокупность объектов, из которых
производится выборка. Выборочной совокупностью (выборкой) называется
совокупность случайно отобранных объектов из генеральной совокупности. Число
объектов в совокупности называется ее объёмом.
Пример 1. Пусть из 2000 изделий отобрано для обследования 100 изделий. Тогда
объём генеральной совокупности N = 2000, а объём выборки п = 100.
Выборку можно осуществлять двумя способами. Если после исследования объект
из выборки возвращается в генеральную совокупность, то такая выборка называется
повторной; если объект не возвращается в генеральную совокупность, то выборка
называется бесповторной.
Выборка называется репрезентативной (представительной), если по её данным
можно достаточно уверенно судить об интересующем признаке генеральной
совокупности.
Различают два способа отбора: без расчленения генеральной совокупности на
части и с расчленением. К первому относятся простые случайные отборы (либо
повторный, либо бесповторный), когда объекты извлекают по одному из всей
генеральной совокупности. Второй способ отбора включает в себя следующие
разновидности, соответствующие способам расчленения генеральной совокупности.
Отбор, при котором объекты отбираются из каждой «типической» части генеральной
совокупности, называется типическим. Например, отбор деталей из продукции каждого
станка, а не из их общего количества является типическим. Если генеральную
совокупность делят на число групп, равное объёму выборки, с последующим отбором
16
из каждой группы по одному объекту, то такой отбор называется механическим.
Серийным называется отбор, при котором объекты отбираются не по одному, а
сериями; этот способ используется, когда исследуемый признак имеет незначительные
колебания в различных сериях.
На практике часто употребляется комбинирование указанных выше способов
отбора. Например, генеральную совокупность разбивают на серии одинакового объема,
затем случайным образом отбирают несколько серий и в завершение случайным
извлечением отдельных объектов составляют выборку. Конкретная комбинация
способов отбора объектов из генеральной совокупности определяется требованием
репрезентативности выборки.
Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка объёма п, в которой
значение x1 некоторого исследуемого признака Х наблюдалось п1 раз, значение x2 – п2
раз, ..., значение xk – nk раз. Значения xi называются вариантами, а их
последовательность, записанная в возрастающем порядке,— вариационным рядом.
Числа ni называются частотами, а их отношения к объёму выборки
(1)
- относительными частотами. При этом сумма частот равна объёму выборки ∑ 𝑛𝑖 = 𝑛
Модой Мo называется варианта, имеющая наибольшую частоту. Медианой те
называется варианта, которая делит вариационный ряд на две части с одинаковым
числом вариант в каждой. Если число вариант нечетно, т.е. k = 2l + 1, то me = xl+1; если
же число вариант четно (k = 2l), то те = (xl + xl+1)/2. Размахом варьирования называется
разность между максимальной и минимальной вариантами или длина интервала,
которому принадлежат все варианты выборки:
(2)
Перечень вариант и соответствующих им частот называется статистическим
распределением выборки. Сумма относительных частот равна единице: Wi = 1.
Пример 2. Выборка задана в виде распределения частот:
Найти распределение относительных частот и основные характеристики
вариационного ряда.
Решение. Найдём объём выборки: п = 2 + 4 + 5 + 6 + 3 = 20. Относительные частоты
соответственно равны
W1 = 2/20 = 0,1; W2 = 4/20 = 0,2; W3 = 5/20 = 0,25; W4 = 6/20 = 0,3; W5 = 3/20 = 0,15.
Контроль: 0,1 + 0,2 + 0,25 + 0,3 + 0,15 = 1.
Искомое распределение относительных частот
Мода вариационного ряда равна 12. Число вариант в данном случае нечетно: k =
2∙2 + 1, поэтому медиана me = x3 = 8. Размах варьирования R = 17 – 4 = 13.
17
Эмпирическая функция распределения
Пусть nх — число наблюдений, при которых значение признака Х меньше х. При
объеме выборки, равном п, относительная частота события Х < х равна nx/n.
Функция
(3) определяющая для каждого значения х относительную
частоту события Х < х, называется эмпирической функцией распределения, или
функцией распределения выборки.
В отличие от эмпирической функции распределения F*(x) выборки функция
распределения F(x) генеральной совокупности называется теоретической функцией
распределения. Различие между ними состоит в том, что функция F(x) определяет
вероятность события Х < х, a F*(x) – относительную частоту этого события. Из общей
теории вероятностей (закона больших чисел) следует, что при больших п вероятность
отличия этих функций друг от друга близка к единице:
(4)
F*(x) обладает всеми свойствами F(x), что вытекает из её определения (3):
1) значения F*(x) принадлежат отрезку [0, 1];
2) F*(x) является неубывающей функцией;
3) если х1 — наименьшая варианта, то F*(x) = 0 при х ≤ х1; если xk — максимальная
варианта, то F*(x) = 1 при x > xk.
Функция F*(x) служит для оценки теоретической функции распределения F(x)
генеральной совокупности.
Пример 3. Построить эмпирическую функцию по заданному распределению
выборки:
Решение. Находим объём выборки: п = 10 + 15 + 25 = 50. Наименьшая варианта
равна 2, поэтому F*(x) = 0 при х ≤ 2. Значение Х < 4 (или x1 = 2) наблюдалось 10 раз,
значит, F*(x) = 10/50 = 0,2 при 2 < х < 4. Значения X < 6 (а именно x1 = 2 и x2 = 4)
наблюдались 10 + 15 = 25 раз, значит, при 4 < х < 6 функция F*(x) = 25/50 = 0,5.
Поскольку x = 6 — максимальная варианта, то F*(x) = 1 при х > 6. Напишем формулу
искомой эмпирической функции:
График этой функции показан на рисунке
18
Полигон и гистограмма
Каждую пару значений (xi, ni) из распределения выборки можно трактовать как
точку на координатной плоскости. Точно так же можно рассматривать и пары значений
(хi, Wi) относительного распределения выборки. Ломаная, отрезки которой соединяют
точки (xi, ni), называется полигоном частот. Ломаная, соединяющая на координатной
плоскости точки (xi, Wi), называется полигоном относительных частот. На рисунке
показан полигон относительных частот для распределения, приведённого в примере 2.
Для случая непрерывного признака Х удобно разбить интервал (xmin, xmax) его
наблюдаемых значений на несколько частичных интервалов длиной h каждый и найти
для каждого из этих интервалов сумму частот nj, попавших в него. Ступенчатая фигура,
состоящая из прямоугольников с основаниями длиной h и высотами
𝑛𝑗
ℎ
(плотность
частоты), называется гистограммой частот. Геометрический смысл гистограммы:
площадь её равна сумме всех частот или объёму выборки.
В случае гистограммы относительных частот высоты прямоугольников,
составляющих ступенчатую фигуру, определяются отношениями сумм относительных
частот, попадающих в интервал (𝑥𝑚𝑖𝑛 + (𝑗 — 1)ℎ, 𝑥𝑚𝑖𝑛 + 𝑗ℎ), к длине интервала h, т.е.
величинами Wj/h. Площадь гистограммы относительных частот равна единице (сумме
относительных частот выборки).
Статистические оценки параметров распределения
Значения количественного признака х1, х2, ..., хk в выборке можно рассматривать
как независимые случайные величины. Нахождение статистической оценки
неизвестного параметра теоретического распределения означает отыскание функции от
наблюдаемых случайных величин, которая и даст нам приближённое значение искомого
параметра. Статистические оценки бывают следующих видов.
Несмещённой называется статистическая оценка * , математическое ожидание
которой равно оцениваемому параметру при любой выборке:
(5)
Смещённой называется оценка, при которой условие (5) не выполнено.
Эффективной называется оценка, которая имеет минимальную дисперсию при
19
заданном объеме выборки п.
Состоятельной называется статистическая оценка типа (4), которая при п→
стремится по вероятности к оцениваемому параметру.
Теперь укажем виды числовых характеристик оценок.
Генеральная средняя для изучаемого количественного признака Х по генеральной
совокупности
и выборочная средняя
Если значения признака х1, x2, …, хk в выборке имеют соответственно частоты n1,
n2, ..., nk, то последнюю формулу можно переписать в виде
(6)
Можно показать, что выборочная средняя (6) является несмещённой оценкой; это
аналог математического ожидания случайной величины.
Рассмотрим величины, характеризующие отклонение значений количественного
признака Х от своего среднего значения. Это генеральная дисперсия:
и выборочная дисперсия:
(7)
Можно показать, что для вычисления этих характеристик справедливы более
удобные формулы, аналогичные дисперсии случайной величины; так, формула (7)
принимает вид
(8)
Генеральное среднее квадратическое отклонение определяется как
Аналогично вводится выборочное среднее квадратическое отклонение
(9)
Пример 4. Выборка задана таблицей распределения
Найти выборочные характеристики: среднюю,
квадратическое отклонение.
РЕШЕНИЕ. По формуле (6) сначала находим x в:
дисперсию
и
среднее
Затем по формулам (8) и (9) находим две другие искомые величины:
Доверительный интервал
Все оценки, приведённые выше, определяются одним числом, т.е. являются
точечными. При малых объёмах выборки точечная оценка может приводить к большим
ошибкам и значительно отличаться от оцениваемого параметра. Более широкое
20
применение получил метод доверительных интервалов.
Доверительным интервалом для параметра с надёжностью оценки p называется
числовой промежуток ( * − , * + ) , содержащий истинное значение данного
параметра с вероятностью, равной p : P( * − * + ) = p (10), где * - оценка
неизвестного параметра , - некоторое положительное число. Обычно надёжность
оценки p задаётся числом, близким к единице. Иными словами, доверительный
интервал покрывает неизвестный параметр с заданной надёжностью. Число = 1 − p
называется уровнем значимости.
Общая схема построения доверительных интервалов
1. Рассматриваются теоретические выборки случайных величин, с
распределениями которых связан параметр .
2. Подбирается случайная величина Y с известным распределением, значения
которой определяются выборками и параметром : Y = Y ( ) .
3. По известному распределению Y подбираются числа Y1 и Y2 такие, чтобы
выполнялось равенство P(Y1 Y ( ) Y2 ) = p .
4. По значениям Y1 и Y2 определяется положительное число при известном
значении * . Условие (10) будет выполнено и доверительный интервал построен.
Статистические оценки статистических гипотез
Обычно в практических задачах не встречаются случайные величины,
распределения которых точно соответствовали бы теоретическим распределениям.
Подбор математических моделей реальных распределений и анализ их адекватности
моделируемым случайным величинам является одной из основных задач
математической статистики, которая сводится к проверке предположений (гипотез) о
виде модели распределения и о его параметрах.
Статистической называется гипотеза о виде неизвестного распределения, о
параметрах известных распределений, об отношениях между случайными величинами
и т.д.
Нулевой (основной) гипотезой называется выдвинутая гипотеза H 0 .
Конкурирующей (альтернативной) гипотезой называется гипотеза
H1 , которая
противоречит нулевой гипотезе H 0 . Гипотеза называется простой, если она содержит
только одно предположение. Гипотеза называется сложной, если она состоит из
конечного или бесконечного числа простых гипотез. Наиболее распространённые типы
гипотез: параметрические: при известном виде распределения предположения о
неизвестных характеристиках этого распределения; для известной случайной величины
(выборки) предположения о виде её распределения.
Общая схема проверки статистических гипотез
Статистическим критерием называют случайную величину, которая служит для
проверки гипотез.
21
1. Для основной гипотезы H 0 формулируется альтернативная гипотеза H1 .
2. Выбирается малое положительное число - уровень значимости проверки,
обычно в пределах от 0,01 до 0,05.
3. Рассматриваются теоретические выборки значений случайных величин, о
которых сформулирована гипотеза H 0 , и выбирается (формируется) случайная
величина Т. Значения и распределение Т полностью определяются по выборкам при
предположении о верности гипотезы H 0 . Величина Т называется статистикой или
тестом критерия.
4. На числовой оси задают интервал D такой, что вероятность попадания теста Т
в этот интервал равна p = 1 − (11). Интервал D называется областью принятия
гипотезы H 0 , а оставшаяся часть числовой оси – критической областью. В ряде случаев
за область D принимают один из интервалов (− , t кр ] , [ −t кр , t кр ] , [t кр , + ] , где число t кр критическое значение теста проверки. Соответственно этим промежуткам критерий
проверки называется правосторонним, двусторонним и левосторонним.
5. По реализациям анализируемых теоретических выборок вычисляется
конкретное (наблюдаемое) значение теста ( t н ) и проверяется выполнение условия (11):
если оно выполняется, то гипотеза H 0 принимается в том смысле, что она не
противоречит опытным данным; если же условие (11) не выполняется, то полагается,
что гипотеза H 0 неверна.
При проверке гипотезы H 0 возможны следующие ошибки: ошибка первого рода
– отвергнуть гипотезу H 0 при её правильности, вероятность этой ошибки равна ;
ошибка второго рода – принять гипотезу H 0 при правильности альтернативной
гипотезы H1 . Пусть вероятность ошибки второго рода равна , тогда число 1 −
называют мощностью критерия. Чем больше мощность критерия, тем меньше
вероятность ошибки второго го рода. При выбранном уровне значимости критическую
область нужно строить так, чтобы мощность критерия была максимальной.