Элементы комбинаторики
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 1. Лекция
1.Элементы комбинаторики
1.1. Правила суммы и произведения
При практической работе c реальным множеством, состоящим из набора элементов, которые могут быть как уникальными, так и повторяющимися, постоянно требуется отбирать отдельные элементы или группы элементов, организованные по какому-то критерию.
Рассмотрим пример: из 10 студентов надо выбрать трех для назначения в дежурство. Сколькими способами это можно сделать?
Поскольку выбор произволен, то первым дежурным можно назначить любого, т.е. число способов выбора, очевидно, вариантов. Но после того как выбран первый дежурный, второй выбирается уже из оставшихся 9 человек. Следовательно, число способов выбора второго дежурного вариантов. Ясно, что третий дежурный выбирается способами.
Таким образом, при произвольном последовательном выборе общее число способов выбора равно:
.
Указанный пример иллюстрирует следующее:
Правило произведения. Если объект можно выбрать из данного множества способами, объект – способами и так до k-го выбора, то все k выборов вместе могут быть выполнены способами.
Усложним пример. Пусть из контингента в 6 лейтенантов и 10 солдат надо выбрать усиленный патруль из 6 человек: трех офицеров и трех солдат.
Из предыдущего примера уже известно, что трех солдат можно выбрать m = 720 способами. Точно так же трех офицеров из шести выбираем способами. Ясно, что выборы солдат и офицеров не могут быть выполнены одновременно (сразу из множества в 16 человек), т.е. правило умножения для обобщения применить нельзя. Следовательно, общее число способов выбора равно .
Этот пример иллюстрирует следующее:
Правило суммы. Если два действия взаимно исключают друг друга, причем одно из них можно выполнить m способами, а другое – n способами, то выбрать либо первое, либо второе действие можно m + n способами.
Правило сложения легко обобщается на любое конечное число действий.
Представленные здесь правила умножения и суммы широко используются в комбинаторных и вероятностных задачах.
Понятие факториала введем для множества неотрицательных чисел.
Факториалом целого положительного числа n называют произведение . Обозначение: n!. Чтение: «n факториал». Пример: .
Свойства факториала:
1. Принимается: и .
2. Факториал можно расчленить. К примеру,
или .
3. ; ; ; .
1.2. Элементы комбинаторики.
1) Размещения
Пусть имеется некоторое множество, содержащее конечное число членов. Например, множество учебных групп факультета, множество книг на полке, множество населенных пунктов области или, например, множество целых положительных чисел, меньших 10, и т.д. Все элементы такого множества можно пронумеровать, т.е. каждому элементу множества поставить в соответствие одно из чисел: 1, 2, 3, 4, …, n; в результате получается некоторая последовательность элементов данного множества, которые обычно записывают в виде . Такие «занумерованные» множества будем называть упорядоченными. Таким образом, упорядоченное множество представим в виде некоторой последовательности, что будет использовано в дальнейшем. Очевидно, если в упорядоченном множестве поменять местами хотя бы два его элемента, то получим новое упорядоченное множество, которому будет соответствовать новая последовательность элементов данного множества.
Определение. Размещением из n элементов по m называется любое упорядоченное подмножество из m элементов множества, состоящего из n различных элементов.
Пример. Пусть имеется множество, содержащее четыре буквы: . Запишем все возможные размещения из четырех указанных букв по две. Таких размещений 12:
AB, AC, AD, BC, BD, CD, BA, CA, DA, CB, DB, DC.
Заметим, что размещения отличаются порядком входящих в них элементов и их составом. Размещения AB и BA содержат одинаковые буквы, но порядок их расположения различен. Поэтому эти размещения считаются разными.
На практике чаще представляет интерес количество размещений, а не их конкретный вид. Число размещений из n элементов по m будем обозначать символом , где .
Формула для определения числа размещений из n элементов по m имеет вид:
.
Достаточно часто удобно использовать иную формулу:
Таким образом, для приведенного выше примера:
.
Рассмотрим теперь размещения с повторениями.
Пусть имеется два числа {4; 5}. Из них можно составить 8 трехзначных чисел: 444, 544, 454, 445, 554, 545, 455, 555, что и иллюстрирует размещение из двух элементов по три с повторениями.
Определение. Размещения из n элементов, в каждое из которых входит m элементов, причем один элемент может повторяться в каждом размещении любое количество раз, но не более m раз, называются размещениями из n элементов по mс повторениями.
Формула для расчета:
Так, для примера, .
2) Перестановки
Рассмотрим теперь отдельно случай, когда m = n. Соответствующие этому случаю размещения называются перестановками.
Определение. Перестановкой из n элементов называется любое упорядоченное множество, в которое входят по одному разу все n различных элементов данного множества.
Пример. Пусть имеются цифры 3, 5, 7. Этому множеству цифр соответствует 6 перестановок: 357, 375, 537, 573, 753, 735.
Число перестановок n различных элементов будем обозначать символом .
Формула: число перестановок n различных элементов равно:
Так как перестановки являются частным случаем размещений, то при n = m имеем:
Рассмотрим теперь случай с повторениями. Если каждый элемент множества {4; 5} взять по два раза, получим числа: 4455, 5544, 5454, 4545, 4554, 5445.
Определение. Перестановки из n объектов, в каждую из которых входят одинаковых объектов одного типа, – второго типа и т.д. до – k-го типа, называются перестановками из n элементов с повторениями.
Число всех таких перестановок с повторениями:
.
Так, для примера, .
3) Сочетания
Если два различных размещения состоят из одинаковых элементов некоторого множества, то они обязательно отличаются порядком входящих в них элементов. Часто возникает необходимость не учитывать порядок элементов, входящих в размещение. В этом случае все m! размещения, которые состоят из одних и тех же m элементов, считаются неразличимыми.
Предположим, что из чисел 3, 5, 7 необходимо составить различные произведения двух чисел. Таких произведений только три, а именно: 3 5 = 15; 3 7 = 21; 5 7 = 35. Это объясняется тем, что произведения вида 3 5 и 5 3 совпадают, так как порядок сомножителей, входящих в произведение, не учитывается. Если требуется из указанных цифр составить двузначные числа, то таких чисел уже шесть. Запишем эти числа: 35, 53, 37, 73, 57, 75. Как видно, здесь уже пришлось учитывать порядок цифр, т.е. получим размещения.
Определение. Сочетанием из n элементов по m называется любое подмножество из m элементов, которые принадлежат множеству, состоящему из n различных элементов.
Пример. Пусть имеется множество, содержащее четыре буквы: {A, B, C, D}. Запишем все возможные сочетания из указанных букв по три. Таких сочетаний будет четыре: ABC, ACD, ABD, BCD. Здесь в число сочетаний не включены, например, ACB и BCA, так как эти последовательности букв не отличаются от последовательности ABC, поскольку порядок элементов в сочетаниях не учитывается.
Число сочетаний из n разных элементов по m будем обозначать символом , где .
Прежде чем привести общую формулу для определения числа сочетаний, решим следующую задачу. Необходимо выбрать 4 из 10 имеющихся различных книг. Сколькими способами можно это сделать?
Из смысла задачи следует, что порядок выбора книг не играет роли. Здесь важен только их состав. Как известно из предыдущего, число размещений из 10 по 4 равно . Пусть теперь выбраны 4 книги из 10. Число возможных выборов, где не учитывается порядок выбранных книг, равно . Однако каждому из этих сочетаний (выборов) будут соответствовать = 24 перестановки выбранных книг. Тогда выбор 4 книг из 10 с учетом их порядка по правилу умножения возможен способами. С другой стороны, число указанных способов – это число размещений . Таким образом, , откуда имеем . То есть число возможных способов выбора равно 210. Следовательно, число сочетаний из n элементов по m равно:
.
Следствие. Число сочетаний из n элементов по n – m равно числу сочетаний из n элементов по m, т.е.
.
Еще раз подчеркнем разницу между размещениями и сочетаниями: в размещениях учитывается порядок входящих в них элементов, а в сочетаниях – не учитывается. При решении задач это не следует забывать. Кроме того, следует иметь в виду, что использование правила умножения приводит к необходимости учитывать порядок элементов при выборе их из какого-либо множества.
Приведем два свойства числа сочетаний, которые могут быть полезными при решении комбинаторных задач.
1. Имеет место равенство (правило Паскаля):
.
2. Имеет место равенство:
.
Рассмотрим теперь задачу с повторениями.
Определение. Сочетаниями из n объектов называются соединения, содержащие m объектов (без учета порядка следования), причем любой объект может входить в соединение любое число раз, но не более m раз.
Таким образом, если имеется по m одинаковых предметов каждого из n различных типов, то число способов, которыми можно выбрать m из этих предметов определится формулой:
.
Пример. Сколькими способами можно выбрать четыре монеты из четырех пятирублевых и четырех рублевых монет?
Это – задача о числе сочетаний из двух по четыре с повторениями. Следовательно,
,
то есть число таких выборов – пять.
Рассмотрим ряд примеров, иллюстрирующих применение комбинаторных формул в задачах.
Упростить выражение .
Было бы неправильным просто вычислить все факториалы, после чего перейти к арифметике ‑ слишком большие числа. Используем, где возможно, расчленение факториалов:
; ;
. Следовательно, .
При расследовании хищения установлено, что у преступника семизначный телефонный номер, в котором ни одна цифра не повторяется. Следователь, полагая, что перебор этих номеров потребует одного-двух часов, доложил о раскрытии преступления. Прав ли он?
Известно, что любое число может быть записано с использованием десяти цифр: 0, 1, ..., 9. Так как телефонные номера обычно не начинаются с 0, то задача состоит в вычислении числа комбинаций из девяти различных цифр по 7. Очевидно, что это ‑ размещение по семи различным местам семи из девяти различных цифр, т.е.
номеров.
Даже если на проверку одного номера тратить 1 минуту, то на все уйдет 3024 часа или 126 суток. Таким образом, следователь ‑ не прав.
Пример. Сколькими способами семь разных учебников можно поставить на полке в один ряд?
Так как порядок учебников по условию ‑ значения не имеет, то имеем задачу о числе перестановок семи разных книг. Следовательно, способов.
Пример. В штате мебельного магазина имеется пять грузчиков. Сколькими способами можно сформировать бригаду из двух грузчиков для доставки гарнитура к заказчику?
Поскольку не имеет значения, какой грузчик будет первым, а какой ‑ вторым, т.е. необходим выбор двух разных грузчиков из пяти возможных, то это ‑ задача о сочетаниях из пяти человек по два. Следовательно, способов.
Пример. Изменим условия примера 12.3. Пусть стало известно, что в телефонном номере преступника встречаются только цифры 2, 4, 5 и 7. Насколько уменьшится перебор всех возможных номеров?
Таким образом, в семизначном телефонном номере встречаются только четыре цифры, остальные три, очевидно, повторяют какие-то из имеющихся. Следовательно, имеем задачу о размещениях из четырех цифр по семи, то есть с повторениями. Решение: (повт.) = 47 =16384 номера. Перебрать все эти номера можно примерно за 11 суток, что почти в 10 раз меньше, чем в примере 12.3.
Пример. Сколькими способами можно разложить в ряд две зеленые и четыре красные папки?
Так как названия папок не указываются, а критерием является цвет, то задача состоит в расположении шести цветных папок двух цветов. Имеем случай перестановок с повторениями. Следовательно, способами.
1.3. Классификация событий.
Предметом теории вероятностей является анализ явлений, наблюдения над которыми не всегда приводят к одним и тем же исходам и в то же время обладающим некоторой статистической регулярностью, которая проявляется в статистической устойчивости частот исходов.
Статистическая устойчивость частот делает весьма правдоподобной гипотезу о возможности количественной оценки случайности того или иного события, появляющегося в результате эксперимента. Как правило, эксперимент предпринимается для изучения некоторых свойств интересующих нас экономического процесса или явления. При этом производится построение математической модели эксперимента, которое включает описание:
Возможных исходов;
Класса рассматриваемых событий;
Вероятностей наступления этих событий.
Современная теория вероятностей основана на аксиоматическом подходе Колмогорова, позволяющим охватить все классические разделы теории вероятностей и дать основу для развития ее новых разделов, вызванных запросами практики. Одной из важных сфер приложения теории вероятностей является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей. Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений.
Пространством элементарных событий называют множество взаимоисключающих исходов эксперимента такое, что каждый интересующий результат эксперимента может быть однозначно описан с помощью элементов этого множества. Элементы называются элементарными событиями и обозначаются .
Событием называют любое подмножество элементов из . Событие произойдет, если произойдет какое-либо из элементарных событий . Пустое множество называется невозможным событием.
Суммой двух событий и называется событие + , состоящее из элементарных событий, принадлежащих хотя бы одному из событий или .
Произведением двух событий и называется событие , состоящих из элементарных событий, принадлежащих одновременно и .
Противоположным событием событию называют событие , состоящее из элементарных событий, не принадлежащих .
Разностью двух событий и называют событие /, состоящее из элементарных событий, которые входят в событие .
Под случайным событием в теории вероятностей понимается событие, которое в результате опыта (испытания) может произойти или не произойти.
Событие называется достоверным, если оно обязательно произойдет в результате испытания, и невозможным, если оно не может произойти в результате испытания. Так при подбрасывании монеты достоверным является появление орла или решки и невозможным – появление кирпича.
События называются несовместными, если они не могут наблюдаться в одном и том же испытании одновременно. Так при бросании монеты появление орла или решки – несовместные события.
События являются равновозможными, если по условиям испытания нельзя считать, что одно из них может быть более возможным, чем другое.
Пусть F - поле событий для данного эксперимента. Вероятностью P(A) называется числовая функция, определенная на всех F и удовлетворяющая трем условиям ( аксиомам вероятностей):
P(A) 0;
P()=1;
Для любой конечной или бесконечной последовательности наблюдаемых событий таких, что при
1.4. Способы задания вероятности:
1. Классический способ задания вероятности
При данном способе пространство элементарных событий является конечным, и все элементарные события равновероятны. Тогда вероятность события определяется равенством
,
где - число элементарных исходов испытания, благоприятствующих появлению события ; - общее число возможных элементарных исходов испытания.
Пример. Брошены два игральных кубика. Найти вероятность того, что сумма очков на выпавших гранях равна пяти, а произведение – четырем.
Решение. Каждый кубик при бросании дает одно из чисел 1, 2, 3, 4, 5, 6. Так как оба кубика бросаются независимо, то по теореме умножения общее число исходов: 6 · 6 = 36.
Ясно, что удовлетворить условию задачи возможно только двумя сочетаниями очков: 1, 4 или 4, 1. То есть только два исхода благоприятствуют условию задачи. Следовательно, по определению вероятности:
.
Пример. В коробке имеется 15 шаров, из которых 10 – окрашены, а 5 – прозрачные. Извлекаем, не глядя, три шара. Какова вероятность того, что все они будут окрашены?
Решение. Общее число исходов при извлечении шаров:
.
Благоприятных исходов того, что все шары окрашены:
.
Следовательно, .
2. Геометрический способ задания вероятности
При данном способе пространство элементарных событий является бесконечным, но все элементарные события, входящие в это пространство, являются равновозможными.
Если отождествлять пространство элементарных событий с некоторой замкнутой областью пространства из , то вероятность события будет вычисляться по формуле
где и мера области :
Это длина ( если рассматривается пространство
площадь (если рассматривается пространство
объем ( если рассматривается пространство
Пример. Точка случайно бросается на отрезок [0,1]. Какова вероятность, что она попадет в центральную часть ?
Очевидно, р(А)= .
Пример. Ромео и Джульетта договорились встретиться в определенном месте между двенадцатью часами и часом дня. Найти вероятность их встречи, если приход каждого из них в течение указанного часа происходит наудачу, и каждый из них ждет другого 10 минут.
Рис.1
Обозначим момент прихода Ромео через х, а Джульетту через y. Выберем за начало отсчета 12 часов, а за единицу измерения 1 минуту. Тогда пространство всех элементарных исходов представляет собой квадрат на плоскости со стороной 60 (см. рис.1). Событие А (Ромео и Джульетта встретятся) произойдет тогда и только тогда, когда |x-y|≤10. Оно изображено на рисунке заштрихованной полосой. Имеем: площадь квадрата равна 3600, площадь полосы равна 602-502=1100. поэтому .
3. Дискретный способ задания вероятности
При данном способе пространство элементарных событий является бесконечным счетным. Числовая неотрицательная функция Р определяется таким образом, чтобы вероятность каждого элементарного события была равна некоторому числу ,
Статистический способ задания вероятности
При данном способе рассматривается случайный эксперимент для которого построить пространство элементарных событий невозможно. Тогда эксперимент проводится раз при неизменном комплексе условий протекания и подсчитывается число экспериментов, в которых появилось некоторое событие . Тогда вероятность вычисляется по формуле
На практике, при вычислениях вероятностей в классической схеме часто приходиться пользоваться формулами комбинаторики (соединений). Существуют две принципиально различные схемы выбора:
а) без возращения элементов (это значит, что отбираются либо сразу все элементов, либо последовательно по одному элементу, причем каждый отобранный элемент исключается из исходного множества);
б) с возвращением (выбор осуществляется поэлементно с обязательным возвращением отобранного элемента на каждом шаге и тщательном перемешиванием исходного множества перед следующим выбором).
В результате получаются различные постановки эксперимента по выбору наудачу элементов из общего числа и различных элементов исходного множества.
1
В задачах, использующих вероятностные количественные характеристики, приходится по вероятностям одних событий оценивать вероятности других событий. Для этого используют различные соотношения, в основе которых лежат теоремы теории вероятностей.
Теорема сложения вероятностей. Вероятность суммы несовместных событий равна сумме вероятностей этих событий:
.
Если в единичном опыте обязательно должно произойти одно из событий , то такая
группа событий называется полной группой событий. Сумма вероятностей несовместных событий, образующих полную группу, равна единице: .
Например, при бросании игральной кости, возможно появление одного из чисел: 1, 2, 3, 4, 5, 6. Вероятность каждого появления при единичном бросании . Следовательно,
.
В ряде случаев вероятности появления одних событий зависят от того, произошло ли другое событие или нет. Вероятность события A, вычисленная при условии, что имело место другое событие B, называется условной вероятностью события A и обозначается P(A/B) или .
Например, при бросании игральной кости может наступить событие B: «четное число очков» и событие A: «число очков меньше 6». Эти события могут произойти одновременно, т.е. совместны, поэтому можно поставить вопрос о вероятности P(AB) их совместного появления. Эту задачу решает следующая теорема.
Пример. Два стрелка одновременно стреляют по мишени. Вероятность попадания для первого стрелка равна 0,7, второго – 0,8. Найти вероятность того, что в мишень попадет только один стрелок.
Так как два стрелка стреляют одновременно и независимо друг от друга, то, используя противоположные события «попадание – промах» и правило умножения вероятностей, получим следующие варианты событий:
‑ попадают оба стрелка: ;
‑ попадает первый стрелок и не попадает второй: ;
‑ попадает второй и промах у первого: ;
‑ промах обоих стрелков: .
Эти события образуют полную группу, т. к. .
Решением задачи, по правилу сложения, будет: .
Теорема умножения вероятностей. Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную при условии, что первое событие имело место: . Если же появление одного из событий не меняет вероятности появления другого, то события называются независимыми. Вероятность произведения независимых событий равна произведению вероятностей каждого события: .
Для нашего примера можно определить: , т.к. четных очков – три (2, 4, 6) из шести возможных; , т.к. событию A отвечает только два варианта (2 и 4). Тогда условная вероятность наступления события A при появлении события B:
.
Другой пример. Бросается два кубика отдельно друг от друга. Какова вероятность того, что на первом выпадет четное количество очков (событие A), а на втором число очков будет меньше пяти (событие B)?
В данном случае ясно, что повлиять друг на друга эти события не могут – они независимы. Вероятности: ; , следовательно, вероятность совместного появления обоих событий: .
Пример. Программа экзамена содержит 25 вопросов, из которых студент знает 20. Преподаватель последовательно задает три вопроса. Найти вероятность того, что студент сможет ответить на все вопросы А, В, С.
Вероятность того, что первый вопрос будет из числа известных студенту, равна .
Таким образом, остается 24 вопроса, 19 – известны. Следовательно, .
Аналогично, вероятность того, что студент ответит и на третий вопрос: .
Итак, вероятность отличной оценки: .
1.6. Формула полной вероятности и формула Байеса
Пусть имеется полная группа несовместных событий , , …, с известными вероятностями , , …, . Событие A может наступить только при появлении одного из событий , причем известны условные вероятности , , …, . Найти вероятность события A по этим данным позволяет формула полной вероятности:
.
Пример. Предполагается произвести два выстрела в цель из орудия. Необходимо оценить вероятность события A: «разрушение цели», если вероятности попадания снаряда в цель:
- 0 снарядов ;
- 1 снаряда ;
- 2 снарядов ,
и вероятности разрушения цели при попадании в нее
- 0 снарядов ; - 1 снаряда ; - 2 снарядов .
Так как события составляют полную группу, то вероятность разрушения цели:
Пусть теперь событие A может, по-прежнему, наступить с одним из несовместных событий , , …, , образующих полную группу. Пусть в результате какого-то из испытаний событие A произошло. Возникает вопрос, как изменятся условные вероятности событий , , …, , т.е. в результате наступления события A?
Ответ на этот вопрос дает формула Байеса
,
где – полная вероятность события A.
Пример. По цели было произведено два выстрела, и цель была поражена. Используя данные предыдущего примера, требуется найти вероятности , , получения ровно 0, 1 и 2 попаданий.
Вероятность полного отсутствия попаданий:
.
Вероятности одного или двух попаданий:
; .
Видно, что вероятности событий после разрушения цели изменились, точнее, изменились их условные вероятности, хотя события по-прежнему составляют полную группу.
Формула Байеса широко применяется при решении проблем с недостаточной информацией: пусть имеется несколько несовместных предположений (гипотез), которые надо проверить с помощью опыта. Перед началом опыта далеко не всегда можно определить вероятности этих гипотез, которые называют доопытными илиаприорными вероятностями. Этими вероятностями приходится задаваться, исходя из какого-то опыта или просто по интуиции. Как только опыт проведен, появляется информация, с помощью которой можно произвести коррекцию априорных вероятностей.
Таким образом, основываясь на результатах опыта, заменяют априорные вероятности послеопытными (или апостериорными). Надо учитывать, что вероятности отдельных гипотез после опыта могут сильно измениться и даже уменьшиться настолько, что ими можно пренебречь, т.е. в нашем примере – отбросить гипотезу . После коррекции эксперимент можно продолжать (повторять опыт), продолжая уточнять вероятности гипотез. По мере уточнения производится обоснованное изменение различных решений практических задач, оперативных планов работы и т.п.
1.
В этой теме изучается так называемая схема повторных независимых испытаний или схема Бернулли. Схема Бернулли подразумевает выполнение четырех основных условий:
а) количество повторных испытаний конечно,
б) они являются независимыми;
в) исходом каждого испытания является либо «успех» либо «неудача»;
г) в каждом испытании вероятность «успеха» постоянна.
В этой теме рассматриваются п последовательных независимых испытаний, в каждом из которых событие А может наступить с постоянной вероятностью . Результат испытаний – появление k раз события А, которое чередуется в любом порядке с раз не появлением события А, то есть появлением события - события противоположного событию A.
При этом могут решаться разнообразные задачи. При решении задач следует уяснить, что нужно понимать под испытанием и событием А. Далее необходимо сформулировать вопрос задачи в виде условий, налагаемых на число наступления события . Затем перейти к записи условий задачи в терминах и обозначениях схемы повторных испытаний, к выбору подходящей расчетной формулы и вычислительной схемы.
Перечислим основные формулы и вычислительные схемы.
1. Для нахождения вероятности того, что событие A наступит ровно k раз при проведении n независимых испытаний, проводимых по схеме Бернулли, применяетсяформула Бернулли[1]:
, (1)
где - вероятность наступления события A в каждом испытании;
- вероятность события, противоположного событию A, то есть ;
.
Из формулы Бернулли следует, что
.
2. Иногда необходимо бывает найти наивероятнейшее число , то есть число испытаний, при котором достигается максимальная вероятность в n независимых испытаниях. Наивероятнейшее значение числа наступления события A при проведении n повторных независимых испытаний, удовлетворяющих схеме Бернулли, является целым числом и находится в интервале, который можно найти по формуле
. (2)
Длина указанного интервала равна единице, поэтому если границы интервала – целые числа, то имеются два наивероятнейших числа, которые совпадают с граничными значениями интервала, определяемого формулой (2), в противном случае – только одно, которое определяется по формуле (2) и выбирается из условия того, что наивероятнейшее число - целое.
3. Вероятность того, что событие A наступит не менее раз и не более раз при проведении n независимых испытаний, удовлетворяющих схеме Бернулли можно найти по формуле:
. (3)
4. Вероятность того, что событие A наступит хотя бы один раз при проведении n независимых испытаний, можно найти по формуле:
. (4)
5. Вероятность того, что событие A при проведении n независимых испытаний наступит:
а) менее раз, определяется по формуле
; (5)
б) более раз, определяется по формуле
; (6)
в) не менее раз, определяется по формуле
; (7)
г) не более раз, определяется по формуле
. (8)
Формулы (5) – (8) являются следствием формулы (3).
6. Если число независимых испытаний велико, то для нахождения вероятности того, что событие A наступит ровно k раз при проведении n независимых испытаний, проводимых по схеме Бернулли, формулу Бернулли применять (чисто технически) достаточно сложно. В этих случаях применяют асимптотические (локальную и интегральную) формулы Муавра – Лапласа и асимптотическую формулу Пуассона.
а). Локальная формула Муавра – Лапласа
, (9)
где (таблица значений функции приведена в приложении 1)
Функция обладает следующими свойствами:
1) функция является четной, то есть ;
2) функции монотонно убывает при положительных значениях аргумента;
3) ;
4) для всех значений значение функции .
б). Интегральная формула Муавра – Лапласа:
, (10)
где - функция Лапласа, , (таблица функции Лапласа приведена
в приложении 2).
Функция обладает следующими свойствами:
1) функция является нечетной, то есть ;
2) функции – монотонно возрастающая;
3) ;
4) для всех значений значение функции .
в). Формула Пуассона:
, (11)
где . Значение функции для различных значений и k приведены в приложении 3.
Часто правую часть формулы Пуассона для удобства обозначают , то есть
.
Замечание. Выбор формул (1), (3) (и ее следствий (5) – (8)), (9), (10) и (11) осуществляется исходя из количества испытаний и вероятности наступления события в каждом испытании . Используемые понятия «мало», «не очень мало», «велико» являются относительными и могут признаваться таковыми в зависимости от конкретных условий задачи. Как правило, если , то можно говорить, что – велико; если , то – не очень мало.
В замечаниях 1 – 7 перечислим соответствующие условия и рекомендуемые формулы для применения.
Замечание 1. Если число независимых испытаний п мало, то для вычислениявероятности появления события k раз пользуются формулой Бернулли (1). В этом случае не возникает вычислительных трудностей для подсчета вероятности .
Замечание 2. Если число независимых испытаний п достаточно велико, авероятность появления события в каждом испытании отлична от 0 и 1 и не очень мала, так что , то для вычисления вероятности появления события k раз применяют локальную формулу Муавра-Лапласа (9).
Замечание 3. Если число независимых испытаний п достаточно велико, авероятность появления события в каждом испытании отлична от 0 и 1 и мала, так что , то для вычисления вероятности появления события k раз применяют формулу Пуассона (11).
Замечание 4. Если число независимых испытаний п мало и требуется найтивероятность появления события от до раз, то для вычисления искомой вероятности применяют формулу (3). При этом вероятности входящие в каждое слагаемое формулы (3) вычисляются используя формулу Бернулли (1).
Замечание 5. Если число независимых испытаний п достаточно велико, число слагаемых в сумме формулы (3) мало и вероятность появления события в каждом испытании отлична от 0 и 1 и не
очень мала, так что , то для вычисления вероятности появления события от до раз применяют формулу (3). При этом вероятности входящие в каждое слагаемое формулы (3) вычисляются используя локальную формулу Муавра – Лапласа (9).
Замечание 6. Если число независимых испытаний п достаточно велико, число слагаемых в сумме формулы (3) мало и вероятность появления события в каждом испытании отлична от 0 и 1 и
очень мала, так что , то для вычисления вероятности появления событияот до раз применяют формулу (3). При этом вероятности входящие в каждоеслагаемое формулы (3) вычисляются используя формулу Пуассона (11).
Замечание 7. Если число независимых испытаний п достаточно велико, число слагаемых в сумме формулы (3) велико и вероятность появления события в каждом испытании отлична от 0 и 1 и
не очень мала, так что , то для вычисления вероятности появления события от до раз применяют интегральную формулу Муавра – Лапласа (10).
Пример. Вероятность того, что стрелок при одном выстреле попадет в мишень равна 0,8. Стрелок произвел 7 выстрелов. Найти:
а) наивероятнейшее число попаданий в мишень;
б) вероятность наивероятнейшего числа попаданий в мишень.
Эксперимент состоит в том, что стрелок последовательно производит 7 выстрелов по мишени, т.е. проводится 7 повторных независимых испытаний (количество испытаний конечно). Каждое испытание имеет два исхода: стрелок попал в мишень и стрелок не попал в мишень. Вероятность попадания в мишень в каждом испытании постоянно. Каждое испытание является независимым, так как по условию задачи вероятность попасть в мишень при одном выстреле (испытании) является величиной постоянной и не зависит от других испытаний. Следовательно указанный эксперимент удовлетворяет схеме Бернулли (схема Бернулли выполняется).
Решение:
a). По условию имеем:
- число выстрелов (число испытаний в эксперименте);
- вероятность попасть в мишень при одном выстреле (вероятность «успеха»);
- вероятность не попасть в мишень при одном выстреле (вероятность «неудачи»).
Найдем наивероятнейшее число числа попаданий в мишень по формуле (2):
.
Тогда,
или
.
Так как наивероятнейшее число есть целое число, то наивероятнейшее число попаданий в мишень равно 6, то есть .
б). Рассмотрим событие F – из 7 выстрелов стрелок попадет в мишень ровно 6 раз.
По условию имеем:
- число выстрелов (число испытаний в эксперименте);
- вероятность попасть в мишень при одном выстреле (вероятность «успеха»);
- вероятность не попасть в мишень при одном выстреле (вероятность «неудачи»);
– число попаданий в мишень.
Найдем вероятность события F, то есть используя формулу Бернулли (1), так как эксперимент проводится по схеме Бернулли:
.
Тогда, подставляя исходные данные, получим искомую вероятность
Пример. В каждом из 700 независимых испытаний событие А происходит с постоянной вероятностью 0,35. Найти вероятность того, что событие А происходит:
а) точно 270 раз;
б) меньше чем 270 и больше чем 230 раз;
в) больше чем 270 раз.
Так как количество испытаний довольно велико, а вероятность не очень мала, причем
,
то для вычисления искомых вероятностей можно использовать локальную и интегральную формулы Муавра – Лапласа (9) и (10).
Решение:
a) Дано: , , . Найти вероятность .
Так как количество испытаний – велико, а вероятность не очень мала, причем , то воспользуемся локальной формулой Муавра – Лапласа (9)
, где .
Подставляя исходные данные, получим
,
.
Значение функции найдем по таблице приложения 1
.
Тогда искомая вероятность
.
б) Дано: , , и .
Найти вероятность . Для нахождения указанной вероятности можно было бы воспользоваться формулой (3)
,
но так как количество испытаний – велико и число слагаемых в формуле (3) так же достаточно велико (38 слагаемых), а вероятность не очень мала, причем , то согласно замечанию 7 для нахождения искомой вероятности
воспользуемся интегральной формулой Муавра – Лапласа (10)
, где , .
Подставляя исходные данные, найдем
,
,
.
Значение функции определим по таблице приложения 2
,
.
Тогда искомая вероятность
в) Дано: , , и . Найти вероятность .
Для нахождения указанной вероятности можно было бы воспользоваться формулой (6), являющейся следствием формулы (3)
,
но так как количество испытаний – велико и число слагаемых в формуле (6) так же достаточно велико (429 слагаемых), а вероятность не очень мала, причем , то согласно замечанию 7 (в котором сказано не только об условиях применения формулы (3), но и об условиях применения следствий из формулы (3), то есть формул (5) – (8)) для нахождения искомой вероятности
воспользуемся интегральной формулой Муавра – Лапласа (10)
, где , .
Подставляя исходные данные, найдем
,
,
.
Значение функции определим по таблице приложения 2
,
.
Тогда искомая вероятность
Пример. Телефонный коммутатор обслуживает 2000 абонентов. Для каждого абонента вероятность позвонить в течение часа равна 0,0025. Найти вероятность того, что в течение часа позвонят на коммутатор:
а) три абонента;
б) не менее четырех абонентов.
Так как количество испытаний – велико, а вероятность очень мала, причем
,
то для нахождения искомых вероятностей можно использовать формулу Пуассона (11)
.
Решение:
a) Дано: , , . Найти вероятность .
Так как количество испытаний – велико, а вероятность очень мала, причем , то воспользуемся формулой Пуассона (11).
Подставим исходные данные в формулу (11) и, используя таблицу значений функции Пуассона приложения 3, найдем искомую вероятность при и :
.
б) Рассмотрим событие F – в течение часа позвонят на коммутатор не менее четырех абонентов. По условию имеем: , , .
Найти вероятность .
Искомую вероятность можно найти, используя формулу (7)
.
Однако число слагаемых в формуле (7) достаточно велико (1996 слагаемых) и поэтому применять указанную формулу практически невозможно. Рассмотрим противоположное событие, то есть событие – в течение часа позвонят на коммутатор менее четырех абонентов. Тогда вероятность искомого события можно определить по формуле
.
Для события имеем: , , . Найти вероятность
.
Так как количество испытаний – велико, число слагаемых в формуле (3) не велико (четыре слагаемых) и вероятность появления события в каждом испытании очень мала ( ), так что , то для вычисления вероятности события , то есть , применим формулу (3)
Тогда искомую вероятность найдем по формуле
Вероятности входящие в каждое слагаемое формулы (3) вычисляются используя формулу Пуассона (11)
.
;
;
;
.
Значение указанных функций Пуассона можно найти, либо используя инженерный калькулятор, либо по таблице приложения 3 при и соответствующих значениях k.
Тогда искомая вероятность
Тема 2. Лекция
Случайной называется величина, которая в результате опыта может принимать различные заранее не известные значения.
Случайные величины можно разделить на два основных вида – дискретные и непрерывные.
Дискретной случайной величиной называется такая величина, которая может принимать любое значение из конечного или бесконечного счетного множества значений, т.е. такого множества, элементы которого могут быть занумерованы в каком-нибудь порядке и выписаны в последовательности , , …, , …
Непрерывной случайной величиной называется такая величина, которая может принимать любые неизвестные заранее значения из рассматриваемого участка или интервала.
Так число будущих министров среди ста выпускников института – дискретная случайная величина с возможными значениями 0, 1, 2, …, 100, а дальность полета пули при выстреле – непрерывная и заранее неизвестная величина от 0 до 1 км.
2.1. Дискретная случайная величина
2.1.1. Способы задания дискретной случайной величиной
Для задания дискретной случайной величины необходимо перечислить все ее возможные значения и указать вероятности этих значений.
1. Законом распределения (или рядом распределения) дискретной случайной величины называется соответствие между ее возможными значениями и их вероятностями.
Закон распределения может задаваться таблицей, формулой или графиком. При табличном задании первая строка таблицы содержит возможные значения, вторая – вероятности этих значений.
X
x1
x2
…
xn
P
p1
p2
…
pn
В любом законе распределения необходимо перечислять все возможные значения случайной величины, следовательно, события x1, x2, …, xn образуют полную группу и
.
Пример. В лотерее выпущено 100 билетов. Разыгрывался один выигрыш в 50 у.е. и десять выигрышей по 1 у.е. Найти закон распределения величины X – стоимости возможного выигрыша.
Возможные значения величины X: x1 = 0; x2 = 10 и x3 = 50. Так как «пустых» билетов – 89, то p1 = 0,89, вероятность выигрыша 1 у.е. (10 билетов) – p2 = 0,10 и для выигрыша 50 у.е. – p3 = 0,01. Таким образом:
Легко проконтролировать: .
2. Ряд распределения можно задать графически, если по оси x откладывать
значения X, а по оси y – значения P и соединять отрезками полученные точки.
Пример. Дискретная случайная величина X задана законом распределения:
X
1
3
6
8
p
0,2
0,1
0,4
0,3
Построить многоугольник распределения.
В прямоугольной системе координат по оси x будем откладывать возможные значения xi, а по оси y – вероятности этих значений. Построим точки ; ; и . Соединив эти точки отрезками, получим ответ.
3. Функция распределения вероятностей случайной величины
Дискретная случайная величина может быть задана перечнем всех ее возможных значений и их вероятностей. Такой способ задания неприменим для непрерывных случайных величин.
Действительно, рассмотрим случайную величину X, возможные значения которой сплошь заполняют интервал (а, b). Можно ли составить перечень всех возможных значений X? Очевидно, что этого сделать нельзя. Этот пример указывает на целесообразность дать общий способ задания любых типов случайных величин. С этой целью и вводят функцию распределения вероятностей случайной величины.
Пусть х - действительное число. Вероятность события, состоящего в том, что Х примет значение, меньшее х, т. е. вероятность события Х < х, обозначим через F(x). Разумеется, если х изменяется, то, вообще говоря, изменяется и F(x), т. е. F (х)—функция от х.
Функцией распределения называют функцию F (х), определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х, т. е.
F(x)=P(Xnx/n; nx – число вариант, меньше x, n – объем выборки.
Свойства.
значения F*(x) [0;1]
F*(x) – функция неубывающая: F*(x2)> F*(x1), если x2> x1
если x1 – наименьшая варианта, F*(x1)=0
если xk – наибольшая, то F*(x1)=1.
В отличие от эмпирической функции, функцию F(x) генеральной совокупности называется теоретической. Различия между ними состоят в том, что F(x) определяет вероятность события XКкр
Левостороннюю называют критическую область определяемую неравенством К<Ккр
Двустороннюю называют критическую область определяемая двумя неравенствами К<Кı и К>К2; Кı>К2
При отыскании критической области задают α (уровень значимости) и ищут критические точки исходя из требований, что критерий К примет значение лежащее в критической области, при этом вероятность такого события равна принятому уровню значимости α, т.е. для правосторонней области Р(К>Ккр)= α; для левосторонней области Р(К<Ккр)= α; для двусторонней области Р(К>|Ккр|)= α/2
Для многих критериев составлены таблицы:
Стьюдента;
χ²;
Фишера
5.3. Сравнение двух дисперсий
Рассмотрим гипотезу о параметрах нормального распределения. Пусть имеется две серии опытов, регистрирующие значение некоторой случайной величины.
Х: х1, х2 … хn
Y: y1, y2 … уn
Осуществим проверку нулевой гипотезы Н0 о равенстве дисперсий при неизвестных математических ожиданиях.
Н0: Dх = Dу
Постановка задачи.
Пусть даны две случайные величины Х и Y, распределенные нормально. По данным выборки объем их nх и nу y подсчитаны выборочные дисперсии S.
Цель работы при заданном уровне значимости α проверить нулевую гипотезу о равенстве дисперсий.
Такая задача возникает при сравнении точности двух приборов, или при сравнении различных методов измерения. Т.е. когда выборочные дисперсии отличаются, возникает вопрос значимости или не значимости это различие.
Если различие неразличимо, то имеет место нулевая гипотеза, т.е. приборы, например, имеют одинаковую точность. А различия выборочных дисперсий объясняется случайными причинами.
Механизм проверки.
По данным выборок значений nх и nу, вычисляют наблюдаемое значение критерия как отношение большей дисперсии к меньшей:
Критическая область строится в зависимости от конкурирующей гипотезы. По таблицам распределения Фишера, по заданному уровню значимости α и вычисленным степеням свободы υх, υу находят табличное значение критерия:
для альтернативной гипотезы Н1: Dх >Dу
Fкр в зависимости от параметров Fкр (α, υх, υу)
для альтернативной гипотезы Н1: Dх ≠ Dу
Fкр в зависимости от параметров Fкр (α/2, υх, υу)
Если Fнаб >Fкр, то Н0 отвергают.
Если Fнаб Dy.
Решение: Найдем отношение большей исправленной дисперсии к меньшей:
Fнабл = S²б / S²м = 0.76 / 0.38 = 2
По условию конкурирующая гипотеза имеет вид H1: Dx >Dy, поэтому критическая область – правосторонняя. По таблице критических точек распределения Фишера, по уровню значимости α=0,05 и числам степеней свободы k1 = nх – 1 = 11 – 1 = 10 и k2 =nу – 1 = 14 – 1 = 13 находим критическую точку:
Fкр (α, kı, k2) = Fкр (0.05,10,13) = 2.67
Так как Fнабл = 2. < Fкр = 2.67, то нет оснований отвергать Но о равенстве дисперсий. Другими словами, исправленные выборочные дисперсии различаются незначимо.
5.4. Сравнение математических ожиданий
Для проверки гипотезы, соответствие двух выборок принадлежности к одной и той же генеральной совокупности, рассмотрим вопрос о значимости расхождений между выборочным значением математических ожиданий. Выдвинем нулевую гипотезу о равенстве математических ожиданий.
Н0: Мx =Мy
Тестирование такой гипотезы основано:
на нормальном распределении в случае большого объема выборок (n>30), когда дисперсии считаются известными
на распределении Стьюдента в случае малого объема выборок (n<30) когда дисперсии являются неизвестными.
Сравнительные графики плотностей распределения нормального и Стьюдента приведены на рисунке:
синей и розовой линиями показано распределение Стьюдента,
красной – нормальное.
5.5. Проверка гипотезы о равенстве средних при и известных дисперсиях
Для того чтобы при заданном уровне значимости α =0.05 проверить нулевую гипотезу Но: Мх=Му о равенстве математических ожиданий двух больших нормальных выборок с известными дисперсиями Dх и Dу, необходимо:
1. Вычислить наблюдаемое значение критерия:
Построить критическую область в зависимости от конкурирующей гипотезы:
при конкурирующей гипотезе Н1: Мх ≠ Му по таблице функции Лапласа находят критическую точку zкр из равенства Ф(zкр) = (1 – α) /2.
Если |Zнабл| < zкр, то нет оснований отвергать нулевую гипотезу.
Если |Zнабл| > zкр, то нулевую гипотезу отвергают.
при конкурирующей гипотезе Н1: Мх > Му по таблице функции Лапласа находят критическую точку zкр из равенства
Ф(zкр) = (1 – 2α) /2.
Если Zнабл < zкр, то нет оснований отвергать нулевую гипотезу.
Если Zнабл > zкр, то нулевую гипотезу отвергают.
при конкурирующей гипотезе Н1: Мх < Му по таблице функции Лапласа находят «вспомогательную критическую точку» zкр из равенства
Ф(zкр) = (1 – 2α) /2.
Если Zнабл > - zкр, то нет оснований отвергать нулевую гипотезу.
Если Zнабл < - zкр, то нулевую гипотезу отвергают.
5.6. Проверка гипотезы о равенстве средних при неизвестных дисперсиях
Постановка задач: пусть генеральные совокупности распределены нормально, причем их дисперсии Dx и Dy заранее не известны. Взяты две выборки малого объема, требуется сравнить средние этих генеральных совокупностей.
Методика проверки задач: заключается в использовании критерия Стьюдента при условии, что генеральные дисперсии не известны, однако в предположении, что они равны между собой.
Такая задача возникает: если сравниваются средние размеры двух партий деталей, изготовленных на одном и том же станке. Естественно будет предположить, что дисперсии контролируемых размеров одинаковы.
Алгоритм проверки
1) Прежде чем сравнивать средние требуется проверить Но: Dх=Dу
2) Если гипотеза подтвердилась нужно вычислить наблюдаемое значение критерия:
3) Строим критическую область в зависимости от конкурирующей гипотезы
а) Если Н1: Мх ≠ Му – двусторонняя критическая область строится исходя из условия чтобы вероятность попадания наблюдаемого значения критерия в эту область была равна принятому уровню значимости α взятого из таблицы Стьюдента для числа степеней свободы в верхней части таблицы, т.е. для двусторонней критической области при условии |Тнабл| < tкр(α,υ), то нет основания отвергать нулевую гипотезу; если |Тнабл| > tкр(α,υ), то нулевую гипотезу отвергают.
б) Если Н1: Мх >Му строится правосторонняя критическая область, а критическую точку находят по таблице Стьюдента из нижней части.
Если Тнабл < tкр, то нет основания отвергать нулевую гипотезу .
Если Тнабл > tкр, то нулевую гипотезу отвергают.
в) При конкурирующей гипотезе Н1: Мх < Му по таблице критических точек распределения Стьюдента, по заданному уровню значимости α,помещенному в нижней строке таблицы ,и числу степеней свободы k= nx + ny–2 найти «вспомогательную критическую точку» tкр односторонней критической области.
Если Тнабл < - tкр, то нет основания отвергать нулевую гипотезу.
Если Тнабл > - tкр, то нулевую гипотезу отвергают.
Тнабл и число степеней свободы.
5.7. Проверка гипотезы о законе распределения генеральной совокупности
Если закон распределения не известен, но есть основание предположить, что он имеет определенный вид (А), то проверяют нулевую гипотезу:
Но: генеральная совокупность распределена по закону А.
Проверка гипотезы о предполагаемом законе распределения производится так же как и проверка гипотезы о параметрах распределения, т.е. при случайно отобранной случайной величине – критерия согласия.
Критерием согласия называют критерий проверки гипотезы о
предполагаемом законе распределения.
Имеется несколько критериев согласия:
критерий Пирсона;
критерий Колмогорова;
критерий Смирнова.
Критерий Пирсона
Пусть по выборке объема n получены эмпирические частоты, т.е. мы имеем предполагаемое распределение.
xi
x1
x2
x3
x4
x5
ni
n1
n2
n3
n4
n5
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты.
При уровне значимости α требуется проверить гипотезу: генеральная совокупность распределена нормально.
В качестве критической проверку нулевой гипотезы примем случайную величину:
(*)
Эта величина случайная, т.к. в различных опытах она принимает различные, заранее не известные, значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия => он характеризует близость эмпирических и теоретических распределений.
Доказано, что закон распределения случайной величины (*) не зависит от того, какому закону распределения подчинена генеральная совокупность, а стремится к закону распределения χ2 с числом степеней свободы: υ=k–1–r , где
k – число групп (интервалов) выборки
r – число параметров предполагаемого распределения.
А т.к. для нормального распределения нам интересно М(х) и D(x), то число степеней свободы определяется υ=k–3
Правила проверки.
Для того, чтобы при заданном уровне значимости α проверить Н0: “генеральная совокупность распределена нормально”, необходимо:
1. вычислить теоретические частоты;
2. вычислить наблюдаемое значение критерия:
3. по таблицам критических точек распределения χ2 по заданному уровню значимости и числу степеней свободы υ=k–3, найти критическую точку: χ2кр=(α,υ);
4. сравнить 2 имеющихся критерия:
- если χ2набл< χ2кр - нет основания отвергать нулевую гипотезу о нормальном распределении.
- если χ2набл > χ2кр - нулевую гипотезу о нормальном распределении отвергают.
Замечание:
объем выборки должен быть достаточно велик (более 50);
малочисленные группы следует объединять в одну, суммируя частоты;
т.к. возможные ошибки первого и второго рода, то в окончательном выводе следует проявить осторожность:
можно повторить опыт;
увеличить число наблюдений;
для проверки воспользоваться другими критериями;
построить график распределения;
вычислить эксцесс и асимметрию.
для контроля вычислений формулу
преобразуют к виду
Пример. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в процентах к предыдущему году):
Выработка в отчетном году (в % к предыдущему году)
94-104
104-114
114-124
124-134
134-144
Итого
Количество рабочих
6
20
45
27
6
100
На уровне значимости проверить гипотезу о нормальном распределении случайной величины X – выработки рабочих – с помощью критерия Пирсона. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Решение. Параметры теоретического нормального закона распределения и , являющиеся соответственно математическим ожиданием и дисперсией случайной величины X, неизвестны, поэтому заменяем их «наилучшими» оценками по выборке – несмещенными и состоятельными оценками соответственно выборочной средней и «исправленной» выборочной дисперсией . Так как число наблюдений достаточно велико, то вместо исправленной можно взять «обычную» выборочную дисперсию .
Найдем выборочную среднюю (по упрощенной формуле):
,
и выборочную дисперсию (также по упрощенной формуле):
.
Для этого составим расчетную табл. 1 при и .
Таблица 1.
Выработка в отчетном году (%)
Середина интервала
xi
Количество студентов
ni
94-104
99
6
-2
-12
24
104-114
109
20
-1
-20
20
114-124
119
45
124-134
129
27
1
27
27
134-144
139
2
2
4
8
Сумма
100
-1
79
Тогда выборочная средняя
(%).
Выборочная дисперсия
.
Таким образом, ; .
Тогда .
Так как случайная величина имеет нормальное распределение, то для расчета вероятностей попадания случайной величины X в интервал , где , используем функцию Лапласа в соответствии со свойствами нормального распределения:
Так как нормальное распределение определено на всей числовой оси, то есть
, то указанная выше формула применяется при нахождении вероятностей попадания случайной величины X в интервал для всех значений случайной величины X, за исключением крайних значений, то есть значений и .
Вероятность попадания случайной величины X в интервал определяется следующей формулой
Вероятность попадания случайной величины X в интервал определяется следующей формулой
Таким образом, в нашем примере получим:
Запишем в табл. 2 исходные данные и найденные вероятности. Вычислим в табл. 2 теоретические частоты .
Таблица 2.
i
Интервал
Эмпирические частоты
,
Вероятности
,
Теоретические частоты,
1
94 – 104
6
0,0465
4,65
0,06
2
104 – 114
20
0,2447
24,47
0,2
3
114 – 124
45
0,4245
42,45
0,45
4
124 – 134
27
0,2397
23,97
0,27
5
134 – 144
2
0,0446
4,46
0,02
100
Так как в последнем (пятом) интервале число наблюдений меньше пяти, то имеет смысл для применения критерия Пирсона объединить последний интервал с предыдущим (как для эмпирических так и для теоретических частот), полагая при вычислении эмпирическую частоту, равной , теоретическую частоту, равной .
Для определения выборочной статистики (2)
,
составим расчетную табл. 3.
Таблица 3.
i
Эмпирические частоты
,
Теоретические частоты,
,
,
,
1
6
4,65
1,8225
0,3919
2
20
24,47
19,9809
0,8165
3
45
42,45
6,5025
0,1532
4
29
28,43
0,3249
0,0114
100
1,373
Из табл. 3 находим фактически наблюдаемое значение статистики (выборочную статистику) .
Так как число интервалов , а нормальный закон распределения определяется параметрами, точечные оценки которых были получены по выборочным данным, то число степеней свободы . Соответствующее критическое значение статистики можно найти по таблице «Критические точки распределения » в приложении 3 .Имеем .
Так как , то гипотеза о выбранном теоретическом нормальном законе распределения с параметрами и согласуется с опытными данными, то есть гипотеза принимается на заданном уровне значимости .
На одном чертеже построим нормальную кривую и гистограмму. Вершина нормальной кривой имеет координаты ; (где – малая функция Лапласа,
значения которой приведены в приложении 1 .
Выполнив чертеж (рис. 1), можно увидеть, что нормальная кривая
теоретического распределения достаточно хорошо «выравнивает» гистограмму эмпирического распределения.
Рис.1.