Важнейшие распределения непрерывных случайных величин
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Важнейшие распределения непрерывных случайных величин
Равномерное распределение на отрезке
Непрерывная случайная величина Х называется равномерно
распределенной на отрезке [a,b], если ее функция плотности вероятности
постоянна на этом отрезке и равна нулю за его пределами, т. е.
c, x [a, b],
f ( x)
, где с – некоторая постоянная.
0, x [ a, b].
b
Так как
b
f ( x)dx cdx c(b a ) 1,
a
то c
a
1
.
ba
Для функции распределения F(x) имеем
x
F ( x)
x
f (t )dt
x
F ( x)
a
f (t )dt
x
0 dt 0,
x
если x a;
xa
dt
0 dt b a b a ,
a
если a x b;
a
b
x
dt
F ( x) f (t )dt 0 dt
0 dt 1, если x b.
b a b
a
Таким образом, для случайной величины, равномерно распределенной на
отрезке [a, b], функция плотности вероятности и функция распределения
имеют вид
0, x a,
1
x a
, x [a, b],
f ( x) b a
F ( x)
, a x b,
b
a
0, x [a, b].
x b.
1,
Графики функций f(x) и F(x) изображены на рис. 3.2 и 3.3.
f(x)
F(x)
1
ba
1
a
b
x
Рис. 3.2
Найдем основные числовые характеристики:
a
Рис. 3.3
b
x
1 b
ab
MX xf ( x)dx
xdx
;
b
a
2
a
a
b
1 b 2
b 2 ab a 2
MX x f ( x)dx
;
x dx
baa
3
a
2
b
2
b 2 ab a 2 (a b) 2 (b a) 2
.
3
4
12
Тот факт, что Х равномерно распределена на отрезке [a, b], будем
обозначать как X ~ U [a, b].
Примерами реальных ситуаций, связанных с необходимостью
рассмотрения равномерно распределенных случайных величин, могут
служить: анализ ошибок округления при проведении числовых расчетов
(такая ошибка, как правило, оказывается равномерно распределенной на
интервале от –5 до +5 единиц округляемого десятичного знака); время
ожидания «обслуживания» при точно периодическом, через каждые Т единиц
времени, включении (прибытии) «обслуживающего устройства» и при
случайном поступлении (прибытии) заявки на обслуживание в этом
интервале. Например, время ожидания пассажиром прибытия поезда метро
при условии точных двухминутных интервалов движения и случайного
момента появления пассажира на платформе будет распределено
приблизительно равномерно на интервале [0 мин., 2 мин.].
DX MX 2 ( MX ) 2
Пример 3.7. Два бухгалтера ездят на работу, у первого дорога отнимает
20–25 мин., у второго – 20–30 мин. Любое время на дорогу в этих пределах
равновероятно. Определить вероятность того, что дорога на работу занимает
у каждого бухгалтера от 20 до 22 мин., а также среднее время на дорогу.
Решение. Здесь случайные величины X 1 , X 2 – время, затрачиваемое на
дорогу первым и вторым бухгалтерами, равномерно распределены на
отрезках [20, 25] и [20, 30] соответственно. Функции плотности вероятности
запишутся для них как
1
1
, x [20,25],
, x [20,30],
f1 ( x) 5
f 2 ( x) 10
0, x [20,25].
0, x [20,30].
Искомая вероятность для первого бухгалтера составит
22
1
P (20 X 1 22) f1 ( x) dx (22 20) 0, 4.
5
20
Для второго бухгалтера:
22
1
P(20 X 2 22) f 2 ( x)dx (22 20) 0,2.
10
20
Среднее время на дорогу для первого бухгалтера
20 25
20 30
MX1
22,5 мин. , для второго MX 2
25 мин.
2
2
Экспоненциальное (показательное) распределение
Непрерывная случайная величина Х, принимающая неотрицательные
значения, распределена по экспоненциальному закону с параметром λ 0
( X ~ E ( ) ), если ее плотность вероятности равна
e x , x 0
f ( x)
0, x 0.
Функция распределения определяется как
0, x 0,
x
F ( x) f (t )dt x t
t x
x
e dt e |0 1 e , x 0.
0
1 e x , x 0,
т. е. F ( x)
0, x 0.
Графики функций f(x) и F(x) изображены на рис. 3.4 и 3.5.
F(x)
f(x)
1
x
x
Рис. 3.4
Основные
распределения:
Рис. 3.5
числовые
характеристики
для
экспоненциального
ux
du dx
MX xf ( x)dx xe x dx
x
x
dv
e
dx
v
e
xe
x
e
x
1
dx e
x
1
.
Здесь
для
вычисления
xe
интеграла
λx
использовали
dx
формулу
интегрирования
по
частям,
а
при
нахождении
предела
lim xe x
x
x
1
lim x 0.
x
x
x e
x e
u x2
du 2 xdx
2
2
2 x
MX x f ( x )dx x e dx
x
x
dv
e
dx
v
e
использовали правило Лопиталя: lim xe x lim
2 x
x e
2 xe x dx
2
.
2
2
1
1
DX MX 2 ( MX ) 2 2 2 2 .
Практически
экспоненциальное
(показательное)
распределение
описывает распределение длительности жизни элемента сложной системы
или индивидуума, работающего в «режиме нормальной эксплуатации»
(задачи теории надежности, анализ коэффициентов смертности в демографии
и т. п.). Экспоненциально распределенную случайную величину можно
интерпретировать как промежуток времени между двумя последовательными
наступлениями событий в простейшем потоке событий. При этом параметр λ
экспоненциального распределения равен интенсивности потока. Прикладная
популярность экспоненциального закона объясняется не только
разнообразными
возможностями
его
естественной
физической
интерпретации, но и исключительной простотой и удобством его модельных
свойств (вида функции распределения и функции плотности вероятности, а
также основных числовых характеристик, которые однозначно определяются
значением параметра λ ).
Нормальное (гауссовское) распределение
Непрерывная случайная величина Х распределена по нормальному
закону с параметрами а и (краткое обозначение X ~ N (a, ) ), если ее
функция плотности вероятности имеет вид
( x a )2
1
f ( x)
e 2 2 , x .
(3.6)
2
Чтобы выяснить вероятностный смысл параметров а и , определим
основные числовые характеристики: математическое ожидание и дисперсию
нормальной случайной величины.
1
MX xf ( x)dx
2
1
=
2
(a 2 t )e
так как I1
xe
x a
t , x a 2 t ,
dx 2
=
dx 2 dt
( x a )2
2 2
a
2 dt
t 2
a
I1
2
2
e dt
t 2
t
te dt
2
I 2 a,
e dt – интеграл Пуассона, I 2
t 2
t
te dt 0 – интеграл в
2
симметричных пределах от нечетной функции.
Дисперсию определим как второй центральный момент:
( x a )2
1
2
2
2 2 2
DX M ( X MX ) ( x a ) f ( x)dx
( x a) e
dx
2
2
1
x a
t , x a 2 t , dx 2 dt
2 2t 2e t 2 dt
2
2
du dt 2
u t
2
2 t 2
t 2
t 2
2t e dt
(
te
|
e
dt ) 2 .
2
2
t
t
dv 2te dt v e
t 2
Здесь lim(te ) 0 , а
t
e
t 2
dt .
Таким образом, а и – параметры нормального закона –
интерпретируются, соответственно, как среднее значение и стандартное
отклонение данной случайной величины.
Функция распределения для нормального закона
X ~ N (a, )
определяется как
x
( t a )2
2
1
F ( x)
e 2 dt.
(3.7)
2
Графики функций f(x) и F(x) изображены на рис. 3.6 и на рис. 3.7.
f(x)
1
1
2
F(x)
0,5
a-
a a+
Рис. 3.6
x
a
Рис. 3.7
x
Кривая распределения для нормального закона симметрична
относительно параметра а – математического ожидания или центра
распределения. Очевидно значения моды и медианы здесь совпадают и
равны а, асимметрия и эксцесс также равны друг другу и равны нулю.
Во многих задачах, связанных с нормально распределенными
случайными величинами, приходится определять вероятность попадания
случайной величины Х, подчиненной нормальному закону с параметрами а,
, на участок от α до β
2
( xa )
1
P ( X ) F ( ) F ( )
e 2 2 dx.
(3.8)
2
Практическое вычисление интеграла по формуле (3.8) затруднительно,
здесь a (;) и (0;) . Для того, чтобы упростить расчет
X a
вероятностей (3.8), перейдем к новой случайной величине Y
.
Величина Y есть центрированная (вычитание а дает смещение центра
распределения в начало координат), нормированная (деление на –
нормирование) случайная величина, также распределенная по нормальному
закону с математическим ожиданием
X a 1
MY M
(MX a) 0
X a 1
и дисперсией DY D
2 DX 1 , т. е. Y ~ N (0,1) .
Условимся называть нормальный закон с параметрами а = 0 и 2 =1
стандартным, а его функцию плотности и функцию распределения
обозначать, соответственно, (x) и * ( x) и определять как
( x)
1 x22
e ,
2
(3.9)
x
2
1
t2
( x)
(3.10)
e dt.
2
Значения этих функций содержатся в специальных таблицах (см.
приложение 2). Графики их представлены на рис. 3.8 и 3.9.
*
Φ* (x)
(x)
1
2
1
0,5
–1
1
x
x
Возвращаясь к формуле (3.8), проведем центрирование и нормирование
xa
переменной, т. е. обозначим
y , тогда dx dy и
( a ) /
y2
a
a
2
P ( X )
e dy * (
) * (
).
(3.11)
2 ( a ) /
В различных руководствах по теории вероятностей и математической
статистике имеются таблицы значений не только функции распределения
стандартного распределения * ( x) , но и так называемой функции Лапласа
(приложение 3)
x
2
1
t2
( x)
e dt.
(3.12)
2 0
или удвоенной функции Лапласа
x
2
2
t2
0 ( x)
e dt.
(3.13)
2 0
Тогда вероятность того, что случайная величина X ~ N (a, ) примет
значения из интервала ( , ) (или промежутка [ , ] ), можно вычислять
также по формуле
a
a 1 a
a
P( X ) (
) (
) 0 (
) 0 (
) . (3.14)
2
Сведем в следующую таблицу свойства функций * ( x), ( x), 0 ( x).
1
( x)
2
*
x
e
x
2
t2
dt
() 0
*
2
1
t2
( x)
e
dt
2 0
() 0,5
() 0,5
0 () 1
* (0) 0,5
(0) 0
0 (0) 0
( x) ( x)
* ( x)
(x)
1
х
0 ( x) 0 ( x)
0 ( x)
0,5
-1 0
0 () 1
* () 1
* ( x ) 1 * ( x )
1
x
2
2
t2
0 ( x)
e
dt
2 0
х
х
-0,5
Пользуясь формулами (3.11) или (3.14), для случайной величины
X ~ N (a, ) , можно вычислить следующие вероятности:
P(a X a ) 0,683, P(a 2 X a 2 ) 0,955,
P(a 3 X a 3 ) 0,997.
Существует практическое правило «трех », которое позволяет во
многих приближенных вычислениях считать, что реализация какого-либо
числового значения нормальной случайной величины в пределах
( a 3 ,a 3 ) будет практически достоверным событием, а реализация
значений за пределами этого промежутка практически невозможна.
Нормальное распределение занимает центральное место в теории и
практике вероятностно-статистических исследованиях. В качестве
непрерывной аппроксимации к биномиальному распределению оно впервые
рассматривалось А.Муавром еще в 1733 году (см. ниже теорему МуавраЛапласа, п. 4.2.2). Некоторое время спустя нормальное распределение было
снова открыто и изучено независимо друг от друга К.Гауссом (1809 г.) и
П.Лапласом (1812 г.). Оба ученых пришли к нормальному закону в связи со
своей работой по теории ошибок наблюдений. Идея их объяснения
механизма формирования нормально распределенных случайных величин
заключается в следующем. Утверждается, что значения исследуемой
непрерывной случайной величины формируются под суммарным
воздействием очень большого числа независимых случайных факторов,
причем сила воздействия каждого отдельного фактора мала и не может
оказывать подавляющего действия на все остальные. Можно показать, что
функция плотности вероятности случайных величин подобного типа имеет
вид (3.6).
Во многих случайных величинах, связанных с измерениями в экономике,
технике, медицине, биологии и в других областях, естественно видеть
суммарный аддитивный эффект большого числа независимых причин.
Отсюда следует особая популярность нормального закона для описания
распределения разнообразных случайных величин. Например, нормальное
распределение используется в ситуациях, связанных с измерениями веса или
объема товаров, роста мужчин, проходящих медкомиссию, срока службы
электроламп и т.д. Теоретически значения нормальной случайной величины
находятся в интервале , . Однако на практике нормальное
распределение обычно используется для случайной величины, значения
которой расположены в ограниченном интервале (о чем говорит и правило
«трех »).
Пример 3.8. Производителю электроламп известно, что средний срок
работы лампы составляет 600 ч, а стандартное отклонение срока работы – 40
ч. Какова вероятность того, что срок работы:
1. менее 700 ч;
2. от 550 до 700 ч;
3. 2% ламп имеют минимальный срок работы. Какова его величина.
Решение. Будем считать, что случайная величина Χ – срок работы
электролампы – распределена по нормальному закону с параметрами
a 600ч, 40 ч. Для определения искомых вероятностей воспользуемся
формулой (3.14) и соответствующими значениями функции Лапласа из
приложения 3:
700 600
P X 700 P X 700
40
1.
2,5 0,5 0,4938 0,5 0,9938.
Иными словами, 99,38% ламп проработает 700 ч и меньше.
700 600
550 600
P 550 X 700
40
40
2.
2,5 1,25 0,4938 0,3944 0,8882,
т.е. 88,82% ламп будут работать от 550 до 700 ч.
1. Этот вопрос в задаче несколько отличается от остальных. Известно, что
P X x
0,02 или
min
x 600
P X xmin min
0,5 0,02 ,
40
x 600
min
0,48 ,
40
так как x x , то
600 xmin
0,48 .
40
В таблице значений функции Лапласа находим тот ее аргумент, при
котором она равна 0,48:
600 xmin
2,055 ,
40
отсюда xmin 600 40 2,055 600 82,2 517,8 ч. Таким образом, для 2%
ламп с минимальной продолжительностью работы срок работы составляет
517,8 ч.
В заключение этого параграфа отметим, что особая популярность
нормального закона объясняется не только его сравнительно простыми
математическими свойствами и большой практической применимостью, но и
тем, что даже в случае отклонения исследуемых экспериментальных данных
от нормального закона существуют, по крайней мере, два пути его
целесообразной эксплуатации.
1. Использовать его в качестве первого приближения; при этом нередко
оказывается, что подобное допущение даёт достаточно точные с точки
зрения конкретных целей исследования результаты.
2. Подобрать такое преобразование исследуемой случайной величины
Χ , которое видоизменяет исходный «ненормальный» закон распределения,
превращая его в нормальный. Так при описании распределения доходов
населения, банковских вкладов, месячной заработной платы и др.
используют не сами значения исследуемой величины, а их логарифмы. Такие
преобразованные
величины
будут,
как
правило,
нормально
распределенными, а распределение исходной величины называют
логарифмически нормальными или логнормальным. Приведем краткие
сведения об этом законе и пример его практического использования.
Случайная величина X , принимающая лишь положительные значения,
распределена по логарифмически нормальному закону, если ln X N a, .
Для x 0 событие, состоящее в том что X x , равносильно тому, что
ln X ln x , отсюда функция распределения случайной величины X
запишется как:
ln x
t ln a
2
1
2 2
F x P X x P ln X ln x
e
dt .
2
Дифференцируя этот интеграл по x , получим выражение функции
плотности вероятности:
f x
ln x ln a
1
2 x
e
2
2
2
.
Для логнормального закона:
2
MX ae 2 , DX a 2e e 1 ,
2
xmod ae ,
2
2
xmed a .
Если для нормально распределенной случайной величины параметр a
равен ее среднему значению, то для логарифмически нормально
распределенной величины этот параметр равен медиане.
Пример 3.9. Проведенное исследование показало, что вклады населения в
данном банке могут быть описаны случайной величиной X , для которой
ln X N a, , a 530, 0,8 .
Найти: 1) средний размер вклада; 2) долю вкладчиков, размер вклада
которых составляет не менее 1000 у.е.; 3) моду и медиану случайной
величины X и пояснить их смысл.
Решение. Здесь X – размер вклада является случайной величиной,
логарифмированные
значения которой распределены по нормальному
закону с заданными параметрами, т.е. ln X N 530;0,8 .
2
0,64
2
1) Средний размер вклада найдем как MX ae 530e 730 у.е.
2) Долю вкладчиков, размер вклада которых составляет не менее 1000
у.е., определим как вероятность
2
ln1000 ln530
P 1000 X
0,5 0,79 0,5 0,285 0,215
0,8
(при вычислении этой вероятности мы воспользовались формулой (3.14) и
соответствующим значением функции Лапласа из приложения 3).
3) Найдем моду и медиану случайной величины X :
2
xmod ae 530e 0.64 280 у.е., то есть наиболее часто встречающийся
банковский вклад равен 280 у.е.;
xmed a 530 у.е., т.е. половина вкладчиков имеют вклады до 530 у.е., а
другая – сверх 530 у.е.
Представим графически полученную информацию о случайной величине
X (рис. 3.10)
f(x)
P X 1000 0, 215
200
MX
xmed
xmod
400
600
800
1000
x
Рис. 3.10
Удобным для статистических приложений является также свойство
«самовоспроизводимости» нормального закона, заключающееся в том, что
сумма любого числа нормально распределённых случайных величин тоже
подчиняется нормальному закону распределения. Кроме того, нормальный
закон имеет большое теоретическое значение: с его помощью выведен целый
ряд других важных распределений, о которых пойдёт речь в следующем
разделе, построены различные статистические критерии и т. п. (см. п. 7.3).
Специальные распределения, встречающиеся в
задачах математической статистики
В этом разделе мы рассмотрим некоторые специальные распределения,
которые используются в задачах математической статистики при построении
разнообразных статистических критериев и интервальных оценок
параметров: 2 – распределение («хи-квадрат» – распределение), t –
распределение (распределение Стьюдента),
– распределение
F
(распределение Фишера). Эти распределения описывают поведение
некоторых функций от набора независимых и нормально распределенных
случайных величин. При изучении первой части нашего курса – основ теории
вероятностей, – этот параграф может быть пропущен. Сведения об этих
распределениях необходимы при изучении соответствующих разделов
математической статистики.
«Хи-квадрат» – распределение
Распределением «хи-квадрат» с числом степеней свободы, равным n,
называется распределение случайной величины вида
2 n X 12 X 22 X n2 ,
(3.15)
где X 1 , X 2 ,, X n – независимые случайные величины, распределенные по
нормальному стандартному закону, т.е. X i ~ N 0,1 , i 1, , n .
Функция распределения и функция плотности вероятности случайной
величины 2 n имеют довольно сложный вид, они однозначно
определяются параметром n – целым положительным числом, которое
принято называть числом степеней свободы. Практически, число степеней
свободы n – это число не связанных между собой величин X i , участвующих
в формировании величины 2 n . Если между величинами Χ i существуют
связи, то число степеней свободы будет уменьшаться на соответствующее
число единиц. Так при наличии одной связи вида
n
X i n X , число степеней
i 1
свободы будет равно n 1.
На рис. 3.11 приведены графики функций плотности
2 n –
распределения для различных значений n . При увеличении n 2 n –
распределение приближается к нормальному закону. Основные числовые
характеристики 2 n -распределения: 2 n n, D 2 n 2n . Квантили
2 n -распределения содержатся в специальных таблицах (см. приложение
4).
f 2 n x
n=1
n=3
n=5
n = 10
4
8
12
16
20
x
24
Рис. 3.11
Распределение Стьюдента (t - распределение)
Распределением Стьюдента (t – распределением) с п степенями свободы
называется распределение случайной величины
X0
,
(3.16)
t ( n)
X 12 ... X n2
n
где Χ 0 , Χ 1 ,, Χ n – независимые случайные величины, распределенные по
нормальному закону с MX i 0, DX i 2 , i 0,1,, n, т.е. X i ~ N 0, 2 . В
частности, если Χ i – независимые стандартные нормальные величины,
X0
Χ i ~ N 0,1 , i 0,1,, n , то t n
.
X 2 n
n
Английский статистик Госсет (псевдоним «Стьюдент») получил в 1908 г.
распределение для случайной величины (3.16), которое и названо его именем.
Он показал, что функция плотности вероятности величины (3.16) не зависит
от дисперсии 2 случайных величин Χ i , является унимодальной и
симметричной относительно x 0 . Её значения определяются числом
степеней свободы n и табулированы. Квантили t-распределения приведены в
специальных таблицах (см. приложение 5). При увеличении n распределение
Стьюдента приближается к нормальному закону. Основные числовые
n
(существует только
n2
при n 2 ). На рис. 3.12 приведены графики функций плотности t n распределения для различных значений n .
характеристики t -распределения: Mtn 0, Dt n
f t ( n ) ( x)
0,4
n =4
( x) для N (0,1)
n=1
-4
-3
-2
-1
1
2
3
4
x
Рис. 3.12
Распределение Фишера (F-распределение)
Распределением Фишера (F-распределением) с двумя числами степеней
свободы n1 и n 2 называется распределение случайной величины
1
Χ 12 Χ 22 Χ n21
n
,
(3.17)
F n1 , n2 1
1
2
2
2
Υ Υ 2 Υ n2
n2 1
где Χ 1 , , Χ n1 ,Υ1 , ,Υ n2 – независимые случайные величины, распределённые
по
нормальному
закону
с
MΧ i MΥ j 0 ,
DΧ i DΥ j σ 2
i 1,, n1 , j 1,, n2 , Χ i ~Ν 0 ,σ 2 , Υ j ~Ν 0 ,σ 2 .
Та же самая случайная величина может быть определена и как отношение
двух независимых и соответствующим образом нормированных χ 2 -
распределенных величин 2 n1 и 2 n2 , т. е.
1 2
n1
n1
.
F n1 , n2
1 2
n2
n2
Английский статик Р. Фишер в 1924 году показал, что плотность
вероятности случайной величины F n1 , n2 определяется только числом
степеней свободы числителя n1 и числом степеней свободы знаменателя n2 ;
она имеет довольно сложный вид и табулирована. В приложении 6
приведены 0,95-квантили F -распределения для разных значений n1 и n2 .
При увеличении n1 и n2 F -распределение приближается к нормальному
закону. Основные числовые характеристики F n1 , n2 -распределения:
n
MF n1, n2 2 (существует при n2 2 ),
n2 2
2n2 n1 n2 2
2
DF n1 , n2
(при n2 4 ).
2
n1 n2 2 n2 4
На рис. 3.13 приведены графики функций плотности F -распределения
для различных значений n2 при n1 10 .
f F ( n1 , n2 ) x
1
n1 10, n2 50
0,8
n1 10, n2 10
0,6
0,4
n1 10, n2 4
0,2
1
2
Рис. 3.12
3
4
x