Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
3. Простейшие числовые характеристики
одномерных случайных величин
Случайная величина, даже одномерная, может принимать много или даже бесконечно много числовых значений, и закон ее распределения вероятностей может задаваться бесконечным набором вероятностей или функцией с бесконечным числом значений. Однако в практических вопросах слишком большой объем информации, как правило, не нужен. Обычно решения принимаются на основании знания числовых значений некоторого конечного множества величин. Именно так мы поступаем в практической жизни, размышляя о какой-нибудь хозяйственной покупке. Цена, главные размеры, объем, вес, мощность могут служить примерами числовых величин, знание значений которых необходимо и достаточно для того, чтобы принять определенное решение. В теории вероятностей аналогичную роль играют разного рода числовые характеристики случайных величин.
Под простейшими числовыми характеристиками одномерной случайной величины обычно понимают математическое ожидание, дисперсию и среднее квадратическое отклонение.
Математическое ожидание (оно же среднее значение ) дискретной случайной величины вычисляется по формуле:
.
Если множество возможных значений величины бесконечное, то предполагается, что ряд сходится абсолютно. Другими словами, считается, что существует тогда и только тогда, когда существует математическое ожидание случайной величины (см. Комментарии)
Математическое ожидание непрерывной случайной величины находится по формуле:
.
Формальное выражение называют элементом вероятности. Для того чтобы от дискретного случая перейти к непрерывному случаю, достаточно вместо суммы написать интеграл, дискретные значения заменить непрерывными, а вероятности заменить элементом вероятности . В непрерывном случае предположение об абсолютной сходимости является излишним, потому что сходимость такого несобственного интеграла равносильна сходимости интегралов и . А сходимость интегралов от положительной и отрицательной частей подинтегральной функции эквивалентна абсолютной сходимости.
Легко представить себе две случайные величины с одним и тем же математическим ожиданием, но обладающие разными степенями случайности. Одна из величин может быть близка к постоянной величине, ее значения сосредоточены около математического ожидания. А значения другой величины широко разбросаны относительно того же математического ожидания. Для того чтобы сравнивать случайные величины, необходимо ввести характеристику разброса значений случайной величины относительно ее математического ожидания. В качестве такой стандартной меры разброса используется дисперсия. Дисперсия вычисляется по формулам:
для дискретной случайной величины,
для непрерывной случайной величины.
В некоторых случаях более удобной для вычислений оказывается формула: , в которой для дискретной величины, для непрерывной случайной величины. Докажем эту формулу для дискретной случайной величины.
.
Дисперсия имеет размерность квадрата случайной величины. Для того чтобы иметь характеристику разброса значений случайной величины той же самой размерности, что и сама величина, вводится среднее квадратическое отклонение .
Математическое ожидание случайной величины называют характеристикой расположения значений величины. Математическое ожидание может не существовать, если множество значений дискретной случайной величины бесконечно или случайная величина непрерывна (см. Дополнение). В этом случае заменить математическое ожидание могут другие характеристики расположения – медиана и мода . Эти характеристики, впрочем, могут играть существенную самостоятельную роль. Медиана – это такое значение, для которого справедливы равенства: . Другими словами, медиана является корнем уравнения , и обычно говорят, что медиана делит распределение вероятностей пополам. В дискретном случае функция распределения кусочно постоянна, уравнение не имеет корней или имеет бесконечно много корней, медиана не определена. Однако «медианное среднее» часто встречается в приложениях, поэтому существуют различные способы построения медианы дискретной случайной величины, основанные на приближенной замене кусочно постоянной функции непрерывной функцией.
Модой непрерывной случайной величины называется точка абсолютного максимума или точка локального максимума плотности распределения вероятностей: для всех значений случайной величины или для значений близких к значению . Мода может не существовать совсем, а может существовать несколько точек локального максимума, появляются многомодальные распределения. Для того чтобы избежать недоразумений, которые могут возникнуть в точках разрыва плотности распределения вероятностей, будем считать, что в такой точке принимается наибольшее из возможных предельных значений. В дискретном случае мода – это значение случайной величины, которое может приниматься с наибольшей вероятностью, наивероятнейшее значение. Приведем примеры вычисления простейших числовых характеристик.
ПРИМЕР 1. Закон распределения вероятностей одномерной дискретной случайной величины задан таблицей:
-2
1
3
4
0,1
0,3
0,2
Найти математическое ожидание, дисперсию, среднее квадратическое отклонение и моду (наивероятнейшее значение) случайной величины .
РЕШЕНИЕ. ,
,
.
и, очевидно, .
ПРИМЕР 2. Плотность распределения вероятностей непрерывной случайной величины задана формулами:
Вычислить математическое ожидание, дисперсию и среднее квадратическое отклонение случайной величины . Найти функцию распределения вероятностей , построить графики функций и , определить моду и медиану случайной величины . РЕШЕНИЕ.
,
,
, .
Функция распределения вероятностей случайной величины найдена в примере 3 пункта 2. Графики плотности и функции распределения вероятностей изображены на рисунке 7. Наибольшее значение функции достигается в точке , следовательно, . Для нахождения медианы надо решить уравнение . Значения функции распределения на этом интервале находятся по формуле . Рисунок 7 показывает, что корень этого уравнения принадлежит интервалу . Поэтому надо решить уравнение и выбрать тот корень уравнения, который принадлежит промежутку . Умножив обе части уравнения на число , получим: , , . Из двух полученных корней только корень принадлежит интервалу , следовательно, .
ПРИМЕР 3. Вычислить математическое ожидание, дисперсию и среднее квадратическое отклонение непрерывной случайной величины из примера 2 параграфа 2, определить моду и медиану.
РЕШЕНИЕ. В указанном примере плотность распределения задается формулами: . Поэтому верны равенства:
,
,
; .
Графики функций и изображены на рисунке 6. Наибольшее значение плотности достигается в точке , поэтому . Однако предельное значение плотности в точке является локально максимальным. Это дает основание считать распределение такой случайной величины двухмодальным. Медиана лежит на промежутке и является корнем уравнения . Получим: , , .
Комментарии. Перестановка конечного числа членов числового ряда не влияет ни на его сходимость, ни на его сумму. Если числовой ряд сходится абсолютно, то и перестановка бесконечного числа членов ни на что не влияет. А вот если ряд сходится условно, то есть существует предел частичных сумм , но ряд из абсолютных величин членов исходного ряда расходится, то можно так переставить бесконечное число членов ряда, что суммой этого ряда будет любое заданное число (теорема Римана). Числовые значения дискретной случайной величины и вероятности, с которыми они принимаются, являются объективными характеристиками этой величины и не могут быть изменены. А вот нумерация значений, то есть присвоение значению какого-либо номера, является субъективной операцией, зависящей от нашего произвола. Конечно, математическое ожидание от изменения нумерации зависеть не должно, и условно сходящиеся ряды приходится исключать.
Дополнения. Функция является плотностью распределения некоторой случайной величины. Действительно, , а несобственный интеграл сходится и равен единице:
.
Но эта случайная величина не имеет математического ожидания: . Интеграл расходится.
В то же время очевидно, что наибольшее значение функция принимает в точке . Функция четная, , график функции симметричен по отношению к оси ординат. Поэтому , мода и медиана существуют и совпадают.
6. Моменты случайных величин.
Корреляционный момент и коэффициент корреляции
Математическое ожидание и дисперсия одномерной случайной величины доставляют некоторую информацию о случайной величине. Но для решения многих теоретических и практических задач такой информации недостаточно. Поэтому вводятся дополнительные числовые характеристики, которые называются моментами случайных величин.
Как и раньше, в дальнейшем при обосновании ряда утверждений будут ради простоты использоваться дискретные случайные величины.
Числовая характеристика называется начальным моментом -го порядка одномерной случайной величины . Случайная величина называется центрированной. Центральным моментом порядка называется числовая характеристика . Математическое ожидание совпадает с начальным моментом первого порядка: . Математическое ожидание центрированной случайной величины равно нулю, а второй центральный момент совпадает с дисперсией величины:
;
.
По этой причине моменты одномерной случайной величины можно рассматривать как обобщения математического ожидания и дисперсии.
Ещё более существенную роль моменты играют в многомерном случае. Если – многомерная случайная величина, то указатель ее начального или центрального момента задается упорядоченным набором целых неотрицательных чисел . Такой набор называют мультииндексом порядка . Начальными и центральными моментами типа называется числовые величины
и .
Если все индексы в указателе типа момента, кроме одного индекса , равны нулю, то возникает момент -ой компоненты порядка , начальный или аналогичный центральный. Самым простым центральным моментом, который не совпадает с каким-либо моментом одномерной компоненты, является момент, в показателе которого стоят две единицы и нули. В этом случае вместо многомерной случайной величины достаточно рассматривать двухкомпонентную систему случайных величин , то есть величину .
Корреляционным моментом случайных величин и называется центральный момент типа . Корреляционной момент является простейшей числовой характеристикой, которая учитывает связь между случайными величинами. Иногда для этого центрального момента используется другое название – ковариация и обозначение . Моменты определяются как математические ожидания функций случайных величин, поэтому они могут вычисляться по формулам для математического ожидания функции случайных величин.
В частности, корреляционный момент для дискретной и непрерывной случайной величины находится по формулам:
,
.
Часто удобно применять равенство (см. Дополнение), в котором начальный момент находится по формулам: и для дискретных и непрерывных случайных величин соответственно.
Для того чтобы получить простейшую безразмерную характеристику связи между случайными величинами, делят корреляционный момент на произведение средних квадратических отклонений. В результате получают коэффициент корреляции: .
Случайные величины называются некоррелированными, если их корреляционный момент равен нулю:.
ПРИМЕР.1. Закон распределения вероятностей двумерной дискретной случайной величины задан таблицей:
Восстановить законы распределения вероятностей составляющих величин, найти . Вычислить начальный момент . Определить корреляционный момент и коэффициент корреляции.
РЕШЕНИЕ. Складывая вероятности таблицы по столбцам и, соответственно, по строкам, получим таблицы распределения вероятностей составляющих случайных величин и
–1
1
2
0,2
0,3
0,4
0,1
Найдем числовые характеристики составляющих величин:
;
,
; .
; ,
; .
Вычислим значение начального момента . Для нахождения математического ожидания функции дискретной двумерной случайной величины надо вычислить сумму значений этой функции в точках , умноженных на вероятности . Условимся в процессе вычисления слагаемых такой суммы перемещаться по клеткам таблицы распределения слева направо и сверху вниз:
.
Отметим, что в результате вычислений многие из клеток таблицы не внесли никакого вклада в окончательную сумму, потому что нулевым оказалось значение вероятности или значение одномерной случайной компоненты. Ниже для сокращения записи это обстоятельство будет учтено.
Определим корреляционный момент и коэффициент корреляции:
; ;
.
В прикладных исследованиях в качестве дополнительных числовых характеристик одномерной случайной величины используют нормированные моменты третьего и четвертого порядка. Коэффициент асимметрии служит мерой несимметричности распределения случайной величины относительно ее математического ожидания . У симметричных в этом смысле случайных величин все центральные моменты нечетного порядка равны нулю. Коэффициент эксцесса – это показатель кривизны графика плотности распределения одномодальной непрерывной случайной величины в точке с абсциссой . Как и коэффициент асимметрии, коэффициент эксцесса применяют для сравнения случайной величины с нормальной случайной величиной (пункт II.10). У нормальной случайной величины оба коэффициента равны нулю.
В заключение отметим, что если у случайной величины существуют все ее моменты, то закон распределения определяется ими однозначно, аналогично тому, как аналитическая функция определяется однозначно коэффициентами своего ряда Тейлора. Однако, как уже было показано, случайная величина может не иметь даже математического ожидания.
Дополнения. Докажем равенство .
.
ПРИМЕР 2. Вычислить корреляционный момент и коэффициент корреляции двумерной непрерывной случайной величины из примера 2 пункта II.4.
РЕШЕНИЕ. Как было показано в пункте II.4 плотности распределения вероятностей компонент и задаются формулами:
, .
Вычислим числовые характеристики компонент:
;
;
; .
;
;
; .
Определим корреляционный момент и коэффициент корреляции:
;
;
.
7. Зависимость и независимость случайных величин
Важные понятия зависимости и независимости случайных величин можно ввести на основании следующих соображений. С любой - мерной случайной величиной связана совокупность случайных событий, каждое из которых заключается в том, что случайная величина попадает в некоторое подмножество множества своих возможных значений, или, что равносильно, в некоторое подмножество объемлющего пространства . Случайные события независимы, если вероятность их произведения равна произведению вероятностей. Естественно называть случайные величины независимыми, если независимы любые два события, одно из которых связано с первой случайной величиной, а другое – со второй. Другими словами, случайные величины и называются независимыми, если для любых измеримых относительно соответствующих вероятностных мер событий и , вероятность произведения событий и равна произведению их вероятностей: .
Из этого определения вытекают все известные способы проверки независимости по заданному в какой-либо форме совместному закону распределения вероятностей случайных величин и , то есть по закону распределения величины . Для совместной функции распределения вероятностей получается равенство:
.
И, наоборот, из этого равенства следует независимость случайных величин и . Случайные величины и независимы тогда и только тогда, когда их совместная функция распределения вероятностей представляется в виде произведения функций распределения этих величин. Для непрерывной случайной величины плотность распределения получается из функции распределения с помощью операции дифференцирования: , поэтому непрерывные случайные величины и независимы тогда и только тогда, когда их совместная плотность распределения вероятностей раскладывается в произведение плотностей распределения составляющих величии: .
В наиболее простом частном случае, для одномерных случайных величин , условия независимости принимают вид:
.
Для независимых непрерывных величин: .
Для дискретных случайных величин и условия независимости принимают вид: , .
Отметим, что, вообще говоря, нельзя по законам распределения вероятностей составляющих величин и найти закон распределения величины . Но если эти величины независимы, то сделать это нетрудно, применив полученные выше формулы.
8. Свойства числовых характеристик
Для того чтобы найти числовые характеристики функции случайных величин, надо использовать совместный закон распределения вероятностей. Но иногда для определения основных числовых характеристик функции случайных величин достаточно знать только некоторые моменты невысокого порядка. Тогда говорят о свойствах числовых характеристик.
Свойства математического ожидания.
1). Математическое ожидание постоянной величины равно самой этой постоянной величине. Постоянную величину (константу) можно рассматривать как частный вид случайной величины, принимающей единственное возможное значение с вероятностью, равной единице: . Конечно, в этом случае верно равенство: .
2). Числовой множитель можно выносить за знак математического ожидания: .
3). Математическое ожидание суммы случайных величин и равно сумме математических ожиданий этих случайных величин:
Свойства 2), 3) означают, что математическое ожидание является линейной функцией случайных величин. Объединив 2), 3), получим равенство: .
С помощью свойств 1), 3) легко показать, что математическое ожидание центрированной случайной величины равно нулю:
.
4). Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий:
Из этого свойства математического ожидания, в частности, вытекает, что независимые случайные величины не коррелированы:
.
5). В общем случае верна формула: , которая является следствием равенства: .
Свойства дисперсии.
1). Дисперсия неотрицательна и равна нулю тогда и только тогда, когда случайная величина постоянна: и тогда и только тогда, когда . Действительно: . Все слагаемые этой суммы неотрицательны, поэтому сумма тоже неотрицательна. А равна она нулю только тогда, когда все значения равны одному и тому же числу . Это значит, что .
2). За знак дисперсии можно выносить не сам множитель, а квадрат этого множителя: . В самом деле:
.
3). Дисперсия суммы двух случайных величин равна сумме дисперсий этих величин плюс удвоенный корреляционный момент этих величин:
.
Справедливы равенства:
. Поэтому:
.
4). Из 3) следует, что дисперсия суммы некоррелированных случайных величин равна сумме дисперсий этих случайных величин. Независимые случайные величины не коррелированы, и, конечно, дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин.
Свойства корреляционного момента.
1). Справедливо равенство: , корреляционный момент симметричен по аргументам.
2). . То есть справедливо равенство: , которое означает, что корреляционный момент линеен по первому аргументу. Так же показывается, что корреляционный момент линеен по второму аргументу: . Отметим, что аналогичными свойствами обладает скалярное произведение векторов-стрелок: .
Свойства коэффициента корреляции.
1). Модуль коэффициента корреляции не превосходит единицы: или, что то же: .
2). Коэффициент корреляции равен или тогда и только тогда, когда случайная величина является линейной функцией случайной величины , другими словами, когда верно равенство: .
ПРИМЕР 1. Заданы случайные величины и . Известно, что: . Найти математическое ожидание и дисперсию случайной величины .
РЕШЕНИЕ.
.
.
Дополнения. Докажем свойства 3, 4, 1, 2.
3).
.
4).
.
1). Для доказательства положим . Дисперсия любой случайной величины обладает свойством 3) и неотрицательна. Поэтому:
,
и . Следовательно, верны неравенства: , . Если , то . А если , то , так что всегда.
При выводе двойного неравенства молчаливо предполагалось, что средние квадратические отклонения и положительны, то есть случайные величины и не постоянны. Но если одна из величин, например, , постоянна, то величины независимы. В этом случае , но и коэффициент корреляции не определен.
2). Если , то верны равенства: , , , .
Поэтому: . Если , то и . Если , то и .
Наоборот, если , то справедливо равенство: . А если , то справедливо равенство: . Следовательно: или , ; или , .