Выбери формат для чтения
Загружаем конспект в формате pptx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Теоретические распределения случайных величин
Зачем? Теоретические распределения часто (но не всегда, а только если удастся обосновать
возможность их использования) позволяют генерировать последовательности данных,
обладающих примерно теми же свойствами, что и факторы, имеющие место в
действительности.
В каких задачах это требуется? Основной потребитель – задачи принятия решений
«на будущее»: если создается проект нового объекта или если принимается решение на
предстоящий период времени, то для обоснования решений нужно поместить модель
решаемой задачи в виртуальную среду, имитирующую реальность (в том числе имитирующую
случайные факторы – например: аварии оборудования, колебания качества сырья, изменения условий эксплуатации,
качество технического обслуживания, периодичность ремонтов… )
Какие задачи должны быть решены?
(тема лекции)
1. Нужно иметь библиотеку теоретических распределений, для которых известен опыт их
успешного использования и область задач, для которых они полезны, и уметь выбрать
подходящее (соответствующее имеющимся экспериментальным данным).
2. Если подобрать теоретическое распределение не удается – уметь построить «своё»
теоретическое распределение по экспериментальным данным.
3. Нужно обладать аппаратом, позволяющим генерировать случайные величины,
подчиняющиеся выбранному или сконструированному самостоятельно теоретическому распределению.
4. Нужно доказать, что подмена реальности теоретическим распределением корректна.
Библиотека теоретических распределений случайных величин
Непрерывные распределения
(т.е. распределения величин,
принимающих непрерывные
(не квантованные) значения)
Дискретные распределения (т.е.
распределения величин,
принимающих значения,
квантованные по уровню сигнала)
Непрерывные распределения (формулы, статистические характеристики, область применения)
1. Нормальное распределение (иначе - распределение Гаусса)
2. Логарифмическое нормальное распределение
(сокращенно – логнормальное распределение)
(входят в группу
нормальных
распределений)
3. Распределение 2
4. Распределение Стьюдента (иначе – t-распределение)
5. Распределение Фишера (иначе – f-распределение)
6. Экспоненциальное распределение
(входят в группу
7. Распределение Вейбулла - Гнеденко.
гаммараспределений)
8. Равномерное распределение
Имеется большое число
других распределений –
Коши, Парето, Колмогорова,
гамма- распределение…
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат)
Выше мы рассмотрели вопрос о качестве оценки математического ожидания (по величине
выборочной средней). В частности, мы показали, что среднее квадратическое отклонение
оценки математического ожидания от его истинного значения в n раз меньше, чем
среднее квадратическое отклонение данных.
Естественно задать себе тот же вопрос - о качестве оценки дисперсии по величине
выборочной дисперсии
1 n
1 n
2
dx (n)
·[ X i mx (n)] , mx (n) · X i
n 1 i 1
n i 1
(количество данных)
(элемент ряда наблюдений)
(выборочное среднее)
Предварительные замечания: важное понятие «Число степеней свободы»
Определение: число степеней свободы у какого-либо параметра определяют числом
опытов, по которым рассчитывают данный параметр, минус количество констант,
найденных по этим опытам независимо друг от друга
Пример: пусть имеются n экспериментальных данных, по которым мы рассчитали выборочную среднюю и
выборочную дисперсию. Поскольку вычисление выборочной дисперсии зависит от вычисления выборочной
средней, число независимых констант в этом случае равно 1. Число степеней свободы = n 1.
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат)
Рассмотрим закон распределения суммы квадратов независимых центрированных
случайных значений, одинаково распределенных (т.е. принадлежащих одной и той же генеральной
совокупности) по нормальному закону, среднее квадратическое отклонение которых равно 1
(используется общепринятое обозначение нормального закона, в скобках указывается математическое ожидание и
среднее квадратическое отклонение, в данном случае N(0,1)
X = X12 + X22+…+ Xn+12
(центрирование)
Мы видим, что эта формула соответствует формуле для
выборочной дисперсии; число степеней свободы для нее, как мы
видели выше, равно n (т.к. на этих же данных была рассчитана оценка
математического ожидания, «отнявшая» одну степень свободы )
1 s
dx (s)
·[ X i mx (s)]2
s 1 i 1
Определение: 2-распределение с n степенями свободы – это распределение суммы
квадратов n независимых стандартных нормальных величин, т.е. имеющих
распределение N(0,1)
Плотность
распределения
вероятностей
(найдена К. Пирсоном):
1 n/2
n
x
( )
1
f ( x) 2 ·x 2 ·e 2
n
( )
2
Здесь
(a) z a 1·e z dz
(гамма-функция; одна из специальных функций,
т.е. не входящих в число элементарных)
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат), продолжение
Плотность 2распределения
вероятностей
(найдена К. Пирсоном):
1 n/2
n
x
( )
1
f ( x) 2 ·x 2 ·e 2
n
( )
2
Здесь
(a) z a 1·e z dz
(гамма-функция; одна из специальных функций,
т.е. не входящих в число элементарных)
Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны)
При малом числе
степеней свободы
2- распределение
существенно
отличается от
нормального
При малом числе степеней свободы
распределение резко асимметрично;
при увеличении числа степеней
свободы распределение становится
всё более симметричным.
При увеличении числа
степеней свободы
2- распределение
приближается к
нормальному (при больших
n практически не отличается от
нормального)
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат), продолжение
Плотность 2распределения
вероятностей
(найдена К. Пирсоном):
1 n/2
n
x
( )
1
f ( x) 2 ·x 2 ·e 2
n
( )
2
Здесь
(a) z a 1·e z dz
(гамма-функция; одна из специальных функций,
т.е. не входящих в число элементарных)
Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны)
Функция 2распределения
вероятностей:
n x
( , )
F ( x) 2 2
n
( )
2
x
Здесь
(неполная гамма-функция; одна из специальных
функций, т.е. не входящих в число элементарных)
На рисунке также видно,
что при увеличении
числа степеней свободы
2- распределение
приближается к
нормальному (при больших
n практически не отличается от
нормального)
(a, x) z a 1·e z dz
Пример ЭД, распределенных по хи-квадрат;
степень свободы = 4, резкая асимметрия
относительно математического ожидания
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат), продолжение
1 n/2
n
x
( )
1
f ( x) 2 ·x 2 ·e 2
n
( )
2
Плотность 2распределения
вероятностей
(найдена К. Пирсоном):
Здесь
(a) z a 1·e z dz
(гамма-функция; одна из специальных функций,
т.е. не входящих в число элементарных)
Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны)
x
Здесь
(a, x) z a 1·e z dz
(неполная гамма-функция; одна из специальных
функций, т.е. не входящих в число элементарных)
Точечные статистические характеристики (n – число степеней свободы):
1. Математическое ожидание = n
2. Дисперсия = 2·n
3. Медиана n
2
3
4. Мода = n – 2, определяется при n > 2
8
5. Коэффициент асимметрии =
n
6. Коэффициент эксцесса =
12
n
(уменьшаются с ростом n, по мере
приближения к нормальному закону)
n x
( , )
F ( x) 2 2
n
( )
2
Функция 2распределения
вероятностей:
Непрерывные распределения, продолжение
Распределение 2 (хи-квадрат), окончание
Плотность 2распределения
вероятностей
(найдена К. Пирсоном):
1 n/2
n
x
( )
1
f ( x) 2 ·x 2 ·e 2
n
( )
2
Здесь
(a) z a 1·e z dz
(гамма-функция; одна из специальных функций,
т.е. не входящих в число элементарных)
Важное свойство распределения 2
Распределение устойчиво относительно суммирования, т.е. если X1 и X2 независимы и
если X1 принадлежит распределению 2 , рассчитанному для степени свободы n1, а X2
принадлежит распределению 2 , рассчитанному для степени свободы n2, то сумма X1+X2
тоже принадлежит распределению 2 , рассчитанному для степеней свободы n1+n2.
(дисперсия суммы X1+X2 будет больше, чем дисперсия каждого слагаемого)
Пример прикладной задачи, для решения которой можно использовать распределение 2
Пример прикладной задачи, для которой может быть использовано распределение
хи-квадрат: Пусть фирма выпустила новый процессор. Предположим, что каждый год
цена процессора падает на случайную величину, распределенную нормально со средним
значением 10%. Тогда количество процессоров, которые можно купить на фиксированную
сумму, может быть описано с помощью распределения 2 .