Прикладная теория вероятностей
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ПРИКЛАДНАЯ ТЕОРИЯ
ВЕРОЯТНОСТЕЙ
Фаттахова
Мария Владимировна
[email protected]
Доцент, к.ф.-м.н.,
доцент кафедры № 43
1
Контрольные мероприятия по
курсу ПТВ
Контрольная работа (два контрольных задания).
Лабораторные работы № 1, 2, 3.
Экзамен: 25.01.2021
Z6431 – в 11:00
Z6432K – в 15:00
Консультация перед экзаменом:
23.01.2021 в 15:00
2
Оценивание контрольной
работы
Контрольная работа (два контрольных задания) – 60 баллов:
Задание 1: 4 задачи ×10 баллов = 40 баллов
Задание 2: 20 баллов
Оценки за контрольную работу:
«отлично»: 51 – 60 баллов
«хорошо»: 42 – 50 баллов
«удовлетворительно»: 33 – 41 балл
«неудовлетворительно»: менее 33 баллов.
3
ЛЕКЦИЯ 1.
ВВЕДЕНИЕ
4
Прикладная теория вероятностей
Теория вероятностей
Математическая статистика
Корреляционный и регрессионный анализы
Анализ временных рядов
Принятие решений в условиях
неопределенности и риска
Теория случайных процессов и массового
обслуживания
…
5
Элементы математической
статистики
Основные понятия математической
статистики
Выборочный метод математической
статистики
Статистическая зависимость между
случайными величинами
Элементы проверки статистических гипотез
6
Основные понятия
математической статистики
Статистические данные – это сведения об
объектах и явлениях окружающей среды, их
параметрах, свойствах и состоянии, полученные в
результате наблюдений или эксперимента.
Математическая статистика – это раздел
математики, в котором разрабатываются методы
получения выводов о массовых явлениях и
процессах на основе анализа статистических
данных.
7
Выборочный метод
математической статистики
Генеральная совокупность – это совокупность
всех возможных значений, которые принимает
изучаемая случайная величина.
Выборка – отобранные случайным образом
объекты генеральной совокупности.
8
Пример статистического
исследования
Цель: оценить уровень знаний по математике
учащихся 9-х классов в одном из российских городов.
Общее количество девятиклассников: 710 чел.
Выборка: 50 чел.
Случайная величина: ξ – количество верно решённых
девятиклассником задач (из 6)
Результаты: 4, 2, 0, 6, 2, 3, 4, 3, 3, 0, 1, 5, 2, 6, 4, 3,
3, 2, 3, 1, 3, 3, 2, 6, 2, 2, 4, 3, 3, 6, 4, 2, 0, 3, 3, 5, 2, 1,
4, 4, 3, 4, 5, 3, 2, 3, 1, 6, 2, 2.
9
Пример статистического
исследования
Столбчатая диаграмма
16
14
Частота
12
10
8
6
4
2
1
2
3
4
5
Число решённых задач
6
10
Пример статистического
исследования
Столбчатая диаграмма
16
14
Частота
12
10
8
6
4
2
1
2
3
4
5
Число решённых задач
6
11
Пример статистического
исследования
Полигон
x E
16
14
!
12
10
8
Полигон
6
4
2
1
2
3
4
5
6
7
x (0 3 1 4 2 12 3 15 4 8 5 3 6 5) : 50 150 : 50 3
12
Оценки выборочных
характеристик
Оценкой параметра 𝜃 называют всякую
функцию результатов наблюдений за случайной
величиной, с помощью которой судят о значении
параметра:
ˆn f ( x1 , x2 ,..., xn )
Оценка параметра является случайной
величиной, зависящей от закона распределения
случайной величины и объем выборки.
Различают точечные и интервальные оценки
параметров.
13
Требования к оценкам
параметров
Свойства точечных оценок параметров:
Несмещенность
Состоятельность
Эффективность
14
Несмещённость
Оценка 𝜃𝑛 параметра 𝜃 называется несмещённой,
если ее математическое ожидание равно
оцениваемому параметру, т.е.
𝐸 𝜃𝑛 = 𝜃
В противном случае оценка называется смещённой.
15
Состоятельность
Оценка 𝜃𝑛 параметра 𝜃 называется состоятельной,
если она удовлетворяет закону больших чисел, т.е.
вероятность того, что оценка параметра сходится к
неизвестному параметру равна 1:
lim 𝑃 𝜃𝑛 − 𝜃 < 𝜀 = 1
𝑛→∞
16
Эффективность
Оценка 𝜃𝑛 параметра 𝜃 называется эффективной,
если она имеет наименьшую дисперсию по сравнению с
дисперсиями любых других оценок этого параметра, т.е.
𝑉 𝜃𝑛
эфф
= min 𝑉 𝜃𝑛
𝑟
𝑟=1,…,𝑘
17
Выборочные характеристики
случайных величин
Выборочное среднее (оценка
математического ожидания)
1 n
E[ ] ~ x xi
n i 1
Выборочная дисперсия (оценка
дисперсии)
n
1
2
2
V [ ] ~ S x
xi x
n 1 i 1
18
Выборочные характеристики
случайных величин
Выборочное среднее
квадратическое отклонение
(СКО)
(оценка теоретического СКО)
n
1
2
2
~ Sx Sx
xi x
n 1 i 1
19
Выборочные характеристики
случайных величин
Относительная частота –
оценка неизвестной
вероятности события А
относительная частота появления события А в n
независимых испытаниях
𝑝∗
=
𝑛𝐴
𝑛
Можно построить оценки функций плотности и распределения,
моментов различных порядков и других параметров
распределений
20
Интервальное оценивание
параметров
Пусть 𝛼 некоторая достаточно большая
вероятность, а 𝜃 − неизвестный параметр.
Интервал (𝜃1 , 𝜃2 ) со случайными границами, для
которого выполняется следующее равенство:
P1 2
называется доверительным интервалом, а
вероятность 𝛼 − доверительной вероятностью.
1
2
В качестве выбирают 0,9; 0,95; 0,997.
21
Зависимость случайных величин
Стохастическая (случайная, статистическая)
связь – это такая зависимость, при которой
изменение одной из величин приводит к изменению
закона распределения другой или, по крайней мере,
его параметров.
22
Корреляционная зависимость
Корреляционной зависимостью между двумя
случайными величинами называется статистическая
зависимость, при которой каждому значению одной
из
переменных
соответствует
условное
математическое ожидание другой:
𝐸 𝜉2 /𝜉1 = 𝑥𝑖 = 𝜑(𝑥) ≠ 𝑐𝑜𝑛𝑠𝑡
или
𝐸 𝜉1 /𝜉2 = 𝑦𝑗 = 𝜔 𝑦 ≠ 𝑐𝑜𝑛𝑠𝑡 .
Эти
уравнения
регрессии.
называются
уравнениями
23
Корреляционный момент
Корреляционный момент (ковариация) призван
измерять тесноту корреляционной зависимости
между переменными и их рассеяние вокруг центра
двумерного распределения – точки 𝐸1 , 𝐸2 :
𝑉ξ1ξ2 = 𝐸[ ξ1 − 𝐸 ξ1
ξ2 − 𝐸 ξ2 ]
Выборочный момент корреляции:
1 n
Cov X , Y xi x yi y
n i 1
24
Выборочный коэффициент
корреляции
Коэффициентом корреляции двух случайных
величин называется отношение их момента корреляции
к произведению средних квадратических отклонений
𝜌ξ1ξ2
𝑉ξ1ξ2
=
𝜎ξ1 𝜎ξ2
Выборочный коэффициент корреляции
rXY
Cov( X , Y )
SxS y
1 n
xi x yi y
n i 1
1 n
1 n
2
2
x
x
y
y
i
i
n i 1
n i 1
25
Свойства выборочного
коэффициента корреляции
1. −1 ≤ 𝑟𝑋𝑌 ≤ 1.
2.
Если между переменными существует сильная прямая
линейная связь, то значение 𝑟𝑋𝑌 будет близко к +1.
3.
Если между переменными существует сильная обратная
линейная связь, то значение 𝑟𝑋𝑌 будет близко к –1.
4.
Когда между переменными нет линейной связи или она
очень слабая, значение 𝑟𝑋𝑌 будет близко к 0.
26
Интерпретация выборочного
коэффициента корреляции
Значение
Уровень линейной связи между переменными
от 0.75 до 1.00
Очень высокая прямая зависимость
от 0.50 до 0.74
Высокая прямая зависимость
от 0.25 до 0.49
Средняя прямая зависимость
от 0.00 до 0.24
Слабая прямая зависимость
от -0.24 до 0.00
Слабая обратная зависимость
от -0.49 до -0.25
Средняя обратная зависимость
от -0.74 до -0.50
Высокая обратная зависимость
от -1.00 до -0.75
Очень высокая обратная зависимость
27
Теснота линейной зависимости
между случайными величинами
X
Y
𝑥1
𝑦1
𝑥2
𝑦2
⋮
⋮
𝑥𝑛
𝑦𝑛
28
Статистические гипотезы
Статистической гипотезой называется любое
предположение о свойствах и характеристиках
исследуемых генеральных совокупностей, которое
может быть проверено на основе анализа выборок.
Гипотезы можно формулировать:
о виде распределения,
о параметрах распределения,
о независимости двух выборок,
о случайности выборки,
…
29
Основная и альтернативная
гипотезы
Проверяемая гипотеза в статистике называется
основной (или нулевой) гипотезой. Основная гипотеза
𝐻0 подлежит проверке, по результатам которой ее
можно принять либо отклонить, то есть принять
альтернативную гипотезу 𝐻1 .
Правило, согласно которому проводят проверку
основной гипотезы, называют статистическим
критерием проверки гипотезы.
30
Статистический критерий
Статистический критерий НЕ отвечает на вопрос,
верна или нет проверяемая гипотеза. Он
помогает ответить на вопрос, противоречат или
не противоречат выдвинутой гипотезе
выборочные данные, можно ли принять или
следует отвергнуть данную гипотезу.
!
31
Ошибки первого и второго рода
Гипотеза
Н0
Решение
Гипотеза Н0
ПРИНИМАЕТСЯ
ВЕРНА
Вероятность
𝛼
Примечание
Доверительная
вероятность
Гипотеза Н0
ОТКЛОНЯЕТСЯ,
принимается Н1
1– 𝛼
Уровень значимости
(вероятность ошибки I
рода)
Гипотеза Н0
ПРИНИМАЕТСЯ
𝛽
Вероятность ошибки II
рода
НЕВЕРНА Гипотеза Н0
ОТКЛОНЯЕТСЯ,
принимается Н1
1– 𝛽
Мощность критерия
32
Примеры ошибок 1-го и 2-го рода
В радиолокации:
𝐻0 – Сигнал тревоги.
Ошибка I рода: пропуск сигнала;
Ошибка II рода: ложная тревога.
В судебной системе:
𝐻0 – подсудимый виновен
Ошибка I рода: оправдание виновного;
Ошибка II рода: осуждение невиновного.
33
Этапы проверки статистических
гипотез
Формулируем основную и альтернативную гипотезы
Задаем уровень значимости
Выбираем статистику – критерий проверки гипотезы
Определяем критическую область
Вычисляем значение статистики по выборке
Сравниваем критическое значение с границами критической
области
Делаем вывод
34
Критическая область
Критические значения
Критическая область
Критическая область
Область принятия
основной гипотезы
Возможные
значения
статистики
35
Правило проверки основной
гипотезы
Если значение статистики попало в область
принятия гипотезы, то гипотеза 𝐻0
ПРИНИМАЕТСЯ
Если значение статистики попало в критическую
область, то гипотеза 𝐻0 ОТКЛОНЯЕТСЯ и
принимается альтернативная гипотеза 𝐻1
36
Построение критической
области
Н 0 : 0
П
K
H1 : 0
K
K1
K2
П
H1 : 0
Двусторонняя
область
K
Правосторонняя
область
K2
H1 : 0
П
K
Левосторонняя
область
K1
Значения 𝑘1 и 𝑘2 называются критическими значениями или
границами критической области.
37