Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Тема 5. Принятие решений в
условиях неопределённости и риска
Лекция 13
2
Пример. Проблема студента Василия
Василий – прилежный студент, который обычно получает хорошие
отметки благодаря, в частности тому, что имеет возможность повторить
материал в ночь перед экзаменом. Перед завтрашним экзаменом Василий
столкнулся с проблемой. Его сокурсники организовали на всю ночь
вечеринку, в которой он хочет поучаствовать. У Василия три альтернативы:
участвовать в вечеринке всю ночь; половину ночи участвовать, а половину
учиться; учиться всю ночь (а1, а2, а3).
Профессор, принимающий завтрашний экзамен, непредсказуем, и
экзамен может оказаться лёгким, средним или трудным (s1, s2, s3). В
зависимости от сложности экзамена и времени, затраченного Василием на
повторение, можно ожидать следующие баллы:
3
Какой выбор следует сделать Василию?
Пример. Проблема студента Василия
Альтернативы:
а1 – участвовать в
вечеринке всю ночь,
а2 – половину ночи
участвовать в вечеринке,
а половину - учиться,
а3 – учиться всю ночь.
4
Экзамен: s1 – лёгкий,
s2 – средний,
s3 – трудный.
Экзаменационные баллы
(из 100 возможных):
Задачи принятия решений в
условиях неопределённости (УН)
– это задачи принятия решений, в которых влияние
внешней среды учитывается, но вероятность реализации
ее состояний неизвестна и не может быть оценена.
Решения ЛПР
5
Состояния среды
s1
s2
…
sn
d1
d2
h(d1,s1)
h(d1,s2)
…
h(d1,sn)
h(d2,s1)
h(d2,s2)
…
h(d2,sn)
…
…
h(dm,s1)
…
h(dm,s2)
…
…
…
h(dm,sn)
dm
Принятие решений в условиях
неопределенности
d – возможное решение
s – состояние внешнего фактора
ℎ(𝑑, 𝑠) – полезность решения 𝑑 при условии, что
реализовалось состояние внешнего фактора 𝑠.
max h(d , s )
d
6
Критерий «осторожного
наблюдателя» (Критерий Вальда)
Предположение. Среда всегда наихудшим образом
влияет на исход любого решения.
max min h(d , s ) min h(d 0 , s )
d
s
s
d 0 – стратегия осторожного наблюдателя.
(Максиминная стратегия)
7
Исходные данные в задаче принятия
решений в УН
Решения
ЛПР
8
Состояния среды
min h(d , s)
s1
s2
…
sn
d1
d2
h(d1,s1)
h(d1,s2)
…
h(d1,sn)
h(d1 , s j1 )
h(d2,s1)
h(d2,s2)
…
h(d2,sn)
h(d 2 , s j2 )
…
…
…
…
…
…
dm
h(dm,s1)
h(dm,s2)
…
h(dm,sn)
d 0 : max min h(di , s j )
di
sj
s
h(d m , s jm )
Пример. Проблема студента Василия
Состояния среды
Решения ЛПР
s1 –
лёгк. экз.
s2 –
средн. экз.
s3 – трудн.
a1 – вечеринка
85
60
40
40
a2 – вечеринка
92
85
81
81
a3 – учиться
100
88
82
82 max min h(ai , s j )
экз.
min h(d , s)
s
всю ночь
полночи
всю ночь
ai
sj
Стратегия осторожного наблюдателя: учиться всю ночь.
9
Критерий «здорового оптимиста»
Предположение. Среда всегда наилучшим
образом влияет на исход любого решения.
max max h(d , s ) max h(d1 , s )
d
s
s
d1 – стратегия здорового оптимиста.
10
Пример. Проблема студента Василия
Состояния среды
Решения ЛПР
s1 –
лёгк. экз.
s2 –
средн. экз.
s3 – трудн.
a1 – вечеринка
85
60
40
85
a2 – вечеринка
92
85
81
92
a3 – учиться
100
88
82
max h(d , s)
s
экз.
всю ночь
полночи
всю ночь
100 max max h(ai , s j )
ai
Стратегия здорового оптимиста: учиться всю ночь.
11
sj
Критерий «здорового оптимиста»
Обозначим
max min h(d , s)
d
s
max max h(d , s)
d
– критерий осторожного наблюдателя
– критерий здорового оптимиста
s
характеризует уровень неопределенности в задаче.
h( d , s )
12
Пример. Проблема студента Василия
Состояния среды
Решения ЛПР
s1 – лёгк.
экз.
s2 –
средн. экз.
s3 – трудн. экз.
a1 – вечеринка всю
85
60
40
a2 – вечеринка
92
85
81
a3 – учиться всю ночь
100
88
82
ночь
полночи
max min h(d , s) 82
d
s
max max h(d , s) 100
d
13
100 82 8
s
Уровень неопределённости в задаче – 8 баллов.
Критерий Гурвица
Предположение. Среда наилучшим образом влияет на
исход любого решения с вероятностью 𝜶 и наихудшим
образом с вероятностью 𝟏 − 𝜶 .
[0,1]
14
– субъективная вероятность
Критерий Гурвица
Ожидаемая полезность решения 𝑑 при уровне
субъективной вероятности 𝛼:
H (d ) max h(d , s ) (1 ) min h(d , s)
s
s
max H (d ) H (d a )
d
𝑑𝛼 – решение по критерию Гурвица при уровне
субъективной вероятности 𝛼
15
Пример. Пессимистическое решение
Состояния среды
Решения ЛПР
s1 – лёгк.
min h(d , s )
max h(d , s)
экз.
s2 –
средн. экз.
s3 – трудн.
a1 – вечеринка всю
85
60
40
40
85
a2 – вечеринка
92
85
81
81
92
a3 – учиться всю
100
88
82
82
100
s
s
экз.
ночь
полночи
ночь
0,1
H 0,1 (d ) 0,1 max h(d , s) (1 0,1) min h( d , s)
s
s
H 0,1 (a1 ) 0,1 85 0,9 40 44,5
H 0,1 (a2 ) 0,1 92 0,9 81 82,1
H 0,1 (a3 ) 0,1 100 0,9 82 83,8 max H 0,1 (d )
d
16
Критерий Гурвица при субъективной вероятности 0,1:
учиться всю ночь.
Пример. Оптимистическое решение
Состояния среды
Решения ЛПР
s1 – лёгк.
min h(d , s )
max h(d , s)
экз.
s2 –
средн. экз.
s3 – трудн.
a1 – вечеринка всю
85
60
40
40
85
a2 – вечеринка
92
85
81
81
92
a3 – учиться всю
100
88
82
82
100
s
s
экз.
ночь
полночи
ночь
0,8
H 0,8 (d ) 0,8 max h(d , s) 0, 2 min h( d , s)
s
s
H 0,8 (a1 ) 0,8 85 0, 2 40 76
H 0,8 (a2 ) 0,8 92 0, 2 81 89,8
H 0,8 (a3 ) 0,8 100 0, 2 82 96, 4 max H 0,8 (d )
d
17
Критерий Гурвица при субъективной вероятности 0,8:
учиться всю ночь.
Пример. Реалистическое решение
Состояния среды
Решения ЛПР
s1 – лёгк.
min h(d , s )
max h(d , s)
экз.
s2 –
средн. экз.
s3 – трудн.
a1 – вечеринка всю
85
60
40
40
85
a2 – вечеринка
92
85
81
81
92
a3 – учиться всю
100
88
82
82
100
s
s
экз.
ночь
полночи
ночь
0,5
H 0,5 (d ) 0,5 max h(d , s ) 0,5 min h(d , s)
s
s
H 0,5 (a1 ) 0,5 85 0,5 40 62,5
H 0,5 (a2 ) 0,5 92 0,5 81 86,5
H 0,5 (a3 ) 0,5 100 0,5 82 91 max H 0,5 (d )
d
18
Критерий Гурвица при субъективной вероятности 0,5:
учиться всю ночь.
Критерий Лапласа
Предположение. Внешний фактор 𝑠 является случайной
величиной, распределенной по равномерному закону.
Пусть множество состояний среды конечно:
S s1 , s2 ,..., sn ;
1
P s j , j 1,..., n
n
Ожидаемая полезность решения 𝑑 в предположениях
Лапласа:
1 n
H l (d ) h d , s j
n j 1
19
Критерий Лапласа
max H l (d ) H l (dl )
d
dl – оптимальное решение по критерию
Лапласа
20
Пример
1 n
H l (d ) h d , s j
n j 1
Состояния среды
Решения ЛПР
a1 – вечеринка всю ночь
a2 – вечеринка полночи
a3 – учиться всю ночь
s1 – лёгк. экз.
s2 –
s3 – трудн. экз.
85
60
40
92
85
81
100
88
82
средн. экз.
1
85 60 40 61, 67
3
1
H l (a2 ) 92 85 81 86
3
1
H l (a3 ) 100 88 82 90
3
H l (a1 )
21
Решение по критерию Лапласа: учиться всю ночь.
Критерий Сэвиджа
Предположение. Среда всегда наихудшим образом влияет на
исход любого решения в соответствии с функцией Сэвиджа
hs max h(d , s )
d
H (d , s ) [h(d , s ) hs ]
c
– функция Сэвиджа (функция «сожаления»)
H (d , s) 0
c
22
Критерий Сэвиджа
max min H (d , s ) min H (d c , s)
c
d
s
c
s
d c – оптимальное решение по критерию
Сэвиджа
23
Пример
H (d , s) [h(d , s) hs ]
c
Состояния среды
Решения ЛПР
s1 – лёгк. экз.
s3 – трудн. экз.
85
60
40
средн. экз.
a1 – вечеринка всю ночь
a2 – вечеринка полночи
a3 – учиться всю ночь
92
85
81
100
88
82
hs max h(d , s)
100
88
82
d
Функция
Сэвиджа:
24
s2 –
a1
a2
a3
s1
s2
s3
-15
-8
-28
-3
-42
-1
min
-42
-8
Замечания
25
1.
Рассмотренный пример – удивительное
исключение из
правил: обычно, различные критерии дают различные решения.
Иногда – прямо противоположные.
2.
Для решения задачи принятия решения в условиях
неопределённости ЛПР выбирает критерий, наиболее
подходящий именно ему.
3.
В случае применения критерия Гурвица, как правило
рассматривают три различных варианта решения:
оптимистичный, пессимистичный и реалистичный. А далее ЛПР
определяет свой собственный настрой и ориентируется на него.
4.
При большом уровне неопределённости, как правило,
привлекают команду экспертов и переводят задачу в разряд
задач принятия решений в условиях риска.
Экзамен по курсу Прикладные
модели оптимизации
1. Любые задолженности по курсу принимаются (с
потерей баллов).
2. Список экзаменационных вопросов выложу до 1
июня.
3. Информацию о форме проведения экзамена выложу в
личный кабинет не позднее 10 июня.
4. Все вопросы – на e-mail с пометкой: «ПМО. ВОПРОС.
Группа №…».
26
Домашнее задание № 6
Решите задачу принятия решения в условиях
неопределённости, воспользовавшись каждым из
рассмотренных критериев.
СРОК: 02.06.2020
27