Основы теории игр
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Основы теории игр
В конфликтных ситуациях, где сталкиваются интересы двух и более
сторон, преследующих разные цели, действия противника обычно
неизвестны. В таких случаях приходится принимать решение в условиях
неопределенности. Теория игр – это математическая теория принятия
решений в конфликтных ситуациях в условиях неопределенности. Цель
теории игр – дать способ выбора действий, наиболее разумных в конкретной
ситуации.
При анализе рассматривается упрощенная модель конфликтной
ситуации, которая учитывает только наиболее существенные связи и
влияния.
Игра – это действительный или формальный конфликт, в котором
имеется по крайней мере два участника (игрока), каждый из которых
стремится к достижению собственных целей.
Правила игры указывают допустимые действия игроков и исход игры –
выигрыш или проигрыш каждого участника в зависимости от сложившейся
ситуации. Развитие игры представляется как ряд последовательных ходов.
Ходом называется выбор игроком одного из предусмотренных
правилами игры действий и его осуществление.
Стратегией игрока называется совокупность правил (или программа),
которые определяют, какой из имеющихся ходов необходимо сделать в
зависимости от сложившейся ситуации.
Стратегия игрока называется оптимальной, если при многократном
повторении игры она обеспечивает игроку максимально возможный средний
выигрыш (минимально возможный средний проигрыш). Задача теории игр –
выявление оптимальных стратегий игроков.
В теории игр подразумевается, что при выборе стратегии игроки
придерживаются принципа осторожности, т.е. игрок считает противникам
не менее разумным, чем он сам и для получения максимально возможного
среднего выигрыша выбирает наилучший из наихудших для себя вариантов.
АНТАГОНИСТИЧЕСКИЕ МАТРИЧНЫЕ ИГРЫ
Математическая модель матричной игры
Если сумма выигрышей игроков рана нулю, то такая игра называется
игрой с нулевой суммой. В этой игре интересы игроков прямо
противоположны. Каждый игрок выигрывает только за счет противника.
Парная игра с нулевой суммой называется антагонистической.
Рассмотрим игру, в которой участвуют 2 игрока А и В, имеющие
противоположные интересы. Пусть у первого игрока имеется m возможных
стратегий А1,A2,..., Аm, а у второго – n стратегий В1, В2,..., Вn. Если игроки
принимают в своих действиях только одну из некоторого конечного набора
возможную стратегию, то мы имеем задачу с чистыми стратегиями. Пусть
первый игрок выбирает 𝑖 -ю стратегию, 𝑖 = 1, … , 𝑚, а второй, не зная выбора
первого, выбирает j-ю стратегию, 𝑗 = 1, … , 𝑛. В соответствии с правилами
для выбранной пары стратегии определен исход игры 𝑎𝑖𝑗. Если 𝑎𝑖𝑗> 0, то это
будет выигрыш игрока А, если же 𝑎𝑖𝑗< 0, то это будет проигрыш игрока А.
Матрица, элементы которой равны результатам игры называется платежной
матрицей, или матрицу игры.
Строки матрицы А соответствуют стратегиям первого игрока, а столбцы
– стратегиям второго. Эти стратегии являются чистыми. Игру, определяемую
матрицей А, имеющей m строк и n столбцов, называют конечной игрой
размерности m × n.
Матрица игры составляется для одного из игроков (например, для
игрока А). Таким образом, игрок А играет на максимум (заинтересован в
максимальном выигрыше), а игрок В, интересы которого противоположны,
играет на минимум (чем меньше 𝑎𝑖𝑗, тем выгоднее В). Такая форма игры
называется нормальной.
Задача 1. Сторона А посылает в сторону противника В два самолета,
один из которых несет бомбу. Сторона В высылает навстречу истребитель.
При атаке первого самолета истребитель может быть сбит с вероятностью
0,6, при атаке второго – с вероятностью 0,3. Если истребитель не сбит и
атакует первый самолет, то вероятность поражения цели равна 0,8. При атаке
второго самолета вероятность поражения цели 0,6. Составить матрицу
возможных исходов, в которой 𝑎𝑖𝑗 означают вероятности сохранения бомбы.
Решение. Для стороны А возможны 2 стратегии: стратегия А1 – бомба
размещена в первом самолете; стратегия А2 – бомба размещена во втором
самолете.
Для игрока В также возможны 2 стратегии: стратегия В1– атакуется
первый самолет; стратегия В2 – атакуется второй самолет.
Рассчитаем значения вероятности сохранения бомбы для каждой пары
стратегий.
Пара А1В1: 𝑎11 – вероятность сохранения бомбы при условии, что она
находится в первом самолете и истребитель атакует первый самолет. Бомба
будет сохранена, если истребитель будет сбит до начала атаки (вероятность
0,6) или истребитель не сбит (вероятность 0,4), но не поразил цель
(вероятность 0,3). Получаем вероятность
𝑎11=0,6+0,4·0,2=0,68.
Пара А1В2: 𝑎12 – вероятность сохранения бомбы при условии, что она
находится в первом самолете, а истребитель атакует второй самолет. В этом
случае сохранение бомбы – это достоверное событие и 𝑎12=1.
Пара А2В1: 𝑎21 – вероятность сохранения бомбы при условии, что она
находится во втором самолете, а истребитель атакует первый самолет. В этом
случае сохранение бомбы – это достоверное событие и 𝑎21=1.
Пара А2В2: 𝑎22 – вероятность сохранения бомбы при условии, что она
находится во втором самолете и истребитель атакует второй самолет. Бомба
будет сохранена, если истребитель будет сбит до начала атаки (вероятность
0,3) или истребитель не сбит (вероятность 0,7), но не поразил цель
(вероятность 0,4). Получаем вероятность
𝑎22=0,3+0,7·0,4=0,58.
Матрица игры имеет вид
𝐴=
0,68
1
.
1
0,58
Нижняя и верхняя цена игры. Принцип минимакса. Игры с седловой
точкой
Рассмотрим игру m×n с платежной матрицей с неотрицательными
элементами
Каждый элемент матрицы определяет величину выигрыша игрока А и
проигрыша игрока В в сложившейся ситуации.
В теории игр предполагается, что игроки действуют в соответствии с
принципом осторожности, т.е. выбирают стратегию, гарантирующую
наилучший для него из наихудших результатов.
Поскольку игроку А необходим максимально возможные выигрыш
(играет на максимум), то наихудшим для него вариантом в каждой стратегии
будет минимальный результат. Поэтому выберем минимальное из чисел 𝑎𝑖𝑗 в
i- й строке и обозначим его символом аi
𝑎𝑖 = min 𝑎𝑖𝑗 , 𝑖 = 1, … , 𝑚.
𝑗
Выберем ту стратегию, для которой число аi максимально (наилучший
из наихудших результатов) и обозначим это значение α:
𝛼 = max 𝑎𝑖 = max min 𝑎𝑖𝑗 .
𝑖
𝑖
𝑗
Величина α называется нижней ценой игры (максимин А).
Соответствующая максимину стратегия игрока А называется максиминной
стратегией, при этом α – гарантированный выигрыш игрока А, т. е. меньше
которого он не получит при разумном выборе своей стратегии.
Поскольку игроку В необходим минимально возможный проигрыш
(играет на минимум), то наихудшим для него вариантом в каждой стратегии
будет максимальный результат. Поэтому выберем максимальное из чисел 𝑎𝑖𝑗
в j- й строке и обозначим его символом 𝑏𝑗
𝑏𝑗 = max 𝑎𝑖𝑗 , 𝑗 = 1, … , 𝑛.
𝑖
Выберем ту стратегию, для которой значение
𝑏𝑗
минимально
(наилучший из наихудших результатов) и обозначим это значение 𝛽:
𝛽 = min 𝑏𝑗 = min max 𝑎𝑖𝑗
𝑗
𝑗
𝑖
Число β называется верхней ценой игры (минимакс В). Стратегия,
соответствующая выигрышу β, называется минимаксной стратегией игрока
В. Величина β – значение гарантированного проигрыша, больше которого не
отдаст разумный противник.
Для матричной игры справедливо неравенство α ≤ β. В результате
предположения о разумности противника оба игрока выбирают наиболее
осторожные стратегии – максиминную и минимаксную, которые в теории игр
часто обозначают общим термином «минимаксные стратегии».
Задача 2. Для игры
найти верхнюю и нижнюю цены игры, указать минимаксные стратегии.
Решение. В соответствии с принципом минимакса: поступай так, чтобы
при наихудшем поведении противника получить максимальный выигрыш,
найдем для игрока А минимальные значения выигрыша в каждой строке
матрицы аi = (0,2; 0,3; 0,5) и выберем из них максимальное значение, 𝛼 = 0,5.
Эта величина – гарантированный выигрыш игрока А. Соответствующая
этому выигрышу стратегия – А3.
Игрок В, выбирая стратегию, хотел бы отдать поменьше, но он тоже
рассчитывает на наихудшее для него поведение игрока А. Найдем
максимальные значения проигрыша в каждом столбце bj= (0,9; 0,7; 0,8) и
выберем из них наименьшее β = 0,7. Это значения проигрыша, больше
которого не отдаст игрок В. Соответствующая минимаксная стратегия – В2.
Итак, нижняя цена игры равна 0,5, верхняя – 0,7. До тех пор, пока
стороны в этом примере будут придерживаться своих минимаксных
стратегий, выигрыш игрока A и проигрыш игрока В, будут стабильными и
равными 0,7.
Предположим, что игрок В узнал, что игрок А выберет свою третью
стратегию. Тогда он выберет стратегию В1 и выигрыш первого игрока уже
будет 0,5. Очевидно, минимаксные стратегии не всегда устойчивы по
отношению к информации о поведении другой стороны. Однако в некоторых
задачах информация о стратегии противника ничего не меняет.
Задача 3. В платежной матрице
указано, какую долю рынка выиграет предприятие у своего единственного
конкурента, если оно будет действовать согласно каждой из возможных трех
стратегий, а конкурент – согласно каждой из своих возможных стратегий.
Найдем нижнюю и верхнюю цену игры
Если первый игрок воспользуется второй стратегией, а второй игрок –
третьей стратегией, то игроки могут гарантировать себе: первый – выигрыш
не менее ν = α = β = 0,3 (30%рынка), а второй – что первый выиграет не более
ν = 30% рынка.
Если верхняя цена игры равна нижней, то минимаксные стратегии будут
устойчивыми. В этом случае любое отступление игроков от минимаксных
стратегий может только ухудшить их положение. Пара таких стратегий
называется «седловой точкой», а игра называется игрой с «седловой точкой».
В случае, если игра имеет седловую точку, то соответствующие
минимаксная и максиминная стратегии называют оптимальными чистыми
стратегиями, а их совокупность – решением игры. В этом случае полагают
α = β = ν, где ν называют ценой игры.
Решение игры обладает свойством: если один из игроков
придерживается своей оптимальной стратегии, то второму игроку невыгодно
отклоняться от своей оптимальной стратегии. При этом поступившие
сведения о стратегии другой стороны не меняют оптимальные стратегии
игроков. Это означает, что в играх с седловой точкой минимаксные стратегии
обладают устойчивостью. В платежной матрице может быть несколько
седловых точек.
Задача 4. Найти нижнюю и верхнюю цены игры. Сделать вывод о
наличии седловой точки.
4 5 6 7
3 4 6 5
𝐴=
7 6 10 8
8 5 4 3
Решение. Нижняя цена игры
𝛼 = max 4; 3; 6; 3 = 6.
Верхняя цена игры
𝛽 = m𝑖𝑛 8; 6; 10; 8 = 6.
Поскольку 𝛼 = 𝛽, то имеем игру с седловой точкой и цена игры равна 6.
Смешанные стратегии.
В случае отсутствия седловой точки для получения решения
используются смешанные стратегии.
Смешанной стратегией данного игрока называется вектор, каждая из
компонент
которого
показывает
вероятность
использования
соответствующей чистой стратегии при многократной игре.
При этом используется случайный порядок следования стратегий (датчик
случайных чисел, выбрасывание монеты и т.д.).
Рассмотрим игру размерности 𝑚 × 𝑛.
Обозначив через 𝑝𝑖 вероятность (относительную частоту) появления
стратегии 𝐴𝑖 , получим вектор, определяющий смешанную стратегию игрока
А:
𝑆𝐴 = 𝑝1 , 𝑝2 , … , 𝑝𝑚 ,
где 𝑝1 + 𝑝2 + ⋯ + 𝑝𝑚 = 1.
Аналогично смешанная стратегия игрока В определяется вектором
𝑆𝐵 = 𝑞1 , 𝑞2 , … , 𝑞𝑛 ,
где 𝑞1 + 𝑞2 + ⋯ + 𝑞𝑛 = 1.
Стратегии, для которых вероятность в смешанной стратегии отлична от 0,
называются активными.
Задача сводится к нахождению пары оптимальных стратегий 𝑆𝐴∗ и 𝑆𝐵∗ ,
обладающих свойством: если один из игроков придерживается своей
оптимальной стратегии, второму невыгодно отступать от своей. Очевидно,
что каждую чистую стратегию можно задать как смешанную, если положить
вероятность ее использования равной единице, а остальные вероятности
равными нулю.
Ценой игры является число
𝑛
𝑚
𝜈=
𝑎𝑖𝑗 𝑝𝑖 𝑞𝑗 ,
𝑗 =1 𝑖=1
определяющее выигрыш, полученный при использовании оптимальной
стратегии. Цена игры всегда лежит между нижней и верхней ценами игры α ≤
v≤ β. Определение оптимальных стратегий и цены игры составляют процесс
нахождения решения игры.
На вопрос о существовании решения игры отвечает
Основная теорема теории игр. Каждая конечная матричная игра с нулевой
суммой имеет по крайней мере одно решение, возможно, в области
смешанных стратегий.
Для решения игр важное значение имеет
Теорема об активных стратегиях. Если один из игроков применяет свою
оптимальную смешанную стратегию, то его выигрыш равен цене игры
независимо от того, какие активные стратегии использует второй игрок.
Смешанная стратегия определяется либо в результате решения системы
линейных алгебраических уравнений (матрица игры – квадратная), либо как
решение задачи линейного программирования (матрица игры –
прямоугольная). Смешанные стратегии игры размерности 2×n или m×2
можно найти графически.
Задача 5. Найти графическим методом решение задачи
1 −3 2 3
А=
−2 5 1 −4
Решение. Решим задачу графически.
Пусть смешанная стратегия 𝑆𝐴 = 𝑝1 ; 𝑝2 , 𝑝1 + 𝑝2 = 1, 𝑝2 = 1 − 𝑝1
Выигрыш А равен цене игры вне зависимости от выбора стратегии игроком
В. Поэтому делать любые предположения о выборе игроком В стратегий.
Пусть игрок В придерживается стратегии В1, тогда:
𝑝1 − 2𝑝2 = 𝜈 или 𝜈 = 𝑝1 − 2(1 − 𝑝1 ) или
𝜈 = 3𝑝1 − 2
(1)
Пусть игрок В придерживается стратегии В2: −3𝑝1 + 5𝑝2 = 𝜈 или 𝜈 =
−3𝑝1 + 5(1 − 𝑝1 ) или
𝜈 = −8𝑝1 + 5
(2)
Пусть игрок В придерживается стратегии В3: 2𝑝1 + 𝑝2 = 𝜈 или 𝜈 = 2𝑝1 +
(1 − 𝑝1 ) или
𝜈 = 𝑝1 + 1
(3)
Пусть игрок В придерживается стратегии В4: 3𝑝1 − 4𝑝2 = 𝜈 или 𝜈 = 3𝑝1 −
4(1 − 𝑝1 ) или
𝜈 = 7𝑝1 − 4
(4)
Изобразим на координатной плоскости прямые (1)-(4) с учетом того, что
𝑝1 0; 1 .
Минимальные выигрыши (наихудшие варианты для игрока А)
расположены на отрезках нижних прямых. Наилучший из наихудших
вариантов – это максимальная из ординат точек зеленой ломанной.
Оптимальное значение 𝑝1∗ определяется абсциссой точки пересечения прямых
(1) и (2):
𝜈 = 3𝑝1∗ − 2;
𝜈 = −8𝑝1∗ + 5.
3𝑝1∗ − 2 = −8𝑝1∗ + 5;
11𝑝1∗ = 7;
7
4
7
1
𝑝1∗ =
; 𝑝2∗ =
; 𝜈 =3∙
−2 = − .
11
11
11
11
Стратегии В3 и В4 являются неактивными, т.е. не влияют на цену игры,
поэтому 𝑞3∗ = 0, 𝑞4∗ = 0. Компоненты
оптимальной стратегии В
удовлетворяют системе
1𝑞1∗ − 3𝑞2∗ + 2𝑞3∗ + 3𝑞4∗ = 𝜈;
−2𝑞1∗ + 5𝑞2∗ + 1𝑞3∗ − 4𝑞4∗ = 𝜈
или, с учетом 𝑞3∗ = 0, 𝑞4∗ = 0, 𝜈 = −
1
11
1
;
11
1
−2𝑞1∗ + 5𝑞2∗ + 1 ∙ 0 − 4 ∙ 0 = −
11
Умножая первое уравнение на 2 и складывая уравнения, получим:
3
3
8
−𝑞2∗ = −
→
𝑞2∗ =
; 𝑞1∗ =
.
11
11
11
Получены оптимальные смешанные стратегии:
1𝑞1∗ − 3𝑞2∗ + 2 ∙ 0 + 3 ∙ 0 = −
𝑆𝐴 = {
7
11
;
4
11
}; 𝑆𝐵 =
8
11
;
3
11
; 0; 0 .
Задача 6. Найти графическим методом решение задачи
2 0
А = −3 5
1 4
Решение. Решим задачу графически. Начинаем находить смешанную
стратегию игрока, у которого только 2 стратегии, т.е. игрока В.
Пусть смешанная стратегия 𝑆𝐵 = 𝑞1 ; 𝑞2 , 𝑞1 + 𝑞2 = 1, 𝑞2 = 1 − 𝑞1
Для стратегии A1: 2𝑞1 + 0𝑞2 = 𝜈 или
𝜈 = 2𝑞1
Для стратегии A2: −3𝑞1 + 5𝑞2 = 𝜈 или 𝜈 = −3𝑞1 + 5(1 − 𝑞1 ) или
𝜈 = −8𝑞1 + 5
(2)
Для стратегии A3: 1𝑞1 + 4𝑞2 = 𝜈 или 𝜈 = 1𝑞1 + 4(1 − 𝑞1 ) или
𝜈 = −3𝑞1 + 4
(3)
Изобразим на координатной плоскости прямые (1)-(3) с учетом того, что
𝑞1 0; 1 .
Оптимальное значение 𝑞1∗ определяется абсциссой точки пересечения
прямых (1) и (3):
𝜈 = 2𝑞1∗ ;
𝜈 = −3𝑞1∗ + 4;
2𝑞1∗ = −3𝑞1∗ + 4;
5𝑞1∗ = 4;
4
1
4 8
𝑞1∗ = ; 𝑞2∗ = ; 𝜈 = 2 ∙ = .
5
5
5 5
Стратеги А2 является неактивной, т.е. не влияет на цену игры, поэтому
∗
𝑝2 = 0,. Компоненты оптимальной стратегии A удовлетворяют системе
2𝑝1∗ − 3𝑝2∗ + 𝑝3∗ = 𝜈;
0𝑝1∗ + 5𝑝2∗ + 4𝑝3∗ = 𝜈
или, с учетом 𝑝2∗ = 0, 𝜈 =
8
5
8
;
5
8
0𝑝1∗ + 5 ∙ 0 + 4𝑝3∗ =
5
8
2
3
4𝑝3∗ =
→
𝑝3∗ = ; 𝑝1∗ = .
5
5
5
Получены оптимальные смешанные стратегии:
2𝑝1∗ − 3 ∙ 0 + 𝑝3∗ =
3
2
4
5
5
5
𝑆𝐴 = { ; 0; }; 𝑆𝐵 =
;
1
5
.
ЭЛЕМЕНТЫ ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИЙ
Постановка задачи. Иногда требуется принять решение в условиях
неопределенности.
Для
выработки
решения
используется
как
количественный, так и субъективный подход. При проведении
количественного анализа поиск проходит по следующей схеме:
1) определяется цель решения;
2) рассматриваются возможные варианты решения проблемы;
3) определяются возможные исходы каждого решения;
4) оценивается каждый исход;
5) выбирается оптимальное решение на основе поставленной цели. Но, в
конечном итоге, выбор решения зависит от точки зрения того, кто его
принимает.
Следует отметить, что неопределенность бывает разного рода. Ранее
были рассмотрены неопределенные ситуации, связанные с сознательным
противодействием противника. Однако встречается неопределенность
другого рода, исходящая от недостаточной осведомленности об условиях, в
которых будет проходить действие. Например, может быть неизвестен
заранее покупательский спрос на определенный вид продукции, или объем
перевозок пассажиров в летний период. Такие ситуации иногда называют
«играми с природой», а посвященный им раздел теории игр называется
теорией статистических решений.
Пусть сторона А имеет m возможных стратегий А1, А2,...,Аm, об
условиях прохождения операции можно сделать n предположений
П1,П2,...,Пn. Эти условия в теории статистических решений принято называть
«природой», а предположения о состоянии природы называют «стратегиями
природы». Выигрыш стороны А при каждой паре стратегий AiПj, задается
матрицей, представленной в таблице 1:
Элемент 𝑎𝑖𝑗 равен выигрышу игрока А, если он использует стратегию
Аi, при состоянии природы Пj. Требуется выбрать для стороны А наиболее
выгодную стратегию.
Несмотря на схожесть постановки задачи и терминологию, к этой задаче
не применимы абсолютно все методы теории антагонистических игр.
Методы решения антагонистических игр требуют адаптации к задачам игр с
природой.
Для решения игр с природой разработаны критерии. Выбор критерия
субъективен.
Некоторые критерии напоминают решение антагонистических игр в
чистых стратегиях, основаны на анализе результата игры, некоторые
используют оценку опасности ситуации и отношение к риску.
Риском 𝑟𝑖𝑗 игрока А при использовании стратегии Аi называется
разность между выигрышем, который получил бы игрок А, если бы знал
состояние Пj, и выигрышем, который он получит, не зная условий и
применяя стратегию Аi:
𝑟𝑖𝑗 =βj-aij
где 𝛽𝑗 – максимальное значение выигрыша при стратегии Пj. Значение
риска отражает удачность выбора данной стратегии в данной ситуации. Риск
– это плата за отсутствие информации.
При выборе решения игры в одних случаях стараются максимизировать
доход, в других – минимизировать риск, сопровождающий выбор решения. В
целом правила выбора решения делятся на две группы:
а) правила выбора решения без использования численных значений
вероятностей исходов;
б) правила принятия решения с использованием численных значений
вероятностей исходов.
Критерии теории игр
Критерий ММ (Вальда).
Mаксиминное решение (критерий Вальда) получается при
максимизации минимума дохода. Такой подход продиктован крайним
пессимизмом при оценке состояний спроса. Согласно этому критерию
выбирается стратегия, гарантирующая выигрыши, не меньшие чем
max min aij .
i
j
Критерий Н (крайнего оптимизма).
Максимаксное решение– максимизация максимума доходов.
Для
каждой стратегии ( в каждой строке) максимальный доход (заносится в
последний столбец таблицы). Из полученных максимумов выбирается
максимальное значение.
Этот критерий
продиктован крайним оптимизмом при оценке
состояния спроса.
Критерий N (Критерий Гурвица, нейтральный).
При использовании принципа минимакса не учитывается априорная
информация о состояниях природы и тем самым ограничивается тот
выигрыш, который эта информация может дать.
При выборе стратегии логично вместо двух крайних взглядов выбрать
промежуточный. Такого рода компромиссное правило предложил Гурвиц.
Согласно принципу Гурвица неразумно, приняв во внимание самый
маленький выигрыш, не учитывать самый большой. Для этого субъективным
образом вводится коэффициент оптимизма 𝛾(0 ≤ 𝛾 ≤ 1) и стратегия
выбирается из условия
H max min aij (1 ) max aij
j
i
j
При 𝛾 = 1 критерий Гурвица превращается в критерий
перестраховщика Вальда; при 𝛾 = 0 – в критерий «крайнего оптимизма». При
0<𝛾< 1 получается нечто среднее между тем и другим. Коэффициент 𝛾
выбирается из субъективных соображений – чем опаснее ситуация, тем он
ближе к 1.
Критерий S (Сэвиджа).
Критерий Сэвиджа основан на анализе рисков.
Риском rij игрока А при использовании стратегии Ai называется
разность между выигрышем, который получил бы игрок А, если бы знал
состояние В j , и выигрышем, который он получит, не зная условий и
применяя стратегию Ai :
rij j aij
где j – максимальное значение выигрыша при спросе В j . Значение
риска отражает удачность выбора данной стратегии в данной ситуации. Риск
– это плата за отсутствие информации.
При выборе оптимальной стратегии принцип Сэвиджа советует не
допускать чрезмерно высоких потерь, к которым могут привести ошибочные
решения. Он рекомендует выбирать стратегию, при которой величина риска
принимает наименьшее значение в самой неблагоприятной ситуации
s min max rij
i
j
Критерий Сэвиджа, как и критерий Вальда, основан на самой
пессимистической оценке обстановки.
Критерий Байеса. Критерий Байеса используется, если известны
вероятности состояний природы. В соответствии с критерием Байеса
оптимальной считается чистая стратегия Ai, при которой максимизируется
средний выигрыш:
С помощью такого приема задача о выборе решения в условиях
неопределенности превращается в задачу о выборе решения в условиях
определенности, только принятое решение является оптимальным не в
каждом отдельном случае, а в среднем.
Критерий Лапласа. Если игроку представляются в равной мере
правдоподобными все состояния природы, то иногда полагают
и, учитывая, «принцип недостаточного основания»
оптимальной считают чистую стратегию Ai, обеспечивающую:
Лапласа,
Задача 7. Хлебозавод поставляет хлеб на продажу магазинам.
Себестоимость одной булки хлеба составляет 30 руб., ее продают за 50 руб.
Если булка изготовлена, но не продана, то после переработки черствого
хлеба убытки составляют 10 руб. за штуку. В различные дни наблюдался
спрос на булки такого типа в количествах 10, 12, 14, 16, 18 тыс. штук.
Построить матрицу риска для этой задачи. Найти оптимальные стратегии по
основным критериям игр с природой.
Решение. Стратегии хлебозавода – выпекать в день булки этого типа в
количествах 10, 12, 14, 16 и 18 тыс. штук. В роли природы выступит
покупательский спрос с теми же стратегиями. Составим матрицу доходов для
любой комбинации стратегий (табл 1).
Расчет значений
a21 =20∙10-10∙2=180 (тыс.руб.)
a31 =20∙10-10∙4=160 (тыс.руб.)
a32 =20∙12-10∙2=220 (тыс.руб.)
a53 =20∙14-10∙4=240 (тыс.руб.)
и т.д.
Матрица игры.
Спрос на хлеб в день (тыс. шт.)
Количество поступившего 10
12
14
16
18
в продажу хлеба (тыс.шт.)
10
12
14
16
18
200
180
160
140
120
200
240
220
200
180
200
240
280
260
240
200
240
280
320
300
200
240
280
320
360
На основании матрицы доходов, пользуясь формулой (1), составим
матрицу риска, которую называют еще матрицей упущенного дохода
(табл.2,3):
Спрос на хлеб в день (тыс. шт.)
Количество поступившего
10
12
14
16
18
в продажу хлеба (тыс.шт.)
10
200 200 200 200 200
12
180 240 240 240 240
14
160 220 280 280 280
16
140 200 260 320 320
18
120 180 240 300 360
max
200 240 280 320 360
Матрица риска
Спрос на хлеб в день (тыс. шт.)
Количество поступившего
10
12
14
16
18
в продажу хлеба (тыс.шт.)
10
40
80
120 160
12
20
40
80
120
14
40
20
40
80
16
60
40
20
40
18
80
60
40
20
max
200 240 280 320 360
Критерий ММ (Вальда).
Mаксиминное решение (критерий Вальда)
α=max{200; 180; 160;140; 120} =200,
стратегия А1 - максиминная
Критерий Н (крайнего оптимизма).
Максимаксное решение
Н=max{200; 240; 280; 320; 360} =360,
стратегия А5 - максимаксная
γ=0,5
γ=0,4
γ=0,6
γ=0,7
200
180
160
140
120
200
240
220
200
180
200
240
280
260
240
200
240
280
320
300
200
240
280
320
360
200
240
280
320
360
200
210
220
230
240
200
200
200
198
𝑗
200
180
160
140
120
𝑗
max 𝑎𝑖𝑗
10
12
14
16
18
min 𝑎𝑖𝑗
Количество
поступившего
в продажу хлеба
(тыс.шт.)
Критерий N (Критерий Гурвица, нейтральный).
Спрос на хлеб в день (тыс.
шт.)
10 12
14
16
18
216
204
232
208
196
248
212
264
216
194
192
Критерий S (Сэвиджа).
Критерий Сэвиджа основан на анализе рисков.
Он рекомендует выбирать стратегию, при которой величина риска
принимает наименьшее значение в самой неблагоприятной ситуации
s min max rij
i
j
Спрос на хлеб в день (тыс. шт.)
Количество поступившего 10
12
14
16
18
в продажу хлеба (тыс.шт.)
10
40
80
120
160
12
20
40
80
120
14
40
20
40
80
16
60
40
20
40
18
80
60
40
20
Стратегия А4 – оптимальная.
160
120
80
60
80
Критерий Байеса. Критерий Байеса используется, если известны
вероятности состояний природы.
Критерий Лапласа.
Спрос на хлеб в день (тыс. шт.)
Количество поступившего
в продажу хлеба (тыс.шт.)
10
12
14
16
18
10
12
14
16
18
200
180
160
140
120
200
240
220
200
180
200
240
280
260
240
200
240
280
320
300
200
240
280
320
360
А4 – оптимальная стратегия.
200
228
244
248
240