Игры с природой
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 6 (ММвТУиИО)
ИГРЫ С ПРИРОДОЙ
В антагонистических играх всегда присутствует неопределенность –
поскольку ни один из игроков не обладает полной информацией о действиях
противника. Тем не менее эта неопределенность в некоторой степени
компенсируется предположением каждого из игроков о том, что
противоборствующая сторона действует осознанно и разумно, выбирая стратегии,
наиболее выгодные для себя и наименее выгодные для противника, т.е. поведение
каждого игрока было нацелено на увеличение своего выигрыша (уменьшение
проигрыша).
В экономической практике во многих задачах принятия решений
существенным и важным элементом является неопределенность:
не связанная с сознательным целенаправленным противодействием противника;
заключающаяся в недостаточной информированности лица, принимающего
решение, об объективных условиях, в которых будет приниматься это решение.
Неопределенность такого рода может порождаться различными факторами (как
рыночной, так и нерыночной природы):
нестабильность экономической ситуации,
изменение спроса на товар определенного вида,
колебания в объемах перевозок,
рыночная конъюнктура,
политика правительства,
надежность партнера,
выход из строя технического оборудования,
непредсказуемые погодные катаклизмы, плавающий курс валюты,
уровень инфляции,
налоговая политика,
биржевая ситуация,
экологическая обстановка и пр.
Во всех задачах такого рода, когда об одной из сторон в игре заранее
неизвестно ее состояние в момент принятия решения, математическая модель игры
называется игрой с природой.
В игре с природой осознанно действует только один игрок, а именно, лицо,
принимающее решение (обозначим его через А). Природа (обозначим ее через П),
является вторым игроком, но не противником игрока А, ибо она не действует
осознанно против игрока А, а демонстрирует неопределенным образом то или иное
свое состояние, не преследуя конкретной цели и безразлично к результату игры.
В таких играх игрок, играющий «против природы», называется
статистиком, а сама теория игр с природой – теорией статистических решений.
Статистические решения – это исходы игры, в которых один из игроков (игрок
П) оказывается нейтральным, т.е. он не стремится извлечь для себя максимальной
1
Лекция 6 (ММвТУиИО)
выгоды и, следовательно, не стремится обратить в свою пользу ошибки,
совершаемые его противником. В этих случаях строки платежной матрицы игры
соответствуют стратегии игрока-статистика, а столбцы – состояниям природы.
Представление данных в виде платежной матрицы А – один из методов
формализации в теории статистических решений, оказывающий помощь игроку А
в выборе одного из нескольких возможных вариантов решения в наибольшей
степени способствующей достижению его целей.
При изучении статистических решений использование методов теории игр
(платежной матрицы и пр.) целесообразно, если:
1) имеется ограниченное число альтернатив или вариантов выбираемых
стратегий;
2) есть частичная или полная неопределенность в выборе состояния игрока П;
3) результаты принятого решения зависят от того, какая именно выбрана
альтернатива игроком А и какие события (для П) в действительности имели
место.
Рассмотрим такую ситуацию подробнее.
Пусть игрок А имеет конечное множество состояний (в частности,
управленческих решений) Ai, соответствующее m его возможным стратегиям: А1,
…, Аm, а природа П может находиться в одном (из n) ее возможных состояний П1,
…, Пn, которые можно рассматривать как ее «стратегии». Будем считать, что
множество состояний Пj конечно (𝑗 = 1, 𝑛) или, по крайней мере, эти состояния
можно пронумеровать (упорядочить). Все возможные состояния известны, но
неизвестно, какое состояние будет иметь место в условиях, когда должно будет
приниматься управленческое решение.
Совокупность {П1, …, Пn} формируется либо на основе имеющегося опыта
анализа состояний объекта «природа», либо в результате предположений и
интуиции экспертов. Выигрыш игрока А при выбранной им стратегии Ai, 𝑖 = 1, 𝑚 и
при состоянии природы Пj, 𝑗 = 1, 𝑛 обозначим через aij. Так же, как и в матричной
игре, из aij можно сформировать матрицу выигрышей игрока А (матрицу игры или
платежную матрицу), которая содержательно отличается от матрицы
антагонистической игры тем, что элементы столбцов не являются проигрышами
природы при соответствующих ее состояниях.
𝑎11 𝑎12 . . . 𝑎1𝑛
𝑎21 𝑎22 … 𝑎2𝑛
𝐴 = {𝑎𝑖𝑗 } = ( …
…
…
… )
𝑎𝑚1 𝑎𝑚2 … 𝑎𝑚𝑛
Задача выбора игроком А чистой или смешанной стратегии, более
эффективной, чем остальные, в игре с П, с одной стороны, проще аналогичной
задачи в антагонистической игре, поскольку в игре с П отсутствует с ее стороны
систематическое противодействие игроку А, а с другой стороны, эта задача
2
Лекция 6 (ММвТУиИО)
осложняется
наличием
неопределенности,
связанной
с
дефицитом
осведомленности игрока А о характере проявления состояний П.
В играх с природой также можно и полезно пользоваться принципом
доминирования стратегий игрока А (представленных строками матрицы):
1) Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из
остальных его стратегий, то она должна и будет выбираться игроком А в
качестве предпочтительной, поскольку его выигрыш при этой стратегии и при
любом состоянии природы П не меньше выигрыша при любой из остальных
стратегий.
2) Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет
стратегии, доминирующей каждую из остальных его стратегий, то нужно
посмотреть, нет ли у него дублирующих стратегий. Если они присутствуют, то
соответствующие им строки матрицы также можно удалить, уменьшив тем
самым ее размерность.
Однако принцип доминирования стратегий (состояний) П (представленных
столбцами матрицы) недопустим, поскольку природа не выбирает свои состояния с
целью уменьшения выигрышей игрока А - для нее просто нет ни более, ни менее
эффективных и предпочтительных состояний. Это обстоятельство является еще
одним свойством, отличающим игры с природой от антагонистических матричных
игр.
Пример 6.1. Игра с природой задана матрицей:
2 1 3 4
А = (𝟒 𝟔 𝟑 𝟓 )
3 5 2 1
Выбрать предпочтительную для игрока А стратегию, используя принцип
доминирования.
Решение:
Игрок А имеет три чистые стратегии А1, А2, А3, а природа П может
находиться в одном из четырех состояний П1, П2, П3, П4.
Видно, что стратегия А2 доминирует стратегии А1 и А3. Следовательно,
стратегия А2 является предпочтительной для игрока А.
Пример 6.2. Игра с природой задана матрицей:
2 6 4 3 2
𝟗 𝟒 𝟓 𝟏 𝟑
2 3 1 4 2
А=
4 8 3 0 1
9 4 5 1 3
( 𝟒 𝟕 𝟒 𝟖 𝟐)
Используя принцип доминирования, выбрать для
предпочтительные стратегии.
игрока
А
наиболее
3
Лекция 6 (ММвТУиИО)
Решение:
Игрок А имеет шесть чистых стратегий А1, А2, А3, А4, А5, А6, а природа П
может находиться в одном из пяти состояний П1, П2, П3, П4, П5.
Видно, что стратегия А6 доминирует стратегии А1 и А3, т.е. эти стратегии можно
отбросить. Стратегии А2 и А5 дублируют друг друга, и одну из них можно также
удалить, например, А5. В результате получим матрицу:
9 4 5 1 3
А = ( 4 8 3 0 1)
4 7 4 8 2
Оставшиеся три стратегии и являются предпочтительными для А.
В ряде случаев при решении игры с природой в качестве результатов
рассматривается матрица рисков
𝑅 = {𝑟𝑖𝑗 }
Смысл R в том, что, чем больше 𝑟𝑖𝑗 , тем более рискованной в j-ом состоянии П
является i-ая стратегия А.
Элементы матрицы рисков связаны с элементами матрицы выигрышей
(полезности) следующим соотношением:
max 𝑎𝑖𝑗 − 𝑎𝑖𝑗 , если 𝑎𝑖𝑗 − выигрыш
𝑖
𝑟𝑖𝑗 = { 𝑎 − m𝑖𝑛 𝑎 , если 𝑎 − потери
𝑖𝑗
𝑖
𝑖𝑗
𝑖𝑗
Пример 6.3. Для платежной матрицы, полученной в примере 6.2 построить
матрицу рисков, при условии, что элементы матрицы представляют собой
выигрыши.
Решение:
𝟗 4 𝟓 1 𝟑
А = (4 𝟖 3 0 1)
4 7 4 𝟖 2
Полужирным шрифтом выделены максимальные элементы каждого столбца
𝑅 = (5
5
4
1
2
1
7
8
2)
1
В играх с природой различают два вида задач принятия решений:
1) в условиях риска, когда известны вероятности, с которыми природа принимает
каждое из ее возможных состояний;
2) в условиях неопределенности, когда нет возможности получить информацию о
вероятностях появления состояний природы.
4
Лекция 6 (ММвТУиИО)
Основной метод, позволяющий найти оптимальную стратегию в задаче
принятия решения в условиях неопределенности, предполагает следующее:
формулируется гипотеза (критерий) о поведении П, позволяющая дать
численную оценку каждой стратегии А;
оптимальной считается та стратегия, для которой численная оценка является
максимальной.
КЛАССИЧЕСКИЕ КРИТЕРИИ ПРИНЯТИЯ РЕШЕНИЯ В ИГРАХ С ПРИРОДОЙ
Критерий Вальда (V – критерий, максиминный)
Предназначен для выбора из рассматриваемых вариантов стратегий А
варианта с наибольшим показателем эффективности из минимально возможных
показателей для каждого из этих вариантов.
Критерий ориентирует лицо, принимающее решение на осторожную линию
поведения, направленную на получение дохода и минимизацию возможных
рисков одновременно.
Согласно данному критерию игра с П ведется как игра с разумным, причем
агрессивным противником, делающим все для того, чтобы помешать игроку А
достигнуть успеха. Оптимальной считается стратегия, при которой
гарантируется выигрыш в любом случае не меньший, чем «нижняя цена игры с
природой».
Таким образом, выбранные варианты полностью исключают риск и
принимающий решение не может столкнуться с худшим результатом, чем тот, на
который он ориентируется. К тому же данный критерий не требует знания
вероятностей состояний природы.
Согласно этому подходу оценкой стратегии i является число:
𝑉 (𝑖) = min 𝑎𝑖𝑗
1≤𝑗≤𝑛
Оптимальная по данному критерию стратегия находится из условия:
𝑉 (𝑖0 ) = max 𝑉 (𝑖) = max min 𝑎𝑖𝑗
1≤𝑖≤𝑚 1≤𝑗≤𝑛
1≤𝑖≤𝑚
Принцип оптимальности, основанный на критерий Вальда, называется
принципом максимина.
Если значения функции выигрыша имеют характер потерь (т.е. фактически
они являются не выигрышами, а проигрышами), то оценкой стратегии i является
max 𝑎𝑖𝑗 , а оптимальной будет та стратегия, при которой указанный максимум
1≤𝑗≤𝑛
достигает наименьшего значения, т.е. max 𝑎𝑖0 𝑗 = min max 𝑎𝑖𝑗 . Такая стратегия
1≤𝑗≤𝑛
1≤𝑖≤𝑚 1≤𝑗≤𝑛
называется минимаксной, а соответствующий принцип оптимальности называется
принципом минимакса.
Применение критерия Вальда оправдано, если:
о вероятности наступления того или иного состояния природы ничего
неизвестно;
5
Лекция 6 (ММвТУиИО)
не допускается никакого риска;
реализуется лишь малое количество решений.
Макси-максный критерий (ММ - критерий)
Правило выбора решения в соответствии с ММ-критерием можно
интерпретировать следующим образом:
матрица решений дополняется еще одним столбцом, состоящим из наибольших
результатов в каждой строке;
в добавленном новом столбце выбираются те варианты, в строках которых
стоят наибольшие значения.
𝑀𝑀(𝑖0 ) = m𝑎𝑥 𝑀𝑀 (𝑖) = max max 𝑎𝑖𝑗
1≤𝑖≤𝑚
1≤𝑖≤𝑚 1≤𝑗≤𝑛
Выбранные таким образом варианты предполагают некоторый риск. Это
означает, что принимающий решение может столкнуться с худшим результатом,
чем тот, на который он ориентируется.
Критерий Сэвиджа (S – критерий, минимаксного риска)
Критерий Сэвиджа или критерий минимального риска тоже крайне
пессимистический, но при выборе оптимальной стратегии советует
ориентироваться не на выигрыш, а на риск. Выбирается в качестве оптимальной та
стратегия, при которой величина риска в наихудших условиях минимальна.
Сущность такого подхода в том, чтобы всячески избегать большого риска
при принятии решения. В смысле «пессимизма» критерий Сэвиджа сходен с
критерием Вальда, но сам «пессимизм» здесь понимается по-другому. Он
использует матрицу рисков 𝑅 = {𝑟𝑖𝑗 } и рекомендует в условиях неопределенности
выбирать ту стратегию, при которой величина риска принимает наименьшее
значение в самой неблагоприятной ситуации, т.е.:
𝑆(𝑖0 ) = min 𝑆(𝑖) = min max 𝑟𝑖𝑗
1≤𝑖≤𝑚
1≤𝑖≤𝑚 1≤𝑗≤𝑛
Критерий Байеса-Лапласа (B-L - критерий)
Этот критерий предполагает, что известны вероятности q1, …, qn состояний
природы. Принцип выбора состоит в максимизации математического ожидания
выигрыша статистика: платежная матрица дополняется еще одним столбцом,
содержащим математическое ожидание значений выигрыша по каждой из строк, а
затем выбираются те стратегии А, в строках которых стоят наибольшие значение
этого столбца:
𝑛
𝐵𝐿𝑖0 = max 𝐵𝐿𝑖 = max ∑ 𝑎𝑖𝑗 𝑞𝑗
𝑖
где
𝑖
𝑗=1
i0 – искомая оптимальная стратегия статистика (игрок А);
aij – элементы платежной матрицы А;
q1, …, qn – вероятности состояний природы (игрок П).
6
Лекция 6 (ММвТУиИО)
Предполагается, что ситуация, в которой принимается решение,
характеризуется следующим:
вероятности появления состояний природы известны и не зависят от времени;
решение реализуется многократно;
для малого числа реализаций допускается некоторый риск.
При достаточно большом количестве реализаций среднее значение
постепенно стабилизируется, а риск снижается.
Критерий Лапласа (L - критерий, принцип недостаточного основания)
Основан на гипотезе равновероятности состояний природы, т.е. считается,
что все состояния природы могут наступить с равными вероятностями 𝑞𝑗= 1 , и
𝑛
отражает следующее утверждение: «поскольку мы ничего не знаем о состояниях
среды, то их надо считать равновероятными». При принятии данной гипотезы в
качестве оценки стратегии i берется соответствующий ей средний выигрыш, т.е.
𝑛
1
𝐿(𝑖) = ∑ 𝑎𝑖𝑗
𝑛
𝑗=1
Оптимальная по данному критерию стратегия находится из условия:
𝐿(𝑖0 ) = max 𝐿(𝑖)
1≤𝑖≤𝑚
Если в исходной задаче матрица возможных результатов представлена матрицей
затрат или рисков, то критерий Лапласа принимает следующий вид:
𝑛
1
𝐿(𝑖0 ) = min { ∑ 𝑟𝑖𝑗 }
1≤𝑖≤𝑚 𝑛
𝑗=1
Пример 6.4. Телефонная компания должна определить уровень своих
возможностей (Аi) по предоставлению телефонных услуг так, чтобы удовлетворить
спрос своих клиентов на планируемый период. Для каждого уровня спроса (Пj)
существует наилучший уровень возможностей телефонной компании с точки
зрения затрат на ввод нового тарифа (см.таблицу). Отклонения от этих уровней
могут привести к дополнительным затратам. Необходимо выбрать оптимальную
стратегию с использованием критериев Лапласа, Вальда, Сэвиджа.
А1
А2
А3
А4
П1
7
9
21
24
П2
10
6
18
22
П3
18
8
16
20
П4
22
25
21
26
Решение:
А) Критерий Лапласа
Ожидаемые затраты при различных действиях компании:
7
Лекция 6 (ММвТУиИО)
1
(7 + 10 + 18 + 22)
4
1
𝐿(𝐴2 ) = (9 + 6 + 8 + 25)
4
1
𝐿(𝐴3 ) = (21 + 18 + 16 + 21)
4
1
𝐿(𝐴4 ) = (24 + 22 + 20 + 26)
4
𝐿0 = min 𝐿(𝐴𝑖 ) = 𝐿(𝐴2 ) = 12
𝐿(𝐴1 ) =
= 14,25
= 12
= 19
= 23
𝑖
Наилучшей стратегией развития телефонных возможностей в соответствии с
критерием Лапласа является стратегия А2.
Б) Критерий Вальда
Т.к. в матрице представлены потери (затраты), то применим минимаксный
критерий:
П1
П2
П3
П4
max 𝑎𝑖𝑗 min max 𝑎𝑖𝑗
𝑖
𝑗
А1
А2
А3
А4
7
9
21
24
10
6
18
22
18
8
16
20
22
25
21
26
𝑗
22
25
21
26
21
Наилучшей стратегией развития телефонных возможностей в соответствии с
критерием Вальда является стратегия А3.
В) Критерий Сэвиджа
Составляем матрицу рисков (с учетом того, что мы имеем дело с матрицей затрат):
П1
П2
П3
П4
max 𝑟𝑖𝑗
min max 𝑟𝑖𝑗
𝑗
𝑖
𝑗
А1
4
10
1
10
А2
2
4
4
4
А3
14
12
8
14
А4
17
16
12
5
17
Полученные результаты вычислений с использованием критерия Сэвиджа
(минимального риска) приводят к выбору стратегии А2, обеспечивающей
наименьшие потери (затраты) в самой неблагоприятной ситуации (когда риск
максимален).
Пример 6.5. В процессе эксплуатации станка необходимо периодически его
останавливать для профилактических работ с заменой или без замены отдельных
компонент. Приостановка приводит к определенным экономическим издержкам. В
случае же, если профилактику и замену своевременно не проводить, то может
произойти поломка станка и вывод его из работы на более долгий (по сравнению с
профилактикой) срок, что приведет к еще большим убыткам.
8
Лекция 6 (ММвТУиИО)
Варианты решения: А1 – профилактика без замены отдельных частей; А2 –
профилактика и замена отдельных частей; А3 – отказ от профилактики. Станок
может находиться в следующих состояниях: П1 – работает и не требует
профилактики; П2 – работает и требуется профилактика; П3 – не работает и требует
ремонта.
Результаты, включающие затраты (потери) на профилактику и замену
отдельных компонент, а также затраты, связанные с ремонтом станка,
представлены в таблице:
П1
П2
П3
А1
-140
-160
-180
А2
-150
-170
-190
А3
-180
-220
Найти оптимальный вариант обслуживания станка с использованием критериев
Лапласа, Вальда, ММ-критерия, Сэвиджа.
Решение:
А) Критерий Лапласа
П1
А1
-140
А2
-150
А3
П2
-160
-170
-180
П3
-180
-190
-220
-160
-170
-133,33
Ожидаемые затраты:
1
(−140 − 160 − 180) = −160
3
1
𝐿(𝐴2 ) = (−150 − 170 − 190) = −170
3
1
𝐿(𝐴3 ) = (−180 − 220)
= −133,33
3
𝐿0 = max 𝐿(𝐴𝑖 ) = 𝐿(𝐴3 ) = −133,3
𝐿(𝐴1 ) =
𝑖
Т.о, наилучшей стратегией в соответствии с критерием Лапласа является стратегия
А3 .
Б) Критерий Вальда
П1
П2
П3
m𝑖𝑛 𝑎𝑖𝑗
max min𝑎𝑖𝑗
𝑗
А1
А2
А3
-140
-150
В) ММ-критерий
П1
А1
А2
А3
-140
-150
𝑖
𝑗
-160
-170
-180
-180
-190
-220
-180
-190
-220
-180
П2
П3
max 𝑎𝑖𝑗
max max 𝑎𝑖𝑗
-160
-170
-180
-180
-190
-220
-140
-150
𝑗
𝑖
𝑗
9
Лекция 6 (ММвТУиИО)
Г) Критерий Сэвиджа
Формируем матрицу рисков
П1
А1
А2
А3
140
150
П2
П3
max 𝑟𝑖𝑗
min max 𝑟𝑖𝑗
10
20
10
40
140
150
40
40
𝑗
𝑖
𝑗
ПРОИЗВОДНЫЙ КРИТЕРИИ В ИГРАХ С ПРИРОДОЙ
Критерий Гурвица (критерий пессимизма-оптимизма)
Данный критерий рекомендует при выборе решения не руководствоваться ни
крайним пессимизмом («всегда рассчитывай на худшее»), ни крайним оптимизмом
(«авось кривая вывезет»). Согласно данному критерию, стараясь занять наиболее
уравновешенную позицию, лицо, принимающее решение, может ввести оценочный
коэффициент
(критерий
пессимизма-оптимизма
Гурвица),
называемый
коэффициентом доверия или оптимизма, который находится в интервале [0, 1] и
отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и
крайнего пессимизма. Данный коэффициент определяется на основе
статистических исследований результатов принятия решений или личного опыта
лица, принимающего решения.
Данный критерий предполагает, что природа может находиться в самом
выгодном состоянии с вероятностью α и в самом невыгодном состоянии с
вероятностью (1-α), где α – коэффициент доверия (оптимизма).
Критерий Гурвица устанавливает баланс между случаями крайнего
оптимизма и крайнего пессимизма путем взвешивания обоих способов поведения
весами α и (1-α) соответственно, где 0≤α≤1.
Если в исходной задаче матрица возможных результатов представляет
выигрыш (прибыль, полезность, доход и т.п.), содержательно характеризуемый
словами «чем элемент матрицы больше, тем лучше ситуация для игрока А», то
критерий Гурвица записывается как:
𝐺 (𝑖0 ) = max [𝛼 max 𝑎𝑖𝑗 + (1 − 𝛼) min 𝑎𝑖𝑗 ]
1≤𝑖≤𝑚
1≤𝑗≤𝑛
1≤𝑗≤𝑛
(1)
Если α=0, то получаем критерий Вальда:
𝐺 (𝑖0 ) = 𝑉 (𝑖0 ) = max min 𝑎𝑖𝑗
1≤𝑖≤𝑚 1≤𝑗≤𝑛
Если α=1, то получаем MM-критерий:
𝐺 (𝑖0 ) = 𝑀𝑀(𝑖0 ) = max max 𝑎𝑖𝑗
1≤𝑖≤𝑚 1≤𝑗≤𝑛
10
Лекция 6 (ММвТУиИО)
Если матрица возможных результатов представляет затраты (потери, проигрыш),
содержательно характеризуемые словами «чем элемент матрицы меньше, тем
лучше ситуация для игрока А»,то критерий Гурвица записывается как:
𝐺 (𝑖0 ) = min [𝛼 min 𝑎𝑖𝑗 + (1 − 𝛼) max 𝑎𝑖𝑗 ]
1≤𝑖≤𝑚
1≤𝑗≤𝑛
(2)
1≤𝑗≤𝑛
Критерий Гурвица применяется в ситуациях, когда:
информация о состояниях среды отсутствует или недостоверна;
необходимо считаться с появлением каждого состояния природы;
реализуется только малое количество возможных решений;
допускается некоторый риск.
В технических приложениях сложно выбрать весовой множитель α, т.к.
трудно найти количественную характеристику для тех долей оптимизма и
пессимизма, которые присутствуют при принятии решения, поэтому здесь чаще
всего выбирают α=0,5.
Пример 6.6. Для данных примера 6.4 (затраты) найти оптимальную
стратегию с использованием критерия Гурвица, приняв α=0,5.
Решение:
Отметим, что из постановки (см. Пример 6.4) следует, что для игрока А
(лицо, принимающее решение) справедливо утверждение - «чем элемент матрицы
меньше, тем лучше ситуация для игрока А». Поэтому используем формулу (2):
П1
П2
П3
П4
min 𝑎𝑖𝑗
𝑗
max 𝑎𝑖𝑗
𝑗
𝐺(𝑖) = 𝛼 min 𝑎𝑖𝑗 +
1≤𝑗≤𝑛
(1 − 𝛼) max 𝑎𝑖𝑗
min 𝐺(𝑖)
𝑖
1≤𝑗≤𝑛
А1
А2
А3
А4
7
9
21
24
10
6
18
22
18
8
16
20
22
25
21
26
7
6
16
20
22
25
21
26
14,5
15,5
18,5
23
14,5
Пример 6.7. Для данных примера 6.5 (тоже затраты, но со знаком «-»)
найти оптимальную стратегию с использованием критерия Гурвица, приняв α=0,5.
Решение:
Здесь из постановки (см. Пример 6.5) следует, что для игрока А (лицо,
принимающее решение) справедливо утверждение - «чем элемент матрицы
больше, тем лучше ситуация для игрока А». Поэтому используем формулу (1):
max 𝑎𝑖𝑗 +
П1
П2
П3
min 𝑎𝑖𝑗 max 𝑎𝑖𝑗 𝐺(𝑖) = 𝛼 1≤𝑗≤𝑛
m𝑎𝑥 𝐺(𝑖)
𝑗
𝑗
(1 − 𝛼) min 𝑎𝑖𝑗
𝑖
1≤𝑗≤𝑛
А1
А2
А3
-140
-150
-160
-170
-180
-180
-190
-220
-180
-190
-220
-140
-150
-160
-170
-110
-110
11