Справочник от Автор24
Поделись лекцией за скидку на Автор24

Графический метод решения матричных игр

  • 👀 818 просмотров
  • 📌 747 загрузок
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Графический метод решения матричных игр» pdf
Лекция 4 (ММвТУиИО) ГРАФИЧЕСКИЙ МЕТОД РЕШЕНИЯ МАТРИЧНЫХ ИГР (ЧАСТЬ 2) Игры m x 2 Пусть теперь в матричной игре две чистые стратегии имеет игрок В, а число чистых стратегий у игрока А произвольно (равно m). Это означает, что платежная матрица такой игры имеет следующий вид: 𝑎11 𝑎12 𝑎21 𝑎22 ( … … ) 𝑎𝑚1 𝑎𝑚2 Анализ этой игры во многом напоминает рассуждения, проведенные в Лекции №3 для игры 2 х n. Этап 1. Пусть Q = {q, 1-q} – произвольная смешанная стратегия игрока В. Этап 2. Если игрок А выбирает i-ю чистую стратегию, i=1, 2, …, m, то средний проигрыш игрока В в ситуации {i, Q} будет равен: (i) : w = ai1 * q + ai 2 * (1-q), i=1, 2, …, m Этап 3. Зависимость этого проигрыша (w) от q описывается прямой на плоскости (q, w). Этап 4. Графиком функции max (𝑎𝑖1 𝑞 + 𝑎𝑖2 (1 − 𝑞)) 1≤𝑖≤𝑚 является верхняя огибающая семейства прямых (i), соответствующих чистым стратегиям игрока А (рис. 1) w w0 q0 1 q Рис. 1 1 Лекция 4 (ММвТУиИО) Этап 5. Абсцисса q0 нижней точки полученной огибающей (ломаной) определяет оптимальную смешанную стратегию игрока В, а ордината w0 – цену игры. Этап 6. Нахождение оптимальной смешанной стратегии игрока А проводится по той же схеме (возможны несколько случаев, показанных на рис. и примерах ниже), которая использовалась для определения оптимальной смешанной стратегии игрока В в игре 2 х n, с поправкой на то, что в данном случае:  уже найдена смешанная стратегия для игрока В (см. выше);  необходимо выделить те стратегии А, которые обеспечивают достижение оптимальной цены игры, найденной при поиске решения для В. Случай А. Верхняя огибающая имеет ровно одну низшую точку (𝑝0 , 𝑤 0 ): 1) Если 𝑞0 = 0 (оптимальная стратегия игрока В – это чистая стратегия В2), то игроку A выгодно применить чистую стратегию Aj, соответствующую прямой, проходящей через точку (0, 𝑤 0 ) и имеющей наибольший положительный наклон: w Aj w0 1 q 2) Если 𝑞0 = 1 (оптимальная стратегия игрока B – чистая стратегия B1), то оптимальной для игрока A является чистая стратегия Aj, соответствующая прямой, проходящей через точку (1, 𝑤 0 ) и имеющей наибольший отрицательный наклон: 2 Лекция 4 (ММвТУиИО) w Aj w0 1 q 3) Если 0 < 𝑞0 < 1, то в низшей точке верхней огибающей пересекаются, по меньшей мере, две прямые, одна из которых Ak (соответствующая стратегии Ak игрока A) имеет положительный наклон, а другая Al – отрицательный. В этом случае оптимальная смешанная стратегия игрока A получается, если положить pk = p, pl = 1-p, pj = 0, j ≠ k,l, где p – решение уравнения ak1 * p + a1l * (1-p) = ak2 * p + al2 * (1-p) w Ak Al w0 q0 1 q Случай Б. Верхняя огибающая содержит горизонтальный участок, соответствующий чистой стратегии Аj игрока А, которая и является оптимальной для него: 3 Лекция 4 (ММвТУиИО) w Aj w0 1 q Описанная процедура может рассматриваться как некоторый аналог минимаксного подхода при отсутствии седловой точки. Пример 4.1. Пусть игра 3х2 задана следующей матрицей и требуется найти ее решение: 3 −1 (−1 3 ) 1 Решение. 1-ый шаг. Анализ игры на наличие седловой точки. Нижняя цена игры равна 0, верхняя – равна 3: седловой точки нет. Решение игры нужно искать в смешанных стратегиях. 2-ой шаг. Вычисление средних проигрышей игрока В (проводится при условии, что игрок А выбирает только чистые стратегии). Из таблицы игры 𝑞 1−𝑞 ___ ___ 3 −1 −1 3 1 получаем три уравнения: A1: 𝑤 = 3𝑞 − (1 − 𝑞 ) A2: 𝑤 = −𝑞 + 3(1 − 𝑞 ) A3 : 𝑤 = 𝑞 или после упрощения: 4 Лекция 4 (ММвТУиИО) A1: 𝑤 = 4𝑞 − 1 A2: 𝑤 = −4𝑞 + 3 A3 : 𝑤 = 𝑞 3-ий шаг. Построение верхней огибающей Строим на координатной плоскости (q, w) все прямые, уравнения которых получены на 2-м шаге (рис. 2), и находим их верхнюю огибающую. А1 w А3 1 p А2 Рис. 2 4-ый шаг. Нахождение цены игры и оптимальной смешанной стратегии игрока B. Нижняя точка верхней огибающей является точкой пересечения прямых А1 и А2. Решая систему уравнений 𝑤 = 4𝑞 − 1 { 𝑤 = −4𝑞 + 3 получаем 1 𝑞 = { 2 𝑤0 = 1 5-ый шаг. Нахождение оптимальной смешанной стратегии игрока А Полагая 𝑝10 = 𝑝, 𝑝20 = 1 − 𝑝, 𝑝30 = 0 , приравниваем два средних выигрыша игрока А (когда игрок В выбирает только свои чистые стратегии) к цене игры: 3𝑝 − (1 − 𝑝) = 1 − 𝑝 + 3(1 − 𝑝 ) = 1 и находим 5 Лекция 4 (ММвТУиИО) 1 2 Таким образом, цена игры и оптимальные смешанные стратегии игроков А и В равны: 𝑝0 = 1 1 𝑃0 = { , , 0}, 2 2 1 1 𝑄0 = { , } , 𝜈 = 1 2 2 6 Лекция 4 (ММвТУиИО) ДОМИНИРОВАНИЕ СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКОЙ ИГРЕ В принципе решение любой матричной игры, как будет показано в Лекции №5, сводится к решению стандартной задачи линейного программирования и т.о. может быть найдено методами линейного программирования (этому будет посвящена Лекция №5). При этом требуемый объем вычислений напрямую зависит от числа чистых стратегий игроков (растет с его увеличением и, значит, с увеличением размеров матрицы игры). Поэтому любые приемы предварительного анализа игры, позволяющие уменьшать размеры ее платежной матрицы или еще как-то упростить эту матрицу, не нанося ущерба решению, играют на практике важную роль. В ряде случаев анализ платежной матрицы показывает, что некоторые чистые стратегии не могут внести никакого вклада в искомые оптимальные смешанные стратегии. Отбрасывание таких стратегий позволяет заменить первоначальную матрицу матрицей выигрышей меньших размеров. Рассмотрим антагонистическую матричную игру двух лиц с нулевой суммой, заданную платежной матрицей: 𝑎11 𝑎12 … 𝑎1𝑛 𝑎21 𝑎22 … 𝑎2𝑛 А=( … … … … ) 𝑎𝑚1 𝑎𝑚2 … 𝑎𝑚𝑛 1. Будем говорить, что i-я строка матрицы А 𝑎𝑖1 𝑎𝑖2 … не больше j-й строки этой матрицы 𝑎𝑗1 𝑎𝑗2 … 𝑎𝑖𝑛 𝑎𝑗𝑛 , если одновременно выполнены следующие n неравенств: 𝑎𝑖1 ≤ 𝑎𝑗1 , 𝑎𝑖2 ≤ 𝑎𝑗2 , … , 𝑎𝑖𝑛 ≤ 𝑎𝑗𝑛 При этом также говорят, что j-я строка доминирует i-ю строку или, что стратегия Aj игрока А доминирует стратегию Ai. Игрок А поступит разумно, если будет избегать стратегий, которым в матрице игры отвечают доминируемые строки. 2. Стратегия Aj игрока А дублирует стратегию Ai, если все выигрыши в j-ой строке равны соответствующим выигрышам в i-ой строке. Если в матрице А одна из строк (например, j-ая) доминирует или дублирует другую строку (например, i-ую), то число строк в матрице А можно уменьшить путем отбрасывания доминируемой / дублируемой (i-ой) строки. 3. Будем говорить, что k-ый столбец матрицы А 7 Лекция 4 (ММвТУиИО) 𝑎1𝑘 𝑎2𝑘 … 𝑎𝑚𝑘 не меньше l-го столбца этой матрицы 𝑎1𝑙 𝑎2𝑙 … 𝑎𝑚𝑙 если одновременно выполнены следующие m неравенств: 𝑎1𝑘 ≥ 𝑎1𝑙 , 𝑎2𝑘 ≥ 𝑎2𝑙 , … , 𝑎𝑚𝑘 ≥ 𝑎𝑚𝑙 При этом говорят, что l-ый столбец доминирует k-ый столбец или что стратегия Bl игрока B доминирует стратегию Bk. Игрок B поступит разумно, если будет избегать стратегий, которым в матрице игры отвечают доминируемые столбцы. 4. Стратегия Вl игрока В дублирует стратегию Bk, если все проигрыши В в l-ом столбце равны соответствующим проигрышам в k-ом столбце. Если в матрице А один из столбцов (например, l-ый) доминирует или дублирует другой столбец (например, k-ый), то число столбцов в матрице В можно уменьшить путем отбрасывания доминируемого /дублируемого (k-го) столбца. Оптимальные смешанные стратегии в игре с матрицей, полученной усечением исходной за счет доминируемых строк и столбцов, дадут оптимальное решение в исходной игре т.к.:  доминируемые чистые стратегии игроков в смешении не участвуют;  соответствующие доминируемым стратегиям вероятности следует принять равными нулю. Нужно отметить, что при отбрасывании доминируемых строк и столбцов некоторые из оптимальных стратегий могут быть потеряны. Однако цена игры при этом не изменится и по усеченной матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий. Пример 4.2. Рассмотрим игру с матрицей 4 7 2 3 4 3 5 6 8 9 4 4 2 2 8 3 6 1 2 4 (3 5 6 8 9) Стратегия А5 дублирует стратегию А2, поэтому любую из них можно отбросить. Сравнивая, далее, А1 и А4 видим, что А1 доминирует над стратегией А4 и А4 можно отбросить. Отбросив стратегии А5 и А4 получаем игру 3х5: 8 Лекция 4 (ММвТУиИО) 4 7 2 3 4 ( 3 5 6 8 9) 4 4 2 2 8 Рассматривая полученную матрицу видим, что стратегия В1 доминирует над стратегией В2. Кроме того, стратегия В3 доминирует над стратегиями В4 и В5. Отбрасывая доминируемые стратегии, получаем игру 3х2: 4 2 (3 6 ) 4 2 Теперь видно, что стратегии А1 и А3 дублируют друг друга. Отбросив стратегию А3 окончательно получаем игру 2х2. 4 2 ( ) 3 6 Тем самым исходная игра 5х5 сводится к игре 2х2, решение которой легко находится графическим методом. Пример 4.3. Рассмотрим игру, описываемую следующей, матрицей: −1 0 2 1 −2 0 1 ( ) 2 1 −1 −2 −1 0 2 1 Сравнивая строки матрицы видим, что 1-я строка совпадает с 4-ой строкой, т.е. стратегия А4 дублирует стратегию А1 - одну из этих строк можно вычеркнуть, не нанося ущерба решению (убираем 4-ую строку): −1 0 2 1 (−2 0 1 0) 2 1 −1 −2 Сравнивая поэлементно 1-ю и 2-ю строки, замечаем, что 1-я строка доминирует 2-ю строку, т.е. стратегия А1 доминирует стратегию А2. Это также позволяет уменьшить число строк матрицы (убираем 2-ую строку): −1 0 2 1 ( ) 2 1 −1 −2 Замечая, что 4-й столбец доминирует 3-й столбец, убирая 3-ий, получаем игру с матрицей 2х3: −1 0 1 ( ) 2 1 −2 Решая эту игру графоаналитическим методом, находим ее решение – цену игры и оптимальные смешанные стратегии игроков А и В: 2 1 1 1 { , }, { , 0, } 𝜈 = 0, 3 3 2 2 Возвращаясь к исходной игре 4х4 и учитывая исключенные стратегии, получаем решение исходной игры: 9 Лекция 4 (ММвТУиИО) 𝜈 = 0, 2 1 𝑃0 = { , 0, , 0} , 3 3 1 1 𝑄0 = { , 0,0, } 2 2 10
«Графический метод решения матричных игр» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты

Тебе могут подойти лекции

Смотреть все 938 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot