Справочник от Автор24
Поделись лекцией за скидку на Автор24

Графический метод решения матричных игр (часть 1)

  • 👀 816 просмотров
  • 📌 801 загрузка
Выбери формат для чтения
Статья: Графический метод решения матричных игр (часть 1)
Найди решение своей задачи среди 1 000 000 ответов
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Графический метод решения матричных игр (часть 1)» pdf
Лекция 3 (ММвТУиИО) ГРАФИЧЕСКИЙ МЕТОД РЕШЕНИЯ МАТРИЧНЫХ ИГР Рассмотрение методов поиска решения матричных игр начнем с игр, в которых число стратегий, хотя бы одного из игроков равно двум. Для построения решений 2 x n- и m x 2-игр существует эффективный метод, основанный на простых геометрических построениях - графический (точнее, графо - аналитический) метод. Начнем нахождение оптимальных смешанных стратегий на примере простейшей игры, описываемой платежной матрицей 2 х 2: 𝑎11 𝑎12 А = (𝑎 (1) 𝑎22 ) 21 Пусть смешанные стратегии игроков имеют вид: Р = {p1, p2} и Q = {q1, q2} Оптимальные стратегии первого игрока (𝑝10 и 𝑝20 = 1 − 𝑝10 ) и цена игры ν должны удовлетворять условиям: { 𝑎11 𝑝10 + 𝑎21 𝑝20 =𝜈 𝑎12 𝑝10 =𝜈 + 𝑎22 𝑝20 или 𝑎11 𝑝10 + 𝑎21 (1 − 𝑝10 ) = 𝑎12 𝑝10 + 𝑎22 (1 − 𝑝10 ) Откуда получаем (аналитически!) следующее решение матричной игры (1): 𝑝10 = 𝑎22 −𝑎21 𝑎11 +𝑎22 −(𝑎12 +𝑎21 ) 𝑎11 −𝑎12 = 1 − 𝑝10 = 𝑎11 +𝑎22 −(𝑎12 +𝑎21 ) 𝑎11 𝑎22 −𝑎12 𝑎21 𝑎11 𝑝10 1 + 𝑎21 𝑝20 = 𝑎11 +𝑎22 −(𝑎12 +𝑎21 ) 𝑝20 (2) 𝜈= { Вычислив оптимальное значение ν, можно вычислить и оптимальную смешанную стратегию второго игрока из условия или 𝑎11 𝑞1 + 𝑎12 𝑞2 = 𝜈 𝑎11 𝑞1 + 𝑎12 (1 − 𝑞1 ) = 𝜈 Что дает: 𝑞10 = 𝜈−𝑎12 𝑎11 −𝑎12 , 𝑞20 = 1 − 𝑞10 = 𝑎11 −𝜈 𝑎11 −𝑎12 (3) при 𝑎11 ≠ 𝑎12 Замечание. В случае равенства 0 знаменателей в формулах (2) и (3) у игры существует решение в чистых стратегиях (наглядно это видно на графиках). Эту задачу можно решить графически, учитывая, что решение системы (1) представляет собой геометрически точку пересечения двух прямых на плоскости (p1, ν) или (1- p1, ν). 1 Лекция 3 (ММвТУиИО) Отсюда следует и простой алгоритм геометрического способа решения игры 2 х 2: 1. На оси абсцисс откладываем отрезок единичной длины 𝑝1 = 𝑝 ∈ [0, 1]. 2. На оси ординат откладываем выигрыши игрока А при стратегии А2, а на прямой р=1 – выигрыши при стратегии А1. 3. Проводим прямые, проходящие через точки: а) (0, а21) и (1, а11); б) (0, а22) и (1, а12). 4. Находим точку пересечения этих прямых, которая и дает решение матричной игры (𝑝10 , 𝜈). Данный алгоритм проиллюстрирован на рис. 1. ν a21 a12 ν a11 a22 𝒑𝟎𝟏 1 p Рис. 1 Пример 3.1. Решить матричную игру 2 х 2, заданную платежной матрицей: 3 8 ) А=( 7 4 Решение. Определим сначала верхнюю и нижнюю цену игры: B1 B2 А1 3 8 3 А2 7 4 4 8 7 Нижняя цена игры α = 4 и ей соответствует стратегия А2. Верхняя цена игры β = 7 и ей соответствуют стратегии В1. Т.к. нижняя цена игры меньше верхней (α<β), то игра не имеет седловой точки, что приводит к необходимости рассмотрения смешанной стратегии. По формулам (2) находим: 2 Лекция 3 (ММвТУиИО) 𝑎22 − 𝑎21 4−7 = = 0,375 𝑎11 + 𝑎22 − (𝑎12 + 𝑎21 ) 3 + 4 − 7 − 8 𝑝20 = 1 − 𝑝10 = 1 − 0,375 = 0,625 𝜈 = 3 ∙ 0,375 + 7 ∙ 0,625 = 5,5 По формулам (3) определим смешанную стратегию второго игрока: 𝜈 − 𝑎12 5,5 − 8 𝑞10 = = = 0,5, 𝑞20 = 1 − 𝑞10 = 0,5 𝑎11 − 𝑎12 3−8 Ответ: Р ={0,375; 0,625}, Q ={0, 5; 0, 5}, 𝜈 = 5, 5 Графическое решение задачи показано на рис. 2. 𝑝10 = ν 7 8 5,5 4 3 0,375 1 p Рис. 2 Переходим к более сложным играм с двумя стратегиями у одного игрока. Игры 2 x n Пусть задана платежная матрица игры 2 x n: 𝑎11 𝑎12 … 𝑎1𝑛 (𝑎 𝑎22 … 𝑎2𝑛 ) 21 Согласно теореме 2 нахождение цены игры и оптимального значения p0 для игрока А равносильно решению уравнения: 𝜈 = min (𝑎1𝑗 𝑝0 + 𝑎2𝑗 (1 − 𝑝0 )) = max min (𝑎1𝑗 𝑝 + 𝑎2𝑗 (1 − 𝑝 )) , 𝑗 = ̅̅̅̅̅ 1, 𝑛 𝑗 0≤𝑝≤1 𝑗 Исходя из этого, опишем общую схему, приводящую к нахождению решения. Максимум функции: min (𝑎1𝑗 𝑝 + 𝑎2𝑗 (1 − 𝑝 )) 𝑗 (4) проще всего найти, построив ее график. Предположим, что игрок А выбрал смешанную стратегию P={p, 1-p}, а игрок В – j-ю чистую стратегию Bj, j=1, …, n. Тогда средний выигрыш игрока А в ситуации {P, Bj} будет равен: 3 Лекция 3 (ММвТУиИО) (j): 𝜈𝑗 = 𝑎1𝑗 𝑝 + 𝑎2𝑗 (1 − 𝑝) На плоскости (p,ν), где 𝑝 ∈ [0, 1], это уравнение (j) задает прямую. Т.о., каждой чистой стратегии Вj игрока В на этой плоскости соответствует своя прямая. Поэтому в качестве первого шага на плоскости (p, ν) проводятся все эти прямые (рис. 3): (j): 𝜈 = 𝑎1𝑗 𝑝 + 𝑎2𝑗 (1 − 𝑝), j=1, …, n ν 1 p Рис. 3 В качестве второго шага для каждого значения р, 0≤р≤1, путем визуального сравнения соответствующих ему значений ν на каждой из построенных прямых определяется и отмечается наименьшее значение (рис. 4). ν 1 p Рис. 4 4 Лекция 3 (ММвТУиИО) В результате описанной процедуры выделяется ломаная, которая и является графиком функции (4) (жирная линия на рис. 4). Эта ломаная огибает снизу все семейство построенных прямых, и ее принято называть нижней огибающей этого семейства. Верхняя точка построенной нижней огибающей и определяет цену игры – ν, и оптимальную стратегию P0 = {p0, 1-p0} игрока А (рис. 5). Описанная процедура может рассматриваться как некоторый аналог максиминного подхода при отсутствии седловой точки. ν ν p0 1 p Рис. 5 Пример 3.2. Рассмотрим игру, заданную матрицей 2х6: 6 4 3 1 −1 0 ( ) −2 −1 1 0 5 4 Решение. 1-ый шаг. Анализ игры на наличие седловой точки. Нижняя цена игры равна -1, верхняя – равна 1. Седловой точки нет. Решение игры нужно искать в смешанных стратегиях. 2-ой шаг. Вычисление средних выигрышей игрока А (проводится при условии, что игрок В выбирает только чистые стратегии). 𝑝 | 6 4 3 1 −1 0 Из таблицы 1 − 𝑝 | −2 −1 1 0 5 4 Получаем В1: 𝑤 = 6𝑝 − 2(1 − 𝑝) В2: 𝑤 = 4𝑝 − (1 − 𝑝) В3: 𝑤 = 3𝑝 + (1 − 𝑝) В4 : 𝑤 = 𝑝 В5: 𝑤 = −𝑝 + 5(1 − 𝑝) В6 : 𝑤 = 4 ( 1 − 𝑝 ) или после упрощения: В1: 𝑤 = 8𝑝 − 2 5 Лекция 3 (ММвТУиИО) В2: 𝑤 = 5𝑝 + 1 В3: 𝑤 = 2𝑝 + 1 В4 : 𝑤 = 𝑝 В5: 𝑤 = −6𝑝 + 5 В6: 𝑤 = −4𝑝 + 4 3-ий шаг. Построение нижней огибающей Строим на координатной плоскости (p, w) все шесть прямых, уравнения которых получены на 2-м шаге (рис. 6), и находим их нижнюю огибающую. ν 7 6 5 В1 4 В2 3 В3 2 В4 1 В5 ν -1 p0 В6 1 p -2 -3 Рис. 6 4-ый шаг. Отыскание цены игры и оптимальной смешанной стратегии игрока А При построении нижней огибающей видно, что в наивысшей точке пересекаются прямые В4 и В5, заданные уравнениями 𝜈 = 𝑝 и 𝜈 = −6𝑝 + 5 соответственно. Решая 𝜈=𝑝 {𝜈 = −6𝑝 + 5 систему уравнений получаем { 𝑝0 = 𝜈= 5 7 5 7 Тем самым, цена игры и оптимальная стратегия игрока А соответственно равны: 5 5 2 𝜈= , 𝑃0 = { , } 7 7 7 В принципе, на этом этапе решение игры для игрока А заканчивается, т.к. его интересует отыскание собственной оптимальной стратегии и ожидаемого наилучшего гарантированного результата. Следует отметить, что, решая матричную игру, исследователь обычно отождествляет себя с одним из игроков (как правило, это игрок А), считая другого своим противником. Это приводит к тому, что основное внимание уделяется 6 Лекция 3 (ММвТУиИО) поиску оптимальных стратегий только игрока А, а стратегии противника могут вообще не интересовать исследователя. Однако в ряде случаев оказывается важным знать оптимальные смешанные стратегии обоих игроков. Поэтому рассмотрим алгоритм поиска параметров оптимальной стратегии и для игрока В. В зависимости от формы нижней огибающей возможны несколько случаев. Случай А. Нижняя огибающая имеет ровно одну наивысшую точку (𝑝0 , 𝜈 0 ): 1) Если 𝑝0 = 0 (оптимальная стратегия игрока А – это чистая стратегия А2), то игроку В выгодно применить чистую стратегию Вj, соответствующую прямой, проходящей через точку (0, 𝜈 0 ) и имеющей наибольший отрицательный наклон в этой точке (рис. 7). νw ν0 Bj 1 p Рис. 7 2) Если 𝑝0 = 1 (оптимальная стратегия игрока А – чистая стратегия А1), то w ν0 Bj 1 p Рис. 8 7 Лекция 3 (ММвТУиИО) оптимальной для игрока В является чистая стратегия Вj, соответствующая прямой, проходящей через точку (1, 𝑣 0 ) и имеющей наибольший положительный наклон в этой точке (рис. 8). 3) Если 0 < 𝑝0 < 1, то в наивысшей точке нижней огибающей пересекаются, по меньшей мере, две прямые, одна из которых Вk (соответствующая стратегии Вk игрока В) имеет положительный наклон, а другая Вl – отрицательный (рис. 9). В этом случае оптимальная смешанная стратегия игрока В получается, если положить qk = q, ql = 1-q, qj = 0, j ≠ k,l, где q – решение уравнения a1kq + a1l(1-q) = a2kq + a2l(1-q) ν Bk ν0 Bl 1 p Рис. 9 Случай Б. Нижняя огибающая содержит горизонтальный участок, соответствующий чистой стратегии Вk игрока В, которая и является оптимальной для него (рис. 10). ν ν0 Bj 1 p Рис. 10 8 Лекция 3 (ММвТУиИО) Пример 3.2 (продолжение). Покажем, как найти полное решение игры, т.е. еще и оптимальную смешанную стратегию игрока В: 𝑄0 = {𝑞10 , 𝑞20 , 𝑞30 , 𝑞40 , 𝑞50 , 𝑞60 } 1) выделяя из шести чистых стратегий игрока В стратегии В4 и В5, которым соответствуют прямые, определяющие наивысшую точку нижней огибающей, положим 𝑞10 = 0, 𝑞20 = 0, 𝑞30 = 0, 𝒒𝟎𝟒 = 𝒒, 𝒒𝟎𝟓 = 𝟏 − 𝒒, 𝑞60 = 0, 2) приравняем к найденной цене игры любой из двух средних выигрышей игрока В (в случае, когда игрок А выбирает одну из своих чистых стратегий), отвечающих предложенной смешанной стратегии 0 0 𝑞 1−𝑞 0 __ __ __ __ __ __ 6 4 3 1 −1 −2 −1 1 0 5 4 5 5 или 5(1 − 𝑞) = 7 7 3) решая любое из этих уравнений, получаем один и тот же результат 6 6 𝑞0 = , 𝑞0 = 7 7 Т.о. полное решение игры имеет следующий вид 5 2 6 1 5 𝑃 0 = { , }, 𝑄0 = {0,0,0, , , 0} , 𝜈= 7 7 7 7 7 𝑞 − (1 − 𝑞 ) = Замечание. Ситуацию с наличием лишь двух конкурирующих стратегий игрока А нельзя считать надуманной, поскольку на практике она возникает сравнительно часто. Например, в случае, если нужно сравнить два образца некоторого изделия (скажем, старого и модернизированного) с целью выяснения возможности замены, это удобно сделать, используя формализацию с помощью платежной матрицы 2хn. 9
«Графический метод решения матричных игр (часть 1)» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач

Тебе могут подойти лекции

Смотреть все 938 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot