Биматричные игры
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Биматричные игры
Не всегда интересы двух игроков противоположны, как это имеет место в антагонистических играх. Часто встречаются ситуации, в которых интересы участников взаимодействия не являются противоположными. Проиллюстрируем это на классическом примере, называемом «Дилемма заключенного».
Дилемма заключенного 1. Двое подозреваемых (A и B) в совершении преступления арестованы, помещены в одиночные камеры и не имеют возможности передавать друг другу какие-либо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то им грозит (с учетом их признания) тюремное заключение сроком по 6 лет каждому. Если оба не признаются, то они получат по 1 году тюремного заключения. Если же один из них сознается, а другой – нет, то первый, за содействие следствию, будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию – 10-летнему тюремному заключению.
Описанная ситуация может быть представлена следующей игрой с матрицами выигрышей для заключённых A и B соответственно
и
Здесь первые строки матриц выигрышей соответствуют стратегии заключенного A «молчать», а вторые строки – стратегии «сознаться». При этом первые столбцы матриц выигрышей соответствуют стратегии заключенного B «молчать», а вторые столбцы – стратегии «сознаться».
Очевидно, что стратегия «молчать» является строго доминируемой для каждого игрока (так как ни один из них не знает, что предпримет другой), поэтому каждый игрок выберет стратегию «сознаться». В результате оба заключенных получат по 6 лет тюремного заключения. При этом мы сразу же сталкиваемся с очевидной проблемой: получающийся результат игры очень плохой – он дает максимальный суммарный срок заключения. Этот факт послужил толчком к многочисленным исследованиям данной игры, поскольку, например, естественным желанием было бы получить в качестве результата игры (или ее модификаций) выбор стратегий «молчать», дающий каждому заключенному лишь по одному году заключения.
Такая же проблема возникает и в следующей экономико-политической задаче (в силу схожести специфики с предыдущей задачей мы сохраняем прежнее название).
Дилемма заключенного 2. Рассмотрим две нефтедобывающие страны A и B. Эти страны могут кооперироваться, договариваясь об объёмах ежедневной добычи нефти, ограничиваясь, например, добычей 2 млн. баррелей нефти в день для каждой страны. Но страны могут действовать и некооперативно, добывая, например, по 4 млн. баррелей в день. Таким образом, считаем, что у игроков A и B по две стратегии: A1, B1 – договориться об ограничениях по добыче нефти; A2, B2 – добывать нефть без всяких ограничений. Такая ситуация может быть представлена игрой со следующими матрицами выигрышей для стран A и B соответственно:
и .
В матрицах указаны прибыли (млн. долларов в день) стран в зависимости от их объемов добычи нефти. Очевидно, что у каждой страны есть стимул отклониться от договора, чтобы за счет увеличения объемов производства получить дополнительную прибыль. Мы видим, что и здесь у каждого из игроков есть доминирующая стратегия – «не кооперироваться». В итоге страны получают прибыль 32 и 24 (млн. долларов в день), что гораздо меньше, чем в ситуации кооперативного поведения.
Таким образом, мы сталкиваемся с феноменом, аналогичным предыдущей задаче: оба игрока выбирают свои доминирующие стратегии, увеличивая тем самым свои выигрыши, но исход для каждого из них хуже, чем в ситуации, когда оба следуют доминируемым стратегиям.
Рассмотрим конфликт, в котором участвуют игроки A и B. Пусть игрок A имеет стратегии A1, A2,…, Am, а игрок B – стратегии B1, B2,…, Bn. При этом выбранной игроками стратегии соответствуют выигрыши и игроков A и B соответственно. Вообще говоря, . Таким образом, в такой игре существуют две различные матрицы выигрышей
и , ,
для игроков A и B соответственно. В этом случае игру называют биматричной. Очевидно, что антагонистические игры являются частным случаем биматричных игр в случае, когда для всех , . Иногда, биматричную игру представляют одной матрицей
с элементами . Случай, когда , , , соответствует матричной игре.
Рассмотрим смешанные стратегии игроков при многократном повторении игры
и
Средние выигрыши игроков определяются математическими ожиданиями
и .
Определение. Будем говорить, что пара векторов и определяют равновесную ситуацию (точку равновесия), если при любых векторах и , элементы которых удовлетворяют условиям и , выполняются неравенства
и . (1)
Неравенства (1) означают, что отклонение игроков от равновесной ситуации может только уменьшить их выигрыши. Возникает вопрос: всегда ли существует равновесная ситуация? Положительный ответ на этот вопрос дает следующая теорема.
Теорема 1 (Дж. Нэш). Любая биматричная игра имеет хотя бы одну точку равновесия в чистых или смешанных стратегиях.
Замечание. Равновесие по Нэшу в биматричных играх – это обобщение понятия седловой точки (оптимального решения) в играх с нулевой суммой.
Рассмотрим примеры нахождения точки равновесия. Сначала изучим самую простую биматричную игру с матрицами выигрышей
и .
Пусть смешанные стратегии игроков имеют вид
и .
Тогда средние выигрыши HA и HB игроков A и B будут зависеть только от двух переменных p и q. При использовании стратегий и средние выигрыши игроков составят:
(2)
Для биматричных игр справедлива следующая теорема.
Теорема 2. Неравенства (1) для равновесных ситуаций эквивалентны следующей системы неравенств
(3)
Теорема 2 означает, что для нахождения равновесной пары , где , достаточно проверить справедливость неравенств (1) не для всех значений вероятностей p и q, а только для чистых стратегий каждого из игроков.
Преобразуем функции выигрышей (2) к виду, удобному для применения теоремы 2
(4)
Полагая в (4) и , получим
Следовательно,
(5)
Если ввести обозначения
(6)
то формулы (5) примут вид
Так как в точке равновесия выполняются неравенства (3), то получаем систему неравенств:
Аналогичным образом, рассматривая разности , и вводя обозначения
(7)
получим систему неравенств
В итоге пара определяет равновесную ситуацию в биматричной игре тогда и только тогда, когда выполняется система неравенств
(8)
где , , , вычисляются по формулам (6) и (7) и могут принимать любые значения.