«Биматричные игры» - конспект лекции

Конспект лекции по дисциплине «Биматричные игры», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Биматричные игры», Word формат

Биматричные игры Не всегда интересы двух игроков противоположны, как это имеет место в антагонистических играх. Часто встречаются ситуации, в которых интересы участников взаимодействия не являются противоположными. Проиллюстрируем это на классическом примере, называемом «Дилемма заключенного». Дилемма заключенного 1. Двое подозреваемых (A и B) в совершении преступления арестованы, помещены в одиночные камеры и не имеют возможности передавать друг другу какие-либо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то им грозит (с учетом их признания) тюремное заключение сроком по 6 лет каждому. Если оба не признаются, то они получат по 1 году тюремного заключения. Если же один из них сознается, а другой – нет, то первый, за содействие следствию, будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию – 10-летнему тюремному заключению. Описанная ситуация может быть представлена следующей игрой с матрицами выигрышей для заключённых A и B соответственно и Здесь первые строки матриц выигрышей соответствуют стратегии заключенного A «молчать», а вторые строки – стратегии «сознаться». При этом первые столбцы матриц выигрышей соответствуют стратегии заключенного B «молчать», а вторые столбцы – стратегии «сознаться». Очевидно, что стратегия «молчать» является строго доминируемой для каждого игрока (так как ни один из них не знает, что предпримет другой), поэтому каждый игрок выберет стратегию «сознаться». В результате оба заключенных получат по 6 лет тюремного заключения. При этом мы сразу же сталкиваемся с очевидной проблемой: получающийся результат игры очень плохой – он дает максимальный суммарный срок заключения. Этот факт послужил толчком к многочисленным исследованиям данной игры, поскольку, например, естественным желанием было бы получить в качестве результата игры (или ее модификаций) выбор стратегий «молчать», дающий каждому заключенному лишь по одному году заключения. Такая же проблема возникает и в следующей экономико-политической задаче (в силу схожести специфики с предыдущей задачей мы сохраняем прежнее название). Дилемма заключенного 2. Рассмотрим две нефтедобывающие страны A и B. Эти страны могут кооперироваться, договариваясь об объёмах ежедневной добычи нефти, ограничиваясь, например, добычей 2 млн. баррелей нефти в день для каждой страны. Но страны могут действовать и некооперативно, добывая, например, по 4 млн. баррелей в день. Таким образом, считаем, что у игроков A и B по две стратегии: A1, B1 – договориться об ограничениях по добыче нефти; A2, B2 – добывать нефть без всяких ограничений. Такая ситуация может быть представлена игрой со следующими матрицами выигрышей для стран A и B соответственно: и . В матрицах указаны прибыли (млн. долларов в день) стран в зависимости от их объемов добычи нефти. Очевидно, что у каждой страны есть стимул отклониться от договора, чтобы за счет увеличения объемов производства получить дополнительную прибыль. Мы видим, что и здесь у каждого из игроков есть доминирующая стратегия – «не кооперироваться». В итоге страны получают прибыль 32 и 24 (млн. долларов в день), что гораздо меньше, чем в ситуации кооперативного поведения. Таким образом, мы сталкиваемся с феноменом, аналогичным предыдущей задаче: оба игрока выбирают свои доминирующие стратегии, увеличивая тем самым свои выигрыши, но исход для каждого из них хуже, чем в ситуации, когда оба следуют доминируемым стратегиям. Рассмотрим конфликт, в котором участвуют игроки A и B. Пусть игрок A имеет стратегии A1, A2,…, Am, а игрок B – стратегии B1, B2,…, Bn. При этом выбранной игроками стратегии соответствуют выигрыши и игроков A и B соответственно. Вообще говоря, . Таким образом, в такой игре существуют две различные матрицы выигрышей и , , для игроков A и B соответственно. В этом случае игру называют биматричной. Очевидно, что антагонистические игры являются частным случаем биматричных игр в случае, когда для всех , . Иногда, биматричную игру представляют одной матрицей с элементами . Случай, когда , , , соответствует матричной игре. Рассмотрим смешанные стратегии игроков при многократном повторении игры и Средние выигрыши игроков определяются математическими ожиданиями и . Определение. Будем говорить, что пара векторов и определяют равновесную ситуацию (точку равновесия), если при любых векторах и , элементы которых удовлетворяют условиям и , выполняются неравенства и . (1) Неравенства (1) означают, что отклонение игроков от равновесной ситуации может только уменьшить их выигрыши. Возникает вопрос: всегда ли существует равновесная ситуация? Положительный ответ на этот вопрос дает следующая теорема. Теорема 1 (Дж. Нэш). Любая биматричная игра имеет хотя бы одну точку равновесия в чистых или смешанных стратегиях. Замечание. Равновесие по Нэшу в биматричных играх – это обобщение понятия седловой точки (оптимального решения) в играх с нулевой суммой. Рассмотрим примеры нахождения точки равновесия. Сначала изучим самую простую биматричную игру с матрицами выигрышей и . Пусть смешанные стратегии игроков имеют вид и . Тогда средние выигрыши HA и HB игроков A и B будут зависеть только от двух переменных p и q. При использовании стратегий и средние выигрыши игроков составят: (2) Для биматричных игр справедлива следующая теорема. Теорема 2. Неравенства (1) для равновесных ситуаций эквивалентны следующей системы неравенств (3) Теорема 2 означает, что для нахождения равновесной пары , где , достаточно проверить справедливость неравенств (1) не для всех значений вероятностей p и q, а только для чистых стратегий каждого из игроков. Преобразуем функции выигрышей (2) к виду, удобному для применения теоремы 2 (4) Полагая в (4) и , получим Следовательно, (5) Если ввести обозначения (6) то формулы (5) примут вид Так как в точке равновесия выполняются неравенства (3), то получаем систему неравенств: Аналогичным образом, рассматривая разности , и вводя обозначения (7) получим систему неравенств В итоге пара определяет равновесную ситуацию в биматричной игре тогда и только тогда, когда выполняется система неравенств (8) где , , , вычисляются по формулам (6) и (7) и могут принимать любые значения.

Биматричные игры

Тебе могут подойти лекции

Основные понятия теории игр. Игры с природой. Биматричные игры

Основы теории игр

Теория игр

Систематизированный процесс принятия решений

Теория Принятия Решений.

Элементы теории игр

Элементы теории игр

Основные понятия теории игр

Экономико-математические методы и модели в логистике

Кооперативные игры

Биматричные игры

Тебе могут подойти лекции

Другие технические предметы

Помощь с написанием учебных работ