Элементы теории игр
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция №3: Элементы теории игр
1. Понятие об играх и стратегиях
2. Классификация игр
3. Запись матричной игры в виде платёжной матрицы
4. Понятие о нижней и верхней цене игры.
5. Решение игр в чистых стратегиях
6. Понятие о матричных играх со смешанным расширением
7. Решение матричных игр со смешанным расширением методами линейного программирования
1. Понятие об играх и стратегиях
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны".
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
2. Классификация игр
Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.
В зависимости от количества игроков различают игры двух и п игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) - могут вступать в коалиции. В кооперативных играх коалиции заранее определены.
По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые и др.
Матричная игра - это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (отрока матрицы соответствует номеру применяемой стратегии игрока I, столбец номеру применяемой стратегии игрока 2; на пересечении строки п столбца матри- цы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра - это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец - стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице - выигрыш игрока 2.)
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
3. Запись матричной игры в виде платёжной матрицы
В общем виде матричная игра может быть записана следующей платёжной матрицей,
где: Аi - названия стратегий игрока 1,
Вj — названия стратегий игрока 2,
aij - значения выигрышей игрока 1 при выборе им i - й стратегии, а игроком 2 – j-й стратегии
Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположной по знаку значению выигрыша игрока 1.
Bl
B2
...
Bn
Al
a11
a12
a1n
A2
a21
a22
a2n
Am
am1
am2
amn
Рис. 1.1. Общий вид платёжной матрицы матричной игры
4. Понятие о нижней и верхней цене игры.
5. Решение игры в чистых стратегиях
Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину
VH = max i min j aij ,
или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений. Величина VH называется максимином матрицы или нижней ценой игры.
Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение
VВ = min j max i aij ,
или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина VB называется минимаксом матрицы или верхней ценой игры.
В случае, если значения VH и VB не совпадают, при сохранении правил игры (коэффициентов aij ) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве VH = VB = V. В этом случае говорят, что игра
имеет решение в чистых стратегиях, а стратегии, в которых достигается V -оптимальными чистыми стратегиями. Величина V называется чистой ценой игры.
Например, в матрице
Bl
B2
B3
B4
Min j
Al
7
6
5
4
4
A2
1
8
2
3
1
A3
8
1
3
2
1
Max i
8
8
5
4
Рис. 1.2. Платёжная матрица, в которой существует решение в чистых стратегиях
существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия А1, а для игрока 2 - стратегия В4.
Bl
B2
B3
B4
Min j
Al
7
6
5
2
2
A2
1
8
2
3
1
A3
8
1
3
2
1
Max i
8
8
5
3
Рис. 1.3. Платёжная матрица, в которой не существует решения в чистых стратегиях
В матрице (рис. 1.3) решения в чистых стратегиях не существует, так как нижняя цена игры (максимальный гарантированный выигрыш игрока 1) достигается в стратегии А1 и её значение равно 2, в то время как верхняя цена игры (минимум потерь игрока 2) достигается в стратегии В4 и её значение равно 3.
6. Понятие о матричных играх со смешанным расширением
Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на вышрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.
Определение. Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.
Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.
Доказано, что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:
vH1
2,0664х1 + 0х2 + 2,0875хЗ > 1
1,8424х1 + 0,58х2 + 1,675хЗ > 1
х1> 0; х2> 0; хЗ> 0
min Z = xl + х2 + хЗ
Для игрока 2:
1,81у1 + 2,0664у2 + 1,8424уЗ < 1
5,1у1 + 0у2 + 0,58уЗ < 1
2,65у1 + 2,0875у2 + 1,675уЗ < 1
yl>0;y2>0;y3>0
max Z = yl + у2 + уЗ
3. Решим обе задачи с использованием симплекс-метода, применяя
программный комплекс "Линейная оптимизация". [5].
В результате решения задачи получим следующие значения целевой функции и переменных: Z = 0,5444
V* = 1/0,5444 = 1,8369
xl = 0,5269; Х2 = 0; хЗ = 0,0175
yl = 0,0905; у2 = 0; уЗ = 0,4539
4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения переменных на V*. p1 = xl V* = 0,9679, р2 =0, р3 = хЗ V* = 0,0321:
q1 = ylV* = 0,1662, q2 = 0, q3 = y3V* = 0,8338.
5. Определим значение цены игры. Для этого из величины V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента).
V= 1,8369 -1,5 =0,3369
Таким образом, в данной игре выиграет предприятие 1 (значение V > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с частотой 0,9679, а технологию 3-е частотой 0,0321. Предприятие 2, соответственно, должно выбирать технологию 1 с частотой 0,1662, а технологию 3-е частотой 0,8338. Значение математического ожидания выигрыша предприятия 1 составит 0,3269 тыс. д.е.