Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
М.В.Облаухова
Экономико-математические модели
конспект лекций (модуль 4)
Тема 4. Применение теории игр в экономико-математическом моделировании 3
4.1. Основные понятия теории игр 4
4.2. Поиск решения в игре с нулевой суммой 8
Вопросы для повторения 10
Литература 11
Тема 4. Применение теории игр в экономико-математическом моделировании
Поиск оптимальных решений или стратегий поведения участников взаимодействия в математическом моделировании предлагался ещё в XVIII в. Задачи производства и ценообразования в условиях олигополии, которые стали позже хрестоматийными примерами теории игр, рассматривались в XIX в. А. Курно и Ж. Бертраном. В начале XX в. Э. Ласкер, Э. Цермело, Э. Борель выдвигают идею математической теории конфликта интересов.
Математическая теория игр берёт своё начало из неоклассической экономики. Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна “Теория игр и экономическое поведение” (англ. Theory of Games and Economic Behavior).
Американский математик Дж. Нэш в 1949 году написал диссертацию по теории игр, а через 45 лет получил Нобелевскую премию по экономике. Дж. Нэш после окончания Политехнического института Карнеги с двумя дипломами — бакалавра и магистра — поступил в Принстонский университет, где посещал лекции Джона фон Неймана. В своих трудах Дж. Нэш разработал принципы “управленческой динамики”. Первые концепции теории игр анализировали антагонистические игры, когда есть проигравшие и выигравшие за их счет игроки. Нэш разрабатывает методы анализа, в которых все участники или выигрывают, или терпят поражение. Эти ситуации получили названия “равновесие по Нэшу”, или “некооперативное равновесие”, в ситуации стороны используют оптимальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение. Эти работы Дж. Нэша сделали серьёзный вклад в развитие теории игр, были пересмотрены математические инструменты экономического моделирования. Дж. Нэш показывает, что классический подход к конкуренции Адама Смита, когда каждый сам за себя, не оптимален. Более оптимальными являются такие стратегии, когда каждый старается сделать лучше для себя, делая лучше для других.
Хотя теория игр первоначально и рассматривала экономические модели, вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьёзно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений.
В 1960—1970 гг. интерес к теории игр угасает, несмотря на значительные математические результаты, полученные к тому времени. С середины 1980-х гг. начинается активное практическое использование теории игр, особенно в экономике и менеджменте. За последние 20 — 30 лет значение теории игр и интерес значительно растет, некоторые направления современной экономической теории невозможно изложить без применения теории игр.
Большим вкладом в применение теории игр стала работа Томаса Шеллинга, нобелевского лауреата по экономике 2005 г. “Стратегия конфликта”. Т. Шеллинг рассматривает различные “стратегии” поведения участников конфликта. Эти стратегии совпадают с тактиками управления конфликтами и принципами анализа конфликтов в конфликтологии (это психологическая дисциплина) и в управлении конфликтами в организации (теория менеджмента). В психологии и других науках используют слово “игра” в других смыслах, нежели чем в математике. Некоторые психологи и математики скептически относятся к использованию этого термина в других смыслах, сложившихся ранее. Культурологическое понятие игры было дано в работе Йохана Хёйзинги “Homo Ludens” (статьи по истории культуры), автор говорит об использовании игр в правосудии, культуре, этике; говорит о том, что игра старше самого человека, так как животные тоже играют. Понятие игры встречается в концепции Эрика Бёрна “Игры, в которые играют люди, люди, которые играют в игры”. Это сугубо психологические игры, основанные на транзакционном анализе. Понятие игры у Й. Хёйзинга отличается от интерпретации игры в теории конфликтов и математической теории игр.
Математическая теория игр сейчас бурно развивается, рассматриваются динамические игры. Однако, математический аппарат теории игр является предельно затратным и на самом деле субъективным. Математики применяют его для оправданных задач: политика, экономика монополий и распределения рыночной власти и т. п., часто скрывая реально используемые совсем не математические механизмы принятия решений. Ряд известных ученых стали Нобелевскими лауреатами по экономике за вклад в развитие теории игр, которая описывает социально-экономические процессы. Дж. Нэш, благодаря своим исследованиям в теории игр, стал одним из ведущих специалистов в области ведения “холодной войны”, что подтверждает масштабность задач, которыми занимается теория игр.
Нобелевскими лауреатами по экономике за достижения в области теории игр и экономической теории стали: Роберт Ауманн, Райнхард Зелтен, Джон Нэш, Джон Харсаньи, Уильям Викри, Джеймс Миррлис, Томас Шеллинг, Джордж Акерлоф, Майкл Спенс, Джозеф Стиглиц, Леонид Гурвиц, Эрик Мэскин, Роджер Майерсон, Ллойд Шепли, Элвин Рот.
4.1. Основные понятия теории игр
Игра – это ситуация, участники которой принимают решения в условиях взаимозависимости. Участников, принимающих решения, называют игроками. План действий отдельного игрока называется стратегией, а принятие решения, учитывающего взаимозависимость – выбором стратегии.
ТЕОРИЯ ИГР — раздел современной математики, изучающий математические модели принятия решений в т. н. конфликтных ситуациях (т. е. ситуациях, при которых интересы участников либо противоположны и тогда эти модели называются антагонистическими играми; либо не совпадают, хотя и не противоположны, и тогда речь идет об «играх с непротивоположными интересами»).
Предполагается, что каждый игрок является индивидуалистом и преследует личный интерес, т.е. стремится максимизировать собственный выигрыш. Под выигрышем в экономических играх, как правило, понимают прибыль, объем продаж или производства, хотя никаких ограничений на форму или вид выигрыша не существует.
Игроки действуют рационально, т.е. они способны правильно прогнозировать последствия тех или иных действий на рынке и затем выбирать варианты, максимизирующие индивидуальные выигрыши.
Суть игры состоит в том, что каждый из участников принимает такие решения (т. е. выбирает стратегию действий), которые, как он полагает, обеспечивают ему наибольший выигрыш или наименьший проигрыш, причем этому участнику игры ясно, что результат зависит не только от него, но и от действий партнера (или партнеров), иными словами, он принимает решения в условиях взаимозависимости и вытекающей из этого неопределенности. Эти решения отражаются в таблице, которая называется матрицей игры, или платежной матрицей.
Одной из задач теории игр является выяснение того, возможно ли (и если возможно, то при каких условиях) некоторое равновесие (компромисс), в наибольшей степени устраивающее всех участников. При этом часто обнаруживается такая точка (“седловая точка”), в которой достигается подобное равновесие.
Принципиальным достоинством теории игр считают то, что она расширяет общепринятое понятие оптимальности, включая в него такие важные элементы, как, например, компромиссное решение, устраивающее разные стороны в подобном споре (игре). На практике же игровые подходы используются экономистами при разработке моделей, в которых учитываются интересы различных звеньев экономики.
Следует отметить, что подобные задачи решаются и другими экономико-математическими способами. И это не случайно. Многие задачи теории игр могут быть сведены, например, к задачам линейного программирования, и наоборот.
Классификация игр пока не может считаться разработанной, однако можно выделить основные типы игр.
1. Парные и множественные игры
В игре могут сталкиваться интересы одного или нескольких противников, соответственно игры могут быть парными или множественными. В случае множественных игр при условии совпадения интересов отдельных участников, они могут образовывать временные или постоянные коалиции, и такие игры называют коалиционными.
2. Кооперативные и некооперативные игры
Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, беря на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.
Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.
Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом. Попытки объединить два подхода дали немалые результаты. Так назывемая программа Нэша уже нашла решения некоторых кооперативных игр как ситуации равновесия некооперативных игр.
Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.
3. Симметричные и несимметричные игры
Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков — симметричные. В частности, таковой является «Дилемма заключённого».
4. Игры с нулевой суммой и с ненулевой суммой
Игры с нулевой суммой — особая разновидность игр с постоянной суммой, то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Примерами таких игр может служить покер, где один выигрывает все ставки других; реверси, где захватываются фишки противника; либо банальное воровство.
Многие изучаемые математиками игры, в том числе уже упоминавшаяся «Дилемма заключённого», иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме — это делается введением фиктивного игрока, который «присваивает себе» излишек или восполняет недостаток средств.
Ещё игрой с отличной от нуля суммой является торговля, где каждый участник извлекает выгоду. Сюда также относятся го, шашки и шахматы; в двух последних игрок может превратить свою рядовую фигуру в более сильную, получив преимущество. Во всех этих случаях сумма игры увеличивается. Широко известным примером, где она уменьшается, является война.
5. Параллельные и последовательные игры
В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических, играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Эта информация может быть даже не совсем полной, например, игрок может узнать, что его противник из десяти своих стратегий точно не выбрал пятую, ничего не узнав о других.
6. Игры с полной или неполной информацией
Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр — с неполной информацией. Например, вся «соль» Дилеммы заключённого заключается в ее неполноте.
В то же время есть интересные примеры игр с полной информацией: шахматы, шашки, го, манкала и другие.
Часто понятие полной информации путают с похожим — совершенной информации. Для последнего достаточно лишь знание всех доступных противникам стратегий, знание всех их ходов необязательно.
7. Игры с бесконечным числом шагов
Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.
Здесь вопрос обычно состоит в том, чтобы найти не оптимальное решение, а хотя бы выигрышную стратегию. (Используя аксиому выбора можно доказать, что иногда даже для игр с полной информацией и двумя исходами — «выиграл» или «проиграл» — ни один из игроков не имеет такой стратегии.) Существование выигрышных стратегий для некоторых интересных игр имеет важные последствия дескриптивная теория множеств.
8. Дискретные и непрерывные игры
Большинство изучаемых игр дискретны: в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно — шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.
Примером применения теории игр в экономике является широко известная «дилемма заключенного», которая используется при описании олигополистического поведения фирм на рынке, а точнее – при характеристике мотивов выбора ими той или иной стратегии поведения.
Представим, что двое заключенных содержатся раздельно. Каждый знает, что если оба сознаются в содеяном, то получат по 4 года, а если будут отрицать, то получат по два. Кроме того, каждый знает, что если один из них признается, а другой нет, то первый получит один год, а отрицающий вину – 5 лет. Соответствующая матрица выигрышей представлена в таблице.
Матрица выигрышей для «дилеммы заключенных»
Заключ. В
Заключ. А
Признание
Отрицание
Признание
4 года
4 года
5 лет
1 год
Отрицание
1 год
5 лет
2 года
2 года
Особенность данной игры заключается в том, что в представленной ситуации каждый из заключенных имеет так называемую доминантную стратегию. Доминантная стратегия – это стратегия, предпочтительная для одного игрока вне зависимости от стратегии, выбранной другим игроком.
Рассмотрим выборы заключенного А. Если заключенный В сознается, то заключенному А тоже лучше сознаться и получить 4 года вместо пяти. Если В будет отрицать вину, то А все равно лучше сознаться и получить 1 год вместо двух. В данном случае, вне зависимости от выбора В заключенному А лучше сознаться. Аналогичная доминантная стратегия существует и для заключенного В, которому при любых выборах А также выгоднее сознаться. При этом, результат игры не изменится даже если заключенные смогут договориться, т.к. условия выбора таковы, что каждому участнику игры выгоднее сознаться.
Согласно приведенным выше способам классификации, «дилемма заключенных» является парной некооперативной симметричной игрой с ненулевой суммой. Это параллельная дискретная игра с неполной информацией и конечным числом шагов.
4.2. Поиск решения в игре с нулевой суммой
Рассмотрим простейшую математическую модель конечной конфликтной ситуации, когда имеется два игрока и выигрыш одного из них равен проигрышу другого. Такая игра называется антагонистической игрой двух лиц с нулевой суммой.
Пусть в игре участвуют два игрока, каждый из которых может запсать любую цифру от 1 до 3. Если записанная цифра окажется больше цифры соперника, то выигрыш игрока будет положительным, и его величина будет равняться разнице между записанными цифрами.
Таким образом, каждый из игроков имеет три стратегии: А1 и В1 = «записать1»; А2 и В2 = «записать 2»; А3 и В3 = «записать 3». Выигрыши игрока А, которые он может получить при реализации каждой из своих стратегий во взаимодействии со стратегиями игрока В, можно представить в таблице:
Стратегии
В1 = 1
В2 = 2
В3 = 3
А1 = 1
-1
-2
А2 = 2
1
-1
А3 = 3
2
1
Игру можно представить в виде платежной матрицы, в которой строки – стратегии игрока А, столбцы – стратегии игрока В, а на пересечении строк и столбцов расположены выигрыши игрока А:
В общем виде платёжная матрица игры двух игроков с нулевой суммой может быть записана как:
Строго говоря, данная матрица отражает выигрыши игрока А. Но поскольку мы имеем дело с игрой с нулевой суммой, то результаты игры для игрока В также автоматически отражены в матрице при рассмотрении ее по столбцам и представляют собой проигрыши игрока В. Если же имеет место игра с ненулевой суммой, то матрица выигрышей игрока В должна быть построена отдельно.
Задача каждого из игроков – найти наилучшую стратегию, обеспечивающую ему наибольший гарантированный выигрыш.
Найдем наилучшую стратегию первого игрока. Минимальный размер выигрыша в каждой строке обозначим αi:
Зная минимальные гарантированные выигрыши для каждой стратегии, первый игрок выберет ту из них, для которой это значение будет максимальным:
Подобная стратегия определения выигрыша называется максиминной, а величина α – гарантированный выигрыш, который может обеспечить себе первый игрок – нижней ценой игры.
Аналогичным образом будет вести себя и игрок В, с той лишь разницей, что он будет стремиться к минимизации проигрыша. Для этого определим максимальное значение его проигрыша по каждой возможной стратегии:
Оптимальной стратегией для игрока В будет та из них, которая позволяет ему гарантированно получить минимальный из возможных проигрышей:
Подобная стратегия называется минимаксной и позволяет определить β – верхнюю цену игры. Если игрок В будет придерживаться минимаксной стратегии, то он гарантированно проиграет не больше β.
Для матричной игры справедливо неравенство:
α ≤ β
Если α = β, то такую игру называют игрой с седловой точкой, а пару оптимальных стратегий (Аопт; Вопт) седловой точкой матрицы. В этом случае элемент aij, являющийся ценой игры, является минимальным и для строки i, и для столбца j. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.
Если платежная матрица не имеет седловой точки, то решение игры заключается в формировании сложной стратегии, состоящей в случайном применении двух и более стратегий с определенной вероятностью. Такая стратегия называется смешанной.
В этом случае для игры с матрицей m*n стратегии игроков задаются вероятностями их применения.
Для первого игрока: x = (x1…xm),
Для второго игрока: y = (y1…yn),
Решение игры в смешанных стратегиях опирается на аппарат теории вероятностей. Теория игр утверждает, что каждая конечная игра имеет хотя бы одно решение, возможно в области смешанных стратегий.
Если в игре нет седловой точки, то поиск смешанной стратегии тем сложнее, чем выше размерность матрицы. Поэтому первым этапом решения такой игры является поиск и вычеркивание заведомо неэффективных стратегий с помощью принципа доминирования.
Теория игр тесно связана с линейным программированием. В частности, любая конечная игра двух лиц с нулевой суммой может быть представлена в виде задачи линейного программирования и решена с помощью симплекс-метода.
Вопросы для повторения
1. Какие исследования в области экономических взаимодействий можно считать первыми элементами теории игр? Кто является основоположником теории игр?
2. Что такое игра? Стратегия игрока?
3. Что такое платежная матрица? Как она составляется?
4. Какие способы классификации игр Вы знаете?
5. Приведите примеры игр в реальной жизни, в экономических взаимодействиях, определите их место в классификации
6. Что такое антагонистическая игра с нулевой суммой? Каковы ее особенности?
7. Приведите примеры антагонистических игр с нулевой суммой в обычной жизни, в экономических взаимодействиях.
8. Каковы особенности составления платежной матрицы для антагонистической игры с нулевой суммой?
9. Как осуществляется поиск решения в игре с нулевой суммой? Что такое минимаксная стратегия, максиминная стратегия?
10. Что такое верхняя и нижняя цена игры? Что такое седловая точка игры, как она определяется?
11. В чем состоят различия между чистой и смешанной стратегией в игре с нулевой суммой?
Литература
1. Гармаш А.Н. Математические методы в управлении. – М., 2012.
2. Глухов В.В., Медников М.Д., Коробко С.Б. Математические методы и модели для менеджмента. - СПб, 2007.
3. Замков О.О., Черемных Ю.А., Толстопятенко А.В. Математические методы в экономике. - М., 1999.
4. Ильченко А.Н. Экономико-математические методы. - М., 2006.
5. Красс М.С., Чупрынов Б.П. Математика в экономике. Математические методы и модели. – М., 2007.
6. Красс М., Чупрынов. Математические методы и модели для магистрантов экономики. – СПб., 2012.
7. Ланкастер К. Математическая экономика. – М., 1972.
8. Попов А. М., Сотников В.Н. Экономико-математические методы и модели : учеб. для бакалавров. - Москва: Юрайт, 2013.
9. Экономико-математические методы и прикладные модели / Под ред. В.В.Федосеева. – М.: ЮНИТИ-ДАНА, 2005.
10. Экономико-математическое моделирование. / Под ред. Дрогобыцкого И.Н. - М., 2003.