Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
3
6.1.Введение в теорию игр
6.2. Матричные игры
6.3. Игры с природой
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
4
Теория игр – это раздел
математики, изучающий
математические модели
принятия решений в
конфликтных ситуациях.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
5
Теория игр опирается на
предположение о том, что
независимо от цели игры и ее
обстоятельств найдется стратегия,
которая позволит добиться успеха.
это всегда происходит по определенным
правилам, но иногда их трудно распознать
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6
Жозеф Луи Франсуа Бертран
французский математик
11.03.1822 – 05.04.1900
1. Профессор Политехнической
школы и Колледжа Франции,
член Парижской академии
наук.
2. Работал в области теории
чисел, дифференциальной
геометрии, теории
вероятности и термодинамики.
3. Дал математическую трактовку
стратегии в играх в курсе
теории вероятностей «Calcul
des probabilités» в 1889 г.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
7
Джон фон Нейман
венгро-американский математик еврейского происхождения
1)Профессор Принстонского
университета США.
2) Сотрудник RAND Corporation
(американский стратегический центр для
обеспечения национальной безопасности
страны).
3)Внес большой вклад в
создание первых ЭВМ и
разработку методов их
применения.
2) Важную роль в экономике
03.12.1903 – 08.02.1957
сыграла теория игр, разработанная
Нейманом и О. Моргенштерном
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
8
Монография является
классическим,
основополагающим
трудом по теории игр.
Большинство понятий и
идей, разрабатываемых в
настоящее время в теории
игр, берут свое начало из
этого труда
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
9
Джон Форбс Нэш
американский математик
1. Лауреат Нобелевской премии
по экономике 1994 года «За
анализ равновесия в теории
некооперативных игр».
2. Сотрудник RAND Corporation.
3. Работал в Принстоне и
Массачусетском
технологическом институте,
получил звание профессора
Принстонского университета
13 июня 1928 г.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
10
Дж. Нэш доказал, что классический
подход к конкуренции А.Смита, когда
каждый сам за себя, неоптимален.
Наиболее оптимальны те стратегии,
при которых каждый старается сделать
лучше для себя, делая
лучше для других.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
11
«Игры разума» (2001 г.)
– реж. Рон Ховард
– гл. роли Рассел Кроу,
Дженнифер Коннелли
– награды: четыре «Оскара»
(лучший фильм, адаптированный
сценарий, режиссура, актриса
второго плана), «Золотой глобус»
(за лучшую мужскую роль)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
12
Игра - упрощенная
формализованная модель
реальной конфликтной
ситуации.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
13
Цель теории игр - выработка
рекомендаций по разумному
поведению участников
конфликта (определение
оптимальных стратегий
поведения игроков).
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
14
От реального конфликта игра
отличается тем, что ведется по
определенным правилам:
1. Правила устанавливают последовательность
ходов, объем информации каждой стороны о
поведении другой и результат игры в зависимости
от сложившейся ситуации.
2. Правилами устанавливаются также конец игры,
когда некоторая последовательность ходов уже
сделана, и больше ходов делать не разрешается.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
15
АНТАГОНИЗМ — (от греч. antahonisma спор, борьба)
противоречие, для которого
характерна острая непримиримая
борьба враждующих сил,
тенденций.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
16
Примеры конфликтных ситуаций:
взаимоотношения
покупателя и
продавца
конкуренция
различных
фирм
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
боевые
действия
17
А также обычные игры
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
18
Игроки – заинтересованные стороны в
игре.
Партия игры – каждый конкретный
пример разыгрывания игры некоторым
конкретным образом от начала до конца.
Ход игрока – выбор и осуществление
действия производимого одним игроком в
условиях точно определенных правилами
игры.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
19
Игра состоит из ходов, выполняемых игроками
одновременно или последовательно
личный
случайный
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
20
Ход называется личным, если игрок
сознательно выбирает его из
совокупности возможных вариантов
действий и
осуществляет его.
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
21
Ход называется случайным,
если его выбор производится не
игроком, а каким-либо
механизмом
случайного выбора
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
22
Стратегией игрока называется
совокупность правил, определяющих
выбор варианта действий при каждом
личном ходе в зависимости от ситуации,
сложившейся в процессе игры.
В простых (одноходовых) играх, когда в каждой
партии игрок может сделать лишь по одному
ходу, понятие стратегии и возможного варианта
действий совпадают.
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
23
Стратегия игрока называется
оптимальной, если она обеспечивает
данному игроку при многократном
повторении игры максимально возможный
средний выигрыш или минимально
возможный средний
проигрыш, независимо
от того, какие стратегии
применяет противник.
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
24
Теория игр имеет свои
недостатки:
1. Предположение о полной (“идеальной”)
разумности противников.
В реальном конфликте зачастую оптимальная
стратегия состоит в том, чтобы угадать, в чем
слабость противника и воспользоваться этой
слабостью
Е.В.Е.В.
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
Яроцкая,
к.э.н.,
доцент
кафедры
экономики
ТПУ
6.2. Матричные игры
25
Пусть в игре участвуют два игрока А и В
выигрыш игрока А → аij,
выигрыш игрока В → bj
аij = – bj
Задача игрока А - максимизировать свой выигрыш.
Задача игрока В – минимизировать свой проигрыш
или минимизировать выигрыш первого игрока.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
26
Игру можно представить в виде матрицы строки которой стратегии игрока А, а столбцы – стратегии игрока В.
стратегии игрока В
A
a11
a12
...
a1 n
a 21
a 22
...
a2n
...
...
...
...
a m1
am 2
...
a mn
стратегии
игрока А
Матрица называется платежной матрицей, где
элементы этой матрицы это выигрыши игрока А.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
27
Оптимальной стратегией игрока
в матричной игре называется такая,
которая обеспечивает ему
максимальный выигрыш.
Задача каждого из игроков – найти
наилучшую стратегию игры
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
28
ПРИНЦИП МАКСМИНА:
необходимо выбрать ту стратегию,
чтобы при наихудшем поведении
противника получить максимальный
выигрыш.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
29
Пример.
Платежная матрица имеет следующий
вид
A
7
9
10
3
4
8
7
5
8
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
30
Решение:
Найдем наилучшую стратегию игрока А (строки) – это
минимальное число в каждой строке матрицы
min aij , i
i
1, m
αi
A
7
9 10 7
3
4
8 3
7
5
8 5
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
31
Зная минимальные выигрыши при различных стратегиях
Аi , игрок А выберет ту стратегию, для которой αi
максимально.
max min aij
i
j
αi
7 9 10 7
A
3 4
8 3
7 5
8 5
α=7
Величина α – гарантированный выигрыш игрока А и
называется нижней ценой игры (максимином)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
32
Далее необходимо определить наилучшую стратегию
игрока В (столбцы) – это максимальное число в каждом
столбце матрицы
j
max
7
А= 3
7
βj 7
j
9
4
5
9
,j
1, n
10
8
8
10
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
33
Зная максимальные проигрыши при различных
стратегиях Вj , игрок В выберет ту стратегию, для которой βj
минимально
min max
j
7
А= 3
7
βj 7
i
9
4
5
9
j
10
8
8
10
β=7
Игрок В гарантирует себе проигрыш не выше β. Величина β
называется верхней ценой игры (минимаксом)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
34
Для матричной игры всегда справедливо
неравенство
Если α = β, то ситуация является равновесной. И
такая игра называется игрой с седловой
точкой.
А пара оптимальных стратегий (Аiопт, Вjопт) –
седловой точкой матрицы.
Если α < β, то игра не имеет седловой точки
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
35
аij = α = β = ν,
где ν называется ценой игры и является
одновременно минимальным в i-й строке и jм столбце
ν - решение матричной игры
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
36
В примере получаем α = β = 7
А=
βj
7
9
10
αi
7
3
4
8
3
7
7
5
9
8
10
5
Cедловая точка матрицы соответствует элементу а11.
Ответ: цена игры (v) = 7
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
37
1) Если
0, то игра выгодна для
игрока А.
2) Если
0 - для игрока В.
3) Если = 0 игра справедлива,
т.е. является одинаково
выгодной для обоих участников
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
6.2. Матричные игры
38
Применение максиминного принципа
каждым из игроков обеспечивает:
игроку А выигрыш не менее ,
игроку В проигрыш не больше .
Учитывая что
, целью игрока А
будет в увеличении выигрыша, а для
игрока В - уменьшение проигрыша.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
39
2.2. Смешанные стратегии
Если в игре нет седловой точки в чистых
стратегиях, то можно найти нижнюю и верхнюю
чистые цены этой игры, которые указывают, что
игрок 1 не должен надеяться на выигрыш больший,
чем верхняя цена игры, и может быть уверен в
получении выигрыша не меньше нижней цены игры.
Поиск такого решения приводит к необходимости
применять смешанные стратегии, то есть
чередовать чистые стратегии с какими-то частотами.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
40
Смешанной стратегией
игрока называются
случайные величины,
возможные значения
которых являются чистые
стратегии.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
41
1) Теорема о максимине. В конечной игре двух
игроков (коалиций) с нулевой суммой (матричной игре)
при α ≠ β имеет место равенство
A
B
Теорема о максимине указывает на существование
равновесия для случая vА=vB, при α ≠ β, и ,
следовательно, существования оптимальных
смешанных стратегий.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
42
2) Основная теорема матричных игр.
Любая матричная игра имеет, по крайней
мере, одно оптимальное решение, в общем
случае, в смешанных стратегиях и
соответствующую цену v.
Цена игры v - средний выигрыш, приходящийся на
одну партию, - всегда удовлетворяет условию
,
т.е. лежит между нижней
и верхней
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
ценами игры.
43
Оптимальное решение игры в
смешанных стратегиях обладает тем
свойством, что каждый из игроков не
заинтересован в отходе от своей
оптимальной смешанной стратегии, если
его противник применяет свою
оптимальную смешанную стратегию, так
как это ему невыгодно.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
44
Определение. Те из чистых
стратегий игроков А и В, которые
входят в их оптимальные
смешанные стратегии с
вероятностями, не равными нулю,
называются активными
стратегиями.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
45
Существуют следующие условия
применения смешанных стратегий:
1. Игра без седловой точки.
2. Игроки используют случайную смесь чистых
3.
4.
5.
стратегий с заданными вероятностями.
Игра повторяется многократно в сходных
условиях.
При любом ходе ни один из игроков не
информирован о стратегии другого игрока.
Допускается усреднение результатов игр.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
46
Решение матричных игр в смешанных
стратегиях 2х2
Аналитический
метод
Графический
метод
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
47
Аналитический метод решения игры 2х2
A
a11
a12
a 21
a 22
1) оптимальное решение в смешанных стратегиях:
SA=|p1, p2| и SB=|q1, q2|
2)вероятности применения (относительные частоты
применения) чистых стратегий удовлетворяют
соотношениям
p1 + p2 = 1
q1 +q2 = 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
48
В соответствии с теоремой об активных
стратегиях, оптимальная смешанная
стратегия обладает тем свойством, что
обеспечивает игроку максимальный
средний выигрыш, равный цене игры ,
независимо от того, какие действия
предпринимает другой игрок, если тот не
выходит за пределы своих активных
стратегий.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
49
1) Eсли игрок А
использует свою
оптимальную
смешанную стратегию,
а игрок В - свою чистую
активную стратегию В1,
то цена игры равна
2) Eсли игрок А
использует свою
.
оптимальную
смешанную стратегию, а
игрок В - свою чистую
активную стратегию В2,
то цена игры равна
a11p1 + a21p2 = v
a12p1 + a22p2 = v
A
a11
a12 p1
a 21
a 22 p 2
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
50
ЗАДАНИЕ:
.
Найти, чему равны p1, p2, v, если
a11p1 + a21p2 = v
a12p1 + a22p2 = v
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
51
Получаем решение матричной игры:
.
p1
p2
a 11
a11
a 22
a 21
a 22
a 21
a11
a12
a22
a21
a11 a22
a11
a22
a 12
a12
a12 a21
a21
a12
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
52
Вычислив оптимальное
значение v,
.
можно вычислить и оптимальную
смешанную стратегию второго игрока из
условия
a11q1 + a12q2 = v, a21q1 + a22q2 = v
q1
q2
( a11
( a11
a 22
a12
a 22 )
( a12
a11
a12
a 22 )
( a12
v
a 21 )
a12
a11
a11
a 21 )
a11
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
a12
v
a12
53
Пример.
.
Платежная матрица имеет следующий вид
A
3
8
7
4
Найти решение игры аналитическим
методом
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
54
Решение:
Сначала необходимо определить,. решается ли данная
игра в чистых стратегиях, то есть существует ли седловая
точка или нет.
min max
j
i
min
max min aij
i
j
A
max
3
8
3
7
4
8
4
7
α < β, при этом цена игры v
[4; 7]
Игра не имеет седловой точки, следовательно не
решается в чистых стратегиях
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
j
α=4
β=7
55
Каждый из игроков А и В обладает единственной оптимальной смешанной
стратегией SA=|p1, p2| и SB=|q1, q2|
p1
p2
q1
q2
a11
a11
( a11
( a11
a 22
a 21
a 22
a 21
a11
a12
a 22
a 21
a 22
a12
a 22 )
( a12
a12
a11
a12
a 22 )
( a12
4
7
3
4
8
1
p1
a12
a 21 )
(3
1
a 21 )
3
7
1
8
4)
(8
q1
8
0 ,375
4
0 ,375
0 , 625
4
7)
1 0 ,5
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
8
0 ,5
0 ,5
56
a11 a 22
a11
a 22
a12 a 21
a 21
a12
(3 4 )
3
4
(8 7 )
44
7
8
8
5 ,5
Ответ: оптимальной смешанной стратегией
игрока А является стратегия SA=|0,375; 0,625|,
а игрока В - SB=|0,5; 0,5|. Цена игры v = 5,5
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
57
Графический метод решения игры 2х2
1. Найдем оптимальную стратегию
для первого игрока (А):
.
а) Построим систему координат
а v
22
а11
v
а21
а12
ропт
1
р
б) По оси абсцисс откладывается вероятность р1 [0,1], равная 1.
в) По оси ординат – выигрыши игрока А при стратегии А2, а на
прямой р = 1 – выигрыши при стратегии А1
г) Находим точку пересечения прямых, которая и дает
оптимальное решение матричной игры для игрока А (ропт, v)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
58
2. Найдем оптимальную стратегию для второго игрока (В):
а) По оси абсцисс откладывается вероятность q1 [0,1], равный 1.
б) По оси ординат – выигрыши игрока B при стратегии B2, а на
прямой q = 1 – выигрыши при стратегии B1
в) Находим точку пересечения прямых, которая и дает
оптимальное решение матричной игры для игрока B (qопт, v)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
59
Пример.
Матричная игра 2х2 задана следующей матрицей
A
3
8
7
4
Найти решение игры графическим
методом
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
60
Решение:
Сначала необходимо определить, решается ли данная
игра в чистых стратегиях, то есть существует ли седловая
точка или нет.
α = 4, β = 7,
при этом цена игры v
[4, 7]
α < β - игра не имеет седловой точки, и поэтому имеет
решение в смешанных стратегиях.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
61
4 (а22)
3 (а11)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
62
Решение матричных игр в смешанных
стратегиях 2xn и mx2
Любая конечная игра mxn имеет решение, в
котором число активных стратегий каждого игрока
не превосходит L, где L = min (m, n)
У игры 2xn или mx2 всегда имеется решение,
содержащее не более двух активных стратегий у
каждого из игроков (min (2, n) = min (m, 2) = 2)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
63
Пусть платежная матрица игры имеет вид:
A
a11
a12
...
a1 n
a 21
a 22
...
a2 n
Согласно теореме об активных стратегиях, решение
находится из уравнения:
v
m in ( a1 j p опт
j
a 2 j (1
p опт ))
m ax m in ( a1 j p
p 1
j
a 2 j (1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
p )), j
1, n
64
Найти максимум (по p) функции
min ( a1 j p
j
a 2 j (1
p ))
Для этого необходимо построить n прямых вида
j
a1 j p
a 2 j (1
p)
на плоскости (p, δ), р [0, 1] и путём визуального
сравнения выбрать ломаную, огибающую их снизу
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
65
В1
В2
В3
1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
66
Пример.
Матричная игра 2хn задана следующей матрицей
A
2
5
8
7
4
3
Найти решение игры графическим и
аналитическим методом
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
67
Решение:
,
Сначала необходимо определить, решается ли данная игра
в чистых стратегиях, то есть существует ли седловая точка
или нет.
max min aij
j
i
min max
j
i
j
Вычисляя, получим:
α = max (2, 3) = 3
β = min (7, 5, 8) = 5
Цена игры v [3, 5].
Так как α < β, то игра не имеет седловой точки, и поэтому
имеет решение в смешанных стратегиях.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
68
Строим графическое изображение игры
В2
4
5
В1
3
2
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
69
Находим точку оптимума – О. В этой точке
пересекаются стратегии В1 и В2 игрока В. Таким
образом, исключая стратегию В3, получаем матричную
игру 2x2 с платежной матрицей вида
A
2
5
7
4
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
70
Используя алгебраический метод решения этой игры,
получаем точное решение
p1
q1
2
v
a11
4
7
4
7
5
4, 5
5
a12
a12
2
v
0 ,5
p2
1
p1
0 ,5
0,17
q2
1
q1
0 ,83
5
2 4
2
4
7 5
7
4 ,5
5
Ответ: оптимальные смешанные стратегии
игроков SA=|0,5; 0,5|, SB=|0,17; 0,83| при цене
игры v=4,5.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
71
Решение игры mx2 осуществляется
аналогично. Но в этом случае строится
графическое изображение игры для
игрока В и выделяется не нижняя, а
верхняя граница выигрыша, и на ней
находится точка оптимума с наименьшей
ординатой (минимакс).
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
72
Пример.
Матричная игра mх2 задана следующей матрицей
A
1
4
3
1
2
2 ,5
5
Найти решение игры графическим и
аналитическим методом
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
73
Решение:
,
Сначала необходимо определить, решается ли данная игра
в чистых стратегиях, то есть существует ли седловая точка
или нет.
max min aij
i
j
min max
j
i
j
Вычисляя, получим:
α = max (1; 1; 2; 0) = 2
β = min (5; 4) = 4
Цена игры v [2, 4].
Так как α < β, то игра не имеет седловой точки, и поэтому
имеет решение в смешанных стратегиях.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
74
A4
5
A2
A3
3
2
A1
1
4
M
2,5
1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
q
75
p1 = 0,625
p2 = 0,375
q1 = 0,5
q2 = 0,5
v = 2,5
Ответ: оптимальные смешанные стратегии
игроков SA=|0,625; 0,375|, SB=|0,5; 0,5| при цене
игры v=2,5.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
76
6.3. Игры с природой
6.3.1. Понятие игры с природой
6.3.2. Принятие решений в условиях
неопределенности
6.3.3. Принятие решений
в условиях риска
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
77
6.3. Игры с природой
Неопределенность – это когда
противник не имеет противоположных
интересов, но выигрыш действующего
игрока во многом зависит от неизвестного
заранее состояния противника.
Неопределенность зависит от недостатка
информации о внешних условиях, в которых
будет приниматься решение и не зависит от
действий игрока
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
78
Неопределенность может быть
следствием многих причин:
► колебание спроса;
► нестабильность экономической
ситуации;
► изменение курса валют;
► колебание уровня инфляции;
► неустойчивая биржевая ситуация;
► погода как природное явление.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
79
В таких задачах выбор решения
зависит от состояния объективной
действительности, называемой
«природой», а математические
модели называются «игры с
природой».
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
80
Игра, в которой осознанно действует
только один из игроков, называется
игрой с природой.
«Природа» – это обобщенное понятие
противника, не преследующего собственных
целей в данном конфликте, хотя такую
ситуацию конфликтом можно назвать лишь
условно.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
81
Природа может
принимать одно из своих
возможных состояний и не
имеет целью получение
выигрыша
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
82
Игра с природой представляется
в виде платежной матрицы,
элементы которой – выигрыши
игрока А, но не являются
проигрышами природы П.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
83
Каждый элемент платежной матрицы aij –
выигрыш игрока А при стратегии Ai в
состоянии природы Пj
выигрыши игрока А
a11
a12
...
a1 n
a 21
a 22
...
a2 n
...
...
...
...
a m1
am 2
...
amn
природа (П)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
84
Матрица еще называется
матрицей доходности, которая
агрегирует информацию о
возможной доходности вариантов
стратегии при различных сценариях
развития экономической ситуации.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
85
В «играх с природой»
задача выбора
оптимальной
стратегии для игрока
А упрощается
задача выбора
оптимальной
стратегии для игрока
А осложняется из-за
дефицита
информации о
поведении природы
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
86
Различают два вида задач
в играх с природой:
1.Задачи о принятии решений в
условиях неопределенности, когда нет
возможности получить информацию о
вероятностях появления состояний природы
2.Задача о принятии решений в
условиях риска, когда известны
вероятности, с которыми природа принимает
каждое из возможных состояний
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
87
1. Уникальные единичные случайные
явления связаны с неопределенностью.
2. Массовые случайные явления обязательно
допускают некоторые закономерности
вероятностного характера.
3. Ситуация с полной неопределенностью
характеризуется отсутствием какой бы то ни было
дополнительной информации.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
88
Принятие решений в условиях
неопределенности
Предположим, что лицо, принимающее
решение, может выбрать одну из возможных
альтернатив, обозначенных номерами
i = 1, 2, …, m
Ситуация является полностью неопределенной, т. е.
известен лишь набор возможных вариантов состояний
внешней (по отношению к лицу, принимающему
решение) среды, обозначенных номерами j = 1, 2, …, n.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
89
Если будет принято i-e решение, а
состояние внешней среды соответствует
j-й ситуации, то лицо, принимающее
решение, получит доход
Тип
товара
А1
А2
А3
П1
20
16
13
Спрос
П2
15
12
18
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
П3
10
14
15
90
При решении Задачи о принятии
решений в условиях неопределенности
для отбора вариантов стратегии применяют так
называемые критерии оптимальности
(альтернативные критерии оптимальности):
► критерий Вальда,
► критерий оптимизма,
► критерий пессимизма,
► критерий Сэвиджа,
► критерий Гурвица
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
91
Для выбора наиболее эффективного
варианта стратегии ко всем возможным
вариантам развития применяются все
критерии оптимальности одновременно:
каждый из критериев позволяет отобрать
только один вариант, оптимальным же
будет являться тот из них, на который
указало
большинство критериев.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
92
1) Критерий Вальда (критерий гарантированного
результата, максиминный критерий) позволяет выбрать
наибольший элемент матрицы доходности из её
минимально возможных элементов:
W = m ax m in a ij ,
i
a ij
j
– элемент матрицы доходности.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
93
Критерий Вальда предназначен для
выбора из рассматриваемых вариантов стратегий
варианта с наибольшим показателем
эффективности из минимально возможных
показателей для каждого из этих вариантов.
Данный критерий обеспечивает максимизацию
минимального выигрыша, который может быть получен
при реализации каждого из вариантов стратегий.
Критерий ориентирует лицо, принимающее решение, на
осторожную линию поведения, направленную на
получение дохода и минимизацию возможных рисков
одновременно.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
94
Применение критерия Вальда
оправдано, если ситуация, в которой
принимается решение, характеризуется
следующими обстоятельствами:
► о вероятности наступления того или
иного состояния природы ничего не
известно;
► не допускается никакой риск;
► реализуется лишь малое количество
решений.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
95
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию
Вальда.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
96
Решение:
W
max min a ij
i
max( 10 ;12 ;13 )
j
Полученный результат соответствует
стратегии А3
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
13
97
2) Критерий оптимизма (критерий максимакса)
предназначен для выбора наибольшего элемента
матрицы доходности из её максимально
возможных элементов:
M = m ax m ax a ij ,
i
j
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
98
Критерий оптимизма используется,
когда игрок оказывается в безвыходном
положении, когда любой его шаг
равновероятно может оказаться как
абсолютным выигрышем, так и полным
провалом.
Данный критерий предполагает, что развитие
ситуации будет благоприятным для лица,
принимающего решение. Вследствие этого,
оптимальным выбором будет вариант с наибольшим
значением показателя эффективности в матрице
доходности.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
99
Ценой игры в чистых стратегиях по
критерию оптимизма (М) является
наибольший из показателей
эффективности чистых стратегий.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
100
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию
оптимизма.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
101
Решение:
M
max max a ij
i
max( 20 ;16 ;18 )
j
Полученный результат соответствует
стратегии А1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
20
102
3) Критерий пессимизма предназначен
для выбора наименьшего элемента матрицы
доходности из её минимально возможных
элементов:
P = m in m in a ij ,
i
j
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
103
Критерий пессимизма предполагает,
что развитие ситуации будет
неблагоприятным для лица,
принимающего решение.
При использовании этого критерия лицо
принимающее решение ориентируется на
возможную потерю контроля над ситуацией и,
поэтому, старается исключить все
потенциальные риски и выбрать вариант с
минимальной доходностью.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
104
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию
пессимизма.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
105
Решение:
P
min min a ij
i
min( 10 ;12 ;13 )
j
Полученный результат соответствует
стратегии А1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
10
106
4) Критерий Сэвиджа
(критерий минимаксного риска Сэвиджа)
предназначен для выбора максимального
элемента матрицы рисков из её минимально
возможных элементов:
S = m in m ax r ij ,
i
j
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
107
Необходимо провести оценку риска в
условиях, когда реальная ситуация
неизвестна. Если игрок знает, что
осуществляется j-е состояние природы, то
выбрал бы наилучшее решение, то есть то,
которое принесет наибольший выигрыш
bj = max(aij),
j = 1, 2, …, n
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
108
Принимая i-e решение, игрок А рискует получить не bj, а только
aij, то есть, если игрок примет i-е решение, а в природе
реализуется j-е состояние, то произойдет недополучение дохода
в размере:
rij
bj
a ij
a max
j
a ij
(по сравнению с тем, как если бы игрок знал точно, что реализуется
j-е состояние природы, и выбрал бы решение, приносящее
наибольший доход bj = max(aij), j = 1, 2, …, n)
aij – значение показателя доходности варианта стратегии с
максимальной доходностью из имеющихся i-ых вариантов при
наступлении j-ого сценария развития событий
amaxj - значение показателя доходности i-ого варианта стратегии при
наступлении j-ого сценария развития событий (элемент платежной
матрицы).
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
109
Матрица рисков (сожалений)
отражает риск реализации вариантов
стратегии для каждой альтернативы
развития событий (характеризует риск
выбора определенного варианта
стратегии), который будет зависеть от
уровня риска варианта стратегии при
наступлении различных сценариев.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
110
Среди элементов матрицы рисков сначала
выбирается максимальный риск при каждой
стратегии, а затем из них выбирается
минимальный. То есть в данном случае
пессимистично настроенный игрок
предполагает, что состояние природы будет
таковым, что для любой его стратегии риск
будет наибольшим, а стратегию выбирает
такую, чтобы этот риск минимизировать.
111
Критерий Сэвиджа позволяет выбрать
вариант стратегии с меньшей величиной
риска по сравнению с более высоким,
первоначально ожидаемым уровнем риска.
Данный критерий ориентирует лицо
принимающее решение на более благоприятное
развитие ситуации по сравнению с наихудшим
состоянием, на которое то рассчитывало
вначале.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
112
Ценой игры в чистых стратегиях
по критерию Сэвиджа называется
минимальный показатель
неэффективности среди показателей
неэффективности всех чистых
стратегий.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
113
Теорема: Для того чтобы чистая
стратегия была безрисковой, т.е. чтобы
её показатель неэффективности по
критерию Сэвиджа был нулевым,
необходимо и достаточно, чтобы она
доминировала каждую из остальных
чистых стратегий.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
114
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию
Сэвиджа.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
115
Решение:
Применяем формулу rij = amaxj - aij, построим матрицу
рисков.
Матрица доходности
Тип
товара
А1
А2
А3
S
П1
20
16
13
Спрос
П2
15
12
18
min max rij
j
Матрица рисков
П3
10
14
15
Тип
товара
А1
А2
А3
min( 5;6;7 )
П1
4
7
Спрос
П2
3
6
П3
5
1
5
j
Полученный результат соответствует стратегии А1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
116
5) Критерий Гурвица (взвешивает пессимистический и
оптимистический подходы к анализу неопределенной ситуации)
предназначен для выбора некоторого среднего элемента
матрицы доходности, отличающегося от крайних
состояний – от минимального и максимального
элементов:
H = max
i
где
max a ij + 1
min a ij ,
j
j
λ – коэффициент оптимизма,
1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
117
Коэффициент λ выражает количественно
«меру оптимизма» игрока А при выборе
стратегии и определяется им из субъективных
соображений на основе статистических
исследований результатов принятия решений
или личного опыта лица принимающего
решение в схожих ситуациях.
если λ коэффициент оптимизма, то (1 - λ)
коэффициент пессимизма
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
118
Критерий Гурвица позволяет
избежать пограничных состояний при
принятии решения – неоправданного
оптимизма и крайнего пессимизма
относительно ожидаемой доходности – и
выбрать наиболее вероятный вариант
стратегии, обеспечивающий наилучшую
эффективность.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
119
Критерий Гурвица ориентирован
на установление баланса между случаями
крайнего пессимизма и крайнего
оптимизма при выборе стратегии путем
взвешивания обоих исходов с помощью
коэффициента оптимизма
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
120
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию
Гурвица.
λ = 0,5
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
121
Решение:
H
max
i
max a ij
j
H1
( 0 ,5 20 )
H2
( 0 ,5 16 )
H3
( 0 ,5 18 )
H
((1
((1
((1
(1
) min a ij
j
0 ,5 ) 10 )
10
0 ,5 ) 12 )
0 ,5 ) 13 )
max (15 ;14 ;15 ,5)
5
8
9
6
6 ,5
15
14
15 ,5
15 ,5
i
Полученный результат соответствует стратегии А3
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
122
Задача о принятии решений в условиях
неопределенности
W (Вальда) → A3
M (оптимизма) → A1
P (пессимизма) → A1
S (Сэвиджа) → A1
H (Гурвица) → A3
Оптимальной является
стратегия А1
123
При решении Задачи о принятии
решений в условиях риска
различным состояниям природы
поставлены в соответствие
соответствующие вероятности.
Игрок А принимает решение на
основе критерия максимального
ожидаемого среднего выигрыша
или минимального ожидаемого
среднего риска
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
124
Критерии оптимальности в
условиях риска:
► критерий Байеса;
► критерий Лапласа;
► критерий Гермейера.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
125
1) Критерий Байеса относительно
выигрышей
Предположим, что игроку А известны не
только состояния П1, П2,…Пn в которых
случайным образом может находиться
природа, но и вероятности (q1, q2,…qn)
наступления этих состояний, при этом
∑qj = 1.
Это говорит о том, что лицо принимающее решение
находится в условиях риска.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
126
Матрицу выигрышей игрока А и
вероятности состояний природы П можно
представить в виде общей матрицы:
Пj
Аi
А1
А = А2
…
Аm
qj
П1
П2
…
Пn
a11
a21
…
am1
q1
a12
a22
…
am2
q2
…
…
…
…
…
a1n
a2n
…
amn
qn
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
127
Чистую стратегию Аi можно определить как случайную
величину со следующим законом распределения
Ai
q
ai1
q1
ai2
q2
…
…
ain
qn
Математическое ожидание данной случайной величины
n
Bi
q j a ij , i
1, 2 ,..., m
j 1
Оно означает средне взвешенное выигрышей i-ой строки
матрицы А с весами (q1, q2,…qn).
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
128
Критерий Байеса относительно
выигрышей
позволяет выбрать максимальный из
ожидаемых элементов матрицы доходности
при известной вероятности возможных
состояний природы:
n
B
max
i
q j a ij
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
129
ПРИМЕР:
Магазин может завести в различных пропорциях товары
трех типов (А1, А2, А3). Их реализация и прибыль зависит от
вида товара и спроса на него. Спрос имеет три состояния –
П1, П2, П3 и не прогнозируется.
Матрица доходности имеет следующий вид:
Тип
товара
А1
А2
А3
П1
20
16
13
Спрос
П2
15
12
18
П3
10
14
15
Необходимо найти оптимальную стратегию по
критерию Байеса при вероятностях состояний
природы q1 = 0,2; q2 = 0,3; q3 = 0,5.
130
Решение:
Вычислим средние выигрыши
Тип
товара
А1
А2
А3
qj
П1
20
16
13
0,2
B1
( 20 0 , 2 )
(15 0 ,3)
(10 0 ,5 )
13 ,5
B2
(16 0 , 2 )
(12 0 ,3)
(14 0 ,5 )
13 ,8
B3
(13 0 , 2 )
(18 0 ,3)
(15 0 ,5 )
Спрос
П2
15
12
18
0,3
П3
10
14
15
0,5
15 ,5
n
B
max
i
q j a ij
j 1
max( 13 ,5;13 ,8;15 ,5 )
15 ,5
Ответ: оптимальной стратегией по критерию Байеса
является стратегия А3
131
2) Критерий Байеса относительно
рисков
Матрицу рисков игрока А и вероятности состояний
природы П можно представить матрицей:
Пj
П1 П2
Аi
А1 r11 r12
R = А2 r21 r22
… … …
Аm rm1 rm2
qj q1 q2
…
Пn
…
…
…
…
…
r1n
r2n
…
rmn
qn
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
132
Показателем эффективности стратегии Аi по
критерию Байеса относительно рисков
является математическое ожидание рисков,
расположенных в i-ой строке матрицы R.
n
r
Bi
q j rij , i
1, 2 ,..., m
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
133
Критерий Байеса относительно рисков
позволяет выбрать минимальное значение из
средних рисков при известной вероятности
возможных состояний природы:
n
B
r
min
i
q j rij
j 1
Критерии Байеса относительно выигрышей и
относительно рисков эквивалентны, то есть по обоим
критериям оптимальной будет одна и та же стратегия.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
134
3) Критерий Лапласа
относительно выигрышей
Вероятность состояний природы оценивается
субъективно как равнозначные.
qj = n-1
∑qj = ∑n-1 = 1
Этот принцип называется – принцип недостаточного
основания Лапласа.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
135
Имеется игра с природой, в которой игрок А обладает m
чистыми стратегиями Аi, природа П может случайным
образом находиться в одном из n своих состояний Пj, а
матрица выигрышей игрока А задается следующим
образом:
Пj
Аi
А=
А1
А2
…
Аm
qj
П1
П2
…
Пn
a11
a21
…
am1
a12
a22
…
am2
…
…
…
…
a1n
a2n
…
amn
…
qn=n-1
q1=n-1 q2=n-1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
136
Показателем эффективности чистой стратегии Аi
по критерию Лапласа относительно выигрышей
является среднеарифметическое выигрышей при
этой стратегии.
Li
1
n
n
a ij , i
1, 2 ,..., m
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
137
Критерий Лапласа относительно
выигрышей
предполагает выбор варианта стратегии с
максимальной ожидаемой доходностью при
равной вероятности наступления возможных
стратегий природы.
L
max
1
n
n
a ij
,i
1, 2 ,..., m
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
138
ПРИМЕР:
Магазин может завести в различных пропорциях товары
трех типов (А1, А2, А3). Их реализация и прибыль зависит от
вида товара и спроса на него. Спрос имеет три состояния –
П1, П2, П3 и не прогнозируется.
Матрица доходности имеет следующий вид:
Тип
товара
А1
А2
А3
П1
20
16
13
Спрос
П2
15
12
18
П3
10
14
15
Необходимо найти оптимальную стратегию по
критерию Лапласа
139
Решение:
Вычислим средние выигрыши
Тип
товара
А1
А2
А3
qj
L1
L
( 20
15
10 )
15
3
max
1
n
Спрос
П2
15
12
18
⅓
П1
20
16
13
⅓
L2
(16
12
14 )
3
14
П3
10
14
15
⅓
L3
(13
18
15 )
15 ,33
3
n
a ij
max( 15 ;14 ;15 ,33 )
15 ,33
j 1
Ответ: оптимальной стратегией по критерию Лапласа
относительно выигрышей является стратегия А3
140
4) Критерий Лапласа относительно
рисков
Матрицу рисков игрока А и вероятности
состояний природы П при критерии Лапласа
относительно рисков можно представить
матрицей:
Аi
R=
Пj
А1
А2
…
Аm
qj
П1
П2
…
Пn
r11
r21
…
rm1
r12
r22
…
rm2
…
…
…
…
r1n
r2n
…
rmn
qn=n-
q1=n-1 q2=n-1
…
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
1
141
Показателем неэффективности чистой
стратегии Аi по критерию Лапласа
относительно рисков является
среднеарифметическое рисков при этой
стратегии.
L
r
i
1
n
n
rij , i
1, 2 ,..., m
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
142
Критерий Лапласа относительно
рисков
предполагает выбор варианта стратегии с
минимальным риском при равной
вероятности наступления возможных
состояний природы.
L
r
min
1
n
n
rij
,i
1, 2 ,..., m
j 1
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
143
Критерий Гермейера относительно
выигрышей
Гермейер Юрий Борисович
(18.07.1918 - 24.06.1975)
– Профессор, д.т.н.
– Основатель и первый
руководитель отдела
Исследования
операций Вычислительного
Центра РАН
– Основатель и первый
руководитель кафедры
Исследования операций МГУ
им. М.В.Ломоносова
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
144
Критерий Гермейера относительно
выигрышей
Рассмотрим игру с природой размера (m ≥ 2) и (n ≥ 2) с
матрицей выигрышей А
Пj
Аi
А1
А = А2
…
Аm
qj
П1
П2
…
Пn
a11
a21
…
am1
q1
a12
a22
…
am2
q2
…
…
…
…
…
a1n
a2n
…
amn
qn
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
145
По критерию Гермейера (АG)
эффективность чистых стратегий
определяется следующим образом:
Выбрав чистую стратегию Ai, игрок А может получить
выигрыш aij, если природа окажется в состоянии Пj.
Но при этом природа может оказаться в этом
состоянии с вероятностью qj = p(Пj). Поэтому игрок А
может получить свой выигрыш (aij) только с
вероятностью qj.
В связи с этим рассматривается так
называемый элемент Гермейера этого
выигрыша – aij qj.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
146
Если выигрыш aij > 0, aij < 0 или aij = 0, то
элемент Гермейера соответствено
aij qj > 0, aij qj < 0 или aij qj = 0.
Если элемент Гермейера aij qj выигрыша
aij больше элемента akl ql выигрыша akl, то
выигрыш aij может быть не больше
выигрыша akl.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
147
Матрица Гермейера состоит из
элементов Гермейера и выглядит
следующим образом:
Пj
П1
П2
…
Пn
a11 q1
a12 q2
…
a1n qn
А2
a21 q1
a22 q2
…
a2n qn
…
…
am2 q2
…
Аm
…
am q1
…
…
amn qn
qj
q1
q2
…
qn
Аi
А1
АG =
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
148
При выборе стратегии игрок А предполагает, что природа
будет находиться в самом неблагоприятном для
него состоянии, при котором элемент Гермейера будет
являться самым минимальным среди всех элементов
матрицы Гермейера соответствующие выбранной
стратегии.
Этот элемент называется показателем
эффективности чистой стратегии Аi по
критерию Гермейера относительно выигрышей:
Gi
min ( a ij q j ), i
1, 2,... m
1 j n
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
149
Ценой игры в чистых стратегиях по
критерию Гермейера относительно
выигрышей является максимальное значение
среди показателей эффективности чистой
стратегии Аi по критерию Гермейера относительно
выигрышей:
G
max G i
1 i m
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
150
Так же ценой игры в чистых
стратегиях по критерию Гермейера
относительно выигрышей можно
назвать максимином матрицы
Гермейера относительно выигрышей:
G
max min ( a ij q j )
1 i m 1 j n
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
151
Пример:
Тип
товара
А1
А2
А3
П1
Спрос
П2
П3
20
16
13
15
12
18
10
14
15
Найти оптимальную стратегию по критерию Гермейера
относительно выигрышей при вероятностях состояний
природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
152
Решение:
Строим матрицу Гермейера с элементами aij qj
Тип товара
А1
А2
А3
П1
Спрос
П2
П3
4
3,2
2,6
4,5
3,6
5,4
5
7
7,5
Находим минимальный выигрыш игрока А по всем стратегиям по
формуле
Gi
G1 = min (4; 4,5; 5) = 4;
G2 = min (3,2; 3,6; 7) = 3,2;
G3 = min (2,6; 5,4; 7,5) = 2,6.
G
min ( a ij q j )
1 j n
max min ( a ij q j )
max( 4;3, 2;2,6 )
4
1 i m 1 j n
Ответ: оптимальной стратегией по критерию Гермейера
относительно выигрышей является стратегия А3
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ