Авинаш Диксит - Стратегические игры
- Название:Стратегические игры
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2017
- Город:Москва
- ISBN:9785001008132
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Авинаш Диксит - Стратегические игры краткое содержание
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Стратегические игры - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
I. Игра с двумя повторениями.На рис. 12.2 представлена таблица выигрышей для игры, в которой встречаются два представителя популяции рестораторов и играют друг против друга в точности два раза. Если оба игрока относятся к типу В, оба откажутся от сотрудничества в обоих случаях, тогда, как показано на рис. 12.1, каждый из них получит выигрыш 288 в каждом раунде игры, то есть в сумме 576. Если оба игрока относятся к типу О, отказа не будет и каждый игрок получит в каждом раунде выигрыш 324, в сумме 648. Если один игрок относится к типу В, а другой к типу О, то во время первого раунда игрок типа В откажется сотрудничать, а игрок типа О будет сотрудничать; в итоге у первого выигрыш составит 360, а у второго — 216. Во время второго раунда оба игрока откажутся сотрудничать и получат выигрыш по 288 каждый. Таким образом, общий выигрыш игрока типа В будет 360 + 288 = 648, а игрока О — 216 + 288 = 504.
Рис. 12.2.Исходы дилеммы заключенных с двумя повторениями (в сотнях долларов в месяц)
В дважды повторяющейся дилемме заключенных мы видим, что стратегия В («всегда отказ от сотрудничества») — слабо доминирующая. Очевидно, что, если популяция состоит только из игроков типа В, мутанты О-типа не смогут ее захватить, поэтому В — эволюционно устойчивая стратегия. Но если популяция включает исключительно игроков типа О, мутанты В-типа не могут добиться большего, чем игроки О-типа. Означает ли это, что стратегия О («око за око») должна быть еще одной эволюционно устойчивой стратегией, подобно тому как в случае анализа этой игры с точки зрения рационального поведения игроков был бы сделан вывод о существовании равновесия Нэша? Ответ: нет. Если популяция изначально состоит только из игроков типа О и в игру вступают немногочисленные мутанты типа В, то последние в основном будут встречаться с игроками преобладающего типа О и получат такие же выигрыши, как и выигрыш игрока типа О в паре с другим игроком типа О. Но иногда мутант типа В будет встречаться с другим мутантом типа В и тогда получит более высокий выигрыш, чем получил бы игрок типа О в паре с игроком типа В. Таким образом, у мутантов немного более высокий уровень приспособленности, чем у представителей преобладающего фенотипа, и это преимущество приводит к увеличению (хотя и медленному) их доли в популяции. Следовательно, мутанты типа В все же могут успешно захватить популяцию, состоящую только из игроков типа О, а значит, эту стратегию нельзя назвать эволюционно устойчивой.
Наши рассуждения основаны на двух критериях определения эволюционно устойчивой стратегии. Во-первых, мы анализируем, получает ли мутант более высокий или низкий результат, чем преобладающий фенотип, когда каждый противостоит игроку преобладающего типа. Если этот первичный критерий дает четкий ответ, значит вопрос решен. Но если первичный критерий дает равный счет, мы используем вторичный критерий, позволяющий определить победителя: добивается ли мутант большего или меньшего, чем преобладающий фенотип, когда каждый противостоит мутанту? Равный счет бывает крайне редко, поэтому обычно необходимости применять вторичный критерий нет, но он есть в резерве для таких ситуаций, как отображенная на рис. 12.2 [212].
II. Игра с тремя повторениями. Теперь предположим, что каждая подобранная пара игроков из популяции (В, О) играет в эту игру три раза. На рис. 12.3 представлены итоговые показатели приспособленности по всем трем раундам для каждого типа игроков в паре с соперниками каждого типа.
Рис. 12.3.Исходы дилеммы заключенных с тремя повторениями (в сотнях долларов в месяц)
Для того чтобы увидеть, как повышаются показатели приспособленности, рассмотрим пару примеров. Когда встречаются два игрока типа О, оба идут на сотрудничество в первом раунде, а значит, оба его продолжат и во втором, и в третьем раундах. При этом игроки каждый раз получают по 324, что в сумме дает каждому из них выигрыш 972 за три месяца. Когда игрок типа О встречается с игроком типа В, второй получает хороший результат в первом раунде (360 в паре с игроком В и 216 в паре с игроком О), но во втором и третьем раундах игрок типа О также отказывается от сотрудничества и каждый из них получает по 288 в обоих раундах (в сумме выигрыш игрока типа В равен 936, а типа О — 792).
Относительная приспособленность двух типов зависит от состава популяции. Если она почти полностью состоит из игроков типа В, то у типа В более высокий уровень приспособленности, чем у типа О (поскольку при встрече игроков типа В в основном с другими игроками типа В они в большинстве случаев получают выигрыш 864, а игроки типа О — 792). С другой стороны, если в популяции преобладают игроки типа О, у типа О более высокий уровень приспособленности, чем у типа В (так как игроки типа О получают выигрыш 972 при встрече в основном с другими представителями типа О, а выигрыш игроков типа В в такой ситуации составляет 936). Уровень приспособленности каждого типа выше, если он уже преобладает в популяции. Следовательно, тип О не может успешно захватить популяцию, состоящую из игроков типа В, и наоборот. Таким образом, существуют две возможные эволюционно устойчивые конфигурации популяции: в одной эволюционно устойчивая стратегия — стратегия В («всегда отказ от сотрудничества»), а в другой — стратегия О («око за око»).
Теперь рассмотрим эволюционную динамику в случае, когда исходная популяция представляет собой комбинацию двух типов. Как распределится ее состав с течением времени? Допустим, доля x в популяции — это игроки типа О, а остальная часть (1 — x ) — игроки типа В [213]. Отдельный игрок типа В, выставленный против различных соперников, выбранных из данной популяции, получает выигрыш 936 в противостоянии с игроком типа О, что происходит в x случаях, и выигрыш 864 в противостоянии с другим игроком типа В, что наблюдается в (1 — x ) случаях. Это дает следующий ожидаемый выигрыш каждого игрока типа В:
936 x + 864(1 — x ) = 864 + 72 x .
Аналогичным образом отдельный игрок типа О получает такой ожидаемый выигрыш:
972 x + 792(1 — x ) = 792 + 180 x .
Стало быть, уровень приспособленности игрока типа О выше уровня приспособленности игрока типа В, если первый в среднем получает больше, то есть при выполнении следующего условия:
792 + 180 x > 864 + 72 x ,
108 x > 72,
x > 2/3.
Иными словами, если более двух третей (67 %) популяции уже принадлежат к типу О, то у игроков этого типа более высокий уровень приспособленности и их доля будет расти, пока не достигнет 100 %. Если в начале игры в популяции менее 67 % игроков типа О, тогда у игроков типа В более высокий уровень приспособленности и доля игроков типа О будет падать, пока не достигнет 0 %, то есть популяция будет полностью состоять из игроков типа В. Эволюционная динамика смещает популяцию к одному из двух крайних состояний, каждое из которых может быть эволюционно устойчивой стратегией. Эта динамика приводит к тому же выводу, что и статический критерий захвата популяции мутантами. Это общее, хотя и не универсальное свойство эволюционных игр.
Читать дальшеИнтервал:
Закладка: