Авинаш Диксит - Стратегические игры
- Название:Стратегические игры
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2017
- Город:Москва
- ISBN:9785001008132
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Авинаш Диксит - Стратегические игры краткое содержание
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Стратегические игры - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
2. Дилемма заключенных
Предположим, популяция состоит из двух фенотипов. Один включает игроков, которым от рождения свойственно стремление к сотрудничеству: они неизменно работают над достижением исхода, наилучшего для всех. Игроки другого типа не склонны к сотрудничеству и делают все исключительно ради себя. В качестве примера возьмем игру в ценообразование в ресторанах, описанную в главе 5и представленную в упрощенной версии в главе 10. Здесь мы рассмотрим более простую версию, в которой только два варианта выбора цен: наилучшая цена для обоих ресторанов 26 долларов и цена в случае равновесия Нэша 20 долларов. Ресторатор, настроенный сотрудничать, всегда будет выбирать 26 долларов, тогда как владелец ресторана, предпочитающий отказаться от сотрудничества, — 20 долларов. Выигрыши (прибыль) каждого типа в одной игре этой дискретной дилеммы показаны на рис. 12.1, где воспроизведена таблица с рис. 10.2. Мы называем игроков просто Строка и Столбец, поскольку на месте каждого из них может быть любой ресторатор, который входит в состав популяции и которого выбирают случайным образом как конкурента другого случайно выбранного соперника.
Рис. 12.1.Дилемма заключенных в контексте игры в ценообразование (выигрыши исчисляются в сотнях долларов в месяц)
Не забывайте, что в эволюционном сценарии ни у кого нет выбора между сотрудничеством и отказом от него; каждый «рождается» с тем или иным предопределенным качеством. Какое же качество будет более успешным (более приспособленным) в популяции?
Владелец ресторана, который относится к типу не склонных к сотрудничеству игроков, получает выигрыш 288 (28 800 долларов в месяц) в конкурентной борьбе с аналогичным типом и выигрыш 360 (36 000 долларов в месяц) — с типом, готовым сотрудничать. В свою очередь тип, готовый сотрудничать, получает 216 (21 600 долларов в месяц) в соперничестве с типом, не склонным к сотрудничеству, и 324 (32 400 долларов в месяц) — с аналогичным себе типом [211]. Следовательно, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш (а значит, и уровень приспособленности), чем тип, готовый к сотрудничеству, независимо от их соотношения в популяции.
Опишем эту ситуацию более формально. Пусть x — это доля готовых к сотрудничеству типов в популяции. Рассмотрим ее любого отдельно взятого члена, склонного к сотрудничеству. При случайном выборе вероятность того, что он встретит другого такого же представителя популяции (и получит выигрыш 324) равна x , а вероятность того, что он встретит игрока, не расположенного к сотрудничеству (и получит выигрыш 216), составляет (1 — x ). Следовательно, среднестатистический ожидаемый выигрыш типа, склонного к сотрудничеству, равен 324 x + 216(1 — x ). Для противоположного типа вероятность встретить игрока, готового сотрудничать (и получить выигрыш 360), составляет x , а игрока аналогичного себе типа (выигрыш 288) — (1 — x ). Таким образом, среднестатистический ожидаемый выигрыш типа, не склонного к сотрудничеству, составляет 360 x + 288(1 — x ). Очевидно, что при всех значениях x от 0 до 1 выполняется следующее условие:
360 x + 288(1 — x ) > 324 x + 216(1 — x ).
Стало быть, тип, не расположенный к сотрудничеству, имеет более высокий ожидаемый выигрыш и более высокий уровень приспособленности, чем тип, идущий на сотрудничество. Это обусловит увеличение доли этих типов (при этом снижается значение x ) от поколения к поколению, пока вся популяция не будет состоять исключительно из типов, не склонных к сотрудничеству.
А что если популяция изначально состоит только из таких игроков? Тогда ни один (экспериментальный) мутант, готовый к сотрудничеству, не сможет в ней выжить и размножиться настолько, чтобы эту популяцию захватить. Иными словами, мутанты, расположенные к сотрудничеству, не добьются успеха в захвате популяции игроков, не склонных к нему. Даже при совсем малых значениях x (то есть когда доля игроков, готовых к сотрудничеству, очень мала) расположенные к сотрудничеству игроки остаются менее приспособленными по сравнению с оппонентами и их доля в популяции не увеличится, а будет сведена к нулю и мутантная линия исчезнет.
Наш анализ показывает, что у типа игроков, не расположенных к сотрудничеству, более высокий уровень приспособленности по сравнению с типом игроков, готовых к сотрудничеству, а также что популяция, состоящая только из игроков первого типа, не может быть захвачена мутантами. Таким образом, эволюционно устойчивая конфигурация популяции мономорфна и состоит из одной стратегии, или фенотипа, — «отказ от сотрудничества». В связи с этим мы называем ее эволюционно устойчивой стратегией для популяции, вовлеченной в данную дилемму заключенных. Обратите внимание, что при анализе этой игры с точки зрения рационального поведения «отказ от сотрудничества» — строго доминирующая стратегия. Этот результат носит общий характер: если в игре есть строго доминирующая стратегия, она обязательно будет эволюционно устойчивой.
А. Повторяющаяся дилемма заключенныхВ главе 10мы говорили о том, что повторение дилеммы заключенных позволяет игрокам, осознанно придерживающимся рационального поведения, сотрудничать ради взаимной выгоды. Давайте посмотрим, есть ли подобная возможность в эволюционной игре. Предположим, каждая выбранная пара игроков разыгрывает дилемму заключенных три раза подряд. Общий выигрыш игрока от такого взаимодействия — это сумма выигрышей, полученных за три раунда.
Каждый отдельный игрок запрограммирован на использование только одной стратегии, но она должна представлять собой исчерпывающий план действий. В игре с тремя ходами стратегия может предусматривать во время второго или третьего раунда выполнение действия, которое зависит от того, что произойдет в первом или втором раунде. Например, «Я буду сотрудничать при любых обстоятельствах» и «Я буду всегда отказываться от сотрудничества при любых обстоятельствах» — это допустимые стратегии. Однако также допустима стратегия «Я начну с сотрудничества и буду продолжать его, если вы сотрудничали во время предыдущего раунда, и откажусь от него во всех последующих раундах, если вы не сотрудничали во время первого». На самом деле эта последняя стратегия — не что иное, как стратегия равноценных ответных действий, или «око за око».
Для простоты анализа в этом разделе мы будем исходить из предположения, что в популяции могут существовать только два типа стратегий: «всегда отказ от сотрудничества» (В) и «око за око» (О). Из популяции случайным образом выбираются пары игроков, после чего каждая пара проводит игру определенное количество раз. Уровень приспособленности каждого игрока представляет собой сумму его выигрышей от всех повторений игры против конкретного соперника. Мы проанализируем, что происходит в случае двух, трех и n таких повторений в каждой паре.
Читать дальшеИнтервал:
Закладка: