Авинаш Диксит - Стратегические игры
- Название:Стратегические игры
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2017
- Город:Москва
- ISBN:9785001008132
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Авинаш Диксит - Стратегические игры краткое содержание
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Стратегические игры - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Хотя на первый взгляд подобные интуитивные выводы кажутся вполне обоснованными, в них упущен один важный аспект теории стратегий: взаимодействие между двумя игроками. После изменения выигрышей Эверт также будет пересматривать свою равновесную комбинацию, а Навратилова должна учитывать как новую структуру выигрышей, так и поведение Эверт при определении своей новой комбинации стратегий. В частности, поскольку теперь Навратилова гораздо лучше прикрывает ПЛ, Эверт в своей смешанной стратегии чаще использует ПД. И чтобы противодействовать этому, Навратилова тоже чаще прикрывает ПД.
Это станет более очевидным после того, как мы вычислим новую комбинацию Эверт. Ее равновесное значение p должно обеспечивать равенство между ожидаемым выигрышем Навратиловой от прикрытия ПЛ, 30 p + 90(1 — p ), и ее ожидаемым выигрышем от прикрытия ПД, 80 р + 20(1 — p ). Таким образом, мы имеем уравнение 30 p + 90(1 — p ) = 80 p + 20(1 — p ), или 90–60 p = 20 + 60 p , или 120 p = 70. Следовательно, значение p Эверт должно составлять 7/12, или 0,583 (58,3 %). Сравнение этого нового равновесного значения p с рассчитанным в разделе 2первоначальным значением 70 % показывает, что Эверт существенно сократила количество использования ПЛ в ответ на повышение мастерства Навратиловой. С учетом такого поведения Эверт Навратиловой также лучше сократить частоту применения стратегии ПЛ. Теперь Эверт будет использовать с выгодой для себя любой другой выбор комбинации стратегий Навратиловой, особенно той, в которой предпочтительна стратегия ПЛ.
Означает ли это, что Навратилова совершенствовала навыки зря? Нет, но мы должны судить об этом не по частоте применения той или иной стратегии, а по итоговым выигрышам. Когда Навратилова использует свою новую равновесную комбинацию с q = 0,5, процент успеха Эверт при выборе любой из ее чистых стратегий составляет (30 × 0,5) + (80 × 0,5) = (90 × 0,5) + (20 × 0,5) = 55. Это меньше, чем процент успеха Эверт 62 в исходном примере. Следовательно, средний выигрыш Навратиловой также возрастает с 38 до 45, а значит, улучшение навыков прикрытия удара ПЛ действительно принесло ей пользу.
В отличие от парадоксального результата, который мы наблюдали при анализе стратегического ответа Навратиловой на изменение в структуре выигрышей, здесь мы видим, что этот ответ полностью соответствует интуитивным представлениям, если рассматривать его в свете ожидаемого выигрыша Навратиловой. На самом деле с точки зрения ожидаемых выигрышей ответы игроков на изменение структуры выигрышей просто не могут противоречить здравому смыслу, хотя стратегические ответы, как мы уже убедились, могут [95]. Самый интересный аспект такого парадоксального результата стратегических ответов игроков — это сигнал, который он подает теннисистам и, в более общем плане, участникам стратегических игр. Этот результат эквивалентен утверждению, что Навратилова должна усовершенствовать навыки прикрытия удара по линии с тем, чтобы ей не пришлось использовать такое прикрытие слишком часто.
Далее мы представим еще более общий и неожиданный результат, обусловленный изменениями вероятностей применения чистых стратегий в смешанной стратегии. Условие безразличия соперника означает, что равновесные вероятности чистых стратегий в смешанной стратегии каждого игрока зависят исключительно от выигрышей другого игрока, а не от его собственных. Рассмотрим игру в доверие на рис. 7.3. Предположим, выигрыш Салли от встречи в Local Latte увеличивается с 2 до 3, тогда как все остальные выигрыши не меняются. Теперь в случае p -комбинации Гарри Салли получит выигрыш 1 × p + 0 × (1 — p ) = p , если выберет Starbucks, и 0 × p + 3 × (1 — p ) = 3–3 p , если Local Latte. Условие безразличия Салли выглядит так: p = 3–3 p , или 4 p = 3, или p = 3/4 по сравнению со значением 2/3, вычисленным нами выше для p- комбинации Гарри в исходной игре. Расчет условия безразличия Гарри остается прежним и дает результат q = 2/3 в случае равновесной стратегии Салли. Изменение выигрышей Салли меняет вероятности применения чистых стратегий в смешанной стратегии Гарри, а не Салли! В упражнении S13 у вас будет возможность доказать истинность этого вывода в общей формулировке: доли чистых стратегий в равновесной смешанной стратегии игрока меняются не вследствие изменения его выигрышей, а только в случае изменения выигрышей его соперника.
В. Рискованный и безопасный выбор в играх с нулевой суммойВ спорте некоторые стратегии сравнительно безопасны; они не приводят к полной катастрофе, даже если соперник предвидит такой выбор, но и не позволяют добиться сверхрезультатов, если оказываются неожиданными для соперника. Другие стратегии достаточно рискованны; они обеспечивают блестящие результаты, если другая сторона к ним не готова, но терпят полное поражение, когда другая сторона готова. В американском футболе на третьем дауне, когда остается пройти один ярд, пробежка на середину поля — это безопасная стратегия, а длинный пас — рискованная. Здесь возникает интересный вопрос, поскольку порой в ситуациях «третий даун, один ярд» на кону стоит больше, чем в других подобных ситуациях. Например, начало игры с 10-ярдовой линии соперника гораздо сильнее влияет на возможное количество заработанных очков, чем ее старт с вашей собственной 20-ярдовой линии. Вопрос в том, следует ли вам чаще или реже прибегать к рискованным стратегиям в случае более высоких ставок, чем низких.
Для того чтобы представить это в более конкретном виде, проанализируйте вероятности успеха, представленные на рис. 7.6. (Обратите внимание, что тогда как в теннисе мы использовали проценты от 0 до 100, здесь мы используем вероятности от 0 до 1.) Безопасная игра команды нападения — пробежка; вероятность успешного первого дауна составляет 60 %, если команда защиты ожидает пробежки, и 70 %, если защита полагает, что будет пас. Рискованная игра команды нападения — пас, поскольку вероятность успеха в куда большей степени зависит от действий команды защиты; вероятность успеха равна 80 %, если защита ожидает пробежки, и всего 30 %, если защита рассчитывает на пас.
Рис. 7.6.Вероятность успеха команды нападения в игре «третий даун, один ярд»
Допустим, в случае успешной игры команда защиты получает выигрыш, равный V , а неудачной — выигрыш 0. Выигрыш V может представлять собой то или иное количество очков, скажем, три очка за гол в ворота или семь очков за тачдаун. Кроме того, выигрыш V может отображать определенный уровень статуса или количество денег, заработанных командой; например, V = 100 за успешную игру в обычном матче или V = 1 000 000 за победу в Суперкубке по американскому футболу [96].
Читать дальшеИнтервал:
Закладка: