Авинаш Диксит - Стратегические игры
- Название:Стратегические игры
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2017
- Город:Москва
- ISBN:9785001008132
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Авинаш Диксит - Стратегические игры краткое содержание
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Стратегические игры - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Обратите внимание, что выигрыши Эверт от использования стратегии СВ против стратегий ПЛ и ПД Навратиловой могут быть даже ниже значения, при котором все три прямые пересекаются в одной точке (например, если бы выигрыши от СВ равнялись 75 и 30 вместо 70 и 60, как на рис. 7.8). Тогда стратегия СВ не может быть наилучшим ответом Эверт, хотя она не является ни доминируемой стратегией ПЛ, ни доминируемой стратегией ПД. Случай, когда стратегия СВ доминируема по отношению к комбинации стратегий ПЛ и ПД, рассматривается в онлайн-приложении в данной главе.
7. Смешивание стратегий при наличии трех стратегий у обоих игроков
При рассмотрении игр, в которых у обоих игроков есть по три чистые стратегии с возможностью смешивания всех трех, необходимы две переменные, чтобы задать каждую комбинацию стратегий [100]. В комбинации игрока, данные которого отображаются в строках, его первой чистой стратегии соответствует вероятность p 1, а второй — вероятность p 2. Тогда вероятность использования третьей чистой стратегии должна составлять 1 минус сумма вероятностей остальных двух стратегий. То же самое касается комбинации игрока, которому соответствуют столбцы. Таким образом, когда каждый игрок имеет по три чистые стратегии, найти равновесие в смешанных стратегиях без выполнения алгебраических операций с двумя переменными нельзя. Тем не менее зачастую такие алгебраические расчеты вполне выполнимы.
А. Полная комбинация всех стратегийРассмотрим упрощенное представление пенальти в футболе. Предположим, выполняющий его игрок, бьющий правой ногой, имеет три чистые стратегии: удар влево, вправо или в центр (налево или направо по отношению к вратарю; для игрока-правши было бы логично отправить мяч направо от вратаря), и может смешивать их с вероятностями, обозначенными как p л , p п , p цсоответственно. Любые две из этих вероятностей можно принять как независимые переменные, а третью выразить через них. Если p ли p п — независимые переменные, то p ц = 1 — p л — p п. Вратарь также располагает тремя чистыми стратегиями, а именно двигаться налево от бьющего игрока (направо от самого вратаря), направо от бьющего игрока (налево от вратаря) или оставаться в центре. Кроме того, вратарь может их смешивать с вероятностями q л , q п , q ц, две из которых могут быть выбраны в качестве независимых переменных.
Как и в разделе 6.А, график наилучших ответов для этой игры потребовал бы более двух размерностей. (Точнее говоря, четыре. Вратарь выбрал бы свои две независимые переменные, скажем ( q л , q п), как свой наилучший ответ на две независимые переменные игрока, выполняющего пенальти ( p л , p п), и наоборот.) Вместо этого мы снова воспользуемся свойством безразличия соперника, чтобы сфокусироваться на вероятностях чистых стратегий в смешанной стратегии по одному игроку за один раз. В случае каждого игрока вероятности должны быть такими, чтобы другому игроку было безразлично, какую стратегию из имеющихся в его комбинации стратегий выбрать. Это дает нам систему уравнений, которая позволит найти вероятности применения чистых стратегий в смешанной стратегии. В примере с футболом переменные ( p л , p п) удовлетворяли бы двум уравнениям, выражающим требование о том, что ожидаемый выигрыш вратаря от использования стратегии «налево» должен быть равен ожидаемому выигрышу от применения стратегии «направо», а также что ожидаемый выигрыш вратаря от выбора стратегии «направо» должен равняться ожидаемому выигрышу от выбора стратегии «в центре». (В таком случае равенство ожидаемых выигрышей от применения стратегий «налево» и «в центре» определяется автоматически и не требует отдельного уравнения.) При большем количестве стратегий число вероятностей, подлежащих вычислению, и уравнений, которым они должны удовлетворять, тоже увеличивается.
На рис. 7.10 показана таблица взаимодействия между игроком, выполняющим пенальти, и вратарем, где в качестве выигрышей каждого игрока указаны проценты успешных действий. (В этой таблице для упрощения расчетов приведены не фактические данные европейского футбола, представленные чуть ниже, а аналогичные округленные числа.) Поскольку игрок, бьющий пенальти, хочет максимально увеличить выраженную в процентах вероятность того, что он забьет гол, а вратарь стремится минимизировать вероятность того, что он его пропустит, мы имеем дело с игрой с нулевой суммой. Например, в ситуации, когда бьющий игрок отправит мяч налево от себя, а вратарь сделает движение налево от бьющего игрока (ячейка в верхнем левом углу), мы исходим из предположения, что бьющему игроку все равно удастся забить гол в 45 % случаев, стало быть, вратарь сможет отразить удар в 55 % случаев. Однако если бьющий игрок отправит мяч направо от себя, а вратарь сделает движение налево от него, то у бьющего есть возможность забить гол с вероятностью 90 %; мы исходим из того, что он с вероятностью 10 % может ударить мимо или выше ворот, а значит, вратарь может добиться успеха в 10 % случаев. Вы можете поэкспериментировать с другими, более приемлемыми, на ваш взгляд, значениями выигрышей.
Рис. 7.10.Игра в пенальти в футболе
Легко убедиться, что в этой игре нет равновесия в чистых стратегиях. Поэтому допустимя, что игрок, выполняющий пенальти, смешивает стратегии с вероятностями p л, p пи p ц = 1 — p л — p п. По каждой чистой стратегии вратаря эта комбинация обеспечивает ему следующие выигрыши:
«Налево»: 55 p л + 15 p ц + 5 p п = 55 p л + 15(1 — p л — p п) + 5 p п.
«В центр»: 10 p л + 100 p ц + 5 p п = 10 p л + 100(1 — p л — p п) + 5 p п.
«Направо»: 10 p л + 15 p ц + 40 p п = 10 p л + 15(1 — p л — p п) + 40 p п.
Правило безразличия соперника гласит, что бьющий игрок должен выбрать p ли p п, с тем чтобы в равновесии все три выражения были эквивалентны.
Приравняв выражения, соответствующие стратегиям «налево» и «направо», и упростив полученное равенство, имеем 45 p л = 35 p п, или p п = (9/7) p л. Далее приравниваем выражения, соответствующие стратегиям «в центре» и «направо», и упрощаем полученное равенство с помощью только что выведенного соотношения между p п. Это дает 10 p л + 100[1 — p л — (9 p л / 7)] + 5(9 p л / 7) = 10 p л + 15[1 — p л — (9 p л / 7)] + 40 (9 p л / 7), или [85 + 120(9/7)] p л = 85, что дает p л = 0,355. Далее получаем p п = 0,355(9/7) = 0,457 и, наконец, p ц = 1–0,355 — 0,457 = 0,188. Затем вычисляем с помощью представленных выше трех строк выигрышей выигрыш вратаря от любой из его трех стратегий против этой комбинации стратегий; результат — 24,6.
Читать дальшеИнтервал:
Закладка: