Хаим Шапира - Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности
- Название:Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности
- Автор:
- Жанр:
- Издательство:Литагент Аттикус
- Год:2021
- Город:Москва
- ISBN:978-5-389-16827-5
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Хаим Шапира - Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности краткое содержание
«Эта книга касается теории игр и слегка затрагивает ряд важных идей в статистике и теории вероятностей. Эти три области мышления – научная основа того, как мы принимаем жизненные решения. Да, темы довольно серьезны, но я сделал все, чтобы книга получилась и точной, и увлекательной. В конце концов, радость от жизни так же важна, как и изучение нового». (Хаим Шапира) В формате PDF A4 сохранён издательский дизайн.
Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Видите? Обратный расчет может не принести должной выгоды. Он только все осложняет. Это «парадокс неожиданного экзамена» или «парадокс висельника», и вот в чем его суть. В пятницу, на последнем уроке, учитель объявляет, что на следующей неделе состоится неожиданный экзамен. Все ученики бледнеют от страха, но Джо просит слова. «Сэр! – говорит он. – Так не получится! У нас не может быть неожиданного экзамена на следующей неделе!» «Почему?» – спрашивает учитель. «Так ясно же, – отвечает Джо. – В пятницу его быть не может. Ведь если его не будет в четверг, тогда мы будем знать, что он пройдет в пятницу, и это уже не будет сюрприз. То же самое и в четверг – ведь если его не будет в понедельник, во вторник и в среду, а пятницу мы уже вычеркнули, то он должен пройти в четверг – и теперь мы о нем знаем, так что вы нас не удивите, сэр!»
Хотя не очень понятно, что такое «неожиданный экзамен», да и Джо был весьма убедителен, учитель все же удивил учеников, слишком поверивших в логику Джо, и устроил экзамен во вторник.
Та же логика применима к «Дилемме заключенного» с определенным числом раундов (на мастер-классах я обычно не разглашаю заранее их число), поскольку игроки начинают думать так же, как Джо о своем экзамене. Но этот перебор с возвратами только заводит в тупик.
Вышеупомянутый Роберт Аксельрод – профессор государственной политики в Мичиганском университете. Но он изучал и математику и прославился тем, что принял участие в разработке компьютеризованных вариантов «Дилеммы заключенного»; о них можно прочесть в его книге «Эволюция сотрудничества», вышедшей в 1984 г. [15] Axelrod Robert. The Evolution of Cooperation, Basic Books, 1985; revised edition 2006.
. Он просил многих людей, умных и мудрых, выслать ему искусные стратегии для итеративной версии «Дилеммы заключенного», определив правила игры так: если оба игрока хранят молчание, каждый получает 3 очка; если оба выбирают роль предателей, каждый получает 1 очко; если они совершают разный выбор, предатель получает 5 очков, а стойкий и молчаливый – 0. Аксельрод объявил, что для каждой игры отведено 200 раундов, и попросил предложить стратегию. Но что он имел в виду, говоря о «стратегии»?
В итеративной версии игр, основанных на «Дилемме заключенного», есть множество стратегических возможностей. «Всегда молчать» – одна из простейших стратегий, но она, несомненно, неразумна: предательство остается безнаказанным и второй игрок может легко сколотить капитал. «Всегда предавать» – гораздо более крутая стратегия. Можно выбирать всевозможные, даже самые странные стратегии: чередовать предательство с молчанием, подбрасывать монетку, выбирать случайным образом…
Вам, мой искушенный читатель, уже, наверное, ясно, что лучшая стратегия – отвечать на действия противника. И правда, на первых олимпиадах, где играли в компьютерные версии игр, основанных на «Дилемме заключенного», стратегия, приводящая к победе, была описана как «око за око». Кроме того, она была самой короткой: четыре строки на бейсике.
Создателем этой стратегии стал Анатолий Рапопорт (1911–2007), уроженец России, работавший в США. Его шаблон таков: в первом раунде вы храните молчание – иными словами, играете красиво. Потом и далее, начиная со второго раунда, вы просто повторяете предыдущий ход противника: если в первом раунде он промолчал, вы молчите во втором. Спрашивайте не о том, что вы можете сделать с противником, но о том, что он прежде сделал с вами, и поступайте так же. Стратегия «око за око» позволяла заработать в среднем 500 очков, а это довольно много. Не забывайте: если оба игрока решают молчать, они получают по 3 очка за раунд, а значит, 600 очков за игру – это и правда очень хороший результат. Эта стратегия получила высшие оценки.
Что интересно, самая сложная стратегия, с самым длинным описанием, получила низший балл. На второй олимпиаде появился подход «око за два»: если другой предает, вы даете ему возможность искупить грехи, и только если он снова выбирает предательство, вы отвечаете на это своим предательством. Эта стратегия еще «красивее», чем исходная «око за око», но ее красота может вам слишком дорого обойтись: стратегия заняла не слишком высокое место.
Услышав о стратегии «око за око», люди, не знающие ничего о теории игр, обычно протестуют: «И это великое открытие? Естественно, так все и делают!» В конце концов, стратегия «око за око» – это не какая-нибудь поразительная математическая находка, претендующая на Нобелевскую премию, а просто наблюдение за тем, как обычно ведут себя люди: ты ко мне с добром, и я к тебе с добром; ты ко мне со злом, и я тебе той же монетой; око за око, зуб за зуб, и все такое…
В дальнейшем Аксельрод выяснил, что для успеха стратегии «око за око» игроки должны следовать четырем правилам:
1. Будьте джентльменом. Никогда не предавайте первым.
2. Всегда отвечайте на предательства. Слепой оптимизм – плохая идея.
3. Умейте прощать. Как только соперник перестает предавать, прекращайте и вы.
4. Не завидуйте. В тех или иных раундах вам не выиграть, но в общем итоге вы одержите победу.
Еще в одну интересную версию «Дилеммы заключенного» играют несколько игроков зараз. Один из многих примеров такого варианта – охота на китов. Все страны, чья экономика широко полагается на китобойный промысел, мечтают возложить строгие ограничения на любую другую страну (стратегия молчания), а своим китобоям позволить бить китов сколько душа пожелает (стратегия предательства). Проблема здесь очевидна: если все китобойные страны будут «предателями», итог будет губительным для всех этих стран (не говоря уже о китах, которые так могут просто вымереть). Это случай игры, основанной на «Дилемме заключенного», только для многих игроков. То же можно сказать и о лесоразведении, и о климатических соглашениях (здесь есть искушение разорвать договор, загрязнить все что можно и получить прибыль, но каждому лучше, если все согласятся не вредить окружающей среде), и о более прозаических вопросах, той же ежемесячной плате на содержание кондоминиума (дома-совладения): платить иль не платить? Вот в чем вопрос! Конечно, каждый жилец был бы только рад, если бы все платили свои взносы – то есть все, кроме него. Тогда все было бы прекрасно: цвели бы сады, в фойе бы неизменно горел яркий свет, лифты работали бы без перебоев, а он бы не платил ничего! Проблемы начинаются тогда, когда все больше и больше жильцов (и наконец – все) начинают думать, что, возможно, им тоже не стоит платить взносы, – и прекращают это делать. Представьте себе, какие будут лифты и сады в таком кондоминиуме.
Кстати, если бы немецкий философ Иммануил Кант (1724–1804) мог сегодня сказать нам несколько слов, он бы предложил разрешить дилемму следующим категорическим императивом (который я адаптировал из слов самого Канта): Прежде чем действовать, подумайте вот над чем: желаете ли вы, чтобы ваше действие стало вселенским законом? Кант, видимо, ожидал бы от жильцов кондоминиума такого ответа: «Конечно, мы не хотим, чтобы все-все уклонялись от ежемесячной оплаты. Да, это может оказаться весьма неприятным, так что нам, скорее всего, стоит заплатить». Все это очень хорошо, но, вместо того чтобы ждать, пока все жильцы прочтут Канта, лучше бы ввести уставные нормы насчет таких оплат. В делах оплат и налогов люди, как правило, не платят добровольно… даже если они читали Канта.
Читать дальшеИнтервал:
Закладка: