Хорди Деулофеу - Дилемма заключенного и доминантные стратегии. Теория игр
- Название:Дилемма заключенного и доминантные стратегии. Теория игр
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:2014
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Хорди Деулофеу - Дилемма заключенного и доминантные стратегии. Теория игр краткое содержание
Есть ли способ заранее «просчитать» мысли и поведение человека? Ответы на эти и многие другие вопросы вы найдете в данной книге. Это не просто сборник интересных задач, но попытка объяснить сложные понятия и доказать, что серьезная и занимательная математика — две стороны одной медали.
Дилемма заключенного и доминантные стратегии. Теория игр - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Телеконкурс
Одно из заданий телеконкурса состоит в том, что нужно угадать, за какой дверью находится приз. Конкурсанта просят выбрать одну из трех дверей. Затем ведущий конкурса (он знает, за какой дверью находится приз) открывает одну из двух дверей, не выбранных конкурсантом, за которой нет приза, и предлагает поменять изначально выбранную дверь на другую закрытую. Стоит ли принимать предложение ведущего, чтобы повысить шансы на победу?
Химик Лайнус Полинг (1901-1994) получил первую Нобелевскую премию в 1954 году за работы в области квантовой химии. После вручения ему второй премии — Нобелевской премии мира — в 1962 году за кампанию против испытаний ядерного оружия лауреат шутливо заметил, что получить первую премию было очень сложно: вероятность этого составляла один на шесть миллиардов (это население Земли). Вторая, по его мнению, была не столь почетна: вероятность этого равнялась одному на несколько сотен (число живущих на тот момент лауреатов Нобелевской премии). Где же кроется ошибка в этих забавных, но неверных рассуждениях?
Чтобы считать, что вероятность получения второй Нобелевской премии зависит только от числа ее прошлых лауреатов, необходимо, чтобы Нобелевский комитет решил дать премию тому, кто уже получал ее ранее. Однако если мы не располагаем такой информацией, то получить вторую премию с точки зрения теории вероятности столь же сложно, что и первую, так как комитет не принимает во внимание, кто уже получал премию раньше, а кто — нет.
Очевидно, что рассматривать получение Нобелевской премии исключительно с точки зрения теории вероятностей — уже шутка, так как все зависит не столько от случая, но главным образом от заслуг человека.
Лайнус Полинг (справа) получает Нобелевскую премию мира.
Это знаменитая противоречивая задача теории вероятностей, в которой нужно определить, как изменяется вероятность того, что за закрытой дверью находится приз. Когда конкурсант выбирает одну из дверей, вероятность выигрыша равна 1/3. Эта вероятность не изменяется, когда ведущий выбирает одну из оставшихся дверей (за которой нет приза) и открывает ее, поскольку уже известно, что за одной из двух других дверей нет приза. Однако изменяется вероятность того, что приз находится за другой закрытой дверью: она равнялась 1/3 и стала равна 2/3 (вероятности для закрытых дверей складываются). Поэтому конкурсант должен согласиться изменить свой выбор, потому что в этом случае вероятность выигрыша составит 2/3. Противоречивость задачи в том, что вероятность выигрыша для изначально выбранной двери не изменяется. Если бы ведущий не выбирал одну из дверей, за которой нет приза, а вместо этого конкурсант указывал на одну из двух оставшихся дверей и спрашивал, находится ли за ней приз, а ведущий ответил бы «нет», то в этом случае вероятность выигрыша для изначально выбранной двери изменилась бы с 1/3 на 1/2.
Эта игра допускает одно интересное обобщение. Пусть имеется n дверей, и за одной из них находится приз. Конкурсант выбирает одну дверь (не открывая ее), ведущий открывает одну из других дверей, за которой нет приза, а затем разрешает изменить первоначальный выбор. Затем ведущий открывает другую дверь (одну из всех закрытых, за исключением той, что конкурсант выбрал последней), за которой также нет приза, и снова разрешает конкурсанту изменить выбор. Игра продолжается до тех пор, пока не останется две двери и конкурсант должен будет сделать окончательный выбор. Как нужно действовать конкурсанту на протяжении игры, чтобы вероятность выигрыша была наибольшей? Какой в этом случае будет вероятность выигрыша?
Будем отталкиваться от того факта, что при открытии двери ведущим изменяются вероятности для всех закрытых дверей, кроме той, которую выбрал конкурсант. Следовательно, вероятность выигрыша будет наибольшей тогда, когда игрок не будет менять свой выбор, пока не останутся лишь две закрытые двери. В этом случае игрок изменит свой выбор и вероятность победы будет равна (n - 1)/n. Таким образом, при первом выборе вероятность выигрыша составляет 1 /n (так как число дверей равно n). Если игрок не меняет свой выбор до момента, когда останутся лишь две закрытые двери, для изначально выбранной двери вероятность выигрыша будет равна 1/n, для другой — (n - 1)/n, которая и будет наибольшей. Если же, напротив, на каком-то из промежуточных шагов игрок изменит свой выбор, в этом случае определить вероятности будет несколько сложнее. Результат будет зависеть от того, сколько раз игрок изменит свой выбор и когда. В любом случае вероятность в этом случае будет выше 1/n, так как все вероятности увеличатся по отношению к исходной минимум один раз. Когда останутся только две двери, ни для одной из них вероятность выигрыша не будет равной (n - 1)/n. Если вам интересно подробнее ознакомиться с этой игрой, попробуйте вычислить вероятности для разных стратегий. Получить верный результат будет непросто, но очень интересно.
Математика и ожидание
Одно из наиболее важных понятий, которое следует учитывать, принимая решения в азартных играх, — математическое ожидание. Перед тем как дать этому термину точное определение, рассмотрим несколько примеров. Допустим, нам предлагают сыграть в такую игру: бросают две монеты, если выпадает две решки, выигрыш равен 4 евро, если выпадает два орла — 1 евро, если выпадает орел и решка — мы проигрываем 3 евро. Стоит ли играть по таким правилам? Сколько мы надеемся выиграть (или проиграть)?
При броске двух монет имеется четыре возможных результата: две решки (р = 1/4), два орла (р = 1/4), орел и решка (р = 1/4), решка и орел (р = 1/4). Каждые четыре броска в среднем один раз выпадут две решки, один раз — два орла и два раза — орел и решка. Следовательно, в среднем наш выигрыш составит 1 • 4 + 1 • 1 + 2 • (—3) = -1 евро. Это означает, что играть невыгодно и в среднем каждые четыре броска мы будем проигрывать 1 евро, то есть 25 центов за игру. Аналогичный результат можно получить, умножив вероятности для каждого исхода на соответствующий выигрыш (или проигрыш, который будет выражаться отрицательным числом) и сложив полученные результаты. В таком случае получим
1/4.4 + 1/4.1 + 1/2 • (-3) = -1/4 евро.
Рассмотрим второй пример. В игре с обычным кубиком банк платит 6 фишек, если выпадает шестерка, 4 фишки, если выпадает нечетное число, в остальных случаях мы не получаем ничего. Сколько нужно ставить в каждом розыгрыше, чтобы игра была сбалансированной?
Учитывая, что р(6) = 1/6 и р(нечетное число) = 1/2, в каждом розыгрыше мы ожидаем выиграть 1/6•6 + 1/2•4 + 1/3•0 = 3 фишки. Следовательно, игра будет равновесной (ни банк, ни игрок не будут иметь преимущества), если каждая ставка будет равняться 3 фишкам.
Читать дальшеИнтервал:
Закладка: