Enrique Rodriguez - Камень, ножницы, теорема. Фон Нейман. Теория игр.
- Название:Камень, ножницы, теорема. Фон Нейман. Теория игр.
- Автор:
- Жанр:
- Издательство:Де Агостини
- Год:2015
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Enrique Rodriguez - Камень, ножницы, теорема. Фон Нейман. Теория игр. краткое содержание
Камень, ножницы, теорема. Фон Нейман. Теория игр. - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
У игрока В немного другая ситуация. Если А выберет первую стратегию, наилучшим вариантом будет В1. В случае А2, разумеется, следует выбрать В2, а в случае A3 В должен выбрать третью стратегию, так как с ней он потеряет меньше всего. При этом В не имеет ни малейшего понятия о том, как поступит А, и тем не менее он должен сделать свой выбор. Именно в этот момент строится следующее предположение: «А — рациональный игрок, и лучший вариант для него — A3; в этом случае ВЗ будет для меня выгоднее всего, и значит, я последую этой стратегии». Игрок В знает, что в противном случае он проиграет, и пытается свести этот риск к минимуму.
Исследуя эту схему, фон Нейман сделал следующее замечание: на каждой строке всегда есть число меньше остальных двух. Он назвал его минимальным значением. Например, в предыдущей таблице в первой строке стоят числа -5, 0, -2. Самое маленькое из них -5. Таким же образом, минимальное значение для второй строки -3, для третьей —1. Фон Нейман взял самое большое из этих трех чисел, —1 (из всех трех вариантов оно является минимальным проигрышем), и назвал его максимином.
Затем он проделал то же самое для столбцов, но наоборот. Найдем самое большое, то есть максимальное, число в каждом столбце. В первом это будет 3, во втором 8, в третьем -1. Теперь определим самое маленькое из них, минимакс, которым в этом случае будет -1. Таким образом, в этой игре максимин и минимакс совпали в -1. И не случайно, ведь именно это и утверждается в теореме фон Неймана: «В большинстве игр с двумя участниками и нулевой суммой максимин всех строк всегда совпадает с минимаксом столбцов», и оно будет значением игры при оптимальной стратегии для обоих игроков.
Этот результат, известный как первая теорема о минимаксе, был опубликован в статье 1928 года Ж теории стратегических игр». В ней фон Нейман заложил общие основы будущей теории игр. Важно подчеркнуть еще раз: для того чтобы удовлетворить условиям теоремы фон Неймана, оба игрока должны быть рациональными, заботиться исключительно о собственных интересах и очень тщательно анализировать свои возможные стратегии. Эти критерии выполняются не во всех играх. Например, если один из игроков — природа, то в силу вступают произвольные факторы, и этот противник, разумеется, не осуществляет никакого анализа.
Теория игр имела и продолжает иметь тесную связь с так называемыми военными играми. Одним из первых случаев, когда она была применена на войне, стало сражение в море Бисмарка, состоявшееся 23 декабря 1942 года, в котором столкнулись стратегии американского генерала Джорджа Кенни и контр-адмирала Масатоми Кимуры. В конце боя были потоплены все транспортные суда и половина японских кораблей. Благодаря критерию минимакса командование США выбрало оптимальную стратегию и установило новую доктрину для разведывательных полетов. Японский флот должен был выйти из порта Рабаул на северо-востоке острова Новая Британия и направиться в порт Лае для подкрепления. У контр-адмирала Масатоми Кимуры было два варианта: выбрать северный маршрут, пролегавший по морю Бисмарка, где обычно были очень плохие климатические условия, или южный, с более благоприятными. Генерал Кенни должен был сконцентрировать все самолеты-разведчики на одном из этих двух маршрутов, учитывая при этом количество дней, которое ему потребовалось на бомбардировку, как только были бы замечены японские корабли. Применив к платежной матрице критерий минимакса, авторы стратегии выяснили, что при выборе северного маршрута предполагаемое количество дней для бомбардировки в любом случае равнялось бы 2, поэтому был сделан выбор в пользу следующей стратегии.

Самолеты союзнической армии атакуют японский корабль во время сражения в море Бисмарка.
Кимура | |||
Северный маршрут | Южный маршрут | ||
Кенни | Северный маршрут | 2 | 2 |
Южный маршрут | 1 | 3 |
Любой, кто рассматривает арифметические методы для получения произвольных цифр, разумеется, грешник.
Джон фон Нейман
Логично было бы ожидать от ученого, решившего исследовать теоретические загадки игр, выбора в качестве модели шашек или шахмат. Фон Нейман был очень хорошо знаком с этими играми еще с детства. И тем не менее в статье 1928 года, в которой он доказал теорему о минимаксе, приводится тщательный анализ игры в... покер. Широко известно, что фон Нейман очень любил эту игру, хотя не всегда добивался в ней больших успехов. По его мнению, самым интересным аспектом покера был блеф, который делал выбор стратегии еще более сложным. В покере гораздо труднее математически установить оптимальную стратегию по сравнению с играми с двумя участниками и нулевой суммой. Несмотря на это фон Нейман придумал упрощенный вариант покера, который позволил ему включить эту игру в свои исследования.
СЕДЛОВЫЕ ТОЧКИ
Представим, что игроки А и В участвуют в игре со следующей платежной матрицей.
В1 | В2 | вз | |
А1 | -3 | -1 | 4 |
А2 | 3 | 0 | 1 |
A3 | 3 | -1 | -4 |
Когда игрок А выбирает стратегию 1, максимальный проигрыш имеет место, если стратегию 1 выберет и игрок В. Для А это означает потерю -3, что выделено жирным шрифтом в таблице ниже.
В1 | В2 | В3 | ||
А1 | -3 | -1 | 4 | -3 |
А2 | 3 | 0 | 1 | 0 |
A3 | 3 | -1 | -4 | -4 |
3 | 0 | 4 |
Следуя этой схеме, постепенно записываются максимальные потери при каждой стратегии. Теперь возьмем игрока А. Для него наименьшим из всех значений будет 0, что соответствует стратегии 2. Это значение фон Нейман назвал значением игры. Если оно равно 0, как в этом примере, игру называют справедливой. Для игрока В также минимальное значение в этом случае равно 0, что соответствует стратегии 2.
Заметим, что обе стратегии минимакса совпадают в одной ячейке таблицы (А2-В2). Ее значение является минимальным на строке и максимальным в столбце. Эту точку называют седловой. Ее может и не быть, но если она есть, то влияет на стратегию обоих игроков. В предыдущей таблице мы видим, что никому из игроков невыгодно менять стратегию. Это ситуация равновесия, при которой игра достигает оптимального результата, так как стратегия минимакс одного игрока совпадает с минимаксом другого. Если в игре есть седловая точка, можно утверждать, что в ней есть стабильная стратегия. Это конец игры.
Изобразить седловую точку легко, если мы представим себе седло с двумя перпендикулярными плоскостями. Обозначим плоскость, которая соединяет седло со стременами, через Л, а вторую, идущую от головы до хвоста, — В. Игрок, следующий в направлении Л, должен подняться, чтобы достичь максимума в седловой точке, а игрок В должен спуститься, чтобы достичь в той же точке минимума.
Читать дальшеИнтервал:
Закладка: