Авинаш Диксит - Стратегические игры

Тут можно читать онлайн Авинаш Диксит - Стратегические игры - бесплатно полную версию книги (целиком) без сокращений. Жанр: Математика, издательство Манн, Иванов и Фербер, год 2017. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Стратегические игры
  • Автор:
  • Жанр:
  • Издательство:
    Манн, Иванов и Фербер
  • Год:
    2017
  • Город:
    Москва
  • ISBN:
    9785001008132
  • Рейтинг:
    3/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

Авинаш Диксит - Стратегические игры краткое содержание

Стратегические игры - описание и краткое содержание, автор Авинаш Диксит, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Доступный учебник по теории игр, который завоевал заслуженную популярность благодаря наглядным примерам и упражнениям, а также доступному изложению, не требующему от читателей серьезной математической подготовки.
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.

Стратегические игры - читать онлайн бесплатно полную версию (весь текст целиком)

Стратегические игры - читать книгу онлайн бесплатно, автор Авинаш Диксит
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

0,75 × 50 + 0,25 × 10 = 37,5 + 2,5 = 40, если она прикроет ПЛ,

0,75 × 20 + 0,25 × 80 = 15 + 20 = 35, если она прикроет ПД.

Если Эверт выберет комбинацию стратегий 75 на 25, ожидаемые выигрыши показывают, что Навратилова может использовать эту комбинацию с максимальной выгодой для себя, прикрыв удар ПЛ.

Когда Навратилова выбирает ПЛ, чтобы наилучшим образом использовать комбинацию Эверт 75 на 25, это наносит Эверт ущерб, поскольку перед нами игра с нулевой суммой. Ожидаемые выигрыши Эверт составляют:

0,75 × 50 + 0,25 × 90 = 37,5 + 22,5 = 60, если Навратилова прикроет ПЛ,

0,75 × 80 + 0,25 × 20 = 60 + 5 = 65, если Навратилова прикроет ПД.

Выбрав ПЛ, Навратилова удержит выигрыш Эверт на уровне 60, а не 65. Но заметьте, что выигрыш Эверт при такой комбинации стратегий все равно лучше выигрыша 50 в случае использования чистой стратегии ПЛ или 20 при выборе чистой стратегии ПД [91].

Комбинация стратегий в соотношении 75 на 25 позволяет Эверт повысить выигрыш по сравнению с выигрышем в чистых стратегиях, однако все же оставляет стратегию Эверт в какой-то степени открытой для того, чтобы Навратилова использовала ее с выгодой для себя. Решив прикрывать удар ПЛ, она может добиться того, что Эверт получит более низкий выигрыш, чем при выборе стратегии ПД. Эверт хотела бы найти комбинацию стратегий, защищенную от использования, то есть такую, при которой у Навратиловой не было бы очевидного варианта чистой стратегии, которую можно было бы применить против данной стратегии Эверт. Комбинация стратегий Эверт, защищенная от использования, должна обладать свойством, обеспечивающим Навратиловой один и тот же ожидаемый выигрыш, какой бы удар она ни прикрывала, ПЛ или ПД: Навратиловой должно быть безразлично, какую из двух имеющихся чистых стратегий выбрать. Мы называем это свойством безразличия соперника, и, как мы увидим ниже в данной главе, это ключ к равновесиям в смешанных стратегиях в ненулевых играх.

Для поиска комбинации стратегий, защищенной от использования соперником, необходимо применить более общий подход к описанию смешанной стратегии Эверт, чтобы алгебраическим путем рассчитать вероятности чистых стратегий, входящих в соответствующую смешанную стратегию. Обозначим вероятность выбора Эверт ПЛ алгебраическим символом p , тогда вероятность выбора ПД будет 1 — p . Для краткости назовем такую совокупность p -комбинацией.

Если Эверт выберет р -комбинацию, ожидаемые выигрыши Навратиловой составят:

50 p + 10(1 — p ), если она прикроет ПЛ,

20 p + 80(1 — p ), если она прикроет ПД.

Для стратегии Эверт, чтобы ее р -комбинация была защищена от использования, два выигрыша Навратиловой должны быть равны, то есть 50 p + 10(1 — p ) = 20 p + 80(1 — p ), или 30 p = 70(1 — p ), или 100 p = 70, или p = 0,7. Таким образом, в комбинации стратегий Эверт, защищенной от использования, стратегия ПЛ применяется в 70 % случаев, а ПД — в 30 % случаев. При таких вероятностях, заданных смешанной стратегией, Навратилова получит один и тот же ожидаемый выигрыш за счет каждой из своих чистых стратегий, а значит, не сможет использовать ни одну из них с выгодой для себя (или в ущерб Эверт в игре с нулевой суммой). Ожидаемый выигрыш Эверт от смешанной стратегии составит:

50 × 0,7 + 90 × 0,3 = 35 + 27 = 62, если Навратилова прикроет ПЛ,

80 × 0,7 + 20 × 0,3 = 56 + 6 = 62, если Навратилова прикроет ПД.

Этот ожидаемый выигрыш лучше выигрыша 50, который Эверт получила бы при использовании чистой стратегии ПЛ, и выигрыша 60, полученного в случае комбинации 75 на 25. Теперь мы знаем, что эта смешанная стратегия защищена от использования, но является ли она оптимальной или равновесной стратегией Эверт?

Б. Наилучшие ответы и равновесие

Для того чтобы найти равновесную комбинацию стратегий в этой игре, вернемся к методу анализа наилучших ответов, описанному в главе 4, и расширим его на игры с непрерывными стратегиями наподобие тех, которые представлены в главе 5. Наша первоочередная задача — определить наилучший ответ Эверт (ее наилучший выбор вероятности p ) на каждую из возможных стратегий Навратиловой. Поскольку эти стратегии также могут быть смешанными, их можно описать посредством вероятности того, что она прикроет ПЛ. Обозначим эту вероятность как q ; тогда 1 — q — вероятность того, что Навратилова прикроет ПД. Назовем смешанную стратегию Навратиловой « q -комбинация» и попытаемся найти наилучший ответ Эверт p в случае выбора Навратиловой каждого возможного значения q .

Из таблицы выигрышей на рис. 7.1следует, что р -комбинация Эверт обеспечивает ей такой ожидаемый выигрыш:

50 p + 90(1 — p ), если Навратилова выберет ПЛ,

80 p + 20(1 — p ), если Навратилова выберет ПД.

Стало быть, в случае q -комбинации Навратиловой ожидаемый выигрыш Эверт составит:

[50 p + 90(1 — p )] q + [80 p + 20(1 — p )](1 — q ).

Перегруппировав члены выражения, получаем следующую формулу вычисления ожидаемого выигрыша Эверт:

[50 q + 80(1 — q )] p + [90 q + 20(1 — q )] (1 — p ) = [90 q + 20(1 — q )] + [50 q + 80(1 — q ) — 90 q — 20(1 — q )] p = [20 + 70 q ] + [60 — 100 q ] p .

Используем этот ожидаемый выигрыш для поиска значений наилучших ответов p Эверт.

Мы пытаемся определить значение p , максимизирующее выигрыш Эверт при каждом значении q , поэтому основной вопрос состоит в том, как формула расчета ожидаемого выигрыша зависит от p . Здесь важную роль играет коэффициент перед p : [60 –100 q ]. В частности, имеет значение положительный он (тогда ожидаемый выигрыш Эверт увеличивается по мере увеличения p ) или отрицательный (тогда ожидаемый выигрыш Эверт уменьшается по мере увеличения p ). Очевидно, что знак этого коэффициента зависит от значения q , причем q имеет критическое значение в случае, когда 60 — 100 q = 0; то есть q равно 0,6.

Когда при q < 0,6 Навратиловой коэффициент [60 — 100 q ] имеет положительное значение, ожидаемый выигрыш Эверт увеличивается по мере повышения значения p и ее наилучший выбор p = 1, или чистая стратегия ПЛ. Аналогичным образом при q > 0,6 Навратиловой наилучший выбор Эверт — p = 0, или чистая стратегия ПД. Если q = 0,6, Эверт получит один и тот же ожидаемый выигрыш независимо от значения p ; при этом любая комбинация стратегий ПЛ и ПД так же эффективна, как и любая другая: любое значение p в диапазоне от 0 до 1 может быть наилучшим ответом. Кратко сформулируем эти выводы, для того чтобы использовать их в будущем.

Если q < 0,6, наилучший ответ p = 1 (чистая стратегия ПЛ).

Если q = 0,6, любая p -комбинация будет наилучшим ответом.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Авинаш Диксит читать все книги автора по порядку

Авинаш Диксит - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Стратегические игры отзывы


Отзывы читателей о книге Стратегические игры, автор: Авинаш Диксит. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x