С появлением солверов мы точно знаем, как нужно играть в каждом конкретном споте. Верно ли утверждение, что чем ближе ваша игра к GTO, тем больше будет ваш перевес над соперником? Иными словами, если взять двух игроков, у одного из которых стратегия намного ближе к GTO, то всегда ли он будет выигрывать на дистанции? Нет, и в этой статье я объясню, почему.
Вкратце, что собой представляет оптимальная стратегия
Рассмотрим пример, в котором один игрок по имени Джо поставил на ривере банк, а другой решает, выкидывать ему или уравнивать с блефкэтчером. Джо блефует в 20% случаев, тогда как оптимальная частота блефа, с точки зрения солвера, составляет 33,3%. Его первый оппонент — Мисс Оптимальная: она играет идеально и в каждом споте фолдит с частотой, оптимальной с точки зрения GTO. В данной ситуации она будет выкидывать в 50% случаев.
Постараюсь кратко объяснить, почему математика работает именно так:
Таким образом, если Мисс Оптимальная фолдит чаще, чем в половине случаев, у Джо будет возможность зарабатывать на своём блефе. Если она будет выкидывать только в 45% случаев, для Джо будет правильно вообще не блефовать, поскольку он не получит от неё достаточного количества фолдов. Вот почему оптимальная стратегия работает именно так.
Что касается диапазона ставки Джо, в нём должно быть 33% блефа, потому что когда Мисс Оптимальная коллирует с блефкэтчером, она рискует ставкой размером с банк, чтобы выиграть банк и такую же ставку Джо, поэтому её шансы банка составляют 2 к 1. В 2/3 случаев она будет выигрывать две ставки размером с банк, а в 1/3 случаев — проигрывать одну такую ставку, что в сумме даёт ноль.
Невозможно эксплуатировать игрока, который коллирует с оптимальной частотой
Итак, в нашем примере, где Джо блефует слишком редко, Мисс Оптимальная по-прежнему коллирует с оптимальной частотой, которую нельзя эксплуатировать. Джо не получает никакого перевеса над ней, потому что она коллирует абсолютно оптимально. Предположим, Джо 100 раз поставит ривер против Мисс Оптимальной, каждый раз по $10 в банк $10. Что произойдёт?
Каким будет её чистый результат от этих коллов? В 20% из этих случаев (10 из 50) Джо будет блефовать, и в каждом из них Мисс Оптимальная выиграет $20, что в сумме даёт $200. В остальных 40 случаях у Джо будет какая-то рука, и Мисс Оптимальная проиграет $10, что в сумме даёт −$400. Таким образом, её общий результат за 100 попыток составит −$200.
Игрок, играющий оптимально, будет проигрывать деньги, но его нельзя будет эксплуатировать
В этом споте Мисс Оптимальная теряет деньги, но её не эксплуатируют. Причина, по которой её оптимальная стратегия приносит убыток, заключается в том, что когда Джо добирает на ривере, он получает от неё колл в половине случаев, и это происходит независимо от того, как часто он блефует. Его доборные ставки остаются доборными ставками, он не собирается их изменять. Если он добавит в свой диапазон необходимое количество блефов, он попросту будет ставить с бóльшим числом рук.
Поскольку Мисс Оптимальная будет выкидывать в половине случаев, для Джо все те дополнительные блефы, которые он должен добавить, будут безубыточными, но это не изменит его общего матожидания.
Парадокс: ОЧЕНЬ эксплуатируемый игрок проигрывает меньше всего
А теперь давайте откроем нового персонажа по имени Мистер Фолд. Как и следовало ожидать, он фолдит очень часто — всякий раз, когда видит перед собой ставку на ривере. Это чудовищно эксплуатируемая стратегия.
Если вы играете против того, кто никогда не коллирует ривер, вы должны разрывать этого игрока в клочья, блефуя каждую раздачу. Но против Мистера Фолда — Джо, который блефует всего в 20% случаев, когда ставит банк на ривере. Расчёты здесь будут немного проще. За 100 раз, когда Джо поставит ривер, Мистер Фолд 100 раз выбросит, и его чистый результат составит $0. Обратите внимание, что для Мистера Фолда этот спот оказался безубыточным, тогда как Мисс Оптимальная теряла в нём $200.
Таким образом, стратегия Джо ближе к оптимальной, чем у Мистера Фолда, но не настолько оптимальна, как у Мисс Оптимальной. И всё же в этом споте именно Мистер Фолд лучше эксплуатирует своего соперника — он демонстрирует наилучший результат, проигрывая наименьшее количество денег.
Очевидно, что если вы посадите Мистера Фолда против Миссис Блеф, у Мистера Фолда будут большие проблемы, потому что Миссис Блеф будет блефовать каждый ривер, а Мистер Фолд будет выкидывать одну руку за другой, отдавая намного больше банков. За любые отдельно взятые 100 раздач, где в него летит ставка на ривере, результат Мистера Фолда останется таким же, но разница в том, что Миссис Блеф будет ставить против него на абсолютно каждом ривере, и он всегда будет выбрасывать, не имея никаких шансов забрать банк.
На практике никто не способен играть оптимально
Разница между теорией и практикой состоит в том, что на практике никто не способен играть оптимально. Приведу более сложный пример, в котором мы с вами играем друг против друга:
- Моя стратегия на ривере заключается в том, чтобы фолдить в 80% случаев, тогда как по солверу я должен выкидывать только в 50% случаев. При этом, как и Джо, я буду блефовать недостаточно часто — всего в 20% случаев. Итак, я оверфолжу и недоблефовываю.
- А ваша стратегия заключается в том, что вы немного оверколлите, выкидывая 45% рук вместо 50%. При этом вы тоже блефуете с частотой 20% вместо 33%.
У нас с вами одинаковая стратегия блефа — ни у кого нет преимущества в этом аспекте. Однако, с точки зрения теории игр, вы играете намного лучше меня: вы фолдите 45% рук, что очень близко к оптимальным 50%, а я выкидываю 80%, что далеко не так близко.
Вы не будете эксплуатировать ни один его лик, но если он достаточно хорош, он найдёт ваши лики и будет их эксплуатировать. Например, если вы фолдите ривер с частотой 45% вместо 50%, он начнёт блефовать реже и будет зарабатывать на этом деньги.
Или, представьте, что вы недоблефовываете против меня, но частота вашего блефа не 20%, а 28% при всё тех же оптимальных 33%. В этом случае я по-прежнему буду выкидывать множество рук, если буду знать, что вы не способны на встречную подстройку.
Когда оба игрока действуют в соответствии с теорией игр, будет происходить следующее: если вы блефуете в 28% случаев, то я это понимаю и выкидываю в 80% случаев. Вы, в свою очередь, тоже это понимаете и начинаете блефовать со всеми своими руками, и так далее.
Вывод: против игрока, зацикленного на GTO, можно делать подстройки и отклонения
Но что если вы сконцентрированы на своей оптимальной стратегии и не следите за моими отклонениями, а пытаетесь тупо следовать советам солвера?
- Во-первых, поскольку вы человек, а не машина, вы не сможете в точности следовать GTO, всегда будут несоответствия между вашими действиями и стратегией солвера.
- Во-вторых, поскольку я вас изучаю и вижу ваши руки на вскрытии, упущенные блефы, неправильные коллы, я начну писать на вас ридсы, подстраиваться под вас и отклоняться от своей стратегии. И если вы не заметите моих подстроек, а по-прежнему будете пытаться играть как можно ближе к GTO, вы будете проигрывать.
Если вы используете статическую стратегию, которая наиболее близка к оптимальной, а я использую очень эксплуатируемую динамическую стратегию, включающую огромные оверфолды или оверколлы в зависимости от ваших действий, и при этом вы не перестраиваетесь, то я буду выигрывать, вот и всё.