Что если игра вашего противника далека от оптимальной? Блефовать с GTO-частотой против того, кто никогда не фолдит, будет явной ошибкой. Здесь на помощь приходит концепция «псевдобаланса» — это частичный, но не оптимальный баланс, который идеально подходит для практической игры.
Что такое псевдобаланс
Представьте, что мы играем против оппонента, который никогда не блефует ривер — когда он ставит, у него всегда сильная рука. Наша подстройка под него будет очень простой: не коллировать с любыми блафкэтчерами, а коллировать только с руками, доминирующими над определённой частью его вэлью-диапазона.
Но что если оппонент, который, как мы думали, никогда не блефует, внезапно открывает блеф на вскрытии? Это сильно усложняет дело. Он начал блефовать внезапно или он и раньше это делал, а мы просто не понимали? Если он блефовал и раньше, то с какой частотой? Каково его соотношение добора и блефа на ривере — 90/10, 80/20? А, может, он использует сбалансированное соотношение? Возможно, в прошлом мы просто не видели, как он блефует, а видели только вэлью-руки.
Чтобы понять, что оппонент никогда не блефует или, наоборот, блефует как сумасшедший, не обязательно требуется много времени, но если мы не уверены в том, как он играет, и его частота блефа лежит где-то между экстремальными значениями, то для определения точной частоты нам нужно сыграть против него довольно много рук.
Для описания стратегии оппонента мы можем использовать термин «псевдобаланс». Посмотрим на ситуацию его глазами: если мы не любим блефовать ривер и делаем это всего в 5% случаев, но в одной из раздач наш блеф вскрывают, мы становимся намного более трудным соперником. Хотя мы знаем, что блефуем только в 5% случаев, противник этого не узнает, пока не сыграет против нас достаточно много раздач.
Пример: 3-беты в блеф на префлопе
Как применять концепцию псевдобаланса к своей стратегии на повседневной основе? Представьте, что на префлопе ваш оппонент слишком часто выкидывает на 3-беты (в 70%+ случаев). Такого игрока мы можем 3-бетить из любой позиции. Возникает вопрос: можем ли мы 3-бетить 100% его опен-рейзов? Мы знаем, что это +EV, но проблема в том, что такой эксплойт станет слишком очевидным. Если мы переставим оппонента 4–5 раз подряд, он может догадаться, что происходит на самом деле.
В вакууме мы, конечно, должны 3-бетить его каждый раз, когда представляется такая возможность. Но нельзя не задумываться о том, можно ли так делать в реальности. Что, если на пятый-шестой раз он всё поймёт и ответит агрессией? Если учесть будущую игру, то 3-бет с любыми двумя картами может не обладать наивысшим EV.
Экстремальный пример может выглядеть так: если мы 3-бетим его чаще, чем в 75% случаев, он перестраивается и начинает играть как идеальный GTO-оппонент. Очевидно, для нас это не самый лучший сценарий.
Будущее EV
Так или иначе, в любой конкретной ситуации мы никогда не можем знать наилучшую игру, не задумываясь о будущем матожидании. Мы должны подумать о текущем состоянии игры и о том, как оно может измениться, если мы будем слишком откровенно эксплойтить оппонента.
Ответ на этот вопрос не всегда один и тот же, и в большинстве случаев оппонент не переключится на GTO-стратегию, если поймёт, что его эксплуатируют. В ряде случаев, поняв, что его эксплуатируют, он начнёт играть хуже — например, выйдет из себя и будет принимать крайне спорные решения. Таким образом, если мы спровоцируем соперника изменить свою игру, наше EV может стать даже выше.
Допустим, мы нашли постоянный эксплойт в стратегии оппонента — он слишком часто выкидывает на 3-беты. До тех пор пока мы не эксплуатируем его слишком очевидно, у нас есть стабильный источник дохода. У нас может возникнуть соблазн повысить частоту 3-бета и заработать ещё больше денег на короткой дистанции, но мы рискуем потерять этот источник.
Во многих случаях угроза исчезновения эксплойта не так велика, как может показаться, потому что оппонент зачастую будет нечувствителен и не очень способен адаптироваться. Здесь могут быть два разных сценария:
- Он просто не среагирует на наш эксплойт. Возможно, внутренний голос подскажет ему, что его эксплуатируют, но он будет продолжать выкидывать, не желая отклоняться от своих привычных префлоп-диапазонов.
- Он перестроится, но начнёт играть ещё хуже, принося нам ещё больше прибыли.
Но мы не обязательно должны исходить из того, что противник не будет адаптироваться или адаптируется неправильно. В некоторых случаях он сделает правильную подстройку, что уменьшит прибыльность нашего эксплойта.
Текущее состояние игры и стоит ли его менять
Это подводит нас к вопросу, будет ли прибыльно для нас менять текущее состояние игры. Хотим ли мы сохранить текущий эксплойт и довольствоваться относительно скромным, но стабильным профитом, или же мы хотим попытаться спровоцировать оппонента изменить свою стратегию, чтобы эксплуатировать его ещё сильнее, но это потенциально изменит состояние игры? Проблема в том, что мы не знаем точно, как именно это изменит состояние игры: против нас противник может начать играть как хуже, так и лучше.
Стоит ли игра свеч? Общий ответ — нет, особенно если мы уже сейчас собираем очень хороший урожай. В идеале, мы хотим эксплуатировать оппонента максимально сильно, не вызывая у него подозрений. Возьмём экстремальный пример: он фолдит на 3-беты в 100% случаев до тех пор, пока мы 3-бетим реже, чем в 80% случаев. Это настолько прибыльный эксплойт, что мы хотим его сохранить. Если мы начнём 3-бетить чаще 80% случаев, оппонент перестроится, но проблема в том, что мы не знаем, как это будет выглядеть.
Возможно, он действительно начнёт фолдить на любые 3-беты, но у нас будет период времени, когда противник уже адаптировался, а мы ещё не успели оценить, как именно он это сделал. Можно убеждать себя, что мы в состоянии предсказать, как именно он адаптируется, но мы запросто можем переоценивать себя в левелинге и знании психологии оппонента. Точно предсказать его реакцию очень сложно, поэтому нам придётся увидеть много сыгранных раздач и проанализировать новое состояние игры. Это требует большой дополнительной работы, и на протяжении долгого периода времени мы не будем знать прибыльность нашего эксплойта.
Выше мы говорили, что нужно воздерживаться от эксплойтов, которые кажутся +EV в вакууме, но являются −EV с поправкой на изменение состояния игры в будущем. Но также не нужно совершать действий, которые являются напрямую −EV. Например, если оппонент особо не блефует, не нужно пытаться вскрыть его только для того, чтобы показать, что мы готовы коллировать широко, чтобы он, в свою очередь, не блефовал против нас слишком часто в будущем. Он и так блефует редко, поэтому лучший способ эксплуатировать его — это часто выкидывать после его ставок.
Другой пример: блеф на ривере
Рассмотрим применение этой концепции в реальной жизни на примере частоты фолда ривера у оппонента. Бывают споты, в которых поле оверфолдит на ривере, и блефовать становится выгодно с любыми двумя картами (мы говорим не только про низкие и средние лимиты, но и про хайстейкс). Поэтому на ривере у нас есть выбор:
- Блефовать со всеми мусорными руками
- Чуть уважительнее относиться к соперникам, играя агрессивно, но не попадая под их радары.
Для многих спотов на ривере мы можем составить такой диапазон ставки, при котором будем блефовать в 70% случаев, тогда как оптимальная частота по GTO составляет 25–30% в зависимости от сайзинга. Однако такую стратегию очень легко могут эксплойтить продвинутые игроки.
Это соотношение очень уязвимо к встречному эксплойту, но это псевдобаланс: мы не эксплойтим по максимуму и не блефуем с каждой мусорной рукой, а просто делаем это очень агрессивно.
Ещё есть грань между просто эксплуатируемой и явно эксплуатируемой стратегией. Когда на ривере наше соотношение блефа/добора составляет 1 к 1, это эксплуатируемая стратегия, но это нормально, потому что мы играем так по эксплойтным причинам. Но когда на ривере мы блефуем в 70% случаев, мы становимся явно эксплуатируемыми — не нужно быть семи пядей во лбу, чтобы встречно эксплуатировать такую стратегию.
Это похоже на игрока, который никогда не блефует на ривере, поэтому его слишком легко эксплуатировать. Для сравнения, оппонент, который блефует в 10% случаев, тоже очень уязвим к эксплойту, но нам приходится тщательно задумываться о его точной частоте блефа — мы не поймём, что она составляет 10%, пока не сыграем против него достаточно много раздач.
Противоречит ли псевдобаланс основам покера?
На первый взгляд может показаться, что рекомендации выше нарушают одну из фундаментальных теорем покера, гласящую, что мы всегда должны выбирать решение с наивысшим EV. Но это не так — мы по-прежнему говорим о наивысшем EV. Разница в том, что мы расширили понимание EV, включив туда фактор будущего времени в дополнение к частоте фолда и сайзингам.
Представьте, что оппонент, против которого мы много блефовали на ривере, при повышении частоты нашего блефа сделает подстройку, которая для нас будет −EV. Последняя раздача перед тем, как мы перейдём эту черту, всё ещё будет для нас +EV, но уже у следующего блефа матожидание будет намного ниже.
Как видите, мы по-прежнему говорим о +EV решениях. Идея «будущего EV» в том, что оно учитывает возможное изменение состояния игры. Мы оцениваем, насколько откровенно мы можем применять тот или иной эксплойт, сохраняя при этом возможность и дальше его применять.
Проблема с оценкой будущего состояния игры в том, что это всего лишь оценка. Мы не можем утверждать с высокой долей уверенности, как именно перестроится оппонент, если почувствует, что его эксплуатируют, и в какой именно момент он это сделает. Перестроится ли он, если мы будем 3-бетить его опен-рейзы в 50% случаев? А в 70% случаев? А что, если мы можем 3-бетить в 80% случаев, и он всё равно этого не поймёт? Где та грань, при переходе которой противник понимает, что его эксплойтят, и наш эксплойт перестаёт работать? Мы не знаем, это просто оценка, но она может меняться в зависимости от типа оппонента. Вот почему очень удобно ограничивать расчёт EV вычислениями в вакууме отдельной раздачи, потому что в этом случае параметры будут очень чёткими: сайзинг, частота фолда оппонента, взятая из HUD'а и т.д.
Проблема с расчётом будущего EV с учётом изменения состояния игры заключается в том, что это требует множества приблизительных оценок, заморачиваться с которыми некомфортно. Однако работа хорошего покериста и так включает в себя постоянную оценку и переоценку, как, например, в случае с расчётом потенциальных шансов, которые полностью основаны на предположениях. Так что оценки — это важный элемент при расчёте EV.
Степень эксплойта — это стилистические предпочтения
На протяжении большей части своей карьеры я стремился максимизировать EV здесь и сейчас. Если оппонент выкидывал на 3-бет в 90% случаев, то я 3-бетил его каждый раз, потому что это даёт максимальное EV в вакууме. Однако в какой-то момент это провоцирует оппонента перестроиться. Не нужно недооценивать число игроков, которые никогда не адаптируются: таких нужно находить и эксплуатировать по полной программе, покуда это сходит нам с рук.
Но суть в том, что EV, как правило, не существует в вакууме, и если мы будем 3-бетить соперника в 100% случаев, в какой-то момент он может ответить. Его ответ будет трудно предсказать, потому что залезть в голову другому игроку невозможно.
Даже если каждая отдельная раздача в вакууме была разыграна нами с максимальным EV, это не значит, что мы максимизировали EV всей своей стратегии. Это не значит, что так играть неправильно, — это просто вопрос стилистических предпочтений. Но постепенно я понял, что реакцию оппонента трудно предсказать, даже если некоторые покеристы заявляют, что способны на это.
Вот почему может быть хорошей идеей взять на вооружение концепцию псевдобаланса. Суть в том, что мы уже находимся в той среде, в которой нам известен наилучший эксплойт, и если мы можем его поддерживать, это очень облегчает жизнь. Мы просто раз за разом используем одну и ту же стратегию и эксплойтим оппонента очень агрессивно, но не переходя ту грань, за которой он начинает понимать происходящее. Это как иметь курицу, несущую золотые яйца.
Может казаться, что концепция псевдобаланса противоположна правильной покерной теории, но если задуматься об этом глубже, становится понятно, что это не так. Псевдобаланс очень похож на то, как играет солвер при включении функции NodeLock, когда соперникам можно задать реальные диапазоны вместо оптимальных. Солвер играет эксплойт, но только в определённой степени: он играет настолько эксплойтно, насколько это возможно, не позволяя противнику создать встречный эксплойт на более поздних улицах. Именно это и есть псевдобаланс: играть настолько агрессивно, насколько возможно, предотвращая встречные эксплойты не в GTO-смысле, а скорее на индивидуальном уровне оппонента, который не всегда понимает, что может нас эксплуатировать. Это по-прежнему максимальный эксплойт, просто он учитывает будущие раздачи, поэтому приносит максимальный профит на дистанции.