За последние несколько лет концепция теоретически оптимальной игры (ГТО) произвела настоящую революцию среди игроков в покер. Но чтобы успешно применять какую-либо концепцию на практике, прежде всего нужно изучить теоретическую составляющую.
Мы подготовили для Вас текстовую версию видео об основах ГТО, записанного известным регуляром NL500 Fried «mynameiskarl» Meulders. Кстати, чуть раньше мы анализ хай-стейкс раздач от этого автора.
Основы ГТО на простом примере
Перед изучением основ ГТО не помешает дать определение ключевых терминов:
Стратегия - это совокупность всех возможных вариантов, которые были у игрока в раздаче. Сюда входят абсолютно все возможные ставки, рейзы и фолды.
При равновесии НЭШа наш соперник играет по ГТО. Получается, мы в точности знаем его стратегию (с какими диапазонами он ставит, рейзит и коллит), но мы всё равно не можем его эксплойтить, потому что он играет по ГТО.
Это определение подразумевает, что ГТО - это как бы оборонительная стратегия. Мы пытаемся защитить нашу «справедливую» долю в банке. Мы пытаемся максимизировать минимальное количество денег, которое выиграем в раздаче. Еще раз повторюсь: ГТО гарантирует, что мы получим нашу «справедливую» часть банка, которая определяется равновесием.
Как посчитать равновесие НЭШа для разных диапазонов
Рассмотрим классический пример - ситуацию на ривере. Предположим, у нас поляризованный диапазон, состоящий из натсов и воздуха. Натсы имеют 100% эквити, а воздух имеет 0% эквити.
А вот диапазон соперника состоит исключительно из блеф-кэтчеров. Они всегда бьют наш воздух, но проигрывают нашим натсам.
Для наглядности можно использовать реальные комбинации рук в нашем гипотетическом примере. Я называю его «гипотетическим», потому что в реальной игре мы никогда не окажемся конкретно в таком споте на ривере.
Мы находимся в позиции с поляризованным диапазоном из натсов и воздуха. У нас 4 комбинации и 4 комбинации одномастных.
Диапазон соперника состоит только из блеф-кэтчеров. Например, можно положить ему диапазон из 4 комбинаций .
В данном случае между двумя диапазонами нет никаких пересечений. Блеф-кэтчеры соперника не блокируют никакие из наших вэлью рук или блефов. Перед нами чистый теоретический пример.
В данном примере нас интересуют 2 решения. Очевидно, что со всеми мы пушим. Здесь нет никаких вопросов. Нам нужно принять решение о том, как часто мы будем блефовать с одномастные. А сопернику нужно решить, как часто он будет коллить или фолдить с его блеф-кэтчерами.
При равновесии мы будем ставить с блефами таким образом, что соперник будет безразличным между коллом и фолдом с его блеф-кэтчерами. Это означает, что для соперника EV колла будет таким же, как EV фолда, которое равно 0. В такой ситуации соперник никак не сможет увеличить свое EV с помощью изменения частоты колла.
Вторая составляющая равновесия заключается в том, что соперник будет коллить с такой частотой, что мы будем безразличными между тем, чтобы блефануть или сдаться с нашим воздухом одномастные. Соперник коллит таким образом, что для нас EV блефа становится равным EV чека вдогонку с одномастные, которое также равно нулю.
Оба игрока стараются сделать друг друга безразличными.
Следующий шаг - мы всё еще пушим $100. Сопернику надо вколлить $100, чтобы выиграть банк $200. У него шансы банка 2 к 1. Это означает, что для безубыточного колла ему надо выигрывать 1 раз из 3. Мы захотим блефовать таким образом, чтобы блеф-кэтчеры соперника срабатывали 1 раз из 3. Мы будем вэльюбетить в 2/3 случаев и блефовать в 1/3 случаев. Это сделает блеф-кэтчеры соперника безубыточными.
Вот такой процесс можно наблюдать, когда оба игрока пытаются сделать друг друга безразличными между возможными действиями. Рассмотрим этот процесс применительно к нашему примеру.
Всего у нас 4 комбинации и 4 комбинации одномастные. Мы поставим с 4 комбинациями и с 2 комбинациями одномастные. Таким образом, наш диапазон на 2/3 состоит из вэлью рук и на 1/3 из блефов.
Соперник будет блеф-кэтчить с половиной своих рук, то есть с 2 из 4 комбинациями .
Подсчет равновесного EV
Можно посчитать равновесные EV для этой ситуации - какую часть от банка $100 получит каждый игрок.
Начнем с нашего EV.
Когда мы ставим с - в половине случаев выиграем $200, а в половине случаев выиграем $100. Как мы помним, соперник коллит в половине случаев.
Когда мы ставим с одномастные - в половине случаев проиграем $100, а в половине случаев выиграем $100. В среднем, EV ставит с одномастные будет равно 0.
Решив простое уравнение, мы выяснили, что в среднем наше EV = +$75. Не забываем, что в нашем диапазоне 8 комбинаций, поэтому среднее ожидание +$75.
Когда мы ставим с идеально поляризованным диапазоном против диапазона блеф-кэтчеров, то в среднем мы выигрываем весь банк всякий раз, когда ставим. Но чтобы оставаться сбалансированными, мы не можем ставить со всеми руками диапазона. Нам нужно сдаваться с 2 блефами из 4.
Когда мы ставим - в среднем выигрываем весь банк. Когда мы чекаем вдогонку - не выигрываем ничего.
Что касается нашего соперника - в 6 из 8 случаев он сталкивается с идеально поляризованной ставкой, против которой он безразличен между коллом и фолдом. Его EV = 0. В среднем, мы выиграем весь банк, а соперник не выигрывает ничего. Однако в 2 из 8 случаев мы чекаем и сдаемся с блефами, а соперник выигрывает весь банк. Таким образом, среднее EV соперника будет +$25.
Если мы зафиксируем нашу ГТО стратегию и поиграемся с частотами соперника, то наше EV (как ГТО игрока) останется неизменным. Если соперник выкидывает слишком часто, то наши блефы начнут выигрывать деньги, и это компенсирует потерю EV вэльюрук. И наоборот, если соперник начнет слишком часто блеф-кэтчить, то наши блефы будут проигрывать деньги, а EV вэльюрук увеличится. Но наше суммарное EV останется неизменным.
Важно понимать, что при отклонении от ГТО мы можем увеличить свое EV. Предположим, что соперник блеф-кэтчит не половину своих , а 3 из 4 комбинаций. Ранее мы увидели, что при равновесии наши блефы безубыточны. Но если соперник начинает коллить почаще, то наши блефы уже не будут безубыточными. Теперь они будут проигрывать деньги.
Теперь наши вэльюбеты с будут в среднем выигрывать больше денег. Среднее EV всех наших рук увеличится с +$75 до +$87.5.
Если соперник допускает ошибки, и в качестве эксплойта мы отклонились от ГТО стратегии, то соперник может в дальнейшем скорректировать свою стратегию. Если соперник коллит слишком часто, то мы никогда не станем блефовать. Если соперник увидит, что мы никогда не блефуем, то он не будет коллить. Если он никогда не коллит, то мы будем всегда блефовать и т.д. В итоге мы попали в бесконечный цикл.
В реальной жизни люди будут совершать ошибки, и это позволит нам получить больше EV, чем по ГТО. Но для этого нам надо эксплойтить ошибки соперников. Однако надо понимать, что если мы начинаем эксплойтить соперника, то становимся подверженными к контр-эксплойтам со стороны соперника.
Я считаю, что хороший игрок должен хотя бы на базовом уровне понимать, каким будет ГТО в некоторых сценариях. Это будет вашей точкой отсчета. Ну и, конечно, если вы увидите, что соперники совершают ошибки, то не бойтесь отклоняться от ГТО в целях эксплойта их ошибок.