Это первая статья из цикла про алгоритмы поиска GTO-решений в многостоловых турнирах. Она написана по материалам новой книги «Лекции о покере: Турнирная стратегия для короткого стека», написанной Стивом Селбреде — бывшим программистом из Кремниевой долины, а ныне профессиональным игроком и автором семи книг по стратегии покера.
Теория игр
Теория игр — это очень точная область математики, но в реальной покерной игре её обычно трудно применять.
Покерные комментаторы часто говорят, что тот или иной игрок сыграл «по GTO», то есть оптимально с точки зрения теории игр. Например: «Фил Айви здесь рейзил по GTO». Но такие решения редко имеют что-то общее с теорией игр. Их было бы правильнее назвать «статистически оптимальными» или «математически корректными», поскольку под этим комментаторы подразумевают действие, которое принесёт наивысшую ожидаемую прибыль (EV).
На самом деле, термин «GTO» понимается неправильно. GTO — это не обязательно самое выгодное решение; это такое решение, которое противники не смогут эксплуатировать. Следовательно, нам может быть невыгодно совершать GTO-действие, даже если мы знаем, как оно должно выглядеть. Наша игра будет неэксплуатируемой, но мы можем упустить более выгодную возможность, которая у нас будет, если мы отклонимся от GTO, чтобы воспользоваться ошибками соперников. Нашей настоящей целью должна быть максимизация нашей прибыли, что обычно означает эксплойт-игру. Тем не менее, важно знать правильное решение по GTO, особенно в коротких стеках.
Простая модель на основе игры «камень, ножницы, бумага»
Теория игр — это математическая теория, изучающая игры, но она описывает не все типы игр. Теория игр относится только к стратегическим играм между двумя и более игроками, каждый из которых может подстраиваться под стратегию другого. По сути, это теория оптимальной подстройки.
Рассмотрим «камень, ножницы, бумагу» — простую игру с двумя игроками. Каждый из них одновременно выкидывает одну из трёх возможных фигур. Камень ломает ножницы, ножницы режут бумагу, а бумага обёртывает камень.
«Камень, ножницы, бумага» — отличная иллюстрация некоторых принципов теории игр. Допустим, Энди и Боб поставили по $1 на исход большого числа игр. Предположим, в стартовом отрезке этой сессии Энди всегда показывал камень, потому что он геолог, а Боб — бумагу, потому что он журналист. Поначалу Энди проигрывал каждый раз, но затем сменил камень на ножницы, и теперь уже он постоянно выигрывал. В конце концов, Боб понял, что ему нужно рандомно показывать каждую из фигур со средней частотой 1/3.
Стратегия Боба — это GTO. Неважно, что будет делать Энди, на длинной дистанции игра Боба будет безубыточной. Когда Боб использует GTO-стратегию, ни одна стратегия Энди не может уменьшить его винрейт. Но если Боб поймёт, что Энди предпочитает выкидывать камень чаще среднего, он может отклониться от своей GTO-стратегии и чаще выбирать бумагу. Это будет стратегия эксплойта.
Теория игр в покере
«Камень, ножницы, бумага» — полезная модель для понимания базовой идеи теории игр, но она не помогает нам принимать решения в покерной игре. Вообще говоря, некоторые концепции теории игр, которые мы узнали из игры «камень, ножницы, бумага», совершенно не применимы к покерным ситуациям. Например, когда Боб играет по GTO, он гарантированно играет в ноль, независимо от того, насколько плохо играет Энди. Но в покере идеальный GTO-игрок будет играть в плюс, а не в ноль, если его соперники совершают ошибки.
В покере есть и другие отличия: баббл, пейджампы, ICM и полезность фишек (chip utility) могут влиять на то, какое решение наиболее выгодное. Тем не менее, знание того, какое решение в той или иной ситуации соответствует GTO, чрезвычайно ценно.
GTO-солверы и чарты пуш-фолда
Но как узнать, что представляет собой GTO-решение? Вот как это работает на практике.
Давайте зададимся амбициозной целью разработать GTO-стратегию опен-пуша на полном столе в живых турнирах с эффективными стеками меньше 30 ББ. Это грандиозная цель, поскольку для этого нужно изучить сотни ситуаций, и это главная причина того, что лишь немногие МТТшники могут применять GTO в процессе реальной игры.
Наш первый шаг — определить диапазоны пуша по GTO для широкого спектра ситуаций. Для этого можно использовать множество инструментов, например:
- Заранее просчитанные таблицы (пуш-фолд чарты) или простые приложения вроде Push/Fold App или SnapShove. Последнее из них особенно полезно при изучении того, как разные переменные могут влиять на наши GTO-диапазоны. Однако ни один из этих инструментов не является настоящим GTO-солвером. Они просто дают вам предварительно вычисленные ответы.
- SimpleNash — это настоящий GTO-солвер, к тому же совершенно бесплатный. В отличие от простеньких приложений, он даёт более подробные результаты по более широкому набору начальных условий. Главный недостаток этого софта — отсутствие какой-либо инструкции.
- ICMIZER 3 — это ещё более продвинутое ПО, чем SimpleNash. У этой программы более широкий функционал, подробная документация и намного лучший интерфейс. Недостаток в том, что этот софт требует месячную подписку. ICMIZER 3 — это мощный и удобный солвер, который я использую для GTO-вычислений.
Первая ключевая переменная — это структура анте. Наличие анте определяет то, как много фишек мы выиграем, когда наш опен-пуш окажется успешным. Разные структуры анте дадут разные GTO-чарты. При стандартной структуре анте стартовый размер банка зависит от уровня турнира и длины стола. Для расчета нашей базовой GTO-стратегии я выбрал структуру, когда анте за весь стол ставит большой блайнд, потому что в этом случае в банке на начало раздачи всегда лежат те же 2,5 ББ. Потом мы сможем адаптировать свою стратегию под реальную величину банка в каждой конкретной ситуации.
Вторая ключевая переменная — наша позиция за столом. Очевидно, наш GTO-диапазон опен-пуша будет шире на баттоне, чем на UTG.
Третья ключевая переменная — наш эффективный стек. В игре хедс-ап это попросту наименьший стек из двух. Но когда за столом несколько активных игроков, всё сложнее. Чтобы упростить задачу, здесь я предположу, что наш стек равен эффективному.
На скриншоте показан диапазон опен-пуша, когда мы на баттоне с эффективным стеком 16 ББ и структурой «большой блайнд ставит анте за весь стол». Этот диапазон включает в себя 35,9% всех стартовых рук, как написано в самой нижней строчке. Заметьте, что эта таблица показывает EV опен-пуша каждой комбинации. Чтобы увидеть точный Нэш-диапазон 35,9%, нужно щелкнуть на кнопку «Edit».
Расчёт программы ICMIZER 3 для опен-пуша с эффективным стеком 16 ББ. Диапазон пуша баттона — 35,9%. Тёмным цветом показаны комбинации, с которыми мы пушим как минимум в 50% случаев
Суммарная GTO-таблица опен-пуша
С помощью ICMIZER 3 я вычислил GTO-диапазоны пуша для каждой позиции за столом 9-макс со стеком от 3 до 30 ББ и занёс эти данные в таблицу. Под стеком здесь имеется в виду эффективный стек после простановки блайндов и анте.
Стек | BB | SB | BTN | CO | HJ | -3 | -4 | -5 | -6 |
---|---|---|---|---|---|---|---|---|---|
30 | 23,9% | 42,8% | 25,3% | 16,6% | 12,5% | 9,6% | 7,4% | 6,7% | 4,7% |
26 | 26,6% | 46,0% | 28,7% | 18,9% | 14,0% | 10,8% | 8,8% | 7,5% | 6,6% |
24 | 28,6% | 48,1% | 30,0% | 20,1% | 15,0% | 12,0% | 9,6% | 7,6% | 7,0% |
22 | 30,9% | 50,2% | 31,3% | 21,8% | 16,3% | 12,9% | 10,2% | 8,7% | 7,6% |
20 | 33,1% | 53,4% | 33,4% | 23,8% | 17,8% | 14,2% | 11,7% | 9,7% | 8,2% |
18 | 34,5% | 56,4% | 34,4% | 25,5% | 19,5% | 15,4% | 12,7% | 10,3% | 9,4% |
16 | 34,6% | 60,5% | 35,9% | 28,2% | 21,2% | 16,8% | 14,0% | 11,8% | 10,1% |
14 | 36,3% | 63,7% | 36,9% | 30,3% | 23,1% | 18,7% | 15,4% | 13,6% | 11,5% |
12 | 39,2% | 66,5% | 40,2% | 32,9% | 26,1% | 20,8% | 17,5% | 15,0% | 13,3% |
10 | 42,0% | 73,1% | 43,1% | 34,2% | 29,6% | 23,6% | 20,3% | 17,2% | 15,0% |
8 | 43,9% | 74,3% | 47,4% | 37,2% | 32,1% | 27,5% | 23,2% | 19,7% | 17,2% |
6 | 49,7% | 79,9% | 51,6% | 41,5% | 35,7% | 32,3% | 27,9% | 23,7% | 21,0% |
5 | 49,0% | 82,4% | 53,6% | 43,6% | 38,3% | 33,0% | 30,5% | 26,9% | 23,4% |
4 | 49,8% | 83,1% | 54,8% | 47,7% | 42,4% | 39,1% | 34,2% | 30,9% | 27,9% |
3 | 49,6% | 89,4% | 59,0% | 54,5% | 50,9% | 50,3% | 49,6% | 49,9% | 49,9% |
GTO-диапазоны опен-пуша при структуре «большой блайнд платит анте за весь стол»
Существует ли практический способ использовать эту информацию за покерным столом? Предположим, мы на баттоне с эффективным стеком 16 ББ. Мы заглянули в нашу таблицу перед тем, как нам сдали карты, и увидели, что наш диапазон опен-пуша равен 35,9%. После этого нам сдают разномастные . Входит ли эта рука в наш диапазон опен-пуша? Да, но эту информацию трудно запомнить. Чтобы использовать её за живым столом, нам понадобится ещё одна инновация.
Вывод
Большинство из нас просто не утруждает себя игрой по GTO на полном столе, потому что для обучения этому навыку нужно потратить массу времени, к тому же для запоминания результатов нужна очень хорошая память. Мы считаем, что лучше потратить время на более практические навыки, такие как чтение рук. Затем мы убеждаем себя, что GTO в любом случае не так важно, потому что никто не играет по этой стратегии. Но это не так. Знание наших GTO-диапазонов, смелость по ним играть и понимание того, когда именно нужно их использовать — важнейшие навыки для игры коротким стеком.
В следующей статье я покажу, как конвертировать эти процентные диапазоны в почти идеальную GTO-стратегию опен-пуша, которую легко использовать за живым столом.