Что такое оптимальная ГТО игра и зачем она нужна

Стратегии покера
23 окт 2024
0
Что такое оптимальная ГТО игра и зачем она нужна

За последние несколько лет концепция теоретически оптимальной игры (ГТО) произвела настоящую революцию среди игроков в покер. Но чтобы успешно применять какую-либо концепцию на практике, прежде всего нужно изучить теоретическую составляющую.

Мы подготовили для Вас текстовую версию видео об основах ГТО, записанного известным регуляром NL500 Fried «mynameiskarl» Meulders. Кстати, чуть раньше мы анализ хай-стейкс раздач от этого автора.

Перед изучением основ ГТО не помешает дать определение ключевых терминов:

Стратегия - это совокупность всех возможных вариантов, которые были у игрока в раздаче. Сюда входят абсолютно все возможные ставки, рейзы и фолды.

Равновесие НЭША (Nash Equilibrium) в ХА-игре - это такое состояние игры, когда ни один игрок не может улучшить свое ожидание. Если стратегия одного игрока остается неизменной, то у второго игрока нет стимула менять свою стратегию, потому что это не увеличит его EV. Стратегии, при которых достигается равновесие НЭШа, называются ГТО стратегиями (Game Theory Optimal, GTO).

При равновесии НЭШа наш соперник играет по ГТО. Получается, мы в точности знаем его стратегию (с какими диапазонами он ставит, рейзит и коллит), но мы всё равно не можем его эксплойтить, потому что он играет по ГТО.

Это определение подразумевает, что ГТО - это как бы оборонительная стратегия. Мы пытаемся защитить нашу «справедливую» долю в банке. Мы пытаемся максимизировать минимальное количество денег, которое выиграем в раздаче. Еще раз повторюсь: ГТО гарантирует, что мы получим нашу «справедливую» часть банка, которая определяется равновесием.

ГТО не предназначено для максимизации EV. Явным образом оно не использует возможные ошибки соперника. Если вы играете по ГТО, и соперник совершает ошибки - он автоматически отдаст вам некоторое EV. Но если вы знакомы с ликами соперника, то с помощью эксплойта можете выиграть больше денег, чем по ГТО.

Рассмотрим классический пример - ситуацию на ривере. Предположим, у нас поляризованный диапазон, состоящий из натсов и воздуха. Натсы имеют 100% эквити, а воздух имеет 0% эквити.

А вот диапазон соперника состоит исключительно из блеф-кэтчеров. Они всегда бьют наш воздух, но проигрывают нашим натсам.

Для наглядности можно использовать реальные комбинации рук в нашем гипотетическом примере. Я называю его «гипотетическим», потому что в реальной игре мы никогда не окажемся конкретно в таком споте на ривере.

Предположим, на флопе вышли 3c3d3s. На терне - 5d. На ривере - 6c. Флешей на такой доске быть не может. На ривере в банке $100. У каждого игрока осталось по $100.
Мы находимся в позиции с поляризованным диапазоном из натсов и воздуха. У нас 4 комбинации aoao и 4 комбинации 7o2o одномастных.
Диапазон соперника состоит только из блеф-кэтчеров. Например, можно положить ему диапазон из 4 комбинаций toto.

В данном случае между двумя диапазонами нет никаких пересечений. Блеф-кэтчеры соперника не блокируют никакие из наших вэлью рук или блефов. Перед нами чистый теоретический пример.

В данном примере нас интересуют 2 решения. Очевидно, что со всеми aoao мы пушим. Здесь нет никаких вопросов. Нам нужно принять решение о том, как часто мы будем блефовать с 7o2o одномастные. А сопернику нужно решить, как часто он будет коллить или фолдить с его блеф-кэтчерами.

Равновесие будет достигнуто, когда оба игрока сделают друг друга безразличными при принятии вышеуказанных решений.

При равновесии мы будем ставить с блефами таким образом, что соперник будет безразличным между коллом и фолдом с его блеф-кэтчерами. Это означает, что для соперника EV колла будет таким же, как EV фолда, которое равно 0. В такой ситуации соперник никак не сможет увеличить свое EV с помощью изменения частоты колла.

Вторая составляющая равновесия заключается в том, что соперник будет коллить с такой частотой, что мы будем безразличными между тем, чтобы блефануть или сдаться с нашим воздухом 7o2o одномастные. Соперник коллит таким образом, что для нас EV блефа становится равным EV чека вдогонку с 7o2o одномастные, которое также равно нулю.

Оба игрока стараются сделать друг друга безразличными.

Первый шаг - мы пушим $100. Для безубыточности наш блеф должен работать 1 раз из 2. Если соперник хочет коллить таким образом, чтобы сделать нас безразличными между блефом и чеком вдогонку, то он будет коллить с частотой 50%. Именно это он и будет делать при равновесии - против ставки банк он вколлит с toto в 50% случаев.

Следующий шаг - мы всё еще пушим $100. Сопернику надо вколлить $100, чтобы выиграть банк $200. У него шансы банка 2 к 1. Это означает, что для безубыточного колла ему надо выигрывать 1 раз из 3. Мы захотим блефовать таким образом, чтобы блеф-кэтчеры соперника срабатывали 1 раз из 3. Мы будем вэльюбетить в 2/3 случаев и блефовать в 1/3 случаев. Это сделает блеф-кэтчеры соперника безубыточными.

Вот такой процесс можно наблюдать, когда оба игрока пытаются сделать друг друга безразличными между возможными действиями. Рассмотрим этот процесс применительно к нашему примеру.

Всего у нас 4 комбинации aoao и 4 комбинации 7o2o одномастные. Мы поставим с 4 комбинациями aoao и с 2 комбинациями 7o2o одномастные. Таким образом, наш диапазон на 2/3 состоит из вэлью рук и на 1/3 из блефов.

Соперник будет блеф-кэтчить с половиной своих рук, то есть с 2 из 4 комбинациями toto.

Можно посчитать равновесные EV для этой ситуации - какую часть от банка $100 получит каждый игрок.

Начнем с нашего EV.

Когда мы ставим с aoao - в половине случаев выиграем $200, а в половине случаев выиграем $100. Как мы помним, соперник коллит в половине случаев.

Когда мы ставим с 7o2o одномастные - в половине случаев проиграем $100, а в половине случаев выиграем $100. В среднем, EV ставит с 7o2o одномастные будет равно 0.

Решив простое уравнение, мы выяснили, что в среднем наше EV = +$75. Не забываем, что в нашем диапазоне 8 комбинаций, поэтому среднее ожидание +$75.

Когда мы ставим с идеально поляризованным диапазоном против диапазона блеф-кэтчеров, то в среднем мы выигрываем весь банк всякий раз, когда ставим. Но чтобы оставаться сбалансированными, мы не можем ставить со всеми руками диапазона. Нам нужно сдаваться с 2 блефами из 4.

Когда мы ставим - в среднем выигрываем весь банк. Когда мы чекаем вдогонку - не выигрываем ничего.

В нашем диапазоне 8 комбинаций. Мы ставим 6 комбинаций и с каждой из них в среднем выигрываем весь банк, то есть $100. С 2 комбинациями чекаем вдогонку не выигрываем ничего. Итого:  с каждой комбинацией диапазона наше EV в среднем +$75.

Что касается нашего соперника - в 6 из 8 случаев он сталкивается с идеально поляризованной ставкой, против которой он безразличен между коллом и фолдом. Его EV = 0. В среднем, мы выиграем весь банк, а соперник не выигрывает ничего. Однако в 2 из 8 случаев мы чекаем и сдаемся с блефами, а соперник выигрывает весь банк. Таким образом, среднее EV соперника будет +$25.

Если посмотреть на EV разных рук нашего диапазона, то можно увидеть, что наши блефы не выигрывают деньги. С этими руками мы безразличны между блефом и чеком вдогонку. Деньги нам приносят вэльюбеты, ну а блефы, по сути, вынуждают соперника иногда коллить с блеф-кэтчерами. Если бы в нашем диапазоне вообще не было блефов, то соперник не стал бы блеф-кэтчить.

Если мы зафиксируем нашу ГТО стратегию и поиграемся с частотами соперника, то наше EV (как ГТО игрока) останется неизменным. Если соперник выкидывает слишком часто, то наши блефы начнут выигрывать деньги, и это компенсирует потерю EV вэльюрук. И наоборот, если соперник начнет слишком часто блеф-кэтчить, то наши блефы будут проигрывать деньги, а EV вэльюрук увеличится. Но наше суммарное EV останется неизменным.

Важно понимать, что при отклонении от ГТО мы можем увеличить свое EV. Предположим, что соперник блеф-кэтчит не половину своих toto, а 3 из 4 комбинаций. Ранее мы увидели, что при равновесии наши блефы безубыточны. Но если соперник начинает коллить почаще, то наши блефы уже не будут безубыточными. Теперь они будут проигрывать деньги.

Наш соперник отклонился от ГТО, и в качестве эксплойта мы можем перестать блефовать. Это позволит нам увеличить свое EV.

Теперь наши вэльюбеты с aoao будут в среднем выигрывать больше денег. Среднее EV всех наших рук увеличится с +$75 до +$87.5.

Если соперник допускает ошибки, и в качестве эксплойта мы отклонились от ГТО стратегии, то соперник может в дальнейшем скорректировать свою стратегию. Если соперник коллит слишком часто, то мы никогда не станем блефовать. Если соперник увидит, что мы никогда не блефуем, то он не будет коллить. Если он никогда не коллит, то мы будем всегда блефовать и т.д. В итоге мы попали в бесконечный цикл.

В реальной жизни люди будут совершать ошибки, и это позволит нам получить больше EV, чем по ГТО. Но для этого нам надо эксплойтить ошибки соперников. Однако надо понимать, что если мы начинаем эксплойтить соперника, то становимся подверженными к контр-эксплойтам со стороны соперника.

Я считаю, что хороший игрок должен хотя бы на базовом уровне понимать, каким будет ГТО в некоторых сценариях. Это будет вашей точкой отсчета. Ну и, конечно, если вы увидите, что соперники совершают ошибки, то не бойтесь отклоняться от ГТО в целях эксплойта их ошибок.

Рейкбек сделки

Играете много и хотите зарабатывать больше? Мы предложим топовые рейкбек сделки в популярных покер-румах!

Узнать подробней
VIP Клуб PekarStas

Получите доступ к эксклюзивным обучающим видео курсам и покер водам на русском языке от лучших игроков и тренеров.

Вступить в VIP Клуб
Топовый Рейкбек
Нашим игрокам предлагаем лучшие условия по рейкбеку + начисляем PekarStas Points за активную игру в покер-румах
Узнать подробней
PekarStas Points
Играя в покер-румах от нашего сайта, вам на баланс будут начисляться PekarStas Points. PSP-очки можно потратить на обучение с тренерами и товары из магазина.
Узнать подробней

Подпишись на официальный YouTube канал PekarStas и не пропусти ни одно новое видео!
Подписаться
Подпишись на официальный Telegram канал PekarStas и не пропусти ни одной новости!
Подписаться