В этой статье Фил Гальфонд рассказал о тонкостях понимания концепций, лежащих в основе оптимальной игры, и о том, почему иметь такое понимание — лучше, чем пытаться запомнить решения солвера в различных сценариях.
Хотите выработать и запомнить убийственную стратегию действий для определённой ситуации, например, для контбетов на флопе? Вот его неожиданный совет: не стоит к этому стремиться.
Почему Фил Гальфонд не набирает высокие баллы в собственном GTO-тренажёре?
На моём обучающем сайте Run It Once есть PLO-солвер под названием Vision, в котором есть функция «Streak». Вы выбираете конкретный спот (например, игра против контбета на флопе в однократно рейженном банке) или просто одну из улиц, и солвер предлагает вам раздачи. На решение даётся 15 секунд, после чего солвер говорит, правильно вы ответили или нет. Ваша задача — дать как можно больше правильных ответов подряд. На сайте есть лидерборды, и у лучших учеников длина такого «стрика» достигает нескольких сотен успешных попыток.
Я провёл много времени, тренируясь в этом солвере на разных улицах, и понял, что не могу пробиться в топ этих лидербордов. Я ожидал, что у меня будут хорошие шансы на это, потому что я много обучаюсь и мои скиллы выше, чему у этих людей. Я знаю только их никнеймы, но готов поспорить, что никто из них не поставил бы свои деньги в хедс-ап игре против меня.
Так почему же мне не удалось пробиться на верхние места этих лидербордов? Тому есть две причины. Первая заключается в том, что в процессе обучения я упрощаю стратегию солвера, чтобы впоследствии мне было легче применять её за столом.
Например, однократно рейженный банк, я играю чек-колл против контбета. На любых бордах я никогда не донкаю тёрн, потому что у меня неподходящий для этого диапазон. Некоторые игроки выберут здесь донк, и Vision вместе с другими солверами тоже донкают такие споты.
Но я считаю, что такой донк даёт лишь небольшое EV, при этом он усложняет моё обучение, мою стратегию и способность ей следовать. А когда вам приходится использовать более сложную стратегию, выше шансы, что у вас возникнет огромный лик в каком-то другом месте, и если оппонент это поймёт, он может этим воспользоваться.
Вторая причина ещё проще: хотя я действительно много обучался в этом тренажёре для HU PLO, топовые участники лидербордов обучались ещё больше. Так почему же я считаю, что те люди, которые добились гораздо большего успеха в этих лидербордах, чем я, не смогут обыграть меня в хедс-ап игре PLO?
Важно понимать концепции, лежащие в основе оптимальной игры
Дело в том, что выработка идеальной стратегии контбетов на флопе не так уж важна. Что действительно важно в покере, так это понимание концепций, лежащих в основе оптимальной игры.
Солверы не просто «думают» о том, как сыграть в каком-то отдельном споте, а затем переходят к другому изолированному споту. Их можно было бы запрограммировать таким образом, но стратегия солверов учитывает все возможные улицы, они «мыслят» в оба направления — вперёд и назад.
Говоря об искусственном интеллекте, будь то солвер или что-то ещё, мы не можем «увидеть» его мыслительный процесс, потому что нет никакого мыслительного процесса, просто какие-то вычисления. Поэтому обучение с помощью солвера — это своего рода противоположность обучению с тренером. В отличие от солвера, тренер проводит вас через мыслительный процесс, задавая вопросы, и только после этого вы даёте ему ответ. Солвер делает обратное: он даёт вам готовый ответ и ничего не объясняет.
Если всё, что у вас есть, — это ответы без контекста, то вы не сможете самостоятельно применить их на практике, потому что вашему человеческому разуму нужно пройти через мыслительный процесс. Таким образом, вам нужно получить ответы от солвера, а затем попытаться соединить эти точки между собой и понять, почему он принял именно такое решение.
Итак, в вашем диапазоне контбета флопа может быть много рук. Возьмём пример из холдема, где на столе лежат с двумя пиками. С рукой вроде
вы можете ставить много контбетов.
У такой руки очень низкое эквити, но когда на тёрне и ривере придут и
, вы сможете зарядить три барреля, поскольку если ставить только с дро, то на определённых бордах у вас не останется пространства для блефа, вам просто не с чем будет блефовать.
Таким образом, когда ваша рука содержит блокеры, солвер продумывает, какую руку вы сможете изобразить позже. С такими руками он ставит баррели, когда они доезжают, а в некоторых случаях — когда они не доезжают.
Всё потому, что на самом деле ваши дро, с которыми вы ставили флоп и тёрн, в конечном счёте оказываются худшим блефом на ривере, потому что блокируют у оппонента те дро, которые вы хотите, чтобы он выкинул. Таким образом, часто с этими очень слабыми руками солвер ставит флоп из-за наличия конкретного блокера, и на следующих улицах он очень часто продолжает с ними ставить, в зависимости от карт тёрна и ривера.
Некоторые скажут: нет, вы теряете деньги от того, что не ставите на тёрне и ривере, и технически это верно. Но вы также теряете деньги, делая ставку на флопе. Поскольку эквити этой руки очень низкое, единственная причина, по которой эта рука входит в диапазон ставки, заключается в том, что на многих бордах, на которых закроется какое-то дро, эта рука по-прежнему будет воздухом.
Но если вы не собираетесь блефовать с этой рукой на тех риверах, где будет закрываться какое-то дро, значит, вы просто вкладываетесь в банк с очень слабой рукой. Вам не нужно начинать блеф с руками, которые почти всегда так и останутся блефом.
Идеальная стратегия флоп-контбетов бесполезна, если вы не используете её абсолютно идеально
Таким образом, абсолютно идеальная стратегия контбетов на флопе вам не поможет, если вы не будете абсолютно идеально (или близко к идеальному) использовать её на тёрне и ривере.
Что действительно важно в покере, так это понимание концепции, лежащей в основе оптимальной стратегии:
- Почему солвер ставит с этими руками?
- С чем он может добирать на двух или трёх улицах?
- Какими свойствами должны обладать лучшие руки для блефа?
А также с какими руками лучше играть ответный чек и почему:
- Походят ли они для пот-контроля?
- Дают ли хорошее покрытие борда на определённых тёрнах для вашего диапазона ответного чека?
- Если вы не будете чекать, предпримет ли противник какие-то конкретные действия для получения преимущества?
Есть так много вещей, которые нужно учитывать и о которых нужно задумываться, что изучение конкретной стратегии контбета просто теряет своё значение. Важно то, что вы можете продумать любую ситуацию с помощью своего ума, а не компьютера, поскольку вы не можете постоянно держать солвер при себе и сверяться с ним в каждом споте.
Вы можете довести свою префлоп-стратегию до совершенства, вы можете просто запомнить, какие руки нужно разыгрывать на префлопе, и вы, пожалуй, можете очень сильно приблизиться к идеальной стратегии контбетов на флопе. Но, учитывая огромное множество возможных флопов и тёрнов, а также то, как много разных вещей может произойти во время раздачи, у вас просто не будет шанса вызубрить стратегию для тёрна и ривера. Особенно если учесть, что раздача не всегда будет проходить по линии «чек-колл на флопе, чек-колл на тёрне» — иногда на флопе противник сыграет чек-рейз, а иногда после его чек-колла на флопе будет чек-чек на тёрне, а экшен на ривере будет зависеть от пришедшей карты.
Нет смысла строить свою стратегию на запоминании решений солвера
Попытку построить свою стратегию с помощью простой зубрёжки я считаю безнадёжным делом. Конечно, запоминать префлоп-диапазоны — это правильно, ваши постфлоп-лики не сильно будут влиять на то, какие руки вы можете разыгрывать на префлопе. Важно иметь хорошее представление о том, с какими руками ставить флоп и какие сайзинги при этом использовать, но гораздо важнее концептуально понимать, чего солвер пытается добиться небольшими ставками, а чего — крупными, и почему на этом борде он ставит крупно, а на другом — мало.
С какими руками можно добирать на двух улицах и затем играть ответный чек на ривере? С какими руками можно добирать на трёх улицах? С какими лучше ставить флоп, чекать тёрн и ставить ривер? Какие карты тёрна радикально меняют мой привычный сайзинг или частоту ставки? Таких факторов великое множество, и обдумать их все — очень сложная задача, а запомнить тысячи решений солвера — почти невозможная, если только вы не обладаете фотографической памятью. Я не знаю ни одного игрока, который пытался бы запомнить стратегию солвера.
Вывод: применяйте к решениям солвера человеческую логику
Надеюсь, из всего вышесказанного вы не сделаете вывода, что учиться бесполезно. Наоборот, учиться необходимо, если вы хотите улучшить свою игру. Обучение — это фантастически эффективный путь стать лучше, но способом обучения не должно быть простое запоминание.
Нужно изучать решения солвера и применять человеческую логику, чтобы вы могли переварить, усвоить эти решения и, столкнувшись с похожей ситуацией в реальной игре, запустить свой мыслительный процесс и попытаться найти лучший вариант. Я не знаю, что будет делать солвер в каждом возможном споте, но я знаю, как продумывать каждую ситуацию как солвер, поэтому когда я оказываюсь в очень странных спотах, я принимаю решения, близкие к оптимальным, и не теряю много EV.




