Способен ли покерный бот на «разумный» блеф?

Когда речь заходит о понимании интеллекта, то главной проблемой оказываются не Шахматы, Го (Китайская логическая игра) или Кубик Рубика. Ведь все эти игры хоть и имеют огромное количество решений, но все же являются весьма прозрачными в плане вариантов розыгрыша или говоря иначе являются играми с открытой информацией. Но когда речь заходит об игре в покер, все весьма значительно меняется и наиболее наглядно это видно при попытке запрограммировать действительно «думающего» бота.

В чем же главная загвоздка?

Основная проблема кроется в том, чтобы превратить исчерпывающую информацию в рабочую и эффективную стратегию игры. В целом можно сказать, что если для покерного бота суметь найти и подобрать определенный набор правил, то он сможет достигать оптимального результата в игре.

Это весьма наглядно можно увидеть в ситуации игры Гарри Каспарова против шахматного супер-компьютера Deep Blue, когда в 1997 году он после серии матчей в итоге потерпел поражение. Тогда Гарри неодобрительно высказался, касательно такого подхода к игре в шахматы:

«Вместо компьютера, который бы думал и играл в шахматы как человек, есть лишь компьютер, играющий как машина.»

Когда речь заходит о такой игре как покер, то есть игре с неполной информацией, то дела обстоят несколько иначе. Машине не удастся выиграть, просто следуя ограниченному набору правил, ведь часть информации отсутствует, поскольку игроку известны далеко не все карты. Все это относится и ко многим другим областям, таким как игра на бирже и аукционах и заканчивая деловыми переговорами.

И если в такой игре, как Го (открытой, но имеющей гораздо большее количество возможных шагов, чем шахматы) еще вполне реально найти оптимальный набор правил, что и подтвердилось создателями Google DeepMind’s AlphaGo, то для победы в играх с неполной информацией, необходимо постоянно подстраивать вашу стратегию игры в соответствии с имеющимися у вас данными и исходя из того, как играют ваши оппоненты.

Разыгрывая вашу руку одним и тем же способом, вы тем самым станете точно также предсказуемы, как и робот и скорее всего проиграете.

Покер и раньше привлекал таких известных ученых, как Алан Тьюринг и Джон фон Нейман, которые одними из первых начали интересоваться думающими машинами. На сегодняшний же день, покер все также привлекает тех, кто связан с работами над искусственным интеллектом.

Зачастую покер рассматривается скорее как искусство, а не наука, ведь эта игра сильно зависит от изобретательности и инициативы человека, а не от сухих цифр и расчетов. Тем не менее, лучшие покерные боты в мире на сегодняшний день, заставляют сомневаться в этой идее.

Вместе с этим меняется и наше представление о том, как машина и человек создают стратегию игры и принимают в ней решения.

В 2015 году произошло весьма значительное событие для мира покера. Разработчики из Университета Альберты представили своего покерного бота – Цефей (Cepheus), который смог решить лимитную версию Техасского Холдема, для двух игроков. То есть игру, где имеются ограничения по максимальной ставке и игра происходит один на один.

Он играл исходя из равновесной стратегии, когда в каждой отдельной ситуации стратегия игры зависит от возможных вариантов с определенной вероятностью и в долгосрочном плане игрок придерживающийся такой стратегии не будет проигрывать деньги.

Причем показательно то, что Цефея никто не обучал какой-либо покерной стратегии, он сам пришел к ней за счет проигрывания миллиардов смоделированных раздач.

Успех в других видах покера?

На сегодняшний день разработчики подобного рода программ, переключили свое внимание на другие виды покера. Лимитная версия Холема, которую расколол Цефей, по сути имеет весьма жесткие рамки, что дает возможность более простого изучения с точки зрения теории, но заметно снижает полезность таких исследований, применительно к реальному миру.

Безусловно следующим шагом разработчиков станет Безлимитный Холдем, который на сегодняшний день является наиболее популярной версией игры в покер. Но тот факт, что размер ставки в данном виде игры не ограничен и игрок в любой момент может пойти в All-in, заметно усложняет задачу.

Некоторые боты уже довольно свободно чувствуют себя при игре в Безлимитный Холдем и даже показывают определенное тактическое мышление, находящееся далеко за пределами возможностей человека. Постепенно развиваясь, боты начинают открывать новые и способы жонглирования рисками и даже инновационные варианты принятия решений при неполной информации.

Все это заставляет нас задуматься над следующим вопросом:

«Какие аспекты нашего поведения можно считать неотъемлемо человеческими, а какие из них смогут перенять мыслящие машины?»

И хоть покер и имеет репутацию психологической игры, но нельзя просто сказать, что в этой игре только люди способны обманывать друг друга, то есть блефовать. В действительности уже на сегодняшний день, покерный бот способен приходить к тому же решению исходя из оптимальной стратегии.

Лучшие из покерных ботов, сами учили друг друга блефовать, проявлять агрессию и даже манипулировать своими оппонентами. В итоге можно сказать, что ожидания Каспарова насчет того, что «компьютеры узнают, что иногда выгодно играть как человек, а не машина», постепенно сбиваются.

Opt In Image

Возврат рейка до 40% + много игры

Быстрый покер, хороший возврат рейка, большое количество игры, все это на PartyPoker.

0 Comments

Сохрани к себе на стену, что бы не потерять.