Два года назад покерный бот Libratus сделал, казалось бы, невозможное — он обыграл в хэдз-апах четырех сильных игроков этой дисциплины во главе с Дагом Полком. Это был самый настоящий прорыв в области изучения ИИ, и небольшой сигнальчик всему комьюнити — ребята, надо становиться еще конкурентнее, иначе машины заберут у нас все деньги.
Да, это достижение вызвало двоякие чувства. С одной стороны, если рассматривать этот факт с точки зрения прогресса технологий, то это был первый случай, когда ИИ обыграл человека в игре с дефицитом открытой информации. Еще недавно это казалось просто невозможным. С другой, оно же наводило на определенные пугающие мысли. Но как бы кто к этому не относился, факт остался фактом — хэдз-ап покер оказался побит Либратусом.
После победы Либратуса, команда ученых, работавшая над этим ИИ, заявила о своих планах на будущее, в которые входило усовершенствование ИИ для игры в 6-максе или фулл-ринге. И вот будущее наступило. В эту пятницу.
Знакомьтесь, бот Pluribus
Бот Плурибус был создан специально для игры в покер за 6-макс столами. Разработали его исследователи искусственного интеллекта из университета Карнеги-Меллона. Те же самые ребята, что два года назад создали Либратуса.
Плурибус научился играть в покер сам. В него не загружали ничего кроме правил игры и дали простор анализировать и изучать любую информацию, находящуюся в открытом доступе. По сравнению с Либратусом, который, по сути, имел аналогичные возможности для самообучения, алгоритмы Плурибуса заметно улучшили.
Как показал себя Pluribus в игре против профессионалов?
Чтобы проверить возможности Плурибуса, ученые пригласили 15 профессиональных игроков:
- Линус «LLinusLLove» Лелигер
- Крис Фергюсон
- Грег Мерсон
- Майкл Гальяно
- Ник Питранджело
- Даррен Элиас
- Джейсон Лес
- Энтони Грэг
- Дэниел МакОлей
- Джейк Туле
- Сэт Дэвис
- Тревор Саведж
- Джимми Чау
- Донг Ким
- Шон Руан
Плурибус обыграл всех. Без исключения. Даже лучший 6-макс кеш-игрок Линус «LLinusLLove» Лелигер проиграл ИИ. Но стоит отметить, что Линус показал лучший результат среди других профессионалов – минус 0.5bb/100. Средний же винрейт бота против игроков составил 5bb/100.
Стоит отметить, что противостояние проходило в двух форматах - 5 игроков против одного бота, и 5 ботов против одного игрока.
Какие тенденции использовал Pluribus?
Основной принцип игры Плурибуса основывался на математической модели минимизации сожалений. Если говорить коротко, то Плурибус постоянно менял стратегию своей игры и находил идеальный баланс между принятым решением и оптимальным действием.
Некоторые из тенденций Плурибуса заслуживают отдельного внимания. Так, например, Плурибус вообще никогда не лимпит и часто использует донкбеты.
Оба этих мува чаще принято считать неоптимальными. Но если в случае с лимпом, Плурибус все подтвердил своими действиями, то с донкбетами наоборот, оказалось их можно использовать эффективно. Ниже вы можете посмотреть игру Плурибуса против 5 реальных людей.
Как будут использовать Pluribus?
Очевидно, что если Плурибус попадет в чьи-то нечестные руки, то 6-максу со всем онлайн-покером в принципе придет конец. Но, к счастью, у создателей этого ИИ цели были более глобальны. В общем доступе Плурибус не окажется никогда.
В скором времени, после столь удачного теста, ИИ будет переработан и адаптирован под совершенно другие цели. Кроме того, код Плурибуса существует в одном единственном экземпляре, который после донастройки будет передан армии США. Там он будет работать во благо человечества и мира во всем мире.
Как сообщают разработчики, ИИ на основе Плурибуса сможет использоваться в сфере информационной кибербезопасности, он также будет находить и противостоять различным мошенническим схемах, оперативно реагировать на террористические угрозы. В общем, станет идеальным защитником в сети.