Фото: Shutterstock
Технологии

Искусственный интеллект выиграл в покер два миллиона

Программа Libratus победила четырех лучших профессиональных игроков.

 

Исследователи из американского университета Карнеги-Меллон разработали алгоритм, который выиграл почти $2 млн в одной из разновидностей покера. Авторы программы подробно объяснили, как ей удалось добиться сверхчеловеческой производительности, разбивая игру на управляемые части и, основываясь на игре своих оппонентов, устранять возможные недостатки в своей стратегии во время соревнований.

Как отмечают разработчики, их версия искусственного интеллекта умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий. Такой подход сильно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.

Экспресс-инфо по стране

Соединенные Штаты Америки (США) – государство в Северной Америке.

 

USA_orthographic.svg

Флаг Герб

Столица – Вашингтон

Крупнейшие города: Нью-Йорк, Лос-Анджелес, Чикаго, Майами, Хьюстон, Филадельфия, Бостон, Финикс, Сан-Диего, Даллас

Форма правления – Президентская республика

Территория – 9 519 431 км2 (4-я в мире)

Население – 321,26 млн чел. (3-я в мире)

Официальный язык – американский английский

Религия – протестантизм, католицизм

ИЧР – 0,915 (8-я в мире)

ВВП – $17,419 трлн (1-я в мире)

Валюта – доллар США

Граничат с: Канадой, Мексикой

«Приемы, которые разработаны нами при создании этой системы искусственного интеллекта, не специфичны для покера, их можно применять в любых ситуациях, когда нет полной информации для принятия решений», — заявил Ной Браун из Университета Карнеги-Меллон.

Libratus состоит из трех модулей. Первый вычисляет так называемую абстракцию игры, основываясь на общих чертах между ставками и комбинациями. Это позволяет программе разработать подробную стратегию на первые раунды торговли и грубую стратегию для последующих раундов.

В ходе игры второй модуль изменяет стратегию в зависимости от действий противника. Это делается с помощью суперкомпьютера Bridges. Каждый раз, когда соперник делает ход, который не предусматривался изначальной стратегией, модуль делает соответствующие вычисления. Третий модуль предназначен для улучшения стратегии в ходе партии.

По материалам «Новое время»