Programiści Facebooka stworzyli najlepszego pokerowego bota na świecie?

Autor

03/08/2020 08:30

Programiści portalu Faceboook stworzyli nowego pokerowego bota. Został on nazwany ReBel i okazuje się, że jest jeszcze lepszy niż Libratus!

Developerzy Facebooka stworzyli sztuczną inteligencję nazwaną ReBel. Nazwa to skrót od Recursive Belief-based Learning. Radzi sobie ona doskonale w grach, takich jak poker.

W poprzednich latach nastąpiła znacząca poprawa w zakresie możliwości sztucznej inteligencji. AlphaZero od DeepMind samodzielnie nauczył się szachów, japońskich szachów shogi oraz Go tylko na podstawie prostych zasad. Dojście do doskonałego poziomu gry zajęło mu zaledwie parę godzin.

Libratus był pokerowym botem, który również nauczył się samemu gry w NL Holdem. ReBel działa w podobny sposób, ale bierze pod uwagę jeszcze jeden element – tzw. stan gry, dzięki czemu może podczas niej zrozumieć lepiej ukryte informacje.

ReBel bierze pod uwagę informacje, które są znane – karty, bet sizing, a nawet potencjalny zakres oponenta. Dodatkowo bierze też pod uwagę „przekonania” o grze, w której są w ten sam sposób, jak prawdziwy pokerzysta myśli o tym, czy prowadzi w rozdaniu z rywalem, czy jest z tyłu.

Aby tego dokonać ReBel uczy się dwóch różnych modeli sztucznej inteligencji. Operuje na czymś, co naukowcy nazywają grupą publicznych przekonań. W grze, gdzie dostępne są wszystkie informacje, takiej jak szachy, stan gry wystarczy do podejmowania idealnych decyzji. W grach, gdzie wszystkie informacje nie są dostępne, sztuczna inteligencja bierze pod uwagę nie tylko stan gry, ale również wszystkie strategie graczy, dzięki czemu tworzy model akcji, które mogą podjąć, a także ich wyników.

ReBel lepszy od Libratusa?

Zdaniem naukowców, dzięki temu podejściu ReBel w doskonały sposób radzi sobie z grami, w których wszystkie informacje nie są dostępne. Ekipa Facebooka przeprowadziła testy, w których grano w dwie wersja Holdema – Turn Endgame Holdem (uproszczona wersja gry bez raisowania w dwóch pierwszych rundach betowania) oraz Liar's Dice.

Sztuczna inteligencja poradziła sobie doskonale w starciu z profesjonalistą Dongiem Kimem. W czasie meczu trwającego 7.500 rozdań bot wygrał 0,165 big blinda na rozdanie. To lepszy wynik niż miał Libratus, który wygrał 0,147 big blinda na rozdanie w meczu z 2017 roku. Trzeba jednak brać pod uwagę, że w tamtym meczu Libratus pokonał Kima wygrywając zaledwie 0,029 big blinda na rozdanie.

Nie musicie się jednak martwić, że pokerowe boty nagle zyskają na sile. Programiści upewnili się, że kod źródłowy bota nie zostanie ujawniony. Argumentowali to właśnie tym, że poker jest rekreacyjną grą, w której używanie botów jest oszustwem. Wiedzę planują wykorzystać przy zastosowaniu jej w negocjacjach, cyber bezpieczeństwie i nie tylko.