Czy boty grają w pokera lepiej niż ludzie?

0

Grą, która wymaga ponadprzeciętnej inteligencji, nie jest już kostka Rubika, ani szachy, ani nawet Go. Te gry są trudne w tym sensie, że często bywa wiele rozwiązań, ale nadal są przejrzyste; nic nie jest ukryte, każdy bit informacji jest jawny. Głównym wyzwaniem jest przekształcenie tych informacji w strategię. Istnieje stały zbiór zasad i jeśli wgrać je do komputera, to będzie on osiągał optymalny wynik w każdym meczu.

Kiedy Garry Kasparow przegrał z komputerem szachowym Deep Blue IBM w 1997 roku, żalił się, że „zamiast komputera, który myśli i gra w szachy jak człowiek, dostałem taki, który gra jak maszyna”.

Kasparow miał nadzieję, że gry takie jak poker byłyby inne. Nie można w nie wygrać, wykonując stały zestaw reguł, ponieważ są karty ukryte i informacja jest niepełna. To samo dotyczy wielu innych sytuacji życiowych, np. negocjacji, aukcji, handlu.

Można wygrać w grach takich jak Go, szukając optymalnego zestawu zasad – tak, jak to niedawno zrobił Google DeepMind's AlphaGo – ale żeby triumfować w grach niekompletnej informacji, należy dostosować taktykę do posiadanych danych i do przeciwników, z którymi trzeba się zmierzyć. Granie tej samej ręki za każdym razem w ten sam sposób, bycie przewidywalnym, automatyczne podejmowanie decyzji – to recepta na przegraną.

Dlatego poker zawsze intrygował naukowców, takich jak Alan Turing czy John von Neumann. Przyciągał również nowoczesnych badaczy, zainteresowanych stworzeniem sztucznej inteligencji.

Poker jest postrzegany bardziej jako sztuka niż nauka, gra wymagająca ludzkiej pomysłowości i kreatywności, a nie tylko sprawnego operowania liczbami. Ale najlepsze na świecie komputery stworzone do gry zdają się temu zaprzeczać i pokazują jak bardzo różni się ludzki proces myślenia i podejmowania decyzji od tego, do którego zdolna jest maszyna.

W 2015 roku naukowcy z University of Alberta zaprezentowali poker bota – Cepheusa, który rozpracował grę Heads- up Limit Texas Hold'em. Jego decyzje opierały się na equilibrium, czyli na strategii równowagi; w każdej konkretnej sytuacji bot wybierał najlepszą spośród opcji o ściśle określonym prawdopodobieństwie, dlatego w perspektywie long-run nie przegrywał. Grupa nie nauczyła Cepheusa taktyki; według badacza Michaela Johansona w zespole nie było nawet nikogo, kto mógłby nazwać siebie pokerzystą. Zamiast tego bot uczył się poprzez rozgrywanie miliardów symulowanych rozdań i to na podstawie ich historii „wiedział”, które zagrania są najbardziej profitowe.

Zespół zajął się teraz innymi odmianami pokera. Gra z limitem jest z definicji ograniczona, możliwa do opanowania. To sprawia, że jest łatwiejsza z teoretycznego punktu widzenia, ale też wynik eksperymentu trudniej jest odnieść do rzeczywistego świata. Oczywistym kolejnym celem jest No Limit Texas Hold'em, który stoi na czele „ludzkich” pokerowych eventów. Nie ma maksymalnej stawki, gracze mogą pójść all-in w dowolnym momencie.

Niektóre boty są już biegłe w nieograniczonych możliwościach gry bez limitu i demostrują sposoby taktycznego myślenia, wybiegające daleko poza ludzkie możliwości. Ponieważ te boty ciągle się rozwijają, ujawniają nowe, innowacyjne drogi żonglowania ryzykiem i podejmowania decyzji na podstawie niepełnych informacji. Tym samym zmuszają nas do zastanowienia, które aspekty naszego zachowania są tylko ludzkie, a które będziemy dzielić z myślącymi maszynami.

Mimo postrzegania pokera jako gry psychologicznej, nie tylko ludzie są zdolni do oszukiwania przeciwników lub dostosowywania się do sytuacji – komputery również to robią, jeśli uznają to za odpowiednią strategię. Najlepsze boty na świecie nauczyły się blefować, budować swój wizerunek, a nawet manipulować przeciwnikami.

Nie ma wątpliwości, że gdyby zostały dopuszczone do gry live, nie miałyby także problemu z zachowaniem pokerowej twarzy. Ciekawe tylko, jak dałyby sobie radę z modnym ostatnio trash talkiem?

źródło: http://www.wired.co.uk/article/poker-ultimate-test-for-machine-learning
Poprzedni artykułRozdano Global Gaming Awards 2016
Następny artykułFedor Holz ambasadorem marki odzieżowej