Начало Наука Компютърна програма е най-добрият играч на покер

Компютърна програма е най-добрият играч на покер

12.01.2015

Учени детронираха най-добрия играч на покер в света, образно казано, като създадоха програма, която практически не може да бъде победена. Научният труд от въпросните учени е публикуван в журнала Science и показва, че програмата не може да загуби, поне не и за време от един човешки живот.

ВИЖ ОЩЕ: НАЙ-ШАНТАВИТЕ ПРОДУКТИ НА CES 2015

Съществуват програми, които са така програмирани, че да не можете да ги победите на различни игри, които са по-прости от покера – четири поредни или дама например. Но за комплексна игра на покер това не е правено досега. Това е защото покерът, или по-точно Texas Hold ’em покер, над който са работели учените, е игра, успехът ви в която зависи от много различни фактори – несигурни данни, случайност, късмет, блъф и така нататък. Защо обаче въпросната програма не може да бъде победена и как е постигнато това?

Да, вярно – учените са избрали улеснен вариант на Texas Hold ’em, който включва ограничено наддаване, само двама играчи и още няколко други правила, улесняващи играта. Въпреки всичко, след написването на програмата, на нея й е отнело два месеца и 4000 централни процесора, равняващи се на 1000 години изчислителна работа, за да играе сама срещу себе си, да подобри начина си на игра и да изучи нови решения за победа. Точно така – компютърът се учи как да играе и да не губи, като това става като се пази информация за предишни подобни раздавания на някое конкретно. След това програмата изчислява кой е най-оптималното решение на въпросния ход, така че да има най-голям шанс за печалба. Това не значи че тя печели всяко една раздаване, а само, че дори да имахте време да изиграете 60 милиона раздавания с компютъра, пак нямаше да спечелите играта.

Всичко това надгражда на вече създадения алгоритъм counterfactual regret minimization (CFR), което намалява шанса за загуба на дадена ръка. Въпросните данни (regret value) е това, което споменах като запазена информация за предишно изгубено раздаване – колко точно пари е изгубила програмата.

Но всичко това не е просто една игра – учените смятат, че работата им може да подпомогне бъдещо развитие на програми, които да подпомагат софтуерни асистенти на летищата или пък взимането на важни решения за кратко по време на животоспасяваща операция например.

Прочети за: