ИИ научился блефовать и стал непобедимым игроком в Stratego

Stratego является игрой с «неполной информацией», так как противники не знают расположения 40 игровых фишек друг друга. Значение фишки достоверно можно выяснить только при прямой атаке на нее, но его можно также попробовать угадать, анализируя действия противника. Проблема в том, что если в такой сложной игре, как го, насчитывается 10 в 360 степени возможных ситуаций на игровом поле, то в Stratego их целых 10 в 535 степени.
Учитывать все варианты развития событий нереально, поэтому игроки учатся обманывать друг друга, и в этом деле ИИ неожиданно оказался очень хорош. Он самостоятельно, без обучения на сложных моделях, вывел выигрышные принципы и выстроил на их основе стратегию, которая позволяет обхитрить противников. В частности, DeepNash выдает свои низкоуровневые фишки за фишки высокого уровня, создавая эффективные приманки для оппонента. На данный момент ИИ уже входит в тройку лучших игроков в Stratego в мире.