Системите за машинно обучение сразяват своите човешки опоненти вече повече от десетилетие (припомняме, че първата победа на Watson в играта Jeopardy беше през 2011 г.), въпреки че видовете игри, в които превъзхождат, са доста ограничени. Обикновено състезателни настолни или видеоигри, използващи ограничено поле за игра, последователни ходове и поне един ясно дефиниран противник, както и всяка игра, която изисква събиране на числа, е в тяхно предимство. Diplomacy обаче изисква много малко изчисления, вместо това налага играчите да преговарят директно с опонентите си и да правят съответни ходове едновременно – неща, които съвременните системи за машинно обучение обикновено не са създадени да правят. Но това не е попречило на изследователите на Meta да определят AI агент, който може да преговаря за глобални политически позиции, както всеки посланик на ООН.
Diplomacy беше пусната за първи път през 1959 г. и работи като по-усъвършенствана версия на RISK, в която между двама и седем играчи поемат ролите на европейска сила и се опитват да спечелят играта, като завладеят териториите на своите опоненти. За разлика от RISK, където изходът от конфликтите се решава чрез просто хвърляне на зар, Diplomacy изисква играчите първо да преговарят помежду си – създаване на съюзи, удари в гърба, всички други похвати, – преди всеки да премести фигурите си едновременно по време на следващата фаза на играта. Способностите да разчитате и манипулирате опонентите, да убеждавате играчите да създават съюзи и да планират сложни стратегии, да управлявате деликатни партньорства и да знаете кога да смените съюзниците си, са огромна част от играта и всички умения, които системите за машинно обучение обикновено липсват.
Сега изследователите на Meta AI обявиха, че са преодолели тези недостатъци на машинното обучение с CICERO: първия AI, който показва производителност на човешко ниво в Diplomacy. Екипът обучи Cicero по 2.7 милиарда параметъра в хода на 50 000 рунда в онлайн версията на играта webDiplomacy.net, където завърши на второ място (от 19 участници) в турнир от 5 игри на лигата, като същевременно постигна два пъти по-висок резултат от средния на опонентите си.
AI агентът се оказа толкова умел „в използването на естествен език за преговори с хора в играта, че те често предпочитаха да работят с CICERO пред други човешки участници“, отбеляза екипът на Meta в съобщение за пресата. „Diplomacy е игра за хора, а не за фигурки. Ако агентът не може да разпознае, че някой има вероятност да блъфира или че друг играч ще види определен ход като агресивен, той бързо ще загуби играта. По същия начин, ако не говорите като истински човек - проявявайки съпричастност, изграждайки взаимоотношения и показвайки знания за играта - няма да намерите други играчи, желаещи да работят с вас.“
Снимка: Unsplash
Виж още: Meta обучи AI с 48 милиона научни публикации, за да го спре два дни по-късно