Нова техника може да се използва за предсказване на действията на човешки агенти или агенти с изкуствен интелект, които се държат неоптимално, докато работят за постигане на неизвестни цели.
Изследователи от Масачузетския технологичен институт и други университети са разработили рамка, която моделира ирационално или неоптимално поведение на човешки или AI агент въз основа на техните изчислителни ограничения. Техният метод може да помогне за предсказване на бъдещите действия на агента, например в шахматни мачове.
За да се изградят системи за ИИ, които могат да си сътрудничат ефективно с хора, е полезно да се започне с добър модел на човешкото поведение. Но хората са склонни да се държат неоптимално, когато вземат решения.
Тази ирационалност, която е особено трудна за моделиране, често се свежда до изчислителни ограничения. Човек не може да прекара десетилетия в размисъл за идеалното решение на един проблем.
Изследователи от Масачузетския технологичен институт и Вашингтонския университет разработиха начин за моделиране на поведението на агент, независимо дали е човек или машина, който отчита неизвестните изчислителни ограничения, които могат да възпрепятстват способностите на агента за решаване на проблеми.
Техният модел може автоматично да изведе изчислителните ограничения на агента, като види само няколко следи от предишните му действия. Резултатът, така нареченият "бюджет за изводи" на агента, може да се използва за прогнозиране на бъдещото му поведение.
В нова статия изследователите демонстрират как техният метод може да се използва за извеждане на целите на навигацията на някого от предишни маршрути и за предсказване на следващите ходове на играчите в шахматните мачове. Техният метод съвпада с или превъзхожда друг популярен метод за моделиране на този вид вземане на решения.
В крайна сметка тази работа може да помогне на учените да научат системите с изкуствен интелект как се държат хората, което би позволило на тези системи да реагират по-добре на своите човешки сътрудници. Способността да се разбере поведението на човека и след това да се изведат неговите цели от това поведение може да направи един асистент с изкуствен интелект много по-полезен, казва Атул Пол Джейкъб, дипломант по електроинженерство и компютърни науки (EECS) и водещ автор на статията за тази техника.
"Ако знаем, че човек е на път да направи грешка, след като сме видели как се е държал преди, ИИ агентът би могъл да се намеси и да предложи по-добър начин да го направи. Или пък агентът може да се адаптира към слабостите, които имат неговите човешки сътрудници. Възможността да се моделира човешкото поведение е важна стъпка към създаването на агент с изкуствен интелект, който действително може да помогне на този човек", казва той.
От десетилетия изследователите създават изчислителни модели на човешкото поведение. Много от предишните подходи се опитват да отчетат неоптималното вземане на решения чрез добавяне на шум към модела. Вместо агентът винаги да избира правилния вариант, моделът може да предвижда, че агентът прави правилния избор в 95% от случаите.
Тези методи обаче могат да не успеят да обхванат факта, че хората невинаги се държат неоптимално по един и същи начин.
Други специалисти от MIT също са проучвали по-ефективни начини за планиране и извеждане на цели в условията на неоптимално вземане на решения.
За да изградят своя модел, Джейкъб и неговите сътрудници са се вдъхновили от предишни изследвания на шахматисти. Те забелязали, че играчите отделят по-малко време за мислене, преди да действат, когато правят прости ходове, и че по-силните играчи са склонни да отделят повече време за планиране, отколкото по-слабите в трудни мачове.
Техният модел сравнява тези решения с поведението на агент, който решава същия проблем. Той привежда в съответствие решенията на агента с решенията на алгоритъма и определя стъпката, на която агентът е спрял да планира.
Въз основа на това моделът може да определи бюджета за изводи на агента, или колко дълго този агент ще планира този проблем. Той може да използва бюджета за изводи, за да предвиди как този агент ще реагира при решаването на подобен проблем.
Този метод може да бъде много ефективен, тъй като изследователите могат да получат достъп до пълния набор от решения, взети от алгоритъма за решаване на проблеми, без да извършват допълнителна работа. Тази рамка може да бъде приложена и към всеки проблем, който може да бъде решен с определен клас алгоритми.
Снимка: Unsplash
Виж още: SanDisk ще пусне първата в света SD карта с капацитет 4 TB през 2025 г.