Документ, описващ MineDojo, универсален AI агент на Nvidia, който може да изпълнява действия от писмени команди в Minecraft и спечели награда за изключителни набори от данни и бенчмаркове на конференцията NeurIPS (Системи за обработка на невронна информация) 2022 г., беше разкрит от Nvidia в понеделник.
За да обучат рамката на MineDojo да играе Minecraft, изследователите я захраниха със 730 000 видеоклипа на Minecraft в YouTube (с над 2.2 милиарда транскрибирани думи), 7000 копирани уеб страници от уикито на Minecraft и 340 000 публикации в Reddit и 6.6 милиона коментара в Reddit, описващи играта на Minecraft.
От тези данни изследователите създадоха персонализиран модел на трансформатор, наречен MineCLIP, който свързва видеоклипове със специфични дейности в Minecraft в играта. В резултат на това някой може да каже на алгоритъма на MineDojo какво да прави в играта, използвайки естествен език на високо ниво, като например „намерете пустинна пирамида“ или „изградете портал и влезте в него“, и MineDojo ще изпълни поредицата от стъпки необходими, за да се случи това в играта.
MineDojo има за цел да създаде гъвкав алгоритъм, който може да обобщава научените действия и да ги прилага към различни поведения в играта. Както пише Nvidia, „докато изследователите отдавна са обучавали автономни AI агенти в среда на видеоигри като StarCraft, DotА и Go, тези агенти обикновено са специалисти само в няколко задачи. Ето защо изследователите на Nvidia се обърнаха към Minecraft като най-популярната игра в света, за да разработят мащабируема обучителна рамка за генерален агент - такъв, който може успешно да изпълнява голямо разнообразие от отворени задачи“.
Награденият документ „MINEDOJO: Изграждане на вградени агенти с отворен край със знания в интернет мащаб“ дебютира през юни. Сред авторите му са експерти от Nvidia и от различни академични институции.
Снимка: Unsplash
Виж още: Тонове човешки боклук замърсяват Марс след 50 години проучвания