„Може ли да подкара Doom?“ - това е шеговит въпрос, който успява да засегне почти всяка технология на пазара. От управление на играта с тостер до пускане на Doom върху тест за бременност, той почти се е превърнал в еталон за изобретателност. Съвместни усилия на изследователи от Google Research, Google DeepMind и Университета в Тел Авив успяха да накарат класическия шутър да работи само с невронна мрежа. Това по същество генерира кадър, базиран на модел, който е обучен върху реалната игра. Можете да разгледате видеоклип, на който тя работи в реално време, точно тук, но има естествени ограничения за нея.
За незапознатите - невронната мрежа е структура на изкуствения интелект, моделирана по подобие на човешкия мозък, която използва машинно обучение за обработка на команди и подкани. Те се използват най-вече в моделите за прогнозиране поради способността им да схващат понятията по-широко от традиционния ИИ.
Голяма част от подобряването им се нарича „обучение“, при което се правят повторения на малко ниво, като се използват големи набори от данни. Когато една мрежа е „обучена“ върху нещо, това означава, че тя извлича данни от него и ги използва по някакъв начин. В примера с генеративния изкуствен интелект обучените модели до голяма степен ще бъдат доста сходни с изходния си материал, докато тези набори от данни не станат достатъчно широки.
Макар че очевидно е много впечатляващо да прекараш нещо толкова сложно през невронен модел, заслужава да се отбележи, че играта се играе с бавно темпо във видеото, с много проблеми - очевидно е, че се улавят само най-плавните и реалистични моменти от играта. Това няма за цел да омаловажи работата, а да я постави в контекст - в момента това е тест и не е нищо повече от това.
Без да засягаме каквито и да било етични дискусии относно използването на (конкретно генеративен) изкуствен интелект в игрите, в придружаващия документ се признават ограниченията на експеримента и се излагат аргументи за бъдещето на технологията. Поради ограничената памет на невронната мрежа тя може да съхрани само 3 секунди от самата игра. Изглежда, че тя задържа ефектите на интерфейса, но позиционирането на паметта и други неща се губят по време на игра. Освен това тя не успява да предвиди напълно следващите кадри, както можете да видите във видеото по-горе, с визуални проблясъци и липса на яснота в някои области.
Снимка: Unsplash
Виж още: Мистериозен нов организъм, открит в езеро, може да пренапише историята на живота около нас