На изложението SIGGRAPH 2024 NVIDIA представи и разшири визията си за бъдещето на дигиталните хора, като представи най-новия си напредък в областта на ИИ - добавяйки към идеята за взаимодействие с асистент с ИИ реалистично изглеждащо човешко лице (и глас) с емоции и детайлна анимация. Това е огромен скок напред в сравнение с обичайния текстов интерфейс за чатботове и асистенти с изкуствен интелект и е осъществено с помощта на най-новите технологии RTX.

"Джеймс" е създаден с помощта на подобна технология NVIDIA ACE, с която се запознахме на Computex 2024 като част от демонстрация на интерактивна игра, в която си взаимодействате с цифрови хора в реално време, за да разрешите загадка. Този път обаче тя се използва в контекста на виртуален асистент или агент за обслужване на клиенти.

"Джеймс" също е изграден на базата на NVIDIA NIM microservices; Дженсън Хуанг обяснява как работи и потвърждава, че визуалният RTX On фронт енд може да се свърже със съществуващи ИИ чатботове като ChatGPT.

"ИИ, който може да говори, да осъществява зрителен контакт с вас и да анимира по емпатичен начин", обяснява Дженсън Хуанг. "Можете да решите да свържете своя ChatGPT с дигиталния човек или да свържете дигиталния си човек с нашия ИИ за обслужване на клиенти Retrieval Augmented Generation (RAG). Независимо от това коя част бихте искали да използвате, те са с напълно отворен код."

"Създадената от нас технология за дигитално рендиране на хора за изобразяване на красиви лица, които изискват подповърхностно разсейване с проследяване на пътя, е наистина невероятна", продължава Дженсън Хуанг. Разговаряте с изкуствения интелект; той генерира текст. Този текст се преобразува в звук, текст в реч, и тази реч е звукът, който анимира лицето. След това RTX трасирането на пътя се справя с рендирането на цифровия човек. Всичко това е на разположение на разработчиците за използване, а вие бихте могли да решите кои части бихте искали да използвате".

Тъй като технологията е с отворен код и е разделена на различни компоненти, като например технологията Audio2Face на NVIDIA, която обработва всички анимации за речта, разработчиците могат да избират какво да използват. Така изглежда, че е само въпрос на време преди взаимодействието с чатботове с изкуствен интелект в различни платформи да започне да включва реалистични цифрови хора.

Снимка: Unsplash/NVIDIA

Виж още: Microsoft най-сетне обясни първопричината за срива на CrowdStrike