Жена с парализа отново говори чрез AI аватар (ВИДЕО)

HiEnd

26.08.2023

Ан Джонсън прекарва последните 18 години в невъзможност да говори, след като катастрофален инсулт я парализира.

Неотдавна обаче тя успешно проведе разговор със съпруга си, като му каза: "Всичко е възможно", когато той я попита за мнението ѝ относно шансовете на Торонто Блу Джейс за сезона 2023 г. в бейзболната лига на САЩ.

Всичко е възможно, наистина. Думите на Джонсън бяха предадени чрез мозъчен имплант и съобщени чрез аватар на компютърен екран. Революционната установка за изкуствен интелект е разработена от изследователи от Калифорнийския университет в Сан Франциско и Калифорнийския университет в Бъркли, които са изложили забележителните си открития в научното списание Nature.

Върху частта от мозъка, която отговаря за речта и езика, е поставен имплант, който приема мозъчните сигнали. Те бяха директно преведени и изразени от анимирано лице, наподобяващо жената, която сама избра аватара. За да имитира гласа ѝ, екипът обработва аудиозапис от сватбения ѝ тост преди 20 години.

Това е първият случай, в който речта и изражението на лицето са директно синтезирани.

Вместо да облъчват алгоритъма с думи от речника, изследователите го обучават да разпознава фонеми или звукови единици, които са градивни елементи на всички видове думи. "Здравей" на английски например съдържа четири фонеми: "HH", "AH", "L" и "OW", обясняват те в съобщение за пресата.

Технологията може да преобразува мозъчната активност в аудиовълни, които се вербализират чрез екранен герой, който може да се усмихва и да показва емоции. Това беше достоен посредник за Джонсън, майка и бивша учителка и треньорка по волейбол, която често беше описвана като анимиран човек.

Ръководителят на групата, д-р Едуард Чанг, председател на катедрата по неврологична хирургия в Калифорнийския университет в Сан Франциско, казва пред "Таймс", че екипът просто иска да "възстанови хората така, както са били някога".

Учените никога не са възнамерявали да добавят аватар или аудиокомпоненти, но когато технологията надхвърлила очакванията им, решили просто "да го направят", казва Дейвид Моузес, ръководител на проекта. Екипът се обръща към компанията за лицева анимация Speech Graphics, която преобразува мускулните движения на жената в подвижни черти на лицето.

"Не ме карай да се смея", казала Джонсън на съпруга си по време на разговора, разкривайки отново своята жизнерадостна страна.

Колкото и впечатляващо да е всичко това, технологията не е съвършена. Докато средностатистическият разговор се състои от 160 думи в минута, Джонсън е общувала със скорост от 78. Системата също така понякога погрешно декодира речта ѝ.

Засега настройката може да работи само когато имплантът е свързан с компютър. Екипът обаче работи върху безжична версия.