Изкуственият интелект се очертава като тенденцията на 2023 година. Вече видяхме възможностите му по отношение изображенията, видеата и създаването на текстове, а сега е ред на гласовете.
Идеята не е особено нова - и преди сме виждали технологията да пресъздава гласове на музиканти и актьори, които са ни напуснали. Но трябва да признаем, че за първи път възможността се доближава до това да се отвори широко за обществото. Според нов слух Microsoft работи върху AI, който може да имитира гласа на всеки, след като му бъде подаден кратък трисекунден образец.
Новият инструмент, наречен (почти иронично) VALL-E, е обучен чрез приблизително 60 000 часа гласови данни на английски език, които според Microsoft са „стотици пъти по-големи от съществуващите системи“. Използвайки това знание, неговите създатели твърдят, че се нуждае само от семпъл, за да разбере как да възпроизведе гласа на даден потребител. Още по-впечатляващо е, че VALL-E може да възпроизвежда емоциите, тоналностите и акустичната среда, намиращи се във всяка проба - нещо, с което други гласови AI програми са се затруднявали. Това му придава по-реалистична аура и доближава резултатите му до истинската човешка реч. Microsoft демонстрира възможностите на VALL-E в GitHub: малката библиотека от проби, създадени с помощта на инструмента, е впечатляваща. Някои от примерите са по-малко убедителни, което показва, че VALL-E вероятно не е завършен продукт, но като цяло резултатът е убедителен.
В документ, представящ VALL-E, Microsoft обяснява, че технологията „може да носи потенциални рискове при злоупотреба с модела, като подправяне на гласова идентификация или представяне на конкретен човек“. За да смекчи тази заплаха, Microsoft казва, че „е възможно да се изгради модел за откриване, за да се разграничи дали аудио клипът е бил синтезиран от VALL-E“. Компанията споделя, че в процеса ще използва и собствените си принципи на AI. Това включва справедливост, безопасност, поверителност и отчетност. Въпреки очевидните рискове инструменти като VALL-E могат да бъдат особено полезни в медицината например, за да помогнат на хората да възвърнат гласа си след инцидент. Възможностите наистина са неограничени, а според запознати това е само началото.
VALL-E е поредният пример за експериментите на Microsoft с AI. Напоследък компанията работи върху интегрирането на ChatGPT в Bing, използвайки AI за обобщаване на срещите ви в Teams и вграждане на разширени инструменти в приложения като Outlook, Word и PowerPoint. Според Semafor Microsoft иска да инвестира 10 милиарда долара в производителя на ChatGPT OpenAI - компания, в която вече е инвестирала значителни средства.
Снимки: Unsplash
Виж още: Първият в света робот адвокат ще защитава човек в съда