Въпреки че Microsoft и Google доминират в заглавията, свързани с изкуствен интелект, много други компании също бързат да разработят продукти с ИИ, включително Meta. За тази цел гигантът в областта на социалните медии току-що представи първия си опит в тази област.
Този уикенд Meta разкри в публикация в блога си, че работи върху инструмент за генериращ изкуствен интелект за реч. Наречен Voicebox, фирмата твърди, че нейният инструмент може да изпълнява различни задачи за генериране на реч, "за които не е бил специално обучен чрез обучение в контекста".
Според Meta някои от тези задачи включват синтез на текст в реч в контекста, редактиране на реч, намаляване на шума, прехвърляне на стилове между езици и разнообразни речеви проби. Ето как компанията описва тези функции:
Синтез на текст в контекст: Използва аудио образци с дължина до две секунди, за да съответства на аудио стила и да се използва за генериране на текст в реч.
Редактиране на речта и намаляване на шума: Инструментът може да пресъздаде част от речта, която е била прекъсната от шум, или да замени неправилно изречени думи, без да се налага да се записва отново.
Прехвърляне на стилове на различни езици: Инструментът може да вземе извадка от реч и откъс от текст, за да създаде прочит на текста на английски, френски, немски, испански, полски или португалски език.
Вземане на разнообразни проби от речта: Използва разнообразни данни, за да генерира реч, която е по-представителна за начина, по който хората говорят на шестте езика, споменати по-горе.
Организацията заявява, че Voicebox е част от нейните изследвания върху генеративния изкуствен интелект. Що се отнася до нейната полезност, Meta заявява:
"В бъдеще многофункционални генеративни модели на изкуствен интелект като Voicebox ще могат да придават естествено звучащи гласове на виртуални асистенти и неигрови персонажи в метавселената. Те биха могли да позволят на хората с увредено зрение да чуват писмени съобщения от приятели, прочетени от ИИ с техните гласове, да предоставят на създателите нови инструменти за лесно създаване и редактиране на аудио записи за видеоклипове и много други."
Ако искате да видите пример за Voicebox, можете да отидете в блога на Meta и да гледате публикувания там видеоклип.
Снимка: Unsplash
Виж още: Генеративният изкуствен интелект може да замени 300 милиона работни места