Xiaomi, компанията за потребителска електроника и интелигентно произвеждане на смарт телефони и интелигентен хардуер, свързани с платформата Интернет на нещата (IoT), представи най-новото си приложение с усъвършенствани алгоритми и самостоятелно разработена гласова технология в областта на свързаността. Технологията Text-To-Speech, която е разработена от Xiaomi AI Lab, се използва за генериране на уникален и персонализиран глас за потребители с говорни нарушения.

Тези потребители вече може да комуникират с другите, като използват „собствения си глас“ вместо типичния монотонен електронен глас. Като част от предварителния изследователски проект Own My Voice, ръководен от Техническия комитет на Xiaomi, този успешен опит демонстрира ангажимента на Xiaomi към стратегията Tech for Good и постигането на мисията си „да позволи на всеки в света да се радва на по-добър живот чрез иновативни технологии“.

Защо Xiaomi стартира този проект?

Xiaomi се грижи за хората и се стреми да отговори на техните разнообразни нужди чрез технологични иновации. Компанията откликва на желанието на много потребители с говорни нарушения да притежават свои собствени уникални гласове за ежедневна комуникация и създаде екипа на проекта Own My Voice, за да покани потребители с говорни нарушения да се включат като гласови реципиенти. Джу Си, лидер на тематичния комитет Tech for Good, Xiaomi Corporation, сподели: „Ние сме развълнувани да изследваме множество ценности, които технологичните иновации ни носят, като например да отговорим на изискванията на потребителите за самоличност и изграждане на идентичност“.

Как Xiaomi осъществи проекта?

За да генерира най-подходящия и персонализиран глас за получателя, екипът на проекта набра повече от 200 доброволци в Xiaomi да „дарят“ гласовете си. Те използваха алгоритъма за съпоставяне на гласови отпечатъци, за да съпоставят характеристиките на дарените гласове на доброволците с тези на гласа на получателя. Чрез този подход те намериха най-подходящия глас като основен звук за гласова справка за получателя. С оглед на персонализирането и защитата на поверителността избраният реален глас беше манипулиран със сложна акустична модификация, за да се образува нов и оригинален звук на гласа.

След това те използваха технологията Text-To-Speech в спонтанен стил, за да тренират модела на AI, което кара този нов глас постепенно да придобие естествен ритъм и интонация, които могат да изразят истински емоцията и тона на човека.

Проектът Own My Voice съчетава разнообразие от най-модерни алгоритми със самостоятелно разработената технология за реч на Xiaomi, за да гарантира специфичността, безопасността и високата автентичност на синтезирания глас, създавайки нов модел на персонализиран синтез на реч за потребители с говорни нарушения.

Какво е значението на проекта?

В основата на този проект е група от експерти по говорни технологии от Xiaomi AI Lab. От 2017 г. те са публикували 37 доклада за речта в сборници на водещи международни конференции като Международната конференция по акустика, говор и обработка на сигнали (ICASSP). Успехът на Own My Voice зависи основно от технологията Text-To-Speech, разработена от тях. Тя превръща синтезирания глас в такъв като на истински човек по своята интонация, пауза, скорост и други характеристики. Това заменя монотонното и нетипично усещане на електронния глас с по-естествено звучене. В момента тази технология се прилага за много интелигентни устройства, оборудвани с Xiaoai, AI гласовия асистент на Xiaomi. Проектът Own My Voice демонстрира, че технологията Text-To-Speech със спонтанен стил също може да бъде широко възприета от гледна точка на достъпност и да подобри потребителското изживяване.

Джу Си добави: „Ако забележим и обърнем внимание на нуждите на малцинствените групи на ранен етап, процесът на разпространение на технологии може да бъде значително съкратен. Това позволява ползите от новите технологии да станат достъпни за потребители със специални нужди без забавяне.

Занапред Xiaomi ще продължи да получава обратна връзка от гласовия получател и ще проучи допълнително осъществимостта на този проект в по-широк диапазон. Xiaomi ще продължи да дава възможност за достъпност чрез изключителни технологии, като се стреми да задоволи разнообразните нужди на хората чрез технологични иновации.

Снимки: Xiaomi