Според Apple, Google и Microsoft гласовите асистенти са бъдещето на интеракцията ни с компютрите като цяло. Те ще заместят мишката, клавиатурата, сензорните дисплеи и дори ще мислят вместо вас, но за съжаление Siri, Google Now и компания все още трябва да извървят дълъг път, преди да станат пълноценни заместители на основните парадигми, а не просто техни допълнения.

 

Гласовото разпознаване

Речевият анализ става все по-точен и гъвкав с всеки изминал ден. Най-добрият пример за това определено е разпознаването на глас на Google, което засрамва всички останали комерсиално достъпни глас към текст системи.

Ако притежавате смартфон или таблет с Android или използвате Google Search приложението за iOS, няма как да не сте забелязали колко добре се справят алгоритмите на Google дори със силен балкански акцент. Въпреки това гласовото разпознаване все още не е достигнало нивото, при което комуникацията със софтуера е напълно спокойна.

Чувството на леко напрежение, породено от очакването за неразбиране или грешна интерпретация на казаното (не, не става въпрос за половинката ви) присъства почти винаги, особено ако английският не ви е роден език. Системите за глас към текст на Apple и Microsoft са доста по-слаби, но също се развиват бързо. Проблемът с неточния речеви анализ обаче не се наблюдава единствено извън английскоговорещите общества.

Бързо търсене в YouTube е достатъчно, за да демонстрира, че перфектно кокни или класически южняшки американски акцент също са проблем за Siri например. Гласовите алгоритми все още търсят "чистия" език, който се говори единствено от… тях.

 

Не разбирам метафори

 

Никога не съм искал да науча Siri или Google Now на сложни метафори, но понякога крайният буквализъм на гласовите асистенти ме фрустрира. Разбира се, отдавна не живеем в епоха, в която трябва да записваме гласовите си команди предварително или да помним конкретни изрази, но ситуацията все още се различава от маркетинг визията на Apple и Google.

Никога не съм сигурен дали търсенето ми ще доведе до директни резултати, или просто ще отвори браузъра, а какво остава за по-свободен изказ, който всъщност е напълно естествен, стига да не сте робот. В същото време компаниите успяват да намерят време да внедрят няколко "забавни" шеги — решение, което никога няма да проумея.

Статията продължава на следващата страница.

Докосни ме

 

Moto X и Nexus 5 решават един от първичните проблеми на гласовите асистенти, но за съжаление директната гласова асистенция все още е твърде рядко срещана. Още по-добра нейна реализация откриваме в новото поколение Kinect, който идва с всеки Xbox One.

Най-често използваме гласовите асистенти за бързи въпроси или команди, при това когато ръцете ни са заети. Именно затова нуждата от натискане или задържане на бутон прави цялото начинание с една идея по-сложно, отколкото би трябвало да бъде.

Какъв е смисълът да продължа да говоря на смартфона си, ако вече съм отишъл до него, изчистил съм ръцете си и мога просто да го отключа и да прочета точното количество мащерка в рецептата, която и без това съм отворил?

 

Работя за себе си

 

Google Now и Siri са системни елементи на Android и iOS, но интеграцията с приложенията от трети страни липсва. Колкото и удобно да е да настроиш будилника или да конвертираш мерни единици, понякога бих искал да мога да управлявам с глас софтуер, който не идва от Apple или Google.

Siri например може да прочете последните туитове от потока ми, но без да комуникира с любимия ми Twitter клиент, което често обезсмисля задачата. Siri и Google Now все още са изолирани среди, които остават безполезни в много случаи. Все пак не бива да сме крайно осъдителни към Apple, Google и Microsoft. Внедряването на гласови възможности в рамка, която да работи с приложения от трети страни, е невъобразимо трудна задача особено ако искаме тя да бъде реализирана както трябва.

 

Това ли е бъдещето?

 

За пореден път отказвам да бъда пророк, а просто споделям своето мнение. Колкото и активно Google и Apple да се опитват да ни убедят, че гласовите асистенти са най-гениалното изобретение след нарязания хляб, вярвам, че те никога няма да бъдат повече от приятен бонус към основния метод за комуникация, без значение какъв е той в бъдеще.

Причината е елементарна: разговорите с устройства винаги ще изглеждат нелепо на публични места. Не става въпрос за затрудненото от околния шум "чуване", което се компенсира все по-добре от развиващите се технологии за потискане, а за социалния аспект на разговора със смартфон.

Виждали ли сте човек, който да говори на смартфона си по улицата? Тази гледка в България е рядкост, но бързо посещение в САЩ например ще ви изправи пред странна ситуация. Само за няколко дни в Манхатън, Ню Йорк, забелязах над десет души, които разговаряха със Siri, един от тях в метрото. Манталитетът на съгражданите му повеляваше те да не обърнат внимание, но очевидно продължителният му разговор с виртуалната дама бе неприятен за околните.

 

Какво е вашето мнение за бъдещето на гласовите асистенти?

Тагове: