Дресьорите на кучета вече могат да се присъединят към списъка с професионалисти, чиито работни места са застрашени от изкуствения интелект (ИИ), тъй като той може би току-що навлезе в света на комуникацията с животни. Използвайки софтуер за машинно обучение, изследователите успяха успешно да разкодират значението на кучешките вокали, проправяйки пътя за нови технологии, които могат да ни помогнат да разберем по-добре нашите четириноги спътници.
Авторите на изследването, което все още не е рецензирано от специалисти, записват лаенето, ръмженето, воя и хленченето на 74 домашни кучета, които са изложени на различни сценарии, предназначени да предизвикат определени реакции. Те включват всичко - от игра с любимите им играчки до наблюдаване на изследователи, които се преструват, че нападат собствениците на кучетата.
Въз основа на тези записи авторите на изследването идентифицират 14 различни вида кучешка вокализация, като например „позитивни писъци“ по време на игра, „лай на тъга/тревога“ и „много агресивен лай на непознат“. Моделът на изкуствения интелект, наречен Wav2Vec2, който първоначално е бил предназначен за разпознаване на човешка реч, е бил обучен на тези звуци от кучета, след което е бил подложен на редица предизвикателства.
Първият от тях включваше избиране на отделни кучета въз основа на техните вокални сигнали. Колкото и да е забавно, когато изкуственият интелект е бил предварително обучен на човешка реч, преди да се запознае с говора на кучетата, той е успял да идентифицира успешно конкретни кучета в 50% от опитите, докато моделите, обучени само на кучешки звуци, са постигнали 24% успеваемост.
Това е доста важно, тъй като предполага, че познаването на човешката реч може да помогне на ИИ да се справи със сложността на нечовешката комуникация, което означава, че не е необходимо да започваме от нулата, когато става въпрос за създаване на модел за общуване с животни.
„Резултатите ни показват, че звуците и моделите, получени от човешката реч, могат да послужат като основа за анализиране и разбиране на акустичните модели на други звуци, като например вокализациите на животните“, обяснява авторът на изследването Рада Михалчеа в изявление.
За следващия си трик моделът успя да направи разлика между различните породи кучета с различна степен на успех. Повече от половината от кучетата в проучването са били чихуахуа и софтуерът е успял да идентифицира правилно тези кучета по лая им в около 75% от случаите.
Накрая моделът трябваше да интерпретира значението на вокализациите на животните, като ги съпостави с един от 14-те вида кучешки звуци, изброени от изследователите. При предварително обучение върху човешка реч изкуственият интелект постигнал успеваемост от 62.2%, въпреки че някои категории звуци били по-лесни за дешифриране от други.
Например моделът е успял да идентифицира правилно 90.7% от отрицателните хъркания, но само 45.26% от отрицателните писъци.
„Има толкова много неща, които все още не знаем за животните, които споделят този свят с нас. Напредъкът в областта на изкуствения интелект може да се използва за революционно разбиране на комуникацията на животните, а нашите открития показват, че може би няма да се наложи да започваме от нулата“, казва Михалчеа.
„Като използваме модели за обработка на реч, първоначално обучени на човешка реч, нашето изследване отваря нов прозорец към това как можем да използваме изграденото досега в областта на обработката на реч, за да започнем да разбираме нюансите на кучешкия лай“, каза тя.
Снимка: Unsplash