Троловете са навсякъде в интернет и проблемът досега беше в това правилно да се определи какво представлява обидният език. Както се оказва, дори хората трудно определят злоупотребите от онлайн тролове, но най-новият алгоритъм на Yahoo ще поправи нещата.

Интелигентния софтуер на Yahoo засича 90 процента от коментарите с обиден изказ! Това е ниво на точност, несравнимо с нивото при опити с реални хора.

За целта Yahoo използва комбинация от машинно обучение и краудсорсинг предложения за изграждане на алгоритъм за засичане на обидна реч онлайн. Алгоритъмът не търси за някакви специфични ключови думи. Повечето подобни интелигентни софтуери търсят за специфични думи, които се смятат за обидни, но пък често всъщност са сарказъм.

Софтуерът на Yahoo не търси за специфични думи, а за думи в комбинация с други думи, както и цялостни публикации, пунктуация и други показатели, с което по-точно се определя какво представлява злоупотребата с изказвания онлайн.

Yahoo иска и допълнителни оценки от Mechanical Turk на Amazon, от хора, които не са професионални модератори на коментари.

Алгоритъмът на Yahoo засега не е бил използван извън услугите на компанията, но инженерите са уверени, че това ще бъде голяма крачка напред в областта на обработката на естествен език.

 

Прочетете и това: Държавата, където използването на VPN се наказва със затвор