Генериращите системи за изкуствен интелект се обучават, като им се позволява да сърфират в интернет и да извличат съдържание. Apple позволява на издателите да се откажат от това и в нов доклад се казва, че много от най-големите уебсайтове специално са се отказали от обучението на Apple Intelligence.
Това включва както Facebook и Instagram, така и много известни новинарски и медийни сайтове като The New York Times и The Atlantic.
Големите езикови модели като ChatGPT се обучават, като им се предоставя достъп до милиони думи от изходния материал - от новинарски истории до коментари на потребители. В случая на Apple компанията от години използва Applebot за обучение на Siri и за изготвяне на предложения за Spotlight. Отскоро компанията използва Applebot и за обучение на Apple Intelligence.
Практиката е спорна, тъй като изкуственият интелект на практика използва материали, защитени с авторски права, за да създава свои собствени версии. За по-нишови теми, където изходният материал е оскъден, дори е установено, че те пресъздават цели параграфи без почти никакви промени.
Но Apple прави това по етичен начин, като позволява на издателите да се откажат и проверява личните данни. Компанията използва етикет Applebot-Extended, за да позволи на сайтовете да се откажат от обучението с изкуствен интелект, като същевременно разрешат индексиране при търсене, което означава, че техните произведения все още могат да бъдат включени в търсенията в Spotlight и Siri.
Тъй като отказът се извършва с помощта на публично достъпен файл robots.txt, е лесно да се види кои сайтове са направили това. Сайтът Wired провери редица от най-големите сайтове за новини и социални медии. Сред многото организации, избрали да изключат данните си от обучението по изкуствен интелект на Apple, са Facebook, Instagram, Craigslist, Tumblr, The New York Times, The Financial Times, The Atlantic, Vox Media, мрежата USA Today и компанията майка на WIRED - Condé Nast.
Applebot-Extended е сравнително нов етикет, така че е вероятно повече уебсайтове също да се откажат от него, след като се повиши осведомеността по темата.
Смята се, че Apple е сключила сделки с някои медийни компании, като е платила такса в замяна на правото да използва тяхното съдържание за обучение. Вероятно това е мотивът на поне някои сайтове, които в момента блокират Apple - изчакват конкретно предложение за плащане.
Снимка: Unsplash
Виж още: ChatGPT и GPT-4 могат да получат сладък ъпгрейд тази есен за подобрени математически функции