Според ново съобщение с последната актуализация на политиката за поверителност на Google компанията ще може свободно да издирва в мрежата всякакво съдържание, което може да бъде от полза за изграждането и подобряването на инструментите ѝ за изкуствен интелект. 
"Google използва информацията, за да подобрява нашите услуги и да разработва нови продукти, функции и технологии, които са от полза за нашите потребители и обществото", се казва в новата политика на Google. "Например ние използваме публично достъпна информация, за да помогнем за обучението на моделите на Google за изкуствен интелект и за изграждането на продукти и функции като Google Translate, Bard и възможностите на Cloud AI." 
Gizmodo отбелязва, че политиката е актуализирана, за да може вече да се нарича "модели на изкуствен интелект", докато преди това е бил използван терминът "езикови модели". Освен това в политиката са добавени Bard и Cloud AI, докато преди това се споменаваше само Google Translate, за който се събират данни. 
Изглежда, че гореспоменатата формулировка описва по един или друг начин не само тези, които са в екосистемата на Google, но е подробно описана по такъв начин, че марката може да има достъп до информация от всяка част на мрежата. 
Основните проблеми, свързани с масовото развитие на изкуствения интелект, са въпросите за неприкосновеността на личния живот, плагиатството и дали ИИ може да разпространява вярна информация. Ранните версии на чатботовете като ChatGPT се основават на големи езикови модели (LLM), които използват като данни за обучение вече публични източници като например общия уеб архив за обхождане, WebText2, Books1, Books2 и Wikipedia. 
Ранният ChatGPT стана печално известен с това, че зацикляше на информация отвъд 2021 г. и впоследствие попълваше отговорите с фалшиви данни. Това вероятно би могло да бъде една от причините Google да иска неограничен достъп до уеб данни, от които да се възползват инструменти като Bard, за да разполагат с реални данни и потенциално с обучение в реално време за своите модели на ИИ. 


Gizmodo отбеляза също, че Google може да използва тази нова политика, за да събира старо, но все още генерирано от хора съдържание, като например отдавна забравени ревюта или публикации в блогове, за да има представа как се разработват и разпространяват човешкият текст и реч. Все още не е ясно как точно Google ще използва събраните данни. 
Няколко социални медийни платформи, включително Twitter и Reddit, които са основни източници на актуална информация, вече ограничиха публичния си достъп след популярността на AI чатботовете, за съжаление на целите си общности. 
И двете платформи затвориха свободния достъп до своите API, което ограничава потребителите да изтеглят огромни количества публикации за споделяне на други места под предлог за защита на интелектуалната им собственост. За сметка на това бяха разбити много от инструментите на трети страни, благодарение на които Twitter и Reddit работят безпроблемно. 
Както Twitter, така и Reddit трябваше да се справят с други неуспехи и противоречия, тъй като опасенията на собствениците им за завладяване на изкуствения интелект се засилват.

Снимки: Unsplash

Виж още: Вече ползват ChatGPT и Google Bard за генериране на частично работещи ключове за Windows 10 и 11