Генериращият изкуствен интелект се смята за технологичната еволюция, която ще ни пренесе в нова ера. Всеки, който използва чатбот като ChatGPT или Google Bard, може да се съгласи, но никоя нова технология не е лишена от яростни противници. Войната между чатботовете с изкуствен интелект като ChatGPT и сайтовете, които те претърсват, не е нещо, което се чува по време на конференциите или се вижда в публикациите в блоговете. Въпреки това надпреварата се случва и става все по-интензивна.

Огромното мнозинство от хората, които използват чатботове, всъщност не знаят какво ги захранва. Чатботовете са огромни резервоари на информация, които могат да засрамят всеки набор от енциклопедии. Е, откъде мислите, че черпят информацията си? Просто казано, те черпят информация от интернет - от любимите ви уебсайтове.

Това не е насаждане на страх, но ако не знаете за събирането на големи масиви данни, е време да разберете. Чатботовете притежават океан от информация за почти всичко, но тази информация трябва да съществува някъде; те не създават информацията от въздуха (с изключение на халюцинациите). Те получават огромните си знания от информация, събрана от цялата мрежа.

Компаниите за изкуствен интелект използват софтуер, наречен crawlers, който посещава различни уебсайтове и събира данни от тях. Те правят копия на информацията от сайтовете и ги вкарват в своите LLM (големи езикови модели), които захранват чатботовете. А сега си представете колко много информация могат те да да съберат, които имат за своя площадка целия интернет. Ето защо ChatGPT има отговор за почти всичко, което въведете в него.

В случай че се чудите, да, това включва информация, която вие създавате.  Дори и да не сте писател, все пак неволно допринасяте за чатботовете. Най-вероятно вашите туитове, постове във Facebook и други публикации в социалните мрежи са били преровени, за да се обучи чатбот.

На пръв поглед изглежда, че повечето предприятия приемат генеративния ИИ. Те са за предлагане на услуги с ИИ, но въпросът е: как се чувстват, когато данните им се извличат? Всъщност много от най-големите сайтове в интернет не се чувстват добре от това. Всъщност те са се постарали да блокират ползването на техните сайтове от чатботове. Това разкрива доклад на Originality.AI.

На 7 август OpenAI разкри начин, по който компаниите могат да блокират ползвания от нея GTPBot да събира данни от техните уебсайтове. Само след две седмици 69 от първите 1000 уебсайта (около 7%) го блокираха. Бързо напред до 17 септември и този брой се увеличи повече от два пъти. Около 25.9% от първите 1000 уебсайта избраха да блокират GPTBot. Общо 242 от водещите сайтове в света блокират обхождащите програми.

Не бива да забравяте, че тези цифри се отнасят само за първите 1000 сайта. Броят на уебсайтовете като цяло, които блокират обхождащите устройства, е много МНОГО по-голям! Като погледнете графиката по-горе, можете да видите, че броят им непрекъснато се увеличава. Все повече сайтове се борят срещу ChatGPT, като блокират неговия обхождащ модул.

Този списък включва сайтове като Amazon, Pinterest, Quora, Tumblr, Indeed, Dictionary.com, Shutterstock, WikiHow и т.н. Също така не е изненада, че голям брой сайтове на новинарски медии също воюват срещу чатботовете с изкуствен интелект. Сред тях са CNN, The NY Times, The Verge, Reuters, CNBC News, Insider, The Washington Post, Wired, Polygon и много други.

Всички автори за медийни сайтове доста се страхуват за работата си. Чатботовете имат способността да генерират цяла статия за времето, необходимо за прочитане на едно заглавие. Тази технология има потенциала да лиши от работа много журналисти. Ето защо медийните сайтове се противопоставят категорично на използването на чатботове.

Освен това няколко утвърдени новинарски сайта са публикували новаторски журналистически материали през годините. Тези материали са защитени с авторски права и се смятат за върхови постижения на публикациите. На тези сайтове не им е приятно, че ботовете могат да извличат информация от въпросните статии.

Когато ChatGPT стартира за първи път, имаше само един чатбот, за който да се притеснявате. Въпреки това, откакто технологията се разрасна, все повече компании се стремят да извличат данни от уебсайтове. Така че е очевидно, че преходът към новата ера на изкуствения интелект не е плавен. Зад завесите се разиграва истинската драма. Води се война между ИИ и сайтовете, от които той се учи. Това е вид бъдеще, което не бихме могли да избегнем с начина, по който работи генеративният ИИ.

Снимка: Unsplash

Виж още: Американският съд отказа да дава патенти за изобретения на AI