
От януари 2024 г. насам Wikimedia е отбелязала 50-процентно увеличение на интернет трафика, падащ се на изтегляне на мултимедийно съдържание, съобщи фондацията в актуализирана версия. Но това не е защото човешките читатели изведнъж са развили ненаситен апетит да консумират статии в Wikipedia и да гледат видеоклипове или да изтеглят файлове от Wikimedia Commons. Не, скокът в потреблението идва от ИИ ботове - автоматизирани програми, които изстъргват свободно лицензирани изображения, видеоклипове, статии и други файлове на Wikipedia, за да обучават генеративни модели на изкуствен интелект.
Това внезапно увеличение на трафика от ботове може да забави достъпа до страниците и активите на Wikipedia, особено по време на събития с висок интерес. Например, когато Джими Картър почина през декември, повишеният интерес на хората към видеозаписа от президентския му дебат с Роналд Рейгън доведе до забавяне на зареждането на страниците за някои потребители. Wikipedia е оборудвана да поддържа скокове на трафика от човешки читатели по време на такива събития и потребителите, които са гледали видеото на Картър, не би трябвало да предизвикат проблеми. Но „обемът на трафика, генериран от скреперски ботове, е безпрецедентен и представлява нарастващ риск и разходи“, заявиха от Wikipedia.
От фондацията зад онлайн енциклопедията обясняват, че читателите са склонни да търсят конкретни и често сходни теми. Например много хора търсят едно и също нещо, когато то е в тенденция. Wikimedia създава кеш на част от съдържанието, искано многократно, в центъра за данни, който е най-близо до потребителя, което ѝ позволява да предоставя съдържание по-бързо. Но статиите и съдържанието, които не са били посещавани от известно време, трябва да бъдат обслужвани от основния център за данни, което консумира повече ресурси и следователно струва повече пари на Wikimedia. Тъй като ботовете с изкуствен интелект са склонни да четат масово страници, те имат достъп до слабо посещавани страници, които трябва да бъдат обслужвани от основния център за данни.
Wikimedia заяви, че при по-внимателно вглеждане 65% от отнемащия ресурси трафик, който получава, е от ботове. Това вече причинява постоянни смущения на нейния екип за надеждност на сайта, който трябва да блокира краувърите през цялото време, преди те да забавят значително достъпа до страницата за истинските читатели. Сега истинският проблем е, че „разширяването е станало до голяма степен без достатъчно атрибути, което е от ключово значение за стимулиране на нови потребители да участват в движението“. Фондация, която разчита на даренията на хората, за да продължи да работи, трябва да привлече нови потребители и да ги накара да се грижат за нейната кауза.
„Съдържанието ни е безплатно, но инфраструктурата ни не е“, заявиха от фондацията. Сега тя се стреми да създаде устойчиви начини за достъп на разработчиците и повторните ползватели до нейното съдържание през предстоящата финансова година. Тя трябва да го направи, защото не вижда признаци за скорошно забавяне на трафика, свързан с изкуствения интелект.
Снимка: Unsplash
Виж още: Китай вече може да обърка глобалните комуникации с мощно устройство за рязане на подводни кабели