В разобличаващ доклад на 404 Media се твърди, че софтуерът за генериране на видеоклипове Jupiter, базиран на изкуствен интелект, е използвал широка база данни от видеоклипове от YouTube и други източници, за да обучи своя модел.
Jupiter се управлява от Runway AI, Inc., стартъп на стойност 1.5 млрд. долара с финансиране от някои от най-големите имена в индустрията, като Google и NVIDIA. Данните, събрани от 404, включват електронна таблица, в която са изброени каналите в YouTube на някои от най-големите медийни групи и създатели на съдържание в света, както и уебсайтове, които хостват пиратско съдържание, и връзки, които насочват към конкретни видеоклипове.
Анонимен източник е заявил пред изданието, че таблицата е част от „общофирмено“ усилие за изстъргване на съдържание от интернет, а докладът е последният от поредица спорове, свързани с фирми, които използват данни на създателите на съдържание за обучението на своите модели, без да плащат никакви такси.
Според данните предполагаемата таблица съдържа връзки към каналите в YouTube на Netflix, Disney, Sony, Pixar, Vice News и други известни имена от медийната индустрия. Тя се фокусира и върху създатели на съдържание като популярния блогър на видеоклипове на Apple Маркес Браунли и лайфстайл влогъра Кейси Нейстат.
Заедно с електронната таблица 404 Media се свърза и с източник, който твърди, че е работил в Runway. Въпреки че самоличността на това лице е поверителна, то предоставя ключови подробности за това как фирмата е използвала таблицата вътрешно, за да обучава своите модели за генериране на видеоклипове с изкуствен интелект.
Според него Runway е използвала електронната таблица, за да захранва софтуер с отворен код, който е скрапвал съдържание от YouTube. Заедно с каналите листът е съдържал и връзки към конкретни видеоклипове като част от „усилията на цялата компания да намери видеоклипове с добро качество, с които да изгради модела“.
Runway не отговори на исканията на 404 за коментар, а Google пренасочи публикацията към изявленията си от по-рано тази година, когато през април коментира, че генераторът на видеоклипове Sora на OpenAI, който използва видеоклипове от YouTube за обучение на своя модел, нарушава правилата на YouTube.
Според източника се твърди, че Runway също така е възложила на служителите си да отсяват видеоклипове чрез ключови думи, които се фокусират върху конкретни видове съдържание. Видеоклиповете също така са били разделени според тематиката, като някои примери са късометражни анимационни филми и студентски филми. Извличането на данни не се е ограничавало само до YouTube; сайтовете, в които се разпространява пиратско съдържание, също са били обект на атаки.
Jupiter е вътрешното кодово име на модела Gen-3 на Runway, а тестовите подкани 404 за Gen-3 генерират съдържание, подобно на видеоклиповете, за които се твърди, че са били изстъргани от YouTube. Изданието добавя, че моделът е спрял да генерира тези видеоклипове, след като се е свързало с Runway за коментар.
Runway е една от най-популярните фирми за генериране на ИИ видео. Последният кръг на финансиране беше през юни миналата година, което доведе оценката на фирмата до 1.5 млрд. долара.
Снимка: Unsplash
Виж още: Новите саундбар системи на Samsung – малки габарити, но мощен звук