Главният изпълнителен директор на Tesla/X Илон Мъск изглежда вярва, че обучението на модели с изкуствен интелект само с данни, създадени от хора, става невъзможно. Мъск твърди, че все повече липсват данни от реалния свят, с които да се обучават моделите на ИИ, включително неговият чатбот Grok AI.
„Вече сме изчерпали по същество кумулативната сума на човешкото знание в обучението на ИИ“, каза Мъск по време на интервю на живо в X, проведено от председателя на маркетинговата компания Stagwell Марк Пен. „Това се случи основно миналата година.“
Коментарите на Мъск отразяват тези на бившия изследовател на OpenAI Иля Суцкевер, който през декември миналата година прогнозира, че индустрията на изкуствения интелект е достигнала „пика на данните“. Решението на Мъск на този проблем - синтетични данни - също отразява по-голямата индустрия. Google, OpenAI, Anthropic и Meta вече използват т.нар. синтетични данни, за да обучават своите модели.
„Единственият начин да допълним данните от реалния свят е със синтетични данни, при които изкуственият интелект създава данни за обучение“, каза Мъск. „Със синтетични данни ИИ ще се самооценява и ще премине през този процес на самообучение.“
Макар че използването на синтетични данни може да предложи значителни икономии на разходите на компаниите, някои проучвания показват, че прекомерното разчитане на синтетични данни може да доведе до срив на модела, при който отговорите на ИИ стават по-малко креативни и по-пристрастни с течение на времето, тъй като те се обучават многократно върху рекурсивно генерирани данни.
Липсата на данни, получени от хора, не попречи на X да обособи функцията си Grok AI в собствено приложение за iOS в четвъртък. Чатботът и генераторът на изображения, които се отличават с пълната си липса на защита на интелектуалната собственост или съдържанието, бяха достъпни само за хората, които плащаха по 8 долара на месец за платен акаунт в X. Новото приложение обаче може да се изтегли безплатно от всеки.
Снимка: Unsplash