
Можете да решавате един проблем, като изсипвате пари в него - но само до време. Това е приблизително позицията на изследователите на изкуствения интелект в едно скорошно проучване. Запитани дали „увеличаването на мащаба“ на настоящите подходи към ИИ може да доведе до постигане на изкуствен общ интелект (ИОИ) или ИИ с общо предназначение, който да се равнява или да надминава човешкото познание, преобладаващата част от анкетираните отговарят, че това е „малко вероятно“ или „много малко вероятно“ да успее.
Публикуваните в нов доклад резултати от проучването, в което са участвали 475 изследователи на изкуствения интелект и което е проведено от учени от Асоциацията за развитие на изкуствения интелект, са категоричен отпор на отдавна предпочитания от технологичната индустрия метод за постигане на напредък в областта на изкуствения интелект - чрез снабдяване на генеративните модели и центровете за данни, които се използват за тяхното обучение и работа, с повече хардуер. Като се има предвид, че всички разработчици на ИИ твърдят, че това е крайната им цел, може да се каже, че мащабирането се разглежда като задънена улица.
„Огромните инвестиции в мащабиране, които не бяха придружени от сравними усилия да се разбере какво се случва, винаги са ми се стрували неуместни“, казва пред NewScientist Стюарт Ръсел, компютърен учен от Калифорнийския университет в Бъркли, който е помогнал за изготвянето на доклада. „Мисля, че преди около една година за всички започна да става ясно, че ползите от мащабирането в традиционния смисъл на думата са се изчерпали.“
В надпреварата за изкуствения интелект се хвърлят колосални суми пари. Инвестициите в генеративен изкуствен интелект са достигнали над 56 млрд. долара само под формата на финансиране с рисков капитал през 2024 г. Голяма част от тези средства се изразходват за изграждане или управление на огромни центрове за данни, които изискват генеративните модели. Microsoft например се ангажира да похарчи 80 млрд. долара за ИИ инфраструктура през 2025 г.
От това следва, че търсенето на енергия е също толкова зашеметяващо високо. Microsoft подписа сделка за активиране на цяла ядрена електроцентрала само за да захранва своите центрове за данни, като нейните конкуренти Google и Amazon също подготвят забележителни сделки за ядрена енергия.
Предпоставката, че изкуственият интелект може да бъде подобрен безкрайно чрез мащабиране, винаги е била на нестабилна основа. Пример за това е неотдавнашната екзистенциална криза в технологичния сектор, ускорена от китайския стартъп DeepSeek, чийто ИИ модел може да се конкурира с водещите на Запад многомилиардни чатботове срещу уж малка част от разходите за обучение и мощност.
Разбира се, скептицизмът съществуваше и преди това. През ноември миналата година докладите показваха, че изследователите на OpenAI са открили, че предстоящата версия на големия езиков модел на GPT показва значително по-малко подобрение, а в някои случаи изобщо няма подобрения в сравнение с предишните версии спрямо своите предшественици.
През декември главният изпълнителен директор на Google Сундар Пичай каза официално, че лесните печалби от ИИ са „свършили“ - но уверено заяви, че няма причина индустрията да не може „просто да продължи да се увеличава“.
Проучват се по-евтини и по-ефективни подходи. OpenAI използва метод, известен като изчисление на тестово време с най-новите си модели, при който AI прекарва повече време, за да „мисли“, преди да избере най-обещаващото решение. Това постигна повишаване на производителността, което иначе би отнело планини от мащабиране, за да се възпроизведе, твърдят изследователите.
Този подход обаче е малко вероятно да бъде универсално решение, казва Арвинд Нараянан, компютърен учен от Принстънския университет, пред NewScientist.
Междувременно DeepSeek въведе подход, наречен „смес от експерти“, който използва множество невронни мрежи, всяка специализирана в различни области - въпросните „експерти“, - за да помогне да се измислят решения, вместо да се разчита на един „генерален“ модел.
Независимо от това, ако ангажиментът на Microsoft да похарчи десетки милиарди долари за центрове за данни е някаква индикация, „мащабирането с груба сила“ все още ще бъде предпочитаният начин на работа за титаните в индустрията - докато ще бъде оставено на по-скромните стартиращи фирми да търсят начини да направят повече с по-малко.
Снимка: Unsplash
Виж още: Sugar 1 е портативна конзола с два екрана и въртящи се контролери, които ѝ придават визия на робот