Последният напредък в големите езикови модели (LLM) направи изкуствения интелект по-приспособим от всякога, но това идва с недостатък: лъжи. Генеративният ИИ има тенденция да измисля нещата, но Google DeepMind разработи нов LLM, който се придържа към математическите истини. FunSearch на компанията може да решава много сложни математически задачи. По чудо решенията, които генерира, не са просто точни; те са изцяло нови решения, които никой човек никога не е намирал.
FunSearch е наречен така, защото търси математически функции, а не защото е забавен. Въпреки че някои хора може да сметнат проблема с набора от капачки за истинска лудост - математиците дори не могат да се споразумеят как най-добре да го решат, което го превръща в истинска числена мистерия. DeepMind преди това постигна напредък в ИИ със своите Alpha модели като AlphaFold (сгъване на протеини), AlphaStar (StarCraft) и AlphaGo (играене на Go). Тези системи не са базирани на LLMs, но разкриват нови математически концепции.
С FunSearch DeepMind започна с голям езиков режим, версия на PaLM 2 на Google, наречена Codey. Тук работи втори LLM слой, който сканира изхода на Codey и изрязва неправилната информация. Екипът, който стои зад тази работа, не знаеше дали този подход ще проработи и все още не са сигурни защо е така, според изследователя на DeepMind Алхусейн Фаузи.
Като начало инженерите на DeepMind създадоха Python представяне на проблема с ограничен набор, но пропуснаха редовете, които описват решението. Работата на Codey беше да добави редове, които точно решават проблема. След това слоят за проверка на грешки оценява решенията на Codey, за да види дали са точни. В математиката на високо ниво уравненията може да имат повече от едно решение, но не всички от тях се считат за еднакво добри. С течение на времето алгоритъмът идентифицира най-добрите решения от Codey и ги връща обратно в модела.
DeepMind остави FunSearch да работи няколко дни достатъчно дълго, за да генерира милиони възможни решения. Това позволи на FunSearch да прецизира кода и да произведе по-добри резултати. Според новопубликуваното изследване алгоритъмът излезе с неизвестно преди това, но правилно решение на проблема с ограниченията. DepMind също пусна FunSearch в друга трудна част от математиката, наречена bin packing - оптимизационен проблем, при който артикули с различни размери трябва да бъдат опаковани в краен брой контейнери или контейнери, всеки с фиксиран капацитет, по начин, който минимизира броя на използваните контейнери. FunSearch намери по-бързо решение от изчислените от хората.
Математиците все още се борят с интегрирането на LLM технологията в своята работа, а работата в DeepMind показва възможен път напред. Екипът вярва, че този подход има потенциал, защото генерира компютърен код, а не решението. Това често е по-лесно за разбиране и проверка от необработените математически резултати.
Снимка: Unsplash
Виж още: 64 GB DDR5 паметта вече е налична за настолни компютри и отваря пътя за 256GB конфигурации