Индустрията на изкуствения интелект има нова модна дума: „ИИ на докторско ниво (PhD)“. Според доклад на The Information OpenAI може би планира да пусне няколко специализирани продукта за ИИ агенти, включително месечно ниво от 20 000 долара, насочено към подпомагане на „изследвания на ниво доктор“. Други планирани агенти, за които се съобщава, включват асистент за „работещи с високи доходи“ на цена от 2000 долара месечно и агент за разработчици на софтуер на цена от 10 000 долара месечно.

От OpenAI все още не са потвърдили тези цени, но и преди са споменавали за възможности за изкуствен интелект на ниво докторска степен. И така, какво точно представлява „ИИ на ниво доктор“?

Терминът се отнася до модели, за които се предполага, че изпълняват задачи, изискващи експертни познания на докторско ниво. Те включват агенти, които провеждат напреднали изследвания, пишат и отстраняват грешки в сложен код без човешка намеса и анализират големи масиви от данни, за да генерират изчерпателни доклади. Основното твърдение е, че тези модели могат да се справят с проблеми, които обикновено изискват години специализирано академично обучение.

Компании като OpenAI основават претенциите си за „докторско ниво“ на резултати в конкретни сравнителни тестове. Например моделите от серията o1 на OpenAI се представят добре в тестове по природни науки, кодиране и математика, като резултатите им са сходни с тези на човешки докторанти при решаването на трудни задачи. Инструментът Deep Research на компанията, който може да генерира научни статии с цитати, е постигнал 26.6% на „Последния изпит на човечеството“ - цялостна оценка, обхващаща над 3000 въпроса по повече от 100 теми.

Последният напредък на OpenAI в тази насока идва от техните модели o3 и o3-mini, обявени през декември. Тези модели надграждат семейството o1, пуснато по-рано миналата година. Подобно на o1, моделите o3 използват това, което OpenAI нарича „частна верига на мисълта“, симулирана техника за разсъждение, при която моделът преминава през вътрешен диалог и итеративно работи по въпроси, преди да представи окончателен отговор.

Този подход привидно отразява начина, по който човешките изследователи прекарват времето си в обмисляне на сложни проблеми, вместо да дават незабавни отговори. Според OpenAI колкото повече време отделяте за тези изчисления, толкова по-добри отговори получавате. Ето го и ключовия момент: срещу 20 000 долара клиентът вероятно ще си купи тонове време за мислене, за да може ИИ моделът да работи върху сложни проблеми.

Според OpenAI o3 е постигнал рекорден резултат в сравнителния тест ARC-AGI за визуално мислене, достигайки 87.5% при тестване с висока степен на изчислителна мощ - сравним с човешките резултати при праг от 85%. Моделът също така постигна 96.7 процента на Американския изпит по математика за 2024 г., като пропусна само един въпрос, и достигна 87.7 процента на GPQA Diamond, който съдържа въпроси от биологията, физиката и химията за висшисти.

На сравнителния тест Frontier Math на EpochAI o3 реши 25.2 процента от задачите, докато никой друг модел не е надхвърлял 2 процента, което предполага скок в способностите за математическо мислене в сравнение с предишния модел.

Снимка: Unsplash

Виж още: Първият в света биологичен компютър използва човешки мозъчни клетки с изчислителна техника на силициева основа