Отговорът на Илон Мъск на ChatGPT получава актуализация, която ще го направи по-добър в областта на математиката, кодирането и други. xAI на Мъск пусна Grok-1. 5 за ранни тестери с "подобрени възможности и разсъждения" и способност да обработва по-дълги контексти. Компанията твърди, че сега той се съизмерва с GPT-4, Gemini Pro 1.5 и Claude 3 Opus в няколко области.

Ако се съди по цифрите на xAI, Grok-1.5 изглежда значително подобрен в сравнение с Grok-1. Той се изстреля до 50.6% в бенчмарка MATH, което е над два пъти повече от предишния резултат. Той също така се повиши до 90% и 74.1% в GSM8K (математически текстови задачи) и HumanEval (кодиране), съответно в сравнение с 62.9% и 63.2% преди това. Тези резултати са на една ръка разстояние от Gemini Pro 1.5, GPT-4 и Claude 3 Opus - всъщност резултатът от HumanEval за кодиране надминава всички съперници с изключение на Claude 3 Opus.

Той може също така да обработва дълги контексти с до 128 хил. символа в рамките на своя контекстен прозорец, което означава, че може да обединява данни от повече източници, за да разбере дадена ситуация. "Това позволява на Grok да има увеличен капацитет на паметта до 16 пъти спрямо предишната дължина на контекста, което му позволява да използва информация от значително по-дълги документи", казват от компанията.

xAI обаче не даде подробна информация за напредъка на Grok в други области, в които той все още може да изостава (академични резултати, мултимодалност и други). А Grok-1.5 може да не запази позицията си задълго. Според OpenAI ChatGPT 5 ще се появи по някое време това лято и обещава набор от функции, които "създават усещането, че общувате с човек, а не с машина".

Понастоящем Grok е достъпен само за потребителите на ниво Premium+ в X (бивш Twitter), въпреки че Илон Мъск наскоро обеща да го отвори за редовните потребители на X Premium. Компанията също така наскоро предостави отворен код на своя чатбот Grok, след като Мъск съди OpenAI и Сам Олтман за това, че са изоставили мисията си с нестопанска цел.

Снимка: Unsplash

Виж още: Neuralink е провалът на Илон Мъск, за който той не иска да разберете