GPT-4.5 на OpenAI срази конкуренцията в Chatbot Arena

Tech

05.03.2025

Миналата седмица OpenAI представи GPT-4.5 - най-големия си интелигентен модел до момента. От OpenAI твърдят, че GPT-4.5 е най-значимият модел досега и че е създаден чрез допълнително увеличаване на процеса на предварително обучение. Освен че притежава повече знания, моделът GPT-4.5 се отличава с подобрени умения за писане и усъвършенствана индивидуалност в сравнение с по-старите модели на OpenAI.

Днес моделът GPT-4.5 дебютира в Chatbot Arena с позиция #1 в повечето категории. GPT-4.5 оглави следните категории, като има ясна преднина в категорията Multi-Turn. GPT-4.5 води и в класацията за контрол на стила.

Ботовете се оценяват в следните категории:

Многоходови команди
Трудни подсказки
Кодиране
Математика
Творческо писане
Следване на инструкции
По-дълги запитвания

Най-новият модел Grok-3 на xAI (grok-3-preview-02-24) също дебютира в класацията на Arena с първа позиция в раздел „Трудни подсказки“ (английски език) и с равен брой точки като цяло, както и в разделите „Кодиране“, „Математика“, „Творческо писане“, „Следване на инструкции“ и „По-дълги запитвания“. Бързите подобрения, демонстрирани от GPT-4.5 и Grok-3, подчертават засилващата се конкуренция в сферата на изкуствения интелект.

GPT-4.5 на OpenAI е начело на няколко други бенчмарка за изкуствен интелект. Той е на първо място в бенчмарка Elimination Game. Elimination Game е турнир за много играчи, който тества LLM в областта на социалното мислене, стратегията и измамата. В класацията IQ Test Score GPT-4.5 се представи по-добре от всички останали неразумни модели в индустрията. В сравнителния тест SimpleQA Hallucination Rate (Степен на халюцинации) GPT-4.5 постигна най-нисък резултат сред всички големи езикови модели на OpenAI.

Миналия месец главният изпълнителен директор на OpenAI Сам Олтман разкри, че GPT-4.5 е последният модел на OpenAI, който не е част от принципа „верига на мисълта“ при отговаряне и разсъждаване. Освен това OpenAI вече няма да пуска o3 като самостоятелен модел. Вместо това OpenAI ще обедини моделите от серията o и GPT, като създаде системи, които могат да определят подходящото време за мислене въз основа на заявката на потребителя.

Сам Олтман също така потвърди, че дори потребителите на безплатното ниво на ChatGPT ще имат достъп до GPT-5, но при стандартните настройки за интелигентност. Абонатите на ChatGPT Plus ще могат да използват GPT-5 на по-високо ниво на интелигентност, а абонатите на Pro ще могат да използват GPT-5 на още по-високо ниво на интелигентност. Освен това унифицираният модел ще поддържа всички съществуващи функции на ChatGPT, като глас, платно, търсене, задълбочено проучване и др.

Снимка: Unsplash/Chatbot Arena

Виж още: Тecno Spark Slim с амбициозната претенция да бъде най-тънкият телефон в света

Тагове: