В понеделник OpenAI обяви GPT-4o - чисто нов модел на изкуствен интелект, който според компанията е една стъпка по-близо до „много по-естествено взаимодействие между човек и компютър“. Новият модел приема като входни данни всякаква комбинация от текст, аудио и изображения и може да генерира изходни данни и в трите формата. Той също така е способен да разпознава емоции, позволява ви да го прекъснете по средата на речта и реагира почти толкова бързо, колкото човек по време на разговор.
„Особеното при GPT-4o е, че той дава интелигентност на ниво GPT-4 на всички, включително и на нашите безплатни потребители“, заяви главният технически директор на OpenAI Мира Мурати по време на презентация, предавана на живо. „Това е първият път, когато правим огромна крачка напред, що се отнася до лекотата на използване.“
По време на презентацията OpenAI показа как GPT-4o превежда на живо между английски и италиански език, помага на изследовател да реши линейно уравнение в реално време на хартия и дава насоки за дълбоко дишане на друг ръководител на OpenAI, като просто слуша дишането му.
Буквата „о“ в GPT-4o означава „omni“, което е препратка към мултимодалните възможности на модела. OpenAI заяви, че GPT-4o е обучен за работа с текст, зрение и звук, което означава, че всички входове и изходи се обработват от една и съща невронна мрежа. Това е различно от предишните модели на компанията, GPT-3.5 и GPT-4, които позволяваха на потребителите да задават въпроси просто чрез говорене, но след това транскрибираха речта в текст. Това премахваше интонацията и емоциите и правеше взаимодействието по-бавно.
През следващите няколко седмици OpenAI ще предостави новия модел на всички, включително на безплатните потребители на ChatGPT, а също така ще пусне десктоп версия на ChatGPT, първоначално за Mac, до която платените потребители ще имат достъп от днес.
Анонсът на OpenAI идва ден преди Google I/O, годишната конференция на компанията за разработчици.
Снимка: Unsplash
Виж още: Нов модел с изкуствен интелект предсказва човешкото поведение с невероятна точност