В Дубай току-що се проведе The World Government Summit и на форума говори главният изпълнителен директор на OpenAI Сам Олтмън. Той съобщи някои новини за следващото поколение модел на GPT, върху който работи компанията. Според съобщенията Сам Алтън е говорил за GPT-5 и как той ще бъде "по-добър във всичко".
Съвсем наскоро OpenAI обяви Sora. Това е генераторът на текст във видео с изкуствен интелект на компанията. Той успя да създаде някои изключително реалистични видеоклипове, които могат да заблудят повечето хора. В момента може да създава клипове с дължина до 1 минута въз основа на въведен текст. В момента компанията го тества само вътрешно, така че хората от широката общественост не могат да го използват.
От кулоарите на The World Government Summit получихме малко информация за това, което OpenAI планира да направи по-нататък. Компанията вече разполага с GPT-4 и GPT-4 Turbo, които са най-мощните модели на ИИ, достъпни за обществеността. Под тях стои GPT 3.5, до който потребителите имат достъп с безплатен акаунт в ChatGPT.
В момента всички тези модели са изключително мощни и способни на дълбоко разбиране и разсъждение. Така че е трудно да си представим, че компанията може да развие нещата още повече. Въпреки това според Сам Олтман тя "ще бъде по-добра във всичко във всички области". Това може да се очаква, но всички се чудим колко по-добра ще бъде тя. Очевидно е, че всеки скок напред прави изкуствения интелект по-сравним с човешкия. ИИ, който е толкова умен, колкото човек, се нарича AGI (изкуствен общ интелект).
Що се отнася до това колко по-мощен ще бъде GPT-5 в сравнение с GPT-4, кога ще излезе, къде ще бъде достъпен и дали ще даде на човека шанс, предстои да разберем. Сигурни сме, че компанията провежда много ранни тестове с този модел. Една малка част от информацията, която имаме за неговите възможности, е, че чрез Microsoft GPT-5 може да дешифрира език на 3000 години, който никой човек в днешното общество не може да разбере.
Що се отнася до спекулациите, почти сме сигурни, че те ще включват генериране на изображения чрез DALL-E, генериране на видео чрез Sora и вероятно генериране на звук. Това обаче предстои да разберем. Знаем, че ще бъде мултимодално, така че е възможно това да е вярно.
Понастоящем алгоритъмът се разработва под кодовото име Gobi. Не разполагаме с точна дата на пускане, но компанията планира да го пусне по някое време тази година. Като се има предвид, че chatGPT първоначално стартира през ноември 2022 г., може би компанията ще се придържа към версиите около тази времева рамка. Това, заедно с всичко останало за новата версия предстои да разберем.
Снимка: Unsplash
Виж още: Без огледала за обратно виждане за автоматизираните возила без водач