Базираната в Санта Моника компания Rabbit дебютира с r1 - малко персонално устройство с изкуствен интелект, което работи с множество приложения от името на потребителя. Устройството, чийто дизайн е дело на шведската технологична фирма Teenage Engineering, е с размерите на купчина бележки Post-it и се прибира лесно в джоба. То използва голям езиков модел, предоставен от OpenAI, за да разбира исканията на потребителя. Но идеята на Rabbit е да премине далеч от генеративните резултати на LLM и да се насочи към по-активен и агентичен ИИ.
Специалният сос на стартъпа е неговият софтуер, а именно патентован модел на ИИ, наречен Large Action Model (LAM), който се научава да управлява приложенията на потребителя от негово име. Например потребителят може да каже на r1: "Вземи ми Uber до офиса, избери някаква музика за пътуването и уведоми екипа, че ще закъснея малко". След това LAM взаимодейства със съответните приложения, за да изпълни заявката.
На теория способностите на LAM за координиране на приложенията създават нещо като постсмартфон преживяване.
"Стигнахме до момента, в който имаме стотици приложения на смартфоните си със сложен UX дизайн, които не си говорят помежду си", казва основателят и главен изпълнителен директор на Rabbit Джеси Лю. "В резултат на това крайните потребители са разочаровани от своите устройства и често се губят."
Първоначално моделът е обучен чрез наблюдение на хиляди записани потребителски сесии с различни приложения. Потребителят може да предостави достъп на асистента до своите приложения, като предостави своите идентификационни данни за приложението на страницата за настройка на своя лаптоп или настолен компютър.
По-късно тази година потребителите ще могат да използват "режим на обучение", който ще им позволи директно да обучат модела на LAM да използва техните приложения. Използвайки уеб портал, наречен rabbit hole, потребителят може да обучава модела, като демонстрира как използва своите приложения. Моделът "може да прави изводи и да моделира човешките действия върху компютърни интерфейси, като научава намеренията и поведението на потребителите, когато използват конкретни приложения, и след това да ги имитира и изпълнява едновременно надеждно и бързо", обяснява компанията в съобщение за пресата. Например даден потребител може да научи приложение за редактиране на видео да премахва водни знаци от снимки.
Снимка: Rabbit
Виж още: Този неподозиран компонент може би е тайната на ренесансовите художници