За да открива обекти, обикновено AI трябва да бъде обучен върху съществуващ материал, но Meta има начин да накара технологията да действа и в обратната посока. Гигантът в областта на социалните мрежи публикува модел на AI на име Segment Anything, който може да открива обекти в снимки и видеоклипове дори ако те не са били част от обучителния набор. Можете да избирате обекти, като щракнете върху тях или като използвате текстови подсказки в свободна форма. Както обяснява Ройтерс, можете да въведете думата "котка" и да видите как изкуственият интелект маркира всички котки в дадена снимка.
Моделът може да работи и в тандем с други модели. Той може да помогне да се реконструира обект в 3D, като се използва едно изображение, или да се използват изгледи от шлем за смесена реалност. На практика Segment Anything може да ограничи необходимостта от допълнително обучение на AI.
Както моделът на AI, така и наборът от данни ще могат да се изтеглят с нетърговски лиценз. Това означава, че създателите не могат да го използват за продукти. Основното му предназначение е предимно за научни изследвания и разширяване на достъпа до технологията. В момента Meta използва донякъде подобна технология за модериране на забранено съдържание, препоръчване на публикации и маркиране на снимки.
Разработчиците признават, че съществуващият модел е несъвършен. Възможно е да пропуска по-дребни детайли и не е толкова точен в откриването на границите в сравнение с други модели. И макар че Segment Anything може да се справя с подсказките в реално време, той се "задъхва", когато е необходима сложна обработка на изображения. Някои по-специализирани инструменти за изкуствен интелект вероятно ще надминат този модел в съответните области, казва компанията.
Няма да видите този AI в роботи или други устройства, при които бързото и точно откриване на обекти е (обикновено) жизненоважно. Подобни модели обаче все пак могат да помогнат в ситуации, в които е непрактично да се разчита изключително на данни за обучение. Една социална мрежа може да използва технологията, за да се справи с бързо нарастващия обем съдържание. Ако не друго, това показва, че Meta иска да обобщи компютърното зрение.
Meta има навика да споделя пробиви в областта на изкуствения интелект, като например преводач за неписани езици. При това положение върху компанията се оказва натиск да покаже, че е толкова силна в категорията, колкото и технологични конкуренти като Google и Microsoft. Тя вече планира генеративни "личности" с изкуствен интелект за своите социални приложения, а изобретения като Segment Anything показват, че тя има няколко собствени предимства.
Снимка: Unsplash
Виж още: Генеративният изкуствен интелект може да замени 300 милиона работни места