Alibaba се включи в надпреварата за създаване на „физически изкуствен интелект“ с нов модел, предназначен да захранва роботи в реалния свят.

Китайският технологичен гигант представи RynnBrain: система за изкуствена интелигентност, създадена да помага на машините да разбират пространството, обектите и движението.

Стартирането на проекта е знак за нарастващото навлизане на Alibaba в областта на роботиката, която вече привлича големи инвестиции от американски компании като NVIDIA и Google.

Кратко демонстрационно видео, публикувано от DAMO Academy на Alibaba, показва робот, който разпознава плодове и ги слага в кошница. Задачата изглежда проста; интелигентността зад нея обаче не е. Роботът трябва да идентифицира обекти, да проследява тяхното местоположение и да планира прецизни движения в реално време.

Alibaba позиционира RynnBrain като фундаментален модел на „въплътен изкуствен интелект“. Тази категория включва роботи, автономни превозни средства и други машини, които взаимодействат директно с физическата среда.

Китай превърна физическия изкуствен интелект в национален приоритет, тъй като конкуренцията със Съединените щати се засилва.

RynnBrain се фокусира върху решаването на основна слабост в съществуващите модели роботика: слаба памет за пространство и време. Традиционните системи за изкуствен интелект често забравят местоположението на обектите или интерпретират погрешно сцените. Alibaba твърди, че RynnBrain решава и двата проблема чрез пространствено-времева памет. Тази способност позволява на роботите да си спомнят къде са се появили обектите по-рано и да предскажат как ще се движат след това.

Системата поддържа и глобална ретроспекция. Роботът може да прегледа минали действия, преди да избере следващата си стъпка. Този подход помага за намаляване на грешките при сложни задачи.

Физическото пространствено мислене добавя още едно ниво. RynnBrain комбинира текстова логика с пространствени сигнали. Този хибриден метод позволява на роботите да мислят по начин, който по-добре отразява реалните условия.

Alibaba обучи модела на своята система за визуален език Qwen3-VL. DAMO Academy го оптимизира, използвайки специална архитектура, наречена RynnScale. Компанията твърди, че тази настройка е удвоила скоростта на обучението, без да се увеличават изчислителните ресурси. Въпреки размера си системата активира само 3 милиарда параметри по време на извличането на заключения. Alibaba твърди, че тази ефективност позволява на модела да надмине много по-големи системи със 72 милиарда параметри. По-ниските изисквания за извличане на заключения се превръщат в по-плавно движение на робота и по-бързо вземане на решения. Тези предимства са важни за реалното приложение, където ограниченията на мощността и латентността често ограничават производителността.

Снимка: Pexels

Виж още: Ето това се получава, когато сложите перка на хеликоптер върху лек автомобил