Китайская компания AGIBOT, крупнейший в мире производитель гуманоидных роботов, опубликовала видео, в котором представила AGILE (AGIBOT Generative Intelligent Locomotion Engine) — новую генеративную foundation-модель, объединяющую восприятие и передвижение в единую систему.
На демонстрации робот AGIBOT X2 автономно (на скорости 1x, без замедления и склеек) делает то, что для предыдущих поколений гуманоидов было либо невозможно, либо требовало отдельных управляющих модулей под каждую задачу:
- Уворачивается от летящих предметов — например, от брошенных в него мячей.
- Поднимается и спускается по лестнице, различая высоту ступеней (15, 20 и 25 см).
- Считывает геометрию поверхности под ногами, адаптируя шаг под рельеф вместо того, чтобы спотыкаться.
- Переносит тяжёлые предметы, сохраняя равновесие.
Почему это важно
Главная сложность в современной робототехнике — не само движение, а связка «увидел → понял → подстроил движение». Долгое время восприятие и моторика в гуманоидах существовали как две отдельные системы: «зрение» обрабатывало картинку, отдельный модуль превращал её в команды, ещё один отвечал за равновесие и шаг. Каждый стык между ними — потенциальная точка отказа.
AGILE — попытка свести их в одну foundation-модель, по аналогии с тем, как большие языковые модели «понимают» текст и язык в едином пространстве. Это и есть то, что в индустрии называют воплощённым ИИ (embodied AI). Идею «единого мозга», обученного на полном спектре движений, ранее обозначала и Agility Robotics в своей программной статье о пути гуманоидов в дом — там это формулировалось как одно из условий, без которого реальная автономия невозможна.
Демонстрация AGIBOT не отвечает на вопрос «насколько надёжно это работает за пределами ролика» — на этот вопрос пока никто не отвечает. Но как направление развития это правильный ответ на ту самую критику «обманчиво замаскированных трюков»: автономия должна быть встроенной, а не сшитой из отдельных контроллеров.