Unitree показала голосовое управление G1 — робот выполняет произвольные команды в реальном времени

Unitree Robotics опубликовала новое демо гуманоидного робота G1: робот выполняет физические действия по голосовым командам в реальном времени.

Видео снято одним дублем с записью звука на площадке — без монтажа и заранее запрограммированных последовательностей. Оператор отдаёт голосовые команды, а AI-пайплайн G1 транслирует их в движения на лету. Unitree предупреждает, что при автономной генерации действий в реальном времени возможны небольшие задержки и снижение плавности движений.

Это качественно другой уровень по сравнению с ранними демо компании, которые строились на имитационном обучении (робот наблюдает за человеком и повторяет) или акробатике через обучение с подкреплением — сальто, брейк-данс. Голосовое управление произвольными действиями подразумевает другую архитектуру: система должна интерпретировать естественный язык, сформировать моторный план и выполнить его — всё в цикле обратной связи, достаточно быстром, чтобы движение выглядело непрерывным.

Демо совпадает с более широким движением Unitree в сторону интеграции языковых моделей. В марте 2026 года компания выложила в открытый доступ UnifoLM-VLA-0 — модель «зрение-язык-действие» на базе Qwen2.5-VL-7B, дающую G1 готовый базовый уровень манипуляции по 12 категориям задач. Последняя прошивка (v3.2+) также добавила предварительную поддержку LLM на Jetson Orin в версии G1 EDU.

Для контекста: G1 — 1,32 м ростом, 35 кг, до 43 степеней свободы в топовой конфигурации. В 2025 году Unitree отгрузила более 5 500 гуманоидных роботов — больше, чем все американские конкуренты вместе взятые — и нацелена на 10 000–20 000 в 2026 году. IPO на шанхайской бирже (A-share) ожидается в середине года при оценке ~$580 млн.