Рубрики
Технологии

Boston Dynamics научила робота Atlas выполнять сложные задачи по команде в реальном времени

Boston Dynamics представила впечатляющий скачок в разработке человекоподобных роботов, показав на примере робота Atlas, как искусственный интеллект позволяет роботу не только двигаться, но и выполнять длительные и сложные манипуляции с объектами — всё это под контролем обучаемых больших поведенческих моделей (LBMs), созданных совместно с Toyota Research Institute (TRI).

Обучение таких моделей строится на анализе данных как с реального Atlas, так и из компьютерных симуляций, а используемые нейросети способны интерпретировать текстовые команды — теперь роботу достаточно дать простое текстовое задание, и он самостоятельно определяет оптимальную последовательность действий.

Ключевой подход Boston Dynamics — использование единой нейросети, работающей с данными операторов, управляющих Atlas в реальном времени с помощью VR-гарнитур, и синтетических данных из симуляций. Такой симбиоз делает поведение робота гораздо более гибким и универсальным: вместо написания новых программ для каждой задачи Atlas учится выполнять сразу комплекс действий на основе общего алгоритма управления, который реагирует на непредвиденные ситуации и ошибки в процессе работы.

Робот Atlas и робот Spot. Фото: Boston Dynamics

Весь процесс разработки делится на четыре этапа: сначала специалисты управляют роботом вручную и собирают данные, затем — аннотируют их для последующего обучения нейросети, запускают само обучение и, наконец, тестируют результаты. Вся система базируется на принципах максимально широкого охвата поведенческих задач, универсальности управления и возможности быстрой итерации решений.

Особое внимание уделяется тому, чтобы Atlas осваивал задачи разной сложности: от манипуляций пальцами, работы с небольшими объектами до переноски тяжёлых деталей и взаимодействия с окружающей средой. Система позволяет запускать новые варианты поведения без сложной перепрошивки — достаточно внести изменения в используемые модели. Инфраструктура обучения соединяет симуляцию и физические тесты, помогая быстро отрабатывать и отбирать новые навыки для реальных применений.

Недавние демонстрации показали, как Atlas справляется с координацией движений, собирает, перекладывает и перемещает детали, исправляет ошибки, если обстоятельства внезапно меняются (например, если упал предмет). Модель с 450 миллионами параметров обрабатывает не только текстовые инструкции, но и сигналы сенсоров встроённых датчиков положения и усилий в конечностях. За счёт использования общей архитектуры и связи с тестовым стендом Atlas MTS инженеры обучают нейросети на реальных и синтетических данных одновременно.

Разработанная система позволяет ускорить выполнение ряда задач в 1,5-2 раза без потери надёжности, что, по мнению специалистов Boston Dynamics, существенно приближает человека и робота к совместной работе в будущем и даёт шанс на массовое применение роботов-гуманоидов для бытовых, промышленных и сервисных задач. Проект уже получил престижную отраслевую награду RBR50 Robotics Innovation Award 2024.

По словам руководителей проекта, главная инновация в том, что крупные поведенческие модели позволяют масштабно расширять спектр задач и быстро добавлять новые навыки, делая поведение роботов по-настоящему универсальным. Компания продолжает экспериментировать, увеличивать объём и сложность задач, а также внедряет новые алгоритмические подходы, чтобы сделать роботов ещё более надёжными и автономными.