Систему управления большинства современных роботов достаточно легко ввести в ступор при помощи стола или стула, которые преграждает его путь. Робот в состоянии обнаружить препятствие и его планировщик производит попытку прокладки нового маршрута движения в обход этого препятствия. Но, если такая попытка заканчивается неудачей, система сдается и робот, в лучшем случае, останавливает движение, а в худшем - начинает хаотично "тыкаться" в разные стороны. Все это происходит из-за того, что робот рассматривает препятствия как просто препятствия, а не как объекты, на которые можно оказать воздействие.
Обычно стол, установленный на пути человека, не сможет его задержать из-за того, что человек понимает, что стол - это физический объект, который можно переместить. Человек просто отодвинет стол и продолжит свой путь. И даже если что-то происходит не так, к примеру, ножка стола за что-то цепляется, человек быстро и интуитивно находит подходящее решение.
На конференции IROS 2016 Йонатан Шольц (Jonathan Scholz) из Google DeepMind и его коллеги из Технологического университета Джорджии (Georgia Tech) представили робота, который при помощи своих манипуляторов сможет освободить от препятствий свой путь. Робот использует нечто вроде "физического движка" для того, чтобы понять и предположить, как физические объекты будут вести себя при оказании на них того или иного воздействия. И, при помощи полученных данных, система управления робота действует своими манипуляторами, перемещая мешающие движению объекты.
На приведенном видеоролике можно увидеть, как робот Golem Krang, оснащенный планировщиком Navigation Among Movable Obstacle (NAMO) с дополнительной функцией Physics-Based Reinforcement Learning (PBRL), прокладывает себе путь, отодвигая манипулятором стулья и стол, вес которого составляет 35 килограмм. Можно отметить, что робот сначала пытается сдвинуть стол при помощи грубой силы, но когда этот вариант не срабатывает, он находит более тонкий подход, приводящий к успешному решению проблемы.
Система управления роботом Golem Krang изначально не имеет ни малейшего понятия о физике перемещения такого объекта, как стол. Предприняв попытку не очень сильного воздействия на стол, робот составляет первую модель этого объекта, которая затем уточняется, особенно когда стол ведет себя не так, как ожидается, цепляется за что-нибудь, к примеру. И каждое последующее свое действие робот планирует уже при помощи новой уточненной модели.
Для того, чтобы уметь ориентироваться и передвигаться в сложной и хаотичной окружающей среде, робот Golem Krang использует систему видения с шестью камерами, набор из нескольких базовых правил перемещения и манипуляции объектами. Все остальные возможности роботу дают технологии и алгоритмы глубинного машинного изучения, которые позволяют ему накапливать своего рода опыт и использовать его в дальнейших действиях. А сейчас исследователи работают над расширением ряда изначально заложенных в систему робота правил, что, по их мнению, должно улучшить способности робота к адаптации и ускорить процесс принятия им новых решений.