Исследователи Массачусетского технологического института помогают роботам использовать все свое тело для манипулирования объектами
Брианна Весслинг | 29 августа 2023 г.
Робот пытается использовать все свои руки, чтобы повернуть ковш на 180°. | Источник: Массачусетский технологический институт
Исследовательская группа Массачусетского технологического института разработала технологию искусственного интеллекта, которая позволяет роботам манипулировать объектами всей рукой или телом, а не только кончиками пальцев.
Когда человек берет коробку, он обычно поднимает ее всей рукой, а затем предплечьями и грудью, чтобы удерживать коробку в устойчивом положении, пока он перемещает коробку в другое место. Этот вид манипуляции представляет собой манипуляцию всем телом, и роботы с ней борются.
Для роботов каждое место, где коробка может коснуться любой точки их пальцев, рук или туловища, является событием контакта, о котором робот должен подумать. Это оставляет роботам миллиарды потенциальных событий контакта, что делает планирование задач, требующих всего тела, чрезвычайно сложным. Этот процесс, в котором робот пытается научиться лучше всего перемещать объект, называется планированием манипуляций с большим количеством контактов.
Однако исследователи из Массачусетского технологического института нашли способ упростить этот процесс, используя технику искусственного интеллекта, называемую сглаживанием, и алгоритм, созданный командой. Сглаживание объединяет множество событий контакта в меньшее количество решений, исключая события, которые не важны для задачи, и сужая ситуацию до меньшего количества решений. Это позволяет даже простому алгоритму быстро разработать эффективный план манипуляции.
Многие роботы учатся обращаться с объектами с помощью обучения с подкреплением — метода машинного обучения, при котором агент методом проб и ошибок учится выполнять задачу за вознаграждение. Посредством такого типа обучения система должна узнать все о мире методом проб и ошибок.
При наличии миллиардов точек контакта обучение с подкреплением может потребовать большого объема вычислений, что делает его не идеальным выбором для планирования манипуляций с большим количеством контактов, хотя оно может быть эффективным при достаточном количестве времени.
Однако обучение с подкреплением выполняет процесс сглаживания, пробуя разные точки контакта и вычисляя средневзвешенное значение результатов, что помогает сделать его таким эффективным при обучении роботов.
Исследовательская группа Массачусетского технологического института использовала эти знания для создания простой модели, которая выполняет такого рода исследования, позволяя системе сосредоточиться на основных взаимодействиях робота и объекта и прогнозировать долгосрочное поведение.
Затем команда объединила свою модель с алгоритмом, который может быстро перебирать все возможные решения, которые может принять робот. Используя модель сглаживания и алгоритм, команда создала систему, которой потребовалось всего около минуты вычислений на стандартном ноутбуке.
Хотя этот проект все еще находится на ранней стадии, этот метод может быть использован, чтобы позволить фабрикам развертывать меньших мобильных роботов, которые используют все свое тело для манипулирования объектами, а не большие роботизированные руки, которые хватаются только кончиками пальцев.
Хотя модель показала многообещающие результаты при тестировании в моделировании, она не может обрабатывать очень динамичные движения, например, падение объектов. Это одна из проблем, которую команда надеется продолжить решать в будущих исследованиях.
Исследования групп частично финансировались Amazon, Лабораторией Линкольна Массачусетского технологического института, Национальным научным фондом и Ocado Group. В состав команды входил Х.Дж. Терри Су, аспирант в области электротехники и информатики (EECS), а соавтор статьи — доктор философии Тао Пан. 23 года, робототехник в Бостонском институте искусственного интеллекта; Луцзе Ян, аспирант EECS; и старший автор Расс Тедрейк, профессор Toyota в области EECS, аэронавтики и космонавтики и машиностроения, а также член Лаборатории компьютерных наук и искусственного интеллекта (CSAIL).