Исслeдoвaтeли изо OpenAI сoздaли aлгoритм для рoбoруки, пoзвoляющий eй сoбирaть кубик Рубикa, пeрeвoрaчивaя и скручивaя eгo пaльцaми. Снaчaлa aлгoритм oбучaлся мeтoдoм прoб и oшибoк в виртуaльнoй срeдe, a зaтeм eгo пeрeнeсли нa рeaльнoe устрoйствo. Изо мaксимaльнo слoжныx кoнфигурaций, трeбующиx 26 пoвoрoтoв, рoбoрукa сoбирaeт кубик в 20 прoцeнтax случaeв, a исполнение) кoнфигурaций, трeбующиx 15 пoвoрoтoв, успeшнoсть сoстaвляeт 60 процентов, рассказывают исследователи в блоге OpenAI.
В области роботизированных рукоподобных манипуляторов первоэлемент внимание разработчиков сконцентрировано на протезах alias телеуправляемых человекоподобных роботах. Сами по себя эти конструкции зачастую уже достаточно ловки и позволяют обманывать сложные манипуляции, но алгоритмы управления роборуками доколе отстают от электромеханической составляющей. Для улучшения уровня алгоритмов отдельные люди компании концентрируют внимание на своих прикладных задачах, а исследователи частенько решают трудноприменимые на практике «детские» задачи. Что ни говорите в процессе их решения зачастую рождаются технологии, которые немного погодя можно применить во многих областях.
Программисты изо некоммерческой организации OpenAI в 2017 году поставили накануне собой в качестве такой задачи сборку кубика Рубика одной роборукой. В 2018 году они показали буферный результат своей работы, научив роборуку перекоцывать кубик нужной стороной до 50 в один из дней подряд. Теперь исследователи показали, что достигли конечной цели, используя той же породы алгоритмы и принципы их обучения.
Потому авторы ставили перед собой задачу подать повод алгоритм для ловких манипуляций с объектами, в целях расчета ходов в процессе решения они использовали доступную реализацию двухфазного алгоритма Коцембы. Сверх того того, они использовали коммерческий доступную роборуку Shadow Dexterous Hand.
Основные алгоритмы годится. Ant. нельзя разбить на две основные части. Первая основана держи архитектуре сверточной нейросети и отвечает за визуальное оценка кубика. Она получает три изображения пакши с кубиком с разных ракурсов и рассчитывает на их основе позиция кубика, а также углы между его плоскостями. Кайфовый втором алгоритме используется архитектура рекуррентной нейросети с долгой краткосрочной памятью (LSTM). Симпатия получает данные от первой и на их основе, а и последовательности сборки, рассчитанной алгоритмом Коцембы, создает расстановка движений для пальцев.
Как и в прошлой работе, исследователи использовали с целью обучения не множество реальных роборук, а виртуальную среду с их копиями. Сие позволило, во-первых, распараллелить процесс обучения и тем самым форсировать его, а, во-вторых, повысить качество алгоритмов, меняя границы среды. В процессе обучения алгоритмы обучались толково проб и ошибок, и постепенно достигали порогового уровня успешности, потом которого среда автоматически меняла параметры, к примеру, размеры и массу кубика. Изо-за этого алгоритм был вынужден ещё (раз) адаптироваться к условиям. Именно это позволило подготовить алгоритмы к переносу возьми реальную роборуку, без необходимости абсолютно ровно симулировать все аспекты взаимодействия кубика и шуршалки.
https://nplus1.ru
Ключевые слова:
Читайте как и:
Как отличить некачественную свинину и говядину
В каждой индустрии трескать (за (в) обе щеки) люди, которые хотят нажиться на других. Сбыт продуктов — не исключение. Вы наверняка сталкивались с тем, яко находили на прилавках магазинов некачественные не то — не то несвежие продукты.
Подробнее »»