🤖 Как ИИ обучает универсальных роботов будущего?
Представьте, что вам нужно научить робота пользоваться разными инструментами, чтобы он помогал вам по дому. Для этого требуется очень много данных, показывающих, как это делать правильно.
В чем проблема❓
Существующие наборы данных для роботов сильно различаются. Они состоят как из цветных, так и из схематичных изображений. Могут быть собраны в разных средах: симуляциях или демонстрациях с участием людей. При этом, каждый набор данных содержит уникальные задачи и условия.
Так как объединить все эти нюансы в одной модели машинного обучения сложно, большинство методов используют только один тип данных.
Из-за этого роботы не могут хорошо справляться с новыми задачами в незнакомых ситуациях.
Исследователи из MIT разработали новую технику обучения роботов на основе диффузионных моделей ИИ, которая поможет сделать их умнее и универсальнее.
Диффузионные модели обычно используют для генерации изображений, так как они могут создавать новые наборы данных, улучшая исходные образцы.
В данном случае модель обучают генерировать траекторию для робота. Ученые делают это, добавляя шум к траекториям в обучающем наборе данных. Диффузионная модель постепенно удаляет шум и улучшает траекторию робота.
Сначала исследователи обучают диффузионные модели для разных задач. Затем они объединяют их стратегии в одну систему. Это позволяет роботам выполнять множество задач и адаптироваться к новым условиям.
Например, данные для обучения, собранные из реальной жизни, делают роботов более ловкими, а симуляции — универсальными.
Эту технику назвали Policy Composition (PoCo). Она улучшила производительность роботов на 20% по сравнению с традиционными методами.
В будущем исследователи планируют применять эту технику для более сложных задач, где роботы будут использовать несколько инструментов подряд.
Так что можно начинать мечтать об универсальных домашних робо-помощниках 🔥
Представьте, что вам нужно научить робота пользоваться разными инструментами, чтобы он помогал вам по дому. Для этого требуется очень много данных, показывающих, как это делать правильно.
В чем проблема❓
Существующие наборы данных для роботов сильно различаются. Они состоят как из цветных, так и из схематичных изображений. Могут быть собраны в разных средах: симуляциях или демонстрациях с участием людей. При этом, каждый набор данных содержит уникальные задачи и условия.
Так как объединить все эти нюансы в одной модели машинного обучения сложно, большинство методов используют только один тип данных.
Из-за этого роботы не могут хорошо справляться с новыми задачами в незнакомых ситуациях.
Исследователи из MIT разработали новую технику обучения роботов на основе диффузионных моделей ИИ, которая поможет сделать их умнее и универсальнее.
Диффузионные модели обычно используют для генерации изображений, так как они могут создавать новые наборы данных, улучшая исходные образцы.
В данном случае модель обучают генерировать траекторию для робота. Ученые делают это, добавляя шум к траекториям в обучающем наборе данных. Диффузионная модель постепенно удаляет шум и улучшает траекторию робота.
Сначала исследователи обучают диффузионные модели для разных задач. Затем они объединяют их стратегии в одну систему. Это позволяет роботам выполнять множество задач и адаптироваться к новым условиям.
Например, данные для обучения, собранные из реальной жизни, делают роботов более ловкими, а симуляции — универсальными.
Эту технику назвали Policy Composition (PoCo). Она улучшила производительность роботов на 20% по сравнению с традиционными методами.
«Для успешной работы роботов нам понадобятся данные из интернета, симуляций и данные реальных роботов. Как их объединить эффективно — большой вопрос. PoCo — уверенный шаг в правильном направлении», — говорит Джим Фан, старший научный сотрудник NVIDIA и руководитель инициативы AI Agents.
В будущем исследователи планируют применять эту технику для более сложных задач, где роботы будут использовать несколько инструментов подряд.
Так что можно начинать мечтать об универсальных домашних робо-помощниках 🔥