Daily Trend [11-09]

【1】RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation

【Time】2023-11-02

一、研究领域

generative robotic agent

二、研究动机

robotic research一个很有挑战的task是：赋予机器人多种技能，使它们能够在各种non-factory环境中运行，并为人类执行各种各样的任务。但是，由于现实世界数据收集的昂贵且费力的性质，所以其中许多技能都是在具有适当领域随机化的模拟中进行训练，然后部署到现实世界。文章利用现有的基础模型，提出了一种自动化的范式驱动机器人的skill learning。

三、方法与技术

RoboGen包含四个阶段：

（1）task proposal：使用特定的robot type和从池中随机采样的object来初始化系统，使系统能够生成 meaningful, diverse, and high-level 的 tasks for robots to learn （形式是query texts）。

（2）scene generation：先用GPT增强query（不在database中的物体描述等）；再从objaverse中检索object或者用text-to-image-to-3D模型生成assets（形式是3D mesh）；然后使用这些assets和特定的configuration来填充相应的场景，从而生成任务对应的场景。

（3）training supervision generation：RoboGen 中集成了三种不同类型的学习算法：强化学习、进化策略、基于梯度的轨迹优化和具有运动规划的动作原语，不同的算法适用于不同类型的任务。用GPT-4编写奖励函数，以及决策使用哪种算法解决哪种任务。

（4）skill learning with generated information：一旦我们获得了所提出的任务所需的所有信息，包括场景组件和配置、任务分解以及分解的子任务的训练监督，就能够为机器人构建模拟场景，以学习完成任务所需的技能任务。

Untitled

四、总结

非常复杂的pipeline居然很神秘地work了，背后应该涉及非常多的工程性问题。