Genie Sim 3.0 – 智元机器人推出的开源仿真平台

AI工具集15小时前发布 商道网
78 0 0

Genie Sim 3.0是什么

Genie Sim 3.0 是智元机器人推出的首个大语言模型驱动的开源仿真平台。平台基于 NVIDIA Isaac Sim 构建,融合三维重建与视觉生成技术,可实现数字孪生级的高保真仿真环境。通过自然语言指令,开发者能在几分钟内生成万级场景,可进行多轮对话以优化场景。Genie Sim 3.0 同步开源了包含真实机器人作业场景的上万小时仿真数据集,构建了覆盖 10 万 + 场景的多维度智能评估体系。全流程功能闭环涵盖从数字资产生成到自动评测,显著加速模型训练与验证,降低对物理硬件的依赖。

Genie Sim 3.0 – 智元机器人推出的开源仿真平台

Genie Sim 3.0的主要功能

  • 高保真仿真环境:基于 NVIDIA Isaac Sim 构建,结合三维重建与视觉生成技术,提供数字孪生级的高保真仿真场景,覆盖零售、工业、餐饮、家居和办公等五大真实操作领域。
  • LLM 驱动场景生成:通过自然语言指令,几分钟内即可生成万级仿真场景,并支持多轮对话优化场景。
  • 大规模开源数据集:开源超过 10000 小时的合成数据集,涵盖 200 + 任务和多传感器模态,支持多维度变化。
  • 多维度智能评估体系:构建超过 10 万场景的评估体系,覆盖操作技能、认知理解等多维度,支持零样本仿真到现实的迁移。
  • 高效数据采集工具:提供低延迟遥操作和自动化数据编程支持,配备错误恢复机制。
  • 零样本仿真到现实迁移:模型在仿真数据上训练后,展现出零样本仿真到现实迁移能力,任务成功率优于真实数据训练的模型。

Genie Sim 3.0的技术原理

  • 基于 NVIDIA Isaac Sim 的高保真环境构建:Genie Sim 3.0 深度融合了三维重建与视觉生成技术,依托 NVIDIA Isaac Sim 架构,打造数字孪生级的高保真仿真环境。
  • 首创大语言模型驱动的场景生成:通过自然语言指令,平台可在几分钟内生成万级仿真场景,支持多轮对话进行场景优化。
  • 3D 高斯泼溅(3DGS)技术:采用 3DGS 技术进行环境重建,结合高分辨率 RGB 图像、360° LiDAR 点云和厘米级 RTK 定位,实现对真实环境的毫米级精准复刻。
  • 视觉生成与资产生成:利用视觉生成模型,智能合成新视角图像,增强 3D 重建的视觉逼真度,并可将任意物体通过 60 秒环拍视频快速生成带精确网格的仿真模型。
  • 全流程功能闭环:涵盖从数字资产生成、场景泛化、数据采集到自动评测的全流程,显著加速模型训练与验证。

Genie Sim 3.0的项目地址

  • 项目官网:https://agibot-world.com/genie-sim
  • Github仓库:https://github.com/AgibotTech/genie_sim
  • arXiv技术论文:https://arxiv.org/pdf/2601.02078

Genie Sim 3.0的应用场景

  • 工业场景仿真:深度集成超市上货、物流分拣、电力巡检等真实工业场景,支持从算法研发到工业应用的全流程仿真验证,实现“零硬件部署,全真实验证”,降低研发成本与验证周期。
  • 具身智能研究:提供大规模仿真数据集,涵盖200余项任务、上万小时时长,包含多传感器信息与多泛化维度。支持基于重建资产生成训练数据集与全流程评测系统,助力具身智能技术的研究与开发。
  • 模型评估与优化:构建基于超10万仿真场景的多维立体评估体系,利用大语言模型(LLM)自动生成评测流程,借助视觉语言模型(VLM)从语义理解、空间推理等多维度进行深度评估,清晰揭示模型能力边界。
  • 自然语言驱动的场景生成:通过自然语言指令,分钟级自动生成、泛化数千训练与测试场景,生成场景支持对话式编辑,可灵活增删细节、调整布局,操作高效便捷。
  • 数据采集与增强:提供双模式采集工具与自动化标注功能,独创错误恢复机制,实现零样本Sim2Real迁移,任务成功率超真实数据训练。
© 版权声明

相关文章