Benchmark 指南#

本节按 benchmark 组织完整评测流程。每篇指南包含环境准备、示例配置、逐步命令与进阶用法。

Benchmark

说明

指南

RealWorld

Franka 真机评测与部署

真机评测

BEHAVIOR-1K

大规模家居场景仿真

BEHAVIOR-1K 评测

LIBERO

机器人操作基准,含 Spatial / Object / Goal / Long / 90 等套件

LIBERO 评测

ManiSkill OOD

ManiSkill 分布外泛化评测

ManiSkill OOD 评测

PolaRiS

桌面操作仿真平台

PolaRiS 评测

RoboTwin

双臂操作仿真,多任务场景

RoboTwin 评测

备注

IsaacLab、MetaWorld 等 benchmark 尚无 evaluations/ 示例配置,评测可参考 基于模拟器的具身强化学习 中对应训练文档,通过配置回退机制使用 examples/embodiment/config/ 下的训练 YAML 进行评测。