参考#
本节汇总评测参考文档,涵盖配置结构、命令行用法、支持的模型,以及如何查看评测输出。
- 配置参考
evaluations/<benchmark>/下的 Hydra YAML 结构,以及embodied_eval所需的runner、env、rollout等字段说明。
- CLI 参考
如何使用
run_eval.sh启动评测、传入 Hydra 覆盖参数,以及从配置名自动推断 benchmark。
- 支持的模型
当前
evaluations/中提供示例配置的 VLA 模型(OpenPI、OpenVLA-OFT、StarVLA、DreamZero、LingBotVLA)及model_path设置方式。
- 日志与结果
日志与 rollout 视频的输出路径、终端指标(如
eval/success_once)以及 TensorBoard 查看方式。