参考#

本节汇总评测参考文档,涵盖配置结构、命令行用法、支持的模型,以及如何查看评测输出。

  • 配置参考

    evaluations/<benchmark>/ 下的 Hydra YAML 结构,以及 embodied_eval 所需的 runnerenvrollout 等字段说明。

  • CLI 参考

    如何使用 run_eval.sh 启动评测、传入 Hydra 覆盖参数,以及从配置名自动推断 benchmark。

  • 支持的模型

    当前 evaluations/ 中提供示例配置的 VLA 模型(OpenPI、OpenVLA-OFT、StarVLA、DreamZero、LingBotVLA)及 model_path 设置方式。

  • 日志与结果

    日志与 rollout 视频的输出路径、终端指标(如 eval/success_once)以及 TensorBoard 查看方式。