PolaRiS 评测#
PolaRiS 是桌面操作仿真平台,提供 TapeIntoContainer、MoveLatteCup 等 DROID 风格操作任务。RLinf 支持在 PolaRiS 上评测 OpenPI 策略。
相关训练文档:基于 PolaRiS 仿真平台的强化学习训练
环境准备#
bash requirements/install.sh embodied --model openpi --env polaris
source .venv/bin/activate
export POLARIS_DATA_PATH=/path/to/dataset/PolaRiS-Hub
示例配置#
配置文件 |
任务 |
模型 |
|---|---|---|
|
TapeIntoContainer |
π₀.₅ |
|
MoveLatteCup |
π₀ |
完整评测流程#
Step 1:下载数据集与模型
按 基于 PolaRiS 仿真平台的强化学习训练 下载 PolaRiS 数据集与 OpenPI checkpoint。
Step 2:设置环境变量
source .venv/bin/activate
export POLARIS_DATA_PATH=/path/to/dataset/PolaRiS-Hub
Step 3:编辑配置
修改 rollout.model.model_path 指向本地 checkpoint。
Step 4:启动评测
bash evaluations/run_eval.sh polaris polaris_tapeintocontainer_openpi_pi05_eval
或:
bash evaluations/run_eval.sh polaris polaris_movelattecup_openpi_eval
Step 5:查看结果
终端输出 eval/success_once;日志见 日志与结果。
常见问题#
数据集路径:
POLARIS_DATA_PATH必须指向 PolaRiS-Hub 根目录,run_eval.sh会自动读取。模型转换: 若使用 JAX checkpoint,需先按训练文档转换为 PyTorch 格式。