指南#

指南面向实际操作流程:配置训练、扩展运行、管理数据与 checkpoint,以及调优性能。

选择工作流#

配置

设置 Hydra 配置、日志与不同工作负载的专用选项。

配置
启动与扩展

在多节点、异构硬件、云边协同或真实机器人上运行。

启动与扩展
数据与 Checkpoint

采集数据、转换 checkpoint,并恢复训练。

数据与 Checkpoint
性能

调整 placement、调度、并行、profiling 与 adapter 训练。

性能
硬件后端

在 AMD ROCm、Ascend CANN 或不同 SGLang 版本上运行 RLinf。

硬件后端
智能体工作流

运行智能体与推理工作负载。

智能体工作流