指南#
指南面向实际操作流程:配置训练、扩展运行、管理数据与 checkpoint,以及调优性能。
选择工作流#
配置
设置 Hydra 配置、日志与不同工作负载的专用选项。
启动与扩展
在多节点、异构硬件、云边协同或真实机器人上运行。
数据与 Checkpoint
采集数据、转换 checkpoint,并恢复训练。
性能
调整 placement、调度、并行、profiling 与 adapter 训练。
硬件后端
在 AMD ROCm、Ascend CANN 或不同 SGLang 版本上运行 RLinf。
智能体工作流
运行智能体与推理工作负载。