支持的异构加速器芯片#

RLinf 主要面向 NVIDIA GPU,但部分具身示例同样可以在 AMD ROCm华为 Ascend CANN 加速器芯片上运行。本节文档侧重于加速器特定的依赖安装与 运行时环境变量,训练任务本身(任务说明、PPO/GRPO 算法、模型下载、配置文件、 指标与结果)与芯片无关,可参考对应的示例页。