扩展#
当你要向 RLinf 添加模型、环境或高级集成路径时,使用扩展页。
扩展概览
各扩展点位于何处,以及各部分如何协同。
新环境
添加一个新的 RL 环境并接入环境注册表。
FSDP 新模型
在 FSDP 后端上添加 HuggingFace 模型。
Megatron 新模型
在 Megatron+SGLang 后端上添加 HuggingFace 模型。
新 SFT 模型
将新模型接入 SFT 训练流程。
高级集成
添加 Megatron-Bridge、权重同步或奖励模型工作流。