扩展#

当你要向 RLinf 添加模型、环境或高级集成路径时,使用扩展页。

扩展概览

各扩展点位于何处,以及各部分如何协同。

扩展框架
新环境

添加一个新的 RL 环境并接入环境注册表。

添加新环境
FSDP 新模型

在 FSDP 后端上添加 HuggingFace 模型。

使用 FSDP+HuggingFace 添加新模型
Megatron 新模型

在 Megatron+SGLang 后端上添加 HuggingFace 模型。

使用 Megatron+SGLang 添加新模型
新 SFT 模型

将新模型接入 SFT 训练流程。

使用 FSDP+HuggingFace 添加新模型 SFT 训练
高级集成

添加 Megatron-Bridge、权重同步或奖励模型工作流。

高级集成