调度模型#

当你需要理解任务运行位置,以及 RLinf 如何存储轨迹数据时,使用这些概念页。

概念

内容

Placement

worker 如何映射到节点与 GPU。

执行模式

共享式、分离式与混合式 placement 的权衡。

Replay Buffer

轨迹回放缓冲区的设计与采样。