调度模型# 当你需要理解任务运行位置,以及 RLinf 如何存储轨迹数据时,使用这些概念页。 概念 内容 Placement worker 如何映射到节点与 GPU。 执行模式 共享式、分离式与混合式 placement 的权衡。 Replay Buffer 轨迹回放缓冲区的设计与采样。