support weight-update in disaggregated mode using sglang by PengchengShi00 · Pull Request #1766 · InternLM/xtuner

PengchengShi00 · 2026-05-07T13:38:03Z

将TrainingWorker中有关权重同步的函数抽取到UpdateWeighter类中
将PR中有关训推共卡权重同步的优化更新到UpdateWeighter类中，Update weight persist buffer #1653
修复sglang在跑训推分离时，rollout和train所占GPU没有分开部署的 bug
更新配置GSM8KJudgerConfig的配置参数
增加训推分离模式下，使用sglang作为推理后端时的权重同步
a. 创建训练 ranks 之间使用的 gloo group，训推分离权重同步时通过该group做 barrier
b. 创建了一个 NCCL process group，用来将训练 rank0 把 bucket 后的权重 broadcast 给 SGLang rollout ranks：

support weight-update in Disaggregated mode using sglang

f6efdac

Provide feedback