Skip to content

v0.9.2

Compare
Choose a tag to compare
@jerryli1981 jerryli1981 released this 27 Sep 02:23
· 38 commits to main since this release
bcb69cb

--支持热门模型微调时采用Sequence Packing加速技术。
--支持用Megatron-Core框架训练Qwen2.5系列模型。
--升级Deepseek-V2-MoE系列模型支持TE版的MLA以及流水并行CKPT转换。
--修复已知的Bugs。