v0.9.2
--支持热门模型微调时采用Sequence Packing加速技术。
--支持用Megatron-Core框架训练Qwen2.5系列模型。
--升级Deepseek-V2-MoE系列模型支持TE版的MLA以及流水并行CKPT转换。
--修复已知的Bugs。
--支持热门模型微调时采用Sequence Packing加速技术。
--支持用Megatron-Core框架训练Qwen2.5系列模型。
--升级Deepseek-V2-MoE系列模型支持TE版的MLA以及流水并行CKPT转换。
--修复已知的Bugs。