Skip to content

v0.9.1

Compare
Choose a tag to compare
@jerryli1981 jerryli1981 released this 30 Aug 03:00
· 50 commits to main since this release
7c3dc6b

--添加LLama3.1最佳实践支持最新的Flash-Attention 3, Offloading, Comm-Overlapping等加速技术。
--升级Qwen2最佳实践支持最新的Flash-Attention 3, Offloading, Comm-Overlapping等加速技术。
--优化PAI算法团队自研的Optimizer Offloading的降显存效果以及吞吐性能。
--修复已知的Bugs。