登录
首页 >  科技周边 >  业界新闻

摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布:支持 64K 长文本、新增 LLaMA2 全系列大模型等

来源:IT之家

时间:2024-09-04 20:55:38 484浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布:支持 64K 长文本、新增 LLaMA2 全系列大模型等》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

本站 8 月 19 日消息,摩尔线程“夸娥智算集群 KUAE” 1.2 版本正式发布。该版本对软硬件层面的综合性进行优化,支持 64K 长文本、新增 LLaMA2 全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。

摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布:支持 64K 长文本、新增 LLaMA2 全系列大模型等

更新内容:
  1. MFU 提升

    • 使用千卡集群训练千亿模型,MFU 提升 10%。
    • 稠密模型集群训练 MFU 最高达到 55%。
  2. Flash Attention2 优化

    • 集成 MUSA SDK 平台优化后的 Flash Attention2 技术,提升大模型训练效率与资源利用率。
  3. 64K 长文本支持

    • 增强对长文本大模型训练的支持,优化处理长文本理解和生成任务的能力。
  4. 支持混合专家模型 MoE

    • All2All 优化,针对 muDNN 算子优化不同形状下的矩阵运算,支持 MoE 大模型训练。
  5. 断点续训

    • 提升 Checkpoint 读写性能,提高训练效率。
  6. 优化 DeepSpeed

    • 适配摩尔线程 GPU 集群的 DeepSpeed 与 Ulysses,强化长文本训练支持。
    • 适配国内外多款大模型。
  7. 稳定性提升

    • 软硬件成熟,实现连续无故障训练 15 天。
    • 引入 KUAE Aegis 可靠性功能,加强监控、自动诊断与故障恢复能力。
  8. 可视化 / 可观测

    • 引入 PerfSight 性能监控系统,实时显示训练过程中的资源消耗与性能数据。
  9. 内置模型库新增大模型

    • 新增 LLaMA2 全系列、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。

本篇关于《摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布:支持 64K 长文本、新增 LLaMA2 全系列大模型等》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

声明:本文转载于:IT之家 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>