摩尔线程 MTT S5000 适配 FlagOS 训练全要素软件栈,实现 Qwen3-0.6B 端到端无中断训练
来源:IT之家原文链接

专属客服号

微信订阅号
大数据治理
全面提升数据价值
赋能业务提质增效
IT之家
3 月 27 日消息,摩尔线程今日发文,北京智源人工智能研究院(简称:智源研究院)正式发布重磅验证成果:六款 AI 芯片、三大模型、同构 + 异构千卡 —— 众智 FlagOS 以统一技术栈完成 AI 训练“全要素”验证。
IT之家注意到,作为本次验证的核心参与厂商之一,摩尔线程基于旗舰级 AI 训推一体全功能 GPU 智算卡 MTT S5000,完整适配了
FlagOS 训练全要素软件栈
—— 包括
FlagScale
系统调度决策框架、Megatron-LM 分布式训练框架、Transformer Engine 加速库、FlagGems 与
Triton
算子库,以及 FlagCX 通信库。

在此次验证中,MTT S5000 面向 Qwen3-0.6B 语言模型完成了 1T Tokens 从头训练验证,
实现连续 6 天以上、超过 14000 步的无中断稳定训练。
训练所得模型 Loss 曲线与基线高度一致,
平均相对误差控制在 0.82% 以内
;在标准下游任务评测中,
较行业标杆基线提升 1.65 个百分点
,充分验证了全功能 GPU 算力在大模型端到端训练中的稳定性与有效性。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。

