直击WAIC丨奈何缓解AI训练“效果瓶颈”？摩尔线程张建中：打造AGI“超等工场”

专题：2025寰宇东谈主工智能大会

　　新浪科技讯 7月27日午间音问，2025寰宇东谈主工智能大会（WAIC 2025）于7月26-28日在上海举办。大会期间，摩尔线程初次建议了“AI工场”理念，公司独创东谈主兼CEO张建中在共享中暗意，“为轻视生成式AI爆发式增长下的大模子训练效果瓶颈，摩尔线程将通过系统级工程立异，构建新一代AI训练基础治安，为AGI期间打造坐褥先进模子的“超等工场”。

　　据悉，摩尔线程建议的“AI工场”，如同芯片晶圆厂的制程升级，需要好意思满从底层芯片架构立异、到集群合座架构的优化，再到软件算法调优和资源调遣系统的全面升级。这种全方向的基础治安变革，将鼓舞AI训练从千卡级向万卡级乃至十万卡级范畴演进，以系统级工程好意思满坐褥力和立异效果飞跃。

　　具体而言，这座“AI工场”的智能“产能”，由五大中枢身分共同决定，其效果公式可详尽为：AI工场坐褥效果=加快野心通用性×单芯片灵验算力×单节点效果×集群效果×集群相识性。摩尔线程将以GPU通用算力为基石，将通过先进架构、芯片算力、单节点效果、集群效果优化与可靠性等协同等深度时间立异，将全功能GPU加快野心平台身手滚动为工程级训练效果与可靠性保险。

　　在单芯片算力方面，摩尔线程的GPU单芯片基于MUSA架构的冲破性设想，可集成AI野心加快、图形渲染、物理仿真及超高清视频编解码身手，充分适配AI训推、具身智能、AIGC等种种化利用场景。且在野心精度方面因循从FP64至INT8的无缺精度谱系，并通过FP8夹杂精度时间，在主流前沿大模子训练中好意思满20%~30%的性能跃升。

　　在内存与通讯效果优化上，摩尔线程内存系统通过多精度近存规约引擎、低延长Scale-Up、通算并行资源进犯等时间，好意思满了50%的带宽松懈和60%的延长裁汰。在通讯和互联范畴，开创ACE异步通讯引擎减少了15%的野心资源损耗，MTLink2.0互联时间提供了跨越西大家业平均水平60%的带宽，为大范畴集群部署奠定了坚实基础。

　　在构建高效集群的基础上，相识可靠的开始环境是“AI工场”抓续产出的保险。相配在万卡级AI集群中，硬件故障导致的训练中断会严重残害算力。摩尔线程立异推出零中断容错时间，故障发生时仅进犯受影响节点组，其余节点链接训练，备机无缝接入，全程无中断。这一决策使KUAE集群灵验训练时候占比超99%，大幅裁汰复原支出。（文猛）

海量资讯、精确解读，尽在新浪财经APP

包袱裁剪：王翔

直击WAIC丨奈何缓解AI训练“效果瓶颈”？摩尔线程张建中：打造AGI“超等工场”

QQ咨询

QQ：