专题:2025寰宇东谈主工智能大会 新浪科技讯 7月27日午间音问,2025寰宇东谈主工智能大会(WAIC 2025)于7月26-28日在上海举办。大会期间,摩尔线程初次建议了“AI工场”理念,公司独创东谈主兼CEO张建中在共享中暗意,“为轻视生成式AI爆发式增长下的大模子训练效果瓶颈,摩尔线程将通过系统级工程立异,构建新一代AI训练基础治安,为AGI期间打造坐褥先进模子的“超等工场”。 ![]() 据悉,摩尔线程建议的“AI工场”,如同芯片晶圆厂的制程升级,需要好意思满从底层芯片架构立异、到集群合座架构的优化,再到软件算法调优和资源调遣系统的全面升级。这种全方向的基础治安变革,将鼓舞AI训练从千卡级向万卡级乃至十万卡级范畴演进,以系统级工程好意思满坐褥力和立异效果飞跃。 具体而言,这座“AI工场”的智能“产能”,由五大中枢身分共同决定,其效果公式可详尽为:AI工场坐褥效果=加快野心通用性×单芯片灵验算力×单节点效果×集群效果×集群相识性。摩尔线程将以GPU通用算力为基石,将通过先进架构、芯片算力、单节点效果、集群效果优化与可靠性等协同等深度时间立异,将全功能GPU加快野心平台身手滚动为工程级训练效果与可靠性保险。 在单芯片算力方面,摩尔线程的GPU单芯片基于MUSA架构的冲破性设想,可集成AI野心加快、图形渲染、物理仿真及超高清视频编解码身手,充分适配AI训推、具身智能、AIGC等种种化利用场景。且在野心精度方面因循从FP64至INT8的无缺精度谱系,并通过FP8夹杂精度时间,在主流前沿大模子训练中好意思满20%~30%的性能跃升。 在内存与通讯效果优化上,摩尔线程内存系统通过多精度近存规约引擎、低延长Scale-Up、通算并行资源进犯等时间,好意思满了50%的带宽松懈和60%的延长裁汰。在通讯和互联范畴,开创ACE异步通讯引擎减少了15%的野心资源损耗,MTLink2.0互联时间提供了跨越西大家业平均水平60%的带宽,为大范畴集群部署奠定了坚实基础。 在构建高效集群的基础上,相识可靠的开始环境是“AI工场”抓续产出的保险。相配在万卡级AI集群中,硬件故障导致的训练中断会严重残害算力。摩尔线程立异推出零中断容错时间,故障发生时仅进犯受影响节点组,其余节点链接训练,备机无缝接入,全程无中断。这一决策使KUAE集群灵验训练时候占比超99%,大幅裁汰复原支出。(文猛) ![]() 包袱裁剪:王翔 |