皮褸佬頭痕了

發表人 **mtr** 發表於 2025-05-08, 21:52

https://x.com/Compute_King/status/1920343594663047486

告别英伟达？华为昇腾已经跑通训练准万亿参数的大模型

我记得前几天还有人讽刺说用华为根本跑不起来，各路闲人纷纷点赞。

简单说，以前要训练接近一万亿参数的模型，大家都得靠英伟达GPU才行。但华为直接在自家的昇腾（Ascend）NPU平台上，实现了对7,180亿参数MoE（稀疏专家模型）稳定的长时间训练。

最新公布的技术报告里披露，华为盘古团队（含诺亚方舟实验室和华为云）在超过6,000块昇腾NPU组成的集群上，靠多项系统级优化，一口气解决了跑大模型的负载均衡、通信开销和效率低下等“拦路虎”。

这些创新的优化一上来，训练速度立马嗖嗖往上涨，直接把顶尖大模型的研发给顶住了！从此，大厂也不用非得买英伟达GPU做训练了 —— “国产”两字，在大模型硬件上砝码越压越重。

华为技术报告链接： http://arxiv.org/pdf/2505.04519

發表人 **joe** 發表於 2025-05-08, 23:02

發表人 **streamboy** 發表於 2025-05-09, 19:31

係佢真係頭痛

誰在線上

皮褸佬頭痕了

皮褸佬頭痕了

Re: 皮褸佬頭痕了

Re: 皮褸佬頭痕了