2026 年 6 月,国产 GPU 阵营迎来集体爆发。壁仞科技发布 BR104 训练芯片,摩尔线程发布 MTT S5000,性能均对标英伟达 H100,被业内视为国产高性能 AI 芯片的里程碑。
性能对比
BR104 单精度浮点性能达到 700 TFLOPS,HBM3 显存 96GB,互联带宽 800GB/s。MTT S5000 在 BF16 训练性能上对标 H100,已通过百度文心、智源研究院的实际训练任务验证。两家公司均强调使用「自主可控」的工艺与互联协议。
产业链协同
本土晶圆代工方面,中芯国际 14nm 改良工艺已具备稳定量产能力,HBM3 内存由长鑫存储和长江存储联合供应。软件栈层面,国产芯片厂商正在合作推进与 PyTorch、TensorFlow 的深度兼容,开发者迁移成本大幅降低。
不过分析师指出,国产 GPU 在 7nm 以下的先进制程、HBM4 和 NVLink 同等带宽的高速互联方面,仍与英伟达保持 1-2 代差距。要真正完成「替代」,还需要 2-3 个产品周期的迭代。

讨论 (0)
登录 后可参与讨论