在刚刚结束的2025全球 AI 发展大会上,AMD 与 OpenAI 联合推出了最新的 Instinct MI400和 MI350系列 AI 芯片。这次发布会吸引了众多行业人士的关注,OpenAI 首席执行官 Sam Altman 也亲自出席,分享了与 AMD 在芯片研发过程中的合作经验。
强大的 AI 计算能力
AMD 新发布的 Instinct MI350系列 GPU 基于 CDNA4架构,专为现代 AI 基础设施设计。其中,MI350X 和 MI355X 两款 GPU 显著提升了 AI 计算性能。MI350系列配备288GB HBM3E 内存,内存带宽高达8TB/s,相较于上一代产品,AI 计算能力提升了4倍,推理性能更是提升了35倍。
与竞争对手英伟达的芯片相比,MI355X 每美元能提供多达40% 的额外 tokens,表现出色。MI355X 的 FP4性能可达到161PFLOPS,而 MI350X 在 FP16性能上可达到36.8PFLOPS,确保了在 AI 应用中的高效运行。
灵活的冷却与部署方案
AMD 的 GPU 设计不仅关注性能,还提供多种灵活的冷却配置,支持大规模部署。例如,在风冷机架中最多可以支持64个 GPU,而在直接液体冷却环境中则可支持多达128个 GPU,极大地增强了其应用的灵活性。
开源 AI 加速平台 ROCm7
为进一步提升 GPU 性能,AMD 还推出了开源 AI 加速平台 ROCm7。经过一年的发展,ROCm 现已成熟,并与多个世界领先的 AI 平台深度整合,如 LLaMA 和 DeepSeek。即将发布的 ROCm7版本将提供超过3.5倍的推理性能提升,为 AI 开发者提供了强大的技术支持。
下一代旗舰 AI 芯片 MI400
Instinct MI400系列是 AMD 下一代旗舰 AI 芯片,预计将搭载高达432GB 的 HBM4高速显存,内存带宽可达300GB/s。MI400在 FP4精度下的计算性能可达到40petaflops,专为 AI 训练中的低精度计算进行优化。此外,MI400系列通过 UALink 技术实现72个 GPU 的无缝互联,使其成为一个统一的计算单元,打破传统架构的通信瓶颈。
多家企业的合作前景
目前,Oracle、微软、Meta、xAI 等多家企业正在与 AMD 合作使用其 AI 芯片,Oracle 将在其云基础设施中首批采用 Instinct MI355X 驱动的解决方案。Oracle 云基础设施执行副总裁 Mahesh Thiagarajan 表示,与 AMD 的合作极大提升了其服务的可扩展性和可靠性,未来将继续深化合作。