ROCm 7+双代AI系统!AMD向NVIDIA 发起全面挑战

500

本文由半导体产业纵横(ID:ICVIEWS)综合

速度与激情。

在全球人工智能(AI)技术高速发展的背景下,AMD 正在积极拓展其软硬件生态系统,并加快产品迭代节奏,以挑战 NVIDIA 在数据中心和 AI 领域长期占据的主导地位。近日,AMD 发布了全新的 ROCm 7 软件堆栈,并详细披露了未来两年内的 AI 产品路线图,包括基于 EPYC“Venice”处理器和 Instinct MI400X 系列加速器的 Helios 机架系统,以及计划于 2027 年推出的第二代机架级解决方案。

ROCm 7:强化 AI 开发者生态

作为AMD GPU 计算平台的核心组成部分,ROCm(Radeon Open Compute)软件堆栈此次更新至第 7 版本,标志着该公司在 AI 生态建设上的进一步深化。ROCm 7 包含多个增强型框架,如 vLLM v1、llm-d 和 SGLang,这些工具旨在提升大语言模型(LLM)推理效率并简化开发者的工作流程。

新版本不仅支持最新算法和模型架构,还增强了对高级AI 功能的支持,例如多模态处理、模型压缩和分布式训练优化。同时,ROCm 7 对 MI350 系列 GPU 提供全面支持,提升了集群管理和资源调度能力,为大规模 AI 工作负载提供更强的可扩展性。

此外,ROCm 7 还强化了企业级功能,包括安全性、稳定性及与主流 AI 框架(如 PyTorch 和 TensorFlow)的兼容性。这一系列改进使得 ROCm 成为 AI 开发者和企业部署 AI 解决方案时更具吸引力的选择。

2026 年:推出首款自主设计 Helios 机架级 AI 系统

在硬件层面,AMD 明确表示将在 2026 年推出其首款自主设计的 Helios 机架级 AI 系统。该系统将整合多项新一代技术,成为 AMD 在高性能计算(HPC)和 AI 推理领域的标志性产品。

Helios 系统的核心是即将发布的 256 核 EPYC“Venice”处理器,这款 CPU 基于 Zen 5 架构打造,预计相比上一代 EPYC 处理器性能提升高达 70%。Venice 将提供更强大的多线程能力和更高的内存带宽,特别适合用于管理复杂的 AI 模型训练任务。

除了CPU,Helios 还搭载 Instinct MI400X 系列加速器,后者预计将使 AI 推理性能较当前的 Instinct MI355X 提升一倍。MI400X 支持最新的 UEC 1.0 规范,并与 Pensando “Vulcano”800 GbE 网卡深度集成,显著提升数据传输效率和网络延迟表现。

通过Helios 系统的推出,AMD 不仅展示了其在软硬件协同方面的创新能力,也为其在 AI 市场中建立差异化竞争力奠定了基础。

2027 年:第二代机架级系统与 Instinct MI500X 登场

在2026 年 Helios 系统之后,AMD 还计划在 2027 年推出第二代机架级 AI 解决方案,继续推进其“每年一次”的产品更新节奏。新一代系统将继续采用 AMD 自主设计的架构,搭载全新的 EPYC“Verano”CPU 和 Instinct MI500X GPU,进一步突破性能效率和可扩展性的极限。

根据AMD CEO 苏姿丰在“Advancing AI”活动上的讲话,2027 年的机架级系统将是“性能密度”和“能效比”的又一次飞跃。虽然目前尚未公布具体规格和性能数据,但从现场展示的图片来看,新一代系统将配备更多计算刀片,意味着更强的并行计算能力和更高的整体性能输出。

其中,EPYC“Verano”CPU 预计将继续采用台积电先进制程工艺,可能引入 Zen 6 或 Zen 6c 架构,带来更出色的单核性能和核心密度。而 Instinct MI500X 则有望采用 RDNA 4 或 CDNA 4 架构,针对 AI 训练和推理进行深度优化。

值得注意的是,台积电计划在2026 年底推出 A16 制程技术,这是其首个支持背面供电的量产节点,特别适用于高功耗、高性能的数据中心芯片。AMD 是否会在 2027 年的产品中采用 A16 技术,目前尚无官方确认,但业内普遍认为这种可能性非常大。

直面NVIDIA:AMD 的 AI 挑战之路

随着ROCm 7 的发布和 2026-2027 年产品路线图的逐步清晰,AMD 正在向市场传达一个明确信号:它不仅要在硬件性能上追赶 NVIDIA,在软件生态、系统集成和整体解决方案方面也将形成有力竞争。

目前,NVIDIA 凭借其 Hopper 架构 GPU、CUDA 生态系统和 NVL72、NVL576(Kyber)等机架级系统牢牢占据 AI 市场的主导地位。尤其是 NVL576 Kyber 系统,集成了多达 144 个 Rubin Ultra 封装,每个封装都包含光罩大小的计算元件,代表了当前 AI 硬件的巅峰水平。

面对如此强劲的对手,AMD 正在通过“红队”策略积极进取,不断缩小差距。从 ROCm 生态的持续优化,到 Helios 系统的首次亮相,再到 2027 年 MI500X 与 Verano CPU 的联合出击,AMD 正在构建一条完整且具有竞争力的 AI 产品链。

AMD 此次发布 ROCm 7 软件堆栈,并披露 2026 至 2027 年的 AI 产品路线图,标志着其在人工智能领域的战略布局已进入加速阶段。无论是从软件生态、芯片架构还是整机系统层面,AMD 都在积极寻求突破,力求在与 NVIDIA 的竞争中赢得更多市场份额。

未来几年将是AI 硬件和软件生态激烈竞争的关键时期,AMD 是否能够凭借其创新技术和产品组合实现弯道超车,值得我们持续关注。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

站务

全部专栏