剑指NVIDIA CUDA生态?AMD发布ROCm 7.0

科技媒体 Wccftech 9 月 16 日消息,AMD 为打破英伟达 CUDA 在 AI 领域的垄断,发布 ROCm 7.0 计算软件堆栈,官网页面显示支持最新算法和模型、扩展 AMD 锐龙 AI 处理器和 AMD Radeon 显卡支持等。

剑指NVIDIA CUDA生态?AMD发布ROCm 7.0 - Image 1
图源:AMD

AMD 官方已经发布 ROCm 7.0 更新日志,其中最值得关注的改进,在于优化 AI 推理任务。AMD 宣称,在 DeepSeek R1 基准任务中,Instinct MI355X 的 FP8 吞吐量比 NVIDIA Blackwell B200 高出 30%。IT之家附上相关截图如下:

剑指NVIDIA CUDA生态?AMD发布ROCm 7.0 - Image 2
图源:AMD

AMD 还提供了 ROCm7 的实测结果,相比较 ROCm 6,在 Llama 3.1 70B 模型上性能提升 3.2 倍,Qwen2-72B 上性能提升 3.4 倍,而 DeepSeek R1 性能提升 3.8 倍。

剑指NVIDIA CUDA生态?AMD发布ROCm 7.0 - Image 3
图源:AMD

功能升级方面,ROCm 7.0 集成了最新算法与模型、先进的 AI 扩展特性、对 MI350 系列 GPU 的支持,以及集群管理与企业级功能,这些改进旨在提升大规模 AI 部署的可扩展性与稳定性。

新版本引入对 Instinct MI355X、MI350X 的支持,并新增 Ubuntu 24.04.3 与 Rocky Linux 9 系统兼容,同时淘汰了旧版 Ubuntu 与 SLES 15 SP6。

AI 框架支持也同步更新,包括 PyTorch 2.7、TensorFlow 2.19.1、ONNX Runtime 1.22.0、JAX 0.6.0、Triton 3.3.0、vLLM 等。相关数学库、通信库与工具链全面提档,进一步提升大模型和 HPC 场景表现。

出处:IT之家


吉ICP备2020006555号

ai987.cn

⌜ 免 责 声 明 ⌝
本站仅为个人学习AI(人工智能)知识的相关日志,网页内容(如有图片或视频亦包括在内)短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改,可联络处理(删/改)!