You dont have javascript enabled! Please enable it!
百度/360权5,日IP1w+ 查看详情
立即入驻

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

AMD推出了最新的Instinct MI325X AI GPU加速器,配备了256 GB HBM3e内存,而明年的MI355X将配备288 GB。

AMD全力以赴推出HBM3e内存:今年MI325X“CDNA 3”配备256 GB,明年MI355X“CDNA 4”配备288 GB

在今天的“推进AI”事件中,AMD推出了全新的Instinct MI325X AI GPU加速器,增强了MI300X的全新功能。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

但在详细介绍之前,我们必须谈谈AMD的Instinct平台整体,该平台获得了全球顶级AI公司的支持,并被一些大品牌如Meta、和微软所使用。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

AMD对性能领先、易于迁移、开放生态系统和以客户为中心的产品组合的承诺,赢得了主要OEM和云合作伙伴的巨大支持,因此,随着行业对AI的需求达到前所未有的高度,公司迅速推进了下一代解决方案的发布。

AMD MI325X 配备256 GB内存和CDNA 3架构

目前,AMD的MI300X在一系列特定于AI的工作负载中,性能比 H100高出30%。AMD对其ROCm套件的改进正在帮助从旗舰加速器中提取更多性能,但现在是时候在同样强大的软件支持下,构建更好的硬件了。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

介绍一下AMD Instinct MI325X,这款全新的加速器基于与MI300X相同的基本设计和架构。使用CDNA 3 GPU架构,MI325X可以被视为一次中期升级,提供256 GB的HBM3e内存,采用16-Hi堆叠,内存带宽高达6 TB/s,FP8性能为2.6 PFLOPs,FP16性能为1.3 PFLOPs,所有这些都集成在一个拥有1530亿个晶体管的芯片中。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

AMD预计Instinct MI325X AI GPU的首次生产将于2024年第四季度开始,相关服务器解决方案将于2025年第一季度通过主要合作伙伴提供。这些AI Instinct服务器将配备多达8个MI325X配置,内存高达2 TB HBM3e,Infinity Fabric带宽为896 GB/s,内存带宽为48 TB/s,FP8性能为20.8 PFLOPs,FP16性能为10.4 PFLOPs。每个GPU的功耗配置为1000W,较MI300X的750-700W配置有了显著提升。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

深入分析数据,AMD声称Instinct MI325X AI GPU加速器在Mixtral 8x7B中比NVIDIA H200快40%,在Mistral 7B中快30%,在Meta Llama 3.1 70B LLMs中快20%。一个8x MI325X平台在Llama 3.1 405B中也将比H200 HGX AI平台快40%,在70B推理测试中快20%。在AI训练方面,MI325X的性能与H200平台相当,或提高10%。

AMD MI355X 配备288 GB内存和CDNA 4架构

明年,AMD计划推出全新的Instinct MI355X GPU加速器,专注于AI工作负载,该加速器将采用3nm工艺节点。GPU将采用CDNA 4架构。在规格方面,内存将升级到更高的容量,最高可达288 GB HBM3e,并支持FP4/FP6数据类型。

AMD表示,CDNA 4架构相较于CDNA 3实现了35倍的性能飞跃,AI计算能力提高了7倍,内存容量/带宽提高了50%,并且还引入了最新的网络效率改进。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

在性能方面,AMD Instinct MI355X AI GPU将提供高达2.3 PFLOPs的FP16性能,比MI325X提高80%;FP8性能也提高80%,达到4.6 PFLOPs。新的FP6和FP4计算性能为9.2 PFLOPs。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

MI355X将实现内存容量和带宽的50%提升,速度高达8 TB/s,超越当前的MI300X。首批搭载八个MI355X GPU的平台将在2025年下半年推出,提供高达2.3 TB的HBM3E内存,带宽为64 TB/s,FP16性能为18.5 PFLOPs,FP8性能为37 PFLOPs,以及FP6/FP4计算性能为74 PFLOPs。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

ROCm 6.2继续提升Instinct的AI性能

回到软件方面,AMD宣布最新的ROCm 6.2生态系统,在推理和训练性能方面,平均性能提升为2.4倍,某些AI工作负载可达到2.8倍。

AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍
AMD Instinct MI325X 是首款配备 256 GB HBM3e 内存、明年配备 288 GB MI355X“CDNA 4”的 AI GPU,性能提升 8 倍

最后,AMD仍在确认其Instinct MI400将在2026年发布,作为“CDNA Next”产品,而不使用最近披露的UDNA架构名称。也许现在使用UDNA命名为时尚早,因为AMD尚未正式确认这一点,尽管他们的一位高级代表已经确认了。

总的来说,AMD似乎在未来的Instinct产品中全力以赴投入AI热潮,与NVIDIA展开激烈竞争,同时也在迎头赶上Intel。

AMD Instinct AI加速器:

加速器名称AMD Instinct MI400AMD Instinct MI350XAMD Instinct MI325XAMD Instinct MI300XAMD Instinct MI250X

GPU架构CDNA NextCDNA 4Aqua Vanjaram (CDNA 3)Aqua Vanjaram (CDNA 3)Aldebaran (CDNA 2)
GPU工艺节点TBD3nm5nm+6nm5nm+6nm6nm
GPU芯片TBD8 (MCM)8 (MCM)8 (MCM)2 (MCM)
1 (Per Die)
GPU核心TBDTBD19,45619,45614,080
GPU时钟速度TBDTBD2100 MHz2100 MHz1700 MHz
INT8计算TBDTBD2614 TOPS2614 TOPS383 TOPs
FP6/FP4计算TBD9.2 PFLOPsN/AN/AN/A
FP8计算TBD4.6 PFLOPs2.6 PFLOPs2.6 PFLOPsN/A
FP16计算TBD2.3 PFLOPs1.3 PFLOPs1.3 PFLOPs383 TFLOPs
FP32计算TBDTBD163.4 TFLOPs163.4 TFLOPs95.7 TFLOPs
FP64计算TBDTBD81.7 TFLOPs81.7 TFLOPs47.9 TFLOPs
显存TBD288 HBM3e256 GB HBM3e192 GB HBM3128 GB HBM2e
Infinity CacheTBDTBD256 MB256 MBN/A
内存时钟TBD8.0 Gbps?5.9 Gbps5.2 Gbps3.2 Gbps
内存总线TBD8192-bit8192-bit8192-bit8192-bit
内存带宽TBD8 TB/s6.0 TB/s5.3 TB/s3.2 TB/s
外形因素TBDOAMOAMOAMOAM
冷却TBD被动冷却被动冷却被动冷却被动冷却
TDP(最大)TBDTBD1000W750W560W

本文提到的产品

AMD Instinct MI300X

USD 25,999

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...