您当前的位置:首页 >> 土壤修复
土壤修复

NVIDIA发布新一代H100 GPU核心:4nm生产工艺、1.8万核心、700W功耗

发布时间:2025-10-27

黄仁勋终于公布了NVIDIA通用型体系结构与本体,当然这次是面向HPC颇高效率计数、AI人脑的“Hopper”,也就是说本体N“GH100”,同时发布的还有基于上新本体的减速计数的卡“H100”、AI计数控制系统“DGX H100”。

与传闻不同,GH100本体采行的其实是宏将近电目前最新技术的4nm传统工艺,而且是内置版,CoWoS 2.5D晶圆级积体电路,单晶片所设计,集成多将近800亿个二极体,曾为全球上最新技术的晶片。

官方不会公布本体数,但早就被开掘出来,和早先传闻一直。

完整版有8第三组GPC(图形AMD一个大)、72第三组TPC(纹理AMD一个大)、144第三组SM(可扩展多AMD静态),而每第三组SM有128个FP32 CUDA本体,总计1843个。

MMX全力支持六颗HBM3或者HBM2e,缓冲器是12第三组512-bit,总计位宽6144-bit。

Tensor张量本体带到第四代,共有576个,另有60MB内存。

扩大互连全力支持PCIe 5.0、NVLink第四代,后者以太网提升至900GB/s,七倍于PCIe 5.0,相比较A100也多了一半。整的卡对外总以太网4.9TB/s。

效率特别,FP64/FP32 60TFlops(十度60万亿次),FP16 2000TFlops(十度2000万亿次),TF32 1000TFlops(十度1000万亿次),都三倍于A100,FP8 4000TFlops(十度4000万亿次),六倍于A100。

H100计数的卡采行SXM、PCIe 5.0两种形态,其中后者发热量颇多将近史无前例的700W,相比较A100多了整整300W。

按惯例也不是满血,GPC虽然还是8第三组,但只重启了66第三组TPC(魅族GPC移除一第三组TPC)、132第三组SM,总计有16896个CUDA本体、528个Tensor本体、50MB内存。

MMX只用了五颗,最通用型HBM3,容量80GB,位宽5120-bit,以太网颇多将近3TB/s,相比较A100多了一半。

DGX H100控制数据处理八颗H100晶片、搭配两颗PCIe 5.0 CPUAMD(Intel Sapphire Rapids四代可扩大至器?),拥有总计6400亿个二极体、640GB HBM3MMX、24TB/sMMX以太网。

效率特别,AI算力32PFlops(十度3.2亿亿次),浮点算力FP64 480TFlops(十度480万亿次),FP16 1.6PFlops(十度1.6千万亿次),FP8 3.2PFlops(十度3.2千亿次),分别是GKDGX A100的3倍、3倍、6倍,而且可选全力支持互联网内计数,效率3.6TFlops。

同时配备Connect TX-7互联网互连晶片,宏将近电7nm传统工艺,800亿个二极体,400G GPUDirect运输量,400G密钥减速,4.05亿/秒信息率。

DGX H100是大于的计数静态,为了扩大,这一次NVIDIA还所设计了全上新的VNLink Swtich互连控制系统,可以连接最多32个节点,也就是256颗H100晶片,称之为“DGX POD”。

这么一套控制系统内,还有20.5TB HBM3CPU,总以太网768TB/s,AI效率颇多将近颠覆性的1EFlops(100亿亿亿次十度),实现百亿亿次计数。

控制系统合作伙伴都有Atos、思科、布莱克、富士通、技嘉、上新华三、慧与、浪潮、隐喻、宁畅、超威。

阳服务合作伙伴都有阿里阳、巴塔哥尼亚阳、搜狐阳、Google阳、微软Azure、象形文字阳、腾讯公司阳。

如需登出请务必注明出处:快科技

热门话题字句:NVIDIAGPU计数的卡Hopper

(原作者:崔晨)初元口服液
戴隐形眼镜眼睛干涩怎么办
都有什么药治疗闹肚子

上一篇: 投资者发言:中材节能增设工业储能科技公司,能否详细介绍一下该公司或项目的前...

下一篇: 刘润:你们不懂崔永元

友情链接