nVIDIA|白皮书揭示了英伟达Hopper大芯片的关键规格
为英伟达下一代 H100 加速卡提供支撑的 GH100 芯片,纸面规格已经让人感到十分惊讶 。不过周末曝光的白皮书,又让我们对其有了更深入的了解 。据悉,绿厂正在积极利用台积电的 N4(4nm 级 EUV)先进工艺来构建 Hopper GPU,而 H100 大芯片更是被六个 HBM3 高带宽显存堆栈给环绕着 。
访问购买页面:
京东NVIDIA系列商品汇总
文章图片
(图 via ComputerBase.de)
TechPowerUp 指出:GH100 计算芯片拥有 800 亿个庞大的晶体管数量,较 GA100 增加近 50%。
文章图片
Hopper GPU 的流处理器设计
有趣的是,在 4nm EUV 工艺的加持下,GH100 的芯片面积却只有 814 m㎡,小于基于 7nm DUV(台积电 N7 工艺)节点制造的 GA100(826 m㎡) 。
文章图片
Ampere GPU 的流处理器设计
由图可知,英伟达 GH100 的组件层次结构与上一代类似,主要数学运算部分被布置到了 144 组流处理器(SM)上 。
GH100 拥有 18432 个 FP32(单精度)/ 9216 个 FP64 (双精度)CUDA 核心,辅以 576 个第四代 Tensor 核心,此外硅片上其中一组 GPC 具有光栅图形单元 。
文章图片
鉴于 GH100 具有 6144-bit 的 HBM3 显存位宽,英伟达或为其标配 80GB VRAM,预计带宽可超 3 TB/s(且有 ECC 加持) 。
主机接口也迎来了重大升级,且 SXM 外形的 PCB 板上配备了最新一代 NVLink 界面(具有 900 GB/s 的带宽) 。
文章图片
AIC 插卡版本则是采用了 PCIe 5.0 x16(128 GB/s)接口,且两者都引入了资源池(resource-pooling)功能 。
最后,英伟达正在用更高的功耗来压榨更多的性能 —— 可知 H100 的典型功率值为 700W,而 A100 仅为 400W。
文章图片
不过 H100 并非满血 SKU,即使高密度的 SXM 外形版本,也只启用了 144 组 SM 单元中的 132 个。
【nVIDIA|白皮书揭示了英伟达Hopper大芯片的关键规格】PCIe 插卡版本更是仅启用了 114 个 SM 单元,且两者的最高时钟速率都是 1.80 GHz。
推荐阅读
- nVIDIA|RTX 40系显卡爆料信息汇总:性能翻倍 价格/功耗感人
- nVIDIA|英伟达GeForce RTX 4090旗舰游戏显卡或率先突破100 TFLOPs算力
- nVIDIA|英伟达挖走英特尔CPU架构师 将负责未来Arm架构产品的研发
- nVIDIA|NVIDIA GeForce RTX 4080/4070显卡参数曝光 显存数量大增
- nVIDIA|NVIDIA现招募到前英特尔设计经理Rafi Marom
- nVIDIA|NVIDIA H100 Hopper加速计算卡上市:配备80GB显存 价格超24万元
- nVIDIA|NVIDIA更新GeForce Now 为Apple Silicon处理器提供原生支持
- nVIDIA|传英伟达正在测试900W TGP功耗的AD102 GPU产品
- nVIDIA|英伟达四月Studio驱动更新 RTX 3090硬件加速可节省大把CPU渲染用时
- 硬件|10年轮回 AMD、NVIDIA新一代显卡再次同时使用台积电代工