Blackwell GPU 的性能有望比 H100 GPU 提高 7 到 30 倍,B200 GPU將取代 H100 成為數據中心最先進的 AI 加速器。
Blackwell GPU芯片
圖源:Nvidia
將兩個B200 GPU與一個基于Arm的Grace CPU進行配對,再通過900GB/s的超低功耗NVLink連接在一起,可以組成GB200超級芯片。Blackwell B200 GPU單顆芯片的功耗1000W,一顆Grace CPU和兩顆Blackwell GPU組成的超級芯片GB200的功耗達到了2700W。 Blackwell GB200 圖源:Nvidia GB200使用了NVLink5.0,每顆B200 GPU有18個NVLink5.0端口可以和交換芯片NVlink Switch 進行互聯,每個端口的速率是雙向100GB/s,由4對差分信號線組成。 英偉達GB200 NVL4是基于GB200擴展的一個全新模塊,GB200 NVL4模塊在更大的主板上配置兩個Grace CPU和4個Blackwell B200 GPU。具有4-GPU NVLink域和1.3T相干內存的單服務器解決方案。 GB200 NVL4 圖源:Nvidia超級芯片GB200
GB200 NVL4
將兩個GB200超級芯片合并安裝到一塊主板上,可以組成一個Blackwell計算節點。Blackwell Compute Node 也叫Compute Tray。
Blackwell Compute Node
圖源:Nvidia
把18個Blackwell 計算節點(Compute Tray)組合在一起,可以形成新一代計算單元:GB200 NVL72(Blackwell Node × 18 + NVLink Switch = GB200 NVL72)。 GB200 NVL72 包含18個Blackwell Compute Node 圖源:Nvidia 為了給18個Blackwell Compute Node提供數據交換能力,GB200 NVL72配備了9個NVLink交換節點(Switch Tray),每個交換節點中配置了2顆NVLink Switch芯片,向外提供14.4TB/s的聚合帶寬。 Blackwell NVLink Switch Tray 圖源:Nvidia Quantum-X800可提供 144 個 800Gbps 端口和 ConnectX-8 SuperNIC 設備端智能網卡。利用英偉達 SHARPv4x 協議進行的網內算力也提升了 9 倍,達到 14.4 Tflops。 Blackwell Quantum-X800 圖源:Nvidia 把若干GB200 NVL72計算單元用Quantum InfiniBand交換機連接起來,再配合上散熱系統,可以組成新一代DGX GB200 SuperPod集群。 DGX GB200 SuperPod 圖源:Deltacomputer DGX GB200 SuperPod 是一個包含32000塊GPU的分布式超算集群,采用新型高效液冷機架,可在FP4精度下提供11.5 Exaflops算力和240TB高速內存。 Blackwell GPU加速成長,重點關注光模塊、銅連接和PCB方向-廣大證券 英偉達官網:https://www.nvidia.comGB200 NVL72
Blackwell NVLink Switch Tray
Quantum-X800
DGX GB200 SuperPod