全球首個(gè)基于 NVIDIA A100 的 AI 系統
NVIDIA DGX ? A100 是適用于所有 AI 工作負載的通用系統,在全球首個(gè) 5 petaFLOPS AI 系統中提供前所未有的計算密度、性能和靈活性。NVIDIA DGX A100 采用世界上最先進(jìn)的加速器 NVIDIA A100 Tensor Core GPU,使企業(yè)能夠將訓練、推理和分析整合到統一、易于部署的 AI 基礎設施中,包括直接訪(fǎng)問(wèn) NVIDIA AI 專(zhuān)家。
AI 數據中心的基本構建塊
一種更簡(jiǎn)單、更快速的人工智能解決方法
NVIDIA AI Starter Kit 提供您團隊所需的一切——從世界一流的 AI 平臺到優(yōu)化的軟件和工具,再到咨詢(xún)服務(wù)——讓您的 AI 計劃快速啟動(dòng)和運行。不要浪費時(shí)間和金錢(qián)來(lái)構建 AI 平臺。一天內插入并通電,一周內獲得定義的用例,并更快地開(kāi)始生產(chǎn)模型。
改變游戲規則的性能
NVIDIA DGX A100 內部技術(shù)
NVIDIA A100 張量核心 GPU
NVIDIA A100 Tensor Core GPU 為人工智能、數據分析和高性能計算 (HPC) 提供前所未有的加速,以應對世界上最嚴峻的計算挑戰。借助第三代NVIDIA Tensor 核心提供的巨大性能提升,A100 GPU 可以有效地擴展到數千個(gè),或者借助多實(shí)例 GPU,將其分配為七個(gè)較小的專(zhuān)用實(shí)例,以加速各種規模的工作負載。
多實(shí)例 GPU (MIG)
借助 MIG,DGX A100 中的 8 個(gè) A100 GPU 可以配置為多達 56 個(gè) GPU 實(shí)例,每個(gè)實(shí)例都與自己的高帶寬內存、緩存和計算內核完全隔離。這允許管理員為多個(gè)工作負載調整 GPU 的大小并保證服務(wù)質(zhì)量 (QoS)。
下一代 NVLink 和 NVSwitch
DGX A100 中的第三代 NVIDIA ? NVLink ?將 GPU 到 GPU 的直接帶寬翻倍,達到每秒 600 GB (GB/s),比 PCIe Gen4 高出近 10 倍。DGX A100 還配備了下一代 NVIDIA NVSwitch?,其速度比上一代快 2 倍。
Mellanox ConnectX-6 VPI HDR InfiniBand
DGX A100 采用最新的 Mellanox ConnectX-6 VPI HDR InfiniBand/以太網(wǎng)適配器,每個(gè)適配器都以 200 Gb/s (Gb/s) 的速度運行,為大規模 AI 工作負載創(chuàng )建高速結構。
優(yōu)化的軟件堆棧
DGX A100 集成了經(jīng)過(guò)測試和優(yōu)化的 DGX 軟件堆棧,包括經(jīng)過(guò) AI 調優(yōu)的基礎操作系統、所有必要的系統軟件以及 GPU 加速的應用程序、預訓練模型,以及來(lái)自NGC ? 的更多內容。
內置安全性
DGX A100 為 AI 部署提供最強大的安全狀態(tài),采用多層方法,涵蓋基板管理控制器 (BMC)、CPU 板、GPU 板、自加密驅動(dòng)器和安全啟動(dòng)。