生成式 AI 和大語言模型(LLM)不斷推動突破性創(chuàng)新,訓練和推理對算力的需求也隨之急劇上升。
這些現(xiàn)代生成式 AI 應用需要全棧加速計算,首先要有能夠快速、準確處理大量工作負載的先進基礎設施。為了幫助滿足這一需求,Oracle 云基礎設施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU,同時 NVIDIA L40S GPU 也即將在 OCI Compute 上推出。
OCI 上的 NVIDIA
H100 Tensor Core GPU 實例
OCI Compute 裸機實例配備了具有NVIDIA Hopper架構的 NVIDIA H100 GPU,不僅大幅提升了大規(guī)模 AI 和高性能計算的性能,也為各種工作負載提供了前所未有的性能、可擴展性和通用性。
相比于NVIDIA A100 Tensor Core GPU,使用 NVIDIA H100 GPU 的企業(yè)可提升 30 倍的 AI 推理性能和 4 倍的 AI 訓練性能。H100 GPU 專為資源密集型計算任務構建,包括訓練 LLM 和在運行 LLM 的同時進行推理等。
BM.GPU.H100.8 OCI Compute 機型配置(Shape)包含 8 顆 NVIDIA H100 GPU,每顆都具有 80GB 的 HBM2 GPU 內(nèi)存。8 顆 GPU 之間的 3.2TB/s 雙向帶寬使每顆 GPU 都能通過 NVIDIA NVSwitch 和 NVLink 4.0 技術與其他 7 顆 GPU 直接通信。該配置還包含 16 塊容量為 3.84TB 的本地 NVMe 硬盤、112 個內(nèi)核的第四代英特爾至強 CPU 處理器以及 2TB 系統(tǒng)內(nèi)存。
簡而言之,該機型配置針對企業(yè)最具挑戰(zhàn)性的工作負載進行了優(yōu)化。
根據(jù)工作負載的時間線和規(guī)模,OCI Supercluster 使企業(yè)能夠通過高性能、超低延遲的網(wǎng)絡,將所使用的 NVIDIA H100 GPU 從單個節(jié)點擴展到多達數(shù)萬顆 H100 GPU。
OCI 上的 NVIDIA L40S GPU 實例
NVIDIA L40S GPU 基于 NVIDIA Ada Lovelace 架構構建而成,是一款數(shù)據(jù)中心的通用 GPU,可以為 LLM 推理和訓練、視覺計算以及視頻應用提供驚人的多負載加速。搭載 NVIDIA L40S GPU 的 OCI Compute 裸機實例將于今年晚些時候推出搶先體驗版本,并于 2024 年初全面上市。 這些實例將作為 NVIDIA H100 和 A100 GPU 實例的替代方案,用于處理中小型 AI 工作負載以及圖形和視頻計算任務。相比于 NVIDIA A100,NVIDIA L40S GPU 可將生成式 AI 工作負載的性能提升 20%,將微調(diào) AI 模型方面的性能提升 70%。 BM.GPU.L40S.4 OCI Compute 機型配置包含 4 顆 NVIDIA L40S GPU,以及多達 112 個核的最新一代英特爾至強 CPU、1TB 系統(tǒng)內(nèi)存、15.36TB 用于緩存數(shù)據(jù)的低延遲 NVMe 本地存儲和 400GB/s 集群網(wǎng)絡帶寬。創(chuàng)建該實例的目的是應對從 LLM 訓練、微調(diào)和推理一直到 NVIDIA Omniverse 工作負載以及工業(yè)數(shù)字化、3D 圖形和渲染、視頻轉碼和 FP32 HPC 等各種用例。NVIDIA 與 OCI:企業(yè)級 AI
OCI 與 NVIDIA 的協(xié)作,將為各種規(guī)模的企業(yè)帶來最先進的 NVIDIA H100 和 L40S GPU 加速基礎設施,助力企業(yè)加入到這場生成式 AI 革命。僅訪問 NVIDIA GPU 加速實例可能還不夠。若要在 OCI Compute 上釋放 NVIDIA GPU 的最大潛能,就必須擁有一個最好的軟件層。NVIDIA AI Enterprise 通過專為底層 NVIDIA GPU 基礎設施優(yōu)化的開源容器和框架,簡化了企業(yè)級加速 AI 軟件的開發(fā)和部署,所有這一切都離不開支持服務的幫助。如要了解更多信息,歡迎訪問有關 Oracle 云基礎設施(OCI)、OCI Compute、Oracle 如何邁向 AI 以及 NVIDIA AI Platform 網(wǎng)頁。
Oracle 云基礎設施(OCI):https://www.oracle.com/cloud/
OCI Compute:https://www.oracle.com/cloud/compute/
Oracle 如何邁向 AI:https://www.oracle.com/artificial-intelligence/
NVIDIA AI Platform:https://www.nvidia.cn/ai-data-science/
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”或掃描下方海報二維碼,關注更多會議及活動信息。
原文標題:Oracle 云基礎設施提供新的 NVIDIA GPU 加速計算實例
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3770瀏覽量
90985
原文標題:Oracle 云基礎設施提供新的 NVIDIA GPU 加速計算實例
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論