RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell平臺(tái)帶來(lái)性能躍升

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-19 14:24 ? 次閱讀

Blackwell 完成的每一項(xiàng)測(cè)試,都為各項(xiàng) AI 應(yīng)用樹立了訓(xùn)練性能新標(biāo)桿。

對(duì)于使用文本、計(jì)算機(jī)代碼、蛋白質(zhì)鏈、摘要、視頻甚至 3D 圖形的生成式 AI 應(yīng)用,它們需要數(shù)據(jù)中心規(guī)模的加速計(jì)算來(lái)高效地訓(xùn)練其背后的大語(yǔ)言模型(LLM)。

在 MLPerf Training 4.1 行業(yè)基準(zhǔn)測(cè)試中,NVIDIA Blackwell 平臺(tái)在所有參與測(cè)試的工作負(fù)載上都取得了令人贊嘆的測(cè)試結(jié)果。在 LLM 基準(zhǔn)測(cè)試中,每塊 GPU 的性能提高了 2.2 倍,其中包括 Llama 2 70B 微調(diào)和 GPT-3 175B 預(yù)訓(xùn)練。

此外,NVIDIA 提交的 NVIDIA Hopper 平臺(tái)測(cè)試結(jié)果繼續(xù)在所有基準(zhǔn)測(cè)試上保持了規(guī)模級(jí)的記錄,包括使用 11,616 塊 Hopper GPU 進(jìn)行的 GPT-3 175B 基準(zhǔn)測(cè)試。

Blackwell 帶來(lái)性能躍升

這是 NVIDIA 首次向 MLCommons 聯(lián)盟提交 Blackwell 的訓(xùn)練測(cè)試結(jié)果,其結(jié)果突顯了該架構(gòu)是如何提高生成式 AI 訓(xùn)練性能的。MLCommons 聯(lián)盟為業(yè)內(nèi)公司創(chuàng)建了標(biāo)準(zhǔn)化、公正且經(jīng)過(guò)嚴(yán)格的同行評(píng)審的測(cè)試。

例如,Blackwell 架構(gòu)包括新的核函數(shù),它們可以更高效地使用 Tensor Core。這些核函數(shù)執(zhí)行優(yōu)化的專用數(shù)學(xué)運(yùn)算,例如矩陣乘,是許多深度學(xué)習(xí)算法的主要計(jì)算。

Blackwell 擁有更高的每塊 GPU 計(jì)算吞吐量以及更大、更快的高帶寬內(nèi)存,使其能夠在更少的 GPU 上運(yùn)行 GPT-3 175B 基準(zhǔn)測(cè)試,同時(shí)實(shí)現(xiàn)出色的每塊 GPU 性能。

通過(guò)利用容量更大、帶寬更高的 HBM3e 內(nèi)存,僅僅 64 塊 Blackwell GPU 就能夠運(yùn)行 GPT-3 LLM 基準(zhǔn)測(cè)試,并且不損失每塊 GPU 性能。使用 Hopper 進(jìn)行相同的基準(zhǔn)測(cè)試時(shí)則需要 256 塊 GPU。

在提交 Blackwell 的訓(xùn)練測(cè)試結(jié)果之前,NVIDIA 還提交了 MLPerf Inference 4.1 推理測(cè)試結(jié)果。在該測(cè)試中,Blackwell 的 LLM 推理性能比 Hopper 高出 4 倍。測(cè)試結(jié)果顯示,通過(guò)利用 Blackwell 架構(gòu)的 FP4 精度以及 NVIDIA QUASAR 量化系統(tǒng),Blackwell 在滿足基準(zhǔn)測(cè)試的精度要求的同時(shí)展現(xiàn)出了強(qiáng)大的性能。

持續(xù)優(yōu)化

經(jīng)過(guò)持續(xù)的軟件開發(fā),NVIDIA 平臺(tái)在各種框架、模型和應(yīng)用的訓(xùn)練和推理方面獲得了性能提升和功能改進(jìn)。

在本輪提交的 MLPerf 訓(xùn)練測(cè)試結(jié)果中,當(dāng)使用 GPT-3 175B 進(jìn)行訓(xùn)練時(shí),Hopper 的每塊 GPU 訓(xùn)練性能比上次提交該基準(zhǔn)測(cè)試時(shí)提高了 1.3 倍。

NVIDIA 還提交了 GPT-3 175B 基準(zhǔn)測(cè)試的大規(guī)模測(cè)試結(jié)果,該測(cè)試使用了 11,616 塊 Hopper GPU,這些 GPU 通過(guò) NVIDIA NVLink 和 NVSwitch 高帶寬 GPU 間通信以及 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)連接在一起。

自去年以來(lái),NVIDIA Hopper GPU 在 GPT-3 175B 基準(zhǔn)測(cè)試中的規(guī)模和性能提升了三倍多。此外,在 Llama 2 70B LoRA 微調(diào)基準(zhǔn)測(cè)試中,NVIDIA 在使用相同數(shù)量的 Hopper GPU 的情況下將性能提高了 26%,這體現(xiàn)了軟件方面的持續(xù)優(yōu)化。

NVIDIA 持續(xù)優(yōu)化加速計(jì)算平臺(tái)的努力,使其 MLPerf 測(cè)試結(jié)果得以不斷提升——提高了容器化軟件的性能,為使用現(xiàn)有平臺(tái)的合作伙伴和客戶帶來(lái)更強(qiáng)大的算力,并讓他們從平臺(tái)投資中獲得更高的回報(bào)。

攜手合作

NVIDIA 的合作伙伴——包括華碩、Azure、思科、戴爾、富士通、Giga Computing、Lambda Labs、聯(lián)想、Oracle Cloud、云達(dá)科技和超微等系統(tǒng)制造商和云服務(wù)提供商——也在最新一輪 MLPerf 測(cè)試中提交了令人印象深刻的測(cè)試結(jié)果。

作為 MLCommons 的創(chuàng)始成員,NVIDIA 認(rèn)為,行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測(cè)試和基準(zhǔn)測(cè)試最佳實(shí)踐對(duì)于 AI 計(jì)算而言至關(guān)重要。通過(guò)獲取經(jīng)過(guò)同行評(píng)審、精簡(jiǎn)的 AI 和 HPC 各個(gè)平臺(tái)的對(duì)比信息,企業(yè)可以跟上最新的 AI 計(jì)算創(chuàng)新步伐,并獲得有助于指導(dǎo)其重大平臺(tái)投資決策的關(guān)鍵數(shù)據(jù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4978

    瀏覽量

    102987
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7488

    瀏覽量

    87849
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    286

    瀏覽量

    327

原文標(biāo)題:巔峰的訓(xùn)練性能:Blackwell 在 MLPerf 測(cè)試中將訓(xùn)練性能帶到新高度

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    臺(tái)積電計(jì)劃在美生產(chǎn)BLACKWELL芯片

    人工智能芯片。 BLACKWELL芯片作為NVIDIA在人工智能領(lǐng)域的重要產(chǎn)品,其性能卓越,廣受市場(chǎng)好評(píng)。此次臺(tái)積電與NVIDIA的會(huì)談,預(yù)示著BL
    的頭像 發(fā)表于 12-06 10:54 ?417次閱讀

    Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

    ,宣布推出高性能的SuperCluster。這一端對(duì)端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺(tái),專為兆級(jí)參數(shù)規(guī)模的生成式AI時(shí)代所設(shè)計(jì)。全新SuperCluster
    發(fā)表于 11-25 10:39 ?310次閱讀
    Supermicro推出直接液冷優(yōu)化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解決方案

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開放計(jì)算項(xiàng)目(OCP),并擴(kuò)大
    的頭像 發(fā)表于 11-19 15:30 ?187次閱讀

    NVIDIA未來(lái)1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無(wú)疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場(chǎng)需求量已攀升至前所未有的高峰。   憑借在全球AI算力領(lǐng)域的領(lǐng)先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?634次閱讀

    NVIDIA 在 Hot Chips 大會(huì)展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    來(lái)源: NVIDIA 在此次大會(huì)期間舉行的四場(chǎng)演講中,NVIDIA 工程師詳細(xì)介紹了 NVIDIA Blackwell 平臺(tái)、新的液冷研究成
    的頭像 發(fā)表于 08-28 16:38 ?369次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大會(huì)展示提升數(shù)據(jù)中心<b class='flag-5'>性能</b>和能效的創(chuàng)新技術(shù)

    NVIDIA AI芯片Blackwell推遲發(fā)布引熱議,公司強(qiáng)調(diào)Hopper需求強(qiáng)勁

    據(jù)8月5日最新消息,NVIDIA新款A(yù)I芯片Blackwell因被曝存在設(shè)計(jì)缺陷而推遲發(fā)布的消息,迅速在業(yè)界引發(fā)了廣泛討論與關(guān)注。面對(duì)這一市場(chǎng)傳聞,NVIDIA官方迅速作出回應(yīng),強(qiáng)調(diào)其旗艦產(chǎn)品
    的頭像 發(fā)表于 08-05 15:05 ?561次閱讀

    NVIDIA CEO黃仁勛在 SIGGRAPH 2024 主題演講中或?qū)⑹状瘟料嘞M(fèi)級(jí)GPU Blackwell

    ABSTRACT摘要NVIDIA首席執(zhí)行官黃仁勛將在2024年Siggraph上發(fā)表主題演講,主題為“面向新計(jì)算革命的圖形”——消費(fèi)級(jí)Blackwell即將到來(lái)?JAEALOT2024年6月20日
    的頭像 發(fā)表于 06-21 08:26 ?468次閱讀
    <b class='flag-5'>NVIDIA</b> CEO黃仁勛在 SIGGRAPH 2024 主題演講中或?qū)⑹状瘟料嘞M(fèi)級(jí)GPU <b class='flag-5'>Blackwell</b>

    英偉達(dá)Blackwell架構(gòu),行業(yè)首選

    的半導(dǎo)體技術(shù)路徑圖,首度公開了即將面世的下一代芯片——Rubin平臺(tái),旨在接替現(xiàn)有的Blackwell。   回顧過(guò)往,NVIDIA始終保持著每?jī)赡臧l(fā)布一次全新架構(gòu)的傳統(tǒng),從2020年的Ampere
    的頭像 發(fā)表于 06-05 15:28 ?640次閱讀

    NVIDIA Blackwell平臺(tái)推動(dòng)科學(xué)計(jì)算突破發(fā)展

    最新加速器和網(wǎng)絡(luò)平臺(tái)提升高級(jí)模擬、AI、量子計(jì)算、數(shù)據(jù)分析等方面的性能
    的頭像 發(fā)表于 05-15 09:45 ?369次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    人工智能模型在規(guī)模和復(fù)雜性上呈指數(shù)級(jí)增長(zhǎng),對(duì)先進(jìn)計(jì)算能力和內(nèi)存容量的需求變得至關(guān)重要。Blackwell圖形處理器架構(gòu)通過(guò)在性能和效率方面實(shí)現(xiàn)大幅躍升,解決了這些需求。 HGX B200 訓(xùn)練
    發(fā)表于 05-13 17:16

    超微電腦借助英偉達(dá)Blackwell架構(gòu),打造頂尖生成式AI系統(tǒng)

    超微電腦Supermicro近日宣布,其全新一代人工智能系統(tǒng)已正式問(wèn)世,該系統(tǒng)基于NVIDIA的革命性Blackwell架構(gòu),展現(xiàn)了前所未有的人工智能性能。該系列新品包括NVIDIA
    的頭像 發(fā)表于 03-25 10:27 ?598次閱讀

    NVIDIA推出搭載GB200 Grace Blackwell超級(jí)芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時(shí)間 3 月 18 日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級(jí)芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?694次閱讀

    NVIDIA宣布推出NVIDIA Blackwell平臺(tái)以賦能計(jì)算新時(shí)代

    全新 Blackwell GPU、NVLink 和可靠性技術(shù)賦能萬(wàn)億參數(shù)規(guī)模的 AI 模型
    的頭像 發(fā)表于 03-20 09:44 ?604次閱讀

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)萬(wàn)個(gè),通過(guò) NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?421次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計(jì)

    網(wǎng)絡(luò)平臺(tái)上快速創(chuàng)建應(yīng)用程序和服務(wù),并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強(qiáng)大功能,提供突破性的網(wǎng)絡(luò)、安全和存儲(chǔ)性能
    的頭像 發(fā)表于 02-23 10:02 ?467次閱讀
    RM新时代网站-首页