該加速計(jì)算庫(kù)幫助科研人員無(wú)縫地?cái)U(kuò)展到強(qiáng)大的計(jì)算集群,并且無(wú)需修改 Python 代碼,推進(jìn)科學(xué)發(fā)現(xiàn)。
無(wú)論研究納米級(jí)電子行為,還是數(shù)百萬(wàn)光年之外的星系碰撞,眾多科學(xué)家都面臨著一個(gè)共同的挑戰(zhàn),那就是必須梳理數(shù) PB 的數(shù)據(jù),才能從中獲得能夠推動(dòng)相關(guān)領(lǐng)域發(fā)展的洞察。
借助 NVIDIA cuPyNumeric 加速計(jì)算庫(kù),科研人員現(xiàn)在可以將他們的數(shù)據(jù)處理 Python 代碼毫不費(fèi)力地運(yùn)行在基于 CPU 的筆記本電腦、GPU 加速工作站、云服務(wù)器或大型超級(jí)計(jì)算機(jī)上。處理數(shù)據(jù)的速度越快,科學(xué)家們就能越快地針對(duì)有前景的數(shù)據(jù)點(diǎn)、值得研究的趨勢(shì)以及實(shí)驗(yàn)調(diào)整做出決策。
想要躍進(jìn)到加速計(jì)算,科研人員并不需要計(jì)算機(jī)科學(xué)方面的專業(yè)知識(shí)。他們只需使用熟悉的 NumPy 界面編寫(xiě)代碼,或?qū)?cuPyNumeric 應(yīng)用于現(xiàn)有代碼,并遵循最佳實(shí)踐即可享受到卓越的性能和可擴(kuò)展性。
一旦使用了 cuPyNumeric,他們就可以在一個(gè)或數(shù)千個(gè) GPU 上運(yùn)行代碼,并且無(wú)需修改任何代碼。
最新版 cuPyNumeric 現(xiàn)已在 Conda 和 GitHub 上發(fā)布,它支持 NVIDIA GH200 Grace Hopper 超級(jí)芯片、運(yùn)行時(shí)自動(dòng)進(jìn)行資源配置以及改進(jìn)的內(nèi)存擴(kuò)展。它還支持 HDF5,這種在科學(xué)界非常流行的文件格式有助于高效地管理大型的復(fù)雜數(shù)據(jù)。
SLAC 國(guó)家加速器實(shí)驗(yàn)室、洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室、澳大利亞國(guó)立大學(xué)、馬薩諸塞大學(xué)波士頓分校、斯坦福大學(xué)湍流研究中心和印度國(guó)家支付公司等機(jī)構(gòu)的科研人員均集成了 cuPyNumeric,這顯著地改善了他們的數(shù)據(jù)分析工作流程。
少即是多:無(wú)需修改代碼
即可享受到無(wú)限的 GPU 可擴(kuò)展性
Python 是數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和數(shù)值計(jì)算領(lǐng)域最常用的編程語(yǔ)言,被天文學(xué)、藥物發(fā)現(xiàn)、材料科學(xué)和核物理等科學(xué)領(lǐng)域的數(shù)百萬(wàn)科研人員所使用。GitHub 上數(shù)以萬(wàn)計(jì)的軟件包都依賴于 NumPy 數(shù)學(xué)和矩陣庫(kù),該庫(kù)在上個(gè)月的下載量超過(guò) 3 億次。所有這些應(yīng)用都能受益于 cuPyNumeric 加速計(jì)算。
許多科學(xué)家都在構(gòu)建使用 NumPy 的程序,并在一個(gè)僅采用 CPU 的節(jié)點(diǎn)上運(yùn)行,這限制了其算法的吞吐量,無(wú)法處理電子顯微鏡、粒子對(duì)撞機(jī)和射電望遠(yuǎn)鏡等儀器收集的日益龐大的數(shù)據(jù)集。
通過(guò)提供一個(gè)可擴(kuò)展到數(shù)千個(gè) GPU 的 NumPy 替代品,cuPyNumeric 幫助科研人員跟上數(shù)據(jù)集日益增長(zhǎng)的規(guī)模和復(fù)雜性。從單個(gè) GPU 擴(kuò)展到整個(gè)超級(jí)計(jì)算機(jī)時(shí),cuPyNumeric 不需要更改代碼。這使得科研人員可以輕松地在任何規(guī)模的加速計(jì)算系統(tǒng)上運(yùn)行分析。
解決大數(shù)據(jù)問(wèn)題,加速科學(xué)發(fā)現(xiàn)
美國(guó)能源部下屬的 SLAC 國(guó)家加速器實(shí)驗(yàn)室(由斯坦福大學(xué)運(yùn)營(yíng))的科研人員發(fā)現(xiàn),cuPyNumeric 可幫助他們更快地使用直線加速器相干光源進(jìn)行 X 射線實(shí)驗(yàn)。
一個(gè)專注于半導(dǎo)體材料科學(xué)發(fā)現(xiàn)的 SLAC 團(tuán)隊(duì)發(fā)現(xiàn),cuPyNumeric 將數(shù)據(jù)分析應(yīng)用程序的速度提高了 6 倍,將運(yùn)行時(shí)間從幾分鐘縮短到幾秒鐘。憑借這樣的提速,該團(tuán)隊(duì)能夠在這個(gè)高度專業(yè)化的設(shè)施內(nèi)同時(shí)進(jìn)行重要的分析和實(shí)驗(yàn)。
通過(guò)更高效地進(jìn)行實(shí)驗(yàn),該團(tuán)隊(duì)預(yù)計(jì)將能更快地發(fā)現(xiàn)新的材料特性、分享成果并發(fā)表論文。
以下機(jī)構(gòu)也正在使用 cuPyNumeric:
澳大利亞國(guó)立大學(xué)的科研人員利用 cuPyNumeric 來(lái)擴(kuò)展勒文伯格-馬夸爾特優(yōu)化算法,以便在澳大利亞國(guó)家計(jì)算基礎(chǔ)設(shè)施中的多 GPU 系統(tǒng)上運(yùn)行。雖然該算法可用于多種應(yīng)用,但科研人員的最初目標(biāo)是構(gòu)建大規(guī)模的氣候和天氣模型。
洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室的科研人員正在運(yùn)用 cuPyNumeric 來(lái)加速數(shù)據(jù)科學(xué)、計(jì)算科學(xué)和機(jī)器學(xué)習(xí)算法。cuPyNumeri 將為他們提供更多工具,以便有效地利用最近推出的 Venado 超級(jí)計(jì)算機(jī),該超級(jí)計(jì)算機(jī)配備了 2,500 多顆 NVIDIA GH200 Grace Hopper 超級(jí)芯片。
斯坦福大學(xué)湍流研究中心的科研人員正在開(kāi)發(fā)基于 Python 的計(jì)算流體動(dòng)力學(xué)求解器,該求解器可使用 cuPyNumeric 在大型加速計(jì)算集群上大規(guī)模地運(yùn)行。這些求解器可以將大型流體模擬集合與 PyTorch 等流行的機(jī)器學(xué)習(xí)庫(kù)無(wú)縫集成,從而支持包括在線訓(xùn)練和強(qiáng)化學(xué)習(xí)在內(nèi)的復(fù)雜應(yīng)用。
馬薩諸塞大學(xué)波士頓分校的一個(gè)研究團(tuán)隊(duì)正在加速線性代數(shù)計(jì)算,以分析顯微鏡視頻并確定活性材料耗散的能量。該團(tuán)隊(duì)使用 cuPyNumeric 來(lái)分解一個(gè)包含 1600 萬(wàn)行和 4000 列的矩陣。
印度國(guó)家支付公司提供的實(shí)時(shí)數(shù)字支付系統(tǒng)每天大約被 2.5 億印度人所用,并在走向全球。印度國(guó)家支付公司使用復(fù)雜的矩陣計(jì)算來(lái)跟蹤付款人和收款人之間的交易路徑。使用當(dāng)前的方法,在 CPU 系統(tǒng)上處理一周的交易數(shù)據(jù)大約需要 5 個(gè)小時(shí)。一項(xiàng)試驗(yàn)表明,通過(guò)在多節(jié)點(diǎn) NVIDIA DGX 系統(tǒng)上應(yīng)用 cuPyNumeric 來(lái)加速計(jì)算,可以將矩陣乘法的速度提高 50 倍,從而使印度國(guó)家支付公司能夠在不到一個(gè)小時(shí)的時(shí)間內(nèi)處理更長(zhǎng)時(shí)間內(nèi)的交易,并近乎實(shí)時(shí)地檢測(cè)到可疑的洗錢(qián)行為。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102987 -
gpu
+關(guān)注
關(guān)注
28文章
4729瀏覽量
128890 -
超級(jí)芯片
+關(guān)注
關(guān)注
0文章
34瀏覽量
8876
原文標(biāo)題:SC24 | NVIDIA 發(fā)布 cuPyNumeric,使科學(xué)家能夠充分利用集群規(guī)模的 GPU 加速
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論