NVIDIA 正在與全球科技巨頭和美國頂級超級計算實(shí)驗室開展合作,為數(shù)據(jù)分析和機(jī)器學(xué)習(xí),這一高性能計算發(fā)展最為迅猛的領(lǐng)域帶來加速支持。
這一新計劃標(biāo)志著高性能計算加速工作迎來了一個關(guān)鍵時刻,預(yù)計在未來幾年內(nèi),高性能計算的市場規(guī)模將迎來顯著的增長。全球數(shù)據(jù)量每年都會翻倍,但隨著摩爾定律的終結(jié),CPU 計算已遭遇到了瓶頸。
通過與 Microsoft、Cisco、Dell EMC、Hewlett Packard Enterprise、IBM、Oracle 等公司攜手,NVIDIA已經(jīng)為客戶實(shí)現(xiàn)了50 倍的數(shù)據(jù)任務(wù)加速。根據(jù)美國能源部橡樹嶺國家實(shí)驗室的初始測試表明,在相關(guān)氣候預(yù)測研究中,所實(shí)現(xiàn)的加速效果更是高達(dá)215 倍之多。
“激流”般的革新
早在十年前,NVIDIA就已經(jīng)實(shí)現(xiàn)了針對科學(xué)計算的加速。從那時起,在我們的幫助下,已有包括多位諾貝爾獎得主在內(nèi)的眾多研究人員成功為其計算密集型模擬實(shí)現(xiàn)了加速,從而得以應(yīng)對一些世界上最為困難的挑戰(zhàn)。
隨后,也就是五年前,我們通過優(yōu)化后的軟件使GPU 平臺具備了深度學(xué)習(xí)加速功能,并就此引發(fā)了一場 AI 變革。
NVIDIA于去年推出了新款開源數(shù)據(jù)科學(xué)加速軟件,標(biāo)志著第三次技術(shù)革新浪潮的興起。
此次浪潮以 RAPIDS 為中心,這是一個開源的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)加速平臺,用于完全在 GPU 上執(zhí)行端到端的數(shù)據(jù)科學(xué)訓(xùn)練管線。
RAPIDS依賴于NVIDIA CUDA進(jìn)行低級別計算優(yōu)化,并通過用戶友好型的Python界面實(shí)現(xiàn) GPU 并行結(jié)構(gòu)和極高的內(nèi)存帶寬。RAPIDS 數(shù)據(jù)框架庫可模仿 pandas API,且構(gòu)建在 Apache Arrow 之上,可以在最大限度上實(shí)現(xiàn)互操作性和高性能。
更多加速機(jī)器學(xué)習(xí)步入云端
如今,NVIDIA正在與全球各大領(lǐng)先的技術(shù)公司合作,讓更多的用戶可以在更多的地方享受到加速機(jī)器學(xué)習(xí)帶來的便利。
通過與 NVIDIA 的緊密合作,Microsoft 正在為其 Azure Machine Learning 用戶提供加速機(jī)器學(xué)習(xí)的服務(wù)。
“Azure Machine Learning 是一個領(lǐng)先的平臺,幫助數(shù)據(jù)科學(xué)家從云端到終端設(shè)備構(gòu)建、訓(xùn)練、管理并部署機(jī)器學(xué)習(xí)模型?!盡icrosoft Azure AI 企業(yè)副總裁 Eric Boyd 說道,“我們一直在與 NVIDIA 合作,為數(shù)據(jù)科學(xué)家提供由 GPU 提供技術(shù)支持的計算能力。此外,我們也很高興能夠通過 RAPIDS 開源項目為 Azure 用戶提供軟件。我期待著能夠看到數(shù)據(jù)科學(xué)社區(qū)利用 RAPIDS 和 Azure Machine Learning 取得研究成果?!?/p>
更多加速機(jī)器學(xué)習(xí)系統(tǒng)即將問世
同時,NVIDIA也在與基于 NVIDIA HGX-2 云服務(wù)器平臺的領(lǐng)先計算機(jī)制造商開展合作,共同研發(fā)一系列適用于所有 AI 和高性能計算工作負(fù)荷的新產(chǎn)品。
通過RAPIDS,數(shù)據(jù)科學(xué)家可以將更多時間用于分析和迭代,并減少等待時間。
NVIDIA HGX-2 可為每個節(jié)點(diǎn)提供每秒2 千萬億次浮點(diǎn)運(yùn)算的計算性能,與僅采用 CPU 的服務(wù)器相比,NVIDIA HGX-2 運(yùn)行機(jī)器學(xué)習(xí)工作負(fù)荷的速度要快上近550 倍。
加速機(jī)器學(xué)習(xí)賦能科學(xué)突破
美國多家領(lǐng)先實(shí)驗室所從事的研究課題包括了核聚變研究,人類基因組學(xué),和氣候預(yù)測在內(nèi)的各個領(lǐng)域,這些研究工作均依賴于科學(xué)計算、深度學(xué)習(xí)和數(shù)據(jù)科學(xué)。
NVIDIA DGX-2 旨在應(yīng)對需要處理海量計算的應(yīng)用,幫助科研人員在對性能要求最高的領(lǐng)域里取得性能突破。DGX-2 可以與 RAPIDS 開源機(jī)器學(xué)習(xí)軟件配合使用,其現(xiàn)已幫助多家美國能源部實(shí)驗室的科學(xué)家加速了他們的研究進(jìn)程。
其中,美國橡樹嶺國家實(shí)驗室的研究人員已經(jīng)借助 DGX-2 和 RAPIDS 取得了早期成果。
如今,研究人員可以利用體量龐大的觀察數(shù)據(jù)來構(gòu)建模型,從而增強(qiáng)與氣候模擬相關(guān)的能源安全應(yīng)用。然而在過去,利用氣候數(shù)據(jù)集進(jìn)行訓(xùn)練的機(jī)器學(xué)習(xí)算法一直受到計算性能的制約,且訓(xùn)練過程非常緩慢。但現(xiàn)在,改變終于來了。
借助 DGX-2 和 RAPIDS,橡樹嶺國家實(shí)驗室的研究人員已經(jīng)大大提升了在大型數(shù)據(jù)集上應(yīng)用機(jī)器學(xué)習(xí)的速度。他們在 DGX-2 上運(yùn)行XGBoost,將大小為224GB 的模型訓(xùn)練用時從在CPU節(jié)點(diǎn)上所需的21 個小時,縮短至僅6 分鐘,實(shí)現(xiàn)了215 倍的加速。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102987 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
165瀏覽量
10053
原文標(biāo)題:NVIDIA 攜加速數(shù)據(jù)科學(xué)再掀高性能計算革新浪潮
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論