NVIDIA 發(fā)布了 65 個全新及更新的軟件開發(fā)工具包,包括庫、代碼樣本和指南,為正在推動廣泛計算挑戰(zhàn)前沿的數(shù)據(jù)科學家、研究者、學生和開發(fā)者帶來更好的特性和功能。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在其 GTC 主題演講中發(fā)布了這些新增內(nèi)容,其中包括用于加速量子計算、到戶交付算法和圖神經(jīng)網(wǎng)絡挖掘的新一代 SDK。
NVIDIA 產(chǎn)品目錄中有 150 多個加速計算工具包,NVIDIA 開發(fā)者計劃中的近 300 萬名成員使用這些工具包,這個數(shù)字在過去五年增長了 6 倍。CUDA(并行計算平臺和編程模型)僅在去年就被下載了 700 萬次,自發(fā)布以來的下載次數(shù)已達到 3000 萬次。
拓展新市場
新發(fā)布的 SDK 有:
NVIDIA ReOpt:用于實時物流,引入了先進的大規(guī)模并行算法,可以優(yōu)化車輛路線、倉庫選擇和車隊組合。其動態(tài)改道功能可以減少旅行時間、節(jié)省燃料成本并最大限度地減少閑置時間,這將為物流和供應鏈行業(yè)節(jié)省數(shù)十億美元。
cuNumeric:用于陣列計算,實現(xiàn) NumPy 應用編程接口,可以自動擴展到多 GPU 和多節(jié)點系統(tǒng),而不需要修改代碼。這將給使用 Python 的 2000 萬名數(shù)據(jù)科學家、研究者和科學家?guī)碇匾膬r值。該工具包現(xiàn)已在 GitHub 和 Conda 上提供,可以擴展到數(shù)千個 GPU,為 PyData 和 NumPy 生態(tài)系統(tǒng)創(chuàng)造加速計算。
cuQuantum:用于量子計算,大大加快了模擬大型量子電路的速度,使量子研究者能夠研究更廣泛的算法和應用空間。開發(fā)者可以模擬分子的近期變異量子算法和能夠識別容錯的糾錯算法等領域,也可以加速 Atos、谷歌和 IBM 的流行量子模擬器
CUDA-X 加速 DGL 容器:用于圖神經(jīng)網(wǎng)絡,為從事具有大型圖的 GNN的開發(fā)者和數(shù)據(jù)科學家提供了一種快速建立工作環(huán)境的方法。該容器使得在結(jié)合 DGL 和 Pytorc h的集成 GPU 加速 GNN 環(huán)境中的工作變得很容易。憑借 GPU 加速 GNN,我們可以挖掘圖中的洞察,即使是有接近一萬億條邊的全球最大圖也不例外。例如 Pinterest 使用具有數(shù)十億個節(jié)點和邊緣的圖神經(jīng)網(wǎng)絡來了解其具有超過 3000 億個 Pin 的生態(tài)系統(tǒng)。該網(wǎng)絡基于 GPU 和各種經(jīng)過優(yōu)化的庫,可用于模型的訓練和推理。
Amazon Web Services 機器學習總監(jiān) Alex Smola 表示:“我們團隊十分高興能與 NVIDIA 合作,通過用于圖構(gòu)建的 RAPIDS cuDF、用于圖采樣的 RAPIDS cuGraph 和 GNN 的自定義計算內(nèi)核來加速 DGL。而開源的 DGL 也能通過亞馬遜 NeptuneML 以托管式服務的形式提供?!?/p>
經(jīng)過更新的SDK加速應用開發(fā)
眾多最受歡迎的 NVIDIA SDK 都增強了功能并進行了升級,包括 Clara、DLSS、RTX、Nsight 和 Isaac 工具包。
其他經(jīng)過更新的 SDK 包括:
RAPIDS 21.10:用于數(shù)據(jù)科學,提供時間序列數(shù)據(jù)處理這項新功能并對現(xiàn)有算法進行多項加速。今年以來,NVIDIA 最受歡迎的 SDK 之一——RAPIDS 的下載量增長了 400%。
Deepstream 6.0:用于智能視頻分析的 Deepstream 6.0 引入了新的圖合成器界面,使具有最低編碼能力的用戶也能使用計算機視覺,還引入了可視化拖放界面,可實現(xiàn)簡單、直觀的AI產(chǎn)品開發(fā)流程。
Triton 2.15、TensorRT 8.2 和 cuDNN 8.4:用于深度神經(jīng)網(wǎng)絡,為大型語言模型提供新的優(yōu)化,并且為梯度增強決策樹和隨機森林提供推理加速。
DOCA 1.2:用于數(shù)據(jù)中心網(wǎng)絡,提供一個零信任的安全框架,該框架通過硬件和軟件認證、線路速率數(shù)據(jù)加密、分布式防火墻和智能遙測來擴展威脅保護。
Merlin 0.8:用于推薦系統(tǒng),具有預測用戶下一步行動的新功能,只需很少的用戶數(shù)據(jù),甚至無需用戶數(shù)據(jù),并且支持大于 GPU 內(nèi)存的模型。
適用于SDK的新培訓課程
根據(jù) IDC 預計,全球全職開發(fā)者的短缺數(shù)量預計將從 2021 年的 140 萬增加到 2025 年的 400 萬。該分析公司認為,創(chuàng)建提供教育和賦能的基礎設施是彌補這一短缺的長期解決方案。
NVIDIA 深度學習培訓中心的兩門新課程支持并加速開發(fā)者對 SDK 的學習和使用,為該學院的 40 多門課程目錄增添新的內(nèi)容。
“用于 DPU 的 DOCA 介紹”是一門自學課程。該課程向開發(fā)者、研究者和學生介紹 NVIDIA DOCA 的基本概念。NVIDIA DOCA 是一個用于在 NVIDIA BlueField DPUs 上實現(xiàn)加速數(shù)據(jù)中心計算的平臺。
將于本月晚些時候推出的“構(gòu)建實時視頻AI應用”課程將介紹如何使用 NVIDIA DeepStream 智能視頻分析工具和 NVIDIA TAO 工具套件將原始視頻數(shù)據(jù)轉(zhuǎn)化為基于實時深度學習的洞察,從而實現(xiàn)用于構(gòu)建高性能流媒體管道的硬件加速組件。
配合新 SDK 的 NVIDIA 深度學習培訓中心課程包括:
由教師授課的“加速數(shù)據(jù)科學基礎”和自學課程“加速端到端數(shù)據(jù)科學工作流”使用 NVIDIA RAPIDS 加速數(shù)據(jù)科學庫來應用各種 GPU 加速機器學習算法,包括 XGBoost、cuGRAPH 的單源最短路徑以及 cuML 的 KNN、DBSCAN 和邏輯回歸,以便執(zhí)行大規(guī)模的數(shù)據(jù)分析。
“構(gòu)建智能推薦系統(tǒng)”涵蓋 NVIDIA Merlin 和其他用于構(gòu)建高效推薦系統(tǒng)的基本工具和技術以及如何部署用于實時推薦的 GPU 加速解決方案。
責任編輯:haq
-
數(shù)據(jù)
+關注
關注
8文章
7002瀏覽量
88941 -
NVIDIA
+關注
關注
14文章
4978瀏覽量
102987 -
軟件
+關注
關注
69文章
4921瀏覽量
87394
原文標題:GTC21 | NVIDIA發(fā)布新的、更新的加速計算庫:包含NVIDIA ReOpt、cuQuantum、DOCA等數(shù)十種更新
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論