NVIDIA 數(shù)據(jù)加載庫(DALI)是一個可移植的開源庫,專用于解碼及增強(qiáng)圖像、視頻和語音,從而加速深度學(xué)習(xí)應(yīng)用。
什么是 NVIDIA 數(shù)據(jù)加載庫(DALI)?
NVIDIA 數(shù)據(jù)加載庫(DALI)是一個可移植的開源庫,專用于解碼及增強(qiáng)圖像、視頻和語音,從而加速深度學(xué)習(xí)應(yīng)用。DALI 通過重疊執(zhí)行訓(xùn)練和預(yù)處理來減少延遲和訓(xùn)練時間,從而減輕瓶頸影響。DALI 可直接嵌入并替代熱門深度學(xué)習(xí)框架中內(nèi)置的數(shù)據(jù)加載程序和數(shù)據(jù)迭代器,由此實(shí)現(xiàn)輕松集成或重新遷至不同框架。
使用圖像訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,開發(fā)者首先要將這些圖像標(biāo)準(zhǔn)化。而且,通常還需壓縮圖像以節(jié)省存儲空間。為此,開發(fā)者構(gòu)建了多階段數(shù)據(jù)處理工作流,其中包括加載、解碼、裁剪、調(diào)整大小以及許多其他增強(qiáng)運(yùn)算符。這些當(dāng)前在 CPU 上執(zhí)行的數(shù)據(jù)處理工作流已成為瓶頸,限制了整體吞吐量。
DALI 擁有高性能,對于內(nèi)置的數(shù)據(jù)加載程序和數(shù)據(jù)迭代器而言,是一款出色的替代方案。開發(fā)者現(xiàn)可在 GPU 上運(yùn)行數(shù)據(jù)處理工作流,從而減少訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的總時間。使用 DALI 實(shí)現(xiàn)的數(shù)據(jù)處理工作流具有可移植性,因?yàn)樗鼈兡軌蜉p松地重新遷至 TensorFlow、PyTorch 和 MXNet。
DALI 的主要特性
可跨多個 GPU 透明擴(kuò)展
加速圖像分類(ResNet-50)、物體檢測(SSD)工作負(fù)載和語音識別模型(例如 Jasper 和 RNN-T)
靈活的圖形助力開發(fā)者創(chuàng)建自定義工作流
支持多種數(shù)據(jù)格式:LMDB、RecordIO、TFRecord、COCO、JPEG、wav、flac、ogg、H.264 和 HEVC
開發(fā)者可添加自定義音頻、圖像和視頻處理運(yùn)算符
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102984 -
DALI
+關(guān)注
關(guān)注
4文章
67瀏覽量
20760
原文標(biāo)題:DevZone | NVIDIA數(shù)據(jù)加載庫(DALI)
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論