RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第三次AI浪潮革命,百萬倍算力挑戰(zhàn)大起底

獨(dú)愛72H ? 來源:劉林華 ? 作者:電子發(fā)燒友 ? 2019-02-05 13:55 ? 次閱讀

AI第三次浪潮革命是在算力激增的推動下發(fā)生的。Jeff Dean說我們需要超過現(xiàn)在100萬倍的算力,成為企業(yè)面臨的重大挑戰(zhàn)。本文通過硬件基礎(chǔ)、軟件基礎(chǔ)以及優(yōu)化框架和應(yīng)用加速4個方面,為您起底百萬倍算力挑戰(zhàn)。

AI這個詞,從第一次被創(chuàng)造出來至今,已經(jīng)經(jīng)歷了兩次浪潮。如今在算法、大數(shù)據(jù)、算力三大因素的驅(qū)動下,AI發(fā)展迎來第三次浪潮。

谷歌AI負(fù)責(zé)人Jeff Dean說:“事實(shí)證明,我們真正需要的是超過現(xiàn)在100萬倍的計(jì)算能力,而不僅僅是幾十倍的增長。”

算力為王的年代,企業(yè)需要滿足4個層次的需求:

硬件,一些計(jì)算平臺比如服務(wù)器、加速卡等。這是算力的物理根基,是滿足算力的第一步

軟件,構(gòu)建在硬件之上的開發(fā)管理套件,提供整體解決方案,可以讓用戶無需掌握高深的AI知識,直接根據(jù)需要進(jìn)行開發(fā)

優(yōu)化主流框架,針對硬件和管理套件進(jìn)行定制化,使得算力能夠更加快速穩(wěn)定

應(yīng)用加速,AI端到端的解決方案,將算力落地

這就給傳統(tǒng)企業(yè)帶來了前所未有的挑戰(zhàn)。一方面,越來越多的傳統(tǒng)企業(yè)需要盡快轉(zhuǎn)型AI;另一方面,傳統(tǒng)企業(yè)已經(jīng)無法應(yīng)對AI時代的算力挑戰(zhàn)。

提高整個AI計(jì)算系統(tǒng)的性能與效率迫在眉睫,而首當(dāng)其沖的,就是服務(wù)器和加速卡。

解決算力需求的硬件基礎(chǔ):服務(wù)器和加速卡

企業(yè)的規(guī)模越大,數(shù)據(jù)的集中度就越高,對AI計(jì)算力的需求也就越高,對AI服務(wù)器的需求也就約旺盛。

根據(jù)國際調(diào)研公司IDC)全球季度服務(wù)器跟蹤報(bào)告,2018年第三季度全球服務(wù)器市場,供應(yīng)商收入達(dá)234億美元(約1581億人民幣),同比增長37.7%。全球服務(wù)器出貨量320萬臺,同比增長18.3%。

在全球服務(wù)器市場,排名前五的分別是:DELL EMC第一、HPE/New H3C Group第二、Inspur/Inspur Power第三、Lenovo第四、 IBM,Huawei和Cisco并列第五。

具體數(shù)據(jù)如下圖:

可以看到,在服務(wù)器市場TOP 5的7家廠商中,浪潮表現(xiàn)的最為亮眼,出貨量同比增長90.2%,營收增長達(dá)增長156.5%。

杭州的阿里,北京的京東、字節(jié)跳動(今日頭條)、百度,深圳的騰訊,都對當(dāng)?shù)谹I計(jì)算力產(chǎn)生巨大的需求。

能夠勝任BAT算力要求的企業(yè)不多。在AI算力供應(yīng)商的問題上,BAT紛紛選擇了浪潮。

浪潮能夠連續(xù)多年成為BAT最主要的AI服務(wù)器供應(yīng)商,靠的是不斷提升計(jì)算能力的AI服務(wù)器:

AI超級服務(wù)器AGX-5,單機(jī)配置16顆NVIDIA Tesla V100 Tensor Core 32GB GPUs,AI計(jì)算性能高達(dá)每秒2千萬億次,可支持4倍超大規(guī)模深度神經(jīng)網(wǎng)絡(luò)模型,并將訓(xùn)練速度提高10倍。

AGX-2服務(wù)器,采用P100的Linpack浮點(diǎn)運(yùn)算性能達(dá)29.33TFLOPS,在2U空間內(nèi)支持部署8塊NVLink或PCI-E。在AI深度學(xué)習(xí)模型訓(xùn)練上,采用TensorFlow框架和GoogLeNet模型,AGX-2處理速度為每秒1165幅圖片。

智能視頻分析服務(wù)器NF5280M5-V,在2U空間內(nèi)配置8片NVIDIA TESLA P4 GPU,單臺服務(wù)器即可完成96路高清攝像頭視頻數(shù)據(jù)的解碼及結(jié)構(gòu)化實(shí)時處理需求。同時最大可提供96TB本地存儲空間,可將視頻處理數(shù)據(jù)的保存周期最高延長至6個月。

彈性GPU服務(wù)器NF5468M5,專注于AI云??赏瑫r處理300路以上1080p高清視頻結(jié)構(gòu)化,支持288TB大容量存儲或32TB固態(tài)存儲,實(shí)現(xiàn)高達(dá)400Gbps通信帶寬和1us的超低延遲。

這些服務(wù)器,同時也在為科大訊飛、商湯、曠視、字節(jié)跳動、滴滴等AI領(lǐng)先公司,在語音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面提供了算力支持。

除了AI服務(wù)器,浪潮還發(fā)布了全球首款集成HBM2高速緩存FPGA AI加速卡F37X,可在不到75W典型應(yīng)用功耗提供28.1TOPS的INT8計(jì)算性能和460GB/s的超高數(shù)據(jù)帶寬,實(shí)現(xiàn)高性能、高帶寬、低延遲、低功耗的AI計(jì)算加速。

有了AI服務(wù)器和加速卡,僅僅是解決了算力需求的第一步:硬件基礎(chǔ)設(shè)施。接下來,就需要管理套件的跟進(jìn),實(shí)現(xiàn)軟件平臺基礎(chǔ)。

解決算力需求的軟件基礎(chǔ):AI開發(fā)平臺

解決了算力的硬件基礎(chǔ),企業(yè)還需要解決快速構(gòu)建AI開發(fā)平臺,進(jìn)行人工智能產(chǎn)業(yè)布局的難題。

這個時候,一套能夠?qū)崿F(xiàn)對計(jì)算、存儲、網(wǎng)絡(luò)等基礎(chǔ)資源的管理和調(diào)度的完整解決方案就非常必要了。

浪潮升級了AI高效開發(fā)管理平臺AIStation,致力于提供高效、易用的人工智能開發(fā)平臺。

同時AIStation還集成了主流的AI開源框架和深度學(xué)習(xí)模型,提供完整的AI開發(fā)工作流服務(wù)。

除了AIStation外,浪潮還發(fā)布了OpenStack AI云平臺。

根據(jù)工信部華信研究院提供的數(shù)據(jù)顯示,2018年OpenStack占據(jù)私有云60%的市場。

OpenStack AI云平臺可幫助行業(yè)AI用戶快速便捷的構(gòu)建CPU+GPU的彈性異構(gòu)云環(huán)境,并實(shí)現(xiàn)對異構(gòu)計(jì)算資源池的動態(tài)調(diào)度與分配,支撐數(shù)據(jù)管理、模型訓(xùn)練、模型部署等各類AI應(yīng)用場景。

通過對GPU虛擬機(jī)的支持,浪潮O(jiān)penStack AI云平臺能夠以多租戶的形式,按需分配異構(gòu)計(jì)算資源,從而實(shí)現(xiàn)AI敏捷開發(fā)。

同時,多租戶任務(wù)排隊(duì)策略、資源分組優(yōu)化策略、租戶資源配額集均衡策略以及GPU共享策略等精細(xì)化調(diào)度策略,也進(jìn)一步提高了GPU資源的利用率。

有了管理套件后,接下來就應(yīng)該深入到更細(xì)節(jié)的框架優(yōu)化中了。

進(jìn)一步提升算力方法:框架優(yōu)化

要滿足算力的不斷提升,舊有的計(jì)算框架已經(jīng)無法滿足新的性能需求,需要不斷的進(jìn)行優(yōu)化。

目前使用比較廣的框架包括TensorFlow、PyTorch和Caffe。

TensorFlow是一款強(qiáng)大而成熟的深度學(xué)習(xí)框架,有強(qiáng)大的可視化性能,以及用于高水平模型開發(fā)的多個選項(xiàng)。它具備生產(chǎn)就緒的部署選項(xiàng),支持移動平臺。

Caffe用來做計(jì)算機(jī)視覺,HPC和數(shù)值優(yōu)化的研究,加上產(chǎn)品線里的高效部署。

PyTorch用來做非常dynamic的研究加上對速度要求不高的產(chǎn)品

對于企業(yè)來說,由于TF和Caffe的高效部署選項(xiàng),基于TF和Caffe的框架優(yōu)化就顯得更有意義。

浪潮針對TF和Caffe推出了Caffe-MPI, TensorFlow-Opt, FPGA計(jì)算加速引擎TF2等優(yōu)化方案。

Caffe-MPI

Caffe-MPI是全球首個集群并行版的Caffe深度學(xué)習(xí)計(jì)算開源框架,針對高性能計(jì)算系統(tǒng)設(shè)計(jì)使之具備良好的并行擴(kuò)展性。

新版本在4節(jié)點(diǎn)16塊GPU卡集群系統(tǒng)上訓(xùn)練性能較單卡提升13倍,其每秒處理圖片數(shù)量是同配置集群運(yùn)行的TensorFlow 1.0的近2倍。

Caffe-MPI設(shè)計(jì)了兩層通信模式,非常適合現(xiàn)在的高密度GPU服務(wù)器。同時Caffe-MPI還設(shè)計(jì)實(shí)現(xiàn)了計(jì)算和通信的重疊,提供了更好的cuDNN兼容性,用戶可以無縫調(diào)用最新的cuDNN版本實(shí)現(xiàn)更大的性能提升。

TensorFlow-Opt

TensorFlow-Opt已完成了ResNet-50、ResNet-101和VGG16(batch size=128 & 256)等多個網(wǎng)絡(luò)模型的測試。

其中,在ResNet-50網(wǎng)絡(luò)模型下(單卡batchsize=256),512塊GPU每秒可訓(xùn)練128336張圖片,即訓(xùn)練完成一個完整的ImageNet數(shù)據(jù)集(128萬張圖片)只需要約10秒時間,打破了AI訓(xùn)練性能世界紀(jì)錄。

FPGA計(jì)算加速引擎TF2

FPGA計(jì)算加速引擎TF2支持TensorFlow,可幫助AI客戶快速實(shí)現(xiàn)基于主流AI訓(xùn)練軟件和深度神經(jīng)網(wǎng)絡(luò)模型DNN的FPGA線上推理,并通過全球首創(chuàng)的FPGA上DNN的移位運(yùn)算技術(shù)獲得AI應(yīng)用的高性能和低延遲。

TF2計(jì)算加速引擎提高了FPGA上AI計(jì)算性能,降低了FPGA的AI軟件實(shí)現(xiàn)門檻,將支持FPGA廣泛應(yīng)用于AI生態(tài)推動更多AI應(yīng)用落地。

經(jīng)過AI服務(wù)器提供算力的硬件基礎(chǔ),管理套件提供軟件平臺基礎(chǔ),優(yōu)化框架保證緊跟算力不斷增長的需求,最后就是為應(yīng)用提供加速。

實(shí)現(xiàn)算力需求的落地應(yīng)用:案例解析

目前,浪潮在智能視頻分析、醫(yī)療影像、電力設(shè)備巡檢、金融匯率預(yù)測、語音識別、AI云等應(yīng)用中,已經(jīng)有了很多成功案例。

成功案例一:智能安防

視頻科技領(lǐng)域AI應(yīng)用的場景化非常分散,需要提煉應(yīng)用場景,根據(jù)應(yīng)用規(guī)模,在解決方案中按需靈活組合各種產(chǎn)品。

浪潮人工智能專家團(tuán)隊(duì)與大華合作建立了超強(qiáng)計(jì)算力為核心的計(jì)算平臺和計(jì)算集群單元。

在硬件上,使用AGX-2集群來處理視頻相關(guān)業(yè)務(wù)計(jì)算。在管理套件上,針對智能安防的應(yīng)用場景,定制開發(fā)了AIstation管理平臺。

優(yōu)化后的AIStation平臺,可以秒級構(gòu)建AI環(huán)境,實(shí)現(xiàn)GPU資源智能調(diào)度,整體效率大幅提升,降低運(yùn)維成本。

目前大華股份與浪潮已經(jīng)在智慧城市、雪亮工程、平安城市等多個領(lǐng)域共同打造信息化聯(lián)合解決方案,共同促進(jìn)智能物聯(lián)網(wǎng)行業(yè)智能化、信息化轉(zhuǎn)型升級和跨域發(fā)展。

成功案例二:首鋼園落地項(xiàng)目

北京首鋼自動化信息技術(shù)有限公司,采用了浪潮和百度聯(lián)合推出的ABC一體機(jī)3.0的鋼包質(zhì)檢解決方案后,10000張鋼材照片的整體缺陷識別分類準(zhǔn)確率達(dá)到99%以上,比人工專業(yè)檢測的準(zhǔn)確率更高。

成功案例三:語音識別一體機(jī)

浪潮與科大訊飛聯(lián)合發(fā)布了面向于語音識別、翻譯等AI應(yīng)用的16卡計(jì)算集群“AI Booster”,單套系統(tǒng)能夠?qū)崿F(xiàn)單精度240TFlops/s或Int8 752TFlops/s的計(jì)算性能。

雙方公布的實(shí)測數(shù)據(jù)顯示,在智能翻譯模型訓(xùn)練任務(wù)中,采用相同計(jì)算卡的“AI Booster”與傳統(tǒng)4卡服務(wù)器組成的16卡集群相比,AI計(jì)算加速比提升18%。

解決算力需求的長期戰(zhàn)略:人才培養(yǎng)

除了技術(shù)問題,傳統(tǒng)行業(yè)AI轉(zhuǎn)型還面臨AI人才的短缺。在培養(yǎng)人才問題上,浪潮也在積極提供解決方案。

去年在AICC人工智能計(jì)算大會上開辦集訓(xùn)營,提供了現(xiàn)場動手實(shí)踐的課程。

打比賽也是一個很好的吸引大學(xué)生投入AI學(xué)習(xí)中的方式。世界三大超算競賽之一的ASC,就是一個很好的例子。

目前ASC已經(jīng)吸引了超過7000名來自世界各地的選手,送出了近百萬的獎金。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886
收藏 人收藏

    評論

    相關(guān)推薦

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?490次閱讀

    AI時代的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

    AI時代,扮演著至關(guān)重要的角色。如果說數(shù)據(jù)是AI大模型的“燃料”,那么則是其強(qiáng)大的“動
    的頭像 發(fā)表于 11-04 11:45 ?416次閱讀

    億鑄科技熊大鵬探討AI芯片的挑戰(zhàn)與解決策略

    在SEMiBAY2024《HBM與存儲器技術(shù)與應(yīng)用論壇》上,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬博士發(fā)表了題為《超越極限:大芯片的技術(shù)挑戰(zhàn)與解決之道》的演講,深入剖析了AI大模型
    的頭像 發(fā)表于 10-25 11:52 ?379次閱讀

    三次諧波定子接地保護(hù)動作條件

    三次諧波定子接地保護(hù)是電力系統(tǒng)中一種重要的保護(hù)方式,主要用于保護(hù)發(fā)電機(jī)、變壓器等設(shè)備的定子繞組。 一、三次諧波定子接地保護(hù)的基本原理 1.1 三次諧波的產(chǎn)生 在電力系統(tǒng)中,由于非線性負(fù)載、變壓器鐵芯
    的頭像 發(fā)表于 07-25 14:57 ?1022次閱讀

    三次諧波對注入式定子接地影響

    引言 隨著電力系統(tǒng)的快速發(fā)展,電力系統(tǒng)的諧波問題日益突出。三次諧波作為電力系統(tǒng)中常見的一種諧波,對電力系統(tǒng)的安全穩(wěn)定運(yùn)行產(chǎn)生了一定的影響。特別是在注入式定子接地系統(tǒng)中,三次諧波的影響尤為明顯。 三次
    的頭像 發(fā)表于 07-25 14:55 ?719次閱讀

    IEEE1901.3標(biāo)準(zhǔn)工作組第三次會議在長沙召開,加速推進(jìn)PLC雙模通信國際標(biāo)準(zhǔn)的制定

    4月11日,IEEE1901.3雙模通信國際標(biāo)準(zhǔn)第三次會議在長沙順利召開。會議由中國電力科學(xué)研究院主辦,國網(wǎng)湖南省電力公司和深圳合微承辦,IEEE1901.3工作組Oleg先生、南方電網(wǎng)公司、國網(wǎng)
    的頭像 發(fā)表于 04-13 08:08 ?634次閱讀
    IEEE1901.3標(biāo)準(zhǔn)工作組<b class='flag-5'>第三次</b>會議在長沙召開,加速推進(jìn)PLC雙模通信國際標(biāo)準(zhǔn)的制定

    諧波和三次諧波區(qū)別 二諧波危害沒有三次諧波大?

    諧波和三次諧波區(qū)別 二諧波危害沒有三次諧波大? 在現(xiàn)代電力系統(tǒng)中,諧波問題逐漸引起人們的關(guān)注。諧波是指頻率是基波頻率的倍數(shù)的電流或電壓成分。二
    的頭像 發(fā)表于 04-08 17:11 ?5797次閱讀

    用cubeMX + STM32L0HAL庫1.12.1生成的自定義HID設(shè)備,接收后發(fā)送數(shù)據(jù)第三次開始會失敗卡死的原因?

    用cubeMX + STM32L0HAL庫1.12.1生成的自定義HID設(shè)備,在接收后發(fā)送數(shù)據(jù),第三次開始會失敗卡死,單獨(dú)接收和發(fā)送沒問題,用HAL庫1.12.0生成的沒問題
    發(fā)表于 03-21 08:05

    SpaceX星艦將第三次試飛

    SpaceX公司近日宣布,其巨型火箭星艦即將迎來第三次試飛,旨在進(jìn)一步測試其性能極限。據(jù)悉,這次試飛計(jì)劃最早于3月14日進(jìn)行,相比前兩,其任務(wù)目標(biāo)更加宏大且復(fù)雜。
    的頭像 發(fā)表于 03-08 13:52 ?671次閱讀

    說說TCP三次握手的過程?為什么是三次而不是兩、四?

    說說TCP三次握手的過程?為什么是三次而不是兩、四? TCP三次握手是建立TCP連接的過程,確保數(shù)據(jù)的可靠傳輸。它是由發(fā)送端和接收端完成
    的頭像 發(fā)表于 02-04 11:03 ?674次閱讀

    SpaceX計(jì)劃2月份進(jìn)行星際飛船系統(tǒng)第三次飛行測試

    SpaceX公司的高管近日宣布,美國聯(lián)邦航空局(FAA)計(jì)劃在今年2月份批準(zhǔn)星際飛船系統(tǒng)進(jìn)行第三次飛行測試。這意味著,星際飛船有望再次升空,繼續(xù)其太空探索之旅。
    的頭像 發(fā)表于 01-11 14:35 ?544次閱讀

    SpaceX 星艦計(jì)劃下月進(jìn)行第三次試飛

    周二下午,NASA舉辦的電話會議中,SpaceX客戶運(yùn)營及整合副總裁杰西卡·詹森(Jessica Jensen)透露,公司正積極爭取Starship第三次飛行審批,預(yù)計(jì)最快能在2月拿到許可。
    的頭像 發(fā)表于 01-11 13:43 ?554次閱讀

    衛(wèi)星通信序幕拉開,AI浪潮澎湃

    AI浪潮催生要求,基礎(chǔ)設(shè)施需求持續(xù)提升。AIGC帶來的超大需求拉動通信基礎(chǔ)設(shè)施建設(shè)及擴(kuò)容
    發(fā)表于 01-03 10:22 ?388次閱讀
    衛(wèi)星通信序幕拉開,<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>浪潮</b>澎湃

    使用ARM對ADIS16480進(jìn)行SPI數(shù)據(jù)讀取時,需要發(fā)送三次讀取指令才能讀取到數(shù)據(jù)是為什么?

    使用ARM對ADIS16480進(jìn)行SPI數(shù)據(jù)讀取時,需要發(fā)送三次讀取指令,第三次才能讀到第一發(fā)送讀取數(shù)據(jù)指令所讀到的數(shù)據(jù),請問有人知道這個是什么地方配置出錯還是什么別的原因
    發(fā)表于 12-28 07:26

    AI數(shù)據(jù)中心的一些挑戰(zhàn)

    AI或者人工智能自1956年提出至今已有幾十年的歷史。過去的幾十年里面,人工智能的熱度經(jīng)歷了三次浪潮,第一提出人工智能之后出現(xiàn)一些新的技術(shù),也應(yīng)用到了工業(yè)生產(chǎn)上,但是很快大家發(fā)現(xiàn)所謂
    發(fā)表于 12-25 11:25 ?549次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>數(shù)據(jù)中心的一些<b class='flag-5'>挑戰(zhàn)</b>
    RM新时代网站-首页