RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA取代AI加速器中的GPU

eeDesigner ? 2020-07-21 15:14 ? 次閱讀

AI軟件初創(chuàng)公司Mipsology正在與Xilinx合作,以使FPGA能夠僅使用一個附加命令即可替換AI加速器應(yīng)用程序中的GPU。Mipsology的“零努力”軟件Zebra將GPU代碼轉(zhuǎn)換為可在FPGA上的Mipsology的AI計算引擎上運行,而無需進行任何代碼更改或重新培訓(xùn)。

賽靈思今天宣布,將為數(shù)據(jù)中心向Zebra交付最新版本的Alveo U50卡。Zebra已經(jīng)在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。

Xilinx Alveo U50卡,旨在取代AI Acceleration中的GPU
賽靈思最新版本的Alveo U50數(shù)據(jù)中心加速卡現(xiàn)在帶有Mipsology的Zebra軟件,用于轉(zhuǎn)換GPU AI代碼以在FPGA上運行(圖片:Xilinx)

Xilinx營銷副總裁Ramine Roane表示:“ Zebra帶給我們的Alveo卡的加速水平使CPU和GPU加速器感到羞愧。”“與Zebra結(jié)合使用,Alveo U50滿足了AI工作負載的靈活性和性能需求,并為任何部署提供了高吞吐量和低延遲性能優(yōu)勢?!?/span>


過去,即插即用的FPGA對于非專業(yè)人士來說很難編程,但是Mipsology希望將FPGA變成即插即用的解決方案,就像CPU或GPU一樣容易使用。這樣做的想法是使從其他類型的加速切換到FPGA盡可能容易。

Mipsology首席執(zhí)行官Ludovic Larzul說:“最好的方式是[Mipsology],我們使用FPGA之上的軟件來使它們透明化,就像Nvidia用Cuda CuDNN來使GPU對AI用戶完全透明一樣?!霸诮邮?/span>EE Times采訪時。

至關(guān)重要的是,這可以由非專家完成,而無需具備深厚的AI專業(yè)知識或FPGA技能,因為無需進行模型再培訓(xùn)即可過渡。

“易用性非常重要,因為當(dāng)您查看人們的AI項目時,他們通常無法訪問設(shè)計神經(jīng)網(wǎng)絡(luò)的AI團隊,” Larzul說。“通常,如果有人安裝了一個機器人系統(tǒng)或一個視頻監(jiān)視系統(tǒng)……他們會讓其他團隊或其他團體開發(fā)神經(jīng)網(wǎng)絡(luò)并對其進行培訓(xùn)。一旦獲得了[訓(xùn)練有素的模型],他們就不會更改它,因為他們沒有專業(yè)知識?!?/span>

Mipsology Zebra軟件堆棧。 Zebra使FPGA能夠取代GPU
斑馬的堆棧。該技術(shù)適用于數(shù)據(jù)中心,邊緣和嵌入式應(yīng)用程序(圖片:Mipsology)

與Xilinx對比當(dāng)Xilinx
已經(jīng)擁有自己的神經(jīng)網(wǎng)絡(luò)加速器引擎(XDNN)時,為什么會支持第三方軟件?

“一句話的重點是:我們做得更好,”拉爾祖爾說。“另一句話是:我們的作品。”

Mipsology在Zebra中擁有自己的計算引擎,該引擎支持客戶現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,與XDNN不同,Larzul表示XDNN支持大量演示,但不太適合定制神經(jīng)網(wǎng)絡(luò)。他說,這使使用XDNN建立和運行自定義網(wǎng)絡(luò)“痛苦”。盡管XDNN可以在不受GPU威脅的應(yīng)用程序中競爭,但Zebra旨在使FPGA根據(jù)性能,成本和易用性直接采用GPU。

Mipsology Zebra堆棧詳細-幫助FPGA取代GPU
斑馬的堆棧詳細。目的是通過盡可能多地隱藏硬件來使FPGA成為從GPU或CPU到AI加速的更簡單的切換(圖片:Mipsology)

Larzul說,大多數(shù)客戶改變GPU解決方案的動機是成本。

他說:“他們想降低硬件成本,但又不想重新設(shè)計神經(jīng)網(wǎng)絡(luò)?!?/span>“(避免了)一筆非經(jīng)常性的費用,因為我們能夠透明地替換GPU,并且無需重新訓(xùn)練或修改神經(jīng)網(wǎng)絡(luò)?!?/span>

FPGA還具有可靠性,部分原因是因為它們在芯片領(lǐng)域不那么積極,并且通常比包括GPU在內(nèi)的其他加速器類型運行溫度更低。這在需要長期維護成本的數(shù)據(jù)中心中尤其重要。

拉爾祖爾說:“總擁有成本不僅僅是董事會的價格?!?/span>“確保系統(tǒng)正常運行還需要付出代價?!?/span>

Zebra還旨在使FPGA在性能上競爭。Larzul說,盡管FPGA通常提供比其他加速器更少的TOPS(每秒Tera操作),但由于Zebra精心設(shè)計的計算引擎,它們能夠更有效地使用TOPS。

Ludovic Larzul(圖片:Mipsology)
Ludovic Larzul(圖片:Mipsology)

“這是大多數(shù)加速AI的ASIC初創(chuàng)企業(yè)都忘記了的-他們在做很大的一塊硅片,試圖包裝更多的TOPS,但是他們沒有考慮如何在網(wǎng)絡(luò)上映射它以提高效率”,他說,并指出Zebra的基于FPGA的引擎比TOPS量為6倍的GPU每秒能夠處理更多圖像。

如何實現(xiàn)的?盡管Larzul沒有提供確切的細節(jié),但他確實表示它們不依賴修剪,因為精度降低太大,以至于不進行重新培訓(xùn)就無法接受。由于相同的原因,它們不使用極限量化(低于8位)。

Zebra的引擎加快了CNN的速度,而CNN如今已廣泛用于圖像和視頻處理應(yīng)用程序,但Zebra也可以應(yīng)用于使用類似數(shù)學(xué)概念的BERT(Google的自然語言處理模型)。Zebra的未來迭代可能會覆蓋其他類型的神經(jīng)網(wǎng)絡(luò),包括LSTM(長期短期記憶)和RNN(遞歸神經(jīng)網(wǎng)絡(luò)),但這很難實現(xiàn),因為RNN在數(shù)學(xué)上更加多樣化。

EVE
Mipsology的團隊成立于2015年,在法國約有30人從事研發(fā)工作,在加利福尼亞有一個小團隊,主要負責(zé)業(yè)務(wù)發(fā)展。公司已獲得總計700萬美元的資金,其中200萬美元是2019年法國政府創(chuàng)新競賽的獎金。

Mipsology的核心團隊來自EVE,這一家ASIC仿真器公司,于2012年被Synopsys收購,用于其ZeBu(零錯誤)硬件輔助驗證產(chǎn)品,當(dāng)時是Cadence鈀金驗證平臺的競爭對手。Larzul認為,幾乎所有主要的ASIC公司都使用EVE技術(shù)在設(shè)計周期內(nèi)驗證ASIC。該技術(shù)依賴于連接在一起的數(shù)千個FPGA來重現(xiàn)ASIC行為。

Mipsology擁有12項正在申請的專利,并且與Xilinx密切合作,并且與第三方加速器卡兼容,例如Western Digital小型(SFF U.2)卡和Vega-4001等研華卡。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21729

    瀏覽量

    602986
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886
收藏 人收藏

    評論

    相關(guān)推薦

    英偉達AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    冷板。 在英偉達給出的模型,每個 AI 加速器復(fù)合體包含 4 個 GPU 模塊,每個 GPU 模塊與 6 個小型 DRAM 內(nèi)存
    的頭像 發(fā)表于 12-13 11:37 ?156次閱讀
    英偉達<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    場景精確投射到2D平面;最后在像素著色階段完成材質(zhì)渲染和光照明細處理。DirectX API的迭代推動了可編程著色的發(fā)展,解放了GPU的通用計算潛能。特別是像素著色的設(shè)計,啟發(fā)了我在深度學(xué)習(xí)任務(wù)
    發(fā)表于 11-24 17:12

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負載設(shè)計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優(yōu)勢聚焦于其更為親民的價格與總擁有成本(TCO)上。
    的頭像 發(fā)表于 09-26 16:16 ?812次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理

    美國限制向中東AI加速器出口,審查國家安全

    AI加速器能協(xié)助數(shù)據(jù)中心處理大量人工智能聊天機器人和其他工具的開發(fā)信息。如今,它們已然成為構(gòu)建AI基礎(chǔ)設(shè)施的企業(yè)和政府的必需品。
    的頭像 發(fā)表于 05-31 09:20 ?578次閱讀

    臺積電:AI服務(wù)處理預(yù)計翻番,拉動收入增長?

    臺積電將 AI 服務(wù)處理嚴格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI
    的頭像 發(fā)表于 04-19 15:04 ?356次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?743次閱讀

    Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計算和高容量存儲應(yīng)用的需求。
    的頭像 發(fā)表于 03-22 14:02 ?623次閱讀
    Hitek Systems開發(fā)基于PCIe的高性能<b class='flag-5'>加速器</b>以滿足行業(yè)需求

    FPGA在深度學(xué)習(xí)應(yīng)用或?qū)?b class='flag-5'>取代GPU

    ,這使其在 AI 應(yīng)用面臨著一些挑戰(zhàn)。 Larzul 表示,想要解決這些問題的解決方案便是實現(xiàn)現(xiàn)場可編程門陣列 (FPGA),這也是他們公司的研究領(lǐng)域。FPGA 是一種處理
    發(fā)表于 03-21 15:19

    瑞薩發(fā)布下一代動態(tài)可重構(gòu)人工智能處理加速器

    瑞薩最新發(fā)布的動態(tài)可重構(gòu)人工智能處理(DRP-AI加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨特之處在
    的頭像 發(fā)表于 03-08 13:45 ?766次閱讀

    家居智能化,推動AI加速器的發(fā)展

    提高了系統(tǒng)的運算能力和數(shù)據(jù)處理能力,還為用戶帶來了更加智能化、個性化的生活體驗。 ? AI 加速器的發(fā)展 ? 在人工智能和機器學(xué)習(xí)任務(wù)變得日益復(fù)雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足以處理這些任務(wù)。然而,隨著深度學(xué)習(xí)模型的出現(xiàn)
    的頭像 發(fā)表于 02-23 00:18 ?4580次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))5.FPGAAI加速源代碼

    使用硬件加速器來進一步提升性能。我寫的這個簡化的代碼只是為了幫助理解FPGA如何可能參與AI計算的過程。在實際的FPGA AI
    發(fā)表于 02-12 16:18

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場的運動。本文將詳細介紹回旋加速器
    的頭像 發(fā)表于 01-30 10:02 ?3930次閱讀

    FPGAGPU的區(qū)別

    FPGA(現(xiàn)場可編程門陣列)和GPU(圖形處理)是兩種常見的硬件加速器,用于提高計算和處理速度。盡管它們在很多方面都有重疊,但在架構(gòu)、設(shè)計和應(yīng)用上存在許多區(qū)別。在本文中,我們將詳細探
    的頭像 發(fā)表于 12-25 15:28 ?1723次閱讀
    RM新时代网站-首页