集賽靈思多年投資和35年架構(gòu)之大成,基于7nm工藝,多核異構(gòu)且能靈活改變,面向所有開發(fā)者和各種應(yīng)用的Versal 宣布發(fā)貨了!
剛剛,自適應(yīng)和智能計算的全球領(lǐng)先企業(yè)賽靈思公司(Xilinx, Inc.,(NASDAQ:XLNX))宣布已開始面向參與公司“早期試用計劃”的多家一線客戶交付 Versal? AI Core 和 Versal Prime 系列器件。Versal 是業(yè)界首款自適應(yīng)計算加速平臺(ACAP),這是一款具有革命性意義的新型異構(gòu)計算器件,其功能遠(yuǎn)超傳統(tǒng)的 CPU、GPU 和 FPGA。
ACAP 是一種高度集成的多核異構(gòu)計算平臺,可在軟硬件兩個層面隨時進(jìn)行更改,從而動態(tài)地適應(yīng)數(shù)據(jù)中心、汽車、5G 無線、有線以及國防市場的廣泛應(yīng)用與工作負(fù)載需求。
Versal ACAP 的體系架構(gòu)從構(gòu)建伊始即可支持軟件可編程,擁有高度靈活的、每秒傳輸速率高達(dá)數(shù)兆比特的片上網(wǎng)絡(luò) (NoC)。NoC 無縫集成所有引擎和關(guān)鍵接口,使得該平臺在啟動時即可使用平臺的各項資源,并且方便軟件開發(fā)者、數(shù)據(jù)科學(xué)家和硬件開發(fā)者等都能輕松進(jìn)行編程。通過一系列工具、軟件、庫、IP、中間件和固件,ACAP 讓使用者能隨時通過業(yè)界標(biāo)準(zhǔn)設(shè)計流程開發(fā)各種定制化的加速計算解決方案。
Versal 到底是什么?
看完上面的介紹,可能很多人還是很蒙圈,這個Versal ACAP 到底是個很東東呢?這里深度解讀一下。
在去年10月的賽靈思2018開發(fā)者大會(XDF)上,賽靈思CEO Victor Peng親自發(fā)布了基于7nm工藝的ACAP平臺首款產(chǎn)品Versal--Versal 這個詞代表多樣性和通用性,它是一款號稱針對任何應(yīng)用做AI加速應(yīng)用的平臺級產(chǎn)品,首先推出AI核心版和基礎(chǔ)版,后續(xù)會推出旗艦版、AI RF版、邊緣計算版、HBM版等,這是2018年繼華為麒麟980,蘋果A12之后,又一堪稱驚世之作的7nm產(chǎn)品。
Victor 在演講中指出,放眼全球,人工智能技術(shù)發(fā)展迅速,芯片技術(shù)已經(jīng)趕不上AI的發(fā)展,新的算法新的框架新的場景應(yīng)用層出不窮,要應(yīng)對這樣的變化,就需要有靈活多變的架構(gòu)去是適應(yīng)這樣的變化,早在四年前,賽靈思啟動“珠穆朗瑪”技術(shù),就是打造一個具有自適應(yīng)、和可以靈活實現(xiàn)計算加速的平臺,這就是ACAP平臺。
“隨著 AI 和大數(shù)據(jù)的爆炸性發(fā)展以及摩爾定律的放緩,行業(yè)已經(jīng)走到了一個關(guān)鍵的轉(zhuǎn)折點。芯片設(shè)計的周期已經(jīng)無法跟上創(chuàng)新的腳步。Versal 是歷經(jīng) 4 年的開發(fā)的業(yè)界首款 ACAP產(chǎn)品。我們對其進(jìn)行了獨特設(shè)計,支持所有類型的開發(fā)者通過優(yōu)化的軟硬件來為他們的整體應(yīng)用提速,同時具備即時的靈活應(yīng)變能力,從而能夠跟上科技快速發(fā)展的步伐。在業(yè)界需求最迫切的時刻 ACAP 可謂雪中送炭?!彼麖娬{(diào)。
“現(xiàn)在中國人工智能技術(shù)非?;鸨写罅咳斯ぶ悄艹鮿?chuàng)企業(yè),我認(rèn)為他們其實不一定要去開發(fā)AI芯片,他們可以采用我們的Versal平臺開發(fā)具體應(yīng)用,可以在算法和框架方面深入研究,這樣不用從頭做起,可以加速AI應(yīng)用?!彼赋?,“就像深鑒科技,他們兩年前就在基于賽靈思的產(chǎn)品做AI方面的開發(fā),因此在被我們收購后其成果可以迅速應(yīng)用到Versal平臺上,當(dāng)然,這也說明了我們產(chǎn)品的靈活性很好?!?/p>
Versal深度揭秘
賽靈思產(chǎn)品及技術(shù)營銷高級技術(shù)總監(jiān)Kirk Saban在隨后的演講中詳解介紹了這款可能改變?nèi)斯ぶ悄軕?yīng)用格局的產(chǎn)品。
他在專訪中指出,我們處于一個雜亂無序的數(shù)據(jù)堆積如山的時代,一種架構(gòu)無法獨自完成數(shù)據(jù)處理,需要異構(gòu)計算。
而從過去40年半導(dǎo)體發(fā)展歷史來看,計算引擎CPU單純采用"工藝縮放scaling"技術(shù)發(fā)展的道路遇到了很大的挑戰(zhàn),難以通過等量的計算提升換取等量的性能提升,半導(dǎo)體工藝的變化迫使計算引擎變成并行趨勢。
“摩爾定律終結(jié)后,CPU、GPU已經(jīng)不適應(yīng)未來趨勢,NV的新品只有最高的計算值,例如最新的T4號稱是P4強l6倍,但實際性能提升只有2.5倍左右,所以我們需要新的架構(gòu)?!盞irk指出。
所以,目前半導(dǎo)體行業(yè)在探索能替代的架構(gòu),包括一些原先在特殊領(lǐng)域的架構(gòu),但是這些架構(gòu)各有優(yōu)缺點,誰是最好的呢?
1、標(biāo)量處理(例如,CPU)在具有不同決策樹和大量庫的復(fù)雜算法中非常有效 - 但在性能縮放方面受到限制。
2、矢量處理元件(例如,DSP,GPU)在較窄的可并行化計算功能集上更有效 - 但由于不靈活的存儲器層次結(jié)構(gòu),造成延時和功耗增加,
3、可編程邏輯(例如,F(xiàn)PGA)可以針對特定計算功能進(jìn)行精確定制,使其在延遲敏感的實時應(yīng)用(例如,汽車駕駛員輔助)和不規(guī)則數(shù)據(jù)結(jié)構(gòu)(例如,基因組測序)方面表現(xiàn)最佳 - 但其算法=需要花費數(shù)小時來編譯,時間太長了!
Kirk表示賽靈思推出的新型異構(gòu)計算架構(gòu),即自適應(yīng)計算加速平臺(ACAP)是把各個架構(gòu)的優(yōu)勢融合起來,它提供了與下一代可編程邏輯緊密耦合的最好的世界級矢量和標(biāo)量處理元件( PL),全部與高帶寬片上網(wǎng)絡(luò)(NoC)融合在一起,可以提供對所有三種處理類型的存儲器映射訪問。,與任何單獨的一個架構(gòu)相比,這種緊密耦合的混合架構(gòu)可以實現(xiàn)驚人的定制和性能提升!
“當(dāng)今開發(fā)者需要軟件的可編程能力、滿足廣泛應(yīng)用的性能和適應(yīng)快速創(chuàng)新的靈活應(yīng)變能力。我們的產(chǎn)品可以滿足開發(fā)者這三個要求。”他指出。“通過軟件可編程實現(xiàn)對個各種負(fù)載的靈活支持,實現(xiàn)性能的大幅度提升?!?/p>
賽靈思ACAP框圖
實際上,Versal是完全軟件可編程,可以實現(xiàn)高達(dá)20倍的性能顯著提升,比當(dāng)今最快的FPGA還要快100倍!Versal產(chǎn)品組合包括 Versal 基礎(chǔ)系列( Versal Prime),Versal 旗艦系列 (Versal Premium旗艦)系列和 HBM 系列,能針對要求最嚴(yán)格的應(yīng)用提供業(yè)界領(lǐng)先的性能、連接性、帶寬和集成功能。此外,該產(chǎn)品組合還包括 AI 核心系列(AI Core),AI 邊緣系列 ( AI Edge) 和 AI 射頻系列(AI RF),采用突破性的 AI 引擎。
AI 引擎是一種新型硬件模塊,專為解決各種應(yīng)用低時延 AI 推斷的新需求而設(shè)計,同時支持高級 DSP 實現(xiàn)方案,滿足無線和雷達(dá)等應(yīng)用要求。它與 Versal 自適應(yīng)硬件引擎緊密結(jié)合,支持整體應(yīng)用加速,也就是說軟硬件都能調(diào)節(jié),從而確保最高性能和效率。
當(dāng)天發(fā)布的Versal Prime 系列和 Versal AI Core 系列,相對于業(yè)界領(lǐng)先的 GPU,AI 推斷性能預(yù)計能提升 8 倍。
VERSAL AI 核心系列
Versal AI 核心系列提供該系列最高計算性能和最低時延,實現(xiàn)突破性的 AI 推斷吞吐量和性能。該系列針對云端、網(wǎng)絡(luò)和自動駕駛技術(shù)進(jìn)行了優(yōu)化,提供業(yè)界最廣泛的 AI 和工作負(fù)載加速功能。Versal AI 核心系列 有 5 款產(chǎn)品,提供 128 到 400 個 AI 引擎。該系列包括雙核 Arm? Cortex?-A72 應(yīng)用處理器、雙核 Arm? Cortex?-R5 實時處理器、256KB 片上 ECC 存儲器、超過 1900 個專為高精度低時延浮點運算而優(yōu)化的 DSP 引擎。此外,它還包括 190 多萬個系統(tǒng)邏輯單元以及超過 130Mb 的 UltraRAM、高達(dá) 34Mb 的塊 RAM 和 28Mb 分布式 RAM 和 32Mb 新加速器 RAM 塊,任何引擎都能直接訪問,這也是 Versal AI 系列的獨特之處,而且都能支持定制存儲器架構(gòu)。該系列還包括 PCIe? Gen4 8 信道和 16 信道以及 CCIX 主機接口、功耗優(yōu)化型 32G SerDes、多達(dá) 4 個集成型 DDR4 存儲器控制器、多達(dá) 4 個多速率以太網(wǎng) MAC、650 個高性能 I/O(用于 MIPI D-PHY)、NAND、存儲級內(nèi)存接口和 LVDS、78 個多路復(fù)用 I/O(連接外部組件)和超過 40 個 HD I/O(3.3V 接口)。以上所有器件均通過業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實現(xiàn)互聯(lián),具有多達(dá) 28 個主/從端口,以低時延提供每秒多 Tb 帶寬,而且提供高功率效率和原生軟件的可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
THE VERSAL PRIME 系列
Versal Prime 系列經(jīng)過精心設(shè)計,適用于多個市場的廣泛應(yīng)用,并針對各種工作負(fù)載的連接性和在線加速進(jìn)行了優(yōu)化。這款中端系列包括 9 款產(chǎn)品,每款產(chǎn)品都采用雙核 Arm? Cortex-A72 應(yīng)用處理器、雙核 Arm? Cortex-R5 實時處理器、256KB 片上存儲器(帶 ECC)、超過 4000 個專為低時延高精度浮點運算優(yōu)化的 DSP 引擎。此外,它還包括 200 多萬個系統(tǒng)邏輯單元,結(jié)合 200Mb 以上 UltraRAM、超過 90Mb 的塊 RAM 以及 30Mb 分布式 RAM,能支持定制存儲器架構(gòu)。該系列還包括 PCIe? Gen4 8信道和 16 信道以及 CCIX 主機接口、功耗優(yōu)化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多達(dá) 6 個集成型 DDR4 存儲器控制器、多達(dá) 4 個多速率以太網(wǎng) MAC、700 個高性能 I/O(支持 MIPI D-PHY)、NAND、存儲級內(nèi)存接口和 LVDS、78 個多路復(fù)用 I/O(連接外部組件)和超過 40 個 HD I/O(3.3V 接口)。以上均通過業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實現(xiàn)互聯(lián),具有多達(dá) 28 個主/從端口,以低時延提供每秒多 Tb 帶寬,而且提供高功率效率和原生的軟件可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
Kirk 表示賽靈思未來的目標(biāo)就是讓機器學(xué)習(xí)更簡單,用軟件可編程讓Versal在毫秒內(nèi)實現(xiàn)可重配置,完成功能的切換,實現(xiàn)對負(fù)載場景的計算加速?!拔覀兊腁I引擎也有優(yōu)化,AI核心版本針對不同AI應(yīng)用有不同的AI引擎可以實現(xiàn)不同場景的支持。”而Victor也表示,賽靈思的ACAP平臺是不斷變化和進(jìn)步的平臺,因為AI技術(shù)還在發(fā)展初期還有更多算法更多框架出現(xiàn),只有不斷變化的架構(gòu)才可以適應(yīng)不斷變化的需求。
首批 Versal ACAP 器件提前從臺積電發(fā)回并出貨給早期試用客戶,是賽靈思創(chuàng)下的又一個歷史性的里程碑和工程成就。Versal ACAP 是賽靈思多年軟硬件投資及過去 35 年產(chǎn)品架構(gòu)全部知識的積累。Versal ACAP 是一項重大的技術(shù)突破,它將面向所有應(yīng)用和各種開發(fā)者開啟一個異構(gòu)計算加速的新時代。
—— Victor Peng,賽靈思總裁兼首席執(zhí)行官
Versal ACAP 產(chǎn)品系列采用臺積電 7 納米工藝技術(shù)打造而成,是業(yè)界首款將軟件可編程性與動態(tài)可配置的領(lǐng)域?qū)S糜布铀僖约皫椭髽I(yè)跟上當(dāng)今快速創(chuàng)新步伐的靈活應(yīng)變能力結(jié)為一體的平臺。該產(chǎn)品系列融合了用于嵌入式計算的新一代標(biāo)量引擎,用于 FPGA 芯片編程的自適應(yīng)引擎,以及用于 AI 推斷與高級信號處理的智能引擎,從而在計算性能和單位功耗性能上都大幅超越了CPU和GPU。
Versal AI Core 系列在整個 Versal 產(chǎn)品系列中提供了最高計算性能和最低時延,并通過 AI 引擎實現(xiàn)了突破性的 AI 推斷吞吐量和性能。該系列針對云端、網(wǎng)絡(luò)和自動駕駛技術(shù)進(jìn)行優(yōu)化,提供了業(yè)界最廣泛的 AI 和工作負(fù)載加速功能。Versal Prime 系列的設(shè)計廣泛適用于各種應(yīng)用,并針對各種工作負(fù)載的連接性和在線加速進(jìn)行了優(yōu)化。
Versal AI Core 系列和 Versal Prime 系列均包含多款器件,每款器件都配備雙核 Arm? Cortex?-A72 應(yīng)用處理器、雙核 Arm Cortex-R5F 實時處理器、超過 200 萬個邏輯單元的自適應(yīng)硬件以及 3,000 多個為高精度浮點與低時延優(yōu)化的 DSP 引擎。Versal AI Core 器件提供多達(dá) 400 個專為 AI 推斷和高級信號處理工作負(fù)載優(yōu)化的 AI 引擎。
Versal 系列還包括其他四個產(chǎn)品系列,每個系列都有其獨特的架構(gòu),可以為從云到聯(lián)網(wǎng)乃至無線通信、邊緣計算和端的各種市場的眾多應(yīng)用提供可擴展性和AI推斷功能。
Versal 重要信息
全面供貨
Versal AI Core 系列和 Versal Prime 系列將于 2019 年下半年上市。
賽靈思將于10月1日-2日在美國加州硅谷舉辦的2019 年賽靈思開發(fā)者論壇(XDF)上現(xiàn)場演示 Versal ACAP。
-
賽靈思
+關(guān)注
關(guān)注
32文章
1794瀏覽量
131246 -
Versal
+關(guān)注
關(guān)注
1文章
158瀏覽量
7658
原文標(biāo)題:剛剛,賽靈思發(fā)了個大招!--Versal ACAP 開始出貨了!
文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論