S7t-VG6 VectorPath加速卡是Achronix公司聯(lián)合BittWare公司(Molex旗下的領(lǐng)先企業(yè)級FPGA加速器產(chǎn)品供應(yīng)商)推出的一類全新的、面向高性能計(jì)算和數(shù)據(jù)加速應(yīng)用的FPGA加速卡。該加速卡搭載了Achronix采用7納米工藝打造的Speedster 7tAC7t1500獨(dú)立FPGA芯片,在同類PCIe FPGA加速卡中,可提供目前業(yè)界最高性能的接口。這些高性能接口包括1個400G以太網(wǎng)接口和2個100G以太網(wǎng)接口,以及總帶寬為3.5 Tbps的8組GDDR6板上存儲器,從而使該加速卡成為人工智能/機(jī)器學(xué)習(xí)(AI / ML)、網(wǎng)絡(luò)和高帶寬數(shù)據(jù)加速應(yīng)用的理想選擇。 本文詳細(xì)介紹了S7t-VG6 VectorPath加速卡的特性和功能,歡迎您閱讀,以進(jìn)一步了解該產(chǎn)品。您也可以在Achronix微信公眾號的“產(chǎn)品介紹”欄目中隨時閱讀本文。
VectorPath加速卡——基于最新的7納米FPGA技術(shù)構(gòu)建您的應(yīng)用
S7t-VG6 FPGA加速卡簡介
提升FPGA的加速性能不僅僅在于增加門數(shù),還需要更好的高速數(shù)據(jù)傳輸通道、更加精心定制的可編程單元、具有更高帶寬的大容量存儲以及新一代網(wǎng)絡(luò)功能的支持。Achronix和BittWare聯(lián)合打造的S7t VectorPath加速卡,可以為您的應(yīng)用在計(jì)算和數(shù)據(jù)傳輸方面提供下一代加速功能。
S7t FPGA加速卡的核心是Achronix的7納米Speedster7t FPGA。該 FPGA充分發(fā)揮了臺積電(TSMC)7納米FinFET工藝的潛力,專門針對人工智能/機(jī)器學(xué)習(xí)和高帶寬數(shù)據(jù)加速應(yīng)用進(jìn)行了高度優(yōu)化。
S7t FPGA加速卡為用戶提供了一系列先進(jìn)的輸入輸出(I/O)接口,包括400G以太網(wǎng)接口、多個PCIe接口和高帶寬GDDR6存儲器接口。
客戶可以通過BittWare的BittWorks II工具包快速開啟此加速卡的使用,該工具包包含示例工程,同時支持Linux和Windows操作系統(tǒng)。
(a)Achronix的7納米Speedster7t FPGA
(b)S7t FPGA加速卡
Achronix的革命性芯片設(shè)計(jì)+BittWare的企業(yè)級設(shè)計(jì)
S7t-VG6 FPGA加速卡功能
★ 片上網(wǎng)絡(luò)(NoC)——高速數(shù)據(jù)通道令FPGA內(nèi)部暢通無阻
NoC是Speedster7t FPGA的高速數(shù)據(jù)通道,可以沿著行/列在FPGA結(jié)構(gòu)中或向著邊緣接口高速移動數(shù)據(jù),從而釋放更多的邏輯單元用于計(jì)算任務(wù)。
NoC的總帶寬達(dá) >27 Tbps。外圍的NoC(外圈)可以將存儲器和PCIe邊緣接口連接至NoC的行/列。外圍的NoC還可以在獨(dú)立于FPGA結(jié)構(gòu)之外的接口間移動數(shù)據(jù)——例如,主機(jī)可以在不使用任何FPGA內(nèi)部資源的情況下通過PCIe將數(shù)據(jù)傳輸至GDDR6。
★ FPGA結(jié)構(gòu)——運(yùn)算能力高達(dá)86 TOPS,最高運(yùn)行頻率為750MHz
可重新配置的邏輯模塊(RLB)
RLB是Speedster7t的一項(xiàng)特色功能:它是一種全新的可重新配置的邏輯架構(gòu),帶有6輸入查找表和8位算術(shù)邏輯單元,每個查找表有2個觸發(fā)器,它還具有一種基于改進(jìn)型Booth算法重新構(gòu)造的乘法器查找表(MLUT)模式,該算法可使基于查找表的乘法運(yùn)算性能提高一倍。
Speedster7t FPGA擁有692K的查找表。
機(jī)器學(xué)習(xí)處理器(MLP)
MLP模塊是支持定點(diǎn)和浮點(diǎn)計(jì)算的大規(guī)模矩陣向量和矩陣乘法引擎。MLP提供的功能包括帶有累加可選項(xiàng)的整數(shù)乘法(int4/int8/int16/int32)、bfloat16格式的浮點(diǎn)運(yùn)算、16位浮點(diǎn)運(yùn)算、塊浮點(diǎn)運(yùn)算和24位浮點(diǎn)運(yùn)算。MLP完全可拆分的整數(shù)乘法器/累加器的結(jié)構(gòu),可有效支持機(jī)器學(xué)習(xí)推理和更傳統(tǒng)的應(yīng)用,例如復(fù)雜的自適應(yīng)信號處理。
根據(jù)不同乘法器格式,每個MLP可以支持或是可等效成的乘法器數(shù)量也會有變化,例如每個MLP可以支持4個int16,或者16個int8,或者32個int4乘法器。Achronix的Speedster7t-1500器件支持有2560個MLP,因此支持Int8 MAC多達(dá)40,960個,運(yùn)行在750MHz的時鐘頻率時,推算最大性能為每秒61.4萬億次操作。
MLP模塊包括兩個可以單獨(dú)使用或與乘法器一起使用的存儲器模塊??傮w的嵌入式存儲器容量為189Mb。
★ 高帶寬GDDR6存儲器
速度快6倍的大容量存儲器——目前板卡支持的GDDR6帶寬為3.5Tbps,容量為16GB容量。而FPGA芯片支持的GDDR6帶寬可到4Tbps,容量可支持到32GB。
通過使用高帶寬GDDR6存儲器,S7t加速卡可以為您的應(yīng)用提供16GB的大容量存儲器資源,但同時可提供高達(dá)6倍的帶寬。
此外,借助NoC,可以在不使用FPGA資源的情況下,從主機(jī)通過PCIe對GDDR6進(jìn)行讀/寫。
★ 高達(dá)400G的網(wǎng)絡(luò)
S7t加速卡提供了一系列可連接至Speedster7t FPGA邏輯結(jié)構(gòu)的網(wǎng)絡(luò)接口。憑借由硬IP實(shí)現(xiàn)的MAC(Hard IP MAC)和前向糾錯(FEC)技術(shù)的支持,該加速卡可支持56G PAM4。板載的抖動消除器可用于同步以太網(wǎng)(Synchronous Ethernet)。
QSFP 56G(PAM4)接口
第一個接口是一個帶有4個SerDes通道的QSFP56接口,可支持的以太網(wǎng)接口:200/100/50/25/10 GbE。
第二個接口是一個帶有8個SerDes通道的QSFP-DD接口,可支持的以太網(wǎng)接口:400/200/100/50/25/10 GbE。
如圖所示的分支連接線提供了一系列其他選項(xiàng)。
★ PCIe、擴(kuò)展和定制
PCIe Gen5 x16接口
S7t加速卡支持一個PCIe Gen5 x16接口,已經(jīng)通過PCI-SIG認(rèn)證。BittWorks II工具包提供的示例項(xiàng)目中包括了用于PCIe交互的示例。
MCIO接口
支持MCIO接口,通過4個高速收發(fā)器連接到FPGA,支持PCIe Gen5的數(shù)據(jù)速率。
支持PCIe5.0的NVMe存儲應(yīng)用
板對板互連
可以使用自定義選項(xiàng)連接至配件板
定制
得益于三十年來構(gòu)建定制化解決方案的經(jīng)驗(yàn),BittWare作為您的合作伙伴可以在各方面提供支持,從簡單的配件板到各種具有復(fù)雜機(jī)械要求的完全定制方案,一應(yīng)俱全。我們的資源包括業(yè)務(wù)覆蓋全球的莫仕(Molex)集團(tuán),因此可以處理任何規(guī)模的項(xiàng)目。
★ 加速卡的其他功能
用于同步以太網(wǎng)的抖動消除器
可從前面板接入1 pps(每秒1個脈沖)的外部參考時鐘
具有健康監(jiān)測功能的基板管理控制器(BMC)
用于Linux和Windows操作系統(tǒng)的驅(qū)動程序
應(yīng)用領(lǐng)域
★ 計(jì)算
旨在滿足要求最嚴(yán)苛的計(jì)算密集型應(yīng)用
8組GDDR6存儲器可提供3.5 Tbps左右的帶寬
針對人工智能/機(jī)器學(xué)習(xí)(AI/ML)功能進(jìn)行了優(yōu)化的機(jī)器學(xué)習(xí)處理器(MLP):
在Int8整數(shù)格式下,可提供多達(dá)41K的乘累加單元(MAC)
支持多種浮點(diǎn)格式和整數(shù)格式
★ 網(wǎng)絡(luò)
QSFP-DD和QSFP56端口可滿足多種高速網(wǎng)絡(luò)應(yīng)用的需求
硬化的多速率MAC適用于10G - 400G以太網(wǎng)
片上網(wǎng)絡(luò)(NoC)的帶寬超過27 Tbps,支持?jǐn)?shù)據(jù)流輸入器件、從器件輸出以及跨越整個器件移動。
★ 存儲
NVMe接入可支持?jǐn)?shù)據(jù)記錄器和數(shù)據(jù)處理應(yīng)用
通過MICO擴(kuò)展端口連接NVMe閃存
數(shù)據(jù)流直接從網(wǎng)絡(luò)端口傳輸至閃存陣列
★ 傳感器處理
使用GPIO和SerDes擴(kuò)展端口針對您的特定應(yīng)用需求進(jìn)行優(yōu)化
直接與自定義數(shù)據(jù)和控制信號連接
可直接互補(bǔ)性傳感器和處理器技術(shù)
開發(fā)工具
★ ACE:FPGA開發(fā)軟件
Achronix的ACE軟件是Speedster7t的開發(fā)環(huán)境。ACE可以執(zhí)行硬件設(shè)計(jì)流程,支持RTL輸入(VHDL和Verilog語言皆可)和行業(yè)標(biāo)準(zhǔn)仿真。ACE還支持使用NoC等高級芯片功能。ACE包括了為Achronix優(yōu)化的Synopsys的Synplify-Pro工具。
★ BittWare的BittWorks II工具包:強(qiáng)大的開發(fā)工具
BittWorks II工具包提供了驅(qū)動程序、庫、實(shí)用程序和示例項(xiàng)目,可用于訪問、整合和開發(fā)S7t加速卡的應(yīng)用。
TeraBox服務(wù)器
★ 將您的S7t加速卡置入TeraBox服務(wù)器中!
讓我們來完成服務(wù)器的集成并啟動您的應(yīng)用的概念驗(yàn)證,您無需再去準(zhǔn)備額外的、寶貴的開發(fā)資源!
★ 通過TeraBox服務(wù)器延長您的保修期
對于大多數(shù)內(nèi)置加速卡的TeraBox服務(wù)器,您在購買后可以將加速卡的保修期延長至3年。
S7t-VG6加速卡的規(guī)格
FPGA |
Speedster AC7t1500 基于 TSMC 7nm FinFET 工藝 692K的6輸入LUT(相當(dāng)于1,522K的4輸入LUT) 二維NOC達(dá)到 >27 Tbps的帶寬 片上RAM的容量約為189Mb 高達(dá)86 TOPS 的 int8 性能 ResNet-50 基準(zhǔn)測試:每秒 8,600 張圖像 該芯片支持GDDR6的總帶寬可到4Tbps,容量可到32GB 該芯片支持112Gbps SerDes |
板載存儲器 |
GDDR6 板載的8組GDDR6存儲器,總帶寬約為3.5Tbps,總存儲容量為16GB DDR4 具有錯誤檢查和糾正(ECC)功能的、運(yùn)行頻率為2666MHz的DDR4存儲器,存儲容量為4GB(72位位寬) Flash 用于啟動FPGA的閃存 |
主機(jī)接口 | 可直接連接至FPGA的PCIe Gen5/4 x16接口 |
外部時鐘 | 可從前面板輸入1pps、10MHz的參考時鐘 |
Micro USB接口 | 通過USB接口訪問BMC,USB接口轉(zhuǎn)JTAG接口,USB接口轉(zhuǎn)UART接口 |
MCIO接口 |
MCIO接口位于加速卡正面,通過4個收發(fā)器連接至FPGA 由硬PCIe IP實(shí)現(xiàn) |
GPIO接口 | 8個GPIO引腳,電壓為3.3V,單端型,每個GPIO引腳的方向(發(fā)送或接收)可由FPGA分別設(shè)置,緩沖器的額定速率為200Mbps |
QSFP接口 |
板上的QSFP-DD的接口: 56G PAM4收發(fā)器 支持:1x 400GbE,2x 200GbE,4x 100GbE或8x 10/25/40/50GbE 支持MAC硬核和前向糾錯(FEC)功能 板上的QSFP56接口: 56G PAM4收發(fā)器 支持:1x 200GbE,2x 100GbE,或4x 10/25/40/50GbE 支持MAC硬核和前向糾錯(FEC)功能 |
基板管理控制器 |
電壓、電流、溫度監(jiān)測 上電順序和復(fù)位 現(xiàn)場升級 FPGA配置和控制 時鐘配置 I2C總線訪問 USB 2.0接口 電壓調(diào)節(jié) |
冷卻 |
標(biāo)準(zhǔn):雙倍寬度無源散熱器 可選項(xiàng):雙倍寬度有源散熱器 可選項(xiàng):雙倍寬度液體冷卻 |
用電 |
板上供電來自于兩個AUX連接器(8引腳) 功耗取決于應(yīng)用 典型的最大功耗值有待確定 |
環(huán)境 | 工作溫度為5°C-35°C |
尺寸 | 標(biāo)準(zhǔn)高度、雙倍寬度的PCIe板 |
關(guān)于Achronix半導(dǎo)體公司
Achronix半導(dǎo)體公司是一家私有的、采用無晶圓廠模式的半導(dǎo)體公司,總部位于美國加利福尼亞州圣克拉拉市,同時提供高性能FPGA和嵌入式FPGA(eFPGA)解決方案。Achronix歷來都是高性能FPGA市場向前發(fā)展的推動者之一。Achronix提供的產(chǎn)品包括可編程的FPGA結(jié)構(gòu),具有硬連線系統(tǒng)級模塊的高性能、高密度獨(dú)立FPGA,數(shù)據(jù)中心和高性能計(jì)算(HPC)硬件加速器板,以及支持所有Achronix產(chǎn)品的一流EDA軟件。公司在美國、歐洲和中國都設(shè)有銷售辦公室和代表處,在印度班加羅爾設(shè)有一間研發(fā)和設(shè)計(jì)辦公室。
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5419瀏覽量
171594 -
接口
+關(guān)注
關(guān)注
33文章
8575瀏覽量
151014 -
加速卡
+關(guān)注
關(guān)注
1文章
60瀏覽量
10943 -
Achronix
+關(guān)注
關(guān)注
1文章
76瀏覽量
22530
原文標(biāo)題:S7t-VG6 VectorPath加速卡產(chǎn)品介紹
文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論