如何確定一個(gè)硬件加速應(yīng)用

本文來(lái)自 XILINX 產(chǎn)品應(yīng)用工程師 Yang Chen

在開(kāi)發(fā)一個(gè)加速程序的之前，有一個(gè)很重要的步驟：正確設(shè)計(jì)程序架構(gòu)。開(kāi)發(fā)人員需要明確軟件應(yīng)用程序中哪一部分是需要硬件加速的，并且它多少的并行量，以保證硬件加速器件（FPGA）能完美發(fā)揮其作用。

本文將分為5個(gè)步驟來(lái)介紹：

1. 基準(zhǔn)和建立目標(biāo)

2. 確定加速部分

3. 確定FPGA硬件加速并行量

4. 確定軟件部分并行量

5. 微調(diào)架構(gòu)細(xì)節(jié)。

1. 基準(zhǔn)和建立目標(biāo)

首先要測(cè)試應(yīng)用程序的運(yùn)行時(shí)間和吞吐量，來(lái)確定當(dāng)前應(yīng)用程序在現(xiàn)有平臺(tái)的的基準(zhǔn)性能。這些數(shù)據(jù)應(yīng)涵蓋整個(gè)應(yīng)用程序（起始到結(jié)束）的性能和各個(gè)主要函數(shù)的性能。通常使用valgrind，callgrind和GNU gprof這些測(cè)試軟件來(lái)獲得應(yīng)用程序的性能數(shù)據(jù)，它們會(huì)顯示應(yīng)用程序中所有的函數(shù)數(shù)量以及各個(gè)函數(shù)的執(zhí)行時(shí)間。通過(guò)這些數(shù)據(jù)，我們可以找到耗時(shí)最長(zhǎng)的部分，然后放到FPGA上進(jìn)行加速。

評(píng)估運(yùn)行時(shí)間

測(cè)試運(yùn)行時(shí)間是軟件開(kāi)發(fā)的基本流程，可以使用一些常用的測(cè)試軟件，或者插入計(jì)時(shí)器和性能計(jì)數(shù)器來(lái)完成此項(xiàng)操作。以gprof為例，可以得到類似如下圖結(jié)果，具體gprof的用法可以參考：http://sourceware.org/binutils/docs-2.17/gprof/index.html

評(píng)估吞吐量

這里的吞吐量是指數(shù)據(jù)被處理的速率。對(duì)于計(jì)算給定函數(shù)的吞吐量，具體公式為函數(shù)處理的數(shù)據(jù)除以函數(shù)處理的時(shí)間，如下：

TSW= max (VINPUT, VOUTPUT) / Running Time

如果是處理固定的數(shù)據(jù)量，只要簡(jiǎn)單的檢查代碼就能知道吞吐量的大小。但在一些情況下，數(shù)據(jù)是可變的，那么插入計(jì)數(shù)器來(lái)測(cè)量吞吐量的大小是比較實(shí)用的。

確定最大可實(shí)現(xiàn)的吞吐量

在大多數(shù)加速系統(tǒng)中，最大可實(shí)現(xiàn)吞吐量受PCIe總線的限制。PCIe總線受很多因素的影響，例如母板，驅(qū)動(dòng)，目標(biāo)板卡和發(fā)送數(shù)據(jù)大小等等。運(yùn)行DMA測(cè)試能夠測(cè)試PCIe發(fā)送的有效吞吐量，從而確定加速性能潛力的上限。在安裝Alveo板卡后，我們可以使用xbutil dmatest命令來(lái)測(cè)試板卡的PCIe性能。

建立總體加速目標(biāo)

在開(kāi)發(fā)過(guò)程中盡早確定加速目標(biāo)是非常有必要的，基于基準(zhǔn)性能的加速目標(biāo)會(huì)決定分析和決策的走向。加速目標(biāo)可以是硬性的也可以是軟性的。例如，實(shí)時(shí)視頻應(yīng)用程序有每秒處理60幀的嚴(yán)格硬性目標(biāo)，而數(shù)據(jù)科學(xué)應(yīng)用程序的軟性目標(biāo)是比其他可代替實(shí)現(xiàn)方法快10倍。所以無(wú)論哪種方式，領(lǐng)域?qū)I(yè)知識(shí)對(duì)于設(shè)置可實(shí)現(xiàn)的加速目標(biāo)都很重要。

2. 確定加速部分

評(píng)估基準(zhǔn)性能后，下一步就是確定哪一個(gè)函數(shù)需要在FPGA上加速。當(dāng)選擇哪個(gè)函數(shù)用于加速時(shí)，有兩個(gè)方面需要考慮到：

性能瓶頸：應(yīng)用程序中有哪些函數(shù)需要著重關(guān)注

加速潛力：這些函數(shù)是否有加速的潛力

確定性能瓶頸

在一個(gè)純粹的順序進(jìn)行的應(yīng)用程序中，可以通過(guò)解析報(bào)告很容易甄別到性能瓶頸。然而，大多數(shù)現(xiàn)實(shí)中的應(yīng)用程序都是多進(jìn)程，因此在尋找性能瓶頸的時(shí)候考慮并行性很重要。一個(gè)很簡(jiǎn)單的例子：

如上圖中是一個(gè)應(yīng)用程序中兩條并行的路徑，長(zhǎng)度表示它們運(yùn)行消耗時(shí)間。從這里我們看出，僅僅加速A，B進(jìn)程的某一個(gè)并不能提高應(yīng)用程序的整體性能。即使你將A2加速100倍，該應(yīng)用程序的性能還是被A1和B進(jìn)程鉗制。所以考慮加速對(duì)象時(shí)，要考慮整個(gè)應(yīng)用程序的性能，而不是單個(gè)函數(shù)的性能。

確定加速潛力

作為軟件程序中的瓶頸函數(shù)不一定具有加速的潛力，通常需要進(jìn)行詳細(xì)分析才能準(zhǔn)確判斷給定函數(shù)的實(shí)際加速潛力。但是，有時(shí)候一些簡(jiǎn)單的指導(dǎo)方法也能確定一個(gè)函數(shù)是否有加速潛力：

1. 選擇運(yùn)算復(fù)雜度比較大的，相比于順序計(jì)算來(lái)說(shuō)，它可以在FPGA上可以使用并行，流水線來(lái)提高效率。

2. 相對(duì)于輸入輸出來(lái)說(shuō)的，選擇運(yùn)算強(qiáng)度比較大的，因?yàn)檫@樣數(shù)據(jù)搬移時(shí)間開(kāi)銷占用整個(gè)加速時(shí)間比率來(lái)說(shuō)會(huì)低一些。

3. 選擇那些能夠數(shù)據(jù)重用，對(duì)內(nèi)存訪問(wèn)比較少的，因?yàn)檫@可以是數(shù)據(jù)更容易在加速器中緩存，減少對(duì)全局內(nèi)存的訪問(wèn)。

4. 對(duì)比函數(shù)吞吐量和FPGA吞吐量的比值，以確定最大可加速的倍數(shù)。

3. 確定FPGA硬件加速并行量

在前面的步驟中確定哪個(gè)函數(shù)用于加速之后，接下來(lái)就要確定使用多少的并行量來(lái)達(dá)到這一目標(biāo)。內(nèi)核（kernel）的并行性可以分為大致兩種，一種是流水線形式，即是輸入和處理數(shù)據(jù)同時(shí)進(jìn)行；另一種是同時(shí)處理多個(gè)任務(wù)，即是擁有多個(gè)輸入，多個(gè)任務(wù)并行處理。

評(píng)估硬件吞吐量（非并行）

沒(méi)有進(jìn)行并行化的內(nèi)核（kernel）吞吐量可以近似為：

THW = Frequency（頻率） / Computational Intensity（計(jì)算強(qiáng)度） = Frequency * max(VINPUT,VOUTPUT) / VOPS

頻率就是kernel的時(shí)鐘頻率。這個(gè)值是由特定的平臺(tái)決定，比如，Alveo U200的最大kernel時(shí)鐘是300Mhz。VINPUT，VOUTPUT是輸入輸出數(shù)據(jù)，VOPS是操作總數(shù)。由此可以看出，大量的操作數(shù)和少量的數(shù)據(jù)的函數(shù)更適合加速。

確定所需的并行量

經(jīng)過(guò)上述計(jì)算后，可以估算出初始的HW/SW性能比：

Speed-up = THW/TSW = Fmax * Running Time /VOPS

沒(méi)有使用并行運(yùn)算，則初始的加速（speed-up）通常會(huì)小于1。

接下來(lái)就要計(jì)算多少并行量可以滿足性能目標(biāo)：

Parallelism Needed = TGoal / THW = TGoal * Vops / (Fmax * max(VINPUT, VOUTPUT))

并行方式可以通過(guò)多種方式實(shí)現(xiàn)：拓展數(shù)據(jù)路徑，使用多個(gè)計(jì)算引擎，使用多個(gè)kernel實(shí)例，開(kāi)發(fā)人員應(yīng)根據(jù)他們的需求和應(yīng)用程序的特點(diǎn)確定最佳組合方式。

確定數(shù)據(jù)路徑應(yīng)并行處理多少個(gè)樣本

一種可能性是通過(guò)創(chuàng)建更寬的數(shù)據(jù)路徑（數(shù)據(jù)的輸入和輸出的過(guò)程）然后并行處理更多數(shù)據(jù)以便加快計(jì)算速度。有些算法很適合這種方法，而有些則不適用。重要的是要了解這個(gè)算法的本質(zhì)，確定這種方法是否可運(yùn)用。如果可運(yùn)用，那么并行處理多少數(shù)據(jù)才能滿足性能目標(biāo)也是需要考慮的。

運(yùn)用更寬的數(shù)據(jù)路徑、并行處理更多數(shù)據(jù)這些方法，本質(zhì)是通過(guò)減少加速函數(shù)等待時(shí)間（運(yùn)行時(shí)間）來(lái)實(shí)現(xiàn)提高性能的。

確定在FPGA中可以（應(yīng)該）實(shí)例化多少個(gè)kernel

如果數(shù)據(jù)路徑無(wú)法并行化（或不夠充分），則請(qǐng)考慮添加更多kernel實(shí)例，這通常被稱為使用多個(gè)計(jì)算單元（CU）。添加更多的kernel實(shí)例的本質(zhì)是允許加速函數(shù)更多的調(diào)用，從而提高應(yīng)用程序的性能，如下所示。多個(gè)數(shù)據(jù)集由不同的實(shí)例并發(fā)處理。只要主機(jī)應(yīng)用程序可以保持kernel繁忙，應(yīng)用程序的性能就會(huì)隨著實(shí)例數(shù)的增加而線性增加。

在Vitis中，很容易通過(guò)添加額外的kernel實(shí)例來(lái)提高加速性能，不需要過(guò)多的代碼調(diào)整。在這一點(diǎn)上，開(kāi)發(fā)人員應(yīng)該充分了解硬件中滿足性能目標(biāo)所需的并行度，結(jié)合數(shù)據(jù)路徑寬度和kernel實(shí)例來(lái)達(dá)到預(yù)期的目標(biāo)。

4. 確定軟件部分并行量

雖然FPGA及其kernel旨在提供潛在的并行性，但是必須對(duì)軟件應(yīng)用程序進(jìn)行設(shè)計(jì)以便利用這種潛在的并行性。

軟件應(yīng)用程序中的并行性主要是以下幾方面：

?最大限度地減少空閑時(shí)間，并在kernel運(yùn)行時(shí)執(zhí)行其他任務(wù)。

?保持kernel處于活動(dòng)狀態(tài)，以便盡早并經(jīng)常執(zhí)行新的計(jì)算。

?優(yōu)化與FPGA之間的數(shù)據(jù)傳輸。

如上圖所示，host程序總是處于繁忙狀態(tài)并且計(jì)劃執(zhí)行下一步的操作，而kernel端是處理當(dāng)前的任務(wù)。所以，host程序必須統(tǒng)籌與kernel的數(shù)據(jù)傳輸，并且向kernel端發(fā)送請(qǐng)求，不然再多的kernel也是沒(méi)有效果的。

在kernel運(yùn)行時(shí)最大程度地減少CPU空閑時(shí)間

FPGA加速是將某些計(jì)算從主機(jī)處理器轉(zhuǎn)移到FPGA的kernel中，在純順序模型中，應(yīng)用程序?qū)㈤e置地等待結(jié)果，準(zhǔn)備并回復(fù)處理。設(shè)計(jì)軟件應(yīng)用程序以避免此類空閑周期，首先是確定不依賴kernel結(jié)果的應(yīng)用程序部分，然后重新設(shè)計(jì)，以便這些函數(shù)可以在主機(jī)處理器上與FPGA中運(yùn)行的kernel同時(shí)運(yùn)行處理。

保持kernel利用率

Kernel是在FPGA中的，僅在應(yīng)用程序請(qǐng)求它們時(shí)才運(yùn)行。為了最大程度地提高性能，應(yīng)使kernel一致處于繁忙（工作）狀態(tài)。從概念上講，這是通過(guò)在當(dāng)前請(qǐng)求完成之前發(fā)出下一個(gè)請(qǐng)求來(lái)實(shí)現(xiàn)的。這可以實(shí)現(xiàn)流水線式執(zhí)行和重復(fù)執(zhí)行，使kernel得到最佳利用。

在上圖這個(gè)例子中，原始的應(yīng)用程序重復(fù)的調(diào)用 func1，func2和func3。針對(duì)這個(gè)應(yīng)用程序?qū)?yīng)創(chuàng)建了三個(gè)kernel是K1，K2和K3。最平庸的實(shí)現(xiàn)是將三個(gè)kernel按順序運(yùn)行，就像原始的應(yīng)用程序一樣。但是，這意味著每個(gè)kernel只有三分之一的時(shí)間處于工作狀態(tài)。更好的方法是重構(gòu)軟件應(yīng)用程序，以便它可以向kernel發(fā)出流水線請(qǐng)求。這允許K1在K2處理K1的輸出的同時(shí)開(kāi)始處理新的數(shù)據(jù)集。通過(guò)這個(gè)方法，三個(gè)kernel以最大化的利用率不斷運(yùn)行。

優(yōu)化與FPGA之間的數(shù)據(jù)傳輸

在加速的應(yīng)用程序中，必須將數(shù)據(jù)從主機(jī)傳輸?shù)紽PGA，尤其是基于PCIe的應(yīng)用程序中。這就引入了延遲，對(duì)于應(yīng)用程序的整體性能而言，可能是非常昂貴的。數(shù)據(jù)需要在正確的時(shí)間被傳輸，如果kernel的運(yùn)行需要等待數(shù)據(jù)，那么應(yīng)用程序的性能會(huì)收到負(fù)面影響。因此，重要的是在kernel需要數(shù)據(jù)時(shí)提前傳輸數(shù)據(jù)。這可以通過(guò)重復(fù)數(shù)據(jù)傳輸、kernel執(zhí)行來(lái)實(shí)現(xiàn)，這可以隱藏?cái)?shù)據(jù)傳輸?shù)牡却龝r(shí)間開(kāi)銷，并避免kernel等待數(shù)據(jù)的情況。

優(yōu)化數(shù)據(jù)傳輸?shù)牧硪环N方法是傳輸最佳大小的緩沖區(qū)。如下圖所示，有效的PCIe吞吐量根據(jù)傳輸?shù)木彌_區(qū)大小而有很大的差異。緩沖區(qū)越大，吞吐量越好，從而確保加速器始終具有可操作的數(shù)據(jù)而不會(huì)浪費(fèi)時(shí)間。通常來(lái)說(shuō)，最好進(jìn)行1MB或更大的數(shù)據(jù)傳輸。預(yù)先運(yùn)行DMA測(cè)試對(duì)于找到最佳緩沖區(qū)大小可能很有用。同樣，在確定最佳緩沖區(qū)大小時(shí)，請(qǐng)考慮大緩沖區(qū)對(duì)資源利用率和傳輸延遲的影響。

Xilinx建議在一個(gè)公共緩沖區(qū)內(nèi)對(duì)多組數(shù)據(jù)進(jìn)行分組，以實(shí)現(xiàn)最大可能的吞吐量。

概念化應(yīng)用程序時(shí)間線

開(kāi)發(fā)人員現(xiàn)在應(yīng)該對(duì)哪些函數(shù)需要加速，需要什么并行性才能達(dá)到性能目標(biāo)以及如何交付應(yīng)用程序有很好的了解。在這一點(diǎn)上，以應(yīng)用程序時(shí)間表的形式總結(jié)信息是非常有用的。應(yīng)用程序時(shí)間軸序列（例如“保持Kernels使用率”中所示的序列）是應(yīng)用程序在運(yùn)行時(shí)表現(xiàn)性能和并行化非常有效的方法。它們可以展示應(yīng)用程序如何調(diào)動(dòng)體系結(jié)構(gòu)中潛在的并行性。

Vitis軟件平臺(tái)會(huì)從實(shí)際應(yīng)用程序運(yùn)行中生成時(shí)間軸視圖。如果開(kāi)發(fā)人員設(shè)計(jì)了預(yù)期的時(shí)間表，則可以將其與實(shí)際結(jié)果進(jìn)行比較，從而確定潛在的問(wèn)題，然后迭代并收斂到最佳結(jié)果，如上圖所示。

5. 微調(diào)架構(gòu)細(xì)節(jié)

在正式編寫(xiě)應(yīng)用程序及其kernel之前，還有最后一步：從頂層決策中細(xì)化和提煉次級(jí)體系架構(gòu)的細(xì)節(jié)。

確定最終kernel邊界

之前已經(jīng)有過(guò)討論，通過(guò)創(chuàng)建多個(gè)kernel的示例可以提高性能。然而，增加CU（compute unit）會(huì)對(duì)IO端口，帶寬和資源有額外地消耗。

在Vitis軟件平臺(tái)流程中，kernel端口的最大寬度為512，并且FPGA在資源方面也具有固定的成本，并不是無(wú)限消耗。重要的是，目標(biāo)平臺(tái)也對(duì)可使用的最大端口設(shè)置了限制。所以我們要注意這些限制，以最佳方式充分使用這些端口及其帶寬。

使用多個(gè)CU進(jìn)行擴(kuò)展的另一種方法是通過(guò)在內(nèi)核中添加多個(gè)引擎（engine）進(jìn)行擴(kuò)展。與添加更多CU的方式來(lái)提高性能一樣，此方法就是用在內(nèi)核中的不同engine同時(shí)處理多個(gè)數(shù)據(jù)集。

將多個(gè)engine放置在同一kernel中可充分利用kernel I / O端口的帶寬。如果數(shù)據(jù)路徑engine不需要端口的全部寬度，則在kernel中添加其他engine比在其中創(chuàng)建具有單個(gè)engine的多個(gè)CU效率更高。

在kernel中放置多個(gè)engine還可以減少端口數(shù)量和事務(wù)數(shù)量到需要仲裁的全局內(nèi)存中，從而提高了有效帶寬。另一方面，采用這種方法需要在開(kāi)發(fā)kernel時(shí)考慮I / O多路復(fù)用行為，盡可能地減少全局內(nèi)存的訪問(wèn)。這是開(kāi)發(fā)人員需要做出的權(quán)衡。

確定kernel的位置和連接性

確定kernel邊界后，開(kāi)發(fā)人員要明確實(shí)例kernel的數(shù)量和連接到全局內(nèi)存資源的端口數(shù)量。在這一點(diǎn)上，了解目標(biāo)平臺(tái)的功能以及哪些全局內(nèi)存資源可用很重要。例如，Alveo?U200數(shù)據(jù)中心加速卡具有分布在三個(gè)超級(jí)邏輯區(qū)域（SLR）中的4 x 16 GB DDR4存儲(chǔ)區(qū)和3 x 128 KB的PLRAM存儲(chǔ)區(qū)。有關(guān)更多信息，請(qǐng)參閱《 Vitis Software Platform Release Notes》。

如果kernel是工廠，則全局內(nèi)存是貨物往返工廠的倉(cāng)庫(kù)。SLR就像獨(dú)特的工業(yè)區(qū)，可以在其中建立倉(cāng)庫(kù)和工廠。雖然可以將貨物從一個(gè)區(qū)域的倉(cāng)庫(kù)轉(zhuǎn)移到另一個(gè)區(qū)域的工廠，但這會(huì)增加延遲和復(fù)雜性。

使用多個(gè)DDR有助于平衡數(shù)據(jù)傳輸負(fù)載并提高性能。但是，這也會(huì)帶來(lái)成本，因?yàn)槊總€(gè)DDR控制器都會(huì)消耗FPGA資源。在決定如何將kernel端口連接到內(nèi)存庫(kù)時(shí)，請(qǐng)均衡這些考慮因素。

在完善了這些架構(gòu)細(xì)節(jié)之后，開(kāi)發(fā)人員就應(yīng)該已經(jīng)掌握kernel以及整個(gè)應(yīng)用程序所需的所有信息了。

　　審核編輯：湯梓紅

閱讀全文

FPGA(591963) FPGA(591963)
Xilinx(119163) Xilinx(119163)
硬件(64549) 硬件(64549)

評(píng)論

相關(guān)推薦

用于軟件驗(yàn)證的硬件加速仿真之一：物理和虛擬探針

在驗(yàn)證領(lǐng)域，虛擬探針增強(qiáng)了硬件加速仿真作為數(shù)據(jù)中心資源對(duì)硬件設(shè)計(jì)人員和軟件開(kāi)發(fā)人員的吸引力。

2017-08-18 10:39:15

1841

縱覽FFmpeg硬件加速方案，涉及主流硬件和操作系統(tǒng)！

被稱為“多媒體技術(shù)領(lǐng)域的瑞士軍刀”，F(xiàn)Fmpeg擁有廣泛的應(yīng)用基礎(chǔ)。不過(guò)，當(dāng)（實(shí)時(shí)）處理海量視頻時(shí)，需要借助各種方法提升效率。本文將縱覽FFmpeg的硬件加速方案，涉及各主流硬件方案和操作系統(tǒng)。

2018-05-18 09:03:30

8487

2017雙11技術(shù)揭秘—千億級(jí)流量來(lái)襲，如何用硬件加速技術(shù)為CPU減負(fù)？

11平穩(wěn)度過(guò)。秉著軟硬件結(jié)合的性能優(yōu)化思想，2017年主站接入層在硬件加速領(lǐng)域邁出了第一步。在剛過(guò)去的2017年雙11零點(diǎn)流量高峰的考驗(yàn)下，主站接入層Tengine Gzip硬件加速機(jī)器運(yùn)行平穩(wěn)

2017-12-29 11:25:28

ADAU1451硬件加速器擺動(dòng)什么用？

Hi，HenryLj.mo請(qǐng)問(wèn)下在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)，對(duì)應(yīng)的time constant 與數(shù)據(jù)從當(dāng)前值到目標(biāo)值得時(shí)間有什么關(guān)系,或者說(shuō)不同的time constant的值有什么用？ Thanks,Jack

2019-01-29 06:55:13

Firefly-RK3288 Linux硬件加速，可安裝Kodi

適用于Firefly-RK3288的板子* rockchip kernel 4.4 (VPU, GPU, DRM RGA and WIFI設(shè)備驅(qū)動(dòng))* rockchip debian stretch (xserver已加入GPU加速,帶硬件加速的gstreamer )

2017-08-19 15:10:30

Firefly-RK3399 Android8.1固件，可調(diào)用神經(jīng)網(wǎng)絡(luò)API進(jìn)行硬件加速

(NNAPI) ，充分調(diào)用神經(jīng)網(wǎng)絡(luò)API進(jìn)行硬件加速，使RK3399的AI運(yùn)算性能大幅提升。適用基于主流模型架構(gòu)衍生開(kāi)發(fā)的各類應(yīng)用，例如：商品識(shí)別、疲勞檢測(cè)等。 2分鐘視頻，一起了解下Android

2018-07-31 17:42:44

GNN（圖神經(jīng)網(wǎng)絡(luò)）硬件加速的FPGA實(shí)戰(zhàn)解決方案

算法的軟件實(shí)現(xiàn)方式非常低效，所以業(yè)界對(duì)GNN的硬件加速有著非常迫切的需求。我們知道傳統(tǒng)的CNN（卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)）硬件加速方案已經(jīng)有非常多的解決方案；但是，GNN的硬件加速尚未得到充分的討論和研究，在

2021-07-07 08:00:00

H.264解碼器中CABAC硬件加速器怎么實(shí)現(xiàn)？

2021-06-07 06:48:58

MCU廠推多樣解決方案 DSP/FPU硬件加速芯片整合

，也有五花八門的硬件加速單元配置組合，滿足不同整合需求的應(yīng)用架構(gòu)?！　×?b class="flag-6" style="color: red">一個(gè)微控制器整合DSP、FPU硬件加速單元的目的，其實(shí)加入 硬件加速單元整合而不采行外部解決方案來(lái)組構(gòu)硬件加速運(yùn)算需求，其最大的優(yōu)點(diǎn)

2016-10-14 17:17:54

VDA安裝后禁用Revit硬件加速

您好，我正在設(shè)置新的XenApp / XenDesktop部署（第一個(gè)計(jì)時(shí)器）并遇到問(wèn)題。使用GRID K260Q vGPU設(shè)置主映像時(shí)，可以在Revit和AutoCAD中啟用硬件加速并運(yùn)行。兩個(gè)

2018-09-21 11:13:27

XCKU115板卡資料：1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡一、概述本板卡系我公司自主研發(fā)，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作為主處理器，主要用于FPGA

2019-10-25 16:00:50

labview可用硬件怎么加速？

目前我使用NI的機(jī)箱采集數(shù)據(jù)，labview做軟件平臺(tái)生成一個(gè)系統(tǒng)。想要達(dá)到實(shí)時(shí)性效果。能否給NI或labview采用硬件加速，提高處理速的呢？如何做呢？有什么資料可以參考？

2018-09-29 09:34:24

【KV260視覺(jué)入門套件試用體驗(yàn)】硬件加速之—使用PL加速FFT運(yùn)算（Vivado）

的應(yīng)用，比如在數(shù)學(xué)，密碼學(xué)，天文學(xué)，地震學(xué)，生物學(xué)等領(lǐng)域。本文主旨利用PL端的并行性和靈活性來(lái)實(shí)現(xiàn)高效的FFT運(yùn)算，在KV260搭建一個(gè)硬件加速算法，作為對(duì)比，我同時(shí)使用ARM核進(jìn)行fft運(yùn)算，驗(yàn)證PL

2023-10-02 22:03:13

【PYNQ-Z2申請(qǐng)】圖像目標(biāo)識(shí)別FPGA硬件加速

項(xiàng)目名稱：圖像目標(biāo)識(shí)別FPGA硬件加速試用計(jì)劃：申請(qǐng)理由本人供職于一家AI公司，現(xiàn)在在使用FPGA硬件加速相關(guān)目標(biāo)檢測(cè)算法的端側(cè)實(shí)現(xiàn)（鑒黃/司機(jī)行為識(shí)別），公司已經(jīng)有非常成熟的軟件算法以及GPU

2019-01-09 14:51:09

【國(guó)產(chǎn)FPGA+OMAPL138開(kāi)發(fā)板體驗(yàn)】（原創(chuàng)）7.硬件加速Sora文生視頻源代碼

完成，準(zhǔn)備輸出視頻幀 // 調(diào)用硬件加速模塊進(jìn)行文本到視頻幀的轉(zhuǎn)換 // 將文本緩沖區(qū)的內(nèi)容“傳遞”給硬件加速器 // TextToVideoHardwareAccelerator 是一個(gè)硬件模塊 // 它

2024-02-22 09:49:01

為什么要進(jìn)入最佳硬件加速板？

我想進(jìn)入硬件加速。什么板對(duì)此有好處，為什么？

2019-10-10 07:00:38

協(xié)調(diào)屏幕旋轉(zhuǎn)和硬件加速器

）。而且，在我的測(cè)試中，我發(fā)現(xiàn)關(guān)閉“硬件加速器”允許屏幕在旋轉(zhuǎn)時(shí)正確地繪制，但是這使得系統(tǒng)使用起來(lái)非常緩慢和痛苦（壞的用戶體驗(yàn)）。謝謝任何幫助。

2020-04-03 10:56:36

在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)不同的time constant的值有什么用？

請(qǐng)問(wèn)下在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)，對(duì)應(yīng)的time constant 與數(shù)據(jù)從當(dāng)前值到目標(biāo)值得時(shí)間有什么關(guān)系,或者說(shuō)不同的time constant的值有什么用？謝謝, 中 J Jj

2023-11-29 07:25:43

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡解決方案

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡一、概述本板卡系我公司自主研發(fā)，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作為主處理器，主要用于FPGA

2018-07-27 16:49:30

基于Xilinx XCKU115的半高PCIe x8硬件加速卡

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡北京太速科技有限公司一、概述本板卡系我公司自主研發(fā)，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作為主處理器

2018-08-22 17:31:55

如何使用RSA硬件加速能多快生成2048bit的密鑰？

面，可能會(huì)導(dǎo)致誤判。嘗試改正后，生成的密鑰是正常的，但速度比OpenSSL純軟件慢。正常使用RSA硬件加速能多快生成2048bit的密鑰？這個(gè)補(bǔ)丁有優(yōu)化版嗎？

2023-05-06 08:05:44

如何充分利用數(shù)字信號(hào)處理器上的片內(nèi)FIR和IIR硬件加速器？

上的片內(nèi)FIR和IIR硬件加速器也分別稱為FIRA和IIRA，我們可以利用這些硬件加速器來(lái)分擔(dān)FIR和IIR處理任務(wù)，讓內(nèi)核去執(zhí)行其他處理任務(wù)。在本文中，我們將借助不同的使用模型以及實(shí)時(shí)測(cè)試示例來(lái)探討如何在實(shí)踐中利用這些加速器。

2020-12-28 06:26:54

如何讓opencv使用官方的GStreamer-rockchip實(shí)現(xiàn)硬件加速呢

opencv編譯和運(yùn)行時(shí)，使用的是安裝的GStreamer視頻IO，那么如何讓opencv使用官方的GStreamer-rockchip實(shí)現(xiàn)硬件加速呢？

2022-04-08 15:25:33

怎么確定一個(gè)步進(jìn)電機(jī)控制的初始加速度？

怎么確定一個(gè)步進(jìn)電機(jī)控制的初始加速度

2023-10-09 07:28:57

找不到3d硬件加速器怎么辦

，將會(huì)彈出設(shè)置選項(xiàng)，然后點(diǎn)擊設(shè)置按鈕?！　　　≡贔lash設(shè)置界面，點(diǎn)擊左下角第一個(gè)圖標(biāo)，即顯示設(shè)置，記住圖標(biāo)哦。然后在啟用硬件加速的選項(xiàng)前打上勾?！　　　∽詈簏c(diǎn)擊關(guān)閉后，按F5刷新游戲頁(yè)面即可?！　?

2019-08-21 09:04:31

無(wú)法導(dǎo)入硬件加速器

嗨！我已經(jīng)創(chuàng)建了一個(gè)硬件加速器（在vhdl中）并且合成成功完成。但是，當(dāng)我使用創(chuàng)建和導(dǎo)入外圍設(shè)備向?qū)r(shí)，它向我顯示我的包在庫(kù)中不可用，盡管它是。我能做什么？？？L'enfer，c'est l

2019-02-27 14:15:31

板載linux OS下，利用FPGA做圖像硬件加速

，詳細(xì)介紹相關(guān)片內(nèi)硬件模塊在GUI系統(tǒng)中的角色及實(shí)現(xiàn)方式；（由于GPU模塊硬件的源碼的開(kāi)源程度不高，不在本文的分析范圍內(nèi)）分析現(xiàn)有GUI框架下，在硬件加速方面，我們能做的事情，并以非常簡(jiǎn)單的圖像處理為

2019-04-02 21:42:10

求一種基于Xilinx XCKU115的半高PCIe x8 硬件加速卡

半高PCIe x8硬件加速卡有哪些技術(shù)指標(biāo)？半高PCIe x8硬件加速卡的物理特性是什么？半高PCIe x8硬件加速卡的接口測(cè)試軟件有哪些？

2021-06-25 07:16:05

請(qǐng)問(wèn)STM32H753的AccHw_Crypto硬件加速加密庫(kù)在哪里？

、F4、F7 等子目錄，但沒(méi)有 H7。H7 的子目錄僅存在于 Fw_Crypto 下。在 en.patchx_cryptolib_3-1-3.zip 中有 G0、G4、L5、WB 和 H7A3 的子目錄。我想，所有這些都只是軟件？哪個(gè)包包含 H753 的硬件加速庫(kù) (AccHw_Crypto)？

2023-01-17 06:22:46

問(wèn)下ARM3的硬件加速器只能用verilog寫(xiě)嗎？

問(wèn)下ARM3的硬件加速器只能用verilog寫(xiě)嗎？

2022-09-30 10:45:39

阿里七層流量入口 Tengine硬件加速探索之路

的開(kāi)發(fā)與維護(hù)。今天分享的主題是《阿里七層流量入口Tengine硬件加速探索之路》。接入層系統(tǒng)介紹接入層是2015年阿里巴巴全站HTTPS誕生的一個(gè)產(chǎn)品。作為一個(gè)電商網(wǎng)站，為了保護(hù)用戶信息安全、賬戶、交易

2018-06-04 17:07:55

數(shù)字集成電路設(shè)計(jì)中的硬件加速驗(yàn)證技術(shù)

摘要：在芯片規(guī)模指數(shù)式上升和要求面市時(shí)間快速縮短的雙重壓力下，驗(yàn)證已成為數(shù)字集成電路設(shè)計(jì)的瓶頸。利用硬件加速驗(yàn)證技術(shù)能很好地解決這一問(wèn)題。該文論述了硬件加速驗(yàn)

2010-04-26 10:20:15

Hifn攜業(yè)內(nèi)首款硬件加速型存儲(chǔ)解決方案亮相SNW秋季大會(huì)

Hifn攜業(yè)內(nèi)首款硬件加速型存儲(chǔ)解決方案亮相SNW秋季大會(huì) 存儲(chǔ)和網(wǎng)絡(luò)創(chuàng)新的推動(dòng)廠商Hifn公司參加了本月14-17日在美國(guó)達(dá)拉斯Gaylord Texan酒店舉行的網(wǎng)絡(luò)存儲(chǔ)世界(SNW)大會(huì)，并對(duì)

2008-10-17 08:33:38

682

ARM：未來(lái)視覺(jué)體驗(yàn)將通過(guò)圖形硬件加速得到提升

ARM：未來(lái)視覺(jué)體驗(yàn)將通過(guò)圖形硬件加速得到提升 iPhone所帶來(lái)的“蝴蝶效應(yīng)”讓業(yè)界對(duì)視覺(jué)體驗(yàn)(Visual Experience)有了全新的認(rèn)識(shí)，其圖形的縮放、翻轉(zhuǎn)、倒置、井深、反射、三

2008-10-24 09:06:06

520

IKIVO 為移動(dòng)用戶界面添加 3D 和硬件加速支持

IKIVO 為移動(dòng)用戶界面添加 3D 和硬件加速支持 - Enrich 4 將在巴塞羅那舉行的移動(dòng)通信世界大會(huì)上進(jìn)行展示巴塞羅那2010年2月

2010-02-10 19:00:00

522

安捷倫科技推出示波器MSO/DSO，具備硬件加速“搜索和導(dǎo)航

安捷倫科技推出示波器MSO/DSO，具備硬件加速“搜索和導(dǎo)航”功能安捷倫科技公司日前宣布推出14款種最新型號(hào)的 InfiniiVision 7000 系列示波器，進(jìn)一步擴(kuò)展其混合信號(hào)示

2010-03-08 09:56:22

1198

采用硬件加速發(fā)揮MicroBlaze處理能力

采用硬件加速發(fā)揮MicroBlaze處理能力　　MicroBlaze處理器是賽靈思(Xilinx)在嵌入式開(kāi)發(fā)套件 (EDK) 中提供的兩款32位內(nèi)核之一，是實(shí)現(xiàn)硬件加速的靈活工具。圖1是MicroBlaze的

2010-03-10 10:24:16

1131

基于VxWorks的硬件加速技術(shù)探討

簡(jiǎn)述了愛(ài)普生S1D13A05芯片的架構(gòu)特征，并且介紹了其中的2D硬件加速引擎的工作模式和相關(guān)的寄存器設(shè)置，最后以VxWorks操作系統(tǒng)作為開(kāi)發(fā)環(huán)境，基于風(fēng)河公司W(wǎng)indML圖形開(kāi)發(fā)包，對(duì)S1D13A0

2011-09-01 14:07:47

957

基于FPGA Nios-Ⅱ的矩陣運(yùn)算硬件加速器設(shè)計(jì)

針對(duì)復(fù)雜算法中矩陣運(yùn)算量大, 計(jì)算復(fù)雜, 耗時(shí)多, 制約算法在線計(jì)算性能的問(wèn)題, 從硬件實(shí)現(xiàn)角度, 研究基于FPGA/Nios-Ⅱ的矩陣運(yùn)算硬件加速器設(shè)計(jì), 實(shí)現(xiàn)矩陣并行計(jì)算。首先根據(jù)矩陣運(yùn)算

2011-12-06 17:30:41

Nios II C語(yǔ)言至硬件加速編譯器

電子發(fā)燒友網(wǎng)核心提示: 獲獎(jiǎng)的Nios II 嵌入式處理器C語(yǔ)言至硬件（C2H）加速編譯器將對(duì)時(shí)間要求較高的ANSI C函數(shù)轉(zhuǎn)換為FPGA中的硬件加速器，從而提高了性能。特性： (1)ANSI/ISO C 代碼按鍵

2012-10-17 14:29:34

1901

Mentor Graphics硬件加速仿真服務(wù)使用Veloce 硬件加速仿真平臺(tái)加速驗(yàn)證

　　俄勒岡州威爾遜維爾，2016 年 4 月 20 日 — Mentor Graphics公司（納斯達(dá)克代碼：MENT）今日宣布，Mentor? 硬件加速仿真服務(wù)采用具有專業(yè)服務(wù)和 IP 的 Veloce? 硬件加速仿真平臺(tái) ，借此加速仿真驗(yàn)證并降低與片上系統(tǒng) （SoC）設(shè)計(jì)相關(guān)的風(fēng)險(xiǎn)。

2016-04-20 11:22:08

2307

Mentor Graphics Veloce 硬件加速仿真平臺(tái)協(xié)助 Barefoot Networks 驗(yàn)證全球首個(gè)完全可編程開(kāi)關(guān)

“Veloce 硬件加速仿真平臺(tái)可提供我們所需的容量，以此驗(yàn)證我們可編程、特定于網(wǎng)絡(luò)并以互連為主導(dǎo)的設(shè)計(jì)，”Barefoot Networks 工程副總裁 Dan Lenoski 說(shuō)道?！俺死?/div>

2016-07-20 14:25:20

1262

精確分類的視角無(wú)關(guān)人臉檢測(cè)方法與硬件加速體系結(jié)構(gòu)

精確分類的視角無(wú)關(guān)人臉檢測(cè)方法與硬件加速體系結(jié)構(gòu)，不錯(cuò)的論文，值得學(xué)習(xí)參考。

2016-09-18 15:22:48

基于硬件加速的實(shí)時(shí)仿真平臺(tái)構(gòu)建技術(shù)

基于硬件加速的實(shí)時(shí)仿真平臺(tái)構(gòu)建技術(shù)_孔璐

2017-01-03 17:41:58

基于最優(yōu)移位雙線性插值的圖像縮放旋轉(zhuǎn)硬件加速研究

基于最優(yōu)移位雙線性插值的圖像縮放旋轉(zhuǎn)硬件加速研究_丁家隆

2017-01-08 15:15:59

Bitfusion支持通過(guò)云訪問(wèn)基于賽靈思All Programmable器件的FPGA硬件加速功能

這是必然趨勢(shì)，肯定有人會(huì)通過(guò)云訪問(wèn) FPGA 硬件加速功能。 Bitfusion 既開(kāi)發(fā)軟件，又設(shè)計(jì)硬件，并且與 Rackspace 協(xié)作共同創(chuàng)建專用于加速云計(jì)算的數(shù)據(jù)中心。這一理念與 FPGA

2017-02-08 19:48:30

238

UVM驗(yàn)證平臺(tái)執(zhí)行硬件加速

UVM已經(jīng)成為了一種高效率的、從模塊級(jí)到系統(tǒng)級(jí)完整驗(yàn)證環(huán)境開(kāi)發(fā)標(biāo)準(zhǔn)，其中一個(gè)關(guān)鍵的原則是UVM可以開(kāi)發(fā)出可重用的驗(yàn)證組件。獲得重用動(dòng)力的一個(gè)方面表現(xiàn)為標(biāo)準(zhǔn)的仿真器和硬件加速之間的驗(yàn)證組件和環(huán)境的復(fù)用

2017-09-15 17:08:11

基于硬件加速系統(tǒng)的PCIe-SRIO橋的邏輯結(jié)構(gòu)

基于混合架構(gòu)的硬件加速是計(jì)算機(jī)領(lǐng)域中很重要的研究方向之一。它是指將一些特定的任務(wù)從通用CPU移植到硬件處理模塊上并進(jìn)行相應(yīng)的算法優(yōu)化。由于硬件設(shè)備的專用結(jié)構(gòu)，這些硬件處理模塊往往比在基于順序指令集

2017-11-03 16:29:44

硬件加速邊緣檢測(cè)優(yōu)化處理方案

針對(duì)計(jì)算機(jī)處理高清圖像或視頻的邊緣檢測(cè)時(shí)存在延時(shí)長(zhǎng)和數(shù)據(jù)存儲(chǔ)帶寬受限的缺點(diǎn)，提出了用Vivado HLS將邊緣檢測(cè)軟件代碼轉(zhuǎn)換成RTL級(jí)硬件電路的硬件加速方法。硬件加速是將運(yùn)算量大的功能模塊由硬件

2017-11-15 18:02:01

1874

添加硬件加速器可以加快處理器的正弦計(jì)算

如果修改軟件不能實(shí)現(xiàn)所需速度，那么你可能順理成章的想到在你的設(shè)計(jì)中加入硬件加速模塊。作有很多種算法可對(duì)單精度浮點(diǎn)數(shù)字的正弦值進(jìn)行計(jì)算，但添加硬件加速器是功能最為強(qiáng)大的方法之一。之所以得出這一結(jié)論

2017-11-24 18:38:33

1895

基于VxWorks的硬件加速技術(shù)探討

2017-12-01 04:26:01

257

利用硬件加速器提高處理器的性能

處理器內(nèi)部集成的硬件加速器可以實(shí)現(xiàn)三種廣泛使用的信號(hào)處理操作：FIR(有限沖激響應(yīng))、IIR(無(wú)限沖激響應(yīng))和FFT(快速傅里葉變換)。硬件加速器減輕了核處理器的負(fù)擔(dān)，能潛在的提升處理器的計(jì)算吞吐

2017-12-04 15:22:36

1035

MD5算法硬件加速模型

針對(duì)MD5軟件實(shí)現(xiàn)方法存在占用資源大、安全性差等缺點(diǎn)，提出了基于NetMagic平臺(tái)的MD5硬件加速模型設(shè)計(jì)方案，并基于ModelSim和NetMagic平臺(tái)對(duì)提出的非流水線與流水線硬件加速模型進(jìn)行

2018-01-12 16:45:07

憶芯科技利用Veloce 硬件加速仿真平臺(tái)進(jìn)行高速企業(yè)級(jí)固態(tài)硬盤存儲(chǔ)設(shè)計(jì)

Mentor Graphics公司今天宣布，憶芯科技 (Starblaze Technology) 已成功使用 Veloce 硬件加速仿真平臺(tái)進(jìn)行專業(yè)的高速企業(yè)級(jí)固態(tài)硬盤 (SSD) 存儲(chǔ)

2018-07-12 14:43:00

1619

Veloce仿真環(huán)境下的SoC端到端硬件加速器功能驗(yàn)證

很多人認(rèn)為硬件加速器無(wú)非是一種速度更快的仿真器而已。毫無(wú)疑問(wèn)，由于硬件加速器使用物理硬件進(jìn)行仿真，使用硬件加速器驗(yàn)證復(fù)雜的集成電路和大型片上系統(tǒng)（SoC）能比軟件仿真器快若干數(shù)量級(jí)。與仿真用通用計(jì)算機(jī)相比，仿真用單一功能計(jì)算機(jī)能提供更高容量、更高效的系統(tǒng)。

2018-03-28 14:50:00

3155

利用硬件加速器提高仿真速度時(shí)的驗(yàn)證平臺(tái)考慮

正確利用硬件加速器對(duì)邏輯仿真進(jìn)行加速是非常有效的。如果知道某項(xiàng)設(shè)計(jì)在仿真中的運(yùn)行速度（用每秒仿真了多少設(shè)計(jì)時(shí)鐘來(lái)衡量），你就能很容易地估計(jì)出該設(shè)計(jì)的原始性能。舉個(gè)例子，我們假設(shè)仿真器以每秒1000

2018-03-05 10:13:13

如何在Windows上設(shè)置英特爾硬件加速執(zhí)行管理器

了解如何在Windows上設(shè)置英特爾?硬件加速執(zhí)行管理器（英特爾?HAXM），以幫助您的Android模擬器以更快的速度運(yùn)行。

2018-11-01 06:23:00

3959

基于Xilinx FPGA的Memcached硬件加速器的介紹

本教程討論基于Xilinx FPGA的Memcached硬件加速器的技術(shù)細(xì)節(jié)，該硬件加速器可為10G以太網(wǎng)端口提供線速M(fèi)emcached服務(wù)。

2018-11-27 06:41:00

3433

毫米波傳感器1443硬件加速器的簡(jiǎn)單介紹

2.6 mmWave波形傳感器簡(jiǎn)介1443硬件加速器

2019-05-08 06:20:00

2981

FPGA的CNN實(shí)現(xiàn)硬件加速需要考慮這些因素

網(wǎng)上對(duì)于FPGACNN加速的研究已經(jīng)很多了，神經(jīng)網(wǎng)絡(luò)的硬件加速似乎已經(jīng)滿大街都是了，這里我們暫且不討論誰(shuí)做的好誰(shuí)做的不好，我們只是根據(jù)許許多多的經(jīng)驗(yàn)來(lái)總結(jié)一下實(shí)現(xiàn)硬件加速，需要哪些知識(shí)，考慮哪些因素。

2019-03-08 14:44:33

3600

分享硬件加速仿真的 11 個(gè)謬論介紹和說(shuō)明

硬件加速仿真可以實(shí)現(xiàn)寄存器傳輸級(jí)(RTL)和現(xiàn)代SoC設(shè)計(jì)門級(jí)的最佳功耗分析。只有硬件加速仿真才有處理大量邏輯以及產(chǎn)生針對(duì)所有元素的切換活動(dòng)的獨(dú)有能力。

2019-10-11 17:54:29

4548

如何將硬件加速器關(guān)閉？

硬件加速是指在計(jì)算機(jī)中通過(guò)把計(jì)算量非常大的工作分配給專門的硬件來(lái)處理以減輕中央處理器的工作量之技術(shù)。尤其是在圖像處理中這個(gè)技術(shù)經(jīng)常被使用。

2019-08-15 15:29:35

6839

LSTM的硬件加速方式

Long-short term memory，簡(jiǎn)稱LSTM，被廣泛的應(yīng)用于語(yǔ)音識(shí)別、機(jī)器翻譯、手寫(xiě)識(shí)別等。LSTM涉及到大量的矩陣乘法和向量乘法運(yùn)算，會(huì)消耗大量的FPGA計(jì)算資源和帶寬。為了實(shí)現(xiàn)硬件加速，提出了稀疏LSTM。

2019-08-24 10:32:35

2798

firefly神經(jīng)網(wǎng)絡(luò)硬件加速簡(jiǎn)介

Firefly-RK3399/AIO-3399J Android8.1固件支持Android Neural Networks API (NNAPI) ，充分調(diào)用神經(jīng)網(wǎng)絡(luò)API進(jìn)行硬件加速，使RK3399的AI運(yùn)算性能大幅提升。適用基于主流模型架構(gòu)衍生開(kāi)發(fā)的各類應(yīng)用，例如：商品識(shí)別、疲勞檢測(cè)等。

2019-11-01 15:47:12

1704

蘋果VR硬件加速落地,或?qū)⒊蔀樾袠I(yè)助推器

蘋果VR硬件加速落地，或?qū)⒊蔀樾袠I(yè)助推器。美東時(shí)間周四，美國(guó)媒體援引知情人士的話稱，蘋果計(jì)劃2022年推出高端VR頭戴設(shè)備，為未來(lái)更加主流的AR眼鏡鋪路。

2021-01-22 11:35:05

2096

Xilinx推出軟件定義、硬件加速型Alveo SmartNIC，掀起現(xiàn)代數(shù)據(jù)中心革命

賽靈思? Alveo? SN1000 是業(yè)界首個(gè)可組合式 SmartNIC 系列，面向各類功能卸載提供了軟件定義硬件加速功能。

2021-02-24 16:38:14

2676

硬件加速器提升下一代SHARC處理器的性能

硬件加速器提升下一代SHARC處理器的性能

2021-04-23 13:06:32

如何去確定一個(gè)硬件加速器件？有哪些步驟？

在開(kāi)發(fā)一個(gè)加速程序的之前，有一個(gè)很重要的步驟：正確設(shè)計(jì)程序架構(gòu)。

2021-06-11 13:05:17

1204

開(kāi)發(fā)加速程序前如何正確設(shè)計(jì)程序架構(gòu)？

將分為5個(gè)步驟來(lái)介紹： 1. 基準(zhǔn)和建立目標(biāo)? 2. 確定加速部分? 3. 確定FPGA硬件加速并行量 4. 確定軟件部分并行量? 5. 微調(diào)架構(gòu)細(xì)節(jié)。 1. 基準(zhǔn)和建立目標(biāo) 首先要測(cè)試應(yīng)用程序的運(yùn)行時(shí)間和吞吐量，來(lái)確定當(dāng)前應(yīng)用程序在現(xiàn)有平臺(tái)的的基準(zhǔn)性能。

2021-06-11 16:28:55

1233

第七屆硬創(chuàng)大賽與中城智能硬件加速器達(dá)成戰(zhàn)略合作，推動(dòng)智能硬件創(chuàng)新發(fā)展

?日前，中國(guó)硬件創(chuàng)新創(chuàng)客大賽組委會(huì)與中城智能硬件加速器正式達(dá)成戰(zhàn)略合作伙伴關(guān)系。 ? ? 中城智能硬件加速器天集社是2020年入選工信部中小企業(yè)服務(wù)平臺(tái)和國(guó)家級(jí)科技企業(yè)孵化器，鏈接全球硬件創(chuàng)新者建立

2021-07-15 15:18:02

2961

OpenHarmony 分論壇-華秋電子新硬件加速器

OpenHarmony 分論壇-華秋電子新硬件加速器今天的華為開(kāi)發(fā)者大會(huì)2021上，OpenHarmony分論壇上展示了華秋電子新硬件加速器。 HDC分論壇-OpenHarmony 分論壇推薦鏈接：http://t.elecfans.com/live/1708.html 責(zé)任編輯：haq

2021-10-23 16:53:48

1500

openEuler Summit 2021-云/虛擬化分論壇：虛擬化硬件加速以及vDPA框架案例分析

openEuler Summit 2021-云/虛擬化分論壇：虛擬化硬件加速以及vDPA框架案例分析

2021-11-10 16:59:51

1747

OpenHarmony Dev-Board-SIG專場(chǎng)：OpenHarmony 新硬件加速器

OpenHarmony Dev-Board-SIG專場(chǎng)：OpenHarmony 新硬件加速器

2021-12-28 15:12:30

1104

基于CORTEX-M3硬件加速的目標(biāo)跟蹤鎖定系統(tǒng)

本項(xiàng)目采用Cortex-M3軟核做控制部分，大規(guī)模專用硬件加速器做濾波跟蹤計(jì)算和智能目標(biāo)檢測(cè)部分，視頻輸入輸出通過(guò)HDMI直接進(jìn)入硬件加速器，繞過(guò)軟核實(shí)現(xiàn)更快的數(shù)據(jù)處理速度。

2022-05-16 10:04:26

959

AR機(jī)器人公司發(fā)布機(jī)器人操作系統(tǒng)(ROS)硬件加速框架ROBOTCORE

)硬件加速框架——ROBOTCORE?。ROS是機(jī)器人技術(shù)的標(biāo)準(zhǔn)。該公司為機(jī)器人提供半導(dǎo)體構(gòu)建模塊，通過(guò)硬件加速為高性能機(jī)器人創(chuàng)建定制計(jì)算架構(gòu)，同時(shí)保持機(jī)器人和加速器的硬件無(wú)關(guān)性（支持流行的FPGA和GPU）。 ROBOTCORE?可幫助機(jī)器人工程師創(chuàng)建與ROS和ROS 2 API兼容的知識(shí)產(chǎn)權(quán)(IP)核心，以提高包括

2022-06-16 12:40:20

1684