RM新时代官方网站,RM新时代官网网址

隨著智能安全、機(jī)器人或無人駕駛汽車等應(yīng)用越來越依靠嵌入式人工智能技術(shù)來提高性能，交付全新的用戶體驗(yàn)，傳統(tǒng)計(jì)算平臺(tái)上的推斷引擎很難在有限的功耗、時(shí)延和物理尺寸限制下滿足實(shí)際要求。推斷引擎必須滿足嚴(yán)格定義的推斷精度，還受限于總線寬度，而且存儲(chǔ)器難以為最佳速度、效率和芯片面積進(jìn)行調(diào)整優(yōu)化。我們需要靈活應(yīng)變的計(jì)算平臺(tái)來滿足運(yùn)行一流卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的嵌入式 AI 的要求。

放眼未來，適應(yīng)于更多前沿神經(jīng)網(wǎng)絡(luò)的靈活性是我們的主要關(guān)注點(diǎn)。今天廣受歡迎的 CNN 正加速被新型的先進(jìn)架構(gòu)所取代。然而，傳統(tǒng)的 SoC 設(shè)計(jì)要使用當(dāng)前的神經(jīng)網(wǎng)絡(luò)架構(gòu)知識(shí)，從開發(fā)開始到未來部署通常需要大約三年時(shí)間。RNN 或 Capsule Network 等新型神經(jīng)網(wǎng)絡(luò)可能會(huì)讓傳統(tǒng) SoC 變得低效，也難以提供保持競(jìng)爭(zhēng)力所需的性能。

嵌入式 AI 要滿足最終用戶期望，特別是要跟上可預(yù)見的未來不斷提升的需求，就必須采用更加靈活的自適應(yīng)計(jì)算平臺(tái)。我們可利用用戶可配置的多核片上系統(tǒng) (MPSoC) 器件，整合主應(yīng)用處理器和可擴(kuò)展的可編程邏輯結(jié)構(gòu)，包含可配置的存儲(chǔ)器架構(gòu)和滿足可變精度推斷所需的信號(hào)處理技術(shù)，從而滿足上述要求。

推斷精度

在傳統(tǒng)的 SoC 中，決定性能的特性如存儲(chǔ)器架構(gòu)和計(jì)算精確度等是固定的。最小值通常為 8 位，由核心 CPU 定義，不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優(yōu)化至晶體管層面，這就能根據(jù)需要讓推斷精度降低到 1 位。此外，這類器件還包含成千上萬可配置的 DSP slice，能高效處理乘積累加 (MAC) 計(jì)算。

能自由優(yōu)化推斷精度，根據(jù)平方律提供剛好滿足需求的計(jì)算效率，也就是說單位的運(yùn)算用 1 位核心執(zhí)行，相對(duì)于用 8 位核心完成相同計(jì)算而言，所需的邏輯僅為 1/64。此外，MPSoC 能讓推斷精度針對(duì)神經(jīng)網(wǎng)絡(luò)的每層做出不同優(yōu)化，從而以最大的效率提供所需的性能。

存儲(chǔ)器架構(gòu)

除了通過改變推斷精度來提高計(jì)算效率之外，配置可編程片上存儲(chǔ)器的帶寬和結(jié)構(gòu)能進(jìn)一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對(duì)于運(yùn)行相同推斷引擎的傳統(tǒng)計(jì)算平臺(tái)而言，片上存儲(chǔ)器可能達(dá)到 4 倍多，存儲(chǔ)器—接口帶寬可能達(dá)到 6 倍。存儲(chǔ)器的可配置性使得用戶能減少瓶頸，并優(yōu)化芯片資源的利用率。此外，典型的子系統(tǒng)只有有限的片上集成高速緩存，必須與片外存儲(chǔ)設(shè)備頻繁交互，這就會(huì)增加時(shí)延和功耗。在 MPSoC 中，大多數(shù)存儲(chǔ)器交換都在片上進(jìn)行，這就會(huì)大幅提高速度，而且相對(duì)于片外存儲(chǔ)器交互而言功耗降低超過 99%。

芯片面積

解決方案的尺寸也越來越重要，特別就采用移動(dòng) AI 的無人機(jī)、機(jī)器人或無人/自動(dòng)駕駛汽車而言尤其如此。MPSoC 的 FPGA 結(jié)構(gòu)上實(shí)現(xiàn)的推斷引擎可能僅占用傳統(tǒng) SoC 八分之一的芯片面積，這就能讓開發(fā)人員在更小的器件中構(gòu)建功能更強(qiáng)大的引擎。

此外，MPSoC 器件系列為設(shè)計(jì)人員提供了實(shí)現(xiàn)推斷引擎的豐富選擇，能支持最節(jié)能、成本效率最高、面積占用最小的方案，從而滿足系統(tǒng)性能要求。一些通過汽車應(yīng)用認(rèn)證的部件具備硬件功能安全特性，達(dá)到業(yè)界標(biāo)準(zhǔn)的 ISO 26262 ASIL-C 安全規(guī)范，這對(duì)自動(dòng)駕駛應(yīng)用而言至關(guān)重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統(tǒng)以及可擴(kuò)展的可編程邏輯結(jié)構(gòu)，這就能在單個(gè)芯片上整合控制處理、機(jī)器學(xué)習(xí)算法和安全電路，同時(shí)提供故障容錯(cuò)功能。

今天，嵌入式推斷引擎可用單個(gè) MPSoC 器件實(shí)現(xiàn)，功耗低至 2 瓦，這對(duì)移動(dòng)機(jī)器人或自動(dòng)駕駛汽車而言都是比較合適的功耗水平。傳統(tǒng)計(jì)算平臺(tái)即便現(xiàn)在也無法用這么低的功耗運(yùn)行實(shí)時(shí) CNN 應(yīng)用，未來也不太可能在更嚴(yán)格的功耗限制條件下滿足更快響應(yīng)和更復(fù)雜功能的日益嚴(yán)格的要求。基于可編程 MPSoC 的平臺(tái)能夠提供更高的計(jì)算性能，更高的效率，也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發(fā)人員不能在自己的項(xiàng)目中輕松地實(shí)現(xiàn)這些優(yōu)勢(shì)，那么這種可配置型多平行計(jì)算架構(gòu)的優(yōu)勢(shì)就僅限于學(xué)術(shù)領(lǐng)域。成功需要適當(dāng)?shù)墓ぞ邅韼椭_發(fā)人員優(yōu)化目標(biāo)推斷引擎的實(shí)現(xiàn)。為了滿足有關(guān)需求，賽靈思不斷擴(kuò)展開發(fā)工具生態(tài)系統(tǒng)和機(jī)器學(xué)習(xí)軟件堆棧，并與專業(yè)合作伙伴合作，一起簡(jiǎn)化和加速計(jì)算機(jī)視覺和視頻監(jiān)控等應(yīng)用的實(shí)現(xiàn)。

面向未來的靈活性

利用 SoC 的可配置性為手頭應(yīng)用創(chuàng)建最佳平臺(tái)，也使得 AI 開發(fā)人員能夠靈活地跟上神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展演進(jìn)的要求。業(yè)界可能遷移到新型神經(jīng)網(wǎng)絡(luò)的可能性，對(duì)于平臺(tái)開發(fā)人員來說是一個(gè)巨大的風(fēng)險(xiǎn)?？芍嘏渲玫?MPSoC 通過重配置并用當(dāng)前最先進(jìn)的策略來構(gòu)建最高效的處理引擎，能夠讓開發(fā)人員靈活地響應(yīng)神經(jīng)網(wǎng)絡(luò)架構(gòu)方式的變化。

AI 越來越多地嵌入到各種設(shè)備中，包括工業(yè)控制、醫(yī)療設(shè)備、安全系統(tǒng)、機(jī)器人和自動(dòng)駕駛汽車等。利用可編程邏輯結(jié)構(gòu)的 MPSoC 器件的靈活應(yīng)變加速技術(shù)，是提供保持競(jìng)爭(zhēng)力所需的快速響應(yīng)和高級(jí)功能的關(guān)鍵。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

賽靈思

賽靈思

+關(guān)注

關(guān)注
32

文章
1794

瀏覽量
131246
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886

原文標(biāo)題：靈活應(yīng)變的加速是將人工智能從云端帶到邊緣的關(guān)鍵

文章出處：【微信號(hào)：FPGA-EETrend，微信公眾號(hào)：FPGA開發(fā)圈】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

PHY6236—藍(lán)牙低功耗 (BLE)/私有 2.4GHz 系統(tǒng)芯片

PHY6236 是一款用于低功耗藍(lán)牙和專有 2.4G 應(yīng)用的片上系統(tǒng) (SoC)。它具有高性能低功耗 32 位 RISC-V MCU，具有 8KB 保留 SRAM、80KB ROM、8

發(fā)表于 12-04 00:31

66AK2Hx片上系統(tǒng)（SoC）器件系列的功耗摘要

電子發(fā)燒友網(wǎng)站提供《66AK2Hx片上系統(tǒng)（SoC）器件系列的功耗摘要.pdf》資料免費(fèi)下載

發(fā)表于 10-10 09:11 ?0次下載

66AK2Hx<b class='flag-5'>片</b><b class='flag-5'>上</b><b class='flag-5'>系統(tǒng)</b>（SoC）<b class='flag-5'>器件</b>系列的功耗摘要

HS6601H：低功耗、高性能、可配置度高的非定頻雷達(dá)芯片數(shù)據(jù)手冊(cè)

HS6601H是具有高性能的傳感信號(hào)處理集成電路,內(nèi)置3.3V 、4.4V或5.0V的高壓LDO，可以給PIR傳感器探頭供電。具備可配置功能，可以減少外圍元器件。可配以熱釋電紅外傳感

發(fā)表于 07-31 11:58

嚴(yán)格的性能測(cè)試確保連接器可滿足復(fù)雜環(huán)境的應(yīng)用需求

嚴(yán)苛環(huán)境下，連接器的使用安全性正面臨嚴(yán)峻挑戰(zhàn)。嚴(yán)格的性能測(cè)試可確保連接器能滿足客戶的多種應(yīng)用環(huán)境需求。耐電壓測(cè)試：當(dāng)設(shè)備出現(xiàn)短時(shí)過載時(shí)，耐電壓性能

發(fā)表于 07-23 08:48 ?223次閱讀

FPGA基礎(chǔ)知識(shí)學(xué)習(xí)

、導(dǎo)航系統(tǒng)等。這些系統(tǒng)對(duì)實(shí)時(shí)性和可靠性要求極高，F(xiàn)PGA能夠滿足這些需求。人工智能和深度學(xué)習(xí) ：FPGA可以用于加速深度學(xué)習(xí)算法的計(jì)算和訓(xùn)

發(fā)表于 04-29 23:26

AI與開源力推嵌入式系統(tǒng)創(chuàng)新升級(jí)

AMD在此次展會(huì)上宣布擴(kuò)大AMD Versal?自適應(yīng)片上系統(tǒng)（SoC）產(chǎn)品線，推出全新第二代Versal AI Edge和Versal Prime系列自適應(yīng)SoC。該系列將預(yù)處理、

發(fā)表于 04-29 11:11 ?507次閱讀

risc-v多核芯片在AI方面的應(yīng)用

在極低的能耗下實(shí)現(xiàn)高效的AI元器件的運(yùn)行。這對(duì)于需要長(zhǎng)時(shí)間運(yùn)行和依賴電池供電的AI設(shè)備來說尤為重要。其次，RISC-V的模塊化架構(gòu)允許其不同部分以模塊化的方式串在一起，從而滿足各種不

發(fā)表于 04-28 09:20

片上系統(tǒng)代表芯片嗎

片上系統(tǒng)并不直接等同于芯片。片上系統(tǒng)（SoC）是一種集成電路（IC）的設(shè)計(jì)方案，它將多個(gè)功能模塊

發(fā)表于 03-28 15:07 ?679次閱讀

什么是可編程片上系統(tǒng)？PSOC和FPGA的區(qū)別

可編程片上系統(tǒng)（PSoC）是一種高度集成化和靈活性的嵌入式系統(tǒng)解決方案。它將數(shù)字邏輯、模擬電路和可配置模塊等功能融合在一起，形成一個(gè)單一的集

發(fā)表于 03-28 14:59 ?1751次閱讀

可編程片上系統(tǒng)是什么

可編程片上系統(tǒng)（Programmable System-on-Chip，PSoC）是一種特殊的嵌入式系統(tǒng)，它集成了數(shù)字邏輯、模擬電路和可配置

發(fā)表于 03-28 14:55 ?640次閱讀

片上系統(tǒng)的組成

片上系統(tǒng)，也被稱為SoC（System on a Chip），是一種集成度極高的芯片產(chǎn)品。它將原本分散于多個(gè)芯片上的處理器、存儲(chǔ)器、接口、控制器等組件集成到一個(gè)單獨(dú)的芯片

發(fā)表于 03-28 14:26 ?473次閱讀

片上系統(tǒng)是什么意思

片上系統(tǒng)（SoC，System on Chip）是一種高度集成化的產(chǎn)品，它將傳統(tǒng)的微處理器、微控制器和可編程邏輯器件等功能融合到一個(gè)芯片中，并通過

發(fā)表于 03-28 14:25 ?1642次閱讀

Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA，以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc)，旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的

發(fā)表于 03-22 14:02 ?623次閱讀

TPS650864可配置多軌PMU適用于多核處理器、FPGA和系統(tǒng)的TPS650861可配置多軌PMU數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《TPS650864可配置多軌PMU適用于多核處理器、FPGA和系統(tǒng)的TPS650861可配置多軌PMU數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 03-07 09:06 ?0次下載

臺(tái)積電大幅上調(diào)SoIC產(chǎn)能規(guī)劃，以滿足未來AI、HPC的強(qiáng)勁需求

近日，據(jù)消息人士透露，臺(tái)積電已大幅上調(diào)其SoIC（系統(tǒng)整合單芯片）產(chǎn)能規(guī)劃。到2024年底，月產(chǎn)能將從2023年底的約2000片跳增至5000~6000片，而原先預(yù)計(jì)今年將擴(kuò)充至3000~4000

發(fā)表于 01-22 15:57 ?659次閱讀

RM新时代网站-首页

搜索歷史

AI新興應(yīng)用通過帶可配置加速的片上系統(tǒng)器件來滿足嚴(yán)格性能、效率需求

評(píng)論

PHY6236—藍(lán)牙低功耗 (BLE)/私有 2.4GHz 系統(tǒng)芯片

66AK2Hx片上系統(tǒng)（SoC）器件系列的功耗摘要

HS6601H：低功耗、高性能、可配置度高的非定頻雷達(dá)芯片數(shù)據(jù)手冊(cè)

嚴(yán)格的性能測(cè)試確保連接器可滿足復(fù)雜環(huán)境的應(yīng)用需求

FPGA基礎(chǔ)知識(shí)學(xué)習(xí)

AI與開源力推嵌入式系統(tǒng)創(chuàng)新升級(jí)

risc-v多核芯片在AI方面的應(yīng)用

片上系統(tǒng)代表芯片嗎

什么是可編程片上系統(tǒng)？PSOC和FPGA的區(qū)別

可編程片上系統(tǒng)是什么

片上系統(tǒng)的組成

片上系統(tǒng)是什么意思

Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

TPS650864可配置多軌PMU適用于多核處理器、FPGA和系統(tǒng)的TPS650861可配置多軌PMU數(shù)據(jù)表

臺(tái)積電大幅上調(diào)SoIC產(chǎn)能規(guī)劃，以滿足未來AI、HPC的強(qiáng)勁需求

搜索歷史

AI新興應(yīng)用通過帶可配置加速的片上系統(tǒng)器件來滿足嚴(yán)格性能、效率需求

評(píng)論

AI新興應(yīng)用通過帶可配置加速的片上系統(tǒng)器件來滿足嚴(yán)格性能、效率需求