rm官网,RM新时代官方网站|首入球时间

本文章主要介紹綜合的、融合的基于超異構(gòu)計(jì)算的通用處理器GP-HPU（General Purpose Hyper-heterogeneous Processing Unit）。

1 不同處理器類型的分類和協(xié)同

我目前有個(gè)基本的思考框架，來把各種PU進(jìn)行劃分：系統(tǒng)是由分層分塊的模塊組成的，這樣我們可以大致上把系統(tǒng)分為三部分，如上圖所示。

各類PU分析如下：

CPU，中央處理器，是最核心的處理器。目前其他各種處理器，號(hào)稱取代CPU的核心地位，這些表述是不對(duì)的：你只是代替CPU干臟活累活，一切的控制和管理依然是CPU來完成。

各類加速器芯片。通過CPU+xPU的異構(gòu)計(jì)算架構(gòu)，如GPU、FPGA加速器、各類AI芯片（谷歌TPU、graphcore IPU、NPU、BPU等）以及其他各種加速芯片，這類芯片沒法單獨(dú)運(yùn)行，需要有CPU的協(xié)作，構(gòu)成CPU+xPU的異構(gòu)計(jì)算的方式運(yùn)行。

DPU。目前，大家對(duì)DPU的理解是，DPU主要負(fù)責(zé)系統(tǒng)I/O的處理。不管是網(wǎng)絡(luò)I/O還是遠(yuǎn)程存儲(chǔ)I/O，都需要走網(wǎng)絡(luò)，因?yàn)镈PU被不少人認(rèn)為是I/O加速的處理器。更深一層的理解，是DPU是作為基礎(chǔ)設(shè)施處理器的存在，負(fù)責(zé)整個(gè)系統(tǒng)底層工作的處理。

SOC，系統(tǒng)級(jí)芯片。把整個(gè)系統(tǒng)的所有處理放在一個(gè)芯片里，有各種加速引擎負(fù)責(zé)性能敏感的工作任務(wù)，CPU負(fù)責(zé)一些基本任務(wù)的處理和整個(gè)系統(tǒng)的控制和管理。

不管叫什么PU，逃不開這四個(gè)類型。

2 場(chǎng)景特點(diǎn)：綜合、通用以及資源預(yù)備

許多AI芯片或系統(tǒng)落地面臨的一個(gè)主要問題是“我好不容易做了一盤餃子，可用戶需要的是一桌菜肴”。也即是說，客戶需要的是綜合性的系統(tǒng)解決方案，而AI只是其中的一部分，甚至非常小的一部分。

具體的終端應(yīng)用場(chǎng)景包羅萬象，但云端和邊緣端，卻都是清一色的服務(wù)器來提供服務(wù)端的運(yùn)行以及和終端的協(xié)同。這些服務(wù)器，可以服務(wù)各行各業(yè)、各種不同類型的場(chǎng)景的服務(wù)端工作任務(wù)的處理。云和邊緣服務(wù)器場(chǎng)景，需要考慮服務(wù)端系統(tǒng)的特點(diǎn)（微服務(wù)化功能持續(xù)解構(gòu)，并且還和多租戶、多系統(tǒng)共存），對(duì)系統(tǒng)的靈活性的要求遠(yuǎn)高于對(duì)性能的要求，需要提供的是綜合性的通用解決方案。

在云和邊緣數(shù)據(jù)中心，當(dāng)CSP投入數(shù)以億計(jì)資金，上架數(shù)以萬計(jì)的各種型號(hào)、各種配置的服務(wù)器的時(shí)候，嚴(yán)格來說，它并不知道，具體的某臺(tái)服務(wù)器最終會(huì)售賣給哪個(gè)用戶，這個(gè)用戶到底會(huì)在服務(wù)器上面跑什么應(yīng)用。并且，未來，這個(gè)用戶的服務(wù)器資源回收之后再賣個(gè)下一個(gè)用戶，下一個(gè)用戶又用來干什么，也是不知道的。

因此，對(duì)CSP來說，最理想的狀態(tài)是，存在一種服務(wù)器，足夠通用，即不管是哪種用戶哪種應(yīng)用運(yùn)行其上，都足夠高效快捷并且低成本。只有這樣，系統(tǒng)才夠簡(jiǎn)單而穩(wěn)定，運(yùn)維才能簡(jiǎn)單并且高效。然后要做的，就是把這種服務(wù)器大規(guī)模復(fù)制（大規(guī)模復(fù)制意味著單服務(wù)器成本的更快速下降）。

服務(wù)器都是相對(duì)通用，服務(wù)器上目前大芯片就三個(gè)位置，也就是我們通常所說的數(shù)據(jù)中心三大芯片的位置：CPU、業(yè)務(wù)加速的GPU以及基礎(chǔ)設(shè)施加速的DPU。大家要做的，就是自己芯片的定位，以及同其他各種廠家的各種芯片來競(jìng)爭(zhēng)這三個(gè)位置。

有些專用的芯片，用在特定領(lǐng)域，需要設(shè)計(jì)專門的服務(wù)器，這種方案都流離在整個(gè)云和邊緣計(jì)算主流體系之外的，落地門檻很高，也很難大規(guī)模落地。

3 超異構(gòu)處理器是什么？

系統(tǒng)持續(xù)演進(jìn)：

第一階段，性能要求不高，CPU能夠滿足要求。目前數(shù)據(jù)中心大量服務(wù)器依然是只有CPU處理器。

第二階段，性能敏感類任務(wù)大量出現(xiàn)，不得不進(jìn)行異構(gòu)加速。如AI訓(xùn)練、視頻圖像處理，HPC等場(chǎng)景。這類場(chǎng)景，目前的狀況主要：NVIDIA GPU+CUDA為主流，F(xiàn)PGA FaaS非主流，AI類的DSA落地較少（包括谷歌TPU，也不算成功）。

第三階段。DPU的出現(xiàn)，CPU、GPU和DPU共同構(gòu)成數(shù)據(jù)中心的三大處理芯片。

第四階段，再融合。

為什么不是獨(dú)立多芯片？為什么需要融合單芯片？融合單芯片是有諸多優(yōu)勢(shì)的：

融合有利于計(jì)算的充分整合，進(jìn)一步提升數(shù)據(jù)計(jì)算效率；

系統(tǒng)成本跟主要芯片的數(shù)量是直接相關(guān)的，融合型單芯片可以進(jìn)一步降低成本；

融合系統(tǒng)，內(nèi)部功能劃分和交互統(tǒng)一構(gòu)建，相比三芯片方案，可以顯著降低彼此功能和交互的各種掣肘（相互拖累）；

大部分（80%-90%）場(chǎng)景是相對(duì)輕量級(jí)場(chǎng)景，通過超異構(gòu)的單芯片可以覆蓋其復(fù)雜度和系統(tǒng)規(guī)模；

Chiplet加持，可以通過多DIE單芯片的方式，實(shí)現(xiàn)重量級(jí)場(chǎng)景的覆蓋。

超異構(gòu)處理器，可以認(rèn)為是由CPU、GPU、各類DSA以及其他各類處理器引擎共同組成的，CPU、GPU和DPU整合重構(gòu)的一種全系統(tǒng)功能融合的單芯片解決方案。

3.1 為什么叫超異構(gòu)處理器？

首先，不能叫超融合處理器。超融合的概念是云計(jì)算領(lǐng)域一個(gè)非常重要的概念，大致意思是說在小規(guī)模集群能夠把云計(jì)算的IaaS層的服務(wù)以及云堆棧OS完整部署，可以提供給企業(yè)和私有云場(chǎng)景的云計(jì)算解決方案，并且因?yàn)楹凸迷贫褩S是同一的體系，可以實(shí)現(xiàn)混合云的充分協(xié)同。

超異構(gòu)處理器和超融合沒有必然聯(lián)系，可以支持小集群的超融合，也可以支持大集群的不“融合”。

NVIDIA對(duì)DPU的未來愿景：數(shù)據(jù)量越來越大，而數(shù)據(jù)在網(wǎng)絡(luò)中流動(dòng)，計(jì)算節(jié)點(diǎn)也是靠數(shù)據(jù)的流動(dòng)來驅(qū)動(dòng)計(jì)算，計(jì)算的架構(gòu)從以計(jì)算為中心轉(zhuǎn)向了以數(shù)據(jù)為中心。

所有的系統(tǒng)本質(zhì)上就是數(shù)據(jù)處理，那么所有的設(shè)備就都可以是Data Processing Unit。所以，未來以DPU為基礎(chǔ)，不斷地融合CPU和GPU的功能，DPU會(huì)逐漸演化成數(shù)據(jù)中心統(tǒng)一的處理器（只是，目前沒有叫超異構(gòu)HPU這個(gè)名字罷了）。

不管名稱具體叫什么，這個(gè)處理器，一定是基于多種處理引擎混合的（超異構(gòu)計(jì)算）、面向宏系統(tǒng)場(chǎng)景的（MSOC，Micro-SOC）、數(shù)據(jù)驅(qū)動(dòng)的（DPU，Data Processing），一個(gè)全新的處理器類型。

4 超異構(gòu)處理器和傳統(tǒng)SOC的區(qū)別

嚴(yán)格來說，超異構(gòu)處理器也是屬于SOC的范疇。但如果只是稱之為SOC，那無法體現(xiàn)超異構(gòu)處理器和傳統(tǒng)SOC的本質(zhì)區(qū)別。這樣，不利于我們深刻認(rèn)識(shí)超異構(gòu)處理器的創(chuàng)新價(jià)值所在，以及在支撐超異構(gòu)處理器需要的創(chuàng)新技術(shù)和架構(gòu)方面積極投入。

如下表格為超異構(gòu)處理器和傳統(tǒng)SOC的對(duì)比：

5 超異構(gòu)處理器，是否可以極致性能的同時(shí)，還足夠“通用”？

每一種處理器（引擎）都有其優(yōu)勢(shì)，也都有其劣勢(shì)：

CPU非常通用，能夠干幾乎所有事情。但劣勢(shì)在于，其性能效率是最低的。

DSA的性能足夠好，劣勢(shì)在于只能覆蓋特定的領(lǐng)域場(chǎng)景，其它領(lǐng)域場(chǎng)景完全沒法用。

GPU，介于兩者之間。能夠覆蓋的領(lǐng)域場(chǎng)景比DSA多、比CPU少，性能比CPU好但比DSA差。

復(fù)雜的宏系統(tǒng)，存在“二八定律”。比如，在服務(wù)器上，永遠(yuǎn)少不了的虛擬化、網(wǎng)絡(luò)、存儲(chǔ)、安全類的任務(wù)，以及很多服務(wù)器都需要的文件系統(tǒng)、數(shù)據(jù)庫(kù)、AI推理等。

因此，我們可以把系統(tǒng)計(jì)算當(dāng)做一個(gè)塔防游戲：

在最前端，主要是各類DSA。他們的性能很好，負(fù)責(zé)處理算力需求強(qiáng)勁的任務(wù)。這些任務(wù)占整個(gè)計(jì)算量的80%。

中間是GPU，性能也不錯(cuò)，覆蓋面也不錯(cuò)。則負(fù)責(zé)處理剩余20%中的80%的計(jì)算量。

而CPU的任務(wù)，就是兜底。所有“漏網(wǎng)之魚”都由CPU負(fù)責(zé)處理。

這個(gè)思路，也對(duì)應(yīng)我們第一部分介紹的系統(tǒng)的三類任務(wù)劃分。

按照這個(gè)思路，我們?cè)偻ㄟ^一些軟硬件融合的系統(tǒng)設(shè)計(jì)，提供更多的通用性、靈活性、可編程性、易用性等能力，然后再不斷的集成新的性能敏感任務(wù)的加速。

基本上，這樣的通用超異構(gòu)處理器，可以在提供極致性能兼極致靈活性的同時(shí)，可以覆蓋大部分云、邊緣和超級(jí)終端的場(chǎng)景。

6 超異構(gòu)處理器可以用在哪里？

超異構(gòu)處理器HPU相比傳統(tǒng)SOC，最核心的特點(diǎn)是宏系統(tǒng)，需要支持虛擬化和多租戶多系統(tǒng)共存，需要支持資源、數(shù)據(jù)和性能隔離。

因此，超異構(gòu)處理器主要用在云計(jì)算、邊緣計(jì)算以及自動(dòng)駕駛超級(jí)終端等復(fù)雜計(jì)算場(chǎng)景：

云端重量級(jí)服務(wù)器。首先，HPU可以當(dāng)做DPU來使用；更長(zhǎng)遠(yuǎn)的，可以通過Chiplet方式實(shí)現(xiàn)HPU對(duì)重量級(jí)場(chǎng)景的覆蓋。

云端輕量級(jí)服務(wù)器。可以實(shí)現(xiàn)HPU單芯片對(duì)目前以CPU為主的多個(gè)芯片的集成，并且性能顯著提升。

邊緣計(jì)算服務(wù)器。類似云端輕量服務(wù)器，可以通過單芯片集成的HPU實(shí)現(xiàn)所有計(jì)算的全覆蓋。

超級(jí)終端。以自動(dòng)駕駛為典型場(chǎng)景，目前也是逐漸地從分布式的ECU、DCU向集中式的超級(jí)終端單芯片轉(zhuǎn)變。這將是HPU在終端場(chǎng)景的典型應(yīng)用。

總結(jié)一下，超異構(gòu)處理器的核心價(jià)值在于確保整個(gè)系統(tǒng)如CPU一樣極致靈活性的同時(shí)，還可以提供相比目前主流芯片數(shù)量級(jí)的算力提升?？梢杂迷谠朴?jì)算、邊緣計(jì)算、超級(jí)終端等各類復(fù)雜計(jì)算場(chǎng)景。

系統(tǒng)越復(fù)雜，超異構(gòu)處理器的價(jià)值越凸顯！

審核編輯：編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19259

瀏覽量
229650
FPGA

FPGA

+關(guān)注

關(guān)注
1629

文章
21729

瀏覽量
602982
加速器

加速器

+關(guān)注

關(guān)注
2

文章
796

瀏覽量
37838
NPU

NPU

+關(guān)注

關(guān)注
2

文章
279

瀏覽量
18582

原文標(biāo)題：一種新的處理器類型：通用超異構(gòu)處理器

文章出處：【微信號(hào)：阿寶1990，微信公眾號(hào)：阿寶1990】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

中國(guó)首個(gè)異構(gòu)計(jì)算處理器IP核實(shí)現(xiàn) 可用于機(jī)器學(xué)習(xí)

日前，中國(guó)華夏芯公司宣布，其異構(gòu)計(jì)算處理器IP核已經(jīng)在硅片上成功實(shí)現(xiàn)，并已通過HSA（異構(gòu)系統(tǒng)架構(gòu)）一致性測(cè)試。公司還宣布了新的機(jī)器學(xué)習(xí)和深層神經(jīng)網(wǎng)絡(luò)的開源項(xiàng)目，旨在進(jìn)

發(fā)表于 09-01 11:42 ?1290次閱讀

【一文看懂】什么是異構(gòu)計(jì)算？

隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展，計(jì)算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計(jì)算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求，異構(gòu)計(jì)算因

發(fā)表于 12-04 01:06 ?1348次閱讀

【<b class='flag-5'>一</b>文看懂】什么是<b class='flag-5'>異構(gòu)計(jì)算</b>？

異構(gòu)計(jì)算的前世今生

，無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。 ? 異構(gòu)計(jì)算的存在可以說創(chuàng)造了另一個(gè)維度，這個(gè)維度上我們又有了堆性能的空間，小至手機(jī)SoC、汽車芯片，大到服務(wù)

發(fā)表于 12-17 09:35 ?4337次閱讀

異構(gòu)計(jì)算在人工智能什么作用？

計(jì)算或外設(shè)管理等，從而達(dá)到性能和成本的最優(yōu)化。異構(gòu)計(jì)算大廚房里的CPU我們熟知的CPU （中央處理器，Central Processing Unit）作為通用處理器，是更偏重支持控制流

發(fā)表于 08-07 08:39

異構(gòu)計(jì)算的前世今生

，無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。異構(gòu)計(jì)算的存在可以說創(chuàng)造了另一個(gè)維度，這個(gè)維度上我們又有了堆性能的空間，小至手機(jī)SoC、汽車芯片，大到服務(wù)器

發(fā)表于 12-26 08:00

什么是通用處理器

什么是通用處理器 通用微處理器一般指的是服務(wù)器用和桌面計(jì)算用CPU芯片?！　∧壳?，在桌面計(jì)算領(lǐng)

發(fā)表于 01-12 15:40 ?4308次閱讀

基于FPGA的異構(gòu)計(jì)算是趨勢(shì)

目前處于AI大爆發(fā)時(shí)期，異構(gòu)計(jì)算的選擇主要在FPGA和GPU之間。盡管目前異構(gòu)計(jì)算使用最多的是利用GPU來加速，F(xiàn)PGA作為一種高性能、低功耗的可編程芯片，在處理海量數(shù)據(jù)時(shí)，F(xiàn)PGA

發(fā)表于 04-25 09:17 ?1.1w次閱讀

異構(gòu)計(jì)算的兩大派別為什么需要異構(gòu)計(jì)算？

20世紀(jì)80年代，異構(gòu)計(jì)算技術(shù)就已經(jīng)誕生了。所謂的異構(gòu)，就是CPU、DSP、GPU、ASIC、協(xié)處理器、FPGA等各種計(jì)算單元、使用不同的類型指令集、不同的體系架構(gòu)的

發(fā)表于 04-28 11:41 ?2.3w次閱讀

異構(gòu)計(jì)算：架構(gòu)與技術(shù)

，以及如何通過將計(jì)算任務(wù)安排給最適合的處理器，從而幫助您充分地利用移動(dòng)硬件。異構(gòu)計(jì)算旨在幫助您實(shí)現(xiàn)更好的應(yīng)用性能，同時(shí)改善發(fā)熱量，提高電源效率。但是，不是所有能夠進(jìn)行異構(gòu)計(jì)算的系統(tǒng)都

發(fā)表于 09-18 19:18 ?860次閱讀

異構(gòu)計(jì)算，你準(zhǔn)備好了么？

異構(gòu)計(jì)算的先進(jìn)技術(shù)又有哪些？為此，小編惡補(bǔ)了一下異構(gòu)計(jì)算的相關(guān)知識(shí)，并總結(jié)出如下幾個(gè)基本知識(shí)點(diǎn)，給大家分享。如有不足，歡迎大家留言補(bǔ)充~ ● 異構(gòu)計(jì)算（Heterogeneous C

發(fā)表于 09-25 17:27 ?472次閱讀

一種面向現(xiàn)代應(yīng)用處理器的PMIC

一種面向現(xiàn)代應(yīng)用處理器的PMIC

發(fā)表于 05-14 20:05 ?8次下載

異構(gòu)計(jì)算真就完美無缺嗎

，無論是神經(jīng)網(wǎng)絡(luò)處理器還是圖像處理器。 異構(gòu)計(jì)算的存在可以說創(chuàng)造了另一個(gè)維度，這個(gè)維度上我們又有了堆性能的空間，小至手機(jī)SoC、汽車芯片，大到服務(wù)器

發(fā)表于 12-21 09:25 ?1945次閱讀

基于超異構(gòu)計(jì)算的通用處理器GP-HPU介紹

有些專用的芯片，用在特定領(lǐng)域，需要設(shè)計(jì)專門的服務(wù)器，這種方案都流離在整個(gè)云和邊緣計(jì)算主流體系之外的，落地門檻很高，也很難大規(guī)模落地。

發(fā)表于 08-25 14:13 ?1220次閱讀

詳細(xì)地剖析HPU和SOC的各種差異

我們介紹了一種新的處理器類型：超異構(gòu)處理器HPU，

發(fā)表于 04-07 11:20 ?2159次閱讀

新一代計(jì)算架構(gòu)超異構(gòu)計(jì)算技術(shù)是什么 異構(gòu)走向超異構(gòu)案例分析

超異構(gòu)計(jì)算架構(gòu)是一種將不同類型和規(guī)模的硬件資源，包括CPU、GPU、FPGA等，進(jìn)行異構(gòu)集成的方法。它通過獨(dú)特的軟件和硬件協(xié)同設(shè)計(jì)，實(shí)現(xiàn)了計(jì)算

發(fā)表于 08-23 09:57 ?842次閱讀

RM新时代网站-首页

搜索歷史

介紹一種基于超異構(gòu)計(jì)算的通用處理器GP-HPU

評(píng)論

中國(guó)首個(gè)異構(gòu)計(jì)算處理器IP核實(shí)現(xiàn) 可用于機(jī)器學(xué)習(xí)

【一文看懂】什么是異構(gòu)計(jì)算？

異構(gòu)計(jì)算的前世今生

異構(gòu)計(jì)算在人工智能什么作用？

異構(gòu)計(jì)算的前世今生

什么是通用處理器

基于FPGA的異構(gòu)計(jì)算是趨勢(shì)

異構(gòu)計(jì)算的兩大派別為什么需要異構(gòu)計(jì)算？

異構(gòu)計(jì)算：架構(gòu)與技術(shù)

異構(gòu)計(jì)算，你準(zhǔn)備好了么？

一種面向現(xiàn)代應(yīng)用處理器的PMIC

異構(gòu)計(jì)算真就完美無缺嗎

基于超異構(gòu)計(jì)算的通用處理器GP-HPU介紹

詳細(xì)地剖析HPU和SOC的各種差異

新一代計(jì)算架構(gòu)超異構(gòu)計(jì)算技術(shù)是什么異構(gòu)走向超異構(gòu)案例分析