DPU這個(gè)概念最近一年多才出現(xiàn)的,被英偉達(dá)的 Mellanox 帶火,英偉達(dá)和邁威爾這個(gè)業(yè)務(wù)的增速都很高,市場(chǎng)也高看一眼。所幸大廠(chǎng)和中小廠(chǎng)商同一起跑線(xiàn),國(guó)內(nèi)也能參與競(jìng)爭(zhēng)。老規(guī)矩,按照市場(chǎng)最關(guān)心的問(wèn)題,分如下部分:
1、DPU是什么?
2、DPU解決什么問(wèn)題?
3、DPU市場(chǎng)空間有多大?
4、DPU能不能成為獨(dú)立主流芯片?
5、海內(nèi)外玩家有哪些?
6、最后會(huì)不會(huì)一家獨(dú)大,贏家通吃?
1、DPU是什么
Data Processing Unit,即數(shù)據(jù)處理器。DPU最直接的作用是作為CPU的卸載引擎,接管網(wǎng)絡(luò)虛擬化、硬件資源池化等基礎(chǔ)設(shè)施層服務(wù),釋放CPU的算力到上層應(yīng)用。以網(wǎng)絡(luò)協(xié)議處理為例,要線(xiàn)速處理10G的網(wǎng)絡(luò)需要的大約4個(gè)Xeon CPU的核,也就是說(shuō),單是做網(wǎng)絡(luò)數(shù)據(jù)包處理,就可以占去一個(gè)8核高端CPU一半的算力。Amazon 把這些開(kāi)銷(xiāo)都稱(chēng)之為“Datacenter Tax”,DPU就是把“Datacenter Tax”從CPU 上卸去,轉(zhuǎn)移到一張專(zhuān)門(mén)的加速卡上,DPU。
DPU可以成為新的數(shù)據(jù)網(wǎng)關(guān),將安全隱私提升到一個(gè)新的高度,網(wǎng)絡(luò)接口一般是網(wǎng)絡(luò)加密,解密的重要邊界,所以海內(nèi)外都有網(wǎng)絡(luò)安全公司做DPU的例子。DPU也可以成為存儲(chǔ)的入口,將分布式的存儲(chǔ)和遠(yuǎn)程訪(fǎng)問(wèn)本地化。
DPU誕生之初,就是一顆異構(gòu)芯片。DPU不是一顆固化的ASIC,在CXL、CCIX等標(biāo)準(zhǔn)組織倡導(dǎo)CPU、GPU與DPU等數(shù)據(jù)一致性,DPU編程障礙掃清。國(guó)內(nèi)一些互聯(lián)網(wǎng)大廠(chǎng)用FPGA的方式開(kāi)發(fā)DPU,海外飛塔這家公司用的ASIC方式,將DPU的性能加到網(wǎng)安組件里面。
上一個(gè)硬件圖吧
國(guó)內(nèi)中科馭數(shù)的系統(tǒng)架構(gòu):
2、DPU解決什么問(wèn)題
DPU為什么能火?算力荒!DPU解決的主要是帶寬提速之后,CPU算力被占用,進(jìn)而卡頓的問(wèn)題。它的角色是在以前網(wǎng)卡的基礎(chǔ)上再升級(jí),不斷寫(xiě)入功能在里面,自身優(yōu)化線(xiàn)路,協(xié)議等,慢慢成型的一個(gè)玩意。IDC的數(shù)據(jù)顯示,全球數(shù)據(jù)量在過(guò)去10年年均復(fù)合增長(zhǎng)率接近50%,并進(jìn)一步預(yù)測(cè)每四個(gè)月對(duì)于算力的需求就會(huì)翻一倍。與此相對(duì)的是CPU性能每年提升3%,巨大的差距面前,加速芯片獨(dú)立了。參照下圖:
數(shù)據(jù)來(lái)源:IDC
DPU 的前身,可以延續(xù)到智能網(wǎng)卡。早期智能網(wǎng)卡就是一張高速網(wǎng)卡+FPGA芯片擴(kuò)展,目的也是加速,但這種組合沒(méi)有成為絕對(duì)主流。這類(lèi)智能網(wǎng)卡只被當(dāng)作FPGA加速卡,有FPGA優(yōu)勢(shì),也繼承了所有FPGA的局限性。當(dāng)下DPU是對(duì)現(xiàn)有的SmartNIC的一個(gè)整合,能看到很多以往SmartNIC的影子,但明顯高于之前任何一個(gè)SmartNIC的定位.以后DPU可能不限于75W的控制中,會(huì)有獨(dú)立的供電系統(tǒng)。
DPU可以應(yīng)用到很多場(chǎng)景,大的就有三個(gè):網(wǎng)絡(luò)功能卸載,儲(chǔ)存功能卸載,安全功能卸載。網(wǎng)絡(luò)功能卸載是伴隨云計(jì)算網(wǎng)絡(luò)而產(chǎn)生的,主要是對(duì)云計(jì)算主機(jī)上的虛擬交換機(jī)的能力做硬件卸載,從而減少主機(jī)上消耗在網(wǎng)絡(luò)上的CPU算力,提高可售賣(mài)計(jì)算資源;儲(chǔ)存功能卸載,NVMe over Fabric是一個(gè)相對(duì)較新的協(xié)議規(guī)范,使用NVMe通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)將主機(jī)連接到存儲(chǔ),支持對(duì)數(shù)據(jù)中心的計(jì)算和存儲(chǔ)進(jìn)行分解。
NVMe-oF協(xié)議定義了使用各種通用的輸協(xié)議來(lái)實(shí)現(xiàn)NVMe功能的方式;安全功能卸載,在傳統(tǒng)的網(wǎng)卡上做云平臺(tái)虛擬化,Hypervisor以及對(duì)應(yīng)的虛擬化網(wǎng)絡(luò)的實(shí)現(xiàn),都是在主機(jī)操作系統(tǒng)上實(shí)現(xiàn)的。
引入DPU智能網(wǎng)卡之后,將虛擬化網(wǎng)絡(luò)的控制平面完全卸載到智能網(wǎng)卡上,與主機(jī)操作系統(tǒng)相隔離。即使黑客攻陷了Hypervisor,獲取了主機(jī)操作系統(tǒng)的root權(quán)限,也無(wú)法篡改虛擬化網(wǎng)絡(luò)的配置,這樣可以將黑客的攻擊范圍限制在主機(jī)操作系統(tǒng)上,不會(huì)影響到虛擬化網(wǎng)絡(luò)以及其它主機(jī),做到有效隔離。
3、DPU市場(chǎng)空間有多大
按照海外投行的說(shuō)法,DPU的潛在市場(chǎng)非常巨大,預(yù)測(cè)到2025年僅中國(guó)市場(chǎng)就能達(dá)到每年40億美元的規(guī)模,估計(jì)全球?qū)⒊^(guò)120億美元,但挑戰(zhàn)與機(jī)遇并存。IaaS在國(guó)內(nèi)云服務(wù)市場(chǎng)占比約60%,支撐了目前最重要的PaaS的容器云技術(shù)。未來(lái)幾年,我國(guó)仍將維持IaaS為主的云計(jì)算結(jié)構(gòu),預(yù)計(jì)市場(chǎng)占比將逐上升到70%。
4、DPU能不能成為獨(dú)立主流芯片
前面說(shuō)了,DPU是智能網(wǎng)卡演化而來(lái),能不能成為獨(dú)立主流芯片,當(dāng)下技術(shù)還在競(jìng)爭(zhēng)發(fā)展中。
前面說(shuō)了,DPU是智能網(wǎng)卡演化而來(lái),能不能成為獨(dú)立主流芯片,當(dāng)下技術(shù)還在競(jìng)爭(zhēng)發(fā)展中。DPU目前主流形態(tài)是外掛”CPU和FPGA會(huì)封裝到一個(gè)芯片中,形成一個(gè)奇怪的通過(guò)PCIe總線(xiàn)互聯(lián)的兩個(gè)CPU系統(tǒng)。這個(gè)架構(gòu)非常簡(jiǎn)潔,但同時(shí)IPU引發(fā)了一個(gè)架構(gòu)性的問(wèn)題,這個(gè)架構(gòu)到底IPU是中心,還是host CPU是中心?”。因?yàn)檫@方面的技術(shù)還在猛烈革新中,所以這三顆大芯片最后的架構(gòu)怎么樣,誰(shuí)勝出,還要看。但趨勢(shì)是直線(xiàn)向上的。
5、海內(nèi)外玩家有哪些
從技術(shù)流派來(lái)講,援引賽迪發(fā)布的《2021中國(guó)DPU行業(yè)發(fā)展白皮書(shū)》內(nèi)容:DPU方案分為三種:一是以通用眾核處理器為基礎(chǔ),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對(duì)性不夠,對(duì)于特殊算法和應(yīng)用的支持與通用CPU相比并無(wú)太顯著優(yōu)勢(shì);二是以專(zhuān)用核為基礎(chǔ)的異構(gòu)核陣列,針對(duì)性較強(qiáng)、性能較好,但是犧牲了部分靈活性;第三種路線(xiàn)結(jié)合了前二者優(yōu)勢(shì),即將通用處理器的可編程靈活性與專(zhuān)用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢(shì)。
說(shuō)的有點(diǎn)抽象,用公司來(lái)舉例,以英偉達(dá),英特爾為例, 基于GPU + FPGA技術(shù)經(jīng)驗(yàn),數(shù)據(jù)處理**** ; 賽靈思 被認(rèn)為是智能網(wǎng)卡玩家 ,基礎(chǔ)的技術(shù)線(xiàn)路和方案比較接近。 現(xiàn)在一些FPGA+NP等技術(shù)源于這里,有人把這類(lèi)歸于白皮書(shū)里的第三類(lèi),折中方案。
通信玩家,博通, Marvell****就是這個(gè)路子,他們以數(shù)據(jù)交換,網(wǎng)絡(luò)通信起家,他們的解決方案主要**** 基于ARM內(nèi)核方案。 新玩家 Fungible思科 **出身,更傾向于 網(wǎng)絡(luò)技術(shù) , ARM內(nèi)核方案。
目前海內(nèi)外玩家的競(jìng)爭(zhēng)都集中在服務(wù)器網(wǎng)卡, AI加速計(jì)算,智能計(jì)算和算力的概念聯(lián)系上,被上升到計(jì)算架構(gòu)的高度,被一級(jí)市場(chǎng) 吹噓到突破摩爾定律。誰(shuí)知道呢?
具體講講各公司情況,附國(guó)內(nèi)創(chuàng)業(yè)公司:
英偉達(dá):NVIDIA收購(gòu)Mellanox后(intel關(guān)注洽談這家很久),在ConnectX系列高速網(wǎng)卡技術(shù)基礎(chǔ)上,推出其BlueField系列DPU,DPU定名!Mellanox和intel在阿里項(xiàng)目上歷時(shí)十幾個(gè)月的PK,累趴對(duì)手,成為國(guó)內(nèi)大互聯(lián)網(wǎng)廠(chǎng)首個(gè)DPU簽約主體。Mellanox以前的產(chǎn)品主要應(yīng)用在超算,后來(lái)技術(shù)部門(mén)研究可以進(jìn)入服務(wù)器市場(chǎng)。英偉達(dá)增速最快的業(yè)務(wù)就是服務(wù)器業(yè)務(wù),由于虛擬機(jī)和容器(containers)等的流行,應(yīng)用程序在多臺(tái)終端運(yùn)行,應(yīng)對(duì)數(shù)據(jù)中心流量爆炸的問(wèn)題而Mellanox是專(zhuān)家。目前Mellanox的產(chǎn)品在其財(cái)報(bào)里面數(shù)據(jù)中心一項(xiàng),按照最新的電話(huà)會(huì)議說(shuō)法,不是受制于產(chǎn)能,增速應(yīng)該能超過(guò)整個(gè)數(shù)據(jù)中心增長(zhǎng)。
Xilinx:被AMD收購(gòu),早前出了Alveo系列加速卡。
Intel :2015年底收購(gòu)了Xilinx的競(jìng)爭(zhēng)對(duì)手——Altera,進(jìn)一步開(kāi)發(fā)硬件加速能力。2021年6月發(fā)布IPU產(chǎn)品(名字不一樣),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競(jìng)爭(zhēng)者。
Marvall:2021 年發(fā)布OCTEON 10 DPU產(chǎn)品,不僅具備強(qiáng)大的轉(zhuǎn)發(fā)能力,還具有突出的AI處理能力。
還有一些參與主體:互聯(lián)網(wǎng)廠(chǎng)商,內(nèi)部也有改善服務(wù)器速度的開(kāi)發(fā)自研計(jì)劃。Google、Amazon,阿里巴巴等。
注:Fungible成立于2015年,目前擁有約200名員工,總籌資超過(guò)3億美元。其他投資者包括Battery Ventures,Mayfield Fund,Redline Capital和Walden Riverwood Ventures。其新資本將用于加速產(chǎn)品開(kāi)發(fā)。
國(guó)內(nèi)的玩家都是初創(chuàng)期,擁有一個(gè)大的客戶(hù),或者行業(yè)熟悉客戶(hù),打磨自己的DPU產(chǎn)品,因?yàn)楝F(xiàn)在海內(nèi)外同一起跑線(xiàn),所以看起各家融資ppt都賊牛逼。
6、最后會(huì)不會(huì)一家獨(dú)大、贏家通吃
目前要解決DPU標(biāo)準(zhǔn)化應(yīng)用,還存在一定挑戰(zhàn)。由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠(chǎng)商一方面采用COTS組件來(lái)構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化(IaaS,PaaS,SaaS),打造面向不用類(lèi)型客戶(hù)的標(biāo)準(zhǔn)化產(chǎn)品。內(nèi)容方AWS有Nitro,阿里云有MOC,反正就是五花八門(mén)——有的廠(chǎng)商強(qiáng)化IO能力、有的關(guān)注路由轉(zhuǎn)發(fā)、有的重視存儲(chǔ)卸載、有的關(guān)注安全加密。
至于有沒(méi)有贏家通吃,一家獨(dú)大,類(lèi)似CPU,GPU這樣的格局出現(xiàn),目前暫時(shí)看不到,只能說(shuō),數(shù)據(jù)爆發(fā)的階段,大家都有碗飯吃。
首先,DPU是一種專(zhuān)用處理器,與通用CPU的發(fā)展路徑有所不同。專(zhuān)用計(jì)算重點(diǎn)放在數(shù)據(jù)平面,而通用計(jì)算重點(diǎn)放在控制平面。作為專(zhuān)用處理器,DPU的功能是收斂的,不用太多考慮多元化,代際兼容等問(wèn)題。典型的“先垂直深耕,再水平擴(kuò)展”的路徑,所以在初期,會(huì)有針對(duì)不同領(lǐng)域,不同類(lèi)型甲方的異構(gòu)產(chǎn)品出現(xiàn)。
需求不同,產(chǎn)品就容易碎片化,例如各大公有云廠(chǎng)商、電信運(yùn)營(yíng)商等都有比較完整、也比較封閉的底層架構(gòu)和應(yīng)用生態(tài)。上層負(fù)載不同,必然對(duì)底層架構(gòu)有各異的需求,這也許是目前DPU標(biāo)準(zhǔn)化面臨的最大的挑戰(zhàn)
當(dāng)然這里的碎應(yīng)該不是貶義詞,應(yīng)該指“專(zhuān)”,畢竟DPU不是一個(gè)人人都能進(jìn)入的賽道。由其專(zhuān)用性,需要長(zhǎng)期行業(yè)“Knowhow”持續(xù)打磨迭代產(chǎn)品,這對(duì)于行業(yè)內(nèi)初創(chuàng)公司才有更大的生存空間,大家同一起跑線(xiàn)。DPU當(dāng)下類(lèi)似于工業(yè)軟件,需要上下游企業(yè),甲方乙方共同來(lái)構(gòu)建良性、開(kāi)放的生態(tài)環(huán)境。
傳統(tǒng)的“one-size-fit-all”的ASIC商業(yè)模式,通過(guò)上量來(lái)攤薄芯片研發(fā)的巨額NRE成本本身還是有效的。所以專(zhuān)用DPU最終也要謀求“水平擴(kuò)展”來(lái)覆蓋更多的場(chǎng)景,還是要盡可能把各異的需求整合起來(lái),并且適應(yīng)不同廠(chǎng)商。
也許十年后,在競(jìng)爭(zhēng)合作中博弈出了滿(mǎn)足各種行業(yè)需求的產(chǎn)品,兼顧靈活性與成本。也許十年后的DPU能解決復(fù)雜網(wǎng)絡(luò)、安全、存儲(chǔ)、虛擬化等方面的問(wèn)題,真真正正成為舉足輕重的“第三顆大芯片”。
-
cpu
+關(guān)注
關(guān)注
68文章
10854瀏覽量
211578 -
DPU
+關(guān)注
關(guān)注
0文章
357瀏覽量
24169 -
數(shù)據(jù)處理器
+關(guān)注
關(guān)注
0文章
26瀏覽量
8652
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論