電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))無(wú)論是長(zhǎng)視頻串流平臺(tái),還是短視頻社交媒體,每日龐大的視頻上傳數(shù)據(jù)和訪問(wèn)量都對(duì)其背后的硬件平臺(tái)提出了極高的要求,比如網(wǎng)絡(luò)帶寬、時(shí)延、視頻處理等,為了進(jìn)一步優(yōu)化成本,硬件的選擇成了一大難題。比如在視頻編解碼上,面臨效率較低的CPU軟件轉(zhuǎn)碼和成本較高的GPU硬件轉(zhuǎn)碼,不少公司決心改用更具性價(jià)比的VPU。
為什么我們需要VPU?
對(duì)于視頻流媒體網(wǎng)站而言,高效的編碼可以在有效節(jié)省帶寬成本的同時(shí),保證視頻質(zhì)量不變,諸如H265、VP9和AV1等。然而,依賴軟件編碼雖然能夠帶來(lái)極高的畫(huà)面質(zhì)量,但對(duì)硬件占用和配置要求高,使得編碼效率極低,遠(yuǎn)不如FPGA、GPU之類的硬件加速。而基于ASIC的VPU,則進(jìn)一步提高了編碼效率,在成本上也要低于FPGA、GPU等硬件。無(wú)論是租用服務(wù)器還是采用本地服務(wù)器,都能使性價(jià)比成倍增長(zhǎng)。
除了視頻串流之外,VPU在另一個(gè)云端應(yīng)用場(chǎng)景中同樣起到了至關(guān)重要的作用,那就是云游戲。對(duì)于云游戲而言,服務(wù)器內(nèi)部的GPU和CPU已經(jīng)貢獻(xiàn)出了一部分算力用于游戲的運(yùn)行和圖形處理,如果再加上視頻編碼的工作,無(wú)疑會(huì)進(jìn)一步加重負(fù)載,這也就意味著同規(guī)格硬件的并發(fā)數(shù)會(huì)進(jìn)一步降低。這樣的改變反映到租用服務(wù)器的游戲廠商上,就等效于支持單個(gè)用戶的成本降低。
坐擁全球最大視頻網(wǎng)站,谷歌選擇了自研VPU
要論播放量、規(guī)模、地區(qū)覆蓋以及視頻質(zhì)量,排名第一的視頻網(wǎng)站自然是谷歌的Youtube。每分鐘500小時(shí)以上的視頻上傳量,超過(guò)19億的月活躍用戶,讓其成為獨(dú)一檔的視頻串流與分享平臺(tái)。然而,在各大視頻網(wǎng)站中,谷歌在圖像質(zhì)量上依然有著絕對(duì)的優(yōu)勢(shì),這一方面歸功于谷歌的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),另一方面也與其自研的VPU脫不了干系。
從2015年起谷歌就開(kāi)始研究獨(dú)立的視頻處理單元,從而用到更加高效的編碼,比如VP9。2021年,谷歌發(fā)布了首個(gè)自研的視頻處理單元,谷歌將其稱為Argos VCU。這個(gè)谷歌自研的ASIC芯片,對(duì)最高4K60fps的H.264和VP9編碼提供了完整的支持,同時(shí)支持單/多輸出轉(zhuǎn)碼、速度/質(zhì)量微調(diào)等。
谷歌VPU / 谷歌
谷歌聲稱,相比在傳統(tǒng)服務(wù)器上使用經(jīng)過(guò)優(yōu)化的軟件轉(zhuǎn)碼方案,VCU給他們帶來(lái)了20到33倍的計(jì)算效率提升。與此同時(shí),與谷歌的TPU一樣,谷歌已經(jīng)準(zhǔn)備好了硬件迭代的方案,比如增加對(duì)AV1編碼的支持、進(jìn)一步提高負(fù)載等。
第三方ASIC VPU,智能化成為趨勢(shì)
有了谷歌的前車之鑒,不少?gòu)S商都開(kāi)始打起了VPU的主意,這也包括了不少第三方VPU設(shè)計(jì)廠商。以NETINT為例,他們推出了Codensity G5這一ASIC芯片,單芯片可以支持32個(gè)1080p30、8個(gè)4kp30和2個(gè)8kp30視頻流的實(shí)時(shí)編碼,時(shí)延僅有8ms。Codensity G5既支持H.264、HEVC、AV1的編碼,也支持H.264、HEVC和VP9等格式的解碼。
與此同時(shí),基于Codensity G5打造的VPU模組還具備18TOPS的AI算力,可以用于視頻分析之類的AI從處理器,比如背景去除、畫(huà)面加強(qiáng)、面部檢測(cè)和物體檢測(cè)等。Codensity G5也可與不同架構(gòu)的CPU混合使用,比如x86的AMD EPYC處理器、Arm的Amepre Altra Max處理器等等。
Alveo MA35D / AMD
除此之外,還有曾經(jīng)以FPGA媒體加速卡方案聞名的AMD/Xilinx,其Alveo U30就是一款混合了ASIC和FPGA設(shè)計(jì)的處理器。但從去年發(fā)布的Alveo MA35D媒體加速卡開(kāi)始,就成了不折不扣的ASIC VPU方案。相比上一代Alveo U30,Alveo MA35D實(shí)現(xiàn)了4倍的通道密度和1.8倍的壓縮效率,編解碼除了支持主流格式外,也新增了AV1的編碼和VP9、AV1的解碼。同樣是4Kp60的視頻,相較于U30的32ms轉(zhuǎn)碼時(shí)延,MA35D也能做到與Codensity G5一樣的8ms。
寫(xiě)在最后
對(duì)于多數(shù)視頻平臺(tái)而言,有關(guān)視頻處理類的工作也不僅僅是依賴VPU等硬件,還有一整套預(yù)處理管線等。但隨著視頻在社交媒體內(nèi)的占比越來(lái)越高,VPU能夠帶來(lái)的成本、部署時(shí)間優(yōu)勢(shì)將越來(lái)越明顯,尤其在帶寬費(fèi)用寸土寸金的國(guó)內(nèi)。
-
gpu
+關(guān)注
關(guān)注
28文章
4729瀏覽量
128890 -
vpu
+關(guān)注
關(guān)注
0文章
15瀏覽量
11780
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論