RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大串流時(shí)代,VPU的優(yōu)先級(jí)甚至高過(guò)GPU

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-05-24 00:16 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))無(wú)論是長(zhǎng)視頻串流平臺(tái),還是短視頻社交媒體,每日龐大的視頻上傳數(shù)據(jù)和訪問(wèn)量都對(duì)其背后的硬件平臺(tái)提出了極高的要求,比如網(wǎng)絡(luò)帶寬、時(shí)延、視頻處理等,為了進(jìn)一步優(yōu)化成本,硬件的選擇成了一大難題。比如在視頻編解碼上,面臨效率較低的CPU軟件轉(zhuǎn)碼和成本較高的GPU硬件轉(zhuǎn)碼,不少公司決心改用更具性價(jià)比的VPU。

為什么我們需要VPU?

對(duì)于視頻流媒體網(wǎng)站而言,高效的編碼可以在有效節(jié)省帶寬成本的同時(shí),保證視頻質(zhì)量不變,諸如H265、VP9和AV1等。然而,依賴軟件編碼雖然能夠帶來(lái)極高的畫(huà)面質(zhì)量,但對(duì)硬件占用和配置要求高,使得編碼效率極低,遠(yuǎn)不如FPGA、GPU之類的硬件加速。而基于ASIC的VPU,則進(jìn)一步提高了編碼效率,在成本上也要低于FPGA、GPU等硬件。無(wú)論是租用服務(wù)器還是采用本地服務(wù)器,都能使性價(jià)比成倍增長(zhǎng)。

除了視頻串流之外,VPU在另一個(gè)云端應(yīng)用場(chǎng)景中同樣起到了至關(guān)重要的作用,那就是云游戲。對(duì)于云游戲而言,服務(wù)器內(nèi)部的GPU和CPU已經(jīng)貢獻(xiàn)出了一部分算力用于游戲的運(yùn)行和圖形處理,如果再加上視頻編碼的工作,無(wú)疑會(huì)進(jìn)一步加重負(fù)載,這也就意味著同規(guī)格硬件的并發(fā)數(shù)會(huì)進(jìn)一步降低。這樣的改變反映到租用服務(wù)器的游戲廠商上,就等效于支持單個(gè)用戶的成本降低。

坐擁全球最大視頻網(wǎng)站,谷歌選擇了自研VPU

要論播放量、規(guī)模、地區(qū)覆蓋以及視頻質(zhì)量,排名第一的視頻網(wǎng)站自然是谷歌的Youtube。每分鐘500小時(shí)以上的視頻上傳量,超過(guò)19億的月活躍用戶,讓其成為獨(dú)一檔的視頻串流與分享平臺(tái)。然而,在各大視頻網(wǎng)站中,谷歌在圖像質(zhì)量上依然有著絕對(duì)的優(yōu)勢(shì),這一方面歸功于谷歌的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),另一方面也與其自研的VPU脫不了干系。

從2015年起谷歌就開(kāi)始研究獨(dú)立的視頻處理單元,從而用到更加高效的編碼,比如VP9。2021年,谷歌發(fā)布了首個(gè)自研的視頻處理單元,谷歌將其稱為Argos VCU。這個(gè)谷歌自研的ASIC芯片,對(duì)最高4K60fps的H.264和VP9編碼提供了完整的支持,同時(shí)支持單/多輸出轉(zhuǎn)碼、速度/質(zhì)量微調(diào)等。

wKgZomZPF-iAHLtLABQn0twAveY694.png
谷歌VPU / 谷歌

谷歌聲稱,相比在傳統(tǒng)服務(wù)器上使用經(jīng)過(guò)優(yōu)化的軟件轉(zhuǎn)碼方案,VCU給他們帶來(lái)了20到33倍的計(jì)算效率提升。與此同時(shí),與谷歌的TPU一樣,谷歌已經(jīng)準(zhǔn)備好了硬件迭代的方案,比如增加對(duì)AV1編碼的支持、進(jìn)一步提高負(fù)載等。

第三方ASIC VPU,智能化成為趨勢(shì)

有了谷歌的前車之鑒,不少?gòu)S商都開(kāi)始打起了VPU的主意,這也包括了不少第三方VPU設(shè)計(jì)廠商。以NETINT為例,他們推出了Codensity G5這一ASIC芯片,單芯片可以支持32個(gè)1080p30、8個(gè)4kp30和2個(gè)8kp30視頻流的實(shí)時(shí)編碼,時(shí)延僅有8ms。Codensity G5既支持H.264、HEVC、AV1的編碼,也支持H.264、HEVC和VP9等格式的解碼。

與此同時(shí),基于Codensity G5打造的VPU模組還具備18TOPS的AI算力,可以用于視頻分析之類的AI從處理器,比如背景去除、畫(huà)面加強(qiáng)、面部檢測(cè)和物體檢測(cè)等。Codensity G5也可與不同架構(gòu)的CPU混合使用,比如x86的AMD EPYC處理器、Arm的Amepre Altra Max處理器等等。

wKgZomZPF_aAAWQMAAQCySQEh7g545.png
Alveo MA35D / AMD


除此之外,還有曾經(jīng)以FPGA媒體加速卡方案聞名的AMD/Xilinx,其Alveo U30就是一款混合了ASIC和FPGA設(shè)計(jì)的處理器。但從去年發(fā)布的Alveo MA35D媒體加速卡開(kāi)始,就成了不折不扣的ASIC VPU方案。相比上一代Alveo U30,Alveo MA35D實(shí)現(xiàn)了4倍的通道密度和1.8倍的壓縮效率,編解碼除了支持主流格式外,也新增了AV1的編碼和VP9、AV1的解碼。同樣是4Kp60的視頻,相較于U30的32ms轉(zhuǎn)碼時(shí)延,MA35D也能做到與Codensity G5一樣的8ms。

寫(xiě)在最后

對(duì)于多數(shù)視頻平臺(tái)而言,有關(guān)視頻處理類的工作也不僅僅是依賴VPU等硬件,還有一整套預(yù)處理管線等。但隨著視頻在社交媒體內(nèi)的占比越來(lái)越高,VPU能夠帶來(lái)的成本、部署時(shí)間優(yōu)勢(shì)將越來(lái)越明顯,尤其在帶寬費(fèi)用寸土寸金的國(guó)內(nèi)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
  • vpu
    vpu
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    11780
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    freertos中斷優(yōu)先級(jí)在哪設(shè)置

    FreeRTOS是一個(gè)流行的實(shí)時(shí)操作系統(tǒng),它廣泛應(yīng)用于嵌入式系統(tǒng)開(kāi)發(fā)。在FreeRTOS中,中斷優(yōu)先級(jí)是一個(gè)重要的概念,因?yàn)樗鼪Q定了中斷處理的順序和響應(yīng)時(shí)間。 1. 理解中斷優(yōu)先級(jí) 在討論如何設(shè)置
    的頭像 發(fā)表于 09-02 14:17 ?636次閱讀

    APS智能優(yōu)化排產(chǎn)軟件的優(yōu)先級(jí)應(yīng)用

    資源、訂單需求和約束條件,自動(dòng)計(jì)算出最優(yōu)的生產(chǎn)計(jì)劃。在這個(gè)過(guò)程中,訂單排產(chǎn)的優(yōu)先規(guī)則起著至關(guān)重要的作用。1.交期優(yōu)先級(jí)交期優(yōu)先級(jí)是訂單排產(chǎn)中最基本的優(yōu)先規(guī)則。根據(jù)
    的頭像 發(fā)表于 06-26 17:43 ?386次閱讀
    APS智能優(yōu)化排產(chǎn)軟件的<b class='flag-5'>優(yōu)先級(jí)</b>應(yīng)用

    ESP32S2如何設(shè)置中斷優(yōu)先級(jí)?

    ESP32S2有六級(jí)中斷, 如何設(shè)置中斷優(yōu)先級(jí)? 比如在GPIO例程里 ,這種中斷優(yōu)先級(jí)是如何設(shè)置的呢? 中斷寄存器列表里 ,只有簡(jiǎn)稱,哪里能獲取這個(gè)名稱所對(duì)應(yīng)的功能??
    發(fā)表于 06-21 07:59

    請(qǐng)問(wèn)有什么方法降低WIFI中斷的優(yōu)先級(jí)?

    因?yàn)轫?xiàng)目對(duì)時(shí)序輸出要求比較嚴(yán)格,WIFI中斷優(yōu)先級(jí)比硬件定時(shí)器中斷優(yōu)先級(jí)要高,在定時(shí)器中斷里面對(duì)GPIO管腳控制被延長(zhǎng)執(zhí)行,請(qǐng)問(wèn)有什么方法降低WIFI中斷的優(yōu)先級(jí)
    發(fā)表于 06-19 07:37

    如何在不同優(yōu)先級(jí)安裝相同的處理程序?

    在不同的優(yōu)先級(jí)中安裝相同的處理程序? 我需要一個(gè)解決方案,在不同的優(yōu)先級(jí)中安裝相同的處理程序(ISR),以便在我的項(xiàng)目中處理 CAT2 中斷,但我不能上傳項(xiàng)目,因?yàn)槲液炇鹆?NDA。
    發(fā)表于 05-28 08:13

    systick的中斷優(yōu)先級(jí)是否應(yīng)該設(shè)置為最高優(yōu)先級(jí)的嵌套中斷?

    最近在學(xué)習(xí)ucosii有這樣一個(gè)疑問(wèn),關(guān)于stm32的systick作為ucosii的基準(zhǔn)時(shí)鐘,systick的中斷優(yōu)先級(jí)是否應(yīng)該設(shè)置為最高優(yōu)先級(jí)的嵌套中斷。理由是什么?各位大俠求指教?。?!
    發(fā)表于 05-16 06:44

    stm32的中斷優(yōu)先級(jí)分組了之后還能改分組嗎?

    如標(biāo)題所示,stm32的中斷優(yōu)先級(jí)分組了之后還能改分組嗎? 比如我要使用外部中斷EXIT2,3,我在配置的時(shí)候配置了優(yōu)先級(jí)分組2組,然后配置了EXIT2,3,如果我下面又想開(kāi)外部中斷的EXIT4,5的話,我是不是必須還的要使用優(yōu)先級(jí)
    發(fā)表于 05-13 08:40

    創(chuàng)建了兩個(gè)task如果一個(gè)優(yōu)先級(jí)高 一個(gè)優(yōu)先級(jí)低,高優(yōu)先級(jí)的那個(gè)一直在做,什么時(shí)候會(huì)調(diào)度到低優(yōu)先級(jí)的呢?

    創(chuàng)建了兩個(gè)task如果一個(gè)優(yōu)先級(jí)高一個(gè)優(yōu)先級(jí)低, 我看到任務(wù)的函數(shù)都是用死循環(huán)做的,那個(gè)高優(yōu)先級(jí)的那個(gè)一直在做,什么時(shí)候會(huì)調(diào)度到低優(yōu)先級(jí)的呢?
    發(fā)表于 05-13 07:13

    求助,關(guān)于stm32F4中斷優(yōu)先級(jí)0無(wú)法搶占的問(wèn)題求解

    使用F407遇到一個(gè)搶占優(yōu)先級(jí)的問(wèn)題: 現(xiàn)設(shè)置優(yōu)先級(jí)分組 HAL_NVIC_SetPriorityGrouping(NVIC_PRIORITYGROUP_4);也就是15個(gè)優(yōu)先級(jí)分組。按照手冊(cè)說(shuō)明0
    發(fā)表于 04-23 07:26

    STM32F103的寄存器NVIC_IPRx搶占優(yōu)先級(jí)和子優(yōu)先級(jí)是怎么設(shè)置的?

    STM32F103的寄存器NVIC_IPRx有些不明白,搶占優(yōu)先級(jí)和子優(yōu)先級(jí)是怎么設(shè)置的? 如果,中斷分組2,搶占優(yōu)先級(jí)3,子優(yōu)先級(jí)3 那下面這樣寫(xiě)對(duì)嗎? SCB->AIR
    發(fā)表于 03-27 07:48

    Hightec對(duì)芯片中斷優(yōu)先級(jí)分配時(shí),中斷號(hào)越高中斷優(yōu)先級(jí)越高嗎?

    請(qǐng)問(wèn)大佬,Hightec對(duì)芯片中斷優(yōu)先級(jí)分配時(shí),中斷號(hào)越高中斷優(yōu)先級(jí)越高嗎?看網(wǎng)上的帖子說(shuō)中斷號(hào)越低優(yōu)先級(jí)越高。
    發(fā)表于 02-27 06:13

    RTTnano的用戶main函數(shù)中的優(yōu)先級(jí)是多少?

    RTTnano 的用戶main函數(shù)中的優(yōu)先級(jí)是多少?為什么會(huì)出現(xiàn)創(chuàng)建新的task之后,main函數(shù)會(huì)搶占掉低優(yōu)先級(jí)的task,例如RT_THREAD_PRIORITY_MAX設(shè)置為8 ,低于3
    發(fā)表于 02-26 08:01

    M0516中斷優(yōu)先級(jí)怎么設(shè)置?

    新唐M0516中斷優(yōu)先級(jí)的設(shè)置,有沒(méi)有示例,沒(méi)找到相關(guān)接口,謝謝!
    發(fā)表于 01-16 07:25

    華為和思科默認(rèn)路由優(yōu)先級(jí)

    優(yōu)先級(jí)值不同,則優(yōu)先級(jí)值最小的為最優(yōu)路由(無(wú)論開(kāi)銷值是否相同,另一種理解就是對(duì)不同路由來(lái)源或路由協(xié)議之間的比較)。
    的頭像 發(fā)表于 01-11 10:47 ?1176次閱讀

    GD32如何配置中斷優(yōu)先級(jí)分組以及中斷優(yōu)先級(jí)

    使用GD32 MCU的過(guò)程中,大家可能會(huì)有以下疑問(wèn):中斷優(yōu)先級(jí)如何配置和使用?
    的頭像 發(fā)表于 01-10 10:30 ?3055次閱讀
    GD32如何配置中斷<b class='flag-5'>優(yōu)先級(jí)</b>分組以及中斷<b class='flag-5'>優(yōu)先級(jí)</b>
    RM新时代网站-首页