RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

驍龍865背后的CPU+GPU模塊技術(shù)解析

454398 ? 來源:cfan ? 作者:cfan ? 2020-08-19 10:48 ? 次閱讀

手機的“心臟”只有指甲蓋大小,但憑借著高集成度的SoC身份,這種芯片卻完美詮釋了“麻雀雖小五臟俱全”的定義。

如果說指令集架構(gòu)和制程工藝決定了SoC的天賦(詳見《硬核科普!為啥說SoC的性能取決于架構(gòu)和工藝?》),那SoC的直觀戰(zhàn)斗力則全看CPU+GPU模塊的規(guī)格了。驍龍865之所以是Android手機圈綜合性能最強的SoC,就是源于其集成的GPU更加強悍。

接下來,我們就將SoC分解,并先來看看影響其絕對性能的這兩個關(guān)鍵模塊。

*****CPU:性能基石*****

在SoC的組成部分中,CPU是最關(guān)鍵的核心單元之一,我們可以將它理解為PC上的酷睿處理器,而它的強弱主要受到以下幾個參數(shù)的影響。

手機專用的SoC都屬于“ARM處理器”,而ARM公司與芯片廠商的合作則存在3種形式:

原生Cortex-A系列架構(gòu)

ARM公司平均每年都會推出全新的“原生”(公版)架構(gòu),包括性能級的Cortex-A7x,以及效能級的Cortex-A5x,前者可以作為CPU中的“大核”,目前SoC正好處于Cortex-A76向Cortex-A77之間的過渡階段,2020年中旬ARM還將祭出Cortex-A78架構(gòu)。

Cortex-A架構(gòu)版本越高,性能越強

后者則屬于CPU中的“小核”,Cortex-A73或更早期的大核都會與Cortex-A53搭配,從Cortex-A75開始則與Cortex-A55“聯(lián)姻”,短期內(nèi)ARM還沒有更新效能級核心架構(gòu)的計劃。

基于Cortex的半定制化架構(gòu)

芯片商在拿到ARM原生Cortex-A的架構(gòu)后,可以對其進行一定程度的改造,從而實現(xiàn)更高性能、更多功能或更低功耗。

高通旗下的驍龍SoC總會采用名為“Kryo”的核心架構(gòu),而它們就都是基于原生Cortex-A架構(gòu)半定制化而來,業(yè)內(nèi)人士還習慣將這種形式稱為“魔改”。

華為從麒麟980開始,包括最新推出的麒麟820,也是主打Cortex-ABased,理論上也是一種半定制化的魔改。

基于指令集的自研架構(gòu)

如果芯片商只憑借ARM的指令集授權(quán),并在此基礎(chǔ)上研發(fā)芯片,則可被歸類到“自研”架構(gòu)。

比如驍龍820采用的Kryo核心、三星貓鼬(Mongoose)核心、蘋果從A5往后的SoC就都采用了在ARM指令集基礎(chǔ)上的自研CPU架構(gòu)。

從ARM授權(quán)的成本角度來看,采用原生架構(gòu)的授權(quán)費用最低,魔改次之,基于指令集的授權(quán)最高,而且芯片商想在ARM指令集基礎(chǔ)上加以定制優(yōu)化以形成自己獨特的設(shè)計,還需要強大的研發(fā)實力,所以目前只有蘋果、高通和三星有所涉獵。

從性能的角度來看,不同時期的架構(gòu)之間則存在明顯的性能壓制,比如Cortex-A77天生就比Cortex-A76更強,但同一時期的原生、魔改和自研架構(gòu)之間的差異其實并不大,主要還是受制于核心數(shù)量、多叢集和最高主頻方面的影響。

多叢集設(shè)計

我們都知道Cortex-A7x性能比Cortex-A5x更強,為什么沒有SoC采用全部由Cortex-A7x打造的多核處理器?

答案很簡單,高性能的背后就是高功耗,為了讓智能手機可以具備至少一天一充的續(xù)航底線,手機SoC必然要采取“大小核”(Cortex-A73之前稱Big.Little,Cortex-A75之后為DynamIQ Big.Little)的搭配策略。

從Cortex-A75開始,DynamIQ技術(shù)可以實現(xiàn)更靈活的核心搭配

為了更好地權(quán)衡性能和功耗,手機SoC在“大小核”的基礎(chǔ)上還引入了“多叢集”的概念,比如聯(lián)發(fā)科天璣1000就是了“4+4”雙叢集的代表,由4×Cortex-A77和4×Cortex-A55共計8個CPU核心構(gòu)成。

麒麟990和驍龍865都是三叢集代表,差異是前者采用了“2+2+4”(2×A76+2×A76+4×A55),后者則是“1+3+4”(1×Kryo 585+3×Kryo 585+4×Kryo 585),即大核+中核+小核三種核心搭配的策略。

在不考慮功耗的前提下,自然是大核架構(gòu)越先進,數(shù)量越多性能越強。

驍龍865的三叢集設(shè)計

但是,現(xiàn)實中SoC在全速運行(玩游戲)時CPU非常容易因過熱而觸發(fā)降頻機制,從而導致性能驟降引起卡頓問題。

因此,“2+6”的雙叢集和“1+3+4”或“2+2+4”的三叢集設(shè)計正逐漸成為主流。

運行頻率

CPU的性能強弱,除了受制于核心架構(gòu)和多叢集設(shè)計,運行頻率的影響總是更加立竿見影。

我們都知道Cortex-A77架構(gòu)比Cortex-A76架構(gòu)強,但2019底才剛剛量產(chǎn)的聯(lián)發(fā)科1000L(大核為Cortex-A77)的CPU性能卻還不如2018年底上市的麒麟980(大核為Cortex-A76)。

原因很簡單,聯(lián)發(fā)科1000L的大核主頻只有2.2GHz,而麒麟980的主頻則高達2.6GHz,更高的主頻足以彌補核心架構(gòu)和大核數(shù)量上的劣勢。

相同SoC的手機之間,散熱設(shè)計越好的手機性能往往也是最強的

因此,對于同期同級別的SoC而言,誰的CPU主頻更高,往往更容易取得性能上優(yōu)勢。當然,前提是手機自身的散熱設(shè)計必須過硬,可以讓CPU長時間運行在預設(shè)的最高主頻上。

*****GPU:游戲引擎*****

GPU是SoC中重要性僅次于CPU的單元,我們可以將它理解為PC上的獨立顯卡,一款手機能支持多高的分辨率、刷新率、玩游戲能跑出多少幀數(shù),幾乎都需要看GPU的臉色。

GPU品牌

和SoC中的CPU單元由ARM一家獨大不同,其集成的GPU單元還未江湖一統(tǒng),在Android手機領(lǐng)域正處于“三國爭霸”的格局——高通旗下的驍龍SoC全部集成自家Adreno品牌的GPU,華為/三星旗下的SoC則青睞ARM公司推出的Mali品牌GPU,聯(lián)發(fā)科則經(jīng)?!澳_踏兩只船”,ARM Mali GPU和Imagination公司的PowerVR GPU都有所涉獵。

據(jù)悉,三星已經(jīng)攜手AMD,在未來Exynos SoC很可能會集成由AMD授權(quán)的RDNA架構(gòu)GPU,而華為也正在開展自研GPU的項目。

核心架構(gòu)

和ARM CPU架構(gòu)總在不斷升級一樣,各個品牌的GPU每隔1年~2年也會完成一次迭代。

其中,高通AdrenoGPU剛剛完成了Adreno500向Adreno600的全面升級,從定位中低端的驍龍665(Adreno 610)到最新的頂級旗艦驍龍865(Adreno 650),Adreno 6x0中的“x”數(shù)字越大代表性能越強。

ARM Mali品牌的高端GPU正經(jīng)歷由Mali-G76(與Cortex-A76 CPU搭配)向Mali-G77(與Cortex-A77 CPU搭配)過渡,而中端GPU很快也要從Mali-G52升級到Mali-G53。

ARM Mali GPU的發(fā)展路線

在大的方向上,Mali-G7x肯定強過Mali-G5x,并同樣是“x”數(shù)字越大代表性能越強。ImaginationGPU很快也要從第九代(PowerVR 9)過渡到第十代(PowerVR IMG A),考慮到該系列GPU比較小眾,我們就不在本文贅述了。

如果你想了解更多手機GPU的歷史和相關(guān)技術(shù),請參考《手機處理器的GPU誰最強?看完這篇文章你就懂了!》這篇文章。

計算單元

在現(xiàn)實中,很多GPU都采用相同架構(gòu)的核心,但它們的GPU性能卻存在很大的差異。

比如,驍龍675(Adreno612)和驍龍730(Adreno618)集成的都是Adreno61x系列GPU,麒麟990和Exynos 980集成的也都是Mali-G76 GPU,但它們兩兩之間的3D性能卻不可同日而語。

DIY用戶都知道,PC領(lǐng)域的獨立顯卡會根據(jù)不同數(shù)量的“流處理器”來劃分檔次。

手機SoC內(nèi)的GPU也是如此,只是這里的“流處理器”叫法不同,高通AdrenoGPU稱做“ALUs”,ARM Mali GPU則叫“Shader Core”,我們習慣將它們統(tǒng)稱為“計算單元”。

還是以麒麟990和Exynos 980為例,前者為Mali-G76 GPU搭配了16個計算單元,即Mali-G76MP16,而后者的計算單元數(shù)量只有5個,即Mali-G76MP5,所以麒麟990的3D性能至少2倍~3倍于Exynos 980。

圖形接口

在3D游戲的開發(fā)中,API圖形接口越先進,GPU的執(zhí)行效率越高。

如果手機GPU恰好支持這種API,就能最大限度避免“負優(yōu)化”,還有機會實現(xiàn)“越級挑戰(zhàn)”。

手機SoC GPU所支持的API主要以O(shè)penCL、OpenGL、Vulkan和DirectX為主,目前它們最新的版本分別為OpenCL2.0FP、OpenGLES3.2、Vulkan1.1和DX12,很多最新的GPU加入了多神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化,可配合NPU單元進一步加速AI運算。

從2018年底開始很多中端手機玩《王者榮耀》也能啟動60FPS模式并比同時期的旗艦級還要流暢,就是因為該游戲推出了VulkanAPI的優(yōu)化版,可以進一步釋放新款GPU的全部潛力。

運行頻率

和CPU一樣,GPU的強弱除了架構(gòu)之外,也受到運行頻率的牽制。聯(lián)發(fā)科Helio G90、驍龍730和驍龍765是最具代表性的SoC,它們都存在一個后綴帶“G”的型號,通過提升CPU和GPU的頻率獲得了更強的性能(表2)。

如果你只關(guān)注絕對性能,看到這里就能告一段落了。

當我們看到一款陌生的SoC時,可以先看制程工藝,如果它能采用7nm或7nm+EUV就代表它具備更加節(jié)能省電的特性。

然后看CPU架構(gòu)和主頻,Cortex-A77和Kryo 500核心代表著當前架構(gòu)的最強音,當CPU主頻高于2.6GHz那它就具備旗艦級的CPU性能,如果低于2.4GHz就是中等偏上。

如果你喜歡玩游戲,就需要看它的GPU是Mali-G7x還是Mali-G5x,并數(shù)一下計算單元的數(shù)量,多多益善。

然而,手機并不僅限于跑分和玩游戲,在追求更強性能之余,它在日常應用環(huán)境下的表現(xiàn),往往要比絕對的性能更加重要。比如,基帶、DSP、ISP等單元,如果你對它們的作用感興趣,請關(guān)注CFan的后續(xù)報道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10854

    瀏覽量

    211574
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4161

    瀏覽量

    218160
  • 指令集
    +關(guān)注

    關(guān)注

    0

    文章

    222

    瀏覽量

    23378
  • 驍龍865
    +關(guān)注

    關(guān)注

    0

    文章

    174

    瀏覽量

    12472
收藏 人收藏

    評論

    相關(guān)推薦

    簡單認識第二代高通Oryon CPU

    在不久前的2024峰會上,備受矚目的新一代旗艦移動平臺——8至尊版正式發(fā)布。這款以“
    的頭像 發(fā)表于 11-13 09:43 ?293次閱讀

    8至尊版性能實測:自研Oryon?CPU實現(xiàn)45%性能與能效提升

    現(xiàn)在高通新一代旗艦移動平臺——8至尊版(8?Elite)已經(jīng)發(fā)布,作為首款集成高通定制Oryon?CPU的旗艦移動平臺,其
    的頭像 發(fā)表于 10-25 10:01 ?609次閱讀
    <b class='flag-5'>驍</b><b class='flag-5'>龍</b>8至尊版性能實測:自研Oryon?<b class='flag-5'>CPU</b>實現(xiàn)45%性能與能效提升

    峰會亮點:自研Oryon CPU首次同時登陸手機、汽車

    10月22日,高通舉行了2024峰會,正式推出了全新旗艦移動平臺——8至尊版。 不只是全新命名那么簡單,
    的頭像 發(fā)表于 10-25 09:55 ?232次閱讀
    <b class='flag-5'>驍</b><b class='flag-5'>龍</b>峰會亮點:自研Oryon <b class='flag-5'>CPU</b>首次同時登陸手機、汽車

    8至尊版發(fā)布,自研第二代Oryon CPU登陸手機

    北京時間10月22日凌晨,2024峰會上,高通正式發(fā)布新一代旗艦移動平臺——8至尊版
    的頭像 發(fā)表于 10-24 18:22 ?535次閱讀
    <b class='flag-5'>驍</b><b class='flag-5'>龍</b>8至尊版發(fā)布,自研第二代Oryon <b class='flag-5'>CPU</b>登陸手機

    高通汽車新方案:CPU性能躍升3倍,AI性能狂飆12倍

    。   據(jù)了解,座艙至尊版平臺作為8295的升級版,被命名為Elite。該平臺搭載了高通專為汽車行業(yè)設(shè)計的自研Oryon CPU
    的頭像 發(fā)表于 10-23 14:50 ?553次閱讀

    高通推出8至尊版,集成全球最快的移動端CPU

    10月21日,在美國夏威夷高通峰會期間,高通技術(shù)公司推出了8至尊版移動平臺,這是迄今為止高通最強大且全球速度最快的移動端系統(tǒng)級芯片。
    的頭像 發(fā)表于 10-22 14:40 ?1552次閱讀
    高通推出<b class='flag-5'>驍</b><b class='flag-5'>龍</b>8至尊版,集成全球最快的移動端<b class='flag-5'>CPU</b>

    高通X Elite平臺:AI能力引領(lǐng)未來,預訓練模型助力開發(fā)者

    上,而對傳統(tǒng)的CPUGPU的介紹則顯得相對簡潔。這一策略背后,是高通對于未來計算領(lǐng)域發(fā)展趨勢的深刻洞察和對AI技術(shù)的堅定信心。
    的頭像 發(fā)表于 06-24 17:08 ?648次閱讀

    小天才Z10旗艦新品發(fā)布,搭載W5可穿戴平臺

    作為小天才本年度的頂級產(chǎn)品,Z10 的核心技術(shù)是先進的 W5 可穿戴平臺。該平臺采用行業(yè)領(lǐng)先的 4 納米制程工藝,配備 Cortex-A53 CPU 與 Adreno 702
    的頭像 發(fā)表于 05-24 17:50 ?2209次閱讀

    CPU渲染和GPU渲染優(yōu)劣分析

    使用計算機進行渲染時,有兩種流行的系統(tǒng):基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計算機的CPU來執(zhí)行場景并將其渲染到接近完美。這也是執(zhí)行渲染的更傳統(tǒng)方式。
    的頭像 發(fā)表于 05-23 08:27 ?588次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    高通推出全新X Plus平臺

    近日,高通技術(shù)公司推出了全新的?X Plus平臺,進一步拓展了其領(lǐng)先的X系列產(chǎn)品組合。這款平臺采用了前沿的高通Oryon?
    的頭像 發(fā)表于 05-06 14:18 ?447次閱讀

    AI服務(wù)器異構(gòu)計算深度解讀

    AI服務(wù)器按芯片類型可分為CPU+GPUCPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內(nèi)的主要選擇(占比91.9%)。
    發(fā)表于 04-12 12:27 ?606次閱讀
    AI服務(wù)器異構(gòu)計算深度解讀

    高通重磅發(fā)布第三代7+,引領(lǐng)AI與性能新紀元

    近日,科技界掀起一陣狂潮,高通技術(shù)公司盛大發(fā)布第三代7+移動平臺,此舉不僅將終端側(cè)生成式AI技術(shù)首次引入
    的頭像 發(fā)表于 03-25 09:46 ?1412次閱讀

    X Elite芯片在Geekbench亮相,性能領(lǐng)先蘋果M2 Max

    回顧2023年高通峰會,高通首次發(fā)布專為PC設(shè)計的新一代X性能平臺,其中最高端版本定名“X Elite”。
    的頭像 發(fā)表于 02-25 15:05 ?697次閱讀

    gpu是什么和cpu的區(qū)別

    GPUCPU是兩種常見的計算機處理器,它們在結(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU的區(qū)別,并詳細介紹它們的原理、應用領(lǐng)域和性能特點。 一、概述 1.1
    的頭像 發(fā)表于 02-20 11:24 ?1.9w次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項任務(wù)。這是因為GPU的架構(gòu)使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2392次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?
    RM新时代网站-首页