近日,ARM正式宣布推出ARMv9架構(gòu)。據(jù)ARM官方稱,這是10年來最重要的創(chuàng)新,是未來3000億ARM芯片的基礎(chǔ)。
與上一代的ARMv8相比,ARMv9處理器將不再局限于移動(dòng)/嵌入式市場(chǎng),而是擴(kuò)展到PC、HPC高性能計(jì)算、深度學(xué)習(xí)等新市場(chǎng),以滿足全球?qū)δ苋找鎻?qiáng)大的安全、人工智能和專用處理的需求。
ARMv9架構(gòu)的發(fā)布,會(huì)對(duì)CPU市場(chǎng)帶來什么樣的影響?對(duì)于中國(guó)而言,是否能夠解“缺芯”之急呢?
ARMv9的三大亮點(diǎn)
2011年10月,ARM首次發(fā)布ARMv8架構(gòu),十年后的今天,ARMv9立足于ARMv8的成功基礎(chǔ),將成為擔(dān)綱未來十年的主流計(jì)算架構(gòu)。那么,它和ARMv8架構(gòu)相比有哪些不同呢?
據(jù)ARM高級(jí)副總裁、首席架構(gòu)師兼技術(shù)院士Richard Grisenthwaite介紹,ARMv9繼續(xù)使用AArch64作為基準(zhǔn)指令集,但是在其功能上增加了一些非常重要的擴(kuò)展。
他指出ARMv9有三個(gè)主要支柱,即:安全性、AI(機(jī)器學(xué)習(xí))以及改進(jìn)的矢量和DSP功能。
亮點(diǎn)一:安全
為了解決當(dāng)今最大的技術(shù)挑戰(zhàn)——保護(hù)全球數(shù)據(jù)安全,ARMv9架構(gòu)路線圖引入了ARM機(jī)密計(jì)算架構(gòu)(Confidential Compute Architecture, CCA)。
機(jī)密計(jì)算通過打造基于硬件的安全運(yùn)行環(huán)境來執(zhí)行計(jì)算,保護(hù)部分代碼和數(shù)據(jù),免于被存取或修改,甚至不受特權(quán)軟件的影響。
例如,在ARM TrustZone的基礎(chǔ)上,可以將個(gè)人銀行信息與智能手機(jī)的社交媒體應(yīng)用完全分離。ARM CCA的新安全功能意味著,即使社交媒體應(yīng)用真的感染了惡意軟件,也不會(huì)傳播設(shè)備其他部分。
ARM CCA還引入動(dòng)態(tài)創(chuàng)建機(jī)密領(lǐng)域(Realms)的概念,機(jī)密領(lǐng)域面向所有應(yīng)用,運(yùn)行在獨(dú)立于安全或非安全環(huán)境之外的環(huán)境中,以實(shí)現(xiàn)保護(hù)數(shù)據(jù)安全的目的。
例如,在商業(yè)應(yīng)用中,機(jī)密領(lǐng)域可以保護(hù)系統(tǒng)中商用機(jī)密數(shù)據(jù)和代碼,無論它們正被使用、閑置或正在傳輸中。在云中,這也意味著保護(hù)物理CPU以及運(yùn)行在第三方代碼旁邊的虛擬化處理器。
此外,ARM持續(xù)與谷歌合作開發(fā)的內(nèi)存標(biāo)簽擴(kuò)展(MTE)技術(shù),將成為第一代基于ARMv9-A處理器的一個(gè)組成部分。
過去30年中,許多廣為人知的數(shù)據(jù)安全漏洞,都是利用計(jì)算機(jī)如何存儲(chǔ)和調(diào)用內(nèi)存中的數(shù)據(jù)的漏洞造成的。如果黑客知道一串重要數(shù)據(jù)的位置,他們就可以用惡意代碼覆蓋它。
MTE使開發(fā)人員能夠使用“標(biāo)簽”鎖定數(shù)據(jù)串。然后,只有使用正確的密鑰才能訪問該數(shù)據(jù),該密鑰由“指針”(負(fù)責(zé)從內(nèi)存中調(diào)用數(shù)據(jù)的代碼)持有。實(shí)現(xiàn)鎖和密鑰訪問是一個(gè)巨大的步驟,不僅可以確保數(shù)據(jù)的安全,而且還可以保證數(shù)據(jù)的安全。
亮點(diǎn)二:針對(duì)AI機(jī)器學(xué)習(xí)的優(yōu)化
機(jī)器學(xué)習(xí)是ARMv9的重要組成部分,ARM認(rèn)為在未來幾年中,越來越多的機(jī)器學(xué)習(xí)工作負(fù)載將變得司空見慣。
為了滿足這一需求,ARM與富士通合作開發(fā)了可伸縮矢量擴(kuò)展(Scalable Vector Extension, SVE)技術(shù),并驅(qū)動(dòng)了世界上最快的超級(jí)計(jì)算機(jī)“富岳”。在此基礎(chǔ)上,ARM為ARMv9開發(fā)了SVE2,以便在更廣泛的應(yīng)用中實(shí)現(xiàn)增強(qiáng)的機(jī)器學(xué)習(xí)和數(shù)字信號(hào)處理能力。
除了增加的各種現(xiàn)代SIMD功能外,SVE和SVE2的優(yōu)勢(shì)還在于其可變的向量大小,范圍覆蓋了128b到2048b,讓其無論在什么硬件運(yùn)行,都允許向量的可變粒度為128b。
如果純粹從向量處理和編程的角度來看,這意味著軟件開發(fā)人員將只需要編譯一次其代碼,并且如果將來某個(gè)CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個(gè)寬度。
同樣,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的保守設(shè)計(jì)上運(yùn)行,這對(duì)于ARM設(shè)計(jì)從物聯(lián)網(wǎng)、移動(dòng)到數(shù)據(jù)中心的CPU而言至關(guān)重要。在保留ARM體系結(jié)構(gòu)的32b編碼空間的同時(shí),它還可以完成所有這些工作。然而,類似X86這樣的架構(gòu),則需要根據(jù)矢量尺寸增加新的指令和擴(kuò)展。
SVE2增強(qiáng)了對(duì)在CPU上本地運(yùn)行的5G系統(tǒng)、虛擬和增強(qiáng)現(xiàn)實(shí)以及機(jī)器學(xué)習(xí)工作負(fù)載的處理能力,如:圖像處理和智能家居應(yīng)用。
未來幾年,ARM將進(jìn)一步擴(kuò)展其技術(shù)的AI能力,除了在其Mali GPU和Ethos NPU中持續(xù)進(jìn)行AI創(chuàng)新外,還將大幅增強(qiáng)CPU內(nèi)的矩陣乘法。
亮點(diǎn)三:通過系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)性能最大化
在過去的五年,ARM技術(shù)每年都以超過業(yè)界的速度提升CPU性能。ARM在新一代架構(gòu)ARMv9上將保持這個(gè)速度,預(yù)計(jì)未來兩代移動(dòng)和基礎(chǔ)設(shè)施CPU的性能提升將超過30%。
據(jù)ARM官方稱,這個(gè)數(shù)據(jù)是根據(jù)業(yè)界標(biāo)準(zhǔn)評(píng)測(cè)工具來衡量,30%的算力提升完全是憑借于本身架構(gòu),而不是借助于制程工藝來實(shí)現(xiàn)的。
然而,隨著行業(yè)從通用計(jì)算向普遍的專用處理發(fā)展,每年兩位數(shù)的CPU性能提升是不夠的。除了增強(qiáng)專用處理能力,ARM的全面計(jì)算(Total Compute)設(shè)計(jì)方法,將通過集中的系統(tǒng)級(jí)硬件和軟件優(yōu)化以及用例性能的提高,加速總體計(jì)算性能。
通過將全面計(jì)算的設(shè)計(jì)原則應(yīng)用在包含汽車、客戶端、基礎(chǔ)設(shè)施和物聯(lián)網(wǎng)解決方案的整個(gè)IP組合中,ARMv9系統(tǒng)級(jí)技術(shù)將遍及整個(gè)IP解決方案,并改善個(gè)別IP。
此外,ARM還在開發(fā)多項(xiàng)技術(shù)以提高頻率、帶寬、緩存,并降低內(nèi)存延遲,從而最大限度地提升基于ARMv9的CPU性能。
ARM欲打破x86壟斷
目前,CPU領(lǐng)域最成功的架構(gòu)當(dāng)屬x86,不過x86的成功和統(tǒng)治力在于PC和高性能計(jì)算市場(chǎng),在ARM擅長(zhǎng)的智能終端市場(chǎng)并不成功。
近幾年,ARM架構(gòu)在高性能計(jì)算領(lǐng)域取得了一些進(jìn)展,包括上面提到的“富岳”超級(jí)計(jì)算機(jī),以及推出采用ARM架構(gòu)的多款服務(wù)器。
去年,蘋果基于ARM架構(gòu)推出M1處理器,并成功應(yīng)用在Macbook Pro電腦上。此外,高通、微軟也在布局基于ARM架構(gòu)的電腦處理器和系統(tǒng)。這一系列的舉動(dòng),都讓業(yè)界看到了x86架構(gòu)在PC市場(chǎng)的統(tǒng)治地位并非牢不可破。
ARM首席執(zhí)行官Simon Segars說,“ARM芯片實(shí)現(xiàn)1000億顆的出貨花了26年,如果預(yù)測(cè)準(zhǔn)確,接下來一年,我們的合作伙伴出貨的ARM芯片將累計(jì)達(dá)到2000億顆。也就是說,我們的第二個(gè)1000億的出貨將在短短5年內(nèi)達(dá)成?!?/p>
據(jù)媒體報(bào)道,目前ARM架構(gòu)的芯片出貨已經(jīng)超過1800億顆,ARMv9架構(gòu)會(huì)成為實(shí)現(xiàn)ARM芯片3000億顆芯片出貨的先驅(qū)。
沒有人能準(zhǔn)確預(yù)估ARM實(shí)現(xiàn)第三個(gè)1000億顆芯片出貨的時(shí)間,但可以明確的是,ARM希望其芯片能夠?yàn)樗兄悄苡?jì)算提供算力,也就是讓其芯片在未來無處不在。
現(xiàn)在看來,在復(fù)雜的國(guó)際形勢(shì)下,同屬精簡(jiǎn)指令集的RISC-V正在快速發(fā)展,加上x86陣營(yíng)Intel和AMD也在加強(qiáng)x86的競(jìng)爭(zhēng)力,ARM要真正撼動(dòng)x86的優(yōu)勢(shì)領(lǐng)域并非易事。
華為能否獲得ARMv9授權(quán)?
不過,相比于ARMv9到底更新了哪些功能,國(guó)內(nèi)關(guān)注更多的還是華為能否獲得ARMv9的授權(quán)。
據(jù)悉,華為自主研發(fā)的海思芯片就是基于ARM架構(gòu)設(shè)計(jì)的。在美國(guó)出臺(tái)芯片禁令之時(shí),華為方面表示,已經(jīng)獲得了ARMv8架構(gòu)授權(quán),可以自主設(shè)計(jì)處理器,并掌握到核心技術(shù)。
雖然華為掌握著ARMv8架構(gòu),但沒有最新構(gòu)架的支持,華為也將陷入停滯不前的狀態(tài)。
對(duì)于ARMv9是否以供給包括華為在內(nèi)的中國(guó)企業(yè)的問題,ARM的官方回復(fù)是:
“ARM既有源于美國(guó)的IP,也有非源于美國(guó)的IP。經(jīng)過全面的審查,ARM確定其ARMv9架構(gòu)不受美國(guó)出口管理?xiàng)l例(EAR)的約束。ARM已將此通知美國(guó)政府相關(guān)部門,我們將繼續(xù)遵守美國(guó)商務(wù)部針對(duì)華為及其附屬公司海思的指導(dǎo)方針?!?/p>
細(xì)品這番發(fā)言,ARM的態(tài)度實(shí)在是模棱兩可:
ARM官方?jīng)]有說任何關(guān)于ARMv9可以授權(quán)給華為的事情。
第二,從ARM官網(wǎng)上可以看到,谷歌、英偉達(dá)、高通、小米、OPPO、VIVO、聯(lián)發(fā)科、臺(tái)積電都是ARM的合作伙伴,但是華為卻不見蹤影,可見這件事背后,還是有一些隱情。
換句話說,華為能否得到ARMv9的授權(quán),其實(shí)還是一個(gè)未知數(shù)。
另一方面,即使華為得到v9的授權(quán),但芯片制造依然是一個(gè)大問題。
同時(shí),國(guó)內(nèi)業(yè)界也在擔(dān)憂,在ARM新架構(gòu)之下,快速進(jìn)軍PC和服務(wù)器業(yè)務(wù),這會(huì)對(duì)我國(guó)硬件國(guó)產(chǎn)化以及系統(tǒng)國(guó)產(chǎn)化帶來更大壓力。
? ? ? 責(zé)任編輯:tzh
評(píng)論
查看更多