半導(dǎo)體工藝技術(shù)創(chuàng)新長期以來的持續(xù)發(fā)展趨勢(shì)正在減緩。經(jīng)過幾十年對(duì)摩爾定律的顯著遵從性,即半導(dǎo)體晶圓上的晶體管密度大約每兩年翻一倍,但是在過去幾年中,晶體管的擴(kuò)展速度明顯放緩,與摩爾定律預(yù)測(cè)相比慢了大約十倍。登納德縮放定律(Dennard Scaling)預(yù)測(cè)隨著晶體管密度的增加,每單位芯片面積的功耗保持不變,但實(shí)際上也失效了,導(dǎo)致大型數(shù)據(jù)中心和其它高性能計(jì)算環(huán)境需要更復(fù)雜的冷卻解決方案。
01.對(duì)半導(dǎo)體工藝創(chuàng)新放緩的架構(gòu)應(yīng)對(duì)
面對(duì)半導(dǎo)體工藝創(chuàng)新的減速,著名計(jì)算機(jī)架構(gòu)師John Hennessy和David Patterson在2018年的圖靈演講中提出,工藝技術(shù)創(chuàng)新的減緩將逐漸增加對(duì)架構(gòu)創(chuàng)新的動(dòng)力——即設(shè)計(jì)集成電路以執(zhí)行計(jì)算任務(wù)的方式。他們認(rèn)為通用計(jì)算架構(gòu)(例如CPU)的固有低效性將開始向(或被)為特定計(jì)算任務(wù)優(yōu)化的架構(gòu)所取代或補(bǔ)充,這種架構(gòu)也被稱為專用域架構(gòu)(Domain-Specific Architectures,DSA)。
與此同時(shí),隨著計(jì)算和數(shù)字化技術(shù)廣泛應(yīng)用于云計(jì)算(AI和高性能計(jì)算)、網(wǎng)絡(luò)、邊緣計(jì)算、物聯(lián)網(wǎng)和自動(dòng)駕駛等各個(gè)應(yīng)用領(lǐng)域,高度專用域計(jì)算工作負(fù)載正在擴(kuò)展,這為DSA提供了提供有意義的性能優(yōu)勢(shì)的機(jī)會(huì)。大型語言模型(Large Language Model,LLM)作為生成式AI的核心引擎,通過ChatGPT等應(yīng)用在AI工作負(fù)載中提供進(jìn)一步的專業(yè)化,并可能導(dǎo)致進(jìn)一步的硬件專業(yè)化。
針對(duì)專用域架構(gòu)(DSA),即為特定應(yīng)用領(lǐng)域開發(fā)的硬件和軟件,商業(yè)潛力是巨大的。例如,GPU和張量處理單元(Tensor Processing Units,TPU)已經(jīng)在數(shù)據(jù)中心獲得了顯著的市場份額,在AI工作負(fù)載(學(xué)習(xí)和推理)等受益于高并行度的工作負(fù)載中,他們的性能超過了CPU。性能提升可能非常顯著,工作負(fù)載特定的加速通常為15到50倍。在汽車領(lǐng)域,一些領(lǐng)先供應(yīng)商提供定制解決方案,提供所需的低延遲、高性能推理,以安全地支持日益增長的自動(dòng)駕駛水平。
隨著DSA擴(kuò)展到其它應(yīng)用領(lǐng)域,我們預(yù)計(jì)到2026年,DSA的收入將達(dá)到約900億美元(全球半導(dǎo)體市場的約10%到15%),而2022年的收入約為400億美元。因此,我們看到了對(duì)專用域設(shè)計(jì)初創(chuàng)公司的風(fēng)險(xiǎn)投資流入顯著增加。在過去十年中,已累計(jì)有約150家初創(chuàng)企業(yè)獲得了180億美元的資金支持,而在之前的十年里,硬件投資被忽視,更多地偏向于軟件。
半導(dǎo)體產(chǎn)業(yè)鏈中的企業(yè)、計(jì)算系統(tǒng)制造商以及計(jì)算解決方案的最終用戶應(yīng)該做好準(zhǔn)備,充分利用這一趨勢(shì),而不是措手不及。02.支持DSA商業(yè)可行性的關(guān)鍵因素正逐漸成熟以往,除了受益于摩爾定律的巨大助力外,CPU還受益于大規(guī)模經(jīng)濟(jì)效益,以抵消競爭專用域芯片(Domain-Specific Chip)的理論優(yōu)勢(shì)。專用域芯片由于其特異性而面臨較小的需求量,并可能需要專門的軟件才能高效部署。芯片越昂貴(由芯片尺寸、復(fù)雜性和工藝技術(shù)節(jié)點(diǎn)決定),應(yīng)用領(lǐng)域就需要更大規(guī)模的需求來證明采用專用域架構(gòu)的必要性。推動(dòng)專用域架構(gòu)的顛覆潛力的是以下五個(gè)重要因素,他們正在共同努力縮小通用目的和專用域設(shè)計(jì)之間的經(jīng)濟(jì)差距:
1.通過晶圓代工廠獲得成熟和領(lǐng)先的半導(dǎo)體技術(shù)制造能力
晶圓代工廠——專注于半導(dǎo)體制造服務(wù)的公司——已經(jīng)在全球半導(dǎo)體制造中占據(jù)越來越大的份額,因?yàn)樗麄兛梢詤R聚需求并實(shí)現(xiàn)規(guī)模效益,以抵消生產(chǎn)現(xiàn)代半導(dǎo)體的不斷上升的成本。(領(lǐng)先半導(dǎo)體制造廠或稱“晶圓廠”的成本超過100億美元。)晶圓代工廠不僅在不同技術(shù)節(jié)點(diǎn)上穩(wěn)步獲得制造市場份額,而且他們還提供了采用最先進(jìn)技術(shù)節(jié)點(diǎn)的機(jī)會(huì),這是過去一直由集成器件制造商掌握的優(yōu)勢(shì)。因此,任何一家擁有針對(duì)專用域設(shè)計(jì)的優(yōu)越想法的初創(chuàng)企業(yè)都可以迅速獲得最先進(jìn)的制造能力,無需投資一分錢在制造能力上。
2.通過成熟的云平臺(tái)快速進(jìn)入市場
專門針對(duì)企業(yè)、AI或HPC工作負(fù)載的卓越DSA供應(yīng)商不一定需要開發(fā)自己的進(jìn)入市場的基礎(chǔ)設(shè)施。他們可以依賴成熟的云服務(wù)提供商(CSP)生態(tài)系統(tǒng),這些CSP提供計(jì)算作為一種服務(wù)。如果他們能向CSP和其客戶群體證明他們的DSA在特定工作負(fù)載下提供了卓越的計(jì)算性能(按照性價(jià)比和每瓦計(jì)算性能),那么他們的硬件解決方案可以被集成到CSP數(shù)據(jù)中心基礎(chǔ)設(shè)施中,并作為硬件服務(wù)提供給計(jì)算周期的最終用戶。
3.豐富的開源和許可知識(shí)產(chǎn)權(quán)(IP)庫用于加速DSA設(shè)計(jì)
盡管專用域架構(gòu)(DSA)按定義是為專用域工作負(fù)載而設(shè)計(jì)的,但這并不意味著DSA設(shè)計(jì)者在設(shè)計(jì)電路時(shí)必須從零開始??稍S可的指令集架構(gòu)(Instruction Set Architectures,ISA),如Arm和x86,以及開源ISA(例如RISC-V),使芯片設(shè)計(jì)變得民主化,并提供了豐富的構(gòu)建模塊和即用型設(shè)計(jì)組件。他們還允許訪問相應(yīng)的編譯器和應(yīng)用級(jí)軟件解決方案生態(tài)系統(tǒng)。選擇這些不同生態(tài)系統(tǒng)作為基礎(chǔ)將在軟件堆棧成熟度、成本和專用域硬件性能之間進(jìn)行權(quán)衡。
4.支持DSA芯片片上異構(gòu)集成的2D和3D芯片封裝的進(jìn)展
越來越多的領(lǐng)先計(jì)算設(shè)備不再由單一芯片組成。隨著高性能芯片變得越來越大,工藝技術(shù)變得更昂貴且更難以實(shí)現(xiàn)高工藝產(chǎn)量,領(lǐng)先廠商采取了一種分散策略,構(gòu)建芯片片而不是單個(gè)大型單片。這些芯片片可能在自己的工藝技術(shù)上進(jìn)行優(yōu)化,并用于自己的功能,然后在先進(jìn)的封裝中進(jìn)行集成。過去芯片封裝只包含一個(gè)芯片,而先進(jìn)封裝允許在單個(gè)封裝中以2D甚至3D的形式對(duì)數(shù)十個(gè)芯片進(jìn)行異構(gòu)集成。這種技術(shù)趨勢(shì)對(duì)專注于DSA芯片片的企業(yè)非常有利,因?yàn)檫@些芯片片現(xiàn)在可以集成到先進(jìn)封裝中,從而實(shí)現(xiàn)與其它計(jì)算、通信、存儲(chǔ)和模擬組件之間的高帶寬和低延遲連接。
5.物理層創(chuàng)新推動(dòng)新型DSA的發(fā)展
對(duì)于物理計(jì)算層面而言,CMOS之外的選擇,例如光子學(xué)、神經(jīng)形態(tài)和量子架構(gòu),有望為專用域計(jì)算需求提供特定優(yōu)勢(shì),如能源效率、可塑性、特定任務(wù)速度和特定NP難問題的線性縮放。隨著這些物理層解決方案的成熟,將會(huì)開辟新的DSA類別。
03.為了充分發(fā)揮DSA的價(jià)值
需要在技術(shù)堆棧的各個(gè)方面進(jìn)行進(jìn)一步的創(chuàng)新
從技術(shù)堆棧的各個(gè)層面,從物理層到應(yīng)用級(jí)工作負(fù)載管理,需要進(jìn)一步的創(chuàng)新來推動(dòng)DSA的可行性和商業(yè)成功。
在物理和電路層面,開源生態(tài)系統(tǒng)(例如Arm和RISC-V)需要進(jìn)一步發(fā)展,以在這些構(gòu)建模塊上支持完整的DSA軟件堆棧。沒有高效的軟件堆棧,許多硬件級(jí)性能優(yōu)勢(shì)將無法轉(zhuǎn)化為實(shí)際的工作負(fù)載加速。
在系統(tǒng)級(jí)封裝(System-in-Package,SiP)層面,需要標(biāo)準(zhǔn)化芯片片間接口,以實(shí)現(xiàn)DSA的經(jīng)濟(jì)和普遍集成。行業(yè)聯(lián)盟(如Universal Chiplet Interconnect Express,UCIe)已經(jīng)開始形成,以定義這些標(biāo)準(zhǔn)。此外,在美國,CHIPS法案和DARPA(國防高級(jí)研究計(jì)劃局)認(rèn)識(shí)到實(shí)現(xiàn)先進(jìn)封裝的協(xié)同開發(fā)平臺(tái)是一個(gè)重要的投資領(lǐng)域,并通過激勵(lì)措施來促進(jìn)其發(fā)展。
在操作系統(tǒng)和編譯器層面,更高級(jí)的編譯器需要有效地考慮單個(gè)封裝中可能存在多個(gè)指令集架構(gòu)(ISA)的潛在共存。
在數(shù)據(jù)中心層面,需要先進(jìn)的虛擬化程序和編排器來優(yōu)化地協(xié)調(diào)不同DSA計(jì)算實(shí)例中的工作負(fù)載容器,并在整個(gè)數(shù)據(jù)中心內(nèi)平衡利用率,以向最終客戶的應(yīng)用程序提供DSA級(jí)別的優(yōu)勢(shì)。此外,云服務(wù)提供商將開發(fā)工具來支持他們的最終客戶了解硬件實(shí)例的最佳配置,以滿足其特定的計(jì)算需求,避免計(jì)算資源的低效部署。
04.半導(dǎo)體價(jià)值鏈上的企業(yè)和最終用戶
應(yīng)該為DSA驅(qū)動(dòng)的顛覆做好準(zhǔn)備
DSA可能會(huì)在整個(gè)半導(dǎo)體價(jià)值鏈上激活顛覆。以下是為其做好準(zhǔn)備的方法:
半導(dǎo)體企業(yè):為價(jià)值鏈顛覆做好準(zhǔn)備
材料供應(yīng)商應(yīng)該了解先進(jìn)封裝技術(shù)的影響(例如,對(duì)2D和3D集成的基礎(chǔ)構(gòu)成形成的新型基板材料的需求,以及對(duì)當(dāng)前基板材料的熱機(jī)械穩(wěn)定性的需求),以及新的物理層范式對(duì)前端和后端材料流的影響。
前端工具制造商將希望參與支持DSA集成的先進(jìn)封裝和異構(gòu)集成熱潮,這將需要與前端制造類似的精確定義和對(duì)齊。
晶圓代工廠將需要準(zhǔn)備迎接對(duì)較小批量和更多專用域芯片和Chiplet的需求,并找到有效和經(jīng)濟(jì)地支持較小玩家的方式。此外,對(duì)非先進(jìn)封裝和新物理層解決方案(如光子學(xué))的支持將變得越來越重要,因?yàn)楣δ軐⒈徊鸱譃槿蝿?wù)優(yōu)化的Chiplet。
芯片設(shè)計(jì)公司需要擁有能夠全面考慮專用域工作負(fù)載性能的人才,從門級(jí)布局和硬件架構(gòu)設(shè)計(jì)選擇到軟件堆棧和工作負(fù)載管理,以充分利用DSA的架構(gòu)優(yōu)化。
電子設(shè)計(jì)自動(dòng)化(EDA)和硬件IP公司需要應(yīng)對(duì)兩個(gè)挑戰(zhàn)。首先是如何調(diào)整他們的商業(yè)模式,以支持可能沒有足夠財(cái)力購買昂貴前期許可證的較小DSA顛覆者。其次是如何將他們的IP、設(shè)計(jì)和仿真套件從芯片級(jí)擴(kuò)展到SiP級(jí),以支持在多個(gè)Chiplet和ISA之間進(jìn)行系統(tǒng)級(jí)、多物理學(xué)(邏輯、電氣、熱學(xué)、光學(xué)和機(jī)械學(xué))EDA,同時(shí)實(shí)現(xiàn)以前僅在芯片級(jí)別見到的帶寬和延遲。
計(jì)算消費(fèi)者:使用優(yōu)化的DSA,并投資于專業(yè)知識(shí),充分發(fā)揮其優(yōu)勢(shì)
云服務(wù)提供商(CSP)已經(jīng)認(rèn)識(shí)到工作負(fù)載特定的芯片架構(gòu)的價(jià)值,這一點(diǎn)可以通過他們?cè)絹碓蕉嗟夭捎肎PU以及推出面向數(shù)據(jù)中心硬件實(shí)例的自主芯片設(shè)計(jì)得到證明。隨著設(shè)計(jì)初創(chuàng)企業(yè)繼續(xù)針對(duì)AI和高性能計(jì)算等應(yīng)用案例的工作負(fù)載特異性,CSP將希望密切關(guān)注新興的成功者,以便可能支持并推動(dòng)他們擴(kuò)展規(guī)模。
企業(yè)客戶需要了解DSA在其特定工作負(fù)載中的優(yōu)勢(shì)。將計(jì)算基礎(chǔ)設(shè)施移入公有云的好處將會(huì)不斷增加,因?yàn)镃SP可以大規(guī)模提供DSA的訪問,通過聚合對(duì)專門硬件實(shí)例的需求并高效管理工作負(fù)載的部署。然而,企業(yè)應(yīng)該掌握或保留如何最好地利用這些硬件實(shí)例的專業(yè)知識(shí),要深入了解如何優(yōu)化特定的工作負(fù)載和云硬件實(shí)例配置,以提供最大的總擁有成本優(yōu)勢(shì)。
專用域的原始設(shè)備制造商(如物聯(lián)網(wǎng)和邊緣設(shè)備制造商、網(wǎng)絡(luò)設(shè)備供應(yīng)商、汽車制造商和區(qū)塊鏈平臺(tái))將希望深入了解其專用域的計(jì)算需求和工作負(fù)載的發(fā)展,而不是依賴于通用計(jì)算進(jìn)展。他們還希望熟悉存在的架構(gòu)選項(xiàng),以滿足芯片設(shè)計(jì)方面的能源、成本、占地面積和性能需求。這可能需要他們超越傳統(tǒng)的供應(yīng)鏈結(jié)構(gòu):例如,汽車原始設(shè)備制造商可能需要直接尋找和與DSA初創(chuàng)企業(yè)合作,而不是依賴于一、二級(jí)供應(yīng)商來獲取所有最新的洞察。
摩爾定律推動(dòng)了計(jì)算行業(yè)的持久發(fā)展,在通用計(jì)算方面帶來了數(shù)十年的性能提升,大大減少了對(duì)工作負(fù)載特異性投資的需求。隨著晶體管密度增長放緩,DSA將越來越多地獲得專用域的性能優(yōu)勢(shì),并對(duì)價(jià)值鏈參與者及其客戶帶來重大顛覆。
責(zé)任編輯:彭菁
-
芯片
+關(guān)注
關(guān)注
455文章
50714瀏覽量
423131 -
半導(dǎo)體
+關(guān)注
關(guān)注
334文章
27286瀏覽量
218062 -
晶圓
+關(guān)注
關(guān)注
52文章
4890瀏覽量
127931 -
DSA
+關(guān)注
關(guān)注
0文章
48瀏覽量
15145 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
818瀏覽量
38908
原文標(biāo)題:專用域架構(gòu)(DSA)與計(jì)算的未來
文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論