在之前舉辦的Computex上,AMD發(fā)布了其實(shí)驗(yàn)性的產(chǎn)品,即基于3D Chiplet技術(shù)的3D V-Cache。該技術(shù)使用臺(tái)積電的3D Fabric先進(jìn)封裝技術(shù),成功地將包含有64MB L3 Cache的chiplet以3D堆疊的形式與處理器封裝在了一起。
在AMD展示的概念芯片中,處理器芯片是Ryzen 5000,其原本的處理器Chiplet中就帶有32 MB L3 Cache,而在和64 MB的3D V-Cache做3D封裝后,每個(gè)Ryzen 5000 Chiplet可以訪(fǎng)問(wèn)總共96 MB的L3 Cache。而在每個(gè)包含多個(gè)Ryzen 5000 Chiplet的處理器中,則最多可以訪(fǎng)問(wèn)高達(dá)192MB的L3 Cache。
先進(jìn)封裝已經(jīng)成為推動(dòng)處理器性能提升的主要?jiǎng)恿?/p>
隨著半導(dǎo)體工藝節(jié)點(diǎn)越來(lái)越接近物理極限,每一代半導(dǎo)體工藝節(jié)點(diǎn)提升對(duì)于芯片性能帶來(lái)的收益也越來(lái)越小,通常在15%左右。而在AMD發(fā)布的帶有3D V-Cache的處理器則在工藝不變(仍然使用7nm臺(tái)積電工藝)的情況下,在3D游戲等對(duì)于處理器性能有高需求的應(yīng)用場(chǎng)景中實(shí)現(xiàn)了約15%的性能提升。
這一點(diǎn)說(shuō)明先進(jìn)封裝在今天已經(jīng)能實(shí)現(xiàn)原來(lái)需要半導(dǎo)體工藝節(jié)點(diǎn)前進(jìn)整整一代才能實(shí)現(xiàn)的性能提升;而在未來(lái)隨著半導(dǎo)體工藝越來(lái)越接近極限,每一代工藝帶來(lái)的性能增益越來(lái)越小,先進(jìn)封裝可望取代半導(dǎo)體工藝成為芯片性能提升的主要推動(dòng)力。
而在先進(jìn)封裝領(lǐng)域,AMD已經(jīng)有了多年的積累,從2015年開(kāi)始使用HBM技術(shù),到2019年推出使用chiplet的產(chǎn)品,到今天推出3D chiplet,每一步都可以看見(jiàn)AMD對(duì)于先進(jìn)封裝領(lǐng)域投入的決心。
在先進(jìn)封裝領(lǐng)域,有兩條由應(yīng)用驅(qū)動(dòng)的技術(shù)路徑。一條的主要訴求是提升互聯(lián)密度,從而解決芯片之間的通信帶寬,其代表產(chǎn)品就是基于2.5D/3D高級(jí)封裝的HBM DRAM接口標(biāo)準(zhǔn)。
使用HBM可以將DRAM和處理器(CPU,GPU以及其他ASIC)之間的通信帶寬大大提升,從而緩解這些處理器的內(nèi)存墻問(wèn)題。目前,HBM已經(jīng)成為高端GPU的標(biāo)配,同時(shí)也應(yīng)用于不少針對(duì)云端處理的AI芯片(例如谷歌的TPU)中。
除此之外,另一條技術(shù)路徑是chiplet,即在封裝系統(tǒng)里面不再使用少量的大芯片做集成,而是改用數(shù)量更多但是尺寸更小的芯片粒(chiplet)作為基本單位。使用chiplet的第一個(gè)優(yōu)點(diǎn)是提升了良率。
如果使用大芯片的話(huà),如果在芯片的晶圓面積上出現(xiàn)瑕疵,那么整個(gè)芯片就有了瑕疵,無(wú)法作為良品使用;但是如果把同樣面積的芯片拆分為多個(gè)chiplet,那么出現(xiàn)瑕疵的話(huà)就僅僅是瑕疵出現(xiàn)的那個(gè)chiplet無(wú)法使用。
而其他chiplet則不受影響,這樣就提升了良率,而這對(duì)于良率存在挑戰(zhàn)的先進(jìn)半導(dǎo)體工藝至關(guān)重要。Chiplet另外的潛力在于可以實(shí)現(xiàn)更靈活的異構(gòu)集成,在同一封裝系統(tǒng)中不同的chiplet可以使用不同的半導(dǎo)體工藝實(shí)現(xiàn),從而進(jìn)一步降低成本(例如某些對(duì)于邏輯性能需求不高的模組可以使用成熟工藝)并提升性能。
而這次AMD的3D Chiplet則是把兩條先進(jìn)封裝的技術(shù)路線(xiàn)匯合到了一起。AMD發(fā)布的3D V-Cache中,首先處理器和堆疊的L3 Cache都使用了chiplet,另外在3D V-Cache和處理器chiplet之間,也使用了先進(jìn)封裝帶來(lái)的高密度互聯(lián),其互聯(lián)密度較2D chiplet高兩百多倍。
相比傳統(tǒng)的3DIC技術(shù)也能提高15倍。我們認(rèn)為,AMD將3D Chiplet投入商用對(duì)于先進(jìn)封裝領(lǐng)域來(lái)說(shuō),將是類(lèi)似HBM進(jìn)入GPU這樣的里程碑式事件。
臺(tái)積電進(jìn)一步鞏固在代工領(lǐng)域的地位
在AMD發(fā)布的3D chiplet背后,是臺(tái)積電的先進(jìn)半導(dǎo)體工藝技術(shù)和先進(jìn)封裝技術(shù)。臺(tái)積電作為同時(shí)掌握了最先進(jìn)半導(dǎo)體工藝和封裝技術(shù)的代工廠(chǎng),其全球最頂尖代工廠(chǎng)的地位得到了鞏固,同時(shí)其在先進(jìn)技術(shù)領(lǐng)域也將變得更加強(qiáng)勢(shì)。
早在2019年的VLSI Symposium中,臺(tái)積電就發(fā)表了類(lèi)似這次AMD 3D Chiplet的技術(shù)。臺(tái)積電把這個(gè)技術(shù)System on Integrated Chips(SOIC),其主要解決的就是進(jìn)一步提升3D封裝中的互聯(lián)密度。
傳統(tǒng)3DIC技術(shù)的連線(xiàn)密度受到bump尺寸的限制,從而限制了集成總線(xiàn)的帶寬和互聯(lián)成本。而臺(tái)積電SoIC技術(shù)一個(gè)關(guān)鍵優(yōu)勢(shì)就是無(wú)須bump,只要將兩塊要堆疊的芯片的銅互聯(lián)做部分裸露并對(duì)準(zhǔn),之后即可通過(guò)熱處理工藝完成兩塊芯片的電路連接。
這樣一來(lái),兩塊堆疊芯片之間的走線(xiàn)密度以及信號(hào)傳輸功耗都可以大大改善。在今年的ISSCC中,臺(tái)積電又一次展示了SOIC技術(shù),這次臺(tái)積電為該技術(shù)商用起了一個(gè)正式的名字(3DFabric),并且公布了更多互聯(lián)密度相關(guān)的數(shù)據(jù)。
其互聯(lián)密度相比傳統(tǒng)的基于bump的3DIC技術(shù)可以提升16倍,該數(shù)據(jù)與AMD這次在Computex發(fā)布的相關(guān)數(shù)字(相比3DIC互聯(lián)密度提升15倍)也大體相符。
如前所述,隨著摩爾定律的半導(dǎo)體工藝節(jié)點(diǎn)提升接近極限,先進(jìn)封裝技術(shù)將會(huì)慢慢接班半導(dǎo)體工藝節(jié)點(diǎn)而成為芯片性能提升的推動(dòng)力。臺(tái)積電在擁有最先進(jìn)半導(dǎo)體工藝的同時(shí),也在先進(jìn)封裝領(lǐng)域領(lǐng)跑全球,其在半導(dǎo)體代工領(lǐng)域的領(lǐng)導(dǎo)者地位將延續(xù)下去。
于此同時(shí),在AMD首發(fā)基于3DFabric的產(chǎn)品之后,預(yù)計(jì)在未來(lái)會(huì)有更多芯片設(shè)計(jì)公司跟進(jìn)使用3DFabric來(lái)實(shí)現(xiàn)高性能芯片,從而進(jìn)一步推廣下一代先進(jìn)封裝技術(shù)的應(yīng)用。
3D Chiplet在AI時(shí)代大有作為
我們認(rèn)為,類(lèi)似3D Chiplet的技術(shù)在AI時(shí)代將會(huì)有廣泛應(yīng)用。
目前,人工智能已經(jīng)成為推動(dòng)半導(dǎo)體行業(yè)市場(chǎng)收入的重要引擎?;?a href="http://hljzzgx.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)的人工智能需要強(qiáng)大的算力支撐其模型訓(xùn)練和部署,因此高性能計(jì)算芯片在AI時(shí)代至關(guān)重要,這也是全球范圍內(nèi)出現(xiàn)了不少AI芯片初創(chuàng)公司的原因。
對(duì)于AI計(jì)算來(lái)說(shuō),內(nèi)存訪(fǎng)問(wèn)已經(jīng)越來(lái)越成為性能的瓶頸,因此如何提升處理器(AI芯片)與存儲(chǔ)器之間的內(nèi)存訪(fǎng)問(wèn)速度和效率變得越來(lái)越重要
為了解決這個(gè)問(wèn)題,目前云端AI芯片使用HBM DRAM配合大容量的片上SRAM已經(jīng)成為標(biāo)配(例如谷歌的TPU)。HBM DRAM和大容量SRAM缺一不可,其中HBM DRAM容量大,但是存取需要較大的延遲。
因此常用來(lái)存儲(chǔ)系統(tǒng)調(diào)度算法中在未來(lái)可能會(huì)用到的數(shù)據(jù);而SRAM的帶寬大于HBM,延時(shí)也較小,但是容量也遠(yuǎn)小于DRAM,常用來(lái)存取在當(dāng)前立即需要用到的數(shù)據(jù)。
在人工智能領(lǐng)域,隨著GPT-3這樣的巨型模型越來(lái)越多,對(duì)于DRAM和SRAM容量的需求都越來(lái)越大,而SRAM擴(kuò)容目前看來(lái)最有希望的方法之一就是使用類(lèi)似3D Chiplet的技術(shù),使用3D堆疊的方式來(lái)獲得更大的容量(如這次AMD在使用3D V-Cache后SRAM容量就擴(kuò)大到了三倍)。
因此我們認(rèn)為隨著臺(tái)積電的3DFabric技術(shù)進(jìn)一步成熟,AI芯片很可能是下一個(gè)使用該技術(shù)的產(chǎn)品,并且隨著人工智能市場(chǎng)越來(lái)越大,AI芯片也將進(jìn)一步將3D Chiplet帶向主流,同時(shí)使用HBM加3D Chiplet技術(shù)的芯片產(chǎn)品將會(huì)進(jìn)入更多產(chǎn)品中獲得使用。
編輯:jq
-
處理器
+關(guān)注
關(guān)注
68文章
19259瀏覽量
229650 -
amd
+關(guān)注
關(guān)注
25文章
5466瀏覽量
134087 -
DRAM
+關(guān)注
關(guān)注
40文章
2311瀏覽量
183445 -
3D
+關(guān)注
關(guān)注
9文章
2875瀏覽量
107480
原文標(biāo)題:AMD的3D Chiplet處理器:先進(jìn)封裝的勝利
文章出處:【微信號(hào):半導(dǎo)體科技評(píng)論,微信公眾號(hào):半導(dǎo)體科技評(píng)論】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論