今年舉辦的國際固態(tài)電路峰會(ISSCC)上,處理器部分開始于AMD的兩個演講,然后是三星和聯(lián)發(fā)科演示他們的最新5 G智能手機(jī)芯片,還包括一個來自CEA技術(shù)的概念設(shè)計的研究項目、TI的汽車SoC和IBM 的最新Z系列主機(jī)處理器。
ISSCC是半導(dǎo)體行業(yè)歷史最悠久的技術(shù)會議之一,每年二月在美國舊金山舉行。這次會議匯集了學(xué)術(shù)界和產(chǎn)業(yè)界人士,討論芯片電路設(shè)計的最新挑戰(zhàn)。該會議主要是一個電路設(shè)計會議,每個廠商都專注于他們的處理器中獨特電路設(shè)計的一個或多個特定方面。
今年的會議涵蓋了一系列深入主題,包括鎖相環(huán)、低功耗電路、內(nèi)存、SerDes、DSP和處理器設(shè)計。處理器部分出現(xiàn)了領(lǐng)先的供應(yīng)商,也有來自研究機(jī)構(gòu)和學(xué)術(shù)界的項目。會議內(nèi)容覆蓋了密集的芯片設(shè)計細(xì)節(jié),下面介紹了處理器環(huán)節(jié)中有趣細(xì)節(jié)的突出部分。
AMD Zen2和EPYC芯片
兩個AMD的會議相互吻合,討論了最新的EPYC服務(wù)器處理器使用的Zen 2 CPU核心的設(shè)計,并討論了EPYC芯片架構(gòu),允許AMD在一個基板上提供64個CPU核心,而不需要大量的芯片。
AMD Zen 2演示描述了使用TSMC的7nm工藝制造第一個x86處理器的挑戰(zhàn)。EPYC服務(wù)器處理器的設(shè)計目標(biāo)是在同一個插槽上增加一倍的CPU內(nèi)核,同時不超過插槽的功率峰值。此外,在SPECint 2006基準(zhǔn)測試上,每個CPU核心都被設(shè)計為每周期提供15%的指令性能提升。Zen 2中的許多架構(gòu)更改在前面已經(jīng)討論過了。在ISSCC的演講中,AMD著重討論了電路設(shè)計的挑戰(zhàn)。
AMD的設(shè)計非常模塊化。基本模塊是CCX(CPUComplex),包含4個CPU核心,L2和L3緩存,使用Infinity總線技術(shù)實現(xiàn)Fabric系統(tǒng)互連。通過4核模塊,AMD可以將設(shè)計從筆記本(4-8核)擴(kuò)展到服務(wù)器(64核)。盡管添加了更多的L3緩存,CCX模塊從上一代的44 mm2縮減到了Zen 2的31.3 mm2。
7nm工藝需要添加更多的金屬層,因此金屬層布局布線規(guī)則發(fā)生了變化,設(shè)計從10.5個track變?yōu)?個track。更低的track帶來了挑戰(zhàn)(更低的高度和更低的驅(qū)動強(qiáng)度),但漏電變少,減少了9%的周期電容,同時硅面積也更小。
AMD使用了多種設(shè)計技術(shù),如時鐘整形,并有五種不同的觸發(fā)器設(shè)計,這對電路時序來說十分關(guān)鍵。為了獲得更好的性能,設(shè)計者還將更多的功耗預(yù)算轉(zhuǎn)移到組合邏輯上,減少了3%。通過這些和其他電路優(yōu)化,AMD可以將時鐘速度提高到4.7 GHz,并在與原始Zen core相當(dāng)?shù)臅r鐘速度下降低工作電壓。
第二個AMD的介紹描述了基于Zen 2的服務(wù)器產(chǎn)品的多種chiplet策略。AMD的主要優(yōu)勢之一是,只要三種die即可以創(chuàng)建產(chǎn)品以支持多個市場。
AMD的目標(biāo)是在每個插槽上提供更多的性能,第二代EPYC處理器將CPU核數(shù)增加了一倍。這使得AMD的業(yè)績每2.5年翻一番(SPECint2006),新的EPYC處理器還改善了內(nèi)存延遲。使用chiplet讓AMD的服務(wù)器芯片成為可能,因為使用單片芯片是不可行,也是不經(jīng)濟(jì)的,在64核下用單片芯片會有諸多限制。
AMD還通過使用更小的chiplet優(yōu)化了成本結(jié)構(gòu),提高了良率。AMD使用昂貴的7納米工藝實現(xiàn)核心緩存芯片(CCD),并將DRAM和PCIe邏輯轉(zhuǎn)移到GlobalFoundries的12納米I/O芯片上。每個CCD由兩個CCX模塊和四個Zen 2核心以及L2和L3緩存組成,其中86%的CCX專用于CPU和L3緩存。每個CCD仍然是一個小型SoC,包括電源管理、Infinity系統(tǒng)互連、時鐘等。
有了所有這些要求,實現(xiàn)上就有了許多挑戰(zhàn)。由于內(nèi)存控制器現(xiàn)在位于單獨芯片上,要用于所有CCX模塊,新的EPYC處理器在平均內(nèi)存訪問延遲上有所改進(jìn),但是最佳情況下的延遲仍然需要離開CCD來訪問內(nèi)存。因此,AMD的設(shè)計重點在于減少Infinity Fabricz總線延遲,最佳情況下的延遲只比預(yù)期長4納秒。
由于AMD承諾保持EPYC封裝尺寸和pin腳不變,因此需要一個緊密的硅/封裝協(xié)同設(shè)計,因為從第一代EPYC到第二代EPYC芯片數(shù)量從4個增加到9個。內(nèi)部布線非常緊湊,需要在內(nèi)部CCD芯片下的信號到達(dá)距離集中式I/O芯片更遠(yuǎn)的CCD芯片。
ISSCC的許多其他演講都是關(guān)于當(dāng)處理器處于高負(fù)載時補(bǔ)償內(nèi)部壓降的電路。AMD有一個電流分流(額外電流)以對抗壓降,也可以拉伸時鐘。相同的LDO設(shè)計允許單個核心線性調(diào)節(jié),通過調(diào)整每個核心的電壓來實現(xiàn)節(jié)能。
概念驗證處理器有96個核和一個有源插入器
會議中的一個非生產(chǎn)芯片是一個96核的處理器,也使用了chiplets策略,但是當(dāng)AMD使用一個專用I/O芯片的多芯片模塊時,這個芯片使用了一個有源硅插入器,將I/O邏輯放入插入器。
該設(shè)計使用6個chiplet,從96個核中獲得220個GOPS。它由CEA-Leti設(shè)計,ST Micro制造。這里的想法是要證明這一概念使用兩種die設(shè)計:chiplet和有源插入器。雖然本設(shè)計使用同構(gòu)芯片,但未來的設(shè)計可以使用異構(gòu)處理元素。與AMD EPYC設(shè)計一樣,CEA的目標(biāo)是添加更多的處理元素,單個die不足以交付所需的處理。其中一種應(yīng)用可能是汽車自動駕駛,這將需要數(shù)百個GOPS。
使用有源插入器,可以去除許多在老的流程節(jié)點中運(yùn)行的功能,包括電源管理、內(nèi)存接口和I/O。在這個特殊的設(shè)計中,CEA使用了一個2D網(wǎng)格的分布式互連。有源插入器上的互連混合使用了短距離的無源通道和長時間的有源通道。本設(shè)計還采用了一種新穎的異步QDI邏輯與芯片上的異步網(wǎng)絡(luò)進(jìn)行通信。
這款處理器上的chiplet采用FDSOI 28nm LPLV制造,有源插層采用了65 nm工藝。雖然這種芯片使用的是較老的工藝節(jié)點,但其目標(biāo)是展示如何構(gòu)建和制造它。芯片測試使用傳統(tǒng)的已知良好的技術(shù),但有源插入器只在所有元素組裝后做了測試。如果完全投入生產(chǎn),通過使用更高級的流程節(jié)點,生產(chǎn)流程可能會有所不同。
責(zé)任編輯:pj
-
半導(dǎo)體行業(yè)
+關(guān)注
關(guān)注
9文章
403瀏覽量
40517 -
服務(wù)器處理器
+關(guān)注
關(guān)注
0文章
13瀏覽量
12291
發(fā)布評論請先 登錄
相關(guān)推薦
評論