RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PC處理器的chiplet結(jié)構(gòu)設(shè)計(jì)未來會(huì)向怎樣的方向發(fā)展

傳感器技術(shù) ? 來源:電子工程專輯 ? 作者:黃燁鋒 ? 2022-10-10 11:33 ? 次閱讀

似乎PC處理器這兩年競(jìng)爭(zhēng)的焦點(diǎn),除了性能、能效這些常規(guī)指數(shù),還包括期貨水平......IntelAMD現(xiàn)在都熱衷于輪番預(yù)告未來產(chǎn)品多么彪悍。尤其是Intel,12代酷睿剛發(fā)幾天,13代酷睿和14代酷睿的消息就不絕于耳了。

最近的Technology Tour 2022上,Intel又分享了有關(guān)13代酷睿(Raptor Lake)CPU最高頻率可上達(dá)6GHz,以及超頻記錄達(dá)8GHz的消息——這應(yīng)該是明擺著針對(duì)即將上市AMD Ryzen 7000的5.7GHz吧。這也算是市場(chǎng)“信息戰(zhàn)”了。

不過畢竟過不了多久13代酷睿就要發(fā)布了,真正“展望”作品應(yīng)該是14代酷睿(Meteor Lake)。今年年中的Intel Vision大會(huì)上,Intel就展示了14代酷睿處理器的真容:讓人們知道了其chiplet方案怎么做的,以及Intel 4工藝的正式提槍上馬。

這些未來產(chǎn)品的消息放出,更多的應(yīng)該還是為了穩(wěn)住市場(chǎng)和投資者,尤其是Intel著眼于戰(zhàn)未來技術(shù)的現(xiàn)狀。上個(gè)月的Hot Chips 34上,Intel詳述了Meteor Lake的部分細(xì)節(jié)信息:尤其是這代芯片采用的chiplet方案。借著14代酷睿的chiplet方案,我們也有機(jī)會(huì)了解應(yīng)用于PC處理器的chiplet結(jié)構(gòu)設(shè)計(jì)未來會(huì)向怎樣的方向發(fā)展。

AMD、蘋果已經(jīng)在用chiplet

PC領(lǐng)域chiplet方案的近代應(yīng)用并不新鮮,為普羅大眾所知的是蘋果M1 Ultra——用在了Mac Studio上。這顆芯片差不多是把兩顆M1 Max加在一起,屬于比較典型的基于chiplet的芯片。所謂的chiplet結(jié)構(gòu),也就是把幾顆die封裝到一起構(gòu)成一顆芯片的方案。這種芯片的每一片die,就是一個(gè)chiplet。Chiplet的本質(zhì)也就是一種多die解決方案。

Chiplet出現(xiàn)的原因莫過于(1)單die越來越大,大到光刻機(jī)即將無法處理(超過reticle limit限制);(2)尺寸縮減的多die有利于提升產(chǎn)品良率,縮減成本;(3)應(yīng)用端的算力需求仍在不斷增加,chiplet式的設(shè)計(jì)也有利于堆算力,在產(chǎn)品組合上也更為靈活。

AMD則是在PC市場(chǎng)上更早應(yīng)用chiplet方案的先鋒,比如在Ryzen 3000系列CPU上,每4個(gè)CPU核心組成一個(gè)CCX,兩個(gè)CCX構(gòu)成一個(gè)CCD——也就是一片die/chiplet。多個(gè)CCD,外加I/O die,就構(gòu)成了完整的芯片。這算是近些年P(guān)C處理器核心數(shù)飆升的某一個(gè)原因,畢竟藉由增加CCD來增加處理器核心比以前容易多了。這年頭,16核處理器已經(jīng)不罕見了。

其實(shí)基于前文chiplet技術(shù)很不嚴(yán)謹(jǐn)?shù)亩x,當(dāng)年的Intel奔騰D膠水雙核處理器(2005年)似乎也可以被叫做chiplet。嚴(yán)謹(jǐn)一點(diǎn),如果我們說chiplet要求先進(jìn)封裝(或至少不是PCB級(jí)別的電路連接),那么近代Intel在自家處理器上采用chiplet方案的處理器應(yīng)該是Kaby Lake-G,8代酷睿產(chǎn)品中的某一個(gè)偏門系列,將AMD的iGPU(核顯)與Intel的CPU藉由2.5D先進(jìn)封裝工藝,放到同一顆芯片上。

Meteor Lake的chiplet

不過像Kaby Lake-G這樣的產(chǎn)品,怎么說都只是試驗(yàn)和先進(jìn)封裝工藝的練手。Intel始終也沒有像AMD那樣,通過chiplet來堆CPU核心。似乎從直覺來看,隨著當(dāng)代PC處理器核心數(shù)增多、I/O能力增強(qiáng)、核顯性能內(nèi)卷,眼見著die size越來越大,還不得不給更多的算力,再不用chiplet是真的不行了。

此前14代酷睿的die shot公布時(shí),我們也都知道了這代產(chǎn)品終于要開始用chiplet方案了。但很顯然,Meteor Lake基于chiplet的芯片架構(gòu)與AMD仍然大相徑庭。

d1ada7a8-3741-11ed-ba43-dac502259ad0.jpg

Meteor Lake總共4片die,Intel稱其為tile,分別是CPU Tile、SoC Tile、Graphics Tile和IOE Tile(IO extender)。

CPU Tile里面主要就是CPU核心與cache,而Graphics Tile自然就是核顯部分了,SoC Tile包含此前SA(System Agent)的絕大部分功能,IOE Tile則連接到SoC Tile。所有的tile都放到一片base die上。這種chiplet式的方案自然就極大提升了處理器產(chǎn)品面向不同市場(chǎng)的靈活性。

比如說要是很看重PCIe連接數(shù)量,那么SoC Tile可以做擴(kuò)展;面向筆記本設(shè)備時(shí),SoC Tile還可以加上圖像處理單元之類的部分;而CPU Tile則能夠根據(jù)場(chǎng)景需要來設(shè)計(jì)不同的核心數(shù)組合;GPU die則面向不同的圖形算力需求。

d1c02ebe-3741-11ed-ba43-dac502259ad0.png

很容易發(fā)現(xiàn),Meteor Lake的chiplet“切分”方式,和AMD Ryzen的chiplet相當(dāng)不一樣??赡芎芏嗳藭?huì)認(rèn)為,AMD的CCD + I/O die的設(shè)計(jì)更靈活,但AMD在移動(dòng)平臺(tái)上受制于功耗仍然采用單die方案;而且從die間通信和封裝的角度來看,AMD所用的chiplet方案并不能算先進(jìn)封裝——而是直接從PCB基板走線——這種方案成本更低,但對(duì)通信效率和功耗而言都不是什么好事。

前不久我們?cè)敿?xì)探討過先進(jìn)封裝技術(shù),及主流的一些方案。Intel雖未詳談Meteor Lake封裝,但大致也不離文章里談到的主流技術(shù)?;?.5D/3D封裝,則Meteor Lake的封裝成本自然就會(huì)高于AMD現(xiàn)階段的方案,更靠近蘋果M1 Ultra(雖然還是不同的)。從擴(kuò)展靈活性的角度來看,如果CPU要增加更多核心,那么CPU Tile需要更大的die size,則base die的這種硅中介或硅橋也要跟著變大。

不過2.5D/3D先進(jìn)封裝能夠獲得更高的IO密度、功耗也會(huì)更低。這對(duì)小尺寸封裝,以及電池驅(qū)動(dòng)的功耗敏感型設(shè)備來說會(huì)很有價(jià)值。

Die間互聯(lián)與通信

AMD此前提到Zen架構(gòu)的die-to-die Infinity Fabric鏈接功耗水平為2 pJ/bit(皮焦/比特);Zen 2的Infinity Fabric這一數(shù)值降低了大約27%。Chips and Cheese在近期的技術(shù)文章中提到,有理由認(rèn)為AMD的die間傳輸功耗應(yīng)該和Intel Haswell(4代酷睿)的OPIO(一般是片上處理器die和PCH die的連接)類似。

d1ec898c-3741-11ed-ba43-dac502259ad0.png


上面這張來自Intel的PPT也基本能闡明這一點(diǎn)。Intel將Meteor Lake的die-to-die link稱作FDI(Foveros Die Interconnect)。而FDI的die間通信功耗水平為0.2-0.3 pJ/bit。這張圖中的延遲數(shù)據(jù)比較模糊,只說是小于10ns。AMD那種相對(duì)簡(jiǎn)單粗暴的連接方式,此前公布的延遲數(shù)據(jù)也是差不多的水平。

AMD說Zen 2架構(gòu)的這種die間連接延遲為13個(gè)FCLK(Infinity Fabric)時(shí)鐘周期,即不到9ns;如果推升DDR內(nèi)存頻率和FLCK的頻率,則Ryzen 3000系列處理器的13個(gè)FCLK周期可低至7.22ns。所以Intel這邊的延遲數(shù)據(jù)就顯得并不算多好。

另外表中的帶寬數(shù)據(jù)也不算明朗,2 GT/s(每秒20億次傳輸)沒有指明每次傳輸?shù)膶挾?。Chips and Cheese評(píng)論說,有可能帶寬也就是OPIO或IFOP(Infinity Fabric On Package)的水平。

d2007226-3741-11ed-ba43-dac502259ad0.png


通信協(xié)議方面,Intel表示CPU與SoC Tile采用IDI(In-Die Interface)協(xié)議,Graphics Tile到SoC Tile則采用iCXL協(xié)議(對(duì)于現(xiàn)在很火的CXL的一個(gè)內(nèi)部實(shí)施方案,和IDI應(yīng)該有諸多相似之處),SoC與IOE Tile連接是通過IOSF(Integrated On-chip System Fabric)和DisplayPort——可見IOE Tile上估計(jì)是有PCIe控制器和DisplayPort PHY的。

這里的IDI,最早出現(xiàn)于Intel Nehalem架構(gòu)(2008年,初代酷睿i5/i7),用于把CPU核心連接到uncore的Global Queue和L3;后續(xù)IDI就成為Intel處理器ring bus總線的主要協(xié)議了,當(dāng)然后續(xù)有不斷更新??偟膩碚f,IDI是一種處理mesh和ring總線通信的內(nèi)部協(xié)議。

值得一提的是,此前Intel處理器的核顯也采用IDI協(xié)議與L3 cache連接。去年我們撰寫的《蘋果M1統(tǒng)一內(nèi)存架構(gòu)真的很厲害嗎?稀松平常的UMA(下)》一文曾經(jīng)提到過,酷睿處理器從Sandy Bridge(6代酷睿)開始就把核顯掛在環(huán)形總線上,LLC(也就是L3 cache)也與核顯共享(如下圖)。換句話說,核顯和CPU一樣都能用L3資源。

d20ed0e6-3741-11ed-ba43-dac502259ad0.jpg


不過從Meteor Lake的die shot來看,Graphics Tile和CPU Tile離得比較遠(yuǎn),所以過去的這種設(shè)計(jì)應(yīng)當(dāng)也就不復(fù)存在了,也就是說核顯可能就不再共享L3 cache了。這么做對(duì)核顯效率會(huì)有影響嗎?Chips and Cheese評(píng)論說或許也未必,因?yàn)橐环矫婵偩€上的stop變少,這利于降低延遲、提升數(shù)據(jù)傳輸?shù)哪苄?另外這可能也有機(jī)會(huì)讓ring頻率變高,達(dá)成CPU核心更高的L3性能;還有就是核顯和CPU隔開,便于將整個(gè)CPU Tile設(shè)定在低功耗狀態(tài),降低功耗。

Chips and Cheese對(duì)此還特別提到了一點(diǎn),就是一般核顯的LLC命中率極低。比如Arm架構(gòu)普遍會(huì)用到的SLC(System Level Cache)也為GPU服務(wù),8MB SLC就只有28%的命中率。AMD的GPU Infinity Cache命中率也很低。Intel這邊的情況也沒好到哪里去。所以有沒有必要再共享L3,原本就很值得懷疑。

與此同時(shí),Intel處理器現(xiàn)在的Xe核顯配備了更大的專用cache,相比AMD這邊的Vega和RDNA 2核顯都更大。若這種設(shè)計(jì)持續(xù),則Meteor Lake的核顯應(yīng)該就有足夠的cache資源,不需要多依賴L3。那么當(dāng)前的這種設(shè)計(jì)也就比較好理解了。

d21e4670-3741-11ed-ba43-dac502259ad0.png

來源:Lecomptoir via Chips and Cheese

雖然單純從物理層面的die shot來觀察,我們普遍都覺得Meteor Lake即便用了chiplet的方案,耦合度依然比較高,但Chips and Cheese認(rèn)為其靈活度相比AMD的方案更高,更為分散化(disaggregation)。而且FDI連接在達(dá)成與AMD IFOP相似性能的同時(shí),功耗更低。

所以這種連接并不用于性能敏感路徑。SoC到IOE Tile鏈接處理DisplayPort和PCIe數(shù)據(jù);核顯內(nèi)存訪問則主要由核顯的專用cache進(jìn)行——核顯到SoC鏈接用于處理GPU的cache未命中請(qǐng)求;CPU的L3主要獲取內(nèi)存訪問,即藉由CPU到SoC Tile。

Chips and Cheese認(rèn)為SoC很可能在CPU Tile上有掛一個(gè)ring stop,跨die鏈接只留意發(fā)往SoC的IDI packets,而“熱”數(shù)據(jù)則僅在CPU Tile內(nèi)部ring stop上傳遞。從die shot來看,在CPU Tile的效率核(E-core)ring stop和這片die的邊緣之間有這么一個(gè)部分,猜測(cè)“這個(gè)位于CPU Tile的部分會(huì)有不少發(fā)往SoC Tile請(qǐng)求的隊(duì)列和仲裁邏輯?!?/p>

明年電腦全面走向chiplet

Intel在Hot Chips上再次明確了14代酷睿Meteor Lake明年發(fā)布——上個(gè)月有傳言說臺(tái)積電N3工藝遭遇不確定性,可能對(duì)Meteor Lake的發(fā)布產(chǎn)生影響,不過最近的消息說Meteor Lake的Graphics Tile實(shí)際上用的是臺(tái)積電N5工藝。另外除了CPU Tile基于Intel 4工藝外,傳言IOE Tile和SoC Tile都基于臺(tái)積電N6工藝(還有個(gè)base die是基于Intel的22FFL工藝)。

無論面向臺(tái)式機(jī)還是筆記本的Meteor Lake處理器,預(yù)計(jì)都會(huì)采用這種chiplet方案。畢竟像Intel這種方案的特色就是面向不同場(chǎng)景的彈性化選擇。未來AMD也有概率會(huì)采用類似的方案,因?yàn)榇饲癆MD就提到以后15-45W TDP的處理器也將應(yīng)用chiplet結(jié)構(gòu),這對(duì)其現(xiàn)有IFOP而言在功耗上是個(gè)挑戰(zhàn)。

這算是個(gè)新的技術(shù)戰(zhàn)場(chǎng),我們也很期待看到在PC處理器具備相當(dāng)?shù)男阅芘c功耗彈性擴(kuò)展空間以后,又會(huì)賦予PC設(shè)備怎樣的體驗(yàn)提升。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SoC芯片
    +關(guān)注

    關(guān)注

    1

    文章

    610

    瀏覽量

    34905
  • PC處理器
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    1957
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    431

    瀏覽量

    12584
  • RDNA
    +關(guān)注

    關(guān)注

    0

    文章

    20

    瀏覽量

    1904

原文標(biāo)題:電腦用上chiplet處理器以后,會(huì)有哪些變化?

文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    印刷線路板元件布局及結(jié)構(gòu)設(shè)計(jì)

    印刷線路板的元件布局和電氣連線方向的正確結(jié)構(gòu)設(shè)計(jì)是決定儀器能否可靠工作的一個(gè)關(guān)鍵問題,對(duì)同一種元件和參數(shù)的電路,由于元件布局設(shè)計(jì)和電氣連線方向的不同會(huì)產(chǎn)生不同的結(jié)
    發(fā)表于 11-24 09:49 ?2262次閱讀
    印刷線路板元件布局及<b class='flag-5'>結(jié)構(gòu)設(shè)計(jì)</b>

    變壓結(jié)構(gòu)設(shè)計(jì)手冊(cè)

    變壓結(jié)構(gòu)設(shè)計(jì)手冊(cè)內(nèi)容有:計(jì)算程序,進(jìn)品硅鋼板的牌號(hào)及其特性,導(dǎo)線尺寸截面積,鐵心各級(jí)尺寸表,三相單框鐵心,夾件,木墊塊,鐵心及夾件用零件,鐵心,鐵心裝置零件表,鐵軛沖槽,鐵心用單件,夾件絕緣等內(nèi)容.變壓
    發(fā)表于 12-13 01:33

    操作系統(tǒng)結(jié)構(gòu)設(shè)計(jì)

    而微內(nèi)核系統(tǒng)結(jié)構(gòu)設(shè)計(jì)則是近幾年來出現(xiàn)的一種新的設(shè)計(jì)理念,最有代表性的操作系統(tǒng)有Mach和QNX。微內(nèi)核系統(tǒng),顧名思義就是系統(tǒng)內(nèi)核很小!比如說QNX的微內(nèi)核只負(fù)責(zé):   ¨ 進(jìn)程間的通信   ¨ 低層的網(wǎng)絡(luò)通信   ¨ 進(jìn)程調(diào)度   ¨ 第一級(jí)中斷處理
    發(fā)表于 09-13 10:10

    手機(jī)結(jié)構(gòu)設(shè)計(jì)心得

    手機(jī)結(jié)構(gòu)設(shè)計(jì)心得
    發(fā)表于 11-07 09:59

    招聘--結(jié)構(gòu)設(shè)計(jì)

    呈現(xiàn)效果,真正將選擇視角的主動(dòng)權(quán)還給用戶。完美幻境以“科技無極限”為主旨,專注于虛擬現(xiàn)實(shí)領(lǐng)域的科技創(chuàng)新,會(huì)始終堅(jiān)持以最尖端的科技、性能最佳的產(chǎn)品為用戶提供更加極致的科技體驗(yàn)。崗位職責(zé)能夠獨(dú)立完成產(chǎn)品結(jié)構(gòu)設(shè)計(jì)
    發(fā)表于 09-25 15:46

    淺談產(chǎn)品結(jié)構(gòu)設(shè)計(jì)特點(diǎn) 

    `  產(chǎn)品結(jié)構(gòu)設(shè)計(jì)是根據(jù)產(chǎn)品功能而進(jìn)行的內(nèi)部結(jié)構(gòu)的設(shè)計(jì),是機(jī)械設(shè)計(jì)的主要內(nèi)容之一。產(chǎn)品結(jié)構(gòu)設(shè)計(jì)內(nèi)容有零件的分件、部件的固定方式、產(chǎn)品使用和功能的實(shí)現(xiàn)方式、產(chǎn)品使用材料和表面處理工藝等。
    發(fā)表于 02-25 17:24

    軟件結(jié)構(gòu)設(shè)計(jì)

    軟件結(jié)構(gòu)設(shè)計(jì),,
    發(fā)表于 09-26 13:55

    嵌入式DSP處理器的體系結(jié)構(gòu)設(shè)計(jì)

    本文就總線結(jié)構(gòu)、指令系統(tǒng)、存儲(chǔ)系統(tǒng)、流水線、尋址方式等幾個(gè)方面對(duì)一個(gè)嵌入式DSP 處理器μDSP 的體系結(jié)構(gòu)設(shè)計(jì)進(jìn)行了詳細(xì)的闡述。關(guān)鍵詞:嵌入式DSP 處理器;體系
    發(fā)表于 08-14 08:08 ?21次下載

    結(jié)構(gòu)設(shè)計(jì)方面資料

    結(jié)構(gòu)設(shè)計(jì)方面資料
    發(fā)表于 08-09 17:02 ?0次下載

    軸系結(jié)構(gòu)設(shè)計(jì)實(shí)驗(yàn)

    實(shí)驗(yàn)六 軸系結(jié)構(gòu)設(shè)計(jì)實(shí)驗(yàn)一、實(shí)驗(yàn)?zāi)康模?熟悉并掌握軸系結(jié)構(gòu)設(shè)計(jì)中有關(guān)軸的結(jié)構(gòu)設(shè)計(jì)、滾動(dòng)軸承組合設(shè)計(jì)的基本方法。 二、實(shí)
    發(fā)表于 03-13 19:04 ?5.8w次閱讀
    軸系<b class='flag-5'>結(jié)構(gòu)設(shè)計(jì)</b>實(shí)驗(yàn)

    多核處理器及其對(duì)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)的影響

    摘要:多核技術(shù)成為當(dāng)今處理器技術(shù)發(fā)展的重要方向,已經(jīng)是計(jì)算機(jī)系統(tǒng)設(shè)計(jì)者必須直面的現(xiàn)實(shí)。從計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的角度探討了同構(gòu)與異構(gòu)、通用與多用等多核處理器
    發(fā)表于 02-27 16:03 ?38次下載

    慣性閉鎖開關(guān)的結(jié)構(gòu)設(shè)計(jì)與分析_許馬會(huì)

    慣性閉鎖開關(guān)的結(jié)構(gòu)設(shè)計(jì)與分析_許馬會(huì)
    發(fā)表于 03-19 19:04 ?0次下載

    淺談產(chǎn)品結(jié)構(gòu)設(shè)計(jì)類別及產(chǎn)品結(jié)構(gòu)設(shè)計(jì)的重要性

    產(chǎn)品設(shè)計(jì)中所涉及的產(chǎn)品結(jié)構(gòu)設(shè)計(jì),主要是產(chǎn)品的外部殼體結(jié)構(gòu)設(shè)計(jì)。目前殼體材料主要是金屬材料通過鈑金沖壓工藝成型和塑料通過注塑工藝成型。常見產(chǎn)品的結(jié)構(gòu)設(shè)計(jì)主要有鈑金結(jié)構(gòu)的設(shè)計(jì)、塑料產(chǎn)品的
    的頭像 發(fā)表于 05-26 14:21 ?9338次閱讀

    變頻電纜的結(jié)構(gòu)設(shè)計(jì)怎樣

    鄭州電纜有限責(zé)任公司之鄭州一纜電纜有限公司之變頻電纜結(jié)構(gòu)設(shè)計(jì)
    發(fā)表于 03-09 17:08 ?1132次閱讀

    FPC的結(jié)構(gòu)設(shè)計(jì).zip

    FPC的結(jié)構(gòu)設(shè)計(jì)
    發(fā)表于 03-01 15:37 ?1次下載
    RM新时代网站-首页