隨著芯片打入汽車、云計算和工業(yè)物聯(lián)網(wǎng)等市場,芯片的可靠性逐漸成為開發(fā)者關注的重要問題。事實也證明,隨著時間的推移,芯片想要達到目標的功能將會變得越來越難以實現(xiàn)。
在過去,芯片的可靠性一般被歸結為代工問題。那些專為電腦和手機設計的芯片可以在最高性能下正常使用平均兩到四年,兩到四年后,芯片功能開始下降,用戶升級到產(chǎn)品的下個版本,后者具有更多功能、更好的性能以及更長的待機時間。
但是隨著芯片打入新的市場或過去不太成熟的電子產(chǎn)品市場,如汽車、機器學習、物聯(lián)網(wǎng)(IoT)和工業(yè)物聯(lián)網(wǎng)(IIoT)、虛擬和增強現(xiàn)實、家庭自動化、云、加密貨幣挖掘等,這不再是一個簡單的問題。
每個終端市場都有其獨特的需求和特點,影響芯片的使用方式和條件,而芯片的使用方式和條件又會對老化、安全等其它問題產(chǎn)生重大影響??紤]以下幾個問題:
可靠性不再僅僅以年計量。用例正在發(fā)生巨大的變化?,F(xiàn)在的汽車在90%到95%的時間是閑置的,但自動駕駛汽車可能只有5%到10%的時間在閑置。這會影響電子產(chǎn)品的架構和開發(fā)技術的潛在商業(yè)模式。
隨著邊緣電子設備變得更加復雜,人們對功能性和「足夠好」的定義也有所不同。過去,如果無人機或機器人上的攝像頭被損壞或弄臟,通常會被換掉。但隨著邊緣設備中的電子產(chǎn)品變得越來越復雜,可以保證其有足夠功能的條件下,補償已破裂的攝像頭。另一方面,由于更嚴格的系統(tǒng)容差,在不太復雜的系統(tǒng)中可被接受的部分在復雜的系統(tǒng)中可能不會被接受。
影響老化和質(zhì)量建模的因素比過去更多。雖然其中一些在開發(fā)芯片時可能不明顯,但與在PCB上相比,一個已知良好的芯片與其它芯片封裝在一起時可能有不同的表現(xiàn)。
整個電子產(chǎn)品領域,用例(use cases)在發(fā)生變化。即使在數(shù)據(jù)中心內(nèi)部也是如此,盡管歷史上在采用新技術和新方法時數(shù)據(jù)中心也非常保守。
Arm首席執(zhí)行官Simon Segars說:「老化是時鐘速度和功耗的函數(shù),過去在運行過程中偶爾會用到服務器,大部分時間它們處于閑置狀態(tài)。但當你轉移到云端時,設計標準需要有所不同,因為這取決于其使用時間。這引發(fā)了很多關于如何設計可以延長壽命的問題?!?/p>
在千禧年開始的時候,服務器的平均利用率約為5%到15%,這一趨勢在20世紀90年代一直存在,因為IT管理人員為了避免設備故障,不愿意在單個商品服務器上運行一或兩個應用程序。后來兩件事改變了這種情況,首先,能源成本開始上升,其次,也許更重要的是,為了使公司的IT部門而不是其設備部門負責其能源成本,公司進行了重組。這兩個因素都導致了虛擬化軟件銷售的猛增,以提高服務器的利用率,這意味著更少用來供電和降溫的服務器機架。
云將這種運營效率提升到了更高的水平。云操作的目的是通過平衡整個數(shù)據(jù)中心的計算作業(yè)來最大化利用率。這將數(shù)據(jù)中心內(nèi)而不是一個機架上的所有服務器的利用率顯著提高,并可以在不需要時快速關閉它們。這種方法節(jié)約了能源,但卻對電子電路的退化和老化造成了很大影響。
Helic市場副總裁Magdy Abadir表示:「芯片正在加速老化從而發(fā)生故障。它們時鐘可能會缺失或發(fā)生額外的抖動,或是發(fā)生電介質(zhì)擊穿。任何時候都有可能發(fā)生一件什么事讓你擔心。在偶爾使用電子產(chǎn)品的時代許多老化模型是先進的,但現(xiàn)在芯片一直在運行,在芯片內(nèi)部,模塊也在升溫,因此老化加速,而老化的芯片會出現(xiàn)各種奇怪的現(xiàn)象。許多公司目前還沒有修改他們的老化模型。他們假設這些設備可以持續(xù)三到四年,但它們可能很快就失效。考慮到從開始設計時的利潤就很小,老化可能將他們拋棄。」
在汽車領域芯片利用率趨勢也在發(fā)生變化,并且會持續(xù)到可以取代人類司機的全自動汽車出現(xiàn)的時候。汽車正在處理越來越多的數(shù)據(jù),其中一些從雷達、激光雷達和照相機等傳感器流式傳輸而來。所有這些數(shù)據(jù)處理的時間都需要比過去更短,準確度更高,這些給電子設備帶來了巨大的壓力。
ADAS的首席技術專家Norman Chang說:「與過去的兩到五年不同,ADAS的可靠性至少為十五年。老化不僅僅指時間上的老化,也與負偏置溫度不穩(wěn)定性(NBTI)、與熱量有關的電遷移率、靜電放電(ESD)和熱耦合有關?!?/p>
圖1:芯片和封裝的熱建模。來源:ANSYS
雖然許多汽車一級供應商都構建可以承受極端溫度、機械震動和各種噪聲的芯片,但使用較長時間的先進節(jié)點CMOS從未有過這類壓力。許多業(yè)內(nèi)人士證實,汽車制造商正在開發(fā)10 / 7nm芯片來管理所有這些數(shù)據(jù),并在前沿節(jié)點工作,避免他們的設計過時,這些設計通常用于近幾代的汽車。問題在于實際數(shù)據(jù)非常少,無法證明隨著時間的推移,這些設備在任何環(huán)境條件下可以可靠運行。
Segars說:「你必須做不同的設計。有一種想法是,你將需要更少的汽車,因為它們不會一直處于閑置狀態(tài)。但另一派認為自動駕駛汽車將跑得越來越快,也將會快地磨損,最后所有東西都會磨損。挑戰(zhàn)在于,確保電子部件不會比機械部件先磨損,這就要求設計有所不同。這包括從嚴肅對待噪聲到減小峰值電流的所有事情?!?/p>
更薄的絕緣層,更薄的襯底
增加芯片可靠性的一個諷刺之處在于它與50年來半導體發(fā)展相矛盾,因為為了降低成本每兩年尺寸就會縮小,也就意味著更薄的電介質(zhì)、更細的線以及更大的動態(tài)功,而且,襯底也會越來越薄。在最先進的節(jié)點工藝,這會導致更高的漏電流、更多的噪聲、更大的電遷移率和其它電學效應。
Fraunhofer EAS質(zhì)量和可靠性的部門經(jīng)理André Lange說:「從電路角度來看,你知道必須考慮工藝變化。但從設計功能的角度來看,這與處理系統(tǒng)中已知缺陷時可能發(fā)生什么有關。如果你看一下自動汽車,有一個中央處理單元來決定從哪個傳感器中使用哪些信息。其中一個可能會很臟或不能運行。」
這使退化模型變得更加復雜,因為它需要在系統(tǒng)環(huán)境中完成。Lange說:「許多情況都會導致電路退化,無論是NBTI還是指定面積上的更多缺陷,或是更大的工藝偏差。」他指出,一個很大的挑戰(zhàn)是確定導致缺陷的原因,而不是所有可用的龐大的數(shù)據(jù)。
圖2:出什么問題了。來源:Fraunhofer
不同的方法
每個新的節(jié)點下工藝偏差都會增加。在過去的十年里,智能手機推動了縮小路線圖(iPhone于2007年推出)的前進?,F(xiàn)在,先進節(jié)點技術的最大用戶是用于數(shù)據(jù)挖掘、機器學習、AI和云的服務器。
工藝偏差和可靠性之間的聯(lián)系已有詳細的記錄,但偏差的存在使老化模型更難準確地建立。為解決這個問題,提出過許多不同的方法,從復雜的統(tǒng)計建模和仿真到將傳感器放在芯片上或?qū)ζ溥M行封裝。
Synopsys 5nm相關的首席研發(fā)工程師Ralph Iverson說:「有熱源時,你必須使用本地和全球「隨機漫步」的方法來跟蹤溫度。隨機漫步的情況下,電壓是其周圍電壓的平均值,因此增量是零?!?/p>
這有助于建模,但據(jù)Iverson說中,在5nm及以下的工藝下,電阻率并不總是干凈的。有表面效應存在,數(shù)據(jù)并不一定代表銅的連通,我們還需要更多的本地化數(shù)據(jù)來判斷。因此,混合類的方法開始出現(xiàn),因為這種不確定性很難去抽象。
西門子商業(yè)公司Mentor的AMS產(chǎn)品營銷總監(jiān)Mick Tegethoff表示:「汽車行業(yè)對雙極CMOS DMOS(BCD)進行了很好的調(diào)查,但我們也看到了對先進CMOS的要求和需求。我們看到了代工廠更多的興趣, EDA公司正在模擬壓力造成的 老化。這夠了嗎?任何一種建模都是對現(xiàn)實世界的近似,所以你要進行電路仿真,并盡可能構建一個可持續(xù)使用的芯片,但之后你需要進行物理測試或類似的事情,比如把它放在烤箱里來制造物理壓力?,F(xiàn)在有許多電子產(chǎn)品都要進行這種測試。」
模擬與數(shù)字
到目前為止,大多數(shù)老化/退化建模都集中在數(shù)字電路上。模擬為老化提供了一個不同的視角。
Moortec首席技術官Oliver King表示:「由于產(chǎn)品核心部件有領先的芯片,因此公司對老化和工藝偏差有很好的理解,所以它們不會盲目前進。模擬有許多可變的效應。數(shù)字芯片可能會不能使用,但對于模擬來說,它可能稍微不好或電路稍有缺陷,所以你必須對此進行調(diào)整。傳統(tǒng)模擬開發(fā)人員不像數(shù)字開發(fā)人員那樣推動幾何效應的增長。電遷移仍是一個問題,電流密度也是問題,但并沒有出現(xiàn)很多老化效應。盡管如此,芯片也需要更積極的維修,以及是否要采取行動?!?/p>
Rambus產(chǎn)品管理高級總監(jiān)Frank Ferro觀點類似:「有了物理層(PHY),最大的挑戰(zhàn)是環(huán)境溫度。隨著溫度的升高,性能發(fā)生漂移,所以你需要重新校準。對于消費者來說,有「圣誕節(jié)測試」這種東西。在天冷的時候,你在車庫里存放一臺Playstation或其他電子設備,然后在圣誕節(jié)早上開啟它,電路需要能夠從冷開始馬上運作。這與汽車或基站的存儲系統(tǒng)類似。老化會對這些系統(tǒng)產(chǎn)生影響,你需要重新校準系統(tǒng)來減弱這些影響?!?/p>
Ferro說,物理層經(jīng)過與數(shù)字元件相同的資格認證,包括老化和電壓和溫度變化的測試。但物理層的設計目的是隨著這些變化而變化,這些很難被設計成數(shù)字電路,特別是在先進的節(jié)點工藝,先進的節(jié)點工藝下,margining對功率和性能有一定的影響。
模擬電路通常基于所謂的「任務概況」而設計。因此,自動駕駛汽車中的特定功能將代表為自動駕駛汽車IP設計的任務概況。
Cadence的IC和PCB部門高級營銷經(jīng)理Art Schaldenbrand說:「我們看到的一個重要問題是,根據(jù)它們的運作方式,不僅有一種情況。設備失效有很多可能,所以我們看不同的壓力下什么可能會失效。10%的設備偏置溫度不穩(wěn)定性(BTI)可能會導致失效,但這是最糟糕的壓力。所以我們需要更好的方式來表達退化。finFET與平面器件的應力不同,所以需要模擬不同的現(xiàn)象?!?/p>
封裝和其他未知
隨著摩爾定律的減緩,越來越多的公司開始采用先進的封裝來提高性能,并提供更多的設計靈活性。目前為止,,如何對先進的包裝進行建模以確定壓力和老化尚不完全清楚。一部分原因在于,有很多的封裝可供選擇,沒有人能確定哪一個是最好的。還有一部分的原因在于,許多這些封裝都相對較新,封裝內(nèi)部需要隨著時間去探究。
Helic Abadir說:「封裝層可能太靠近其他組件或來自另一側的應力。這需要建模。及時在其老化之前,它也必須建立其老化模型,因為效應在增多。所以放置方式尤其重要,如果你移動一下,那你就改變了共振頻率。沒有簡單的方法。你必須通過分析和設計,如果發(fā)現(xiàn)了問題,你可能需要移動?!?/p>
復雜設計中還有其他異常會隨著時間的推移影響可靠性。例如,一些使用模型可能比其他模型更頻繁地開啟和關閉電路,這會給電路帶來壓力。
Cadence高級軟件架構師Jushan Xie說:「如果有些東西閑置太久,就會與其它電路經(jīng)歷不同的老化。設備越小,老化效應越強。壓力越大,老化越快?!?/p>
所有這些將如何處理尚不完全清楚。至少其中一些將涉及新材料和新技術。
Mentor電子產(chǎn)品市場經(jīng)理John Parry表示:「對于電力電子產(chǎn)品,這推動了從硅基器件到碳化硅和氮化鎵(GaN)的轉變,這種器件可以以更高的開關頻率工作,具有更高的效率和更高的溫度。在某些應用中,在某些應用中,這可以使電力電子器件更靠近電機驅(qū)動器,從而進入更高溫度的環(huán)境。在其他情況下,半導體能夠承受更高的溫度意味著需要更少的冷卻。但是,半導體必須進行封裝,封裝也必須能夠承受較高的溫度。在新技術方面有巨大的投資,比如燒結銀用作芯片附著材料,不使用傳統(tǒng)的引線鍵合,所以IGBT等功率器件的封裝在材料、加工技術和設計方面經(jīng)歷了巨大的變化。 ”
結論
隨著設計轉移到先進的節(jié)點或出于安全考慮新市場中使用時間的增加,老化、壓力和其他效應變得越來越成問題。
Fraunhofer的 Lange 說:「這取決于客戶今天提出的問題。談話的對象不同,他們的出發(fā)點不同,但問題的頻率有更大的。許多人只在開始,他們看到了更高的電壓和更高的溫度,并在進行一些實驗來推斷過應力。但了解退化如何影響整個電路更困難。 對于復雜的芯片還有很多工作要做?!?/p>
但隨著對它的重視,解決這些問題的投資也會增加。芯片設計師剛剛注意到退化建模和老化問題。 與十年前的功耗一樣,這一切都將改變。
-
芯片
+關注
關注
455文章
50714瀏覽量
423136 -
摩爾定律
+關注
關注
4文章
634瀏覽量
78997 -
模擬數(shù)字
+關注
關注
2文章
154瀏覽量
25340
發(fā)布評論請先 登錄
相關推薦
評論