1. 引言
電子元器件的可靠性是電子設(shè)備可靠性的基礎(chǔ)。電子可靠性工程是提高產(chǎn)品質(zhì)量和可靠性,降低硬件生產(chǎn)故障率和市場(chǎng)失效率的系統(tǒng)工程。 根據(jù)業(yè)界的分析,60%以上的生產(chǎn)故障是由于器件失效引起的,70%以上的市場(chǎng)返修也是因?yàn)槠骷б鸬?,而大多?shù)公司對(duì)此卻沒有采用系統(tǒng)化的電子可靠性工程方法來(lái)解決,導(dǎo)致效率較低,產(chǎn)品質(zhì)量可靠性不高。其實(shí),通過選擇合適的器件,有效地控制器件質(zhì)量,合理應(yīng)用器件,進(jìn)行可靠性設(shè)計(jì),達(dá)到業(yè)界領(lǐng)先的產(chǎn)品質(zhì)量是可以實(shí)現(xiàn)的。集成電路芯片在電子系統(tǒng)中起到越來(lái)越重要的作用,在以珍視生命的大前提下現(xiàn)代的醫(yī)療設(shè)備,汽車,武器裝備,航空設(shè)備等電子系統(tǒng)的使用,保障和維修費(fèi)用越來(lái)越龐大,經(jīng)濟(jì)可承受性成為一個(gè)不可回避的問題。現(xiàn)在,故障預(yù)測(cè)和健康管理技術(shù)在電子系統(tǒng)中已經(jīng)有廣泛的應(yīng)用,作為電子系統(tǒng)的主要部件和大腦的集成電路芯片能不能也采用故障預(yù)測(cè)和健康管理技術(shù)呢?能不能做到將故障預(yù)測(cè)的范圍從部件縮小到芯片呢?
2.故障預(yù)測(cè)與故障診斷
故障是產(chǎn)品不能完成規(guī)定功能或性能退化不滿足規(guī)定要求的狀態(tài)?,F(xiàn)在通常的做法是在故障發(fā)生后,通過故障診斷的方法找到故障原因。故障診斷是系統(tǒng)發(fā)生故障后,通過別的方式、手段來(lái)警戒用戶,因此故障診斷是事后維修的一個(gè)依據(jù)。事后維修是以系統(tǒng)故障為依據(jù),在系統(tǒng)出現(xiàn)故障后才進(jìn)行維修以恢復(fù)系統(tǒng)的正常功能。事后維修是最原始的維修方式,可以減少一些不必要的維修費(fèi)用,但當(dāng)一個(gè)部件出現(xiàn)故障時(shí)他可能會(huì)損壞其他部件,毀壞整個(gè)系統(tǒng),甚至危及人身安全。這是事后維修的局限性。
在這里提出新的概念—故障預(yù)測(cè)和健康管理。故障預(yù)測(cè)是以當(dāng)前的使用狀態(tài)為起點(diǎn),對(duì)將來(lái)可能出現(xiàn)的故障進(jìn)行預(yù)測(cè),向用戶及時(shí)提出警告,以便能夠采取措施避免重大惡性事故發(fā)生外,對(duì)現(xiàn)行的系統(tǒng)管理和維修制度也有開創(chuàng)性的作用,達(dá)到及時(shí)的故障預(yù)測(cè)和有效的健康管理。Ridgetop-Group 的故障預(yù)測(cè)和健康管理方案能夠告訴用戶當(dāng)前系統(tǒng)的健康狀態(tài)和剩余有用時(shí)間。因此故障診斷是發(fā)生在系統(tǒng)失效之后,故障預(yù)測(cè)和健康管理是發(fā)生在故障出現(xiàn)之前。下面給出Ridgetop Group 關(guān)于集成電路芯片器件和電子系統(tǒng)的故障預(yù)測(cè)說明圖1.
Ridgetop 建議如果芯片觸發(fā)了故障預(yù)測(cè)報(bào)警點(diǎn),說明芯片已經(jīng)接近它的實(shí)際壽命,應(yīng)該提前采取措施,預(yù)防重大事故發(fā)生,比如更換芯片或更換整個(gè)PCB板。
3.集成電路器件故障預(yù)測(cè)的應(yīng)用
故障預(yù)測(cè)和健康管理技術(shù)已經(jīng)應(yīng)用在航天、民用飛機(jī)、武器、軍事上,這里不在贅述。在這里將要討論集成電路芯片器件的故障預(yù)測(cè)技術(shù),首先應(yīng)知道有哪些因素導(dǎo)致芯片的壽命減短或在芯片的生命周期內(nèi)失效呢?ESD、TDDB(時(shí)間相關(guān)介質(zhì)擊穿)、NBTI(Negative Bias Temperature Instability)、電遷移、熱載流子、輻射損傷等實(shí)效機(jī)理是半導(dǎo)體中無(wú)法回避的。既然這些半導(dǎo)體效應(yīng)是不可避免的、不可回避的,就可以根據(jù)這些效應(yīng)進(jìn)行集成電路器件的壽命進(jìn)行預(yù)測(cè)??煽啃缘膯栴}實(shí)際上也是對(duì)未知的問題加以控制。美國(guó)Ridgetop-Group針對(duì)靜電損傷(ESD)、TDDB(Time Dependent Dielectric Breakdown)、電遷移、NBTI(Negative Bias Temperature Instability)、熱載流子、輻射損傷等失效機(jī)理,做到了在宿主器件剩余20%壽命時(shí)失效。 根據(jù)故障預(yù)測(cè)的結(jié)果或故障預(yù)測(cè)的報(bào)警點(diǎn)可以進(jìn)行預(yù)知維修,比如更換芯片或提供芯片的真正的使用壽命給芯片設(shè)計(jì)者。以至于把災(zāi)難性故障的風(fēng)險(xiǎn)降到最小,使系統(tǒng)或芯片器件發(fā)揮最大的效能。這里主要介紹ESD、HC、TDDB、NBTI的故障預(yù)測(cè)。
3.1 靜電損傷的故障預(yù)測(cè)
靜電損傷是半導(dǎo)體領(lǐng)域的難點(diǎn), 很多企業(yè)使用靜電腕帶或離子風(fēng)來(lái)減少靜電效應(yīng), 靜電損傷是不易被察覺的,它的影響也是不能馬上就能體現(xiàn)出來(lái)。但是靜電損傷的確是存在的,也是減少芯片器件生命周期的一個(gè)因素,也就是使對(duì)靜電損傷進(jìn)行故障預(yù)測(cè)成為有效使命。這里提供Ridgetop-Group關(guān)于靜電損傷的故障預(yù)測(cè)單元。
請(qǐng)看它的示意圖2.和ESD預(yù)測(cè)單元圖3。
圖 2. 示意圖
圖3. ESD 預(yù)測(cè)單元
從圖3.看, ESD故障預(yù)測(cè)單元是和用戶的主電路在同一芯片器件里, 和主電路處在相同的環(huán)境下,環(huán)境包括過高壓、 過低壓、 瞬時(shí)毛刺、濕度、惡劣的溫度及輻射。 因此ESD單元能夠預(yù)測(cè)主電路的使用壽命,給出預(yù)測(cè)報(bào)警點(diǎn),但是它需要占用額外的芯片管腳。
3.2 熱載流子(HC)的故障預(yù)測(cè)
熱載流子容易在N溝道MOS管靠近漏極處在二氧化硅或硅處形成負(fù)電荷陷阱。 熱載流子效應(yīng)是MOS管的一個(gè)重要失效機(jī)理,是大家所不希望的。 熱載流子容易導(dǎo)致MOS管的Vt增加和Id減小。示意圖4和圖5.
圖4. 漏極雪崩熱載流子 圖5. 溝道熱載流子
目前,通過施加電應(yīng)力加速M(fèi)OS器件中熱載流子效應(yīng)的產(chǎn)生,并以器件的某些參數(shù)(例如閾值電壓Vth、跨導(dǎo)gm等)變化量達(dá)到行業(yè)標(biāo)注為失效判據(jù),估算出器件在應(yīng)力作用下的壽命值,再根據(jù)一定的模型推算出正常工作條件下的壽命值—既芯片的設(shè)計(jì)壽命。Ridgetop-Group 提出了用在芯片中附加熱載流子單元方法來(lái)監(jiān)測(cè)熱載流子效應(yīng),實(shí)時(shí)監(jiān)測(cè)芯片的健康狀態(tài)和芯片的剩余使用壽命,使芯片的效能達(dá)到最大化。介紹一下HC單元的示意圖6. 和應(yīng)用圖7.
圖6 HC單元示意圖
圖7. HC單元應(yīng)用圖
如圖7.HC單元與主電路被放在一起,與主電路一樣受相同的外界應(yīng)力影響,這些外界應(yīng)力決定著芯片的壽命。當(dāng)主電路在測(cè)試方式下,這個(gè)單元將觸發(fā),進(jìn)入到預(yù)定的、連續(xù)的應(yīng)力和測(cè)試循環(huán),最終給出電路真正的壽命。
TDDB效應(yīng)的故障預(yù)測(cè)
TDDB效應(yīng)是由小幾何體, 多溝道,薄柵氧化層, NMOS 襯底注入引起的, 它容易造成噪聲增加,功耗增加,MOS管器件電參數(shù)不穩(wěn)定,如:闌值電壓漂移、跨導(dǎo)下降和漏電流增加等,甚至可引起MOS管失效。Ridgetop-Group TDDB 故障預(yù)測(cè)單元是利用和主電路在一起的利用JTAG 技術(shù)的TDDB物理單元加HALT 測(cè)試方法來(lái)實(shí)現(xiàn)的。
NBTI效應(yīng)的故障預(yù)測(cè)
NBTI效應(yīng)主要130納米及以下工藝中。當(dāng)柵源的電壓是負(fù)電壓,PMOS 容易發(fā)生NBTI效應(yīng)。在氧化硅和硅的界面處,負(fù)偏壓和/或溫度容易造成正阱,造成Vt 增加和Id的減少。造成電性的間歇性和失效, 導(dǎo)致芯片可靠性和壽命降低。Ridgetop-Group TDDB 故障預(yù)測(cè)單元是利用和主電路在一起的NBTI物理單元來(lái)實(shí)現(xiàn)的。
對(duì)于在半導(dǎo)體中的金屬遷移和輻射等效應(yīng),它們都在影響半導(dǎo)體壽命,有同樣類似的單元來(lái)對(duì)金屬遷移和輻射效應(yīng)等進(jìn)行預(yù)測(cè),只是它們針對(duì)不同的目的,不同的問題。這些單元與客戶的主電路隔離開,互不干擾,但它們實(shí)現(xiàn)了芯片內(nèi)部的自檢測(cè)試(BIST),達(dá)到要檢測(cè)的目的。對(duì)于這些效應(yīng)的預(yù)測(cè),請(qǐng)查閱Ridgetop Group 工作網(wǎng)站。
4 總結(jié)
故障預(yù)測(cè)技術(shù)是可以應(yīng)用在半導(dǎo)體設(shè)計(jì)中的,隨著最終用戶的要求越來(lái)越高,也要求芯片性能越來(lái)越高,如果能夠預(yù)測(cè)芯片的壽命,使系統(tǒng)維修和芯片的替換變得更容易、更簡(jiǎn)單。上述這些半導(dǎo)體效應(yīng)是不能避免的,但是它們是可以預(yù)知的, 因此故障預(yù)測(cè)技術(shù)可以應(yīng)用在半導(dǎo)體設(shè)計(jì)領(lǐng)域,將故障預(yù)測(cè)范圍縮小到芯片級(jí),避免重大惡性事故發(fā)生。
責(zé)任編輯:gt
-
芯片
+關(guān)注
關(guān)注
455文章
50714瀏覽量
423129 -
電子元器件
+關(guān)注
關(guān)注
133文章
3334瀏覽量
105333 -
控制器
+關(guān)注
關(guān)注
112文章
16332瀏覽量
177803
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論