作者:Henrik Nyholm,Jacob Lunn Lassen
在設計安全關鍵系統(tǒng)時,國際安全標準對我們選擇適當?shù)墓に嚭瓦m當?shù)募夹g來檢測和避免最終產品中的危險故障至關重要。這些標準確保我們不會陷入與之前的安全工程師同行相同的坑。
然而,這些標準的危險在于,它們假設你對底層硬件(比如微控制器)有詳細的了解,這可能會導致經驗不足的安全工程師實施不安全的設計。例如,IEC(國際電工委員會)60730標準建議使用棋盤格內存測試來檢測B類軟件可變存儲器中的直流故障,這比看起來更具挑戰(zhàn)性。
本文描述了SRAM的邏輯和物理布局之間未記錄的差異如何導致我們無意中錯誤地實施諸如棋盤格算法之類的內存測試。標準微控制器的數(shù)據(jù)表中通常沒有必要的信息,但幸運的是,有些存儲器測試算法不受SRAM邏輯和物理布局差異的影響。
在運行時測試 SRAM 是否存在缺陷
SRAM存儲器顯然由IC供應商在生產中進行測試,有缺陷的產品不會運送給消費者。盡管如此,在IC的使用壽命期間,隨機硬件缺陷可能并且將會出現(xiàn),這也是在安全關鍵應用中需要在運行時測試微控制器中的硬件的原因之一。
棋盤格內存測試
IEC 60730 (H.2.19.6.1) 等安全標準表明,對于必須符合 B 類安全等級的應用,可以使用棋盤算法來識別 SRAM 中的某些缺陷(直流故障)。通常選擇棋盤格測試,因為它涵蓋了SRAM中最可能的故障,并且速度相對較快,可以方便地將對應用本身的性能影響降至最低。除了位永久卡在高電平或低電平的直流故障外,棋盤格算法還可以檢測相鄰位相互影響的缺陷。
SRAM在邏輯上由許多用單詞組織的位組成。這些字通常為 8 位、16 位或 32 位寬,但也可以更長。從物理上講,這些位被組織成數(shù)組,其中每個位通常有八個相鄰位(參見圖1)。位中的物理缺陷會影響單個位,使其卡在高電平或低電平(直流故障),或者缺陷可能位于兩個位的分離中,在這種情況下,相鄰的侵略者單元(在圖1中以紫色標記)可能會影響受害單元(在圖1中以黃色標記)。侵略者-受害者場景通常稱為耦合故障。從統(tǒng)計學上看,直流故障更有可能發(fā)生,但檢測最可能的耦合故障仍然相關。
圖1 - 相鄰位之間的潛在耦合故障。
如果故障影響單個位,導致該位卡在高電平或低電平,則可以通過寫入值 1,通過讀回來驗證 1,然后寫入值零并通過讀回來驗證零來顯示它,如圖 1 所示。另一方面,如果缺陷是兩個相鄰位之間的耦合錯誤,例如第 2 行中的位列 9 和 10,則某些模式(例如所有 1 或所有 0)不會顯示耦合故障,因為單元格在測試期間具有相同的值。
相鄰單元(側面、上方和下方)的耦合故障具有相反的二進制值。圖1(右下)說明位10中的位污染了位9,由于位9未保持預期值為零,因此揭示了耦合故障。
SRAM 的物理布局與邏輯布局
為了使棋盤格算法正常工作,需要知道哪些位是相鄰位。事實證明這是一個問題,因為數(shù)據(jù)手冊通常只描述SRAM的邏輯布局,而不是SRAM的物理組織方式。
要了解SRAM的物理布局,必須區(qū)分面向位的存儲器(BOM)和面向字的存儲器(WOM),前者當時可以訪問一位,后者當時讀取和寫入n位字。雖然大多數(shù)現(xiàn)實世界的內存都是以口碑形式實現(xiàn)的,但科學文獻中的經典內存測試算法通常假設BOM實現(xiàn)。
對于口碑記憶,構成單詞的位的物理組織主要分為三類:相鄰、交錯和子數(shù)組。邏輯布局將每個單詞放在同一列中前一個單詞的下方(類似地址空間),而相鄰的存儲器將每個單詞放在同一行中,彼此相鄰,如圖 2 所示。交錯架構將字的每個位分隔到SRAM陣列的不同列和行中。最后,子陣列組織將字的每個位放置在SRAM的不同物理上獨立的塊中?,F(xiàn)實情況是,您不知道物理布局,這是正確實施棋盤格測試所必需的。
圖 2 - 面向單詞的存儲器的物理布局示例。
棋盤格測試的特性和缺點
實現(xiàn)棋盤格算法的簡單方法是交替地將值0xAA(假設是 8 位數(shù)據(jù)字)寫入第一個地址,0x55寫入下一個地址,直到所有被測地址都填充了棋盤格模式 1 和 0。然后驗證該模式以檢測相鄰電池之間的任何直流或耦合故障。然后使用反向模式重復該過程。如前所述,有一個問題:內存邏輯布局中的棋盤圖案可能不是底層物理布局中的棋盤圖案,如圖 3 所示。
圖3 - 邏輯SRAM與物理SRAM的數(shù)據(jù)模式。
補償邏輯布局和物理布局之間的差異似乎很明顯,但器件的數(shù)據(jù)表中很少提供必要的信息。那么,你會怎么做呢?接受較低的覆蓋率,畢竟診斷仍然會覆蓋直流故障和相鄰位之間的一些耦合故障?向 IC 供應商請求布局,并為每個器件定制棋盤格測試?還是選擇其他算法?
現(xiàn)在您已經意識到棋盤測試的潛在缺點,您可以做出明智的決定。
SRAM 運行時測試的替代算法
IEC 60730中針對C類安全級別提出的存儲器測試技術具有更高的故障檢測覆蓋率,但這些算法屬于可以被認為是生產測試算法的算法:它們需要更長的運行時間,也可以檢測罕見的故障類型,但通常會破壞存儲在SRAM中的數(shù)據(jù),因為它們在整個SRAM上運行,而不是在子塊中運行。
一般來說,對于我們的嵌入式設計,我們不太能容忍這種情況。因此,我們建議您考慮從生產測試三月算法改編的混合三月算法:這些算法可用于 WOM 優(yōu)化實現(xiàn)并提供高測試覆蓋率。此外,可以實現(xiàn)這些混合March算法,以便它們在SRAM的較小重疊部分上運行,以避免一次擦除SRAM中的所有數(shù)據(jù),這意味著可以避免重新啟動嵌入式系統(tǒng)。March算法的缺點是它們比傳統(tǒng)的棋盤格算法計算量更大,但這是安全關鍵系統(tǒng)中可能需要的費用。
如果您考慮將傳統(tǒng)的棋盤格測試換成三月測試,您可以從一些微控制器供應商那里找到這樣的實現(xiàn)。Microchip是提供March C-算法的性能優(yōu)化實現(xiàn)的公司之一,作為其軟件診斷庫的一部分。Microchip實現(xiàn)支持整個SRAM的測試,通常在啟動時完成,只是為了獲得最大的測試覆蓋率,以及較小的存儲器塊的測試,旨在減少對應用的實時影響。
審核編輯:郭婷
-
微控制器
+關注
關注
48文章
7542瀏覽量
151316 -
嵌入式
+關注
關注
5082文章
19104瀏覽量
304803 -
sram
+關注
關注
6文章
767瀏覽量
114675
發(fā)布評論請先 登錄
相關推薦
評論