1案例背景
最近有個客戶使用S32K146的產(chǎn)品在量產(chǎn)之后出現(xiàn)了三個售后件,ABBA測試之后的結(jié)果表明失效現(xiàn)象跟著S32K146走;同時客戶反饋說試著將其中一個售后件重新燒錄程序,S32K146又正常工作了。結(jié)合這兩種情況,S32K146應該是沒有損壞的,那就需要從軟件程序方面排查了。
然后和客戶的軟件工程師交流了一下,使用Attaching to Running Target的方式發(fā)現(xiàn)程序卡死在HardFault。因為是量產(chǎn)產(chǎn)品出問題,客戶強烈要求去現(xiàn)場處理問題,特地記錄下這次處理S32K146的hard fault問題的過程,希望對讀者有幫助。
2方案準備
在這之前,筆者還沒有處理過S32K1系列發(fā)生HardFault的問題,所以需要先對S32K1系列發(fā)生HardFault的原因進行了解。推薦如下這篇文章,講得非常細致。
結(jié)合上面這篇文章以及ARM官方的M4內(nèi)核文檔Cortex -M4 Devices Generic User Guide ^[1]^ ,筆者簡要整理了下S32K1發(fā)生HardFault的可能原因以及排查方式,如下文所述。
2.1 HardFault(硬件錯誤異常)
- HardFault的可能原因
- 停止調(diào)試關(guān)閉時發(fā)生了調(diào)試事件;
- UsageFault、BusFault、MemManage Fault未使能(Coretex-M4F內(nèi)核默認狀態(tài))時發(fā)生了相應的錯誤導致錯誤升級到HardFault;
- 異常處理過程中取內(nèi)核中斷向量表讀操作錯誤。
- HardFault的原因排查 造成HardFault的原因,可通過SCB模塊的硬件錯誤狀態(tài)寄存器(HFSR)進行排查,如下所示:
- 原因1引起的,DEBUGEVT bit置1;
- 原因2引起的,F(xiàn)ORCED bit置1;
- 原因3引起的,VECTTBL bit置1。
HFSR寄存器
2.2 UsageFault(用法錯誤異常)
- UsageFault的可能原因
- 執(zhí)行未定義指令,即非法指令;
- 指令執(zhí)行狀態(tài)錯誤;
- 異常返回錯誤;
- 嘗試訪問關(guān)閉或者不可用的協(xié)處理器;
- 非對齊地址訪問(需要先通過SCB模塊的CCR寄存器進行使能);
- 除零操作(需要先通過SCB模塊的CCR寄存器進行使能)。
- UsageFault的原因排查 造成UsageFault的原因,可通過SCB模塊的用法錯誤狀態(tài)寄存器(UFSR)進行排查,如下所示:
- 原因1引起的,UNDEFINSTR bit置1;
- 原因2引起的,INVSTATE bit置1;
- 原因3引起的,INVPC bit置1;
- 原因4引起的,NOCP bit置1;
- 原因5引起的,UNALIGNED bit置1;
- 原因6引起的,DIVBYZERO bit置1。
UFSR寄存器
2.3 BusFault(總線錯誤異常)
BusFault的可能原因
- a. 異常/中斷入口壓棧;
- b. 異常/中斷返回出棧;
- c. 預取指;
- d. FPU lazy state現(xiàn)場保護;
BusFault的原因排查 造成BusFault的原因,可通過SCB模塊的總線錯誤狀態(tài)寄存器(BFSR)進行排查,如下所示:
- 原因1.a引起的,STKERR bit置1;
- 原因1.b引起的,UNSTKERR bit置1;
- 原因1.c引起的,IBUSERR bit置1;
- 原因1.d引起的,LSPERR bit置1;
- 原因2引起的,PRECISERR bit置1;
- 原因3引起的,IMPRECISERR bit置1。
BFSR寄存器
2.4 MemManage Fault(存儲器管理錯誤異常)
- MemManage Fault的可能原因
- 嘗試加載和儲存內(nèi)核MPU保護的地址;
- 從內(nèi)核MPU保護的地址取指;
- 由MPU違規(guī)引起的壓棧和出棧(函數(shù)調(diào)用或者中斷/異常處理)錯誤;
- 硬件FPU lazy state保護觸發(fā)的MPU存儲器保護違規(guī)。
- MemManage Fault的原因排查 造成MemManage Fault的原因,可通過SCB模塊的存儲器管理錯誤狀態(tài)寄存器(MMFSR)進行排查,如下所示:
- 原因1引起的,DACCVIOL bit置1;
- 原因2引起的,IACCVIOL bit置1;
- 原因3引起的,MSTKERR或MUNSTKERR bit置1;
- 原因4引起的,MLSPERR bit置1;
MMFSR寄存器
UFSR、BFSR、MMFSR寄存器都是SCB模塊中CFSR寄存器的子寄存器,包含關(guān)系如下,實際調(diào)試時查看CFSR寄存器即可。
CFSR寄存器如果要訪問UFSR、BFSR、MMFSR這些子寄存器,可以按照如下的地址進行訪問:
CFSR子寄存器地址
3現(xiàn)場支持
了解了引起HardFault的可能原因以及排查方式之后,就是按照該方法協(xié)助客戶進行原因排查。
3.1 現(xiàn)場環(huán)境
客戶的現(xiàn)場環(huán)境如下:
3.2 排查過程
- 打開和異常件對應的軟件工程,使用Attach方式連接上第一個異常件的主控S32K146,如下圖所示:
- 進入仿真界面后,暫停之后發(fā)現(xiàn)程序卡死在hard fault。
- 查看S32的SCB模塊,HFSR寄存器的FORCED bit置1,說明是其它錯誤上升到hard fault,需要查看CFSR寄存器了解更多信息。
- CFSR寄存器的BFARVALID bit 和PRECISERR bit都置1,說明是精確總線錯誤造成bus fault并且捕捉保存了精確總線錯誤發(fā)生時的數(shù)據(jù)訪問地址;再去查看BFAR寄存器,發(fā)生錯誤時數(shù)據(jù)訪問的地址是0x100010E8。
- 使用同樣的方法排查第二個異常件的主控MCU,也是精確總線錯誤造成的bus fault,發(fā)生錯誤時數(shù)據(jù)訪問的地址是0x10001128。
- 接著通過IAR查看下S32K146的memory,從地址0x10001128起始的8個字節(jié)長度的flash區(qū)域數(shù)據(jù)無法查看。
- 翻閱S32K1的memory相關(guān)的應用筆記AN11983: Using the S32K1xx EEPROM Functionality – Application Note ^[2]^ ,發(fā)生錯誤的地址屬于D-Flash,如下圖所示:
S32K1xx Memory Map
- 查閱軟件代碼中讀寫DFlash中這塊地址的函數(shù),發(fā)現(xiàn)在寫DFLASH之前雖然進行了擦寫操作,但是并沒有設置擦寫成功之后才能寫DFlash的條件,有概率出現(xiàn)擦寫不完全的情況下寫D-Flash。同時,客戶查看了其他組未出問題的產(chǎn)品的軟件代碼,在寫D-Flash之前添加了比較多的條件判斷,包含對擦寫狀態(tài)的判斷。至此,該問題初步得到解決,剩下的就是優(yōu)化代碼并跟進后續(xù)產(chǎn)品的表現(xiàn)了。
4異常模擬
客戶的問題雖然解決了,但是筆者還是不確定連續(xù)兩次對同一塊區(qū)域的Flash寫不同的值,中間沒有擦除動作,是否會讓MCU卡在HardFault,所以使用手上的S32K144開發(fā)板進行了該情況的模擬。
4.1 測試環(huán)境
- 開發(fā)環(huán)境:S32 Design Studio for ARM 2.2
- SDK:RTM 3.0.0
- 開發(fā)板:S32K144EVB-Q100
4.2 測試過程
- 打開S32DS 2.2,選擇自帶的例程 flash_partitioning_s32k144 。
- 將初始化模擬EEPROM的部分注釋掉,避免D-Flash被用作模擬EEPROM的備份區(qū)從而無法進行讀寫測試。
- 定義一套新數(shù)組并儲存新的數(shù)據(jù)用于測試。
- 在正常的D-Flash寫之后增加寫入不同數(shù)據(jù)的操作。
- 編譯之后進行debug,單步調(diào)試發(fā)現(xiàn)如果只進行寫不同數(shù)據(jù)進入D-Flash,S32K144不會進入HardFault,需要再執(zhí)行讀D-Flash的操作,才會進入HardFault。
如果想要了解讀取Flash地址的數(shù)據(jù)才會發(fā)生HardFault的原因。
- S32DS之所以能在控制臺顯示比較多的MCU異常信息,是因為在調(diào)試器界面使能了異常捕捉功能,這部分功能依賴的是DEMCR寄存器,如下圖所示。
異常捕捉配置
DEMCR寄存器
-
ARM
+關(guān)注
關(guān)注
134文章
9084瀏覽量
367381 -
寄存器
+關(guān)注
關(guān)注
31文章
5336瀏覽量
120230 -
內(nèi)核
+關(guān)注
關(guān)注
3文章
1372瀏覽量
40276 -
軟件
+關(guān)注
關(guān)注
69文章
4921瀏覽量
87394 -
燒錄程序
+關(guān)注
關(guān)注
0文章
20瀏覽量
9325
發(fā)布評論請先 登錄
相關(guān)推薦
評論