對于其他的stm32芯片或者其他ARM Cortex-M芯片,其實解決方法都相通。建議先完整閱讀了本文之后,再對照著你所遇到問題的現(xiàn)象進(jìn)行調(diào)試。
1.基礎(chǔ)知識
在ARM Cortex-M系列處理器中,有若干個系統(tǒng)異常專用于 fault 處理。CM3 中的 Faults 可分為以下幾類:
(1).總線 faults;
(2).存儲器管理 faults;
(3).用法 faults;
(4).硬 fault;
1.1.總線 faults
當(dāng) AHB 接口上正在傳送數(shù)據(jù)時,如果回復(fù)了一個錯誤信號(error response),則會產(chǎn)生總線faults,產(chǎn)生的場合可以是:
(1).取指,通常被稱作“預(yù)取流產(chǎn)”(prefetch abort);
(2).數(shù)據(jù)讀/寫,通常被稱作“數(shù)據(jù)流產(chǎn)”(data abort);
在 CM3 中,執(zhí)行如下動作時,如果地址有誤,亦會觸發(fā)總線異常:
(1).中斷處理起始階段的堆棧 PUSH 動作。此時若發(fā)生總線 fault,則稱為“入棧錯誤”;
(2).中斷處理收尾階段的堆棧 POP 動作。此時若發(fā)生總線 fault,則稱為“出棧錯誤”;
(3).在處理器啟動中斷服務(wù)序列(sequence)后讀取向量時。這是一種極度罕見的特殊情況,被歸類為硬 fault。
總線 fault 狀態(tài)寄存器(BFSR),地址:0xE000_ED29,BFSR的各個位的定義如下:
Snipaste_2020-12-11_14-13-31
1.2.存儲器管理 faults
存儲器管理 faults 多與 MPU 有關(guān),其誘因常常是某次訪問觸犯了 MPU 設(shè)置的保護(hù)規(guī)范。另外,某些非法訪問,例如,在不可執(zhí)行的存儲器區(qū)域試圖取指,也會觸發(fā)一個 MemManage fault,而且在這種場合下,即使沒有 MPU 也會觸發(fā) MemMange fault。MemManage faults 的常見誘因如下所示:
(1).訪問了所有 MPU regions 覆蓋范圍之外的地址;
(2).訪問了沒有存儲器與之對應(yīng)的空地址;
(3).往只讀 region 寫數(shù)據(jù);
(4).用戶級下訪問了只允許在特權(quán)級下訪問的地址;
存儲器管理 fault 狀態(tài)寄存器(MFSR),地址:0xE000_ED28,MFSR的各個位的定義如下:
Snipaste_2020-12-11_14-19-19
1.3.用法 faults
用法 faults 發(fā)生的場合可以是:
(1).執(zhí)行了協(xié)處理器指令。Cortex-M3 本身并不支持協(xié)處理器,但是通過 fault 異常機(jī)制,可以建立一套“軟件模擬”的機(jī)制,來執(zhí)行一段程序模擬協(xié)處理器的功能,從而可以方便地在其它 Cortex 處理器間移植。
(2).執(zhí)行了未定義的指令。同上一點的道理,亦可以軟件模擬未定義指令的功能。
(3).嘗試進(jìn)入 ARM 狀態(tài)。因為 CM3 不支持 ARM 狀態(tài),所以用法 fault 會在切換時產(chǎn)生。軟件可以利用此機(jī)制來測試某處理器是否支持 ARM 狀態(tài)。
(4).無效的中斷返回(LR 中包含了無效/錯誤的值);
(5).使用多重加載/存儲指令時,地址沒有對齊。
另外,如果需要嚴(yán)格要求程序的質(zhì)量,還可以讓 CM3 在遇到除數(shù)為零的時候,以及遇到未對齊訪問的時候也產(chǎn)生用法 fault。在 NVIC 中有兩個控制位分別與它們對應(yīng)。通過設(shè)置這兩個控制位,就可以激活它們。
用法 fault 狀態(tài)寄存器(UFSR),地址:0xE000_ED2A,UFSR的各個位的定義如下:
Snipaste_2020-12-11_14-24-49
1.4.硬 fault
硬 fault 是上文討論的總線 fault、存儲器管理 fault 以及用法 fault 上訪的結(jié)果。如果這些 fault 的服務(wù)例程無法執(zhí)行,它們就會成為“硬傷” ——上訪( escalation)成硬 fault。另外,在取向量(異常處理時對異常向量表的讀?。r產(chǎn)生的總線 fault 也按硬 fault 處理。在 NVIC中有一個硬 fault 狀態(tài)寄存器(HFSR),它指出產(chǎn)生硬 fault 的原因。如果不是由于取向量造成的,則硬 fault 服務(wù)例程必須檢查其它的 fault 狀態(tài)寄存器,以最終決定是誰上訪的。
硬 fault 狀態(tài)寄存器(HFSR),地址:0xE000_ED2C,HFSR的各個位的定義如下:
Snipaste_2020-12-11_14-29-38
2.UsageFault INVPC置1解決過程
最近在使用RTOS增加DMA驅(qū)動時,在對內(nèi)存到設(shè)備和設(shè)備到內(nèi)存的DMA傳輸測試時,出現(xiàn)了UsageFault,并且UFSR中的INVPC置1了。最開始,單獨測試DMA發(fā)送是沒有問題的,但是DMA發(fā)送和接收一起測試時,就會出現(xiàn)UsageFault(INVPC置1)。這個異常不太好定位出現(xiàn)問題的具體位置,因此就檢查DMA驅(qū)動,并且逐步調(diào)試吧。最終,DMA驅(qū)動檢查和修改好了,仍然出現(xiàn)UsageFault,實在沒法了,還是從為什么會出現(xiàn)UsageFault(INVPC置1)開始分析吧。
2.1.出現(xiàn)UsageFault(INVPC置1)的原因
如果LR中的EXC_RETURN不是合法的值(合法值見下圖,包括企圖返回ARM狀態(tài)),則引起用法fault。如果用法fault被除能,也上訪成硬fault。此時,用法Fault狀態(tài)寄存器(UFSR,地址:0xE000_ED2A)中的INVPC位(位偏移:2),或者是INVSTATE位(位偏移:1)置位。
Snipaste_2020-12-11_15-13-23
上面就是出現(xiàn)該異常的文字分析了。
2.2.UsageFault(INVPC置1)的解決過程
因為該異常是異常響應(yīng)期間才可能出現(xiàn)的異常(<
我這里是每次開始DMA測試之后,就進(jìn)入UsageFault異常,并且我的系統(tǒng)中目前就打開了SysTick,PendSV,DMA1_STREAM5,DMA1_STREAM6,NMI,HardFault,MemFault,BusFault,UsageFault這些異常和中斷。因此我在開始DMA測試的時候打一個斷點,在程序運行到DMA測試開始的斷點處時,再在DMA1_STREAM5,DMA1_STREAM6,NMI,HardFault,MemFault,BusFault,UsageFault這些函數(shù)的入口打斷點,在PendSV的返回處打斷點,SysTick就暫時先不管。然后全力運行,發(fā)現(xiàn)每次都會在PendSV的異常返回斷點處停留(因為任務(wù)切換嘛)總共在PendSV的斷點處停留了大概7到8次,就進(jìn)入到了UsageFault。
有了上面步驟的鋪墊,先去除中斷和異常中的斷點,還是先在DMA測試開始處打斷點,等運行到DMA測試開始處,再在上述的中斷和異常相關(guān)位置打斷點。接下來我就慢慢的調(diào)試,在開始DMA測試之后,全速運行,在退出PendSV異常時,執(zhí)行單步運行到下一步,重復(fù)7到8次,從PendSV就進(jìn)入了UsageFault,在這7到8次中,我看在退出PendSV時,LR寄存器中的值都是0xFFFFFFFD,是合法的啊,當(dāng)時仔細(xì)一想,有可能是退出異常時硬件再將堆棧中的PC賦值給PC時出問題,導(dǎo)致進(jìn)入了UsageFault。果不其然,在PenSV退出之前,我查看每個PSP(0xFFFFFFFD:返回線程模式,并使用線程堆棧)對應(yīng)內(nèi)存數(shù)值,能夠正常退出PendSV的寄存器和PSP堆棧內(nèi)容如下圖所示:
Snipaste_2020-12-11_16-38-20
Snipaste_2020-12-11_16-43-28
進(jìn)入UsageFault異常之前的寄存器和PSP堆棧內(nèi)容如下圖所示:
Snipaste_2020-12-11_16-45-35
Snipaste_2020-12-11_16-47-17
此處堆棧中的內(nèi)容,明顯的0x20003D94堆棧中的PC值是有問題的,我的程序是燒寫到flash中的PC地址應(yīng)該是08xxxxxx,然而現(xiàn)在堆棧中的PC地址是0x20003DA8,這個地址是SRAM中的地址,SRAM存儲的數(shù)據(jù)而不是代碼,出現(xiàn)這個問題的原因,猜想一下,應(yīng)該就是任務(wù)堆棧溢出導(dǎo)致,當(dāng)我增加任務(wù)堆棧的大小之后,哈哈,程序正常運行,世界是如此美好。
3.調(diào)試小結(jié)
3.1.解決過程小結(jié)
其實上面的步驟2,是我自己的一個調(diào)試解決問題的過程,這里給大家提供一個比較直接的解決方式。在開始運行程序之前,直接在UsageFault異常入口函數(shù)中打一個斷點,然后全速運行程序,等程序停止在UsageFault異常函數(shù)的斷點處時,需要注意以下幾點:
(1).如果LR是合法值,那么根據(jù)LR判斷退出異常時使用的堆棧,然后在Memory查看窗口中,查看堆棧中R0,R1,R2,R3,R12,LR,PC,xPSR這些寄存器的值,根據(jù)這些寄存器的值,判斷是否是堆棧溢出導(dǎo)致該異常發(fā)生;如果不是堆棧溢出導(dǎo)致該異常發(fā)生,那么就要根據(jù)PC值,在匯編窗口中跳轉(zhuǎn)到PC值對應(yīng)的代碼處,分析導(dǎo)致異常發(fā)生的原因;
(2).如果LR不是合法值,就要分析下你的代碼中,有哪些地方修改過LR的值,確保修改的值要是合法的。
3.2.關(guān)于UsageFault 如何才能讓INVPC置1
(1).在退出異?;蛑袛鄷r,執(zhí)行BX LR時,LR的值是非法的,此時就會觸發(fā)UsageFault異常,并且INVPC置1。
(2).在退出異常或中斷時,執(zhí)行BX LR時,LR的值是合法的,但是退出異常之后要使用的堆棧中,堆棧里面的PC值是有問題的,此時就有可能觸發(fā)UsageFault異常,并且INVPC置1。
對于上面的兩點的模擬其實也比較好做,在PendSV或者其他異常的退出的地方打一個斷點,然后手動修改LR或者堆棧中PC的值,就能觸發(fā)UsageFault異常,并且INVPC置1。這里注意一下,修改堆棧中PC的值,我這里測試時候,設(shè)置PC值為其他值可能引起其他的異常,貌似修改PC的值為RAM中數(shù)據(jù)區(qū)的地址才會出現(xiàn)該異常,不太清楚為什么會這樣,可能是數(shù)據(jù)區(qū)是沒有執(zhí)行代碼的權(quán)限,因此出異常吧,不太確定,有知道的朋友,歡迎留言講解。
審核編輯:劉清
-
ARM
+關(guān)注
關(guān)注
134文章
9084瀏覽量
367379 -
存儲器
+關(guān)注
關(guān)注
38文章
7484瀏覽量
163761 -
中斷處理
+關(guān)注
關(guān)注
0文章
94瀏覽量
10967 -
Cortex-M
+關(guān)注
關(guān)注
2文章
229瀏覽量
29752 -
STM32芯片
+關(guān)注
關(guān)注
0文章
38瀏覽量
4376
原文標(biāo)題:ARM Cortex-M 異常-HardFault(UsageFault) INVPC置1解決過程
文章出處:【微信號:嵌入式那些事,微信公眾號:嵌入式那些事】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論