前言
最近在開(kāi)發(fā)調(diào)試基于RT-Thread 的驅(qū)動(dòng)時(shí),遇到一個(gè)比較奇怪的死機(jī)問(wèn)題,后來(lái)經(jīng)過(guò)一步步排查,終于發(fā)現(xiàn)是驅(qū)動(dòng)的鏈表節(jié)點(diǎn)沒(méi)有初始化造成的死機(jī)
問(wèn)題分析
RT-Thread 的驅(qū)動(dòng)開(kāi)發(fā)完成后,通過(guò)編寫(xiě)串口 shell 測(cè)試命令,運(yùn)行命令后,觸發(fā)死機(jī)
由于當(dāng)前缺少單步的調(diào)試方法,只能通過(guò)增加LOG與打開(kāi)關(guān)閉部分軟件功能,一步步縮小范圍
在函數(shù)調(diào)用的入口,把某些關(guān)鍵的函數(shù)調(diào)用分別注釋掉驗(yàn)證,這樣逐步驗(yàn)證下來(lái),最終縮小到一個(gè)函數(shù),調(diào)用這個(gè)函數(shù)就觸發(fā)死機(jī)。
用到的軟件調(diào)試方法
(1)增加LOG,確認(rèn)代碼能執(zhí)行到哪些函數(shù),能執(zhí)行到哪些行
(2)通過(guò) #if 0 A_CODE #else B_CODE #endif 條件編譯的調(diào)試方法,大塊注釋部分代碼,確認(rèn)代碼執(zhí)行的路徑,縮小排查方向,確認(rèn)是執(zhí)行到哪個(gè)函數(shù)或模塊造成死機(jī)的
(3)通過(guò)對(duì)比代碼來(lái)確認(rèn)問(wèn)題,比如軟件正常工作過(guò),后來(lái)改動(dòng)死機(jī)了,大概率說(shuō)明是改動(dòng)造成的,所以可以通過(guò) git BCompare.exe 等代碼管理與比對(duì)工具,代碼回溯,兩份新舊代碼對(duì)比分析,逐步把排查范圍縮小,從代碼層面分析可能造成死機(jī)的原因
問(wèn)題分析
軟件調(diào)試有時(shí)候比較的簡(jiǎn)單,有時(shí)候會(huì)比較的復(fù)雜,由于這個(gè)驅(qū)動(dòng)移植來(lái)自其他系統(tǒng)的,數(shù)據(jù)結(jié)構(gòu)里面的成員比較的多,所以初步通過(guò)代碼對(duì)比工具如 BCompare 進(jìn)行代碼對(duì)比,發(fā)現(xiàn)了一點(diǎn)端倪:由于RT-Thread 暫時(shí)不支持 hash list(哈希鏈表),我把 hash list的功能實(shí)現(xiàn) 改為了 RT-Thread 的 list 替代,struct rt_list_node。
對(duì)比了軟件的其他改動(dòng)點(diǎn),雖然改動(dòng)部分較大,但軟件工作流程差不多,初步排查代碼沒(méi)有實(shí)質(zhì)性的差異
通過(guò)進(jìn)一步的排查并縮小范圍,終于發(fā)現(xiàn)了問(wèn)題點(diǎn):這個(gè)函數(shù)在 插入鏈表 的操作部分死機(jī)了!
通過(guò)代碼繼續(xù)網(wǎng)上找,發(fā)現(xiàn)這個(gè)包含 RT-Thread list 的數(shù)據(jù)節(jié)點(diǎn),是通過(guò) rt_malloc 申請(qǐng)的,并且沒(méi)有看到成員 list 使用 rt_list_init 初始化鏈表的操作
所以馬上確認(rèn)了問(wèn)題: 鏈表的節(jié)點(diǎn)沒(méi)有初始化造成的,通過(guò)增加 list 初始化,本以為立即解決了問(wèn)題,但是竟然依舊死機(jī)!
意外的BUG發(fā)現(xiàn):數(shù)據(jù)節(jié)點(diǎn)的鏈表的頭,也就是 鏈表 head 也沒(méi)有初始化,解決方法同上,需要初始化 鏈表的頭:使用 rt_list_init,這樣問(wèn)題得到解決
移植的代碼之前使用的 hashlist,聲明時(shí)即初始化了,不需要顯示的初始化,而RT-Thread list,必須初始化,否則把鏈表節(jié)點(diǎn)插入 鏈表頭部的時(shí)候,就會(huì)出現(xiàn) 野指針或空指針 訪問(wèn)成員的問(wèn)題,肯定會(huì)出問(wèn)題。
解決方法就是 增加鏈表初始化操作
問(wèn)題回顧
由于先前移植的樣板驅(qū)動(dòng)使用的是 hash list,造成移植后沒(méi)有初始化數(shù)據(jù)結(jié)構(gòu)的鏈表節(jié)點(diǎn),觸發(fā)了死機(jī)。所以驅(qū)動(dòng)移植時(shí),遇到鏈表時(shí),一定要注意 鏈表頭與鏈表節(jié)點(diǎn)的 鏈表初始化問(wèn)題
另一個(gè)注意點(diǎn):操作空指針的成員,異常信息里面,可能會(huì)提示 異常出在一個(gè) 較小的 內(nèi)存地址上。所以遇到死機(jī),并且發(fā)現(xiàn)死機(jī)的 內(nèi)存地址很小,可以往 空指針?lè)较蚺挪?/p>
RT-Thread 雙向循環(huán)鏈表的操作,由于使用的是【宏定義】,也就是鏈表操作函數(shù)本身沒(méi)有判空的操作,用戶(hù)需要有鏈表指針判空的操作。
訪問(wèn)一個(gè)空指針的結(jié)構(gòu)體成員,肯定會(huì)觸發(fā)內(nèi)存異常死機(jī)。 如 buffer->list 中的 list 為 RT_NULL,那么訪問(wèn) buffer->list->next 時(shí)候,list 中的 next 成員地址就是非法的內(nèi)存地址(小地址),就會(huì)出現(xiàn)異常死機(jī)
小結(jié)
鏈表操作需要謹(jǐn)慎,不只是要把 鏈表頭 申請(qǐng)為 全局的,而且每個(gè)鏈表的節(jié)點(diǎn),都是需要全局的。
注意鏈表節(jié)點(diǎn)會(huì)嵌入到一個(gè)復(fù)雜的數(shù)據(jù)結(jié)構(gòu)里面,并且使用動(dòng)態(tài)內(nèi)存申請(qǐng)的方式 創(chuàng)建,這是一定要注意不要漏下 鏈表成員的初始化。
-
驅(qū)動(dòng)器
+關(guān)注
關(guān)注
52文章
8226瀏覽量
146251 -
Shell
+關(guān)注
關(guān)注
1文章
365瀏覽量
23356 -
RT-Thread
+關(guān)注
關(guān)注
31文章
1285瀏覽量
40081
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論