1. 粉絲問題
自己編寫的一個(gè)協(xié)議相關(guān)代碼,位域的值解析和自己想象的有出入。
問題
結(jié)構(gòu)體的頭:
解析代碼和測(cè)試結(jié)果:
就是說通過函數(shù)hexdump()解析出的內(nèi)存是十六進(jìn)制是 81 83 20 3B 。..。..
從數(shù)據(jù)幀解析出的
opcode = 0x8
該粉絲不明白為什么解析出的值是0x8。
這個(gè)問題其實(shí)就是位域的問題和字節(jié)序的問題。
測(cè)試代碼
廢話不多說,直接寫個(gè)測(cè)試代碼
#include 《stdio.h》
//簡(jiǎn)化的結(jié)構(gòu)體
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
unsigned char a;
unsigned char b;
};
main()
{
struct iphdr t;
unsigned char *s;
//清空內(nèi)存,防止有亂碼
memset(&t,0,4);
//用指針指向結(jié)構(gòu)體變量t
s = (unsigned char*)&t;
//通過數(shù)組訪問的方式修改內(nèi)存的值,因?yàn)閔exdump解析的值是0x81 83,
//所以0x81必為最低字節(jié)的內(nèi)存的數(shù)據(jù)
s[0] = 0x81;
s[1] = 0x83;
//打印出位域成員的值
printf(“fin:%d rsv:%d opcode:%d mask:%d paylod:%d
”,
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執(zhí)行結(jié)果:
fin:1,rsv:0,opcode:8,mask:1 paylod:65
分析:如下圖所示,紫色部分是位域成員對(duì)應(yīng)的內(nèi)存中的實(shí)際空間布局,地址從左到右增加第一個(gè)字節(jié)的0x81賦值后,各位域?qū)?yīng)的二進(jìn)制:
fin:1
rsv:0
opcode:1000
mask:1
paylod:1000001
如上圖多少,內(nèi)存的第1個(gè)字節(jié)是0x81,第2個(gè)字節(jié)是0x83;
第一個(gè)字節(jié)0x81的最低的bit[0]對(duì)應(yīng)fin,bit[3:1]對(duì)應(yīng)rsv,bit[7:4]對(duì)應(yīng)opcode;第二個(gè)字節(jié)0x83的最低bit[0]對(duì)應(yīng)mask,bit[7:1]對(duì)應(yīng)payload。
所以結(jié)果顯而易見。
2、什么是位域?
有些信息在存儲(chǔ)時(shí),并不需要占用一個(gè)完整的字節(jié), 而只需占幾個(gè)或一個(gè)二進(jìn)制位。
例如在存放一個(gè)開關(guān)量時(shí),只有0和1 兩種狀態(tài), 用一位二進(jìn)位即可。為了節(jié)省存儲(chǔ)空間,并使處理簡(jiǎn)便,C語言又提供了一種數(shù)據(jù)結(jié)構(gòu),稱為“位域”或“位段”。
所謂“位域”是把一個(gè)字節(jié)中的二進(jìn)位劃分為幾個(gè)不同的區(qū)域,并說明每個(gè)區(qū)域的位數(shù)。
每個(gè)域有一個(gè)域名,允許在程序中按域名進(jìn)行操作。這樣就可以把幾個(gè)不同的對(duì)象用一個(gè)字節(jié)的二進(jìn)制位域來表示。一、位域的定義和位域變量的說明位域定義與結(jié)構(gòu)定義相仿,其形式為:
struct 位域結(jié)構(gòu)名
{
位域列表
};
其中位域列表的形式為:
類型說明符 位域名:位域長(zhǎng)度
如粉絲所舉的實(shí)例:
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
unsigned char a;
unsigned char b;
};
位域變量的說明與結(jié)構(gòu)變量說明的方式相同??刹捎孟榷x后說明,同時(shí)定義說明或者直接說明這三種方式。例如:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
說明data為bs變量,共占兩個(gè)字節(jié)。其中位域a占8位,位域b占2位,位域c占6位。對(duì)于位域的定義尚有以下幾點(diǎn)說明:
一個(gè)位域必須存儲(chǔ)在同一個(gè)字節(jié)中,不能跨兩個(gè)字節(jié)。
如一個(gè)字節(jié)所??臻g不夠存放另一位域時(shí),應(yīng)從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs
{
unsigned a:4
unsigned :0 /空域/
unsigned b:4 /從下一單元開始存放/
unsigned c:4
};
在這個(gè)位域定義中,a占第一字節(jié)的4位,后4位填0表示不使用,b從第二字節(jié)開始,占用4位,c占用4位。
位域可以無位域名,這時(shí)它只用來作填充或調(diào)整位置。無名的位域是不能使用的。例如:
struct k
{
int a:1
int :2 /該2位不能使用/
int b:3
int c:2
};
從以上分析可以看出,位域在本質(zhì)上就是一種結(jié)構(gòu)類型, 不過其成員是按二進(jìn)位分配的。
這是位域操作的表示方法,也就是說后面加上“:1”的意思是這個(gè)成員的大小占所定義類型的1 bit,“:2”占2 bit,依次類推。當(dāng)然大小不能超過所定義類型包含的總bit數(shù)。
一個(gè)bytes(字節(jié))是8個(gè) bit(二進(jìn)制位)。例如你的結(jié)構(gòu)體中定義的類型是u_char,一個(gè)字節(jié),共8個(gè)bit,最大就不能超過8。32位機(jī)下,short是2字節(jié),共16bit,最大就不能超過16,int是4字節(jié),共32bit,最大就不能超過32.依次類推。
位域定義比較省空間。
例如你上面的結(jié)構(gòu),定義的變量類型是u_char,是一字節(jié)類型,即8bit。
fc_subtype占了4bit,fc_type占2bit,fc_protocol_version占2bit,共8bit,正好是一個(gè)字節(jié)。
其他八個(gè)成員,各占1bit,共8bit,正好也是一個(gè)字節(jié)。
因此你的結(jié)構(gòu)的大小如果用sizeof(struct frame_control)計(jì)算,就是2bytes。
3. 如何測(cè)試當(dāng)前是大端還是小端?
計(jì)算機(jī)硬件有兩種儲(chǔ)存數(shù)據(jù)的方式:大端字節(jié)序(big endian)和小端字節(jié)序(little endian)。大端字節(jié)序:高位字節(jié)在前,低位字節(jié)在后,這是人類讀寫數(shù)值的方法。小端字節(jié)序:低位字節(jié)在前,高位字節(jié)在后。
0x1234567的大端字節(jié)序和小端字節(jié)序的寫法如下圖。
為什么會(huì)有小端字節(jié)序?
答案是,計(jì)算機(jī)電路先處理低位字節(jié),效率比較高,因?yàn)橛?jì)算都是從低位開始的。所以,計(jì)算機(jī)的內(nèi)部處理都是小端字節(jié)序。
但是,人類還是習(xí)慣讀寫大端字節(jié)序。所以,除了計(jì)算機(jī)的內(nèi)部處理,其他的場(chǎng)合幾乎都是大端字節(jié)序,比如網(wǎng)絡(luò)傳輸和文件儲(chǔ)存。
計(jì)算機(jī)處理字節(jié)序的時(shí)候,不知道什么是高位字節(jié),什么是低位字節(jié)。它只知道按順序讀取字節(jié),先讀第一個(gè)字節(jié),再讀第二個(gè)字節(jié)。
如果是大端字節(jié)序,先讀到的就是高位字節(jié),后讀到的就是低位字節(jié)。小端字節(jié)序正好相反。
理解這一點(diǎn),才能理解計(jì)算機(jī)如何處理字節(jié)序。
處理器讀取外部數(shù)據(jù)的時(shí)候,必須知道數(shù)據(jù)的字節(jié)序,將其轉(zhuǎn)成正確的值。然后,就正常使用這個(gè)值,完全不用再考慮字節(jié)序。
即使是向外部設(shè)備寫入數(shù)據(jù),也不用考慮字節(jié)序,正常寫入一個(gè)值即可。外部設(shè)備會(huì)自己處理字節(jié)序的問題。
實(shí)例
仍然用上面的例子,但是做如下修改
#include 《stdio.h》
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
};
main()
{
struct iphdr t;
unsigned short *s;
memset(&t,0,2);
s = (unsigned char *)&t;
//注意,直接賦值0x8183,因?yàn)樵摮A勘厝缓椭鳈C(jī)字節(jié)序一致,
//小端:83給低字節(jié),
//大端:81給低字節(jié)
*s = 0x8183;
printf(“fin:%d rsv:%d opcode:%d mask:%d paylod:%d
”,
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執(zhí)行結(jié)果:
fin:1 rsv:1 opcode:8 mask:1 paylod:64
由結(jié)果可知,收到的0x8183這個(gè)值與對(duì)應(yīng)的的二進(jìn)制關(guān)系:
fin:1
rsv:001
opcode:1000
mask:1
paylod:1000000
如上圖多少,內(nèi)存的第1個(gè)字節(jié)是0x83,第2個(gè)字節(jié)是0x81【和前面的例子不一樣了,因?yàn)槲覀兪侵苯淤x值0x8183,而該常數(shù)是小字節(jié)序,所以低字節(jié)是0x83】;
可見:
低字節(jié)83給了 fin+rsv+opcode
所以,這說明了一口君的ubuntu是小端字節(jié)序。
4. 拓展例子
繼續(xù)將結(jié)構(gòu)體做如下修改,當(dāng)位域成員大小加一起不夠一個(gè)整字節(jié)的時(shí)候,驗(yàn)證各成員在內(nèi)存中的布局。
#include 《stdio.h》
struct iphdr {
unsigned char fin:1;
unsigned char opcode:4;
unsigned char a;
unsigned char b;
};
main()
{
struct iphdr t;
unsigned char *s;
memset(&t,0,2);
s = (unsigned short *)&t;
t.fin = 1;
t.opcode = 0xf;
printf(“%x
”,s[0]);
}
fin:1
opcode:1111
內(nèi)存中形式如下:
如果修改fin的值為0:
t.fin = 0;
執(zhí)行結(jié)果如下:
fin:0
opcode:1111
內(nèi)存中形式如下:
5. 總結(jié)
大家遇到類似問題的時(shí)候,一定要寫一些實(shí)例去驗(yàn)證,對(duì)于初學(xué)者來說,建議多參考上述實(shí)例。
原文標(biāo)題:【問答21】C語言:位域和字節(jié)序
文章出處:【微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
C語言
+關(guān)注
關(guān)注
180文章
7604瀏覽量
136685 -
代碼
+關(guān)注
關(guān)注
30文章
4779瀏覽量
68521
原文標(biāo)題:【問答21】C語言:位域和字節(jié)序
文章出處:【微信號(hào):zhuyandz,微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論