RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

網(wǎng)卡的Ring Buffer詳解

dyquk4xk2p3d ? 來源:良許Linux ? 2023-04-04 09:15 ? 次閱讀

1. 網(wǎng)卡處理數(shù)據(jù)包流程

網(wǎng)卡處理網(wǎng)絡數(shù)據(jù)流程圖:

c934603a-d278-11ed-bfe3-dac502259ad0.png

圖片來自參考鏈接1

上圖中虛線步驟的解釋:

1 DMA 將 NIC 接收的數(shù)據(jù)包逐個寫入 sk_buff ,一個數(shù)據(jù)包可能占用多個 sk_buff , sk_buff 讀寫順序遵循FIFO(先入先出)原則。

2 DMA 讀完數(shù)據(jù)之后,NIC 會通過 NIC Interrupt Handler 觸發(fā) IRQ (中斷請求)。

3 NIC driver 注冊 poll 函數(shù)。

4 poll 函數(shù)對數(shù)據(jù)進行檢查,例如將幾個 sk_buff 合并,因為可能同一個數(shù)據(jù)可能被分散放在多個 sk_buff 中。

5 poll 函數(shù)將 sk_buff 交付上層網(wǎng)絡棧處理。

完整流程:

1 系統(tǒng)啟動時 NIC (network interface card) 進行初始化,系統(tǒng)分配內(nèi)存空間給 Ring Buffer 。

2 初始狀態(tài)下,Ring Buffer 隊列每個槽中存放的 Packet Descriptor 指向 sk_buff ,狀態(tài)均為 ready。

3 DMA 將 NIC 接收的數(shù)據(jù)包逐個寫入 sk_buff ,一個數(shù)據(jù)包可能占用多個 sk_buff ,sk_buff 讀寫順序遵循FIFO(先入先出)原則。4 被寫入數(shù)據(jù)的 sk_buff 變?yōu)?used 狀態(tài)。

5 DMA 讀完數(shù)據(jù)之后,NIC 會通過 NIC Interrupt Handler 觸發(fā) IRQ (中斷請求)。

6 NIC driver 注冊 poll 函數(shù)。

7 poll 函數(shù)對數(shù)據(jù)進行檢查,例如將幾個 sk_buff 合并,因為可能同一個數(shù)據(jù)可能被分散放在多個 sk_buff 中。8 poll 函數(shù)將 sk_buff 交付上層網(wǎng)絡棧處理。

9 poll 函數(shù)清理 sk_buff,清理 Ring Buffer 上的 Descriptor 將其指向新分配的 sk_buff 并將狀態(tài)設置為 ready。

2. 多 CPU 下的 Ring Buffer 處理

因為分配給 Ring Buffer 的空間是有限的,當收到的數(shù)據(jù)包速率大于單個 CPU 處理速度的時候 Ring Buffer 可能被占滿,占滿之后再來的新數(shù)據(jù)包會被自動丟棄。

如果在多核 CPU 的服務器上,網(wǎng)卡內(nèi)部會有多個 Ring Buffer,NIC 負責將傳進來的數(shù)據(jù)分配給不同的 Ring Buffer,同時觸發(fā)的 IRQ 也可以分配到多個 CPU 上,這樣存在多個 Ring Buffer 的情況下 Ring Buffer 緩存的數(shù)據(jù)也同時被多個 CPU 處理,就能提高數(shù)據(jù)的并行處理能力。

當然,要實現(xiàn)“NIC 負責將傳進來的數(shù)據(jù)分配給不同的 Ring Buffer”,NIC 網(wǎng)卡必須支持 Receive Side Scaling(RSS) 或者叫做 multiqueue 的功能。RSS 除了會影響到 NIC 將 IRQ 發(fā)到哪個 CPU 之外,不會影響別的邏輯了。數(shù)據(jù)處理過程跟之前描述的是一樣的。

3. Ring Buffer 相關(guān)命令

在生產(chǎn)實踐中,因 Ring Buffer 寫滿導致丟包的情況很多。當環(huán)境中的業(yè)務流量過大且出現(xiàn)網(wǎng)卡丟包的時候,考慮到 Ring Buffer 寫滿是一個很好的思路。

總結(jié)下 Ring Buffer 相關(guān)的命令:

3.1 網(wǎng)卡收到的數(shù)據(jù)包統(tǒng)計

[root@test]$ethtool-Sem1|more
NICstatistics:
rx_packets:35874336743
tx_packets:35163830212
rx_bytes:6337524253985
tx_bytes:3686383656436
rx_broadcast:15392577
tx_broadcast:873436
rx_multicast:45849160
tx_multicast:1784024

RX 就是收到數(shù)據(jù),TX 是發(fā)出數(shù)據(jù)。

3.2 帶有 drop 字樣的統(tǒng)計和 fifo_errors 的統(tǒng)計

[root@test]$ethtool-Sem1|grep-iE"error|drop"
rx_crc_errors:0
rx_missed_errors:0
tx_aborted_errors:0
tx_carrier_errors:0
tx_window_errors:0
rx_long_length_errors:0
rx_short_length_errors:0
rx_align_errors:0
dropped_smbus:0
rx_errors:0
tx_errors:0
tx_dropped:0
rx_length_errors:0
rx_over_errors:0
rx_frame_errors:0
rx_fifo_errors:79270
tx_fifo_errors:0
tx_heartbeat_errors:0
rx_queue_0_drops:16669
rx_queue_1_drops:21522
rx_queue_2_drops:0
rx_queue_3_drops:5678
rx_queue_4_drops:5730
rx_queue_5_drops:14011
rx_queue_6_drops:15240
rx_queue_7_drops:420

發(fā)送隊列和接收隊列 drop 的數(shù)據(jù)包數(shù)量顯示在這里。并且所有 queue_drops 加起來等于 rx_fifo_errors。所以總體上能通過 rx_fifo_errors 看到 Ring Buffer 上是否有丟包。如果有的話一方面是看是否需要調(diào)整一下每個隊列數(shù)據(jù)的分配,或者是否要加大 Ring Buffer 的大小。

3.3 查詢 Ring Buffer 大小

[root@test]$ethtool-gem1
Ringparametersforem1:
Pre-setmaximums:
RX:4096
RXMini:0
RXJumbo:0
TX:4096
Currenthardwaresettings:
RX:256
RXMini:0
RXJumbo:0
TX:256

RX 和 TX 最大是 4096,當前值為 256 。隊列越大丟包的可能越小,但數(shù)據(jù)延遲會增加。

3.4 調(diào)整 Ring Buffer 隊列數(shù)量

[root@test]$ethtool-lem1
Channelparametersforem1:
Pre-setmaximums:
RX:0
TX:0
Other:1
Combined:8
Currenthardwaresettings:
RX:0
TX:0
Other:1
Combined:8

Combined = 8,說明當前 NIC 網(wǎng)卡會使用 8 個進程處理網(wǎng)絡數(shù)據(jù)。

更改 eth0 網(wǎng)卡 Combined 的值:

ethtool -L eth0 combined 8

需要注意的是,ethtool 的設置操作可能都要重啟一下才能生效。

3.4 調(diào)整 Ring Buffer 隊列大小查看當前 Ring Buffer 大?。?/p>

[root@test]$ethtool-gem1
Ringparametersforem1:
Pre-setmaximums:
RX:4096
RXMini:0
RXJumbo:0
TX:4096
Currenthardwaresettings:
RX:256
RXMini:0
RXJumbo:0
TX:256

看到 RX 和 TX 最大是 4096,當前值為 256。隊列越大丟包的可能越小,但數(shù)據(jù)延遲會增加.

設置 RX 和 TX 隊列大?。?/p>

ethtool -G em1 rx 4096

ethtool -G em1 tx 4096

3.5 調(diào)整 Ring Buffer 隊列的權(quán)重

NIC 如果支持 mutiqueue 的話 NIC 會根據(jù)一個 Hash 函數(shù)對收到的數(shù)據(jù)包進行分發(fā)。能調(diào)整不同隊列的權(quán)重,用于分配數(shù)據(jù)。

[root@test]$ethtool-xem1
RXflowhashindirectiontableforem1with8RXring(s):
0:00000000
8:00000000
16:11111111
24:11111111
32:22222222
40:22222222
48:33333333
56:33333333
64:44444444
72:44444444
80:55555555
88:55555555
96:66666666
104:66666666
112:77777777
120:77777777
RSShashkey:
Operationnotsupported

我的 NIC 一共有 8 個隊列,一共有 128 個不同的 Hash 值,上面就是列出了每個 Hash 值對應的隊列是什么。最左側(cè) 0 8 16 是為了能讓你快速的找到某個具體的 Hash 值。比如 Hash 值是 76 的話我們能立即找到 72 那一行:"72: 4 4 4 4 4 4 4 4",從左到右第一個是 72 數(shù)第 5 個就是 76 這個 Hash 值對應的隊列是 4 。

設置 8 個隊列的權(quán)重。加起來不能超過 128 。128 是 indirection table 大小,每個 NIC 可能不一樣。

3.6 更改 Ring Buffer Hash Field

分配數(shù)據(jù)包的時候是按照數(shù)據(jù)包內(nèi)的某個字段來進行的,這個字段能進行調(diào)整。

[root@test]$ethtool-nem1rx-flow-hashtcp4
TCPoverIPV4flowsusethesefieldsforcomputingHashflowkey:
IPSA
IPDA
L4bytes0&1[TCP/UDPsrcport]
L4bytes2&3[TCP/UDPdstport]

也可以設置 Hash 字段:查看 tcp4 的 Hash 字段。

ethtool -N em1 rx-flow-hash udp4 sdfn

sdfn 需要查看 ethtool 看其含義,還有很多別的配置值。

3.6 IRQ 統(tǒng)計

/proc/interrupts 能看到每個 CPU 的 IRQ 統(tǒng)計。一般就是看看 NIC 有沒有支持 multiqueue 以及 NAPI 的 IRQ 合并機制是否生效。看看 IRQ 是不是增長的很快。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)卡
    +關(guān)注

    關(guān)注

    4

    文章

    307

    瀏覽量

    27374
  • fifo
    +關(guān)注

    關(guān)注

    3

    文章

    387

    瀏覽量

    43646
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4327

    瀏覽量

    62569
  • dma
    dma
    +關(guān)注

    關(guān)注

    3

    文章

    560

    瀏覽量

    100544
  • NIC
    NIC
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    12415

原文標題:網(wǎng)卡的 Ring Buffer 詳解

文章出處:【微信號:良許Linux,微信公眾號:良許Linux】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    網(wǎng)卡知識詳解

    網(wǎng)卡知識詳解關(guān)于網(wǎng)卡名稱       計算機與外界局域網(wǎng)的連接是通過主機箱內(nèi)插入一塊網(wǎng)絡接口板(或者是在筆記本電腦中插入一塊
    發(fā)表于 06-30 22:50

    網(wǎng)卡芯片詳解

    網(wǎng)卡芯片詳解1.RTL8139D  8139/8139A/8139B/8139C/8139C+/8139D/8130/810X/8169/8110系列網(wǎng)卡是市場上最常見的網(wǎng)卡芯片產(chǎn)品,
    發(fā)表于 10-19 13:28

    Ring Buffer 有什么特別?

    首先 - Ring Buffer。我對 Disruptor 的最初印象只有 Ring Buffer。后來我漸漸明白 Ring
    發(fā)表于 05-25 00:41

    什么是Resilient Packet Ring

    什么是Resilient Packet Ring    英文縮寫: Resilient Packet Ring 中文譯名: 彈性分組環(huán)
    發(fā)表于 02-23 09:31 ?623次閱讀

    粉紅圈(pink ring),粉紅圈(pink ring)是

    粉紅圈(pink ring)定義成因/影響/改善 粉紅圈(pink ring)的定義 板面在氧化后,生成一絨毛層(氧化銅及氧化亞銅)。在本質(zhì)
    發(fā)表于 03-27 16:27 ?2636次閱讀

    linux下網(wǎng)卡配置詳解

    linux下網(wǎng)卡配置詳解
    發(fā)表于 12-15 22:38 ?0次下載

    Ring buffer介紹

    首先 - Ring Buffer。我對 Disruptor 的最初印象只有 Ring Buffer。后來我漸漸明白 Ring
    發(fā)表于 04-02 14:32 ?3220次閱讀

    BPF ring buffer解決的問題及背后的設計

    文章介紹了 BPF ring buffer 解決的問題及背后的設計,并給出了一些代碼示例和內(nèi)核 patch 鏈接,深度和廣度兼?zhèn)?,是學習 ring buffer 的極佳參考。
    的頭像 發(fā)表于 05-17 09:37 ?2276次閱讀

    Ring Clojure的Web框架

    ./oschina_soft/ring.zip
    發(fā)表于 06-13 09:38 ?1次下載
    <b class='flag-5'>Ring</b> Clojure的Web框架

    網(wǎng)卡Ring Buffer詳解

    DMA 將 NIC 接收的數(shù)據(jù)包逐個寫入 sk_buff ,一個數(shù)據(jù)包可能占用多個 sk_buff , sk_buff 讀寫順序遵循FIFO(先入先出)原則。
    的頭像 發(fā)表于 03-17 14:25 ?1526次閱讀

    簡述linux系統(tǒng)UDP丟包問題分析思路(上)

    在開始之前,我們先用一張圖解釋 linux 系統(tǒng)接收網(wǎng)絡報文的過程。 1. 首先網(wǎng)絡報文通過物理網(wǎng)線發(fā)送到網(wǎng)卡 2. 網(wǎng)絡驅(qū)動程序會把網(wǎng)絡中的報文讀出來放到 ring buffer 中,這個
    的頭像 發(fā)表于 05-18 17:24 ?2763次閱讀
    簡述linux系統(tǒng)UDP丟包問題分析思路(上)

    簡述linux系統(tǒng)UDP丟包問題分析思路(下)

    在開始之前,我們先用一張圖解釋 linux 系統(tǒng)接收網(wǎng)絡報文的過程。 1. 首先網(wǎng)絡報文通過物理網(wǎng)線發(fā)送到網(wǎng)卡 2. 網(wǎng)絡驅(qū)動程序會把網(wǎng)絡中的報文讀出來放到 ring buffer 中,這個
    的頭像 發(fā)表于 05-18 17:25 ?1500次閱讀

    多CPU下的Ring Buffer處理

    1. 網(wǎng)卡處理數(shù)據(jù)包流程 一圖勝千言,先來看看網(wǎng)卡處理網(wǎng)絡數(shù)據(jù)流程圖: 圖片來自參考鏈接1 上圖中虛線步驟的解釋: 1 DMA 將 NIC 接收的數(shù)據(jù)包逐個寫入 sk_buff ,一個數(shù)據(jù)包可能占用
    的頭像 發(fā)表于 06-22 10:13 ?865次閱讀
    多CPU下的<b class='flag-5'>Ring</b> <b class='flag-5'>Buffer</b>處理

    物聯(lián)網(wǎng)卡的流量到底是什么?超全詳解

    物聯(lián)網(wǎng)卡的流量到底是什么?超全詳解
    的頭像 發(fā)表于 08-31 09:13 ?2373次閱讀
    物聯(lián)<b class='flag-5'>網(wǎng)卡</b>的流量到底是什么?超全<b class='flag-5'>詳解</b>!

    MSPM0 UART通信中DMA和Ring Buffer環(huán)形緩沖的應用

    電子發(fā)燒友網(wǎng)站提供《MSPM0 UART通信中DMA和Ring Buffer環(huán)形緩沖的應用.pdf》資料免費下載
    發(fā)表于 09-05 11:01 ?0次下載
    MSPM0 UART通信中DMA和<b class='flag-5'>Ring</b> <b class='flag-5'>Buffer</b>環(huán)形緩沖的應用
    RM新时代网站-首页