RM新时代平台网址,新时代下载安装最新版

作者 | 大師兄

內(nèi)存管理子系統(tǒng)可能是linux內(nèi)核中最為復(fù)雜的一個子系統(tǒng)，其支持的功能需求眾多，如頁面映射、頁面分配、頁面回收、頁面交換、冷熱頁面、緊急頁面、頁面碎片管理、頁面緩存、頁面統(tǒng)計等，而且對性能也有很高的要求。本文從內(nèi)存管理硬件架構(gòu)、地址空間劃分和內(nèi)存管理軟件架構(gòu)三個方面入手，嘗試對內(nèi)存管理的軟硬件架構(gòu)做一些宏觀上的分析總結(jié)。

來自：極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

內(nèi)存管理硬件架構(gòu)

因為內(nèi)存管理是內(nèi)核最為核心的一個功能，針對內(nèi)存管理性能優(yōu)化，除了軟件優(yōu)化，硬件架構(gòu)也做了很多的優(yōu)化設(shè)計。下圖是一個目前主流處理器上的存儲器層次結(jié)構(gòu)設(shè)計方案。

從圖中可以看出，對于邏輯cache架構(gòu)讀寫內(nèi)存，硬件設(shè)計了3條優(yōu)化路徑。

1）首先L1 cache支持虛擬地址尋址，保證CPU出來的虛擬地址（VA）不需要轉(zhuǎn)換成物理地址（PA）就可以用來直接查找L1 cache，提高cache查找效率。當(dāng)然用VA查找cache，有安全等缺陷，這需要CPU做一些特別的設(shè)計來進行彌補，具體可以閱讀《計算機體系結(jié)構(gòu)：量化研究方法》了解相關(guān)細(xì)節(jié)。

2）如果L1 cache沒有命中，這就需要進行地址轉(zhuǎn)換，把VA轉(zhuǎn)換成PA。linux的內(nèi)存映射管理是通過頁表來實現(xiàn)的，但是頁表是放在內(nèi)存中的，如果每次地址轉(zhuǎn)換過程都需要訪問一次內(nèi)存，其效率是十分低下的。這里CPU通過TLB硬件單元（在MMU中）來加速地址轉(zhuǎn)換。

3）獲得PA后，在L2 cache中再查找緩存數(shù)據(jù)。L2 cache一般比L1 cache大一個數(shù)量級，其查找命中率也更高。如果命中獲得數(shù)據(jù)，則可避免去訪問內(nèi)存，提高訪問效率。

來自：極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

可見，為了優(yōu)化內(nèi)存訪問效率，現(xiàn)代處理器引入多級cache、TLB等硬件模塊。每個硬件模塊內(nèi)部還有大量的設(shè)計細(xì)節(jié)，這里不再深入，如有興趣可以閱讀《計算機體系結(jié)構(gòu)：量化研究方法》等書籍進一步了解。

內(nèi)存映射空間劃分

根據(jù)不同的內(nèi)存使用方式和使用場景需要，內(nèi)核把內(nèi)存映射地址空間劃分成多個部分，每個劃分空間都有自己的起止地址、分配接口和使用場景。下圖是一個常見的32位地址空間劃分結(jié)構(gòu)。

DMA內(nèi)存動態(tài)分配地址空間：

一些DMA設(shè)備因為其自身尋址能力的限制，不能訪問所有內(nèi)存空間。如早期的ISA設(shè)備只能在24位地址空間執(zhí)行DMA，即只能訪問前16MB內(nèi)存。所以需要劃分出DMA內(nèi)存動態(tài)分配空間，即DMA zone。其分配通過加上GFP_ATOMIC控制符的kmalloc接口來申請。

直接內(nèi)存動態(tài)分配地址空間：

因為訪問效率等原因，內(nèi)核對內(nèi)存采用簡單的線性映射，但是因為32位CPU的尋址能力（4G大小）和內(nèi)核地址空間起始的設(shè)置（3G開始），會導(dǎo)致內(nèi)核的地址空間資源不足，當(dāng)內(nèi)存大于1GB時，就無法直接映射所有內(nèi)存。無法直接映射的地址空間部分，即highmem zone。在DMA zone和highmem zone中間的區(qū)域即normal zone，主要用于內(nèi)核的動態(tài)內(nèi)存分配。其分配通過kmalloc接口來申請。

高端內(nèi)存動態(tài)分配地址空間：

高端內(nèi)存分配的內(nèi)存是虛擬地址連續(xù)而物理地址不連續(xù)的內(nèi)存，一般用于內(nèi) 核動態(tài)加載的模塊和驅(qū)動，因為內(nèi)核可能運行了很久，內(nèi)存頁面碎片情況嚴(yán) 重，如果要申請大的連續(xù)地址的內(nèi)存頁會比較困難，容易導(dǎo)致分配失敗。根據(jù)應(yīng)用需要，高端內(nèi)存分配提供多個接口:

vmalloc：指定分配大小，page位置和虛擬地址隱式分配；

vmap：指定page位置數(shù)組，虛擬地址隱式分配；

ioremap：指定物理地址和大小，虛擬地址隱式分配。

持久映射地址空間：

內(nèi)核上下文切換會伴隨著TLB刷新，這會導(dǎo)致性能下降。但一些使用高端內(nèi)存的模塊對性能也有很高要求。持久映射空間在內(nèi)核上下文切換時，其TLB不刷新，所以它們映射的高端地址空間尋址效率較高。其分配通過kmap接口來申請。kmap與vmap的區(qū)別是：vmap可以映射一組page，即page不連續(xù)，但虛擬地址連續(xù)，而kmap只能映射一個page到虛擬地址空間。kmap主要用于fs、net等對高端內(nèi)存訪問有較高性能要求的模塊中。

固定映射地址空間：

持久映射的問題是可能會休眠，在中斷上下文、自旋鎖臨界區(qū)等不能阻塞的場景中不可用。為了解決這個問題，內(nèi)核又劃分出固定映射，其接口不會休眠。固定映射空間通過kmap_atomic接口來映射。kmap_atomic的使用場景與kmap較為相似，主要用于mm、fs、net等對高端內(nèi)存訪問有較高性能要求而且不能休眠的模塊中。

不同的CPU體系架構(gòu)在地址空間劃分上不盡相同，但為了保證CPU體系差異對外部模塊不可見，內(nèi)存地址空間的分配接口的語義是一致的。

因為64位CPU一般都不需要高端內(nèi)存（當(dāng)然也可以支持），在地址空間劃分上與32位CPU的差異較大，下圖是一個X86_64的內(nèi)核地址空間劃分圖:

來自：極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

內(nèi)存管理；軟件架構(gòu)

內(nèi)核內(nèi)存管理的核心工作就是內(nèi)存的分配回收管理，其內(nèi)部分為2個體系：頁管理和對象管理。頁管理體系是一個兩級的層次結(jié)構(gòu)，對象管理體系是一個三級的層次結(jié)構(gòu)，分配成本和操作對CPU cache和TLB的負(fù)面影響，從上而下逐漸升高。

來自：極客星球-深入理解Linux內(nèi)存子系統(tǒng)。

頁管理層次結(jié)構(gòu)：由冷熱緩存、伙伴系統(tǒng)組成的兩級結(jié)構(gòu)。負(fù)責(zé)內(nèi)存頁的緩存、分配、回收。

對象管理層次結(jié)構(gòu)：由per-cpu高速緩存、slab緩存、伙伴系統(tǒng)組成的三級結(jié)構(gòu)。負(fù)責(zé)對象的緩存、分配、回收。這里的對象指小于一頁大小的內(nèi)存塊。

除了內(nèi)存分配，內(nèi)存釋放也是按照此層次結(jié)構(gòu)操作。如釋放對象，先釋放到per-cpu緩存，再釋放到slab緩存，最后再釋放到伙伴系統(tǒng)。

框圖中有三個主要模塊，即伙伴系統(tǒng)、slab分配器和per-cpu（冷熱）緩存。他們的對比分析如下。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

內(nèi)核

內(nèi)核

+關(guān)注

關(guān)注
3

文章
1372

瀏覽量
40275
cpu

cpu

+關(guān)注

關(guān)注
68

文章
10854

瀏覽量
211573
Linux

Linux

+關(guān)注

關(guān)注
87

文章
11292

瀏覽量
209322
內(nèi)存管理

內(nèi)存管理

+關(guān)注

關(guān)注
0

文章
168

瀏覽量
14134

原文標(biāo)題：Linux內(nèi)核內(nèi)存管理架構(gòu)

文章出處：【微信號：技術(shù)讓夢想更偉大，微信公眾號：技術(shù)讓夢想更偉大】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Linux的內(nèi)存管理是什么，Linux的內(nèi)存管理詳解

Linux的內(nèi)存管理 Linux的內(nèi)存管理是一個非常復(fù)雜的過程，主要分成兩個大的部分：

發(fā)表于 05-11 17:54 ?6038次閱讀

<b class='flag-5'>Linux</b>的<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>是什么，<b class='flag-5'>Linux</b>的<b class='flag-5'>內(nèi)存</b><b class='flag-5'>管理</b>詳解

深度解析Linux的內(nèi)存管理體系

Linux內(nèi)存管理的整體模式是虛擬內(nèi)存管理(分頁內(nèi)存管理

發(fā)表于 08-06 16:55 ?1733次閱讀

走進Linux內(nèi)存系統(tǒng)探尋內(nèi)存管理的機制和奧秘

Linux 內(nèi)存是后臺開發(fā)人員，需要深入了解的計算機資源。合理的使用內(nèi)存，有助于提升機器的性能和穩(wěn)定性。本文主要介紹Linux 內(nèi)存組織結(jié)構(gòu)

發(fā)表于 01-05 09:47 ?1621次閱讀

關(guān)于Linux內(nèi)存管理的詳細(xì)介紹

Linux內(nèi)存管理是指對系統(tǒng)內(nèi)存的分配、釋放、映射、管理、交換、壓縮等一系列操作的管理。在

發(fā)表于 03-06 09:28 ?1064次閱讀

Linux內(nèi)核內(nèi)存泄漏怎么辦

在Linux內(nèi)核開發(fā)中，Kmemleak是一種用于檢測內(nèi)核中內(nèi)存泄漏的工具。

發(fā)表于 07-04 11:04 ?819次閱讀

Linux內(nèi)核的內(nèi)存管理詳解

內(nèi)存管理的主要工作就是對物理內(nèi)存進行組織，然后對物理內(nèi)存的分配和回收。但是Linux引入了虛擬地址的概念。

發(fā)表于 08-31 14:46 ?779次閱讀

Linux內(nèi)核地址映射模型與Linux內(nèi)核高端內(nèi)存詳解

Linux 操作系統(tǒng)和驅(qū)動程序運行在內(nèi)核空間，應(yīng)用程序運行在用戶空間，兩者不能簡單地使用指針傳遞數(shù)據(jù)，因為Linux使用的虛擬內(nèi)存機制，用戶空間的數(shù)據(jù)可能被換出，當(dāng)

發(fā)表于 05-08 10:33 ?3452次閱讀

Linux內(nèi)核電源管理的整體架構(gòu)介紹

電子產(chǎn)品來說，電源管理相當(dāng)重要。因此，這部分工作往往在開發(fā)周期中占據(jù)相當(dāng)大的比重，圖1呈現(xiàn)了Linux內(nèi)核電源管理的整體架構(gòu)。大體可以歸納為

發(fā)表于 07-05 07:00

《深入Linux內(nèi)核架構(gòu)》莫爾勒著

電子發(fā)燒友為您提供了免費下載，《深入Linux內(nèi)核架構(gòu)》一書討論了Linux內(nèi)核的概念、結(jié)構(gòu)和實現(xiàn)。內(nèi)核

發(fā)表于 07-10 11:24 ?0次下載

linux內(nèi)存管理機制淺析

本內(nèi)容介紹了arm linux內(nèi)存管理機制，詳細(xì)說明了linux內(nèi)核內(nèi)存

發(fā)表于 12-19 14:09 ?73次下載

linux內(nèi)存管理

linux內(nèi)存管理

發(fā)表于 10-24 11:12 ?3次下載

一文解析Linux內(nèi)存系統(tǒng)

Linux 內(nèi)存是后臺開發(fā)人員，需要深入了解的計算機資源。合理的使用內(nèi)存，有助于提升機器的性能和穩(wěn)定性。本文主要介紹Linux 內(nèi)存組織結(jié)構(gòu)

發(fā)表于 09-01 10:46 ?2437次閱讀

解析Linux內(nèi)核頁表管理中那些鮮為人知的秘密

虛擬內(nèi)存管理，而頁表管理是在虛擬內(nèi)存管理中尤為重要，本文主要以回答幾個頁表管理中關(guān)鍵性問題來

發(fā)表于 06-11 16:32 ?1649次閱讀

Linux內(nèi)核實現(xiàn)內(nèi)存管理的基本概念

本文概述Linux內(nèi)核實現(xiàn)內(nèi)存管理的基本概念，在了解基本概念后，逐步展開介紹實現(xiàn)內(nèi)存管理的相關(guān)技

發(fā)表于 06-23 11:56 ?831次閱讀

Linux 內(nèi)存管理總結(jié)

一、Linux內(nèi)存管理概述 Linux內(nèi)存管理是指對系統(tǒng)內(nèi)存

發(fā)表于 11-10 14:58 ?523次閱讀