FMS2018已經(jīng)過去了,但是閃存的熱度并沒有消退。NVMe組織在FMS2018上通過8個演講對NVMe、NVMe-oF、NVMe-MI、JBOF以及NVMe基準(zhǔn)測試等話題進(jìn)行了介紹。在其官網(wǎng)上有這次演講的PPT(據(jù)說視頻也會更新上來)。接下來通過NVMe 組織在FMS2018上的主旨演講看下未來一年NVMe的演進(jìn)重點。
NVMe協(xié)議族的路線圖(點擊看大圖,下同)
從上圖可以看到當(dāng)前NVMe一些主要的特性和下一步將要做的重點。這篇文章就說NVMe 1.4的兩大更新。NVMe官網(wǎng)最新的一版NVMe標(biāo)準(zhǔn)是1.3c,發(fā)布于2018年5月24日。而今年第四季度以及2019年,NVMe1.4版本將是NVMe標(biāo)準(zhǔn)化組織工作重點,此次更新的重點包括IO Determinism、PMR以及多路徑訪問共享命名空間。
關(guān)于命名空間(namespace)
命名空間(namespace)是NVMe協(xié)議中一個基本的邏輯空間的概念,簡單地說命名空間將NVMe SSD的用戶空間進(jìn)行邏輯劃分,每個命名空間擁有自身的NAND,可以獨立的進(jìn)行格式化和加密等操作。
IO Determinism:NVMe這樣提高QoS
NVMe協(xié)議將在1.4版中通過定義IO Determinism,實現(xiàn)對SSD的物理介質(zhì)資源精細(xì)化管理和控制。在沒有IO Determinism時,多個APP由1個SSD承載,雖然多個APP訪問不同的namespace,但是不同namespace是共享底層channel和Die的。
IO Determinism應(yīng)用前后負(fù)載訪問盤的變化(這張圖也是下圖測試結(jié)果的一個測試方案)
有了IO Determinism之后,NVMe協(xié)議可以將整塊SSD的物理空間劃分為多個NVM Set,每個NVM Set可以包含1到多個Channel和Die,不同的NVM Set的擦除、讀寫都是相互獨立的,最終不同的Set供不同的App使用(如上圖中右側(cè))。如此一來,應(yīng)用之間不會互相干擾,性能和延遲也可以得到更好的保障。Facebook在FMS2018上發(fā)布了關(guān)于NVMe SSD實現(xiàn) IO Determinism詳細(xì)的測試結(jié)果,如下圖:
Facebook對IO Determinism應(yīng)用后的測試結(jié)果
從上圖Facebook對IO Determinism的測試結(jié)果可以看出,讀延遲QoS在IO Determinism應(yīng)用后有了8倍的提升(具體的測試說明可以參看相關(guān)閱讀中Facebook在FMS2018上的演講PPT)。此外,如今NVMe SSD單盤容量不斷提升(Memblaze的PBlaze5 910/916可以做到15.36TB),IO Determinism將一塊大盤分為多個“小盤”,供上層多個應(yīng)用使用,提高了資源的利用率。
NVMe多路徑訪問共享命名空間
NVMe多路徑訪問共享命名空間的意思是單個或多個主機(jī)可以通過不同的NVMe Controler訪問同一個Namespace。下圖是一個基本的原理。
這一特性會影響到未來閃存陣列等存儲系統(tǒng)的設(shè)計。當(dāng)前高可用的NVMe存儲系統(tǒng)多使用雙端口NVMe SSD,并采用如下方案實現(xiàn):
NVMe1.4以后有了多路經(jīng)訪問特性,高可用的存儲系統(tǒng)就可以結(jié)合NVMe SSD的雙端口實現(xiàn)下圖這樣的高可用方案。每一個Contorller都可以看到NVMe SSD一個Port的兩條路徑,這需要NVMe SSD支持多路經(jīng)功能。
這與SAS時代實現(xiàn)高可用系統(tǒng)的理念類似,只是從Switch到盤的性能都有了質(zhì)的提升。JBOD也升級到了JBOF/FBOF。業(yè)務(wù)連續(xù)和數(shù)據(jù)的完整性是企業(yè)客戶對存儲系統(tǒng)的重要訴求,要打造高可用方案,Memblaze在雙端口的研發(fā)上已經(jīng)有諸多積累,相關(guān)的討論和技術(shù)解讀可以看文末關(guān)于雙端口的文章。
最后,NVMe協(xié)議還有NVMe-MI和NVMe-oF兩個重要的分支,分別定義了NVMe SSD管理命令和網(wǎng)絡(luò)層面的規(guī)范。未來這兩個分支也會有所演進(jìn),NVMe-MI將允許應(yīng)用通過In-Band方式向NVMe 子系統(tǒng)(一般為NVMe SSD或者多塊NVMe SSD組成的組)發(fā)送NVMe-MI Send和NVMe-MI Receive兩個新的命令,獲取子系統(tǒng)的基本信息。這些信息之前多由BMC系統(tǒng)獲取。這一新的特性提高了應(yīng)用獲取底層SSD狀態(tài)信息的能力,可以更高效的感知NVMe 子系統(tǒng)的健康狀態(tài)。
NVMe-oF也會開始支持NVMe Over TCP,這部分內(nèi)容將在后續(xù)的文章中進(jìn)行詳細(xì)的闡述。
-
SSD
+關(guān)注
關(guān)注
21文章
2857瀏覽量
117366 -
nvme
+關(guān)注
關(guān)注
0文章
221瀏覽量
22621
原文標(biāo)題:NVMe 1.4:你需要知道的兩個重點技術(shù)
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論