RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVMe SSD性能影響因素一探究竟(下)

架構(gòu)師技術(shù)聯(lián)盟 ? 來(lái)源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-12-09 11:38 ? 次閱讀

3.2 IO Pattern對(duì)性能的影響

IO Pattern會(huì)對(duì)SSD的性能產(chǎn)生嚴(yán)重影響,主要表現(xiàn)在如下幾個(gè)方面:

1, 不同的IO Pattern會(huì)產(chǎn)生不同的寫(xiě)放大系數(shù),不同的寫(xiě)放大系數(shù)占用后端NAND Flash帶寬不同。當(dāng)前端應(yīng)用對(duì)SSD采用完全順序的方式進(jìn)行寫(xiě)入時(shí),此時(shí)是最佳的IO Pattern,對(duì)于SSD而言寫(xiě)放大系數(shù)接近1,SSD內(nèi)部的背景流量基本可以忽略,前端性能達(dá)到最佳。在實(shí)際應(yīng)用中,很難采用這種完全順序的數(shù)據(jù)寫(xiě)模型,但可以通過(guò)優(yōu)化逼近順序?qū)懭搿?/p>

2, 不同請(qǐng)求大小的IO之間會(huì)產(chǎn)生干擾;讀寫(xiě)請(qǐng)求之間會(huì)產(chǎn)生干擾。小請(qǐng)求會(huì)受到大請(qǐng)求的干擾,從而導(dǎo)致小請(qǐng)求的延遲增加,這個(gè)比較容易理解,在HDD上同樣會(huì)存在這種情況。由于NAND Flash介質(zhì)存在嚴(yán)重的讀寫(xiě)不對(duì)稱性,因此讀寫(xiě)請(qǐng)求之間也會(huì)互相干擾,尤其是寫(xiě)請(qǐng)求對(duì)讀請(qǐng)求產(chǎn)生嚴(yán)重的性能影響。

3.2.1 順序?qū)懭隤attern對(duì)SSD性能優(yōu)化的奧秘

在針對(duì)閃存系統(tǒng)的設(shè)計(jì)中,需要考慮IO Pattern對(duì)性能產(chǎn)生的影響,通過(guò)軟件的優(yōu)化來(lái)最優(yōu)化SSD的使用。在實(shí)際應(yīng)用中完全順序?qū)懭氲腎O Pattern基本上是不存在的,除非用作順序?qū)懭氲娜罩驹O(shè)備。對(duì)于順序?qū)懭雰?yōu)化性能這個(gè)結(jié)論,需要從SSD內(nèi)部實(shí)現(xiàn)來(lái)深入理解,知道根源之后,可以采用合理的方式來(lái)逼近順序?qū)懭氲哪J?,從而最?yōu)化SSD的性能。

SSD內(nèi)部采用log-structured的數(shù)據(jù)記錄模式,并發(fā)寫(xiě)入的IO數(shù)據(jù)按照時(shí)間順序匯聚成大數(shù)據(jù)塊,合并形成的大數(shù)據(jù)塊以Page stripe的方式寫(xiě)入NAND Flash。多個(gè)Page stripe會(huì)被寫(xiě)入同一個(gè)GC單元(Chunk orSuperblock),當(dāng)一個(gè)GC單元被寫(xiě)完成之后,該GC單元進(jìn)入sealed模式(只讀),分配新的GC單元寫(xiě)新的數(shù)據(jù)。在這種模式下,如果多個(gè)業(yè)務(wù)的數(shù)據(jù)流并發(fā)隨機(jī)地往SSD中寫(xiě)入數(shù)據(jù),那么多個(gè)應(yīng)用的數(shù)據(jù)就會(huì)交錯(cuò)在一起被存儲(chǔ)到同一個(gè)GC單元中。如下圖所示,不同應(yīng)用的數(shù)據(jù)生命周期不同,當(dāng)需要回收一個(gè)GC單元的時(shí)候,會(huì)存在大量數(shù)據(jù)的遷移,這些遷移的數(shù)據(jù)就會(huì)形成寫(xiě)放大,影響性能和使用壽命。

wKgZomVz4XWABazvAADEeOjWIhk073.jpg

不同應(yīng)用的數(shù)據(jù)交錯(cuò)存儲(chǔ)在同一個(gè)GC單元,本質(zhì)上就是不同冷熱程度的數(shù)據(jù)交錯(cuò)存儲(chǔ)的問(wèn)題。從GC的角度來(lái)講,相同冷熱程度的數(shù)據(jù)存儲(chǔ)在同一個(gè)GC單元上是最佳的,為此三星推出了Multi-stream SSD,該SSD就允許不同應(yīng)用的數(shù)據(jù)存儲(chǔ)到不同的Stream單元(GC單元),從而提升GC效率,降低寫(xiě)放大。Multi-stream是一種顯式的設(shè)計(jì)方式,需要更改SSD接口以及應(yīng)用程序。

從IO Pattern的角度考慮,可以通過(guò)順序大塊的方式也可以逼近類似的效果。假設(shè)操作SSD只存在一個(gè)線程,不同的應(yīng)用都采用大數(shù)據(jù)塊的方式寫(xiě)入數(shù)據(jù),那么在一個(gè)時(shí)間片段內(nèi)只存在一個(gè)應(yīng)用的數(shù)據(jù)往SSD中寫(xiě)入數(shù)據(jù),那么在一個(gè)GC單元內(nèi)存儲(chǔ)的數(shù)據(jù)會(huì)變得有序和規(guī)則。如下圖所示,采用上述方法之后,一個(gè)GC單元內(nèi)存儲(chǔ)的數(shù)據(jù)將會(huì)變得冷熱均勻。在GC過(guò)程中會(huì)大大減少數(shù)據(jù)的搬移,從而減少背景流量。

wKgaomVz4XWAOBaiAADEE3oa5Ss996.jpg

在實(shí)際應(yīng)用中,上述IO Pattern很難產(chǎn)生,主要是應(yīng)用很難產(chǎn)生非常大粒度的請(qǐng)求。為此在存儲(chǔ)系統(tǒng)設(shè)計(jì)過(guò)程中,可以引入Optane高性能存儲(chǔ)介質(zhì)作為SSD的寫(xiě)緩存。前端不同業(yè)務(wù)的寫(xiě)請(qǐng)求首先寫(xiě)到Optane持久化介質(zhì)中,在Optane持久化介質(zhì)中聚合形成大數(shù)據(jù)塊。一旦聚合形成大數(shù)據(jù)塊之后,再寫(xiě)入SSD,通過(guò)這種方式可以最大程度地逼近SSD順序?qū)懭脒^(guò)程,提升SSD的性能和使用壽命。

3.2.2 讀寫(xiě)沖突Pattern對(duì)性能的影響

如下圖所示,NAND Flash介質(zhì)具有很強(qiáng)的讀寫(xiě)不對(duì)稱性。Block Erase和Page Program的延遲會(huì)遠(yuǎn)遠(yuǎn)高于Page Read所耗費(fèi)的時(shí)間。那么在這種情況下,如果read請(qǐng)求在同一個(gè)Flash Channel上和Erase、Program操作沖突,那么read操作將會(huì)被Erase/program操作影響。這是在讀寫(xiě)混合情況下,讀性能會(huì)受到影響的重要因素。

wKgaomVz4XWAHcOoAABVyDF5TS8305.jpg

在實(shí)際應(yīng)用過(guò)程中,經(jīng)常會(huì)發(fā)現(xiàn)應(yīng)用的測(cè)試結(jié)果和SSD Spec對(duì)不上,會(huì)比Spec給出的值要來(lái)的低。Spec給出的值通常為純讀或者純寫(xiě)情況下的性能指標(biāo),在讀寫(xiě)混合的場(chǎng)景下,性能表現(xiàn)和Spec給出的值就會(huì)存在非常大的出入。

對(duì)于不同的SSD,通過(guò)測(cè)試可以發(fā)現(xiàn)在讀寫(xiě)混合情況下的性能表現(xiàn)差距會(huì)比較大。在SSD處于穩(wěn)態(tài)條件下,應(yīng)用隨機(jī)讀的情況下,如果引入一個(gè)壓力不是很大的順序?qū)?,那么?huì)發(fā)現(xiàn)不同SSD的抗干擾能力是不同的。有些SSD在寫(xiě)干擾的情況下,讀性能會(huì)急劇下降,延遲快速上升,QoS性能得不到保證。下圖是兩個(gè)SSD在相同情況下的測(cè)試結(jié)果,從結(jié)果來(lái)看,有些SSD的抗寫(xiě)干擾能力比較強(qiáng),讀性能不會(huì)急劇下降。

wKgaomVz4XWATD14AAPnAEWHZ6k818.jpg

為什么有些SSD會(huì)具備比較強(qiáng)的抗寫(xiě)干擾能力呢?其中的奧秘就在于SSD內(nèi)部的IO調(diào)度器。IO調(diào)度器會(huì)對(duì)write、read 和Erase請(qǐng)求進(jìn)行調(diào)度處理,該調(diào)度器算法的不同就會(huì)表現(xiàn)出不同的抗干擾能力。目前很多NANDFlash可以支持Program/Erase Suspension的功能,在IO調(diào)度處理的過(guò)程中,為了提升讀性能,降低讀請(qǐng)求延遲,可以采用Suspension命令對(duì)Program/Erase命令暫停,對(duì)read請(qǐng)求優(yōu)先調(diào)度處理。

讀寫(xiě)沖突是SSD內(nèi)部影響IO QoS的重要因素。在SSD內(nèi)部通過(guò)IO調(diào)度器的優(yōu)化可以提升SSD性能的QoS能力,但是還是無(wú)法與存儲(chǔ)軟件結(jié)合來(lái)協(xié)同優(yōu)化QoS。為了達(dá)到最佳的SSD性能QoS,需要關(guān)注Openchannel技術(shù)。Openchannel其實(shí)只是一種軟硬件層次劃分的方法,通常來(lái)講,SSD內(nèi)部的邏輯可以劃分為面向NAND資源的物理資源管理層以及面向數(shù)據(jù)布局的資源映射層。物理資源管理由于和NAND Flash密切相關(guān),因此可以放到SSD內(nèi)部。

傳統(tǒng)的NVMe SSD需要對(duì)外暴露標(biāo)準(zhǔn)的塊設(shè)備接口,因此需要在SSD內(nèi)部實(shí)現(xiàn)資源映射層。從端至端的角度來(lái)看,資源映射層可以與存儲(chǔ)軟件層結(jié)合起來(lái),為此將資源映射層從SSD內(nèi)部剝離出來(lái),集成至存儲(chǔ)軟件層。一旦資源映射層從SSD內(nèi)部剝離之后,需要定義一個(gè)新的SSD接口,其中的一種接口方式就是Openchannel。

盤古分布式存儲(chǔ)針對(duì)SSD QoS問(wèn)題進(jìn)行了大量研究,提出了Object SSD的概念,Object SSD也是一種新的SSD接口方式,其采用對(duì)象方式對(duì)SSD進(jìn)行讀寫(xiě)刪操作,每個(gè)對(duì)象采用Append write操作方式。這種接口方式可以很好的與分布式存儲(chǔ)無(wú)縫結(jié)合。采用Object SSD之后,SSD內(nèi)部的大量工作被簡(jiǎn)化,IO的調(diào)度會(huì)更加靈活,存儲(chǔ)軟件與SSD協(xié)同配合,達(dá)到IO性能的最優(yōu)化,以及QoS的最大化。

wKgaomVz4XWAAoVnAAEEkLR3faU906.jpg

4 SSD寫(xiě)性能分析模型

SSD內(nèi)部的數(shù)據(jù)流分成兩大類,一類為前端用戶數(shù)據(jù)流;另一類為內(nèi)部背景數(shù)據(jù)流。前端用戶數(shù)據(jù)流和背景數(shù)據(jù)流會(huì)匯聚成NAND Flash后端流量。當(dāng)背景數(shù)據(jù)流不存在時(shí),NAND Flash帶寬會(huì)被用戶數(shù)據(jù)流全部占據(jù),此時(shí)SSD對(duì)外表現(xiàn)的性能達(dá)到最佳。當(dāng)SSD具有較大寫(xiě)放大時(shí),會(huì)產(chǎn)生很大的背景數(shù)據(jù)流,背景流會(huì)搶占NANDFlash帶寬,導(dǎo)致前端用戶IO性能降低。為了穩(wěn)定前端IO性能,在SSD內(nèi)部的調(diào)度器會(huì)均衡前端和背景流量,保證前端性能的一致性。背景流量的占比反應(yīng)了SSD的寫(xiě)放大系數(shù),因此,站在NAND Flash帶寬占用的角度可以分析SSD在穩(wěn)態(tài)情況下的性能。

下圖是Intel P4500和Samsung PM963隨機(jī)寫(xiě)延遲和推導(dǎo)公式之間的對(duì)比。結(jié)果非常吻合。

wKgZomVz4XWAS5QQAAGrVcFyP_Q453.jpg

由此可以推出,隨機(jī)寫(xiě)性能由SSD內(nèi)部后端帶寬以及寫(xiě)放大系數(shù)來(lái)決定。因此,從存儲(chǔ)軟件的角度出發(fā),我們可以通過(guò)優(yōu)化IO Pattern的方式減小寫(xiě)放大系數(shù),從而可以提升SSD的隨機(jī)寫(xiě)性能。

5 小結(jié)

閃存存儲(chǔ)技術(shù)正在飛速發(fā)展,閃存介質(zhì)、SSD控制器、存儲(chǔ)系統(tǒng)軟件、存儲(chǔ)硬件平臺(tái)都在圍繞閃存日新月異的發(fā)展。閃存給數(shù)據(jù)存儲(chǔ)帶來(lái)的價(jià)值顯而易見(jiàn),數(shù)據(jù)中心閃存化是重要發(fā)展趨勢(shì)。NVMe SSD性能受到很多因素的影響,在軟件層面可以通過(guò)IO Pattern優(yōu)化SSD的性能,使得整體存儲(chǔ)系統(tǒng)的性能達(dá)到最佳。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • QoS
    QoS
    +關(guān)注

    關(guān)注

    1

    文章

    136

    瀏覽量

    44775
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2857

    瀏覽量

    117367
  • Nand flash
    +關(guān)注

    關(guān)注

    6

    文章

    241

    瀏覽量

    39802
  • HDD
    HDD
    +關(guān)注

    關(guān)注

    0

    文章

    143

    瀏覽量

    27419

原文標(biāo)題:NVMe SSD性能影響因素一探究竟(下)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《基于“礦板”低成本學(xué)習(xí)Zynq系列》之二-什么樣的礦板,一探究竟

    本文轉(zhuǎn)自公眾號(hào),歡迎關(guān)注 《基于“礦板”低成本學(xué)習(xí)Zynq系列》之二-什么樣的礦板,一探究竟 (qq.com) .前言 ? 前面篇淘板記中我們淘到了基于Zynq-7010的礦板,初步確認(rèn)沒(méi)問(wèn)題
    的頭像 發(fā)表于 06-26 08:40 ?3897次閱讀
    《基于“礦板”低成本學(xué)習(xí)Zynq系列》之二-什么樣的礦板,<b class='flag-5'>一探究竟</b>

    NVMe SSD性能影響因素分析

    NVMe SSD 廠商Spec給出的性能非常完美,前面也給出了NVMe SSD和磁盤之間的性能對(duì)
    的頭像 發(fā)表于 11-13 11:39 ?1131次閱讀
    <b class='flag-5'>NVMe</b> <b class='flag-5'>SSD</b><b class='flag-5'>性能</b>影響<b class='flag-5'>因素</b>分析

    Xilinx FPGA NVMe主機(jī)控制器IP,高性能版本介紹應(yīng)用

    ,NVMe Host Controller IP所消耗的BRAM比較多,可以達(dá)到CrystalDiskMark測(cè)試軟件SEQ128K Q32T1測(cè)試模式的讀寫(xiě)性能。針對(duì)多路數(shù)據(jù)通道訪問(wèn)PCIe
    發(fā)表于 03-09 13:56

    Xilinx FPGA高性能NVMe SSD主機(jī)控制器,NVMe Host Controller IP

    SSD?易于集成的同步、可綜合Verilog設(shè)計(jì)?通過(guò)完全驗(yàn)證的NVMe Host Controller IP2概述NVMe Host Controller IP作為個(gè)對(duì)PCIe
    發(fā)表于 03-27 17:23

    性能NVMe主機(jī)控制器,Xilinx FPGA NVMe Host Accelerator IP

    SSD?易于集成的同步、可綜合Verilog設(shè)計(jì)?通過(guò)完全驗(yàn)證的NVMe Host Controller IP2概述NVMe Host Controller IP作為個(gè)對(duì)PCIe
    發(fā)表于 04-10 22:55

    iPhone 12 香不香?帶你一探究竟

    12 共有四款機(jī)型,國(guó)行售價(jià)最低的iPhone 12 mini價(jià)格為5499元,高配版的iPhone 12 Pro Max價(jià)格近1.2萬(wàn)元。 iPhone 12 怎么樣呢?現(xiàn)在我們就一探究竟。5G技術(shù)
    發(fā)表于 10-15 17:22

    一探究竟關(guān)于USB轉(zhuǎn)接口部分的電路

    看CT117E的原理圖中,關(guān)于USB轉(zhuǎn)接口部分的電路并未詳細(xì)標(biāo)明芯片型號(hào),不知道又有何蹊蹺,今就來(lái)一探究竟…具體位置藏匿于LCD之下,掀開(kāi)之后,便可窺得:兩個(gè)芯片:FT2232D和ATMEL528...
    發(fā)表于 12-16 06:25

    如何為工業(yè)應(yīng)用設(shè)計(jì)NVMe SSD

    RK3399核心板有哪些應(yīng)用?如何為工業(yè)應(yīng)用設(shè)計(jì)NVMe SSD呢?
    發(fā)表于 03-07 06:12

    NVMe SSD與SATA SSD性能對(duì)比

    老說(shuō)NVMe SSD性能是SATA SSD的四倍,那到底實(shí)際體驗(yàn)是怎樣的呢?
    的頭像 發(fā)表于 07-27 09:43 ?3.6w次閱讀

    一探究竟|CamsenseM Pro

    器人、導(dǎo)航迎賓機(jī)器人等方面的實(shí)時(shí)測(cè)量。 幫助測(cè)試者完成位姿特性、路徑追蹤、軌跡重繪、覆蓋偵測(cè)、導(dǎo)航優(yōu)化、空間姿態(tài)等專業(yè)測(cè)試。這種系統(tǒng)精度高且穩(wěn)定可靠,能夠幫助測(cè)試者快速優(yōu)化完善產(chǎn)品,縮短產(chǎn)品研發(fā)周期。 想了解更具體?下面我們一探究竟
    的頭像 發(fā)表于 09-05 15:35 ?10.3w次閱讀

    影響SSD性能因素有哪些 NVMe SSD性能解析

    SSD性能影響因素進(jìn)行分析,并給出存儲(chǔ)系統(tǒng)設(shè)計(jì)方面的些思考。 目錄 1 存儲(chǔ)介質(zhì)的變革 2 NVME
    的頭像 發(fā)表于 11-05 09:47 ?8929次閱讀

    OPPOFindX拆解 防護(hù)性能一探究竟

    則采用了極具創(chuàng)新性的“雙軌潛望結(jié)構(gòu)”。鑒于“雙軌潛望結(jié)構(gòu)”屬于精密機(jī)械部件,用戶不免對(duì)OPPO Find X的全面防護(hù)能力有所疑慮,所以我們這次將Find X進(jìn)行整體拆解,對(duì)Find X防護(hù)性能一探究竟
    的頭像 發(fā)表于 01-10 09:17 ?9833次閱讀

    一探究竟eSIM的發(fā)展道路

    而這消息也再次引發(fā)了用戶對(duì)于eSIM的討論,目前eSIM在國(guó)內(nèi)的應(yīng)用狀況到底怎樣?三大運(yùn)營(yíng)商在eSIM方面究竟如何布局?eSIM在國(guó)內(nèi)何時(shí)才能真正進(jìn)入智能手機(jī)領(lǐng)域?接下來(lái),我們就來(lái)一探究竟。
    的頭像 發(fā)表于 01-03 10:26 ?4235次閱讀

    iPhone 12 有哪些技術(shù)革新?帶你一探究竟

    “今天,我們將 5G 引入 iPhone,這對(duì)我們所有人來(lái)說(shuō),都是個(gè)具有劃時(shí)代意義的激動(dòng)時(shí)刻?!碧O(píng)果 CEO tim Cook(庫(kù)克)在昨日的蘋(píng)果新品發(fā)布會(huì)上說(shuō)道。 iPhone 12 帶來(lái)了哪些技術(shù)革新呢?現(xiàn)在我們就一探究竟。
    發(fā)表于 10-21 15:14 ?15次下載
    iPhone 12 有哪些技術(shù)革新?帶你<b class='flag-5'>一探究竟</b>

    浪潮NVMe SSD性能

    本次測(cè)試采用浪潮服務(wù)器 SA5112M6,磁盤采用三個(gè)節(jié)點(diǎn)每個(gè)節(jié)點(diǎn)八塊浪潮 INSPUR-NS8610G1U320 NVMe進(jìn)行測(cè)試,此次采用的NVMe SSD具有極高的性能,產(chǎn)品4K
    發(fā)表于 08-03 10:25 ?2039次閱讀
    RM新时代网站-首页