分布式存儲(chǔ)技術(shù)有哪些
1、元數(shù)據(jù)管理
在大數(shù)據(jù)環(huán)境下,元數(shù)據(jù)的體量也非常大,元數(shù)據(jù)的存取性能是整個(gè)分布式文件系統(tǒng)性能的關(guān)鍵。常見(jiàn)的元數(shù)據(jù)管理可以分為集中式和分布式元數(shù)據(jù)管理架構(gòu)。集中式元數(shù)據(jù)管理架構(gòu)采用單一的元數(shù)據(jù)服務(wù)器,實(shí)現(xiàn)簡(jiǎn)單.但是存在單點(diǎn)故障等問(wèn)題。分布式元數(shù)據(jù)管理架構(gòu)則將元數(shù)據(jù)分散在多個(gè)結(jié)點(diǎn)上.進(jìn)而解決了元數(shù)據(jù)服務(wù)器的性能瓶頸等問(wèn)題.并提高了元數(shù)據(jù)管理架構(gòu)的可擴(kuò)展性,但實(shí)現(xiàn)較為復(fù)雜,并引入了元數(shù)據(jù)一致性的問(wèn)題。另外,還有一種無(wú)元數(shù)據(jù)服務(wù)器的分布式架構(gòu),通過(guò)在線算法組織數(shù)據(jù),不需要專(zhuān)用的元數(shù)據(jù)服務(wù)器。但是該架構(gòu)對(duì)數(shù)據(jù)一致性的保障很困難.實(shí)現(xiàn)較為復(fù)雜。文件目錄遍歷操作效率低下,并且缺乏文件系統(tǒng)全局監(jiān)控管理功能。
2、系統(tǒng)彈性擴(kuò)展技術(shù)
在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)規(guī)模和復(fù)雜度的增加往往非常迅速,對(duì)系統(tǒng)的擴(kuò)展性能要求較高。實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的高可擴(kuò)展性首先要解決兩個(gè)方面的重要問(wèn)題,包含元數(shù)據(jù)的分配和數(shù)據(jù)的透明遷移。元數(shù)據(jù)的分配主要通過(guò)靜態(tài)子樹(shù)劃分技術(shù)實(shí)現(xiàn),后者則側(cè)重?cái)?shù)據(jù)遷移算法的優(yōu)化。此外,大數(shù)據(jù)存儲(chǔ)體系規(guī)模龐大.結(jié)點(diǎn)失效率高,因此還需要完成一定的自適應(yīng)管理功能。系統(tǒng)必須能夠根據(jù)數(shù)據(jù)量和計(jì)算的工作量估算所需要的結(jié)點(diǎn)個(gè)數(shù),并動(dòng)態(tài)地將數(shù)據(jù)在結(jié)點(diǎn)間遷移。以實(shí)現(xiàn)負(fù)載均衡;同時(shí).結(jié)點(diǎn)失效時(shí),數(shù)據(jù)必須可以通過(guò)副本等機(jī)制進(jìn)行恢復(fù),不能對(duì)上層應(yīng)用產(chǎn)生影響。
3、存儲(chǔ)層級(jí)內(nèi)的優(yōu)化技術(shù)
構(gòu)建存儲(chǔ)系統(tǒng)時(shí).需要基于成本和性能來(lái)考慮,因此存儲(chǔ)系統(tǒng)通常采用多層不同性?xún)r(jià)比的存儲(chǔ)器件組成存儲(chǔ)層次結(jié)構(gòu)。大數(shù)據(jù)的規(guī)模大,因此構(gòu)建高效合理的存儲(chǔ)層次結(jié)構(gòu),可以在保證系統(tǒng)性能的前提下,降低系統(tǒng)能耗和構(gòu)建成本,利用數(shù)據(jù)訪問(wèn)局部性原理.可以從兩個(gè)方面對(duì)存儲(chǔ)層次結(jié)構(gòu)進(jìn)行優(yōu)化。從提高性能的角度,可以通過(guò)分析應(yīng)用特征,識(shí)別熱點(diǎn)數(shù)據(jù)并對(duì)其進(jìn)行緩存或預(yù)取,通過(guò)高效的緩存預(yù)取算法和合理的緩存容量配比,以提高訪問(wèn)性能。從降低成本的角度,采用信息生命周期管理方法,將訪問(wèn)頻率低的冷數(shù)據(jù)遷移到低速廉價(jià)存儲(chǔ)設(shè)備上,可以在小幅犧牲系統(tǒng)整體性能的基礎(chǔ)上,大幅降低系統(tǒng)的構(gòu)建成本和能耗。
4、針對(duì)應(yīng)用和負(fù)載的存儲(chǔ)優(yōu)化技術(shù)
傳統(tǒng)數(shù)據(jù)存儲(chǔ)模型需要支持盡可能多的應(yīng)用,因此需要具備較好的通用性。大數(shù)據(jù)具有大規(guī)模、高動(dòng)態(tài)及快速處理等特性,通用的數(shù)據(jù)存儲(chǔ)模型通常并不是最能提高應(yīng)用性能的模型.而大數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)上層應(yīng)用性能的關(guān)注遠(yuǎn)遠(yuǎn)超過(guò)對(duì)通用性的追求。針對(duì)應(yīng)用和負(fù)載來(lái)優(yōu)化存儲(chǔ),就是將數(shù)據(jù)存儲(chǔ)與應(yīng)用耦合。簡(jiǎn)化或擴(kuò)展分布式文件系統(tǒng)的功能,根據(jù)特定應(yīng)用、特定負(fù)載、特定的計(jì)算模型對(duì)文件系統(tǒng)進(jìn)行定制和深度優(yōu)化,使應(yīng)用達(dá)到最佳性能。這類(lèi)優(yōu)化技術(shù)在谷歌、Facebook等互聯(lián)網(wǎng)公司的內(nèi)部存儲(chǔ)系統(tǒng)上,管理超過(guò)千萬(wàn)億字節(jié)級(jí)別的大數(shù)據(jù),能夠達(dá)到非常高的性能。
-
存儲(chǔ)技術(shù)
+關(guān)注
關(guān)注
5文章
732瀏覽量
45796 -
分布式存儲(chǔ)
+關(guān)注
關(guān)注
4文章
171瀏覽量
19523
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論