如今,災(zāi)難以多種形式出現(xiàn)。破壞、盜竊、遺失或自然災(zāi)害都會(huì)使企業(yè)的應(yīng)用程序崩潰并破壞其數(shù)據(jù)。在理想的情況下,企業(yè)的數(shù)據(jù)保護(hù)基礎(chǔ)設(shè)施可以立即在故障點(diǎn)時(shí)間恢復(fù)所有的應(yīng)用程序和數(shù)據(jù)。
企業(yè)可以立即切換故障應(yīng)用程序,并連續(xù)復(fù)制其數(shù)據(jù)以實(shí)現(xiàn)接近零的損失。但是這些操作耗費(fèi)資源并且很昂貴。實(shí)際上,IT部門需要根據(jù)預(yù)算、資源和應(yīng)用優(yōu)先級來設(shè)置不同的恢復(fù)時(shí)間和恢復(fù)點(diǎn)目標(biāo)。
人們將這兩個(gè)目標(biāo)稱為恢復(fù)時(shí)間目標(biāo)(RTO)和恢復(fù)點(diǎn)目標(biāo)(RPO)。它們是相關(guān)的,并且這兩者都是應(yīng)用程序和數(shù)據(jù)恢復(fù)所必需的。它們也是不同用途的度量指標(biāo)。
以下討論一下它們是什么,它們的相似之處和不同之處,以及為什么需要分析應(yīng)用程序的優(yōu)先級來平衡資源和應(yīng)用程序的可用性。
|| 定義RTO和RPO
(1)RTO:恢復(fù)時(shí)間目標(biāo)
RTO指的是應(yīng)用程序可以中斷或關(guān)閉多少時(shí)間而不會(huì)對業(yè)務(wù)造成重大損害。有些應(yīng)用程序可能會(huì)停機(jī)數(shù)天而不會(huì)產(chǎn)生嚴(yán)重的后果。而一些高優(yōu)先級的應(yīng)用程序只能停下來幾秒鐘,否則將會(huì)讓企業(yè)和客戶難以應(yīng)對,并導(dǎo)致業(yè)務(wù)丟失。
RTO不僅僅是業(yè)務(wù)損失和恢復(fù)之間的持續(xù)時(shí)間。這個(gè)目標(biāo)還包括IT部門必須采取的步驟來恢復(fù)應(yīng)用程序及其數(shù)據(jù)。如果IT已經(jīng)投入高優(yōu)先級應(yīng)用程序的故障轉(zhuǎn)移服務(wù),那么它們可以在幾秒鐘內(nèi)安全地表達(dá)RTO(IT部門必須恢復(fù)本地環(huán)境,但由于應(yīng)用程序正在云中進(jìn)行處理,因此IT部門可能需要一些時(shí)間)。
企業(yè)的RTO任務(wù)是根據(jù)優(yōu)先級和潛在業(yè)務(wù)損失對應(yīng)用程序進(jìn)行分類,并相應(yīng)地匹配企業(yè)的資源。例如,接近零的RTO的典型計(jì)劃將需要故障轉(zhuǎn)移服務(wù)。4小時(shí)RTO允許從裸機(jī)恢復(fù)開始進(jìn)行本地恢復(fù),并以完整的應(yīng)用程序和數(shù)據(jù)可用性結(jié)束。對于8小時(shí)以上的RTO,IT團(tuán)隊(duì)可以與本地系統(tǒng)集成商簽署維護(hù)合同。
(2)RPO:恢復(fù)點(diǎn)目標(biāo)
恢復(fù)點(diǎn)目標(biāo)是指企業(yè)的損失容限:在對業(yè)務(wù)造成重大損害之前可能丟失的數(shù)據(jù)量。該目標(biāo)表示為從丟失事件到最近一次在前備份的時(shí)間度量。
如果以定期計(jì)劃的24小時(shí)增量備份全部或大部分?jǐn)?shù)據(jù),那么在最壞的情況下,企業(yè)將丟失24小時(shí)的數(shù)據(jù)。對于某些應(yīng)用來說,這是可以接受的,對于其他人來說并不是這樣。
例如,如果企業(yè)的應(yīng)用程序具有4小時(shí)RPO,那么備份和數(shù)據(jù)丟失之間的最大間隔時(shí)間將為4小時(shí)。擁有4小時(shí)的RPO并不一定意味著企業(yè)將失去4小時(shí)的數(shù)據(jù)。例如一個(gè)文字處理應(yīng)用程序在午夜停止運(yùn)行并在凌晨出現(xiàn)故障,那么可能沒有丟失太多(或任何)數(shù)據(jù)。但是如果一個(gè)任務(wù)繁忙的應(yīng)用程序在上午10點(diǎn)關(guān)閉并且直到下午2點(diǎn)才恢復(fù),那么企業(yè)可能會(huì)失去4個(gè)小時(shí)的高價(jià)值并且可能無法替代的數(shù)據(jù)。在這種情況下,需要進(jìn)行更加頻繁的備份,以便訪問特定于應(yīng)用程序的RPO。
這取決于應(yīng)用優(yōu)先級,單個(gè)RPO的范圍通常為24小時(shí)、12小時(shí)、8小時(shí)、4小時(shí)。以秒為單位測量到接近零。只要對生產(chǎn)系統(tǒng)的影響最小,8小時(shí)以上的RPO就可以利用現(xiàn)有的備份解決方案。4小時(shí)的RPO將需要計(jì)劃的快照復(fù)制,而接近零的RPO將需要連續(xù)復(fù)制。在RPO和RTO都接近于零的情況下,將連續(xù)復(fù)制與故障轉(zhuǎn)移服務(wù)結(jié)合使用,以實(shí)現(xiàn)接近100%的應(yīng)用程序和數(shù)據(jù)可用性。
|| RTO和RPO如何相似以及不同的原因
(1)RTO和RPO的幾個(gè)特征
*恢復(fù)時(shí)間和恢復(fù)點(diǎn)目標(biāo)因應(yīng)用程序和數(shù)據(jù)優(yōu)先級而異。即使是規(guī)模和實(shí)力最強(qiáng)的公司也不能為所有應(yīng)用程序提供接近零的RTO或RPO,也不應(yīng)該這樣做。
*確保100%正常運(yùn)行時(shí)間(RTO)和沒有丟失數(shù)據(jù)(RPO)的唯一方法是投資連續(xù)數(shù)據(jù)復(fù)制功能的故障轉(zhuǎn)移虛擬環(huán)境。
*IT優(yōu)先處理應(yīng)用程序和數(shù)據(jù)以匹配所實(shí)現(xiàn)的RTO和RPO的費(fèi)用。請注意,優(yōu)先事項(xiàng)不僅取決于收入,還取決于風(fēng)險(xiǎn)。企業(yè)可能不經(jīng)常使用應(yīng)用程序,但如果其數(shù)據(jù)受到管制,那么數(shù)據(jù)丟失可能會(huì)導(dǎo)致巨額罰款。
* RTO和RPO均以時(shí)間為單位進(jìn)行測量。對于RTO來說,其度量標(biāo)準(zhǔn)是應(yīng)用程序失敗和包括數(shù)據(jù)恢復(fù)在內(nèi)的完整可用性之間的時(shí)間量。RPO也以時(shí)間單位來衡量。度量標(biāo)準(zhǔn)是數(shù)據(jù)丟失和前一次備份之間的時(shí)間間隔。對于RTO和RPO來說,其應(yīng)用程序/數(shù)據(jù)優(yōu)先級可直接轉(zhuǎn)換為更短的時(shí)間單位。
(2)RTO和RPO的目標(biāo)存在巨大的差異
盡管它們有相似之處,但RPO和RTO服務(wù)于不同的目標(biāo)。RTO涉及應(yīng)用程序和系統(tǒng),但主要描述應(yīng)用程序停機(jī)時(shí)間的限制。
RPO主要與失敗事件后丟失的數(shù)據(jù)量有關(guān)。但是,損失數(shù)十萬美元的客戶交易將是災(zāi)難性的后果。
|| RTO和RPO在行動(dòng)中的實(shí)例
?單一文件恢復(fù):例如一家公司員工意外刪除一個(gè)時(shí)間敏感的電子郵件,然后清空回收站和文件夾的內(nèi)容。由于Microsoft Exchange是這家公司的業(yè)務(wù)關(guān)鍵型應(yīng)用程序,因此IT部門不斷支持Exchange中的增量更改。而且由于他們的備份應(yīng)用程序能夠進(jìn)行精細(xì)的備份和恢復(fù),他們可以在5分鐘的RTO內(nèi)恢復(fù)單個(gè)文件,而不用為單個(gè)文件恢復(fù)整個(gè)虛擬機(jī)。
?電子商務(wù)網(wǎng)站:例如,一家零售商店的自營電子商務(wù)網(wǎng)站使用三種不同的數(shù)據(jù)庫:存儲(chǔ)產(chǎn)品目錄的關(guān)系數(shù)據(jù)庫,報(bào)告歷史訂單數(shù)據(jù)的文檔數(shù)據(jù)庫,以及連接到其支付處理器網(wǎng)關(guān)的API數(shù)據(jù)庫。文件數(shù)據(jù)庫可以重建來自其他數(shù)據(jù)庫的數(shù)據(jù),因此其RTO和RPO是在24小時(shí)內(nèi)。該業(yè)務(wù)每周只向關(guān)系數(shù)據(jù)庫添加一次產(chǎn)品,因此RPO并不重要。 其RTO是如果數(shù)據(jù)庫關(guān)閉,則客戶交易停止。
為了保持高可用性,這家商店采用了故障轉(zhuǎn)移服務(wù),因此數(shù)據(jù)庫立即在虛擬服務(wù)器上運(yùn)行。該公司將其在一周內(nèi)進(jìn)行的少量更改復(fù)制到其提供商的災(zāi)難恢復(fù)平臺。API數(shù)據(jù)庫包含訂購信息,并且需要幾秒鐘才能完成RPO和RTO。 IT部門不斷地將數(shù)據(jù)復(fù)制到故障轉(zhuǎn)移站點(diǎn),如果API數(shù)據(jù)庫停機(jī),該站點(diǎn)將立即接管處理。
成本考慮
調(diào)查表明,年收入1億美元的公司在24小時(shí)宕機(jī)期間將損失約275,000美元。而將在4小時(shí)快照復(fù)制計(jì)劃中損失約45,000美元,使用接近于零的連續(xù)復(fù)制的損失約為7600美元。
實(shí)際上,這個(gè)數(shù)量可能會(huì)更小或更大,具體取決于企業(yè)一天中的時(shí)間和應(yīng)用程序活動(dòng)。繁忙的任務(wù)或業(yè)務(wù)關(guān)鍵應(yīng)用程序會(huì)比不太頻繁的應(yīng)用程序丟失更多的數(shù)據(jù)和更高優(yōu)先級的數(shù)據(jù)。
企業(yè)需要相應(yīng)地規(guī)劃RPO和RTO,并在需要之前購買所需的資源。就像購買保險(xiǎn)一樣,企業(yè)可能永遠(yuǎn)不必使用它們,但可能會(huì)挽救其業(yè)務(wù)。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7002瀏覽量
88938 -
RTO
+關(guān)注
關(guān)注
0文章
16瀏覽量
11174 -
應(yīng)用程序
+關(guān)注
關(guān)注
37文章
3265瀏覽量
57677
原文標(biāo)題:恢復(fù)時(shí)間目標(biāo)(RTO)和恢復(fù)點(diǎn)目標(biāo)(RPO)的理解差異
文章出處:【微信號:D1Net11,微信公眾號:存儲(chǔ)D1net】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論