數(shù)據(jù)的備份和歸檔具有不同的功能,很多人沒(méi)有認(rèn)識(shí)到兩者之間的差異,這可能導(dǎo)致訪(fǎng)問(wèn)問(wèn)題,甚至法律問(wèn)題。而對(duì)于備份人員來(lái)說(shuō),備份和歸檔之間的差別非常明顯,很容易理解。
什么是備份?
備份是為了在損壞或丟失的情況下恢復(fù)所述數(shù)據(jù)而創(chuàng)建的數(shù)據(jù)副本。在備份完成后,不會(huì)刪除原始數(shù)據(jù)。
備份的例子包括筆記本電腦或臺(tái)式機(jī)上所有文件的每次備份,或者iPhone上的所有照片都會(huì)被復(fù)制到iCloud,以防數(shù)據(jù)隨著手機(jī)丟失而丟失。人們還將備份文件服務(wù)器(非結(jié)構(gòu)化數(shù)據(jù))和數(shù)據(jù)庫(kù)(結(jié)構(gòu)化數(shù)據(jù))。備份可能會(huì)更加關(guān)注數(shù)據(jù),如數(shù)據(jù)庫(kù)轉(zhuǎn)儲(chǔ)、服務(wù)器的操作系統(tǒng)、裸機(jī)備份,或兩者都支持VMware 的VMDK文件的備份。
備份的定義實(shí)際上歸結(jié)為目的,備份的目的始終是相同的:如果發(fā)生某些事情,則恢復(fù)數(shù)據(jù)。例如,RAID 6存儲(chǔ)陣列的三個(gè)磁盤(pán)可能存在故障,并且需要還原其所有數(shù)據(jù)。有人可能會(huì)意外或惡意刪除VMware、Hyper-V或AWS EC2配置中的一個(gè)或多個(gè)虛擬機(jī),并且需要還原它們。人們可能有一天會(huì)意識(shí)到組織中的每個(gè)文件都已被勒索軟件包加密。如果沒(méi)有良好的備份系統(tǒng),其最終的選擇只能是支付贖金。而有了良好的備份系統(tǒng),則可以找到勒索軟件所勒索的數(shù)據(jù),然后恢復(fù)所有數(shù)據(jù),而無(wú)需支付黑客勒索費(fèi)用。
什么是歸檔?
歸檔是為參考目的而創(chuàng)建的數(shù)據(jù)副本。雖然不是必需的,但在進(jìn)行歸檔后通常會(huì)刪除原件。
如果備份的目的是將某些數(shù)據(jù)恢復(fù)到平時(shí)的樣子,那么歸檔可以用于多種目的。最常見(jiàn)的目的是幫助人們找到很久以前的一些數(shù)據(jù)。它可能是單個(gè)文件,其中包含一個(gè)非常重要的項(xiàng)目,例如幾年前客戶(hù)簽署的合同。它可能是一組相關(guān)的數(shù)據(jù),例如某個(gè)建筑物的所有結(jié)構(gòu)圖。或者它可能是企業(yè)過(guò)去制作的都已經(jīng)過(guò)時(shí)的所有CAD圖紙。
另一個(gè)相關(guān)數(shù)據(jù)集可能是可以證明給定點(diǎn)的所有電子郵件和/或文件。也許一名員工被解雇了,這是因?yàn)楣菊J(rèn)為他實(shí)施了沒(méi)有許可的行為,然后。企業(yè)的訴訟可能會(huì)發(fā)出一個(gè)電子發(fā)現(xiàn)請(qǐng)求,要求所有發(fā)送給他們的電子郵件,其中非工作時(shí)間或他們將要兼職的公司名稱(chēng)。其他人可能正試圖證明其工作狀態(tài),并希望查看來(lái)自特定管理人員的所有電子郵件,這些管理人員的電子郵件將會(huì)列出。
歸檔可以幫助人們完成所有這些任務(wù)。某人可能擁有企業(yè)所提供的每個(gè)銷(xiāo)售訂單、報(bào)價(jià)或合同的歸檔。可以在線(xiàn)保留當(dāng)前的合同和訂單,但是將所有這些合同和訂單保存在歸檔中,歸檔應(yīng)該有一個(gè)索引,允許通過(guò)這些訂單的內(nèi)容檢索訂單和合同。或者某人也可能擁有公司發(fā)送或接收的每封電子郵件的歸檔。
某些電子郵件歸檔系統(tǒng)可以從電子郵件服務(wù)器中清除已存檔的電子郵件,這些電子郵件可以通過(guò)超過(guò)一定大小,或在n天內(nèi)未被訪(fǎng)問(wèn)等條件進(jìn)行消除。這有助于保持電子郵件系統(tǒng)的精簡(jiǎn),節(jié)省計(jì)算和存儲(chǔ)資源,并使備份工作更容易。如果法律不要求人們保留所有電子郵件,那么這甚至可能是歸檔的目的。
恢復(fù)與檢索
即使歸檔的目的是節(jié)省主存儲(chǔ)空間,它也需要能夠執(zhí)行檢索而不是恢復(fù)(如果要將其稱(chēng)為存檔)。備份系統(tǒng)還原和歸檔系統(tǒng)檢索。
還原時(shí),它通常是單個(gè)文件、服務(wù)器或數(shù)據(jù)庫(kù)。當(dāng)人們檢索某些內(nèi)容時(shí),它通常是相關(guān)數(shù)據(jù)的集合,可能存儲(chǔ)也可能不存儲(chǔ)在同一服務(wù)器上,甚至可能存儲(chǔ)在相同的格式中。還可以對(duì)單個(gè)時(shí)間點(diǎn)執(zhí)行還原,例如將數(shù)據(jù)庫(kù)還原到某天的樣子。檢索使用一段時(shí)間的數(shù)據(jù),例如過(guò)去三年的所有電子郵件。
數(shù)據(jù)恢復(fù)需要人們了解文件或數(shù)據(jù)備份時(shí)的大部分內(nèi)容,否則很難找到它。人們需要知道它所在的服務(wù)器的名稱(chēng),它所在的數(shù)據(jù)庫(kù)或目錄,要返回的文件或表的名稱(chēng),以及上次查看的日期。檢索不需要這些信息,人們只需要知道所有與一組參數(shù)匹配的文件或記錄。例如提供過(guò)去三年中創(chuàng)建的包含特定短語(yǔ)或由特定人員創(chuàng)作的所有文件或電子郵件。
差異為何重要
許多人嘗試將他們的備份系統(tǒng)用作歸檔系統(tǒng),這意味著他們將備份保存多年,甚至永遠(yuǎn)。在第一次獲得真正的檢索請(qǐng)求時(shí),人們會(huì)發(fā)現(xiàn)從執(zhí)行恢復(fù)的操作中執(zhí)行檢索是多么困難。這將使檢索花費(fèi)更多、更長(zhǎng)的時(shí)間,可能是幾個(gè)月而不是幾分鐘,并且花費(fèi)更多的成本,甚至高達(dá)數(shù)百萬(wàn)美元。
如果檢索是針對(duì)來(lái)自訴訟的電子發(fā)現(xiàn)請(qǐng)求,并且無(wú)法及時(shí)滿(mǎn)足,那么可能會(huì)有法院發(fā)出不利推理指令的風(fēng)險(xiǎn)。人們花費(fèi)六個(gè)月的時(shí)間來(lái)滿(mǎn)足他們所知道的簡(jiǎn)單要求,而卻遠(yuǎn)遠(yuǎn)沒(méi)有完成。法官推斷其試圖隱瞞什么。比較聞名的例子是摩根士丹利的訴訟案例,他們?cè)谶@種情況下?lián)p失了數(shù)十億美元。
因此,不要將備份用作歸檔。如果人們有著長(zhǎng)期存儲(chǔ)需求,請(qǐng)采用一個(gè)實(shí)際的歸檔系統(tǒng)。這將有一個(gè)前期成本,但從長(zhǎng)遠(yuǎn)來(lái)看它將是值得的。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7238瀏覽量
90946 -
備份
+關(guān)注
關(guān)注
0文章
81瀏覽量
15991
原文標(biāo)題:備份與歸檔:為什么知道差異很重要
文章出處:【微信號(hào):D1Net11,微信公眾號(hào):存儲(chǔ)D1net】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
數(shù)據(jù)備份
阿里云數(shù)據(jù)庫(kù)備份DBS商業(yè)化發(fā)布,數(shù)據(jù)庫(kù)實(shí)時(shí)備份到OSS
什么是差異備份
什么是映像備份
數(shù)據(jù)備份與數(shù)據(jù)歸檔冷熱狀態(tài)的區(qū)別
氣象數(shù)據(jù)歸檔織的并行算法設(shè)計(jì)與驗(yàn)證

備份在任何云策略中都至關(guān)重要,但是存儲(chǔ)數(shù)據(jù)的位置同樣重要
什么是熱備份_熱備份和冷備份的區(qū)別

PADS歸檔管理器管理設(shè)計(jì)數(shù)據(jù)和檔案備份
備份與歸檔的差異重不重要
如何暴漲數(shù)據(jù)備份成功率?
恒訊科技分析:云備份與云存儲(chǔ)有什么區(qū)別?
SQL Server數(shù)據(jù)庫(kù)備份方法
深入理解數(shù)據(jù)備份的關(guān)鍵原則:應(yīng)用一致性與崩潰一致性的區(qū)別

評(píng)論