分布式存儲技術有哪些
1、元數據管理
在大數據環境下,元數據的體量也非常大,元數據的存取性能是整個分布式文件系統性能的關鍵。常見的元數據管理可以分為集中式和分布式元數據管理架構。集中式元數據管理架構采用單一的元數據服務器,實現簡單.但是存在單點故障等問題。分布式元數據管理架構則將元數據分散在多個結點上.進而解決了元數據服務器的性能瓶頸等問題.并提高了元數據管理架構的可擴展性,但實現較為復雜,并引入了元數據一致性的問題。另外,還有一種無元數據服務器的分布式架構,通過在線算法組織數據,不需要專用的元數據服務器。但是該架構對數據一致性的保障很困難.實現較為復雜。文件目錄遍歷操作效率低下,并且缺乏文件系統全局監控管理功能。
2、系統彈性擴展技術
在大數據環境下,數據規模和復雜度的增加往往非常迅速,對系統的擴展性能要求較高。實現存儲系統的高可擴展性首先要解決兩個方面的重要問題,包含元數據的分配和數據的透明遷移。元數據的分配主要通過靜態子樹劃分技術實現,后者則側重數據遷移算法的優化。此外,大數據存儲體系規模龐大.結點失效率高,因此還需要完成一定的自適應管理功能。系統必須能夠根據數據量和計算的工作量估算所需要的結點個數,并動態地將數據在結點間遷移。以實現負載均衡;同時.結點失效時,數據必須可以通過副本等機制進行恢復,不能對上層應用產生影響。
3、存儲層級內的優化技術
構建存儲系統時.需要基于成本和性能來考慮,因此存儲系統通常采用多層不同性價比的存儲器件組成存儲層次結構。大數據的規模大,因此構建高效合理的存儲層次結構,可以在保證系統性能的前提下,降低系統能耗和構建成本,利用數據訪問局部性原理.可以從兩個方面對存儲層次結構進行優化。從提高性能的角度,可以通過分析應用特征,識別熱點數據并對其進行緩存或預取,通過高效的緩存預取算法和合理的緩存容量配比,以提高訪問性能。從降低成本的角度,采用信息生命周期管理方法,將訪問頻率低的冷數據遷移到低速廉價存儲設備上,可以在小幅犧牲系統整體性能的基礎上,大幅降低系統的構建成本和能耗。
4、針對應用和負載的存儲優化技術
傳統數據存儲模型需要支持盡可能多的應用,因此需要具備較好的通用性。大數據具有大規模、高動態及快速處理等特性,通用的數據存儲模型通常并不是最能提高應用性能的模型.而大數據存儲系統對上層應用性能的關注遠遠超過對通用性的追求。針對應用和負載來優化存儲,就是將數據存儲與應用耦合。簡化或擴展分布式文件系統的功能,根據特定應用、特定負載、特定的計算模型對文件系統進行定制和深度優化,使應用達到最佳性能。這類優化技術在谷歌、Facebook等互聯網公司的內部存儲系統上,管理超過千萬億字節級別的大數據,能夠達到非常高的性能。
-
存儲技術
+關注
關注
6文章
753瀏覽量
46224 -
分布式存儲
+關注
關注
4文章
178瀏覽量
19785
發布評論請先 登錄
曙光存儲領跑中國分布式存儲市場
分布式存儲和集中式存儲有何區別
淺談屋頂分布式光伏發電技術的設計與應用

分布式光纖聲波傳感技術的工作原理

評論