進(jìn)行海量數(shù)據(jù)處理與存儲(chǔ)調(diào)研的詳細(xì)資料說(shuō)明
資料介紹
1 Hadoop發(fā)展現(xiàn)狀
Apache Nutch 是 Hadoop 的源頭,該項(xiàng)目始于 2002年, 是Apache Lucene的子項(xiàng)目之一。 至 2004年,Google在OSDI上公開(kāi)發(fā)表了題為 “MapReduce: simplified data processing on large clusters”的論文,受到啟發(fā)的 Doug C 等人 開(kāi) 始 實(shí) 現(xiàn) MapReduce 計(jì) 算 框 架 并 與 NDFS (Nutch distributed file system) 結(jié)合支持 Nutch 的主要算法 。 至2006 年逐漸成為一套完整而獨(dú)立的軟件 ,起名為 Hadoop。2008 年初,Hadoop 成為 Apache 的頂級(jí)項(xiàng)目,應(yīng)用到除Yahoo! 以外的很多互聯(lián)網(wǎng)公司。
Hadoop 技術(shù)已經(jīng)在互聯(lián)網(wǎng)領(lǐng)域得以廣泛的應(yīng)用 , 同時(shí)也得到研究界的普遍關(guān)注。 如 Yahoo! 使用 4 000 節(jié)點(diǎn)的機(jī)群運(yùn)行 Hadoop, 支持廣告系統(tǒng)和 Web 搜索的研究;Facebook 使用 1 000 節(jié)點(diǎn)的機(jī)群運(yùn)行 Hadoop,存儲(chǔ)日志數(shù)據(jù),支持其上的數(shù)據(jù)分析和機(jī)器學(xué)習(xí);IBM 的藍(lán)云產(chǎn)品也直接將 Hadoop 軟件集成到自己本身的云計(jì)算平臺(tái)上;百度用 Hadoop 處理每周 200 TB 的數(shù)據(jù),進(jìn)行搜索日志分析和網(wǎng)頁(yè)數(shù)據(jù)挖掘工作; 中移動(dòng)研究院基于 Hadoop 開(kāi)發(fā)了“大云 ”(big cloud)系統(tǒng) ,不但用于相關(guān)數(shù)據(jù)分析,還對(duì)外提供服務(wù);淘寶的 Hadoop 系統(tǒng)用于存儲(chǔ)并處理的交易相關(guān)數(shù)據(jù)。 國(guó)內(nèi)的高校和科研院所基于 Hadoop 在數(shù)據(jù)存儲(chǔ)、資源管理、作業(yè)調(diào)度、性能優(yōu)化、系統(tǒng)高可用性和安全性方面進(jìn)行研究, 相關(guān)研究成果多以開(kāi)源形式貢獻(xiàn)給 Hadoop 社區(qū)。Cloudera 公司推出了首個(gè) Hadoop 商業(yè)版本,一個(gè)能夠存儲(chǔ)千兆位容量信息的服務(wù)器產(chǎn)品。公司發(fā)言人表示“hadoop 應(yīng)用于 Google、Yahoo、Facebook 等公司 , 已經(jīng)是一個(gè)成功的產(chǎn)品,發(fā)布該產(chǎn)品的商業(yè)版本,幾乎是理所當(dāng)然的事情 ”。 Cloudera 的 Hadoop 是 免 費(fèi) 的 , 并 將 分 配 在Apache 2 軟件許可下 。
2 淘寶網(wǎng)-集群存儲(chǔ)架構(gòu)
淘寶網(wǎng)部署了一個(gè)1.5PB的華為賽門鐵克Oceanspace N8000 Cluster NAS存儲(chǔ)系統(tǒng),以及一個(gè)包含賽門鐵克FileStore軟件的解決方案,該集群NAS存儲(chǔ)系統(tǒng)方案能夠?qū)浞莺突謴?fù)、動(dòng)態(tài)存儲(chǔ)分層(DST)和數(shù)據(jù)快照進(jìn)行整合管理。第二臺(tái)華為賽門鐵克Oceanspace N8000部署在一個(gè)“active-active”系統(tǒng)中,從而讓淘寶網(wǎng)的服務(wù)器能夠訪問(wèn)復(fù)制的常用數(shù)據(jù)庫(kù),以便進(jìn)行故障切換。
該團(tuán)隊(duì)還部署了Veritas NetBackup,以進(jìn)行集中的數(shù)據(jù)保護(hù)。通過(guò)將NetBackup與N8000和FileStore相集成,可以實(shí)現(xiàn)更快速、更便捷的備份。
組合的解決方案具有高度可伸縮性,這是部署過(guò)程中的主要考慮因素之一。馮江解釋說(shuō):“對(duì)于淘寶網(wǎng)來(lái)說(shuō),很難制定一個(gè)超過(guò)一年的完善計(jì)劃,因?yàn)闃I(yè)務(wù)發(fā)展的速度太快了。因此集中管理和出色的可伸縮性對(duì)我們來(lái)說(shuō)至關(guān)重要。內(nèi)置了賽門鐵克FileStore的華為賽門鐵克N8000可以擴(kuò)展到15PB,完全能夠滿足淘寶網(wǎng)一段時(shí)間內(nèi)的需求。”
賽門鐵克FileStore中的一項(xiàng)重要功能是動(dòng)態(tài)存儲(chǔ)分層 (DST),動(dòng)態(tài)存儲(chǔ)分層能夠?qū)?shù)據(jù)動(dòng)態(tài)移動(dòng)到不同的存儲(chǔ)層,以快速響應(yīng)淘寶網(wǎng)不斷變化的業(yè)務(wù)需求。經(jīng)常使用的數(shù)據(jù)可以存儲(chǔ)在第一層存儲(chǔ)上,而不常用的數(shù)據(jù)則可以駐留在第二層或第三層存儲(chǔ)上。
- 大數(shù)據(jù)海量數(shù)據(jù)處理方法總結(jié) 13次下載
- FPGA的RAM存儲(chǔ)資源詳細(xì)資料說(shuō)明 10次下載
- 西門子PLC教程之數(shù)據(jù)塊中的數(shù)據(jù)存儲(chǔ)詳細(xì)資料說(shuō)明 27次下載
- 西門子PLC教程之模擬量處理的詳細(xì)資料說(shuō)明 32次下載
- 存儲(chǔ)器及接口設(shè)計(jì)的詳細(xì)資料說(shuō)明 17次下載
- 數(shù)字信號(hào)處理的詳細(xì)的詳細(xì)資料說(shuō)明 0次下載
- MSSQL數(shù)據(jù)庫(kù)服務(wù)器的命令查看存儲(chǔ)過(guò)程詳細(xì)資料說(shuō)明 10次下載
- ARM處理器的工作模式詳細(xì)資料說(shuō)明 10次下載
- 進(jìn)行51單片機(jī)存儲(chǔ)器擴(kuò)展的詳細(xì)資料說(shuō)明
- 51單片機(jī)的物理存儲(chǔ)地址的詳細(xì)資料說(shuō)明
- 使用Proteus進(jìn)行一個(gè)仿真實(shí)例的詳細(xì)資料說(shuō)明
- 圖像處理教程之圖像復(fù)原的詳細(xì)資料說(shuō)明 7次下載
- 圖像處理教程之圖像運(yùn)算的詳細(xì)資料說(shuō)明 12次下載
- Java程序設(shè)計(jì)教程之異常處理的詳細(xì)資料說(shuō)明 13次下載
- EEPROM存儲(chǔ)器數(shù)據(jù)的詳細(xì)資料說(shuō)明 10次下載
- FPGA在數(shù)據(jù)處理中的應(yīng)用實(shí)例 483次閱讀
- PLC的數(shù)據(jù)處理能力都和哪些因素相關(guān)? 970次閱讀
- MATLAB文件讀寫(xiě)和數(shù)據(jù)處理的詳細(xì)解釋 3044次閱讀
- 融合互通,浪潮分布式融合存儲(chǔ)AS13000加速海量數(shù)據(jù)處理 727次閱讀
- 數(shù)據(jù)處理的基本問(wèn)題 1085次閱讀
- 組合式存儲(chǔ)的詳細(xì)資料說(shuō)明 1105次閱讀
- 應(yīng)對(duì)海量圖片存儲(chǔ)的分布式存儲(chǔ)解決方案 3824次閱讀
- 如何進(jìn)行PLC控制程序的設(shè)計(jì)詳細(xì)資料PPT說(shuō)明 6010次閱讀
- 云存儲(chǔ)是金融行業(yè)應(yīng)對(duì)海量信息的關(guān)鍵 1131次閱讀
- 基于流式計(jì)算的DPI數(shù)據(jù)處理方案 5054次閱讀
- 深入解析大數(shù)據(jù)處理基本步驟 4201次閱讀
- 淺析大數(shù)據(jù)處理的關(guān)鍵技術(shù)及應(yīng)用 8515次閱讀
- PLC常用基本環(huán)節(jié)梯形圖和詳細(xì)文字說(shuō)明詳細(xì)資料概述 1w次閱讀
- 破解元數(shù)據(jù)存儲(chǔ)與管理難題,是浪潮軟件定義存儲(chǔ)馳騁海量數(shù)據(jù)時(shí)代的關(guān)鍵 5817次閱讀
- 基于單片機(jī)的高精度海量數(shù)據(jù)采集與存儲(chǔ)系統(tǒng) 3157次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 92次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7藍(lán)牙設(shè)備在嵌入式領(lǐng)域的廣泛應(yīng)用
- 0.63 MB | 3次下載 | 免費(fèi)
- 89天練會(huì)電子電路識(shí)圖
- 5.91 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論