由雅虎為工程師和數據科學家打造的Apache Hadoop曾因巨大的潛力而備受稱贊,但如今它卻受到了更快的產品的影響,而這些產品往往來自于它本身的生態系統——Spark就是其中之一。今年早些,H20.ai的創始人Sri Ambati對Datanami 曾說:“Spark將會使Hadoop處于絕地”。
但在過去的幾年中,Hadoop似乎并沒有出現過任何衰退的跡象。在2015年Atscale的調查報告中顯示:“在未來3個月內,已經有超過 76%的人使用Hadoop來做更多的工作。”這些受訪者中大約有一半聲稱他們利用Hadoop工作中獲得了一定的價值。Hadoop作為一個十多年的老品牌,在產品的采用方面并沒有減緩下降的趨勢,Spark也并沒有做到真正取代Hadoop。空口無憑,下面我們從以下幾個方面來分析一下Spark在未來的幾年之內到底能不能真正的取代Hadoop。
按行業劃分的市場滲透率
毫無疑問,為專家設計的產品一般都會停留在原來的軌道上,在其他方面不會有所涉及。但Spark在各個行業都存在一些有意義的分布,這可能要歸功于各種市場上的大數據的泛濫。所以,雖然Spark可能有更廣泛的應用,但Hadoop仍然支配著原本預期的用戶群。
主要地理市場
在全球范圍內,我們可以看到Informatica處于中心位置——在歐洲和美洲整體市場份額占比達32%。在兩年半的時間里,我們跟蹤了Informatica在云市場和工業領域的增長,結果顯示達到了50%的增長,而且在高等教育領域也處于領先地位。上周, Informatica被Gartner評為主數據管理解決方案2017年魔力象限的領導者。而Hadoop仍然停留于過去成功的地理市場中。
公司規模的采用趨勢
在企業客戶中Spark也沒有大范圍的涉及。我們注意到世界上大多數公司規模較小,一般都為1-50名員工,所以Spark似乎并不是任何規模公司的唯一選擇。對于那些已經使用Hadoop的人來說,這個產品也對企業和公司起到了一定的作用,而且 Hadoop并不僅限于一種用戶。而Hadoop無論在何種規模的公司中,使用率相對于Spark還是非常高的。
寫在最后
此外,在調查的過程中,傳統的科技公司像eBay、Verizon、惠普和亞馬遜等主流廠商已經開始使用Spark,但是Hadoop還沒有被大規模的拋棄。相反,用戶使用Spark作為系統的介紹,利用這個程序來突破Hadoop的障礙,兩者的結合,使得工作更高效的完成。
-
Hadoop
+關注
關注
1文章
90瀏覽量
16346 -
大數據
+關注
關注
64文章
8950瀏覽量
139474
發布評論請先 登錄
大數據時代,如何提高高速PCB設計效率?

FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
公有云服務器在大數據與AI時代的角色與機遇
Hadoop 生態系統在大數據處理中的應用與實踐
上位機系統優化技巧 上位機如何處理大數據
ADS1675最大數據吞吐率是是多少?
SD NAND在大數據時代的應用場景

智慧城市與大數據的關系
耳機座連接器:未來是否會被全部取代?

耳機座接口會被TYPE-C取代嗎?
基于Kepware的Hadoop大數據應用構建-提升數據價值利用效能

spark為什么比mapreduce快?
spark運行的基本流程

Spark基于DPU的Native引擎算子卸載方案

評論