時(shí)常聽(tīng)創(chuàng)業(yè)者說(shuō)自己的公司每天會(huì)生產(chǎn)/記錄很多的數(shù)據(jù),雖然他們暫時(shí)還沒(méi)想明白怎么用這些數(shù)據(jù),但把這些數(shù)據(jù)都先存起來(lái)了。他們經(jīng)常還說(shuō),通過(guò)這些數(shù)據(jù)他們的產(chǎn)品/服務(wù)將得到很大的提升,仿佛這些數(shù)據(jù)就是公司的救世主一樣。本文不想討論這種觀點(diǎn)正確與否,但想在這里解釋兩個(gè)關(guān)于大數(shù)據(jù)的常見(jiàn)誤解:
一、數(shù)據(jù)不等于信息
經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來(lái)用。其實(shí)不然,數(shù)據(jù)指的是一個(gè)原始的數(shù)據(jù)點(diǎn)(無(wú)論是通過(guò)數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更能不能代表信息就會(huì)成比例增多。我們來(lái)看兩個(gè)簡(jiǎn)單的例子:
備份。很多人如今已經(jīng)會(huì)定期的對(duì)自己的硬盤(pán)進(jìn)行備份。這個(gè)沒(méi)什么好多解釋的,每次備份都會(huì)創(chuàng)造出一組新的數(shù)據(jù),但信息并沒(méi)有增多。
多個(gè)社交網(wǎng)站上的信息。我們當(dāng)中的很多人在多個(gè)社交網(wǎng)站上活躍,隨著我們上的社交網(wǎng)站越多,我們獲得的數(shù)據(jù)就會(huì)成比例的增多,我們獲得的信息雖然也會(huì)增多,但卻不會(huì)成比例的增多。不單單因?yàn)槲覀儠?huì)互相轉(zhuǎn)發(fā)好友的微博(或者其他社交網(wǎng)站上的內(nèi)容),更因?yàn)楹芏鄡?nèi)容會(huì)十分類似,有些微博雖然具體文字不同,但表達(dá)的內(nèi)容十分相似。
二、信息不等于智慧(Insight)
好吧,現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對(duì)我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足以下三個(gè)標(biāo)準(zhǔn):
可破譯性。這可能是個(gè)大數(shù)據(jù)時(shí)代特有的問(wèn)題,越來(lái)越多的企業(yè)每天都會(huì)生產(chǎn)出大量的數(shù)據(jù),卻還沒(méi)想好怎么用,因此,他們就將這些數(shù)據(jù)暫時(shí)非結(jié)構(gòu)化(unstructured)的存儲(chǔ)起來(lái)。這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯。比如說(shuō),你記錄了某客戶在你網(wǎng)站上三次翻頁(yè)的時(shí)間間隔:3秒,2秒,17秒,卻忘記標(biāo)注這三個(gè)時(shí)間到底代表了什么,這些數(shù)據(jù)是信息(非重復(fù)性),卻不可破譯,因此不可能成為智慧。
關(guān)聯(lián)性。我們?cè)?jīng)對(duì)關(guān)聯(lián)性的重要性進(jìn)行過(guò)解釋。這里不再贅述了,無(wú)關(guān)的信息,至多只是噪音。
新穎性。這個(gè)和我前文舉的那個(gè)社交網(wǎng)站的例子類似,不同的是,這里的新穎性很多時(shí)候無(wú)法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進(jìn)行判斷。舉個(gè)例子,某電子商務(wù)公司通過(guò)一組數(shù)據(jù)/信息,分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10塊錢(qián),然后又通過(guò)另一組完全獨(dú)立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時(shí)候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。
大數(shù)據(jù)時(shí)代來(lái)襲
那么大數(shù)據(jù)到底有什么用?到底會(huì)帶來(lái)怎樣的變化呢?
隨著社交網(wǎng)絡(luò)、云服務(wù)、網(wǎng)上購(gòu)物、數(shù)字閱讀等各種新的線上消費(fèi)和生活模式的流行和普及,可以預(yù)見(jiàn)的是人們和互聯(lián)網(wǎng)之間的聯(lián)系程度在將來(lái)越來(lái)越緊密。
用戶和消費(fèi)者的消費(fèi)習(xí)慣、興趣愛(ài)好、關(guān)系網(wǎng)絡(luò)以及整個(gè)互聯(lián)網(wǎng)的趨勢(shì)、潮流都將成為互聯(lián)網(wǎng)從業(yè)者關(guān)注的重點(diǎn)和熱點(diǎn),而這一切的獲取和分析都離不開(kāi)大數(shù)據(jù)。
所以,所謂的大數(shù)據(jù)意味著一種新的信息建構(gòu)模式和商業(yè)模式,意味著數(shù)據(jù)背后往往就潛藏著商業(yè)利益和經(jīng)濟(jì)增長(zhǎng)點(diǎn),意味著凌亂紛繁的數(shù)據(jù)背后就是更符合用戶興趣和習(xí)慣的產(chǎn)品和服務(wù),意味著廠商可以更好地自己的產(chǎn)品和服務(wù)進(jìn)行針對(duì)性地調(diào)整和優(yōu)化。
所以,IBM才會(huì)以超過(guò)140億美元的代價(jià)在過(guò)去收購(gòu)大量與數(shù)據(jù)處理和分析有關(guān)的企業(yè),而惠普也會(huì)在2011年以67億英鎊收購(gòu)Autonomy,而Google也不遺余力地先后收購(gòu)數(shù)據(jù)分析公司Record Future和Postrank。
由于大數(shù)據(jù)所需要的非常的技術(shù)和經(jīng)濟(jì)背景,它往往是和微軟、Google、Facebook以及IBM這樣的大公司聯(lián)系在一起的,但是這并不意味著大數(shù)據(jù)就和我們的日常生活沒(méi)有關(guān)系,事實(shí)上,大數(shù)據(jù)已經(jīng)滲入到我們生活的方方面面,從方方面面影響、改變著我們的生活。
隨之而來(lái)的問(wèn)題就是,大數(shù)據(jù)究竟和我們的生活有怎樣的關(guān)系?
當(dāng)我們每次用Google進(jìn)行搜索,在Gmail中出現(xiàn)的關(guān)鍵字;iPhone用戶和Siri互動(dòng)所產(chǎn)生的所有信息都會(huì)被蘋(píng)果公司收集并進(jìn)行整理分析;Facebook一直對(duì)用戶信息進(jìn)行著收集。甚至連NFL、NBA和奧運(yùn)會(huì)等各種體育賽事中都已經(jīng)開(kāi)始熟稔地運(yùn)用大數(shù)據(jù)對(duì)球員和球隊(duì)進(jìn)行分析。
盡管國(guó)內(nèi)的大數(shù)據(jù)起步晚而且發(fā)展遲緩,但如阿里巴巴、淘寶等也同樣對(duì)平臺(tái)上的用戶數(shù)據(jù)進(jìn)行著收集和整理。
現(xiàn)在大數(shù)據(jù)所形成的市場(chǎng)規(guī)模在51億美元左右,而到2017年此數(shù)據(jù)預(yù)計(jì)會(huì)上漲到530億美元。
實(shí)際上我們就已經(jīng)和大數(shù)據(jù)發(fā)生里密不可分的關(guān)系,生活中各種各樣的大數(shù)據(jù)應(yīng)用一方面使得用戶體驗(yàn)不斷被優(yōu)化,另一方面又使得各種應(yīng)用者從中尋找到新的商機(jī)。
大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨,大數(shù)據(jù)的海洋正波濤洶涌地涌向人們,那么諸位那么準(zhǔn)備好乘風(fēng)破浪迎接大數(shù)據(jù)的洗禮了嗎?
大數(shù)據(jù)已成紅海?!全球十四個(gè)大數(shù)據(jù)公司全面盤(pán)點(diǎn)!
在本文中,我整理了當(dāng)今世界上在大數(shù)據(jù)領(lǐng)域最具話語(yǔ)權(quán)的企業(yè),它們有的是計(jì)算機(jī)或者互聯(lián)網(wǎng)領(lǐng)域的巨頭,有的是剛剛創(chuàng)辦不久的初創(chuàng)企業(yè)。但它們有一個(gè)共同點(diǎn),那就是它們都看到了大數(shù)據(jù)帶來(lái)的大機(jī)會(huì)于是毫不猶豫地挺進(jìn)了這個(gè)領(lǐng)域。
雖然大數(shù)據(jù)是比云計(jì)算還要新興的一個(gè)術(shù)語(yǔ),但是通過(guò)我在這篇文章里列舉的一些公司你就可以發(fā)現(xiàn),在此領(lǐng)域已有很多外國(guó)企業(yè)深耕已久,但是國(guó)內(nèi)企業(yè)在這個(gè)領(lǐng)域還幾乎是空白。
傳統(tǒng)巨頭:
企業(yè)名稱:IBM
網(wǎng)址:http://www.ibm.com/
上線時(shí)間:2011年5月
公司地址:美國(guó)紐約州阿蒙克市
融資狀況:IBM業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場(chǎng)
IBM這個(gè)藍(lán)色巨人現(xiàn)如今雖已經(jīng)沒(méi)有上世紀(jì)名號(hào)響亮,但是在如今企業(yè)市場(chǎng)的各個(gè)領(lǐng)域卻具有無(wú)可爭(zhēng)議的話語(yǔ)權(quán),自然它也不會(huì)放過(guò)大數(shù)據(jù)這塊肥肉,現(xiàn)在它是全球最大的信息技術(shù)和業(yè)務(wù)解決方案公司。
2011 年5月,IBM正式推出InfoSphere大數(shù)據(jù)分析平臺(tái)。InfoSphere大數(shù)據(jù)分析平臺(tái)包括 BigInsights和Streams,二者互補(bǔ),Biglnsights基于Hadoop,對(duì)大規(guī)模的靜態(tài)數(shù)據(jù)進(jìn)行分析,它提供多節(jié)點(diǎn)的分布式計(jì)算,可以隨時(shí)增加節(jié)點(diǎn),提升數(shù)據(jù)處理能力。Streams采用內(nèi)存計(jì)算方式分析實(shí)時(shí)數(shù)據(jù)。InfoSphere大數(shù)據(jù)分析平臺(tái)還集成了數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)、數(shù)據(jù)集成、業(yè)務(wù)流程管理等組件。
企業(yè)名稱:亞馬遜
網(wǎng)址:http://www.amazon.com/
上線時(shí)間:2009年
公司地址:美國(guó)華盛頓州西雅圖
融資狀況:亞馬遜業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場(chǎng)
對(duì)于云計(jì)算和大數(shù)據(jù),亞馬遜絕對(duì)具有先見(jiàn)之明,早在2009年就推出了亞馬遜彈性MapReduce(Amazon Elastic MapReduce),亞馬遜對(duì)Hadoop的需求和應(yīng)用可謂了若指掌,無(wú)論是中小型企業(yè)還是大型組織。彈性MapReduce是一項(xiàng)能夠迅速擴(kuò)展的 Web服務(wù),運(yùn)行在亞馬遜彈性計(jì)算云(Amazon EC2)和亞馬遜簡(jiǎn)單存儲(chǔ)服務(wù)(Amazon S3)上。這可是貨真價(jià)實(shí)的云:面對(duì)數(shù)據(jù)密集型任務(wù),比如互聯(lián)網(wǎng)索引、數(shù)據(jù)挖掘、日志文件分析、機(jī)器學(xué)習(xí)、金融分析、科學(xué)模擬和生物信息學(xué)研究,用戶需要多大容量,立即就能配置到多大容量。
除了數(shù)據(jù)處理外,用戶還可以使用Karmasphere Analyst的基于服務(wù)的版本,Karmasphere Analyst是一種可視化工作區(qū),用于在亞馬遜彈性MapReduce上分析數(shù)據(jù)。用戶還可以提取結(jié)果文件,以便在數(shù)據(jù)庫(kù)或者微軟Excel或 Tableau等工具中使用。
企業(yè)名稱:甲骨文
網(wǎng)址:http://www.oracle.com/
上線時(shí)間:2010年
公司地址:美國(guó)加州紅木城
融資狀況:甲骨文業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場(chǎng)
甲骨文在近期發(fā)布的Oracle大數(shù)據(jù)機(jī)(Oracle Big Data Appliance)為許多企業(yè)提供了一種處理海量非結(jié)構(gòu)化數(shù)據(jù)的方法。在2011年10月初召開(kāi)的Oracle OpenWorld 2011大會(huì)上甲骨文正式推出了Oracle大數(shù)據(jù)機(jī)。對(duì)于那些正在尋求以更高效的方法來(lái)采集、組織和分析海量非結(jié)構(gòu)化數(shù)據(jù)的企業(yè)而言,該產(chǎn)品具有很大的吸引力。
與甲骨文近期推出的其他一體化產(chǎn)品一樣,Oracle大數(shù)據(jù)機(jī)集成了硬件、存儲(chǔ)和軟件,包括Apache Hadoop軟件的開(kāi)源代碼分發(fā)、新的甲骨文NoSQL數(shù)據(jù)庫(kù)和用于統(tǒng)計(jì)分析的R語(yǔ)言開(kāi)源代碼分發(fā)。該產(chǎn)品被設(shè)計(jì)為能夠與甲骨文Database 11g、Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器,以及針對(duì)商業(yè)智能應(yīng)用的新的Oracle Exalytics商業(yè)智能云服務(wù)器一起協(xié)同工作。
企業(yè)名稱:谷歌
網(wǎng)址:http://www.google.com/
上線時(shí)間:2011年
公司地址:美國(guó)加州山景城
融資狀況:谷歌業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
谷歌一直是科技行業(yè)的領(lǐng)軍者,近年來(lái)幾乎在任何一項(xiàng)互聯(lián)網(wǎng)科技項(xiàng)目你都能看到谷歌的身影,大數(shù)據(jù)時(shí)代谷歌自然不會(huì)錯(cuò)過(guò)。何況如果對(duì)其擁有的海量數(shù)據(jù)進(jìn)行深入挖掘,這對(duì)于提升谷歌搜索乃至所有谷歌服務(wù)的價(jià)值無(wú)可估量。
BigQuery 是Google推出的一項(xiàng)Web服務(wù),用來(lái)在云端處理大數(shù)據(jù)。該服務(wù)讓開(kāi)發(fā)者可以使用Google的架構(gòu)來(lái)運(yùn)行SQL語(yǔ)句對(duì)超級(jí)大的數(shù)據(jù)庫(kù)進(jìn)行操作。 BigQuery允許用戶上傳他們的超大量數(shù)據(jù)并通過(guò)其直接進(jìn)行交互式分析,從而不必投資建立自己的數(shù)據(jù)中心。Google曾表示BigQuery引擎可 以快速掃描高達(dá)70TB未經(jīng)壓縮處理的數(shù)據(jù),并且可馬上得到分析結(jié)果。大數(shù)據(jù)在云端模型具備很多優(yōu)勢(shì),BigQuery服務(wù)無(wú)需組織提供或建立數(shù)據(jù)倉(cāng)庫(kù)。而B(niǎo)igQuery在安全性和數(shù)據(jù)備份服務(wù)也相當(dāng)完善。
去年底該服務(wù)只向一小部分開(kāi)發(fā)者開(kāi)放,現(xiàn)在任何人都可以注冊(cè)這項(xiàng)服務(wù)。免費(fèi)帳號(hào)可以讓你每月訪問(wèn)高達(dá)100GB的數(shù)據(jù),你也可以付費(fèi)使用額外查詢和存儲(chǔ)空間。
企業(yè)名稱:微軟
網(wǎng)址:http://www.microsoft.com/
上線時(shí)間:2011年
公司地址:美國(guó)華盛頓州雷德蒙市
融資狀況:微軟業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
微軟研究部門(mén)從2006年起就一直致力于某種非常類似于Hadoop的項(xiàng)目,被稱為“Dryad”。今年年初,該計(jì)劃通過(guò)與SQL Server和Windows Azure云的集成實(shí)現(xiàn)了Dryad的產(chǎn)品化。雖然現(xiàn)在微軟還沒(méi)有更新,但看上去Dryad似乎將成為在SQL Server平臺(tái)上影響大數(shù)據(jù)愛(ài)好者的有力競(jìng)爭(zhēng)者。
微軟進(jìn)入這一市場(chǎng)可謂“姍姍來(lái)遲”,而且在一定程度上說(shuō),數(shù)據(jù)倉(cāng)庫(kù)分析和內(nèi)存分析計(jì)算市場(chǎng)落下了后腿。2011年初微軟發(fā)布的SQL Server R2 Parallel Data Warehouse(PDW,并行數(shù)據(jù)倉(cāng)庫(kù)),PDW使用了大規(guī)模并行處理來(lái)支持高擴(kuò)展性,它可以幫助客戶擴(kuò)展部署數(shù)百TB級(jí)別數(shù)據(jù)的分析解決方案。微軟目前已經(jīng)開(kāi)始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區(qū)技術(shù)預(yù)覽版本的連接器。 該連接器是雙向的,你可以在Hadoop和微軟數(shù)據(jù)庫(kù)服務(wù)器之間向前或者向后遷移數(shù)據(jù)。
微軟在去年推出了基于Azure云平臺(tái)的測(cè)試版 Hadoop服務(wù),今年它承諾會(huì)推出與Windows兼容的基于Hadoop的大數(shù)據(jù)解決方案(Big Data Solution),這是微軟SQL Server 2012版本(首發(fā)日期還不知道)的一部分,現(xiàn)在也不清楚微軟是否會(huì)與其他硬件合作伙伴或者相關(guān)大數(shù)據(jù)設(shè)備廠商合作。
企業(yè)名稱:EMC
網(wǎng)址:http://www.emc.com/
上線時(shí)間:不詳
公司地址:美國(guó)麻州Hopkinton市
融資狀況:EMC業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
EMC 于1979年成立于美國(guó)麻州Hopkinton市,1989年開(kāi)始進(jìn)入企業(yè)數(shù)據(jù)儲(chǔ)存市場(chǎng)。 EMC公司是全球信息存儲(chǔ)及管理產(chǎn)品、服務(wù)和解決方案方面的領(lǐng)先公司。EMC是每一種主要計(jì)算平臺(tái)的信息存儲(chǔ)標(biāo)準(zhǔn),而且,世界上最重要信息中的 2/3 以上都是通過(guò)EMC的解決方案管理的。
面對(duì)大數(shù)據(jù)時(shí)代,EMC公司推出用于支持大數(shù)據(jù)分析的下一代平臺(tái)――EMC Greenplum統(tǒng)一分析平臺(tái)(UAP)。Greenplum UAP是一個(gè)唯一的統(tǒng)一數(shù)據(jù)分析平臺(tái),可擴(kuò)展至其他工具,其獨(dú)特之處在于,它將對(duì)大數(shù)據(jù)的認(rèn)知和分享貫穿整個(gè)分析過(guò)程,實(shí)現(xiàn)比以往更高的商業(yè)價(jià)值。
企業(yè)名稱:Teradata
網(wǎng)址:http://www.teradata.com/
上線時(shí)間:2011年
公司地址:美國(guó)俄亥俄州邁阿密斯堡
融資狀況:Teradata業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
Teradata 公司(Teradata Corporation,紐約證券交易所交易代碼TDC)是全球領(lǐng)先的數(shù)據(jù)倉(cāng)庫(kù),大數(shù)據(jù)分析和整合營(yíng)銷管理解決方案供應(yīng)商,專注于數(shù)據(jù)庫(kù)軟件,數(shù)據(jù)倉(cāng)庫(kù)專用平臺(tái)及企業(yè)分析方案。 不久前宣布推出一款集硬件、軟件和服務(wù)于一體的全面產(chǎn)品組合——Teradata分析生態(tài)系統(tǒng) (Teradata Analytical Ecosystem),使不同的 Teradata 系統(tǒng)實(shí)現(xiàn)無(wú)縫協(xié)作,為企業(yè)客戶提供分析和更深入的洞察力,幫助其預(yù)測(cè)商業(yè)機(jī)會(huì)和加速實(shí)現(xiàn)商業(yè)價(jià)值。Teradata Unity 將確保整個(gè)Teradata Analytical Ecosystem的同步和統(tǒng)一。為了增強(qiáng)在大數(shù)據(jù)分析領(lǐng)域的優(yōu)勢(shì), Teradata還收購(gòu)Aster Data公司,以增強(qiáng)其非傳統(tǒng)數(shù)據(jù)分析的能力,突破了SQL分析的限制,協(xié)助企業(yè)從全部數(shù)據(jù)中獲取更多價(jià)值。
企業(yè)名稱:NetApp
網(wǎng)址:http://www.netapp.com
上線時(shí)間:2011年
公司地址:美國(guó)加利福尼亞州森尼韋爾
融資狀況:NetApp業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
Network Appliance,Inc.(NetApp,美國(guó)網(wǎng)域存儲(chǔ)技術(shù)有限公司)是IT存儲(chǔ)業(yè)界的佼佼者,自1992年創(chuàng)業(yè)以來(lái),不斷以創(chuàng)新的理念和領(lǐng)先的技術(shù)引領(lǐng)存儲(chǔ)行業(yè)的發(fā)展。Network Appliance, Inc. (NetApp) 是向目前的數(shù)據(jù)密集型企業(yè)提供統(tǒng)一存儲(chǔ)解決方案的居世界最前列的公司。
NetApp StorageGRID 是一個(gè)久經(jīng)驗(yàn)證的對(duì)象存儲(chǔ)軟件解決方案,設(shè)計(jì)用于管理 PB 級(jí)、全球分布的存儲(chǔ)庫(kù),這些存儲(chǔ)庫(kù)包含企業(yè)和服務(wù)提供商的圖像、視頻和記錄。通過(guò)消除數(shù)據(jù)塊和文件中數(shù)據(jù)容器的典型約束,NetApp StorageGRID 提供了強(qiáng)大的可擴(kuò)展性。它支持單個(gè)全局命名空間內(nèi)的數(shù)十億個(gè)文件或?qū)ο蠛?PB 級(jí)容量。
NetApp StorageGRID 實(shí)現(xiàn)了智能的數(shù)據(jù)管理和安全的內(nèi)容保留。它通過(guò)一個(gè)具有內(nèi)置安全性的全局策略引擎來(lái)優(yōu)化數(shù)據(jù)存放、元數(shù)據(jù)管理和效率,該引擎管理數(shù)據(jù)的存儲(chǔ)、放置、保護(hù)和檢索的方式。此外,使用數(shù)字指紋和加密等技術(shù)防止內(nèi)容受到篡改。
NetApp StorageGRID 有助于隨時(shí)隨地提供數(shù)據(jù),以便于不間斷地運(yùn)營(yíng)。該解決方案被設(shè)計(jì)為允許靈活進(jìn)行部署配置,以滿足全球的多站點(diǎn)組織的不同需要。
企業(yè)名稱:Sybase
網(wǎng)址:www.sybase.com
上線時(shí)間:2011年
公司地址:美國(guó)加州Dublin市
融資狀況:Sybase業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
Sybase公司成立于1984年11月,總部設(shè)在美國(guó)加州的Emeryville(現(xiàn)為美國(guó)加州的Dublin市)。作為全球最大的獨(dú)立軟件廠商之一,Sybase公司致力于幫助企業(yè)等各種機(jī)構(gòu)進(jìn)行應(yīng)用、內(nèi)容及數(shù)據(jù)的管理和發(fā)布。
Sybase IQ是Sybase公司推出的特別為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的關(guān)系型數(shù)據(jù)庫(kù)。 相比于傳統(tǒng)的“行式存儲(chǔ)”的關(guān)系型數(shù)據(jù)庫(kù), Sybase IQ 使用了獨(dú)特的列式存儲(chǔ)方式,在進(jìn)行分析查詢時(shí),僅需讀取查詢所需的列,其垂直分區(qū)策略不僅能夠支持大量的用戶、大規(guī)模數(shù)據(jù),還可以提交對(duì)商業(yè)信息的高速訪問(wèn),其速度可達(dá)到傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)的百倍甚至千倍。“隨著 Sybase IQ 不斷地在分析應(yīng)用 POC 測(cè)試中拔得頭籌,有時(shí)甚至超過(guò)其他對(duì)手 100 倍之多”, Gartner 評(píng)價(jià)道,“ Sybase IQ 逐漸成為從數(shù)據(jù)集市到企業(yè)數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)最令人渴望的 DBMS (數(shù)據(jù)庫(kù)管理系統(tǒng))。”
自 2009 年推出以來(lái), Sybase 陸續(xù)發(fā)布了 Sybase IQ 15.1 、 15.2 、 15.3 以至最新的 Sybase IQ 15.4 版本,每個(gè)版本都著力于增加新的核心能力以促進(jìn)更深入的高級(jí)分析。Sybase IQ 15.4是面向大數(shù)據(jù)的高級(jí)分析平臺(tái),將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個(gè)人都行動(dòng)的情報(bào)信息,從而在整個(gè)企業(yè)的用戶和業(yè)務(wù)流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。
因此,有人說(shuō)Sybase IQ15.4正在徹底改變“大數(shù)據(jù)分析”。
企業(yè)名稱:惠普
網(wǎng)址:www.hp.com
上線時(shí)間:2011年
公司地址:美國(guó)加州帕羅奧多市
融資狀況:惠普業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)
大數(shù)據(jù)時(shí)代來(lái)臨,老牌巨頭惠普也不甘落后。不久前惠普企業(yè)服務(wù)事業(yè)部宣布推出全新服務(wù),幫助客戶更快部署惠普子公司Vertica的Vertica Analytics Platform ,從而迅速洞悉關(guān)鍵的業(yè)務(wù)信息,輔助決策過(guò)程。
Vertica Analytics Platform 讓用戶能夠大規(guī)模實(shí)時(shí)分析物理、虛擬和云環(huán)境中的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),從而深入洞悉“大數(shù)據(jù)”。
Advanced Information Services for Vertica 幫助客戶最大化實(shí)現(xiàn) Vertica 分析平臺(tái)性能,并構(gòu)建企業(yè)分析專用環(huán)境。惠普提供從評(píng)估到實(shí)施的一系列服務(wù),與客戶共同定義多種交付方式組合,并找出匹配其現(xiàn)有基礎(chǔ)設(shè)施的最佳解決方案。
Advanced Information Services for Vertica已在全球上市,將為實(shí)現(xiàn)“瞬捷”企業(yè)構(gòu)建靈活的智能環(huán)境。
企業(yè)名稱:沃爾瑪
網(wǎng)址:http://www.walmart.com/
上線時(shí)間:2011年
公司地址:本頓維爾
融資狀況:沃爾瑪業(yè)務(wù)
業(yè)務(wù)方向:未知
在這里看到沃爾瑪?shù)纳碛埃赡芎芏嗳藭?huì)有疑問(wèn),全球最大的傳統(tǒng)零售業(yè)巨頭沃爾瑪怎么就跟大數(shù)據(jù)扯上關(guān)系了?看了下面的介紹你就會(huì)明白了。
沃爾瑪是最早通過(guò)利用大數(shù)據(jù)而受益的企業(yè)之一,曾經(jīng)擁有世界上最大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。通過(guò)對(duì)消費(fèi)者的購(gòu)物行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,沃爾瑪成為最了解顧客購(gòu)物習(xí)慣的零售商,并創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例。早在2007年,沃爾瑪就已建立了一個(gè)超大的數(shù)據(jù)中心,其存儲(chǔ)能力高達(dá)4Pb以上。《經(jīng)濟(jì)學(xué)人》在2010年的一篇報(bào)道中指出,沃爾瑪?shù)臄?shù)據(jù)量已經(jīng)是美國(guó)國(guó)會(huì)圖書(shū)館的167倍。
沃爾瑪實(shí)驗(yàn)室計(jì)劃將沃爾瑪?shù)?0個(gè)不同的網(wǎng)站整合成一個(gè),同時(shí)將一個(gè)10個(gè)節(jié)點(diǎn)的Hadoop集群擴(kuò)展到250個(gè)節(jié)點(diǎn)的Hadoop集群。目前實(shí)驗(yàn)室正在設(shè)計(jì)幾個(gè)能將當(dāng)前像Oracle、Neteeza這樣的開(kāi)放資源的數(shù)據(jù)庫(kù)進(jìn)行遷移、整合的工具。
沃爾瑪曾進(jìn)行了一些列的收購(gòu),包括Kosmix(沃爾瑪實(shí)驗(yàn)室前身)、Small Society、Set Direction、OneRiot、Social Calenda、Grabble等多家中小型創(chuàng)業(yè)公司,這些創(chuàng)業(yè)公司要么精于數(shù)據(jù)挖掘和各種算法,要么在移動(dòng)社交領(lǐng)域有其專長(zhǎng),從此我們就可以看出沃爾瑪進(jìn)軍移動(dòng)互聯(lián)網(wǎng)和挖掘大數(shù)據(jù)的決心。相信在沃爾瑪?shù)膸ьI(lǐng)下,傳統(tǒng)行業(yè)也會(huì)慢慢意識(shí)到大數(shù)據(jù)的重要性,加速步入大數(shù)據(jù)時(shí)代。
初創(chuàng)企業(yè):
除了這些傳統(tǒng)的大企業(yè)已經(jīng)開(kāi)始進(jìn)入大數(shù)據(jù)領(lǐng)域之外,還有不少的創(chuàng)業(yè)企業(yè)也瞄準(zhǔn)了大數(shù)據(jù)帶來(lái)的機(jī)會(huì),紛紛推出自己的產(chǎn)品,以期抓住大數(shù)據(jù)時(shí)代的機(jī)會(huì)。
企業(yè)名稱:Clustrix
網(wǎng)址:www.clustrix.com
創(chuàng)辦時(shí)間:2005年
公司地址:美國(guó)加州舊金山
融資狀況:1200萬(wàn)美元
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)等
Clustrix 創(chuàng)立于2005年,是Y Combinator 2006年冬季班的成員。Clustrix可以為SQL數(shù)據(jù)庫(kù)提供專利數(shù)據(jù)應(yīng)用方法,幫助人們處理大量的數(shù)據(jù),使SQL數(shù)據(jù)庫(kù)無(wú)限擴(kuò)容成為可能。最近 Clustrix從Sequoia Capital、USVP和 ATA Ventures三家風(fēng)險(xiǎn)投資公司處再次獲得價(jià)值675萬(wàn)美元的風(fēng)險(xiǎn)投資,至今已獲融資1200萬(wàn)美元。Clustrix總部設(shè)在美國(guó)舊金山,研發(fā)中心設(shè)在西雅圖。為打開(kāi)歐洲市場(chǎng),公司計(jì)劃將總部遷至荷蘭的阿姆斯特丹,并將于年底前在印度設(shè)立辦公室。
企業(yè)名稱:Cloudera
網(wǎng)址:http://www.cloudera.com/
創(chuàng)辦時(shí)間:2009年
公司地址:美國(guó)加州帕洛阿爾托
融資狀況:4000萬(wàn)美元
業(yè)務(wù)方向:面向各類企業(yè)市場(chǎng)等
Cloudera 是一家專業(yè)從事基于Apache Hadoop的數(shù)據(jù)管理軟件銷售和服務(wù)的公司,總部位于加州帕洛阿爾托,2009年3月發(fā)布了第一款商業(yè)產(chǎn)品,當(dāng)時(shí)獲得由AccelPartners領(lǐng)投的500萬(wàn)美元投資。該公司于2010年6月正式推出Cloudera企業(yè)產(chǎn)品。 2011年11月募集到4000萬(wàn)美元風(fēng)險(xiǎn)投資資金,此輪融資由風(fēng)險(xiǎn)投資機(jī)構(gòu)Ignition Partners的合伙人弗蘭克·阿泰勒(Frank Artale)領(lǐng)投。Cloudera之前的投資者頂尖風(fēng)投機(jī)構(gòu)Accel Partners、Greylock Partners、Meritech Capital Partners 和In-Q-Tel也參與本輪投資。
除以上企業(yè)以外,包括MapR、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop以及大數(shù)據(jù)相關(guān)的新公司都已經(jīng)獲得投資,新一輪熱潮正在興起。
看到以上這么多的國(guó)外企業(yè)已經(jīng)開(kāi)始走上大數(shù)據(jù)之路,我們不禁想知道國(guó)內(nèi)有哪些企業(yè)在大數(shù)據(jù)方面有所建樹(shù),但遺憾的是,與國(guó)外大數(shù)據(jù)的熱火朝天相比,國(guó)內(nèi)企業(yè)參與這一領(lǐng)域的并不多。
國(guó)內(nèi)企業(yè)在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、商業(yè)智能等領(lǐng)域基礎(chǔ)薄弱,IT尤其是軟件企業(yè)在布局大數(shù)據(jù)方面,已經(jīng)遠(yuǎn)遠(yuǎn)落后于國(guó)外先進(jìn)企業(yè)。對(duì)于哪些企業(yè)將來(lái)有可能成功進(jìn)入大數(shù)據(jù)領(lǐng)域,挑起大數(shù)據(jù)利用國(guó)產(chǎn)化的重?fù)?dān),不少人表示看好百度、阿里巴巴、騰訊等國(guó)內(nèi)互聯(lián)網(wǎng)巨頭,因?yàn)樗鼈儾粌H具有資金、技術(shù)等方面的實(shí)力,而且一直在與數(shù)據(jù)打交道方面具有先發(fā)優(yōu)勢(shì),其本身業(yè)務(wù)的發(fā)展趨勢(shì)與大數(shù)據(jù)發(fā)展趨勢(shì)相符。
實(shí)際上,作為中國(guó)最大的電子商務(wù)公司阿里巴巴已經(jīng)在利用大數(shù)據(jù)技術(shù)提供具體服務(wù),主要內(nèi)容就是阿里信用貸款與淘寶數(shù)據(jù)魔方這兩部分業(yè)務(wù)。
以阿里信用貸款為例,阿里巴巴通過(guò)掌握的企業(yè)交易數(shù)據(jù),借助大數(shù)據(jù)技術(shù)自動(dòng)分析判定是否給予企業(yè)貸款,全程不會(huì)出現(xiàn)人工干預(yù)。據(jù)透露,截至目前阿里巴巴已經(jīng)放貸300多億元,壞賬率約0.3%左右,大大低于商業(yè)銀行。
淘寶數(shù)據(jù)魔方則是淘寶平臺(tái)上的大數(shù)據(jù)應(yīng)用方案。通過(guò)這一服務(wù),商家可以了解淘寶平臺(tái)上的行業(yè)宏觀情況、自己品牌的市場(chǎng)狀況、消費(fèi)者行為情況等,并可以據(jù)此作出經(jīng)營(yíng)決策。
除了互聯(lián)網(wǎng)企業(yè)以外,也許還有一家不可忽略的企業(yè)極有可能在大數(shù)據(jù)領(lǐng)域異軍突起,那就是華為。盡管華為公司在大數(shù)據(jù)領(lǐng)域一直保持低調(diào)狀態(tài),但仍有相當(dāng)一部分中國(guó)用戶期待華為產(chǎn)品和方案,這主要得益于多年來(lái)華為精心打造的“國(guó)產(chǎn)IT網(wǎng)絡(luò)通信產(chǎn)品、方案領(lǐng)導(dǎo)者”的品牌形象。
近年來(lái),尤其是進(jìn)入2012年以來(lái),大數(shù)據(jù)漸漸地開(kāi)始成為一個(gè)人們耳熟能詳?shù)男g(shù)語(yǔ)。有許多人認(rèn)為2012年應(yīng)該是大數(shù)據(jù)元年,更有甚者預(yù)測(cè),下一個(gè)Facebook會(huì)誕生在大數(shù)據(jù)領(lǐng)域,不管這些看法有沒(méi)有道理,但至少我們可以看到大數(shù)據(jù)時(shí)代的帷幕已經(jīng)開(kāi)啟。
如何發(fā)掘大數(shù)據(jù)的潛力?
下面向大家介紹一個(gè)數(shù)字,可能大家不常見(jiàn)到:百萬(wàn)的5次方或一萬(wàn)兆,即1,000,000,000,000,000,000(1后邊18個(gè)0)。IBM曾經(jīng)估算過(guò)一萬(wàn)兆這個(gè)概念,即人類每天所產(chǎn)生的新的數(shù)據(jù)量為2.5萬(wàn)兆。做個(gè)對(duì)比,地球五大洋里的海水總量為352萬(wàn)兆加侖,如果一字節(jié)的數(shù)據(jù)量相當(dāng)于一桶水的話,只需要5個(gè)月左右所產(chǎn)生的“水”就可以填滿整個(gè)五大洋。
對(duì)于企業(yè)來(lái)說(shuō),面對(duì)并管理這些浩如煙海的數(shù)據(jù)時(shí)真的感覺(jué)無(wú)能為力。Oracle今年6月份發(fā)出報(bào)告稱,300家美國(guó)和加拿大企業(yè)中93%的承認(rèn)因?yàn)闆](méi)法處理他們身邊的數(shù)據(jù)而損失了一些盈利的機(jī)會(huì)。
某 “大數(shù)據(jù)”公司的首席營(yíng)銷系統(tǒng)專員Pete Elliott可以幫助大小企業(yè)從浩如煙海的數(shù)據(jù)(比如博客、推特、Facebook中的贊、鏈接、圖像、視頻、評(píng)論、文本文件、回復(fù),甚至集裝箱貨單)中找到可以利用的信息。Elliott說(shuō),數(shù)據(jù)越多,搜索速度越快,客戶越喜歡。
首先我們要理清一個(gè)概念:大數(shù)據(jù),并不意味著大生意。數(shù)據(jù)分析才是帶來(lái)利潤(rùn)和提高利潤(rùn)的途徑。不管是大企業(yè)還是小企業(yè),都需要在市場(chǎng)中保持競(jìng)爭(zhēng)力,這就需要根據(jù)大數(shù)據(jù)來(lái)做相應(yīng)的市場(chǎng)、競(jìng)爭(zhēng)分析,因?yàn)楦?jìng)爭(zhēng)對(duì)手也很有可能會(huì)做這種類型的數(shù)據(jù)分析。雖然說(shuō)每天產(chǎn)生2.5萬(wàn)兆的數(shù)據(jù),如果不對(duì)這些信息加以整理,沒(méi)法正常使用和理解的話,也是沒(méi)有意義的。然而隨著計(jì)算機(jī)技術(shù)的發(fā)展,編程人員開(kāi)發(fā)出了效率更高的軟件,可以幫助企業(yè)更好地搜集、篩選、整理,最終將數(shù)據(jù)轉(zhuǎn)換成對(duì)未來(lái)發(fā)展的分析,成為企業(yè)競(jìng)爭(zhēng)的有利條件。
IBM 企業(yè)營(yíng)銷管理副總裁Yuchun Lee建議企業(yè)先從“企業(yè)網(wǎng)站”開(kāi)始進(jìn)行大數(shù)據(jù)分析。他說(shuō),“只要有人登陸網(wǎng)站,就有利用大數(shù)據(jù)的機(jī)會(huì)。”對(duì)于電子商務(wù)企業(yè)來(lái)說(shuō),企業(yè)網(wǎng)站就是一種營(yíng)銷工具。Elliott也說(shuō),“使用大數(shù)據(jù)最好先從簡(jiǎn)單的方面開(kāi)始入手,慢慢測(cè)試,最終擴(kuò)大適用范圍。”
McKee Wallwork Cleveland公司的主席Steve McKee(本文作者)最近做了一次大數(shù)據(jù)服務(wù),服務(wù)范圍已經(jīng)超過(guò)了網(wǎng)站流量。我們跟蹤了客戶的媒體消耗時(shí)間、網(wǎng)站瀏覽、客戶詢價(jià),購(gòu)買(mǎi)了相應(yīng)的數(shù)據(jù),最終發(fā)現(xiàn)了以上幾者的關(guān)系。我們還根據(jù)結(jié)果跟蹤了人們購(gòu)買(mǎi)產(chǎn)品之后廣告營(yíng)銷的漲跌情況。這里利用大數(shù)據(jù)分析的結(jié)果幫助McKee Wallwork Cleveland的客戶提高了媒體投資效率,預(yù)計(jì)2013年將提高9個(gè)百分點(diǎn)。
數(shù)據(jù)也會(huì)對(duì)消費(fèi)者滿意度有非常重要的影響。Verint Systems公司的資深營(yíng)銷副總裁Ryan Hollenbeck講了一個(gè)消費(fèi)者打電話給客服中心問(wèn)詢的故事。客戶發(fā)現(xiàn)企業(yè)的廣告中有誤導(dǎo)行為(非有意而為之)。另一位客戶利用語(yǔ)音分析發(fā)現(xiàn)客服對(duì)話中有客戶想取消賬號(hào),他們根據(jù)關(guān)鍵詞、關(guān)鍵句來(lái)判斷這些可能流失的客戶,這位企業(yè)客戶通過(guò)大數(shù)據(jù)分析挽救了600多位風(fēng)險(xiǎn)客戶,避免了1200萬(wàn)美元的損失。
或許大數(shù)據(jù)最令人興奮的地方就是幫助企業(yè)預(yù)測(cè)未來(lái)。許多警察局利用歷史數(shù)據(jù)來(lái)預(yù)測(cè)“何時(shí)何地”可能發(fā)生犯罪,企業(yè)利用消費(fèi)者在線行為數(shù)據(jù)開(kāi)發(fā)他們想要的產(chǎn)品。對(duì)于營(yíng)銷人員來(lái)說(shuō),社交媒體之前曾經(jīng)是企業(yè)與客戶實(shí)時(shí)互動(dòng)的地方,現(xiàn)在有了大數(shù)據(jù),可以更深入地挖掘消費(fèi)者信息,由此來(lái)改進(jìn)產(chǎn)品,發(fā)現(xiàn)消費(fèi)者的需求。Hollenbeck說(shuō):“社交媒體上人們的對(duì)話交流或許有進(jìn)一步發(fā)展的巨大潛力!”(TECH2IPO注:對(duì)話中人們會(huì)直接提到自己的購(gòu)買(mǎi)意向)
如何發(fā)掘大數(shù)據(jù)的潛力?不試試怎么知道。企業(yè)需要做的就是去試一下大數(shù)據(jù)服務(wù),領(lǐng)略一下它能企業(yè)帶來(lái)的飛一般地進(jìn)步。Elliott說(shuō),基于云服務(wù)的復(fù)雜數(shù)據(jù)分析未來(lái)可能會(huì)非常廉價(jià),低至1000美元/次。
十年前,人們面對(duì)面做生意,企業(yè)要和客戶打交道只能從很窄的層面了解客戶。如今網(wǎng)絡(luò)上隨意的交談都有可能變成發(fā)生產(chǎn)品交易的前提。企業(yè)如果依舊不認(rèn)同大數(shù)據(jù),看不清大數(shù)據(jù)和消費(fèi)者的關(guān)系,依舊不能利用大數(shù)據(jù),很有可能喪失一個(gè)寶貴的機(jī)會(huì)。
?
評(píng)論