如今,數(shù)據(jù)成為了一種“新石油”,但是如何挖掘其價(jià)值?在數(shù)據(jù)的生命周期中有很多階段,這就是企業(yè)需要采用一些方法和措施處理從數(shù)據(jù)收集到獲得見(jiàn)解的整個(gè)生命周期的原因。
幾乎每個(gè)經(jīng)歷了數(shù)字化轉(zhuǎn)型的企業(yè)都在努力地利用收集到的大量數(shù)據(jù)。實(shí)際上,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),85%~95%的數(shù)據(jù)從未得到充分利用,因此會(huì)造成浪費(fèi)。
數(shù)據(jù)的生命周期有許多階段,其中包括數(shù)據(jù)獲取、創(chuàng)建數(shù)據(jù)工程/數(shù)據(jù)集以賦予原始數(shù)據(jù)意義、大容量存儲(chǔ)數(shù)據(jù)以供進(jìn)一步使用和分析、創(chuàng)建數(shù)據(jù)庫(kù)以探索數(shù)據(jù),最后,還可以使用高級(jí)分析或機(jī)器學(xué)習(xí)從數(shù)據(jù)中提取見(jiàn)解,同時(shí)保持?jǐn)?shù)據(jù)安全和完全的合規(guī)性。許多企業(yè)面臨的挑戰(zhàn)是如何更好地組合這樣的系統(tǒng),同時(shí)保持合理的成本并最大程度地減少部署和運(yùn)營(yíng)的時(shí)間,以及如何以更具意義的方式呈現(xiàn)數(shù)據(jù),以便人們能夠從中獲得見(jiàn)解。
企業(yè)需要的是處理從數(shù)據(jù)采集到分析的整個(gè)數(shù)據(jù)生命周期的方法,同時(shí)還要保持開(kāi)源的優(yōu)勢(shì)以及利用內(nèi)部部署或混合云計(jì)算的能力。數(shù)據(jù)倉(cāng)庫(kù)可以處理存儲(chǔ)和交付,但它們不能提供完整的解決方案。許多組織已經(jīng)實(shí)現(xiàn)了數(shù)據(jù)云,無(wú)論是通過(guò)純粹的開(kāi)源產(chǎn)品(如Apache Hadoop)還是商業(yè)產(chǎn)品(如Talend、Informatica、Amazon Redshift、IBM、SAP、Oracle等),但這并不能解決整個(gè)數(shù)據(jù)生命周期方面的挑戰(zhàn),通常會(huì)迫使企業(yè)使用許多可能難以集成的附加異構(gòu)產(chǎn)品。
盡管開(kāi)源軟件/系統(tǒng)似乎非常有吸引力,尤其是從成本角度來(lái)看,但“自行開(kāi)發(fā)”實(shí)施功能解決方案的方法通常充滿挑戰(zhàn),而其“免費(fèi)”并不是真正的“免費(fèi)”。通過(guò)選擇一個(gè)完整的解決方案,可以顯著減少全面運(yùn)營(yíng)的時(shí)間,同時(shí)也降低了持續(xù)運(yùn)營(yíng)和支持的復(fù)雜性。從長(zhǎng)遠(yuǎn)來(lái)看,這種方法可以為企業(yè)部署節(jié)省大量的投資。根據(jù)調(diào)查,復(fù)雜性和集成挑戰(zhàn)會(huì)導(dǎo)致多達(dá)50%~65%的企業(yè)系統(tǒng)達(dá)不到預(yù)期或全部失敗。此外,非優(yōu)化系統(tǒng)的持續(xù)維護(hù)成本會(huì)對(duì)運(yùn)營(yíng)預(yù)算造成重大影響,估計(jì)這些成本可能是完全集成的解決方案成本的2~5倍。
除了增加以及對(duì)多種技術(shù)和可用資源有更多的需求之外,還有一個(gè)問(wèn)題是,導(dǎo)致洞察延遲,并且可能永遠(yuǎn)無(wú)法實(shí)現(xiàn)。而采用基于開(kāi)源的解決方案要有效得多,它已經(jīng)創(chuàng)建了所有必要的集成,以構(gòu)建可以輕松快速地實(shí)施并最終得到有效支持的完整系統(tǒng)。
作為更完整的數(shù)據(jù)生命周期解決方案的一個(gè)例子,Cloudera公司創(chuàng)建了一個(gè)與其Cloudera數(shù)據(jù)平臺(tái)(CDP)的集成方法,不僅包括數(shù)據(jù)采集和存儲(chǔ),還支持機(jī)器學(xué)習(xí)和縮短洞察時(shí)間,同時(shí)還包括一個(gè)配置文件驅(qū)動(dòng)的分層數(shù)據(jù)安全方法。它將數(shù)據(jù)采集、數(shù)據(jù)流、數(shù)據(jù)工程、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)和機(jī)器學(xué)習(xí)(ML)集成在一個(gè)可擴(kuò)展的框架內(nèi),并允許根據(jù)需要從不斷擴(kuò)大的合作伙伴生態(tài)系統(tǒng)中集成其他功能。它可以在內(nèi)部部署、混合云或公共云上工作,當(dāng)部署為云計(jì)算實(shí)現(xiàn)時(shí),它實(shí)際上可以消除與單個(gè)組件部署相關(guān)的延遲,從而可能節(jié)省獲得數(shù)據(jù)洞察的時(shí)間。
在許多企業(yè)中,這一點(diǎn)至關(guān)重要,因?yàn)檫@種延遲可能會(huì)面臨高昂的成本或重大損失。例如,欺詐檢測(cè)延遲幾分鐘或幾小時(shí)可能會(huì)導(dǎo)致巨大損失。根據(jù)美國(guó)銀行家協(xié)會(huì)發(fā)布的2019年存款賬戶欺詐調(diào)查報(bào)告,美國(guó)銀行領(lǐng)域在2018年阻止了針對(duì)存款賬戶高達(dá)223億美元的欺詐攻擊。雖然金融欺詐分析通常被認(rèn)為是此類(lèi)數(shù)據(jù)分析系統(tǒng)的主要應(yīng)用,但這只是冰山一角。
對(duì)健康數(shù)據(jù)/趨勢(shì)的延遲分析可能會(huì)造成病毒在未被發(fā)現(xiàn)的情況下傳播,同時(shí)也會(huì)因?yàn)槿狈m當(dāng)?shù)脑\斷和后續(xù)治療措施而帶來(lái)挑戰(zhàn)。隨著醫(yī)療機(jī)構(gòu)越來(lái)越多地使用遠(yuǎn)程醫(yī)療會(huì)話程序,并越來(lái)越依賴遙感器監(jiān)測(cè)和動(dòng)態(tài)的健康分析,準(zhǔn)確地收集數(shù)據(jù)至關(guān)重要,因?yàn)槿魏斡捎阱e(cuò)誤數(shù)據(jù)而導(dǎo)致的誤診都會(huì)給患者和醫(yī)療系統(tǒng)帶來(lái)重大損失。
研究表明,誤診損失的費(fèi)用占到醫(yī)療總費(fèi)用的30%。美國(guó)2018年在醫(yī)療保健方面的支出約為3.6萬(wàn)億美元,平均每人約支出11,000美元。為了使遠(yuǎn)程醫(yī)療系統(tǒng)發(fā)揮更廣泛的作用,就必須擁有更強(qiáng)大的數(shù)據(jù)生命周期解決方案,從而消除或至少在很大程度上減少誤診及其相關(guān)問(wèn)題。此外,采用在不同組織間共享個(gè)人數(shù)據(jù)的方法,以便更好地評(píng)估趨勢(shì)并提供更精確的分析,這是加強(qiáng)數(shù)據(jù)生命周期管理過(guò)程至關(guān)重要的另一個(gè)原因,它可以保護(hù)機(jī)密性并滿足所有相關(guān)的法規(guī)遵從性問(wèn)題。零售業(yè)、制造業(yè)、制藥業(yè)、運(yùn)輸業(yè)等行業(yè)領(lǐng)域都將從這種數(shù)據(jù)生命周期管理方法中受益。
結(jié)語(yǔ)
當(dāng)人們進(jìn)入一個(gè)數(shù)據(jù)驅(qū)動(dòng)和數(shù)字化轉(zhuǎn)型的世界時(shí),必須具有一個(gè)更具包容性的數(shù)據(jù)生命周期管理平臺(tái)。在許多企業(yè)中,容易因?yàn)槿狈皶r(shí)的洞察力會(huì)造成重大的財(cái)務(wù)或物理?yè)p失。企業(yè)應(yīng)該采用一種平臺(tái)方法來(lái)管理數(shù)據(jù)生命周期,這種方法不需要廣泛的內(nèi)部集成,也不需要延長(zhǎng)部署周期,無(wú)論是對(duì)于大型跨企業(yè)項(xiàng)目,還是對(duì)于快速啟動(dòng)的單個(gè)或小型團(tuán)隊(duì)項(xiàng)目。為了實(shí)現(xiàn)這一目標(biāo),采用集成的數(shù)據(jù)生命周期平臺(tái)解決方案至關(guān)重要。
作者:Jack Gold 來(lái)源:企業(yè)網(wǎng)D1Net
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7242瀏覽量
91037 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
9287瀏覽量
63090
發(fā)布評(píng)論請(qǐng)先 登錄
石油機(jī)械新寵兒 旋轉(zhuǎn)式油管測(cè)徑儀
一種新型直流電機(jī)控制器
易華錄智慧交管大模型實(shí)現(xiàn)交通數(shù)據(jù)價(jià)值的深度挖掘與應(yīng)用
智能測(cè)徑儀可以測(cè)量的石油套管種類(lèi)
光電測(cè)徑儀是如何應(yīng)用在石油套管生產(chǎn)線的?
智能測(cè)徑儀在石油行業(yè)的應(yīng)用前景
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
石油鉆桿的內(nèi)外螺紋及長(zhǎng)度如何測(cè)量?
一種使用LDO簡(jiǎn)單電源電路解決方案

一種面向飛行試驗(yàn)的數(shù)據(jù)融合框架

愛(ài)普生開(kāi)發(fā)了一種烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%

一種簡(jiǎn)單高效配置FPGA的方法

科技云報(bào)到:以數(shù)據(jù)“價(jià)值三角”為擎,探索數(shù)據(jù)治理實(shí)踐路徑

BIG WALNUT大核桃防爆手機(jī)在石油、化工等高危行業(yè)的應(yīng)用價(jià)值

評(píng)論