第一階段
企業信息化達到一定程度之后,一定會有報表的需求,此時直接從業務系統的數據庫進行查詢。
第二階段
直接查詢業務系統數據庫,很容易對業務系統造成影響,這時可能會將數據抽取出來,放在一個鏡像數據庫里進行查詢。
第三階段
當數據規模越來越大,報表與數據分析的需求也隨之增多。開始對數據進行系統化的規劃與管理時,數據倉庫的雛形也已建立起來。
關系型數據庫的星形(或雪花型)結構是數據倉庫的常見形式之一,但不是唯一的形式,只要能做到將數據有序管理,基本上就可以稱之為數據倉庫。
當建立起心形或雪花型的數據倉庫的時候,已經可以做一些基本的數據分析了。但是會有一些弊端。星形或水上行結構雖然模擬了多維數據模型,但是其本質上還是關系型數據庫的表字段以及數據行的模型。無法做到真正意義上的面對業務時的數據分析。而且這種直接建立在關系型數據庫之上的模型,很難讓業務人員自主進行數據分析。
第四階段
基于關系數據庫星型或雪花型結構所建立的數據倉庫,雖然可以進行數據分析,但分析能力不強。
星型或雪花型結構雖然模擬了多維數據模型,但其本質上還是關系型數據庫的表及字段模型,無法做到真正意義上面向業務的數據分析,而且這種直接建立在關系型數據庫之上的模型,很難讓業務人員獨立進行數據分析。
第五階段
由于多維數據庫維度既業務的特性,所以基于多維數據庫所建立的數據體系的分析能力要強很多,而且也能將讓業務人員自主分析這一目標落地實現。
多維數據庫向外提供維度與數據集市模型,數據的實際物理存儲則對外屏蔽。關系型數據庫可以作為多維數據庫的一種底層實現,當然還有其他的方式,比如數據塊文件、分布式存儲等。
關系型數據庫的星型(或雪花型)結構容易與多維數據庫的維度與數據立方體結構產生一些混淆,主要是由于以下兩點原因:
多維數據庫可以使用關系數據庫作為數據實際存儲方案;
多維數據庫的MDX與關系數據庫的SQL在語法結構上的類似。
以上兩點原因使得在關系數據庫的星型(或雪花型)模型上使用SQL進行查詢被誤認為是可以進行多維分析的,實際上這是非常錯誤的認識,原因在于表及字段模型和維度及數據立方體模型本質上的區別。
以上是思邁特軟件Smartbi的分享,更多行業干貨可關注我們下一期的分享。思邁特軟件Smartbi是知名國產BI品牌,專注于商業智能BI與大數據BI分析平臺軟件產業的研發及服務。經過多年持續自主研發,凝聚大量商業智能最佳實踐經驗,整合了各行業的數據分析和決策支持的功能需求。滿足最終用戶在企業級報表、數據可視化分析、自助探索分析、數據挖掘建模、AI智能分析等大數據分析需求。
現個人版提供全模塊長期免費使用,有興趣的小伙伴可登陸官網免費試用。
責任編輯:tzh
評論