面對新基建驅動而即將造成的數據量井噴現象,當下的數據庫模式將不能夠足以支撐,尤其考慮到 AI 正逐步落地的情況。
依據 Raconteur 統計的數據,到 2025 年,全球每天預計有 463 EB 數據產生,相當于每天產出約 2.1 億張 DVD 碟;IDC 發布的《數據時代 2025》報告中也預測,全球每年產生的數據從 2018 年的 33 ZB 增長到 175 ZB(1 ZB=1024 EB),以 25 MB/ 秒的網速進行下載,需要的時間為 18 億年。
隨著數據量的暴增,問題逐漸暴露。
數據規模大、類型多,一站式服務需求激增
截至目前,針對海量數據的處理,業內既有的數據產品多只能解決某一類問題,譬如 Hive 應用于結構化數據、面向數據存儲的文檔數據庫 MongDB、專注于復雜搜索需求的 ElasticSearch 以及圖數據庫 Neo4J 等等。
與此同時,圍繞多種數據類型的存儲與處理需求,業內也搭建了一種混合架構,涉及多種不同的數據庫技術,以解決不同的數據問題。
只不過,我們也可以注意到,各個數據庫各自為政,這也使得客戶在需要使用多種數據庫產品時,需要自己重新架設一層,以解決需求被滿足時所產生的附加問題,包括數據如何在不同數據庫之間導進導出、數據在不同庫中的一致性保持、整體運維等等。
僅從文字的描述來看,就可以知道,數據庫的單一獨立使用和混合使用各有優劣,前者操作簡單但供給不足以滿足實際應用場景的多樣化需求,后者雖然能夠滿足客戶圍繞數據產生的多樣化需求,但是操作不便、運維復雜等問題也是不可忽視的。
就當下而言,混合架構或許尚能夠應對來自產業內的多樣化數據需求,但是長久以往下去并不是一個辦法,尤其是隨著新基建的到來,于國內數據庫的發展也帶來了極大的挑戰。
針對這個問題,騰訊云數據庫副總經理王義成指出了三點:
1、數據量出現全面井噴,如何滿足相應運算與分析的實時進行?
2、業務融合多樣化發出挑戰,數據庫是否能夠接受在不同的業務中心、數據中心、基礎設施之間去做相應的部署和融合?
3、老齡化逐步演進,數據庫人才缺口可能更大,數據庫供應商如何為用戶提供多種自動化服務,以及能否為用戶的多種服務需求提供自動運維服務,實現整個數據的自動化治理?
圖 | 騰訊云數據庫副總經理王義成
從這些挑戰來看,鑒于數據庫與數據庫之間的不兼容,為了避免復雜操作性、實現成本有效降低等目的,一個面向數據層面的一站式服務平臺顯然成為一個剛需。
簡單來講,在這個一站式數據服務平臺或數據庫中,用戶希望能夠以簡單的操作方式調用多數據庫的資源,并處理多種數據模型等等。
數據庫未來趨勢?提名“多模數據庫”
在提及數據庫在新基建背景下將面臨的挑戰時,他也指出了這一產品的兩點趨勢,一點關乎數據庫分配模式,“在數據量再擴幾倍的情況下,還能保持 TP 與 AP 的整體穩定性和性能,這是一個大趨勢,大家也會在這個點上繼續去深耕。”
第二點上,王義成則表示隨著 5G 的到來,可能會有更多模式的數據庫會出來,包括圖數據庫或是更為稀奇的數據模式。
“數據庫的下一個模式會向多模方向發展。數據庫的存儲模式是不同的,但真正對于應用訪問來說,或者對于應用處理來說,需要一個更加經典化、更加統一的標準接口讓上層應用能夠去訪問。”王義成表示,“我認為,應對 5G 帶來的應用爆發、數據爆發,多模可能是一個大的趨勢點。”
多模數據庫究竟是怎樣的?與現有的混合架構模式而言,它的優勢體現在哪里?
簡單來講,多模數據庫最終體現的是一種數據模式的統一,主要形式有兩種:
一種是數據存儲為統一模式,可以在這一層面暴露多種協議接口類型,比如一套數據存儲,可以暴露 Mongo 的訪問模式,暴露 MySQL 的訪問模式;
另一種則是集中存儲,將不同類型的數據庫存儲到一個整體通用的數據平臺,再用一個 up 層,或者用一個接口層去兼容多種協議,讓所有的應用都能夠更為方便的集中于自身的數據處理跟統一。
相較于混合架構而言,多模數據庫在進行統一整合、將操作極簡化的同時,也降低了數據在不同庫之間來回遷移的成本和風險等。“多模數據庫有可能是未來中長期相對比較的趨勢。”王義成說到。
多模數據庫驅動下,助力 AI 逼近“人類智能”
從前面行業內人士的講解來看,在數據庫賽道中,利好多多的多模數據庫已然成為被看好的下一個趨勢。當前,在多模數據庫賽道中,包括騰訊在內,華為、阿里等大型云服務商也已經推出或即將推出有關產品。
在一些行業賽道中,尤其是那些傳統行業,他們的數據多是分散在各個業務系統中,這也為他們的數據化、智能化變革道路中增添了難度。如果一個產品能夠幫助他們更快地整合數據,并能夠提供抽象化的應用接口,這必然是利好的。
用王義成的話來說,使用多模數據庫的目的之一,是解決用戶不同調用的使用習慣,助力用戶使用。而當談及落地,“多模數據庫”于 AI 的智能提升而言可謂一大助力。
眾所周知,AI 與人類智能差距之一就是“多模態信息的智能化理解”,這其中包括視覺、聲音、符號語言、嗅覺和觸覺等信息。如果能夠像人類利用多模態數據學習知識一樣,讓 AI 也擁有多模態數據的學習能力,AI 的智能程度必然將大大獲得提升。
然而,就目前而言,多模態 AI 還存在不少技術難點,其中就涉及到多模態數據的融合。
具體來看,一個軟件或算法模型的進步是較為容易的,但當多個算法疊加在一起,難度的升級將會是成倍的,尤其在面對圖像、語音、觸感等非文本數據時。
就這一點來看,多模數據庫與 AI 可以看作是相輔相成的:利用 AI 算法,數據庫將能夠在現有基礎上獲得進一步的優化;反過來,正是因為能夠調用多個數據庫,以及兼具的統一性,多模數據庫將能夠為 AI 算法模型提供訓練平臺,以及融合數據處理平臺,讓 AI 系統的決策更為全面和智能。
責任編輯:pj
-
數據
+關注
關注
8文章
7244瀏覽量
91053 -
AI
+關注
關注
87文章
34314瀏覽量
275493 -
5G
+關注
關注
1360文章
48738瀏覽量
570495
發布評論請先 登錄
數據庫數據恢復——MongoDB數據庫文件拷貝后服務無法啟動的數據恢復

數據庫數據恢復—SQL Server附加數據庫提示“錯誤 823”的數據恢復案例

適用于SQLite的dbExpress數據庫驅動程序
MySQL數據庫的安裝

云數據庫是哪種數據庫類型?
數據庫事件觸發的設置和應用
AI時代的數據庫技術發展論壇亮點前瞻
數據庫數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例
不用編程不用電腦,快速實現多臺Modbus協議的PLC、智能儀表對接SQL數據庫

數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

Oracle數據恢復—異常斷電后Oracle數據庫啟庫報錯的數據恢復案例

數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

軟通動力數據庫全棧服務,助力企業數據庫體系全面升級

評論