疫情的防控需要結合科學有效的手段,其中大數據作為科學判斷的主要依據,扮演著相當重要的作用,隨著抗疫的逐漸深入,究竟何時才能到達拐點,何時才能見到曙光?算力大學邀請中科院大學金融科技中心首席科學家劉世平從大數據,用數學模型給出了他的預測。
劉世平表示,通過Logistic增長模型和Vintage分析,全國確診人數的峰值可能在8萬左右,預計在3月14日以后每日新增確診小于10人,疫情進入緩解階段。
新一代進行信息技術包括很多方面,像4G、5G各方面的信息流通、大數據、云計算、區塊鏈、人工智能等都非常熱應用面也非常廣。
這些技術往往有很多復雜的交叉和應用,比如大數據跟云計算是一個緊密的結合,如何把大數據跟區塊鏈技術進行有效的結合,也很重要。
人工智能也非常依賴大數據的數據和數據整理。
那么大數據是怎么一回事?
一是大數據是一個更加廣泛和深入的數字化。
二是全社會的互聯互通。
數字化是不是一個簡單的電子化的問題,它是用數字來指導我們業務的一個習慣、策略和決策的概念。
麥肯錫在2011年對大數據提過一個定義,“big data:The next frontier for innovation,competition and productivity。”這里提出了三個關鍵詞,創新、競爭、生產效率。
這些年我們做了幾十年的工作以后,總結了5個關鍵點。
1.建立大數據標準體系;
2.不斷強化基于大數據的數據質量管控;
3. 持續完善基于大數據的基礎設施;
4.初步實現基于大數據的數據集中與共享;
5.逐步開展基于大數據的數據挖掘和應用。
那么用大數據主要能干什么?
一個是總結過去,另一個是掌握現在,還有預測未來。
在這次疫情過程中,我們要不斷發現每天和過去發生的事情,積極歸納總結。我們是希望知道我們當下的狀態,并對未來做一些預估,我們可能關心很多的題,比如大家都關心什么時候會出現拐點?
這就是數據挖掘的概念。數據挖掘是從大量的數據中挖掘有應用價值的信息,關鍵問題是怎么樣把這些信息運用到我們的決策過程中,這里有一系列算法要做。在這次疫情的分析過程中,我們也用到了各種不同的算法去對疫情和未來的反彈的問題進行預估。
要用數據挖掘的方法去建模,首先對業務的理解非常重要,第2是要對數據進行探索,知道我需要什么樣的數據。
在這個基礎上對數據進行準備,包括數據的收集和整理,甚至有時候還要去購買一些數據,對數據的質量要進行檢查,另外要對中間的變量轉化等等做一系列工作。建模完成后還有個很重要的工作,對模型進行有效評估,評估模型是否準確,然后部署到系統中,讓他真正發揮作用。
中央指導組的副組長,中央政法委秘書長陳一新強調說,疫情防控指揮系統的決策力、執行力,是武漢保衛戰能否打贏的前提條件和關鍵的環節。決策力、執行力就要用到數據,所以他也提到了一句,要加大數據的分析,時刻要心中有數。
在我們的決策過程中,這是一種思維方式,建立健全有力有序有效的指揮機制,實現疫情防控的科學化、精準化、高效化,尤其是科學化和精準化以及高效化,這些東西,都離不開大數據的有力支持。
在這個基礎上,***也提出了他的指示,鼓勵運用大數據、人工智能、云計算等數字技術,在疫情監測分析、病毒溯源、防控救治、資源調配等方面發揮更好的支撐作用。所以在從各個方面對大數據的重要性的強調都很多。
舉個例子,如果一個人平均傳播2.6個人的話,傳播到第5代,可以快速擴展到368個人。所以這次武漢爆發我們究竟關心什么東西呢?
從整個事件的本身去理解,有病患發展的一個周期。我們把它分成潛伏期、待確診、治療以及出院,包括密切接觸留院的觀察者、疑似患者、確診患者、重癥患者等等。
這里很重要是治愈和死亡,現在提到的很多死亡率和治愈率的數據講法是不準確的。
因為很多專家都說了,疫情傳播隱藏期大概14天左右,比如湖北是我國第1個大型爆發的。第2個是在溫州,然后還有北京、深圳等等城市,那么這些城市發現第1例的時候,究竟在什么時間點會出現大的一個爆發,也會出現一個波峰?
我們分析了這些很多城市之后,一般大概是在7~9天左右的時間,那么湖北省的第1個波峰是在9天,在其他的省一般在9天左右,也就是說當發現第1例患者,可以通過患者者來簡單預測未來在什么時間點,可能預估到會出現的一個小高峰。
另外很重要的一點,從現有的疫情來確認人數,看疫情發展的一個趨勢。
在早期的時候,我們都在找拐點,但究竟什么是拐點?
我們一開始做分析的時候,我們找第1個拐點就是說讓增速能不能先降下來。第2個拐點是讓絕對值能下來。
數學上我們就在講的第1個是增速,其后我們希望找的是絕對值的減少。
另外還有一個很重要的點,要預估這次疫情的發展,潛在可能有多少人被感染、大概在什么時間點會達到高峰期?我們用了邏輯回歸的理念。邏輯回歸這條曲線有開始期,有加速期、有減速期以及飽和期。
我們做了這么一個預估,應該是在79,000多將近8萬的這樣的一個數字。然后具體的時間大概應該是在3月14號左右,全國這個增量大概會在10人以下。
在收集了大量的數據之后,還有一個很重要的一點是利用模型預測病毒繁衍。
我要講的第三部分是大數據在抗疫中的作用。
一、大數據支撐人員返程
我們每天對全國的疫情,都有一個很明確的分析,利用大數據追蹤行程追溯,這個人病源是從什么地方來,看從他流動的趨勢,利用交通信息數據精密追蹤這個人的動向。
二、大數據防控預警平臺
三、大數據可以追溯傳染病源頭
四、大數據分析人員流動軌跡
五、大數據助力物資調運
大數據可以幫助我們進行物資的調運,什么地方缺什么東西,缺的量是多少,什么地方可以快速的把這些物資可以快速的運用到這個地方去。這些技術早在20年前,沃爾瑪用來解決了他倉儲的問題,區塊鏈在打假這方面也很重要,尤其在利用區塊鏈的物資調配來辨別醫療物資的真假方面。
首先是要進行分類的審批,對于醫療防護用品的企業鼓勵迅速復工,這很重要,廣東的佛山市開發了一個叫疫情數據報送平臺,動態的掌握了企業生產的和員工的數據。
還有一個很重要的問題,如果當地的疫情比較嚴重,務工的人員不愿意去也是很重要的問題。對政府來說,在不同的地方復工,首先批準的是基本上沒有疫情的地方,務工人員也會愿意到這個地方來。
每個人得病,這都是其實是一個很隱私的事情。那么在抗議過程,在隱私保護方面,哪些可以對隱私的保護能夠起到比較好的作用?
目前,為做好新冠肺炎疫情聯防聯控中的個人信息保護,積極利用包括個人信息在
內的大數據支撐聯防聯控工作。中央網信辦日前公開發布《關于做好個人信息保護利用大數據支撐聯防聯控工作的通知》,明確為疫情防控、疾病防治收集的個人信息,不得用于其他用途。任何單位和個人未經被收集者同意,不得公開姓名。
在大數據使用里邊非常重要的一個理念,也是隱私的保護的問題。在這個時間點我們首先要解決的是疫情防控問題,但是同時我們一定要注意隱私的一個保護。
區塊鏈的優勢在于,它的一個加密哈希算法里包括了數據的收集、數據的存儲、數據的共享、數據的使用,以及數據在什么時間內銷毀的問題。這里包括安全的采集、存儲的安全,以及一系列加密手段和加密算法。
所以我們希望隨著疫情逐漸趨于平坦,可以把更多時間用在隱私保護工作上,其實對這些人的隱私的保護,一樣的是很重要。
比如利用數字簽名保障數據收集的真實可靠。
隨著疫情逐漸向平穩過渡,希望政府在今后的過程中,能夠把已經收集到的一些數據的使用能夠提出一些更加完整、更加系統的些方法,每一個人私密和隱私進行一定的保護。
對此我們也提出了一個概念,叫密管中心。利用大數據平臺,通過一個嚴格的流程程,使得數據和使用者嚴格遵守隱私保護的體系和理念,對我們每一個人來講,都希望有這樣的隱私權的。
另外區塊鏈在這個過程中,然后可以使社區的防疫更加精準。其不可篡改性,和精確追蹤的去穿透式能力,可以更加準確的掌握每一個人的行動和軌跡。
另一點是助力解決中小微企業的融資的問題,區塊鏈在企業的信用方面能夠發揮很多的作用,讓信用更加真實可靠。
大家也知道前一段時間,關于捐贈物品使用的是不是合理,是不是規范的問題,其實區塊鏈技術可以在這方面發揮一定的作用,利用他的防篡改、可追溯性,接受公眾的監督。
總體來說,這些新一代技術,像區塊鏈、大數據、互聯網、人工智能,在很多方面都是相互有關聯作用的。每一種技術都會有自己的缺陷,不同技術之間也會有一定的相互補充。所以好多技術在很多時候都可以綜合應用。
我覺得大數據跟人工智能更加密切一點,大數據跟區塊鏈也有一定的兼容性,所以我們在利用大數據各種各樣的優勢的同時,也可以考慮利用區塊鏈去保護隱私,讓其他的東西更的透明。比如中小企業的信用,更加真實可靠,讓捐贈更加透明,這些東西都是區塊鏈的優勢。
責任編輯:ct
評論