1 引言
隨著大數據時代的迅猛發展,人們對LBS(Location Based Services,基于位置服務)的需求也快速增長,無線定位技術逐步得到重視,位置服務已經成為一種熱門的技術。輔助GPS(AGPS)定位技術結合了GPS定位和蜂窩基站定位的優勢,借助蜂窩網絡的數據傳輸功能,可以快速精準地定位,在移動設備尤其是手機終端中被廣泛使用。運營商通過更新4G網絡主設備網管,即新增輔助GPS和異網檢測功能,實現了基站MR(Measurement Report,測量報告)數據版本升級。在新的數據源中不僅能夠獲取到精確的GPS地理信息,同時異網檢測功能也可以針對其他運營商網絡覆蓋強度進行周期測量,從而解決了當前MR應用過程中定位精度不足和只能評估本網絡覆蓋情況的局限。通過本次研究,可以有效拓展MR的分析能力,針對三網(中國移動、中國電信、中國聯通)的覆蓋情況進行對比分析。
本文通過對輔助GPS數據的挖掘分析,預測出運營商的基站覆蓋中心點,可以實現運營商之間的網絡可持續化對比,為解決傳統三網對比測試樣本不充足、對比不全面的問題提供一種有效解決方案。
2 運營商基站覆蓋中心點預測
以基站采集到的終端測量報告作為數據源,并將數據源按頻點和PCI(Physical CellIdentifier,物理小區標識)進行分組,對分組后的每組數據用Mean-Shift(偏移均值向量算法)算法做首次密度聚類[3-4],找到局部最優的基站覆蓋中心點。結合專業的業務背景知識,對局部基站覆蓋中心點用DBSCAN算法做二次聚類,找到全局最優的基站覆蓋中心點[5-8]。最后用本網的主覆蓋小區來驗證所預測出來的基站覆蓋中心點的正確性。具體流程如圖1所示:
圖1 運營商基站覆蓋中心點預測流程
2.1 數據源提取及清洗
本模型采用中國電信全省MR的輔助GPS相關數據,主要包括:各運營商的頻點、PCI、用戶個人上報的百度經緯度、地市、中國電信主服務小區百度經緯度等屬性,并對每條記錄中的異常數據、無效數據進行了清洗。為減少鄰區等干擾因素影響模型的準確度,本模型只提取了室外且相距主服務小區1 km以內的MR記錄。
2.2 Mean-Shift算法聚類過程
Mean-Shift算法是一個迭代的過程。對于d維空間的N個樣本點,首先隨機選擇一個點,并以這個點為圓心、以R為半徑做一個d維的高維球,落在這個球內的所有樣本點和圓心都會產生一個向量,每個向量都以圓心為起點、以球內的樣本點為終點,計算出球內所有向量的和,最終得出Mean-Shift向量。再以Mean-Shift向量的終點為圓心重復上述步驟。由同起點向量求和法則可知,Mean-shift向量最終將收斂到概率密度最大的區域[9]。Mean-Shift向量的基本形式如下:
(1)
其中,x為空間中任意一點;D表示在N個樣本點xi中有D個點落在SD區域中。
Mean-Shift算法的偽代碼思想如下:
(1)隨機選擇一點為中心點,固定一個窗口,計算出Mean-Shift向量;
(2)判斷是否達到收斂,若收斂則終止,否則執行第(3)步;
(3)以Mean-Shift向量的終點為新的中心,重復上述步驟[10]。
由于獲取到的用戶輔助GPS數據呈現出無規律分布,因此采用基于概率密度的Mean-Shift算法進行聚類分析。該算法忽略了數據源中的異常值,每次只對窗口內局部數據進行計算,計算完成后再移動窗口。
本模型首先以中國電信的數據做訓練集,以頻點和PCI作為分組條件,分別把具有相同頻點和PCI的個人上報百度經緯度進行聚類。經過多次模型訓練并結合業務實際,本模型最終設置的Mean-Shift窗寬系數為0.02,聚類得到多個同一頻點和PCI下多個基站覆蓋中心經緯度。預測中國電信室外的基站覆蓋中心點有159 284個,將預測出來的覆蓋中心點經緯度與中國電信MR數據本身提供的小區百度經緯度在百度地圖上作距離對比。結果表明,對于廣州市區統計出基站覆蓋中心點有80.3%落在主覆蓋小區對應方向角附近150 m以內,但在同一頻點和PCI下有部分預測的基站覆蓋中心點相距較近。結合專業的業務知識,運用區域聚類算法DBSCAN進行二次聚類,將屬于同頻點同PCI且相距較近的基站覆蓋中心點聚為一個新中心點。
2.3 DBSCAN二次聚類過程
DBSCAN是一種基于高密度連通區域的聚類算法,能夠將具有足夠高密度的區域劃分為簇。該算法需要兩個核心的參數:一個參數是半徑,表示以給定點P為中心的圓形鄰域的范圍;另一個參數是以點P為中心的鄰域內最少點的數量[11]。
基于本模型需求和專業的業務知識,模型設置的半徑為200 m,鄰域內最少點數量設置為1,從而可以將具有相同頻點和PCI且距離較近的基站覆蓋中心點聚類成一個新的中心點。將基站覆蓋中心點經緯度與中國電信MR數據提供的小區經緯度作距離核對,該模型預測出中國電信室外共有155 244個基站覆蓋中心點。對于廣州市區統計出基站覆蓋中心點有83.6%落在主覆蓋小區對應方向角附近150 m以內,符合實際業務規則。
DBSCAN算法的偽代碼思想如下:
(1)選取鄰域半徑為200 m,鄰域內最少點數為1;
(2)隨機選取一點為中心點,計算相同頻點和PCI下的主覆蓋小區中心點的距離,若滿足條件,則加入該鄰域,并以新加入的點為中心判斷其余點是否滿足條件,直到遍歷完所有點,計算出該鄰域新的中心點,并把屬于該鄰域的點從原數據中刪除;
(3)從剩余的點中隨機選取一點為新的中心,重復第(2)步直到原數據中所有點都被重新歸類完畢為止。
3 運營商基站覆蓋中心點對比分析
通過上述模型,采用相同的方法可以預測出異網基站覆蓋中心點的位置及其數量,預測出運營商A室外有231 948個基站覆蓋中心點、運營商B室外有92 668個基站覆蓋中心點。將三家運營商的基站覆蓋中心點預測結果顯示在百度地圖上,以廣州兩個區域Ⅰ、Ⅱ為例,具體如圖2和圖3所示:
圖2 區域Ⅰ運營商基站覆蓋中心點對比
圖3 區域Ⅱ運營商基站覆蓋中心點對比
其中,扇形表示運營商真實的主覆蓋小區所在的位置;圓形表示用模型預測出來的基站覆蓋中心點所在的位置;黃色表示運營商A、藍色表示運營商B、紅色表示運營商C。
從圖2和圖3可以看出,預測得到的基站覆蓋中心點跟真實的小區相距較近,能夠直觀地描繪出三家運營商的覆蓋區域及覆蓋密度。通過這種直觀的比較,不僅可以掌握異網的大致網絡分布,而且也易于了解哪些區域是本網盲區、哪些區域需要加強覆蓋,為網絡建設規劃和智慧網優提供強有力的支撐。
4 結束語
本文通過對MR數據的挖掘分析,預測出運營商的基站覆蓋中心點,可以全面掌握運營商主覆蓋小區的大致分布和覆蓋密度,為全面評估網絡覆蓋程度提供有力支撐,也為掌握異網的網絡規劃和發展規模提供理論依據。后續將對全集團的MR數據做相同的挖掘分析,為全集團的網絡規劃、智慧網優、優化布局提供全方位智能化分析方法,進一步提升網絡資源投放效率。
責任編輯:gt
-
運營商
+關注
關注
4文章
2412瀏覽量
45048 -
gps
+關注
關注
22文章
2960瀏覽量
168476 -
中國移動
+關注
關注
22文章
5610瀏覽量
72850
發布評論請先 登錄
國內外電機結構 工藝對比分析
主流汽車電子SoC芯片對比分析
HDJL接地回流試驗測試儀的數據對比分析

半導體激光器和光纖激光器的對比分析
Wi-Fi與藍牙的波特率對比分析
RoCE與IB對比分析(二):功能應用篇

常用音頻線接口對比分析
安科瑞智慧工廠解決方案--讓能耗監測全面+有效-能耗監控,能效分析,節能優化

對比分析點焊機與傳統焊接方法
網關和路由器的對比分析
交流伺服電機與直流伺服電機的對比分析
全光網絡與傳統網絡架構的對比分析

評論