實時數據無處不在,由嵌入在各種技術(包括自動駕駛汽車、制造設備和醫療設備)中的傳感器生成。但是,“實時”對工程決策的真正含義是什么,更重要的是,如何使用實時數據?
許多工程師可能認為這些數據的主要用途是預測性維護,監測產生所述數據的設備的長期可行性。雖然這肯定是這種數據的一種潛在用途,但它不是主要用途。實時數據最好由機器學習模型處理,這些模型能夠在收到數據時盡快分析數據。然后,此數據用于生成見解,這些見解將快速或“實時”發送到數據庫、儀表板或設備。
然而,工程師面臨的一個共同挑戰是處理實時數據,因為原始形式的數據太混亂,無法進行有效分析。使用機器學習模型來處理這些數據是有幫助的,但更重要的是,工程師必須在將實時數據放入這些模型之前有效地準備這些數據。
考慮汽車發動機的溫度計。從理論上講,從儀表收集的數據每秒捕獲一個溫度。但是,發動機的溫度由多個傳感器測量,每個傳感器的測量速率略有不同 - 稱為采樣率或時間步長 - 必須將其同步到單個數據集中,然后才能由模型進行分析。那么,工程師應該從哪里開始使用實時數據呢?
嘗試同步數據
在宏觀層面上,同步數據的目標與同步手表的目標相同 - 將一個不同的時間與另一個不同的時間對齊,以便它們一起流動。在微觀層面上,目標是將多個不同的數據點(本質上是幾個不同步的手表測量的秒數)實時合并到一個數據集中。然而,每個數據點都是如此的微不足道,它們之間的差距是如此細化,以至于將它們同步在一起需要仔細準備。
同步實時數據的第一步是對齊。它可以幫助工程師從所需的目標開始 - 特定的時間步長或采樣率,例如每小時或每10秒。但是,實時數據模型通常設計為一次僅處理 1 秒的數據。因此,同步原始設備數據需要創建一個運行在 0 到 1 秒之間的時間向量,時間步長為 0.001 秒,然后對數據進行“重采樣”以匹配新時間。
考慮到這一點,下一步是數據同步的藝術所在,因為工程師必須決定如何在時間不匹配的地方填寫數據點。這通常是通過對原始數據重新采樣來完成的。幾種常見的重采樣方法包括最近鄰、聚合和插值,最佳選擇取決于初始時間矢量對齊和應用要求。
當工程師不確定數據集之間的時間對齊時,常見的解決方案是用恒定值或缺失數據填充空白。這在涉及許多傳感器時尤其有用,因為瀏覽和可視化結果數據可以幫助確定如何繼續分析其余數據。如果時間緊密對齊,則可以使用所記錄的任何重采樣方法。如果時間不緊密對齊,工程師應聚合或插值數據。
想象一下,將每小時的數據轉換為每日數據。如何在單個數據點中表示 24 小時內的所有數據?此方案中的一個適當示例是數據聚合,例如每日平均值。對于非數值數據,模式、計數或最近鄰方法更為常見。
在處理實時傳感器數據時,特別是在時間僅略微錯位的情況下,許多工程師使用插值,因為它有助于提供數據趨勢的知識,因為需要填充的時間空間更少。如果在處理實時傳感器數據時點較遠,則多項式或樣條插值是更準確的方法。
下面是使用溫度、壓力和電流傳感器預測設備故障的示例。
圖 1:流式處理工作流的圖示。? 1984–2020 數學工程公司
在此示例中,消息傳遞服務處理原始傳感器數據,然后將其應用于模型,該模型用于實時生成預測。生成預測后,模型將更新并應用于下一組實時傳感器數據。這些結果會持續且反復地實時發送到儀表板。
實時數據和通用數據的區別
概述的準備實時數據的過程可能聽起來很有挑戰性。但是,對于工程師來說,它很常見,可以內置到大多數數據科學平臺的API和模塊中。由于與數據科學平臺的常見集成,在執行此過程時,在使用實時傳感器數據構建模型之前,通常需要解決最少的額外數據準備注意事項。
其中一個考慮因素應該是規劃一個系統,這意味著在構建任何東西之前捕獲所有需求并建立參數。此外,在流程早期構建完整的流式處理原型也會有所幫助,因為它允許工程師在分析實時數據的同時返回調整算法。時間窗口可能是另一個需要考慮的好參數,因為這些參數通常控制進入系統的數據量。
構建模型時,工程師通常會對數據集進行平滑和縮減采樣。使用實時數據,可以添加頻域,從而創建一個新參數,以便在模型分析數據之前考慮這些參數。一旦原始數據被組織到具有匹配時間的單個數據集中,就更容易執行其他分析。
總體而言,隨著自動駕駛汽車和醫療設備以及制造設備和其他設備繼續嵌入各種傳感器,實時數據將變得更加普遍。隨著工程師希望繼續為系統提供有價值的基于數據的見解,有效地導航傳感器數據的“實時”方面將非常重要。
審核編輯:郭婷
-
傳感器
+關注
關注
2564文章
52706瀏覽量
764604 -
發動機
+關注
關注
33文章
2537瀏覽量
70760 -
自動駕駛
+關注
關注
788文章
14242瀏覽量
169898
發布評論請先 登錄
自動駕駛“單車智能”并不意味著不聯網?

AFE0064芯片手冊中把所有的地引腳都表示為GND,是不是就意味著不分數字地和模擬地呢?
ADS7230有兩個電源和兩個地,是不是意味著芯片內部模擬部分和數字部分是隔離的?
ADS1274沒有DRDY信號輸出,是否意味著芯片已經損壞?
ADS8671 datasheet里寫的是小信號輸入-3db帶寬為15KHz,是不是意味著正常信號超過10K衰減已經很厲害了?
在ADS8320的規格書里,Tcsd最大為0ns,請問這是不是意味著Dclock極性只能是空閑為低?
ADC的數據表給出了±VREF的輸入范圍,是否意味著可以測量相對于接地的負電壓?
ADS1262浮空測量波動大,是否意味著連接上信號實測波動也會很大?
超級電容的出現意味著儲能技術的突破

電子設備有陶瓷電容意味著什么?
想要對脈寬3ns的脈沖信號進行放大,是不是意味著我選放大器時的響應時間要小于3ns?
解析OrangePi AIpro:什么是 NPU?它對你意味著什么?

評論