Hello 大家好,今天為大家?guī)?lái)eIQ Time Series Studio系列的最后一講。
上期講到的“Utilities”模塊中“Data Intelligence”數(shù)據(jù)智能工具。數(shù)據(jù)智能工具可以幫助用戶(hù)評(píng)估數(shù)據(jù)集的平衡性,確定各個(gè)數(shù)據(jù)通道/軸的重要性,還可以幫助確定最佳采樣頻率和窗口大小,從而優(yōu)化數(shù)據(jù)集,提高質(zhì)量和分析。本節(jié)將介紹“Utilities”模塊中的“Data Operation”數(shù)據(jù)操作工具。
Data Operation
數(shù)據(jù)操作模塊是TSS中的一個(gè)非常重要且方便實(shí)用的工具,主要解決非結(jié)構(gòu)化表格數(shù)據(jù)與TSS項(xiàng)目所需的標(biāo)準(zhǔn)化信號(hào)格式之間的兼容問(wèn)題。與圖像數(shù)據(jù)不同,時(shí)間序列數(shù)據(jù)的來(lái)源廣泛,形式多樣。
比如可能會(huì)碰到實(shí)驗(yàn)室設(shè)備參數(shù)、工況不完全一致,系統(tǒng)新老不一等這類(lèi)數(shù)據(jù)源的數(shù)據(jù)。數(shù)據(jù)格式不完全統(tǒng)一,這使得TSS機(jī)器學(xué)習(xí)任務(wù)變得困難。這個(gè)工具能讓用戶(hù)輕松預(yù)處理、轉(zhuǎn)換和驗(yàn)證這些五花八門(mén)的時(shí)間序列數(shù)據(jù),直接生成符合TSS工作流程要求的輸入文件數(shù)據(jù)集。Data Operation主界面如圖所示:
Dataset-數(shù)據(jù)集
數(shù)據(jù)集部分允許用戶(hù)導(dǎo)入表格數(shù)據(jù)文件(TXT或CSV格式)以進(jìn)行后續(xù)處理。可以加載單個(gè)或多個(gè)文件,并使用驗(yàn)證規(guī)則確保數(shù)據(jù)一致性。如需從本地系統(tǒng)選擇文件,請(qǐng)點(diǎn)擊“Import Files”按鈕。可以同時(shí)導(dǎo)入多個(gè)文件。
若導(dǎo)入多個(gè)文件,請(qǐng)確保所有導(dǎo)入的文件具有相同的列數(shù)。否則,要將它們合并為一個(gè)文件,請(qǐng)點(diǎn)擊“Concatenate Files”并選擇“Direction”選項(xiàng)。如果文件未連接,則此操作將分別應(yīng)用于每個(gè)文件。
若數(shù)據(jù)表中包含列標(biāo)題,請(qǐng)單擊“Ignore the first label line”跳過(guò)第一行(標(biāo)題)。可手動(dòng)選擇相應(yīng)的分隔符并預(yù)覽數(shù)據(jù)。
Operation-操作區(qū)
操作部分允許用戶(hù)對(duì)導(dǎo)入的數(shù)據(jù)集使用各種數(shù)據(jù)轉(zhuǎn)換。大多數(shù)操作需要參數(shù)配置才能達(dá)到預(yù)期結(jié)果。
Remove lines
刪除用戶(hù)認(rèn)為無(wú)用的行。
1. 輸入要?jiǎng)h除的行 2. 點(diǎn)擊“Run”按鈕
Remove Columns
刪除用戶(hù)認(rèn)為無(wú)用的列。
1. 輸入要?jiǎng)h除的列 2. 點(diǎn)擊“Run”按鈕
Remove Channels
移除用戶(hù)認(rèn)為無(wú)用的通道。僅適用于多通道數(shù)據(jù),用戶(hù)可以先將數(shù)據(jù)導(dǎo)入“Data Intelligence”模塊進(jìn)行智能分析來(lái)獲得推薦。通道相關(guān)性和通道重要性指標(biāo)可以幫助識(shí)別冗余通道。
1. 點(diǎn)擊“NumberofChannels”填寫(xiě)數(shù)據(jù)集的通道數(shù)
2. 選擇需要?jiǎng)h除的數(shù)據(jù)通道
3. 點(diǎn)擊“Run”按鈕
Separate Data by Columns
根據(jù)用戶(hù)指定的列數(shù),進(jìn)行行列轉(zhuǎn)換。
1. 點(diǎn)擊“NumberofColumns”填寫(xiě)數(shù)據(jù)集的列數(shù)
2. 點(diǎn)擊“Run”按鈕
Transpose Data
將數(shù)據(jù)集轉(zhuǎn)置,使行變成列,列變成行。直接點(diǎn)擊“RUN”按鈕。
Shuffle Data
按行打亂數(shù)據(jù)集。直接點(diǎn)擊“RUN”按鈕。
Wash Data
移除數(shù)據(jù)集中不干凈的行。這里的不干凈是指該行包含非數(shù)字元素,或者該行的列數(shù)與其他行不一致。直接點(diǎn)擊“RUN”按鈕。
Generate Samples
從連續(xù)數(shù)據(jù)中創(chuàng)建分段數(shù)據(jù)集,用于導(dǎo)入到TSS機(jī)器學(xué)習(xí)項(xiàng)目中。用戶(hù)可以使用“Data Intelligence”對(duì)連續(xù)數(shù)據(jù)進(jìn)行智能分析,預(yù)先獲得最佳分段參數(shù)。
1. 設(shè)置通道數(shù)。注意:連續(xù)數(shù)據(jù)要求通道數(shù)與列數(shù)相同 2. 選擇目標(biāo)列。注意:當(dāng)用戶(hù)希望將某個(gè)通道的輸出作為回歸任務(wù)的預(yù)測(cè)目標(biāo)時(shí),此選項(xiàng)可用。分類(lèi)任務(wù)則無(wú)需此選項(xiàng) 3. 設(shè)置分段數(shù)據(jù)窗長(zhǎng)
4. 設(shè)置采樣頻率。這里指的是原始采樣頻率的分頻系數(shù) 5. 設(shè)置步長(zhǎng)和重疊率
6. 點(diǎn)擊“RUN”按鈕
Down Sampling
對(duì)分段數(shù)據(jù)集進(jìn)行下采樣。由于分段數(shù)據(jù)的窗長(zhǎng)固定,因此下采樣時(shí)數(shù)據(jù)窗長(zhǎng)會(huì)減小。
1. 設(shè)置通道數(shù) 2. 設(shè)置采樣頻率。這里指的是原始采樣頻率的分頻系數(shù)
3. 點(diǎn)擊“RUN”按鈕
Split Dataset
將數(shù)據(jù)集按行拆分為訓(xùn)練集和測(cè)試集。
1. 選擇訓(xùn)練集/測(cè)試集比率
2. 點(diǎn)擊“RUN”按鈕
Result-操作處理結(jié)果
“Result”部分允許用戶(hù)保存已操作的文件或?qū)@些文件執(zhí)行新的操作。
對(duì)于單個(gè)文件:
“Run New Operation”按鈕會(huì)將已操作的文件導(dǎo)入到左側(cè)“數(shù)據(jù)集”部分。
“Save As”按鈕會(huì)引導(dǎo)用戶(hù)將已操作的文件保存到本地系統(tǒng)。
對(duì)于多個(gè)文件:
“Run New Operation”按鈕會(huì)將所有已操作的文件導(dǎo)入到左側(cè)的“數(shù)據(jù)集”部分。
“Save All”按鈕會(huì)將已操作的文件打包成 zip 文件并保存。
結(jié)論 “Data Operation”模塊提供了一套簡(jiǎn)化的工作流,用于將原始表格數(shù)據(jù)預(yù)處理并轉(zhuǎn)換為T(mén)SS工具可使用的文件格式。界面分為三個(gè)主要部分:
Dataset:支持靈活導(dǎo)入 (TXT/CSV) 文件,具備多文件合并功能,并提供可配置的解析設(shè)置(如分隔符、表頭識(shí)別)
Operation:提供多種針對(duì)表格數(shù)據(jù)的轉(zhuǎn)換操作,每項(xiàng)操作均設(shè)計(jì)簡(jiǎn)潔、易于理解,可適配不同數(shù)據(jù)類(lèi)型。
Result:支持對(duì)已處理文件執(zhí)行新操作或保存文件。
該工具通過(guò)直觀的交互設(shè)計(jì),幫助初學(xué)者與資深分析師高效生成項(xiàng)目所需的優(yōu)質(zhì)時(shí)間序列數(shù)據(jù)集。
eIQ Time Series Studio系列告一段落,感謝大家的一路相伴!
-
恩智浦
+關(guān)注
關(guān)注
14文章
5953瀏覽量
113771 -
Studio
+關(guān)注
關(guān)注
2文章
207瀏覽量
29548 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8495瀏覽量
134181 -
數(shù)據(jù)操作
+關(guān)注
關(guān)注
0文章
2瀏覽量
685
原文標(biāo)題:eIQ Time Series Studio 工具使用攻略(11)-數(shù)據(jù)操作
文章出處:【微信號(hào):NXP_SMART_HARDWARE,微信公眾號(hào):恩智浦MCU加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
恩智浦eIQ Time Series Studio 工具使用攻略(四)-數(shù)據(jù)導(dǎo)入

恩智浦eIQ Time Series Studio工具使用教程之數(shù)據(jù)記錄

恩智浦車(chē)規(guī)級(jí)深度學(xué)習(xí)工具包使新一代汽車(chē)應(yīng)用性能提高30倍
NXP eIQ Time Series Studio 工具使用攻略(九)-數(shù)據(jù)標(biāo)簽

恩智浦eIQ Time Series Studio工具使用教程之數(shù)據(jù)智能

恩智浦eIQ? Neutron神經(jīng)處理單元
防范機(jī)器學(xué)習(xí)IP失竊,恩智浦推出一款“防偷”神器!
NVIDIA TAO工具套件功能與恩智浦eIQ機(jī)器學(xué)習(xí)開(kāi)發(fā)環(huán)境的集成
恩智浦eIQ AI和機(jī)器學(xué)習(xí)開(kāi)發(fā)軟件增加兩款新工具
恩智浦eIQ Time Series Studio的工作流程

恩智浦eIQ Time Series Studio工具使用教程之模型訓(xùn)練

恩智浦eIQ Time Series Studio工具使用教程之仿真

評(píng)論