開發板簡介
創龍科技 TL3562-EVM-B 是一款基于瑞芯微 RK3562J/RK3562 處理器設計的四核 ARMCortex-A53 +單核 ARM Cortex-M0 國產工業評估板,主頻高達 2.0GHz。評估板由核心板和評估底板組成,核心板 CPU、ROM、RAM、電源、晶振、連接器等所有元器件均采用國產工業級方案,國產化率 100%。評估底板大部分元器件亦采用國產工業級方案,國產化率約 99%(按元器件數量占比,數據僅供參考)。核心板經過專業的PCBLayout 和高低溫測試驗證,質量穩定可靠,可滿足各種工業應用環境要求。
評估板硬件資源圖解1
評估板硬件資源圖解2
前言
本文檔主要通過Cyclictest延遲檢測工具,以及基于Linux-RT的應用程序評估Linux-RT系統的實時性,適用開發環境如下:
Windows開發環境:Windows 7 64bit、Windows 10 64bit
Linux開發環境:VMware16.2.5、Ubuntu20.04.6 64bit
U-Boot:U-Boot-2017.09
Kernel:Linux-5.10.209、Linux-RT-5.10.209
LinuxSDK:rk3562-buildroot-2021.11-sdk-[版本號](基于rk3562_linux_release_v1.2.0_20240620)
我司默認使用的是Linux內核,同時提供了Linux-RT內核位于產品資料“4-軟件資料LinuxKernelimagelinux-5.10.209-[版本號]-[Git系列號]”目錄下,版本號、Git序列號以實際情況為準。請按照如下方法替換為Linux-RT內核。
請將boot-rt.img鏡像拷貝至評估板文件系統任意目錄下。執行如下命令,替換內核鏡像至Linux系統啟動卡,評估板重啟生效。
備注:"/dev/mmcblk1p3"為Linux系統啟動卡對應的設備節點,如需固化至eMMC,請將設備節點修改為"/dev/mmcblk0p3"。
Target# dd if=boot-rt.img of=/dev/mmcblk1p3conv=fsync
Target# sync
Target# reboot
圖 1
圖 2?Linux-RT內核
我司提供的Linux-RT內核與Linux內核測試方法一致,請參考《評估板測試手冊》或《物聯網模塊開發案例》進行測試即可,Linux-RT內核支持的外設接口如下表所示。
我司提供的Linux-RT內核應用了開源的RT PREEMPT機制進行補丁。PREEMPT_RT補丁的關鍵是最小化不可搶占的內核代碼量,同時最小化必須更改的代碼量,以便提供這種附加的可搶占性。Linux-RT內核增加PREEMPT_RT補丁后,增加了系統響應的確定性和實時性,但是代價是CPU性能降低。
Linux-RT內核與普通Linux內核相比,幾個主要的相同之處是:
具有相同的開發生態系統,包括相同工具鏈、文件系統和安裝方法,以及相同的POSIX API等。
仍然存在內核空間和用戶空間的劃分。
Linux應用程序在用戶空間中運行。
Linux-RT內核與普通Linux內核在常規編程方式上的幾個主要不同之處是:
調度策略。
優先級和內存控制。
基于Linux-RT內核的應用程序使用了調度策略后,系統將根據調度策略對其進行調優。
Linux系統實時性測試
本章節主要介紹使用Cyclictest延遲檢測工具測試Linux系統實時性的方法。Cyclictest是rt-tests測試套件下的一個測試工具,也是rt-tests下使用最廣泛的測試工具,一般主要用來測試內核的延遲,從而判斷內核的實時性。
Cyclictest常用于實時系統的基準測試,是評估實時系統相對性能的最常用工具之一。Cyclictest反復測量并精確統計線程的實際喚醒時間,以提供有關系統的延遲信息。它可測量由硬件、固件和操作系統引起的實時系統的延遲。
為了測量延遲,Cyclictest運行一個非實時主線程(調度類SCHED_OTHER),該線程以定義的實時優先級(調度類SCHED_FIFO)啟動定義數量的測量線程。測量線程周期性地被一個到期的計時器(循環報警)所定義的間隔喚醒,隨后計算有效喚醒時間,并通過共享內存將其傳遞給主線程。主線程統計延遲值并打印最小、最大和平均延遲時間。
參考鏈接:https://wiki.linuxfoundation.org/realtime/documentation/howto/tools/cyclictest/start?s[]=cyclictest。
Linux-RT性能測試
本次測試分別在CPU空載、滿負荷(運行stress壓力測試工具)、隔離CPU核心的情況下,對比評估Linux-RT內核的系統實時性。
CPU空載狀態
評估板上電啟動,進入評估板文件系統執行如下命令,修改內核printk日志等級,避免內核打印信息影響實時測試。
Target# echo 1 > /proc/sys/kernel/printk
調整內存分配策略為“2”,禁用內存過度使用。避免出現OOM(Out-of-Memory) Killer攻擊某些進程而產生延遲,影響測試結果。
備注:執行如下命令將會改變內存分配方式,若使用DDR容量為1GByte的評估板,請勿執行該命令。
Target# echo 2 > /proc/sys/vm/overcommit_memory
圖 3
執行如下命令,基于CPU空載狀況下測試系統的實時性。測試指令需運行12小時,請保持評估板長時間穩定工作,測試完成后將生成統計結果no_load_output文件。
Target# cyclictest -m -Sp99 -i1000 -h800 -D12h -q>no_load_output
圖 4
參數解析:
-m:鎖定當前和將來的內存分配;
-S:采用標準SMP測試;
-p:設置線程優先級;
-i:設置線程的基本間隔;
-h:運行后將延遲直方圖轉儲至標準輸出,亦可指定要跟蹤的最大延時時間(以微秒為單位);
-D:指定測試運行時長,附加m(分鐘)、h(小時)、d(天)指定;
-q:運行時不打印相關信息。
CPU滿負荷狀態
評估板上電啟動,進入評估板文件系統執行如下命令,修改內核printk日志等級,避免內核打印信息影響實時測試。
Target# echo 1 > /proc/sys/kernel/printk
調整內存分配策略為“2”,禁用內存過度使用。避免出現OOM(Out-of-Memory) Killer攻擊某些進程而產生延遲,影響測試結果。
備注:執行如下命令將會改變內存分配方式,若使用DDR容量為1GByte的評估板,請勿執行該命令。
Target# echo 2 > /proc/sys/vm/overcommit_memory
圖 5
執行如下命令,運行stress壓力測試工具,使得CPU處于滿負荷狀態。再使用Cyclictest工具測試CPU滿負荷狀態下的系統實時性能。測試指令需運行12小時,請保持評估板長時間穩定工作,測試完成后將生成統計結果overload_output文件。
Target# stress-ng --cpu 4--cpu-method=all --io 4--vm 4 --vm-bytes 64M --timeout 43200s &
Target# cyclictest -m -Sp99 -i1000 -h800 -D12h -q > overload_output
圖 6
參數解析:
--cpu:指定壓力測試的進程個數;
--cpu-method:指定CPU壓力測試的方式;
--io:指定I/O測試的進程個數;
--vm:指定內存測試的進程個數;
--vm-bytes:指定每個內存測試進程中分配內存的大?。?/p>
--timeout:指定測試時長。
隔離CPU核心狀態
本次測試以隔離CPU3核心為例,通過降低系統上所運行的其他進程對隔離CPU3產生的延遲影響,確保CPU3進程的正常運行,進而評估Linux-RT內核的系統實時性。
將評估板斷電,長按"Ctrl + C"按鍵并啟動評估板,進入U-Boot命令行模式后松開按鍵,執行如下命令,修改環境變量,隔離CPU3核心。
備注:如從eMMC啟動,請將命令中的"sd"修改為"emmc"。
U-Boot# setenv bootargs storagemedia=sd androidboot.storagemedia=sd androidboot.mode=normal isolcpus=3
U-Boot# saveenv
U-Boot# reset
圖 7
評估板重啟后,執行如下命令,查看環境變量。
Target# cat /proc/cmdline
圖 8
進入評估板文件系統,執行如下命令,修改內核printk日志等級,避免內核打印信息影響實時測試。
Target# echo 1 > /proc/sys/kernel/printk
調整內存分配策略為“2”,禁用內存過度使用。避免出現OOM(Out-of-Memory) Killer攻擊某些進程而產生延遲,影響測試結果。
備注:執行如下命令將會改變內存分配方式,若使用DDR容量為1GByte的評估板,請勿執行該命令。
Target# echo 2 > /proc/sys/vm/overcommit_memory
圖 9
執行如下命令,運行stress壓力測試工具,使得CPU處于滿負荷狀態。再使用taskset工具將Cyclictest測試程序運行在CPU3核心,測試CPU3核心滿負荷狀態下的系統實時性能。測試指令需運行12小時,請保持評估板長時間穩定工作,測試完成后將生成統計結果iso_overload_output文件。
Target# stress-ng --cpu 4--cpu-method=all --io 4--vm 4 --vm-bytes 64M --timeout 43200s &
Target# taskset -c 0-3 cyclictest -m -Sp99 -i1000 -h800 -D12h -q > iso_overload_output
圖 10
統計結果分析
我司已提供腳本文件get_histogram.sh用于繪制統計結果直方圖,位于產品資料“4-軟件資料Demort-linux-demoscyclictestbin”目錄下,請將該腳本文件拷貝至Ubuntu工作目錄下。
圖 11
在Ubuntu系統執行如下命令,安裝gnuplot工具。
Host# sudo apt-get -yinstall gnuplot
圖 12
CPU空載狀態
請將CPU空載狀態下的統計結果no_load_output文件拷貝至Windows工作目錄,使用Windows文本工具打開該文件并拖動至文件末尾,可查看Linux系統每個核心(CPU0~CPU3)的最小延遲(MinLatencies)、平均延遲(AvgLatencies)、最大延遲(MaxLatencies)統計結果。
圖 13
請將CPU空載狀態下的統計結果no_load_output文件拷貝至Ubuntu,存放在get_histogram.sh同一目錄下。執行如下命令修改文件名為"output"。
Host# cp no_load_outputoutput
圖 14
執行如下命令生成直方圖文件plot.png,請將其拷貝至Windows下并打開。
Host# ./get_histogram.sh
圖 15
圖 16
根據測試結果output文件數據以及結合直方圖,可得主要數據如下表。本次測試中,CPU0核心Max Latencies值最大,為119us,CPU1核心的Max Latencies值最小,為42us。
備注:測試數據與實際測試環境有關,僅供參考。
CPU滿負荷狀態
參考如上方法,分析CPU滿負荷狀態下的統計結果如下所示。本次測試中,CPU0核心Max Latencies值最大,為215us,CPU1核心的Max Latencies值最小,為141us。
圖 17
隔離CPU核心狀態
參考如上方法,分析隔離CPU核心狀態下的統計結果如下所示。本次測試中,CPU1核心Max Latencies值最大,為232us,隔離CPU3核心的Max Latencies值最小,為33us。
圖 18
根據CPU滿負荷、隔離CPU核心狀態的測試結果可知:當程序指定至隔離的CPU3核心上運行時,Linux系統延遲最低,可有效提高系統實時性。故推薦對實時性要求較高的程序(功能)指定至隔離的CPU核心運行。
rt_gpio_ctrl案例
案例說明
通過創建一個基本的實時線程,在線程內觸發LED的電平翻轉,同時程序統計實時線程的調度延時,并通過示波器測出LED電平兩次翻轉的時間間隔。由于程序默認以最高優先級運行,為避免CPU資源被程序完全占用導致系統被掛起,因此在程序中增加100us的延時。程序原理大致如下:
在Linux-RT內核上創建、使用實時線程。
實時線程中,計算出觸發LED電平翻轉的系統調度延時。
案例測試
本小節測試以隔離CPU3核心為例,通過降低系統上所運行的其他進程對隔離CPU3產生的延遲影響,確保CPU3進程的正常運行,進而評估Linux-RT內核的系統實時性。
將評估板斷電,長按"Ctrl + C"按鍵并啟動評估板,進入U-Boot命令行模式后松開按鍵,執行如下命令,修改環境變量,隔離CPU3核心。
備注:如從eMMC啟動,請將命令中的"sd"修改為"emmc"。
U-Boot# setenv bootargs "storagemedia=sdandroidboot.storagemedia=sdandroidboot.mode=normal isolcpus=3"
U-Boot# saveenv
U-Boot# reset
圖 19
圖 20
將案例bin目錄下的可執行文件拷貝至評估板文件系統,并執行如下命令運行測試程序,再按"Ctrl + C"退出測試,串口終端將打印程序統計的延遲數據,如下圖所示。
Target# sysctl kernel.sched_rt_runtime_us=-1
Target# taskset -c 3 ./rt_gpio_ctrl100
圖 21
同時使用示波器捕捉LED兩次電平翻轉之間的間隔,即可得到線程調度的延遲,測試點為R50電阻一端。
圖 22
本次測得電平翻轉周期為?x=113us,如下圖所示。由于程序中增加了100us的時間延時,因此實際延時應為:113us -100us = 13us,與程序統計打印的Latency results平均值13us相近。
圖 23
案例編譯
將產品資料“4-軟件資料Demort-linux-demosrt_gpio_ctrlsrc”案例源碼拷貝至Ubuntu。進入案例源碼目錄,執行如下命令,編譯案例生成可執行文件。
Host# source /home/tronlong/RK3562/rk3562-buildroot-2021.11-sdk-v1.0/buildroot/output/rockchip_rk3562/host/environment-setup
Host# make
圖 24
關鍵代碼說明
創建實時任務,具體操作包括內存鎖定、線程堆棧內存設置、調度策略和優先級配置等。
圖 25
在線程中打開LED文件節點,并對LED狀態進行翻轉。
圖 26
統計調度時間延時情況。
圖 27
?由于篇幅過長等原因,部分內容均不逐一展示,如需獲取完整版詳細資料,請關注創龍科技微信公眾號或官網,或者評論區留言,感謝您的支持!
審核編輯 黃宇
-
Linux
+關注
關注
87文章
11509瀏覽量
213671 -
開發板
+關注
關注
25文章
5669瀏覽量
104497
發布評論請先 登錄
評論