女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

嵌入式Linux入門級板卡的神經網絡框架ncnn移植與測試-米爾i.MX6UL開發板

米爾電子 ? 2023-02-21 10:12 ? 次閱讀

本篇測評由電子發燒友的優秀測評者“ALSET”提供。

c757321e-b186-11ed-ad0d-dac502259ad0.gif電子發燒友網發布了一款試用產品:米爾 MYD-Y6ULX-V2 開發板,基于 NXP i.MX6UL/i.MX6UL L處理器,該開發板被米爾稱之為經典王牌產品。本次測試目標是在此開發板上進行神經網絡框架ncnn的移植與測試開發,測試ncnn在此開發板上的性能與應用測試。c765827e-b186-11ed-ad0d-dac502259ad0.png

01.

什么是ncnn

ncnn 是騰訊優圖推出的在手機端極致優化的高性能神經網絡前向計算框架。也能夠在移動設備上的高性能神經網絡前向計算框架。ncnn 從設計之初深刻考慮移動端的部署和使用。無第三方依賴,跨平臺,其中手機端 cpu的速度快于目前所有已知的開源框架。基于ncnn,能夠將深度學習算法輕松移植到手機端和移動設備上高效執行,開發人工智能應用。以騰訊內部應用為例,ncnn目前已在QQ,Qzone,微信,天天P圖等上得到應用。ncnn支持大部分常用的CNN 網絡:Classical CNN: VGG AlexNetGoogleNet Inception …Practical CNN: ResNetDenseNet SENet FPN …Light-weight CNN:SqueezeNet MobileNetV1/V2/V3 ShuffleNetV1/V2 MNasNet …Detection: MTCNNfacedetection …Detection: VGG-SSDMobileNet-SSD SqueezeNet-SSD MobileNetV2-SSDLite …Detection: Faster-RCNNR-FCN …Detection: YOLOV2 YOLOV3MobileNet-YOLOV3 …Segmentation: FCN PSPNetUNet …騰訊優圖實驗室是主要研究計算機視覺技術,ncnn的許多應用方向也都在圖像方面,如人像自動美顏,照片風格化,超分辨率,物體識別。騰訊優圖ncnn提供的資料顯示:對比目前已知的同類框架,ncnn是cpu框架中最快的,安裝包體積最小,跨平臺兼容性中也是最好的。以蘋果主推的CoreML為例,CoreML是蘋果主推的 iOS gpu計算框架,速度非常快,但僅支持 iOS11以上的 iphone手機受眾太狹窄。非開源也導致開發者無法自主擴展功能。

02.

ncnn功能簡介

ncnn支持卷積神經網絡,支持多輸入和多分支結構,可計算部分分支無任何第三方庫依賴,不依賴 BLAS/NNPACK 等計算框架純 C++ 實現,跨平臺,支持 android ios 等ARM NEON 匯編級良心優化,計算速度極快精細的內存管理和數據結構設計,內存占用極低支持多核并行計算加速,ARM big.LITTLE cpu 調度優化。支持基于全新低消耗的 vulkan api GPU 加速整體庫體積小于 700K,并可輕松精簡到小于 300K可擴展的模型設計,支持 8bit 量化和半精度浮點存儲,可導入 caffe/pytorch/mxnet/onnx 模型支持直接內存零拷貝引用加載網絡模型可注冊自定義層實現并擴展。ncnn與同類框架對比c7912a6e-b186-11ed-ad0d-dac502259ad0.png

03.

在i.MX6ull上移植編譯ncnn

工程地址:
githubhttps://github.com/Tencent/ncnn 從工程的readme文件看,該工程已經支持很多嵌入式CPU的架構,其中就有arm 32位版本。c7c1c1d8-b186-11ed-ad0d-dac502259ad0.png既然支持arm32位,那么ixm6ull處理器也應該支持,即著手編譯MYD-Y6ULX-V2開發板上的版本。1.從github 上拉取ncnn源碼在主機上執行命令:Sudo git clonehttps://github.com/Tencent/ncnn.gitc7d3e822-b186-11ed-ad0d-dac502259ad0.png可見是一個 cmake工程,那么嘗試cmake 編譯。2.初次使用camke編譯先進入ixml6ull的SDK下,切換到交叉編譯環境,然后創建 build 目錄,進入build目錄下,執行cmake命令cmake ../從輸出信息上看 cmake失敗,查看cmake 日志,發現錯誤原因是cmake在生成開發板的makefile文件時,需要指定使用的編譯工具鏈。3.添加imx6ull開發板的編譯配置根據腳本的過程,在toolchains目錄下,有很多其它開發板的編譯配置文件,參照其它開發板的配置文件,添加一個該開發板的配置文件。文件名:arm-poky-linux-gnueabi.cmake內容如下:

set(CMAKE_SYSTEM_NAME Linux)set(CMAKE_SYSTEM_PROCESSOR arm)set(CMAKE_C_COMPILER "arm-poky-linux-gnueabi-gcc")set(CMAKE_CXX_COMPILER "arm-poky-linux-gnueabi-g++")set(CMAKE_FIND_ROOT_PATH_MODE_PROGRAM NEVER)set(CMAKE_FIND_ROOT_PATH_MODE_LIBRARY ONLY)set(CMAKE_FIND_ROOT_PATH_MODE_INCLUDE ONLY)
set(CMAKE_C_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")
set(CMAKE_CXX_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")
# cache flagsset(CMAKE_C_FLAGS "${CMAKE_C_FLAGS}" CACHE STRING "c flags")set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS}" CACHE STRING "c++ flags")

c7fc735a-b186-11ed-ad0d-dac502259ad0.png
4.再使用cmake生成編譯文件添加完該開發板的編譯工具鏈后,就可以使用cmake來生成編譯所需的makefile文件了。在cmake時,可以指定除了編譯ncnn庫外,還可以編譯ncnn例子程序。命令如下:cmake-DCMAKE_BUILD_TYPE=Release -DNCNN_SIMPLEOCV=ON-DCMAKE_TOOLCHAIN_FILE=../toolchains/arm-poky-linux-gnueabi.cmake-DNCNN_BUILD_EXAMPLES=ON ..c81e8f26-b186-11ed-ad0d-dac502259ad0.png查看目錄下,已經順利地生成了 Makefile文件。5.使用make編譯文件然后可以正式編譯ncnn庫和測試樣例程序了。直接執行make –j4就開始愉快地編譯了。c83ee064-b186-11ed-ad0d-dac502259ad0.pngc85e6ae2-b186-11ed-ad0d-dac502259ad0.png編譯libncnn庫文件成功,會繼續自動編譯 examples 下的例子文件。c88b5c1e-b186-11ed-ad0d-dac502259ad0.png大約10多分鐘,順利地全部編譯完成。在編譯測試用例時,會出現庫格式錯誤的提示,此時需要設置一下交叉編譯環境下的庫歸檔工具,系統默認使用的是arm-poky-linux-gnueabi-ar 工具,這個工具產生的 .a文件有問題,經過測試使用 arm-poky-linux-gnueabi-gcc-ar 即可。只需要在執行切換交叉環境腳本后,再單獨執行一下以下命令即可修改該問題:export ar=arm-poky-linux-gnueabi-gcc-ar再進行編譯即可。6.查看編譯結果編譯完成后,在build目錄下,可以看到 benchmark 目錄,該目錄下就是ncnn的基準測試工具,可以看到目標板執行文件已經編譯出來。c8aa8652-b186-11ed-ad0d-dac502259ad0.png再進入到 build/example 下,可以看到所有例程也編譯出來了。c8c2f8ea-b186-11ed-ad0d-dac502259ad0.png

04.

板上運行測試ncnn

編譯完成把可執行文件與模型文件復制到開發板里進行測試。
把 build/benchmark 下的benchmark 復制到開發板/home/root/ncnn 目錄下,同時把工程根目錄下的benchmark 目錄下所有文件也復制到開發板 /home/root/ncnn目錄下,
c8efc924-b186-11ed-ad0d-dac502259ad0.png然后就可以執行 benchmark 執行文件來測試開發板的人工神經網絡的計算能力。
先把開發環境下目標文件系統arm目錄下/usr/lib下的libgomp.so.1文件復制到開發板的/usr/lib下,這個文件是并行計算庫,ncnn編譯時用到了這個庫,這個庫在多核處理器上能夠支持執行并行計算。然后再在本開發板執行benchmark,執行輸出結果如下圖:
c90ae51a-b186-11ed-ad0d-dac502259ad0.png可見大部分的模型能夠跑通了,有部分模型運行出現異常。
從拋出的分值可以評估該開發板的神經網絡推理計算能力了。
這個分值是一個模型推理一次的耗時,所以數值越小意味著算力越強。考慮到這個開發板是一個arm v7入門級的開發板,這樣的性能已經超乎預料了。


05.

測試基于ncnn的應用

這里在MYD-Y6ULX-V2開發板上測試ncnn的應用例子,這里就用ncnn下的例程來做測試,在上面編譯完example后,在build目錄下會產生example的目標板的可執行文件。編譯出來的例子程序如下,把他們全部傳到開發板上。
c918ca40-b186-11ed-ad0d-dac502259ad0.png需要注意的是,除了ncnn的應用執行文件,在這些例子執行的時候,還需要模型和測試的資源文件,而這些文件體積都比較大,因此不能傳送到開發板的系統目錄上,需要單獨存在擴展的存儲空間上。
經過觀察板上的文件系統,發現有3.1G的空間沒有使用,此時可以使用fdisk 來格式化該空間,格式化成 ext4 格式,重啟板子后,就可以看到這部分空間了,然后把ncnn的所有測試執行文件和資源文件傳到該目錄下,這樣就夠用了。
c9429f1e-b186-11ed-ad0d-dac502259ad0.png在板上執行各個測試例子,會提示缺少相關模型文件和參數文件,這些模型和參數文件在這個github上面,下載相應的文件到當前目錄下就可以。
https://github.com/nihui/ncnn-assets/tree/master/models
c95590ba-b186-11ed-ad0d-dac502259ad0.png1. 測試圖片分類器
準備被測試圖片,test,jpg ,傳到上ncnn當前目錄下
c970385c-b186-11ed-ad0d-dac502259ad0.png并且下載好 squeezenet_v1.1.param和 squeezenet_v1.1.bin 文件到 ncnn當前目錄下,然后執行一下命令:
./squeezenet./test.jpg
很快就輸出識別結果,輸出結果如下圖
c9c20696-b186-11ed-ad0d-dac502259ad0.png輸出結果前面的編號和分類號,具體可以參考:
mageNet20121000分類名稱和編號
https://zhuanlan.zhihu.com/p/315368462
但不知本測試模型所用分類的版本是否和這個一致。
2測試圖片內容多目標識別
測試圖片內容識別,先用上面的圖,再使用 squeezenetssd 來執行。執行前先下載 squeezenet_ssd_voc.bin和 squeezenet_ssd_voc.param 到板上ncnn當前目錄下,然后執行:
./squeezenetssd./test.jpg
大約3秒左右輸出結果如圖:
c9d05980-b186-11ed-ad0d-dac502259ad0.png輸出的分類編號,可見代碼的定義:
c9e73056-b186-11ed-ad0d-dac502259ad0.png同時輸出了識別結果圖:
c9f82136-b186-11ed-ad0d-dac502259ad0.png再測試另外一張圖;
ca66c578-b186-11ed-ad0d-dac502259ad0.png執行結果如下:
ca9ee89a-b186-11ed-ad0d-dac502259ad0.png輸出識別結果圖:
cab3bd42-b186-11ed-ad0d-dac502259ad0.png上面的識別,因為輸出的第二個目標被第三個目標遮蓋,第二個識別為“Dog”,所以識別準確度還是比較高的。
再測試了一張圖:
輸出:
caec920c-b186-11ed-ad0d-dac502259ad0.pngcb05c2e0-b186-11ed-ad0d-dac502259ad0.png識別效果也比較理想。

06.

ncnn移植測試總結

經過在MYD-Y6ULX-V2開發板上,進行這次的ncnn移植測試,總體非常順利,在移植中只需要針對開發板的編譯器,修改添加相應的編譯腳本即可順利的編譯ncnn庫和所有例程。并不需要對代碼做任何改動或者調整,因此過程很快,短暫的時間就可以完成ncnn這樣一個神經網絡框架在本開發板上運行起來。
對ncnn的benchmark的性能測試來看,因為本開發板僅為arm v7單核處理器,處于入門級的一款開發板,能跑出這樣的成績已經出乎意料。
在對實際圖像分類和圖像內容識別測試中,其中圖像分類僅百十毫秒就出結果,對多目標識別單張圖在2秒左右,這對一些靜態的環境下已經能夠達到業務使用的需求了,再綜合其硬件性能,可見效能比是非常高的。同時工程里還帶有一些各種其它框架模型轉化ncnn的工具,方便將其它模型轉化到ncnn上來使用,非常方便。
同時也測試出ncnn的良好的可移植性和對不同嵌入式硬件的支持較好,其它任何一個神經網絡框架恐怕無法在這樣一個系統上運行,因此也為這樣一個有效的國產開源神經網絡項目點贊。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5141

    文章

    19526

    瀏覽量

    314885
  • Linux
    +關注

    關注

    87

    文章

    11457

    瀏覽量

    212772
  • 開發板
    +關注

    關注

    25

    文章

    5503

    瀏覽量

    102216
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    米爾NXP i.MX 91核心發布,助力新一代入門級Linux應用開發

    積累,賦能新一代入門級嵌入式Linux應用。提供1GB LPDDR4 8GB eMMC 的核心開發板,核心
    發表于 05-30 11:20

    NXP系列-米爾 i.MX91核心開發板,新一代入門級Linux應用

    NXP i.MX91賦能新一代入門級Linux應用, 低成本、低功耗NXP i.MX91處理器:內核Cortex-A55,主頻1.4 GHz;支持新的LPDDR4內存,確保平臺使用壽命
    發表于 05-29 16:35 ?0次下載

    新品!米爾NXP i.MX 91核心,賦能新一代入門級Linux應用

    推出的米爾基于?NXPi.MX91核心開發板?(MYC-LMX91),延續了米爾嵌入式模組
    的頭像 發表于 05-29 08:01 ?1235次閱讀
    新品!<b class='flag-5'>米爾</b>NXP <b class='flag-5'>i.MX</b> 91核心<b class='flag-5'>板</b>,賦能新一代<b class='flag-5'>入門級</b><b class='flag-5'>Linux</b>應用

    NXP i.MX 91開發板#支持快速創建基于Linux?的邊緣器件

    NXP Semiconductors FRDM i.MX 91開發板設計用于評估i.MX 91應用處理器,支持快速創建基于Linux ^?^ 的邊緣器件。該
    的頭像 發表于 05-19 10:55 ?429次閱讀
    NXP <b class='flag-5'>i.MX</b> 91<b class='flag-5'>開發板</b>#支持快速創建基于<b class='flag-5'>Linux</b>?的邊緣器件

    基于RV1126開發板移植NCNN部署庫方法

    移動端優化的開源神經網絡推斷庫。能實現無第三方依賴,跨平臺操作,在手機端CPU運算速度在開源框架中處于領先水平。基于該平臺,開發者能夠輕松將深度學習算法移植到手機端,輸出高效的執行,進
    的頭像 發表于 04-16 15:24 ?160次閱讀
    基于RV1126<b class='flag-5'>開發板</b><b class='flag-5'>移植</b><b class='flag-5'>NCNN</b>部署庫方法

    NXP入門級Linux應用開發板,FRDM i.MX 91詳解

    FRDM平臺新品發布 FRDM i.MX 91開發板是一款低成本、體積小巧的開發板,集成了恩智浦i.MX 91應用處理器和IW610 Wi-Fi 6
    的頭像 發表于 03-14 09:43 ?843次閱讀
    NXP<b class='flag-5'>入門級</b><b class='flag-5'>Linux</b>應用<b class='flag-5'>開發板</b>,FRDM <b class='flag-5'>i.MX</b> 91詳解

    恩智浦推出FRDM i.MX 93開發板

    備受嵌入式開發者青睞的恩智浦FRDM開發平臺,迎來了一位新成員——FRDM i.MX 93開發板,這也是第一塊配備i.MX MPU的FRDM
    的頭像 發表于 02-21 14:22 ?1055次閱讀

    3.1s啟動!飛凌嵌入式i.MX93開發板部署LVGL,打造更高效的GUI

    近期,飛凌嵌入式為基于NXP i.MX93系列處理器打造的OK-MX9352-C開發板成功移植了LVGL v8.3,不僅界面美觀精致,啟動速
    的頭像 發表于 01-16 11:52 ?614次閱讀
    3.1s啟動!飛凌<b class='flag-5'>嵌入式</b><b class='flag-5'>i.MX</b>93<b class='flag-5'>開發板</b>部署LVGL,打造更高效的GUI

    【迅為電子】i.MX6ULi.MX6ULL芯片區別與開發板對比

    【迅為電子】i.MX6ULi.MX6ULL芯片區別與開發板對比
    的頭像 發表于 11-28 14:31 ?1212次閱讀
    【迅為電子】<b class='flag-5'>i.MX6UL</b>和<b class='flag-5'>i.MX6</b>ULL芯片區別與<b class='flag-5'>開發板</b>對比

    【北京迅為】i.mx8mm嵌入式linux開發指南第四篇 嵌入式Linux系統移植篇第六十九章uboot移植

    【北京迅為】i.mx8mm嵌入式linux開發指南第四篇 嵌入式Linux系統
    的頭像 發表于 10-22 14:46 ?1075次閱讀
    【北京迅為】<b class='flag-5'>i.mx</b>8mm<b class='flag-5'>嵌入式</b><b class='flag-5'>linux</b><b class='flag-5'>開發</b>指南第四篇 <b class='flag-5'>嵌入式</b><b class='flag-5'>Linux</b>系統<b class='flag-5'>移植</b>篇第六十九章uboot<b class='flag-5'>移植</b>

    i.MX Linux開發實戰指南—基于野火i.MX系列開發板

    電子發燒友網站提供《i.MX Linux開發實戰指南—基于野火i.MX系列開發板.pdf》資料免費下載
    發表于 10-10 17:23 ?12次下載

    【飛凌嵌入式OK3576-C開發板體驗】RKNN神經網絡-車牌識別

    LPRNet基于深層神經網絡設計,通過輕量級的卷積神經網絡實現車牌識別。它采用端到端的訓練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設計提高了識別的實時性和準確性
    發表于 10-10 16:40

    【飛凌嵌入式OK3576-C開發板體驗】開箱報告

    (12Gbps)和擴展PCIe NVMe/SATA SSD固態硬盤,提供高效的數據存儲和讀取能力,滿足工控設備對大容量存儲的需求。 1.3、工業屬性 穩定性:核心通過了飛凌嵌入式實驗室嚴苛的工業環境
    發表于 10-10 09:22

    嵌入式linux開發板怎么操作

    嵌入式Linux開發板是一種基于Linux操作系統的嵌入式系統開發平臺。它通常包括一個處理器、內
    的頭像 發表于 09-02 09:09 ?688次閱讀

    嵌入式linux開發板芯片的工作原理

    嵌入式Linux開發板是一種基于Linux操作系統的嵌入式系統開發平臺,它廣泛應用于工業控制、智
    的頭像 發表于 09-02 09:07 ?714次閱讀