女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RV1126 開發OCR文字識別算法組件

ljx2016 ? 來源:ljx2016 ? 作者:ljx2016 ? 2025-04-16 09:11 ? 次閱讀

1. OCR文字識別簡介

文字識別也是圖像領域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進行文字的識別。所以一般包含兩個步驟:

文字檢測:解決的問題是哪里有文字,文字的范圍有多少。

文字識別:對定位好的文字區域進行識別,主要解決的問題是每個文字是什么,將圖像中的文字區域進轉化為字符信息。

我們的OCR算法是基于CTPN+CRNN設計的。CTPN是一種文字檢測算法,能有效的檢測出復雜場景的橫向分布的文字,是目前比較好的文字檢測算法。CRNN算法主要用于端到端地對不定長的文本序列進行識別,不用先對單個文字進行切割,而是將文本識別轉化為時序依賴的序列學習問題,就是基于圖像的序列識別。

基于EASY-EAI-Nano硬件主板的運行效率:

算法種類 模型大小 運行效率
文字檢測算法 2.79MB 227ms
文字識別算法 4.56MB 89ms

2. 快速上手

2.1 開發環境準備

如果您初次閱讀此文檔,請閱讀《入門指南/開發環境準備/Easy-Eai編譯環境準備與更新》,并按照其相關的操作,進行編譯環境的部署。

在PC端Ubuntu系統中執行run腳本,進入EASY-EAI編譯環境,具體如下所示。

cd ~/develop_environment ./run.sh

wKgZO2f_BEyAOsEAAACbrHAYX20186.png

2.2 源碼下載以及例程編譯

在EASY-EAI編譯環境下創建存放源碼倉庫的管理目錄:

cd /opt mkdir EASY-EAI-Toolkit cd EASY-EAI-Toolkit

通過git工具,在管理目錄內克隆遠程倉庫

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-C-Demo.git

wKgZPGf_BE2AHbU7AADL06HcVzc386.png

注:

* 此處可能會因網絡原因造成卡頓,請耐心等待。

* 如果實在要在gitHub網頁上下載,也要把整個倉庫下載下來,不能單獨下載本實例對應的目錄。

進入到對應的例程目錄執行編譯操作,具體命令如下所示:

cd EASY-EAI-Toolkit-C-Demo/algorithm-ocr/ ./build.sh

注:

* 若build.sh腳本帶有cpres參數,則會把Release/目錄下的所有資源都拷貝到開發板上。

* 若build.sh腳本不帶任何參數,則僅會拷貝demo編譯出來的可執行文件。

* 由于依賴庫部署在板卡上,因此交叉編譯過程中必須保持adb連接。

wKgZO2f_BE2ABJMwAAGE7T_LyXI914.png

2.3 模型部署

要完成算法Demo的執行,需要先下載算法模型。

百度網盤鏈接為:https://pan.baidu.com/s/1w4tf1YolUCpcAFtyP3aJZQ (提取碼:6666 )。

wKgZPGf_BE2AW-E3AAASX4aXfzE122.png

同時需要把下載的OCR識別算法模型復制粘貼到Release/目錄:

wKgZO2f_BE2AS6QJAABsoqMXJ3w667.png

再通過下方命令將模型署到板卡中,如下所示。

cp Release/ /mnt/userdata/ -rf

2.4 例程運行

通過按鍵Ctrl+Shift+T創建一個新窗口,執行adb shell命令,進入板卡運行環境。

adb shell

wKgZPGf_BE6ABm0gAABc3DEXVxM480.png

進入板卡后,定位到例程上傳的位置,如下所示:

cd /userdata/Release/

運行例程命令如下所示:

./test-ocr test.jpg

2.5 運行效果

test-ocr的Demo執行效果如下所示:

wKgZO2f_BE6AALDhAAG-6Ctw4HY520.png

再開一個窗口,在PC端Ubuntu環境通過以下命令可以把圖片拉回來:

adb pull /userdata/Demo/result.jpg .

結果圖片如下所示:

wKgZPGf_BE6AVpjNAAEj4BcK8uY110.jpg

API的詳細說明,以及API的調用(本例程源碼),詳細信息見下方說明。

3. OCR文字識別API說明

3.1 引用方式

為方便客戶在本地工程中直接調用我們的EASY EAI api庫,此處列出工程中需要鏈接的庫以及頭文件等,方便用戶直接添加。

選項 描述
頭文件目錄 easyeai-api/algorithm_api/ocr
庫文件目錄 easyeai-api/algorithm_api/ocr
庫鏈接參數 -lpthread -locr -lrknn_api

3.2 OCR檢測初始化函數

設置OCR檢測初始化函數原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數名: ocr_det_init
頭文件 ocr.h
輸入參數
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.3 OCR檢測運行函數

設置OCR檢測運行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具體介紹如下所示。

函數名: ocr_det_run
頭文件 ocr.h
輸入參數
app_ctx:算法模型句柄
input_image:Cv::Mat輸入圖像
Params:ocr檢測算法參數
out_result:返回結果
返回值
成功返回:0
失敗返回:-1
注意事項

3.4 OCR檢測釋放函數

設置OCR檢測釋放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數名: ocr_det_release
頭文件 ocr.h
輸入參數 app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.5 OCR識別初始化函數

OCR識別初始化函數原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數名: ocr_rec_init
頭文件 ocr.h
輸入參數
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值
成功返回:0
失敗返回:-1
注意事項

3.6 OCR識別運行函數

OCR識別運行函數原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具體介紹如下所示。

函數名: ocr_rec_run
頭文件 ocr.h
輸入參數
app_ctx:算法模型句柄
input_image:輸入圖像
out_result:返回結果
返回值
成功返回:0
失敗返回:-1
注意事項

3.7 OCR識別釋放函數

OCR識別釋放函數原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數名: ocr_rec_release
頭文件 ocr.h
輸入參數 app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

4. OCR識別算法例程

例程目錄為Toolkit-C-Demo/ocr/test-ocr.cpp,操作流程如下。

wKgZO2f_BE6AR-wwAABFnLXCW4I978.png

參考例程如下所示。

#include #include #include #include"ocr.h" using namespace cv; using namespace std; #define INDENT " " #define THRESHOLD 0.3 // pixel score threshold #define BOX_THRESHOLD 0.9 // box score threshold #define USE_DILATION false // whether to do dilation, true or false #define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type int main(int argc, char **argv) { if (argc != 2) { printf("%s n", argv[0]); return -1; } /* 參數初始化 */ const char *img_path = argv[1]; Mat input_image, rgb_img; input_image = imread(img_path); if (input_image.empty()) { cout

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4698

    瀏覽量

    94720
  • 文字識別
    +關注

    關注

    0

    文章

    18

    瀏覽量

    8773
  • OCR
    OCR
    +關注

    關注

    0

    文章

    157

    瀏覽量

    16704
  • rv1126
    +關注

    關注

    0

    文章

    106

    瀏覽量

    3345
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于RV1126開發板實現人臉檢測方案

    RV1126開發板上實現人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設計邏輯流程圖,方案代碼分為分為兩個業務流程,主體代碼負責抓取、合成圖像, 算法代碼負責人臉檢測功能。
    的頭像 發表于 04-21 17:59 ?322次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現人臉檢測方案

    基于RV1126開發板實現二維碼識別方案

    RV1126開發板上實現方案設計邏輯流程圖,方案代碼分為兩個業務流程,主體代碼負責抓取、合成圖像,算法代碼負責二維碼識別功能。
    的頭像 發表于 04-21 14:25 ?54次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現二維碼<b class='flag-5'>識別</b>方案

    基于RV1126開發板實現人臉識別方案

    RV1126上實現人臉識別:在圖像中找出人臉,并與數據庫進行比對,得出該人臉對應的身份信息。 方案設計邏輯流程圖,方案代碼分為分為三個業務流程,主體代碼負責抓取、合成圖像,算法代碼負責人臉
    的頭像 發表于 04-21 13:51 ?11次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發板實現人臉識別方案

    RV1126開發板上實現人臉識別:在圖像中找出人臉,并與數據庫進行比對,得出該人臉對應的身份信息。 方案設計邏輯流程圖,方案代碼分為分為三個業務流程,主體代碼負責抓取、合成圖像,
    的頭像 發表于 04-21 10:24 ?107次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發板實現駕駛員行為檢測方案

    RV1126開發板上實現駕駛員行為檢測:通過圖像識別出這幾種行為:打電話、抽煙、疲勞駕駛。
    的頭像 發表于 04-18 17:47 ?354次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現駕駛員行為檢測方案

    基于RV1126開發板實現人臉識別方案

    RV1126開發板實現人臉識別:在圖像中找出人臉,并與數據庫進行比對,得出該人臉對應的身份信息。 方案設計邏輯流程圖,方案代碼分為分為三個業務流程,主體代碼負責抓取、合成圖像,
    的頭像 發表于 04-18 16:55 ?83次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發板的resnet50訓練部署教程

    本教程基于圖像分類算法ResNet50的訓練和部署到EASY-EAI-Nano(RV1126)進行說明
    的頭像 發表于 04-18 15:07 ?314次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板的resnet50訓練部署教程

    基于RV1126開發板的按鍵測試方法與例程

    RV1126開發板的按鍵測試方法與例程詳細描述
    的頭像 發表于 04-15 17:03 ?262次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板的按鍵測試方法與例程

    基于RV1126開發板的人員檢測算法開發

    RV1126開發人員檢測AI算法組件
    的頭像 發表于 04-14 13:56 ?242次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板的人員檢測<b class='flag-5'>算法</b><b class='flag-5'>開發</b>

    基于RV1126開發板的人臉檢測算法開發

    RV1126開發人臉檢測算法組件
    的頭像 發表于 04-14 10:19 ?229次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板的人臉檢測<b class='flag-5'>算法</b><b class='flag-5'>開發</b>

    RV1126 實現人臉檢測方案

    基于RV1126開發板實現人臉檢測方案,充分體現了電子方面的實踐經驗和目標檢測技術。
    的頭像 發表于 04-14 09:25 ?180次閱讀
    <b class='flag-5'>RV1126</b> 實現人臉檢測方案

    基于RV1126開發板實現二維碼識別方案

    RV1126上實現二維碼識別方案
    的頭像 發表于 04-11 14:48 ?188次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發</b>板實現二維碼<b class='flag-5'>識別</b>方案

    RV1126 實現人臉識別門禁系統解決方案

    RV1126實現人臉識別門禁系統解決方案
    的頭像 發表于 04-10 15:17 ?307次閱讀
    <b class='flag-5'>RV1126</b> 實現人臉<b class='flag-5'>識別</b>門禁系統解決方案

    RV1126 實現簡單的UI開發示例

    RV1126上實現簡單的UI開發實例
    的頭像 發表于 04-09 16:08 ?281次閱讀
    <b class='flag-5'>RV1126</b> 實現簡單的UI<b class='flag-5'>開發</b>示例

    RV1126核心特性概述

    RV1126是一款集高性能與低功耗于一體的智能處理器,專為滿足現代嵌入式設備和應用場景的需求而設計。其主要特性如下: 一、強大的處理器架構 RV1126搭載了四核ARM Cortex-A7處理器
    的頭像 發表于 02-08 16:56 ?1390次閱讀