女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OCR識別技術

新機器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀

在爬蟲對驗證碼進行破解時,經常需要對圖片中的文字內容進行識別,這時就需要用到OCR技術了,那么 OCR識別技術是如何實現對文字內容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學字符識別技術,實質屬于計算機輸入技術。OCR通過利用光學技術與計算機技術對圖片、紙張、物體等處的文本內容進行分析識別,并讀取轉換成計算機和人類都能理解接受的格式。

OCR主要可以分為手寫體識別和印刷體識別。

由于印刷體都是計算機自助生成再進行輸出,通常較為規律,因此較手寫體識別來說要更簡單。而手寫體由于往往會帶有個人特色,每個人的風格不盡相同,由于其千人千面的特性,手寫體識別也成了OCR界一直想攻克的難關。當然,除了手寫體與印刷體外,OCR也可以根據識別內容來分類。例如按語言分類,要識別的內容將可能包括漢語、英語、日語、法語等,而如果僅滿足國人需求,要識別的內容就可能會包括漢字、英文字母、阿拉伯數字、標點符號等。

通常根據要識別的內容不同,識別的難度也不同。比如僅識別阿拉伯數字,只需能識別出0-9,而英文字母則需要識別52個字符(僅考慮大小寫),而中文識別則會高達數千個,且由于漢字的結構偏旁較為復雜,要將這些字符都準確識別出來會使難度系數直線上升。一個典型的OCR技術處理流程如下圖所示:

圖:來源于網絡

其中,圖像預處理通常為能使圖像中的文字更明顯便于識別,會對圖像的成像問題進行修正,通常是基于數字圖像處理和傳統機器學習等方法對圖像進行操作。

常見的圖像預處理包括幾何變換(透視、翻轉、旋轉、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強、光線矯正、灰度化、二值化等。其中,在對付驗證碼時常用的灰度化、二值化處理對于內容較為簡單的文本信息有增強作用,但對復雜背景的內容處理效果就會收效甚微。

文字檢測,顧名思義是對圖片中存在的文字內容進行檢測,檢測內容包括文本所在的位置、范圍、布局、數量等,通常也包括整體版面分析和文字行檢測等。部分OCR軟件為了保證檢測范圍的準確性,還會套用圖像檢測的方法,對圖像中的文本區域進行框選,并像下圖所示將框選與待識別區域交由令用戶進行校驗確認。

圖:某OCR軟件識別界面

文本檢測完成后,建立在其基礎之上的文本識別將會對選定的文本內容進行識別,并將圖像中的字符轉化為可供人類和計算機識別的文本信息。文本信息主要需要解決的問題是每個字符是什么。

對于識別后輸出的文本通常需要再次核對驗證以確保其準確率,即文本校正,通常也被認為屬于文字檢測的環節。當識別的內容是由詞庫中的詞匯構成時就稱之為有詞典識別,反之則稱為無詞典識別。在整個處理流程過程中,對識別準確率影響最大的步驟就是文本檢測與文本識別。相比一般文本,通常對OCR技術的評測會從最終識別率、識別速度、版面理解正確率、版面還原滿意度4方面來作為依據。

OCR識別技術對于手寫體識別目前尚在發展階段,而對于印刷體識別的技術已經發展的較為純熟。而且,對于印刷體識別的應用劃分可能遠比你我想象的更為細致。例如用于對人身份進行核查驗證的證件OCR識別、用于移動支付綁卡的銀行卡OCR識別、用于存儲管理名片的名片OCR識別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識別、用于銀行、金融、電信機構的票據OCR識別、用于交通安全的車輛OCR識別等。

OCR技術的出現無疑提升了工作效率,也改變了我們的生活。

參考文獻:

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • OCR
    OCR
    +關注

    關注

    0

    文章

    156

    瀏覽量

    16703

原文標題:文字識別界的“拍立得”——OCR識別技術

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr
    發表于 05-28 06:46

    rfid技術是如何應用在集裝箱自動識別的呢?

    在現代集裝箱物流管理中,快速、準確地識別集裝箱號碼是提升港口、堆場和海關運作效率的關鍵。隨著技術的發展,RFID(射頻識別技術OCR視覺
    的頭像 發表于 04-18 10:13 ?157次閱讀
    rfid<b class='flag-5'>技術</b>是如何應用在集裝箱自動<b class='flag-5'>識別</b>的呢?

    大模型預標注和自動化標注在OCR標注場景的應用

    OCR,即光學字符識別,簡單來說就是利用光學設備去捕獲圖像并識別文字,最終將圖片中的文字轉換為可編輯和可搜索的文本。在數字化時代,OCR(光學字符
    的頭像 發表于 04-15 15:18 ?245次閱讀

    手持終端集裝箱識別系統的圖像識別技術

    在港口、碼頭、物流園區等場景中,集裝箱的高效管理一直是行業智能化升級的核心需求。基于先進的OCR(光學字符識別)與AI技術,手持終端集裝箱識別系統實現了從大型設備到移動終端的全場景箱號
    的頭像 發表于 04-03 10:49 ?227次閱讀

    阿普奇視覺控制器AK7在OCR識別場景中的應用

    在實際工業生產中,OCR(光學字符識別技術的應用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領域幫助企業完成產品編碼、生產日期、批號等字符信息自動識別,對于避免因出現瑕疵、錯漏
    的頭像 發表于 03-20 11:44 ?159次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>場景中的應用

    漢王科技CES展示創新技術,共觸未來智能交互

    獨特的磁容觸控技術,為用戶帶來了更加流暢、精準的交互體驗。同時,漢王科技還推出了Penstar海外電紙本品牌,展示了其在電子紙技術領域的最新成果。 此外,漢王科技還帶來了數字簽批、手寫&OCR
    的頭像 發表于 01-08 15:08 ?553次閱讀

    ElfBoard開源項目|車牌識別項目技術文檔

    車牌識別項目基于百度智能云平臺,旨在利用其強大的OCR服務實現車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩定的服務質量,能夠幫助開發者快速實現車牌識別應用。這個開源
    的頭像 發表于 12-06 10:30 ?556次閱讀
    ElfBoard開源項目|車牌<b class='flag-5'>識別</b>項目<b class='flag-5'>技術</b>文檔

    明治案例 | 【OCR識別+條碼讀取】一步到位,印刷品質的智能守護者

    在某大型印刷企業的生產線上,印刷機需要完成大量的條碼印刷任務。為了確保條碼的準確性和可讀性,需要在設備上安裝傳感器進行條碼印刷的讀碼和OCR識別檢測。1、傳感器需要準確識別條碼中的信息,并將其與預設
    的頭像 發表于 10-22 08:02 ?656次閱讀
    明治案例 | 【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>+條碼讀取】一步到位,印刷品質的智能守護者

    光學字符識別是什么的一種技術

    光學字符識別(Optical Character Recognition,簡稱OCR)是一種將文本資料轉換為計算機可編輯和可搜索的數據格式的技術。這項技術廣泛應用于文檔掃描、數據錄入、
    的頭像 發表于 09-10 15:48 ?963次閱讀

    光學識別技術的工作原理是什么?

    光學識別技術(Optical Character Recognition,簡稱OCR)是一種將圖像中的文字信息轉換成可編輯和可搜索的文本數據的技術。它廣泛應用于文檔掃描、數據錄入、自動
    的頭像 發表于 09-10 15:46 ?1243次閱讀

    光學識別字符是自動識別技術

    光學識別字符(Optical Character Recognition,簡稱OCR)是一種自動識別技術,它能夠將各種類型文檔(如掃描的紙質文檔、PDF文件或數字相機拍攝的圖片)中的文
    的頭像 發表于 09-10 15:43 ?764次閱讀

    光學識別輸入的基本原理是什么

    光學字符識別(Optical Character Recognition,OCR)是一種將不同格式的文檔(如掃描的紙張文檔、PDF文件或數字相機拍攝的圖片)轉換成可編輯和可搜索的數據的技術O
    的頭像 發表于 09-10 15:34 ?1156次閱讀

    明治案例 | PE編織袋【大視野】【OCR識別

    OCR識別技術OCR識別技術在工業生產中扮演著至關重要的角色。它利用先進的圖像處理
    的頭像 發表于 08-13 08:25 ?697次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】

    智能手機充電頭OCR精準識別

    文本是人類最重要的信息來源之一,自然場景中充滿了形形色色的文字符號。光學字符識別(OCR)相信大家都不陌生。而工業場景的圖像文字識別更加復雜,OCR出現在很多不同的場合,對某些特殊的表
    的頭像 發表于 06-11 08:24 ?729次閱讀
    智能手機充電頭<b class='flag-5'>OCR</b>精準<b class='flag-5'>識別</b>