資料介紹
摘 要
本論文詳細介紹了一款低成本便攜式的OCR文字識別 ,TTS語音播報系統(tǒng)的實現(xiàn)方案。本次研發(fā)的盲人導(dǎo)讀儀系統(tǒng),核心的軟硬模塊子子系統(tǒng)包括:500萬高清攝像頭JPEG圖像采集子系統(tǒng),大功率NRF2401圖像傳輸子系統(tǒng),MFC上位機圖像解碼子系統(tǒng),OCR模式識別子系統(tǒng), TTS文本語音子系統(tǒng)。本文將對設(shè)計的各個子系統(tǒng)詳細闡述。
關(guān)鍵詞:模式識別OCR; TTS語音播報系統(tǒng); OV5640五百萬像素采集系統(tǒng);
OCR blind reading meter based on template matching
This paper introduces in detail a low-cost portable OCR character recognition, the implementation scheme of TTS speech broadcasting system. The research and development of the blind reading meter system, the core of hard and soft module a subsystem including: 5 million hd camera JPEG image acquisition subsystem, high-power NRF2401 image transmission subsystem, MFC PC image decoding subsystem, OCR pattern recognition subsystem, TTS text-to-speech subsystem. This article will be to the design of each subsystem in detail
Key words: OCR pattern recognition; TTS speech broadcasting system; OV5640 mega pixels acquisition system。
1緒論
書籍是人類進步的階梯,視覺障礙的弱勢群體如果想要閱讀一些文獻資料,傳統(tǒng)的方法要依賴盲文,憑借手觸覺去感知文字,由于盲文的發(fā)行量相對較少,加上他笨重,體積大,致使收到很大限制。隨著計算機的領(lǐng)域的飛速發(fā)展,OCR (Optical Character Recognition,光學(xué)字符識別) ,TTS(Text To Speech,從文本到語音),OV5640(高清攝像頭)日益成熟,這些新興技術(shù),將為視覺殘障人士帶來福音,將視覺文字變成聽覺語音,自此弱勢的殘障人士可以打破視覺閱讀障礙,享受文本書籍的知識殿堂。
1.1課題的背景與意義
我國的印刷體漢字識別是從70年代開始研究,大致可以分為如下3個階段:
第一階段:20世紀70年代末期到20時期,主要是算法和方案探索。
第二階段:20世紀90年代,中文OCR技術(shù)從實驗室走向市場。
第三階段:21世紀初至今,主要是印刷體漢字識別技術(shù)和系統(tǒng)性能的提高,包括漢英混排識別率的提高和穩(wěn)健性的增強。
1.2 OCR的研究現(xiàn)狀及研究意義
現(xiàn)有的文字技術(shù)一般采用光學(xué)的方式將文本圖像信息采集到計算機中,因此該技術(shù)被稱為光學(xué)字符識別(Optical Character Recognition, OCR)技術(shù),經(jīng)過將近一個研究,OCR已經(jīng)成為現(xiàn)如今模式是被領(lǐng)域里最活躍的研究方向之一。它綜合了人工智能,計算機圖像,數(shù)字圖像處理等多方面的內(nèi)容,并在計算機領(lǐng)域及其相關(guān)領(lǐng)域得到了廣泛的應(yīng)用。近些年來,我國的中文印刷體文檔識別發(fā)展十分
隨著社會的發(fā)展,科學(xué)文化的進步,越來越多的視覺障礙人式(包括先天性行殘疾人士,或者因意外事故及其傷病視力下降乃至失去視覺的殘疾人士)更加渴望閱讀這個時代最前沿的書籍期刊,鑒于盲文的厚重,不便于攜帶,印刷量小,延遲性高等缺點,市場上主流的OCR識別器售價相對較高,一種低成本,高識別率的OCR盲人導(dǎo)讀儀的研發(fā)有相當(dāng)大的現(xiàn)實意義,其核心算法也有著極其廣泛的社會應(yīng)用:
1.使用OCR進行印刷體版文稿的自動識別錄入,這類產(chǎn)品的缺點是對于表格,插圖,公式需要手工進行干預(yù)。
2圖形,圖像,公式,文本,中英文交疊等混版復(fù)雜版面進行自動切分的印刷識別系統(tǒng)的算法研究提供解決思路。
3郵件自動分揀系統(tǒng),郵件的自動分揀系統(tǒng)東是郵政系統(tǒng)提高心寒分揀速度和質(zhì)量的極為有效手段之一國內(nèi)外已經(jīng)普遍使用,其核心算法是書寫體的識別。
4 手寫體表格數(shù)據(jù)自動錄入系統(tǒng),應(yīng)用于政府,保險,醫(yī)療等個行業(yè)的申報表,調(diào)查表等表格數(shù)據(jù)的處理與錄入【1】。 。
1.3研究的主要內(nèi)容和預(yù)期目標(biāo)
該系統(tǒng)致力于實現(xiàn)一種低成本,便攜式,易操作,高識別率的簡易OCR中文識別系統(tǒng)。根據(jù)基于模板匹配的OCR的自身特點,以及現(xiàn)階段研究水平,調(diào)研了中文OCR在各個行業(yè)的應(yīng)用市場,如下對基于模板匹配的盲人導(dǎo)讀儀的各個系統(tǒng)和實現(xiàn)原理及算法進行簡要講解。
1.3.1 核心子系統(tǒng)解決方案概述
1. 基于OV5640 500萬像素的自動對焦的高清攝像頭模組,實現(xiàn)JPEG,BMP高清圖像采集存儲。
2. 基于大功率NRF2401的無線傳圖子系統(tǒng),可以實現(xiàn)一點對多點,單點對單點實時圖像采集傳輸。
3基于VS2010 MFC上位機算法處理子系統(tǒng),SerialPort串口接收模塊,Cimage類進行數(shù)據(jù)流圖像解碼編碼,微軟公司開源MicroSoft Image documentOCR控件作為核心算法將采集解碼得到圖片文字解碼出來,顯示到Edit文本框,將文字編碼串口發(fā)送科科大訊飛模塊。
4基于科大訊飛模組XFS5512CE文字語音轉(zhuǎn)碼解碼芯片將OCR識別的文字進行語音播報,實現(xiàn)文本到語音的轉(zhuǎn)換。
1.3.2 預(yù)期目標(biāo)
1. STM32F103RBT6能正常驅(qū)動500萬OV5640高清模組,實現(xiàn)圖形采集
2. NRF2401能實現(xiàn)無線傳圖,文字解碼信息發(fā)送
3.MFC數(shù)據(jù)流解碼JPEG,OCR文字識別,OCR解碼發(fā)送
4.下位機驅(qū)動科大訊飛模塊,實現(xiàn)文字解碼發(fā)送。
2基于模板匹配中文OCR語音導(dǎo)讀儀工作原理
2.1 OCR工作原理
與普通印刷體文檔是被相比,中文印刷體文檔識別在對文檔所包含的文字字符識別過程中。一個完整的中文印刷體文檔識別系統(tǒng)應(yīng)包括如下諸多模塊:
文檔圖像預(yù)處理。該部分完成對原始文檔圖像預(yù)處理,使得原始文檔圖像能夠達到識別的要求。
文檔圖像版面分析,該部分實現(xiàn)文檔圖像中文本,表格和圖像等不同區(qū)域的分離,并在識別出每個區(qū)域的類別后交由不同的處理模塊進行進一步的分析和處理。
文檔圖像中的多字符識別,該部分處理通過文檔版面分析得到的文本區(qū)域,包括漢字識別和公式識別的模塊。漢字識別模塊負責(zé)包括中文字符在內(nèi)的所有字符的識別。
文檔圖像中圖形圖像暫存模塊。該部分負責(zé)處理通過文檔版面分析得帶的圖像圖像區(qū)域。
版面分析過程中,分析得到的文字區(qū)域,圖像區(qū)域和表格區(qū)域?qū)⒈环謩e切割成單獨的圖像,其中文字圖像區(qū)域?qū)⑺椭劣∷Ⅲw漢字識別模塊進行處理。與其他的數(shù)字圖像模式識別應(yīng)用類似,印刷體的漢字識別的基本過程包括圖像預(yù)處理。圖像分割,圖像分割,特征提取,圖像分類等過程。圖像的預(yù)處理通過圖像增強,文字字符切割等步驟形成單個漢字字符圖像,圖像分割則在單個漢字圖像中提起漢字輪廓,特征提取則是是依據(jù)漢字輪廓提取代表的各個漢字模式的本質(zhì)的表達形式,即各種特性,形成漢字模板庫(可以理解為字典)并存儲在計算機中。識別時,圖像分類過程將漢字的模式特性和漢字的模板庫元素逐一匹配,在用一定的匹配準則進行判別。最后在模板庫中找出最接近的位置漢字的模板元素,該模版元素的漢字就是識別的結(jié)果。
- OV5640資料包分享 42次下載
- ATK OV5640 AF V1.1圖下載 12次下載
- STM32驅(qū)動攝像頭ov5640的驅(qū)動源碼 9次下載
- 自動對焦攝像頭模塊OV5640原理圖 48次下載
- CMOS圖像傳感器OV5640用戶手冊.pdf 53次下載
- 基于stm32控制OV7670攝像頭 136次下載
- 基于D3 CAMERA MEZZ OV5640圖像傳感器的參考設(shè)計
- 機器視覺中基于灰度統(tǒng)計的快速模板匹配算法詳細概述 7次下載
- Leopard Imaging 10232017 LI-OV5640攝像頭圖解資料下載 31次下載
- OV5640_datasheet 90次下載
- 模板匹配 5次下載
- STM32工程模板 56次下載
- 基于模板匹配的圖像跟蹤技術(shù) 0次下載
- 基于模板匹配的電子元器件針腳檢測方法
- 基于改進模板匹配的芯片缺陷檢測方法
- OpenCV邊緣模板匹配算法原理詳解 1454次閱讀
- OCR實戰(zhàn)教程 1034次閱讀
- OpenMV如何實現(xiàn)旋轉(zhuǎn)模板匹配呢 1916次閱讀
- 3D模板匹配算法概述 1735次閱讀
- 如何通過OV5640攝像頭顯示在VGA顯示屏上 3363次閱讀
- 函數(shù)模板與類模板的基本概念及實現(xiàn)原理 1763次閱讀
- 基于HALCON的形狀匹配算法的研究和心得總結(jié) 4431次閱讀
- 微雪電子OV5640 攝像頭模塊B型簡介 3969次閱讀
- 微雪電子OV5640攝像頭模塊A型簡介 6370次閱讀
- 微雪電子OV5640 攝像頭模塊C型簡介 3159次閱讀
- 飛凌嵌入式500W攝像頭介紹 2512次閱讀
- 天嵌科技OV5640攝像頭模塊-CMOS攝像頭介紹 1.2w次閱讀
- 基于OmniVision的OV5640設(shè)計的USB攝像頭模塊 5834次閱讀
- ov7620怎么接線_ov7620硬件連接 9109次閱讀
- 一文看懂ov7620與ov7670的區(qū)別 5.1w次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 6次下載 | 免費
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計
- 0.60 MB | 3次下載 | 免費
- 5基于FPGA的光纖通信系統(tǒng)的設(shè)計與實現(xiàn)
- 0.61 MB | 2次下載 | 免費
- 651單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 751單片機大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費
- 8基于51單片機的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33564次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6653次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537796次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191185次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論