?作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力
什么是PaddleOCR?PaddleOCR是一個(gè)基于飛槳(PaddlePaddle)深度學(xué)習(xí)框架開發(fā)的開源多語(yǔ)言O(shè)CR工具包。在GitHub上與其它OCR開源工具包相比,PaddleOCR在五年發(fā)展時(shí)間內(nèi),擁有最多的星標(biāo)(46k)、最快的星標(biāo)增速、最多的貢獻(xiàn)者(234)和最活躍的社區(qū)支持。
近期,DeepSeek-R1的橫空出世,無(wú)疑在AI領(lǐng)域掀起了一場(chǎng)震撼全球的風(fēng)暴。而在這股中國(guó)AI力量震撼全球的浪潮中,PaddleOCR也在OCR領(lǐng)域默默耕耘,用自身的實(shí)力證明著中國(guó)AI的力量。它不僅在中文識(shí)別上表現(xiàn)出色,更在多語(yǔ)言支持、方向識(shí)別等方面展現(xiàn)了強(qiáng)大的功能。本文將深度分析PaddleOCR憑什么在OCR領(lǐng)域脫引而出,深受開發(fā)者喜愛。
一,工具包能力比較
比較項(xiàng) | PaddleOCR | EasyOCR | MMOCR | Tesseract |
所屬機(jī)構(gòu)/公司 | Baidu | Jaided AI | OpenMMLab | |
框架 | PaddlePaddle | PyTorch | PyTorch | C++ |
文本檢測(cè) | 支持 | 支持 | 支持 | 支持 |
文本識(shí)別 | 支持 | 支持 | 支持 | 支持 |
版面分析 | 支持 | 不支持 | 支持 | 不支持 |
手寫字符識(shí)別 | 支持 | 支持 | 支持 | 不支持 |
語(yǔ)言支持 | 80+種語(yǔ)言 | 80+種語(yǔ)言 | 60+種語(yǔ)言 | 100+種語(yǔ)言 |
國(guó)產(chǎn)化硬件支持 | PaddleOCR在支持國(guó)產(chǎn)硬件:昆侖芯、寒武紀(jì)、昇騰上訓(xùn)練模型 |
二,PP-OCRv4模型的精度和速度
PP-OCRv4是PaddleOCR中當(dāng)前支持的最新通用OCR模型。它在PP-OCRv3的基礎(chǔ)上進(jìn)一步升級(jí)。整體的框架圖保持了與PP-OCRv3相同的pipeline,針對(duì)檢測(cè)模型和識(shí)別模型進(jìn)行了數(shù)據(jù)、網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練策略等多個(gè)模塊的優(yōu)化。
PP-OCRv4系統(tǒng)框圖如下所示:
在 Intel?Xeon?6148 CPU上(推理引擎使用OpenVINOTM)的實(shí)測(cè)數(shù)據(jù)如下:
模型 | Hmean | 模型大小(M) | 推理時(shí)間(ms) |
PP-OCRv3 | 57.99% | 15.6 | 78 |
PP-OCRv4 | 62.24% | 15.8 | 76 |
三,PaddleOCR的易用性
PaddleOCR使用非常方便,提供零代碼和低代碼兩種使用方式。
1,零代碼評(píng)估和訓(xùn)練工具:
PaddleOCR提供零代碼評(píng)估工具,只需上傳圖片,便能體驗(yàn)?zāi)P托阅堋?/p>
PaddleOCR評(píng)估鏈接:
https://aistudio.baidu.com/community/app/91660/webUI。
還提供零代碼訓(xùn)練工具,只需上傳標(biāo)注數(shù)據(jù)集,即可啟動(dòng)模型訓(xùn)練。
PaddleOCR零代碼訓(xùn)練工具:
https://aistudio.baidu.com/pipeline/mine
2,低代碼評(píng)估和訓(xùn)練工具:
安裝好PaddleX后,只需三行代碼即可完成PaddleOCR模型的評(píng)估:
詳情參見:
https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html
克隆PaddleOCR代碼倉(cāng)到本地后,一條命令啟動(dòng)訓(xùn)練:
python3 tools/train.py -c configs/det/det_mv3_db.yml
詳情參見:
https://paddlepaddle.github.io/PaddleOCR/latest/ppocr/model_train/training.html
六,最后的話
PaddleOCR模型能力強(qiáng),精度和速度俱佳,支持國(guó)產(chǎn)硬件,滿足多場(chǎng)景需求,在復(fù)雜場(chǎng)景下優(yōu)勢(shì)顯著。另外,PaddleOCR還易學(xué)易用,由此深受廣大開發(fā)者的喜愛!
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!
?審核編輯 黃宇
-
OCR
+關(guān)注
關(guān)注
0文章
156瀏覽量
16698 -
OpenVINO
+關(guān)注
關(guān)注
0文章
113瀏覽量
410
發(fā)布評(píng)論請(qǐng)先 登錄
3大優(yōu)勢(shì),讓鋰電池外殼氣密性檢測(cè)儀脫穎而出

使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

阿里最新消息:國(guó)家超算互聯(lián)網(wǎng)平臺(tái)、廣州算力中心、多所高校接入通義千問大模型
超過150萬(wàn)個(gè)大模型,DeepSeek全球最受歡迎

三星ALoP榮獲CES 2025創(chuàng)新獎(jiǎng)
連續(xù)五屆!華秋電子再次榮獲2024千峰獎(jiǎng)——年度產(chǎn)業(yè)互聯(lián)網(wǎng)百?gòu)?qiáng)!

喜報(bào)!全國(guó)首批!賽思成功獲選國(guó)家級(jí)專精特新重點(diǎn)“小巨人”企業(yè)!

阿里通義千問代碼模型全系列開源
國(guó)產(chǎn)MCU廠商,靠什么從內(nèi)卷中脫穎而出?

AI耳機(jī)成卷王新賽道,聲智何以脫穎而出?
三星貼片電容CL10B104KA85PN 0603/100nF/25Vdc/X7R --芯引力產(chǎn)品中心
NAS設(shè)備鐵威馬F4-424是如何從市場(chǎng)中脫穎而出的
運(yùn)動(dòng)相機(jī)為什么會(huì)脫穎而出

評(píng)論