OCR 智能體應用背景
企業在日常運營中面臨合同、票據、手寫筆記等多種文檔的處理需求,這些文檔常以圖片或掃描件形式存在,文字提取困難,嚴重制約數字化管理效率。
為解決上述問題,本文介紹一套簡單高效的解決方案:通過 dify 工作流快速搭建 OCR 智能體,進行文字識別。
先來看一下搭建好的工作流使用流程:用戶上傳待識別的圖片或文檔,工作流會調用本地部署的 OCR 服務完成識別工作,并將提取的內容轉換成 Markdown 文檔。
OCR 智能體搭建流程
step1:本地部署 dify
因為我們要通過工作流的方式使用 OCR 服務,因此需要現在本地完成 dify 的部署,部署流程相對簡單,直接參考 dify 官方文檔(https://github.com/langgenius/dify)即可,推薦使用 docker 進行部署。
step2:在 dify 插件市場中,安裝澎峰科技“OCR 識別服務”插件
本文中介紹的 OCR 工具,我們已發布到 dify 的插件市場,源代碼可在 github 項目主頁(https://github.com/PerfXLab/dify-plugin-ocr-service)找到,要在 dify 中使用該工具,只需在插件市場中搜索“OCR”并安裝該插件即可:
step3:在 dify 中搭建工作流,并引入 OCR 工具
1.在 dify 中“創建空白應用”,選擇“工作流”
2.對工作流進行編排:
開始節點中加入“file”字段
“OCR 轉 Markdown 工具”節點中填入相關信息
其中,“上傳文件”中填入“開始”節點輸出的內容,OCR 接口地址填入本地搭建的 OCR 服務,OCR 服務本地搭建將在下一步驟中介紹- “結束”節點中填入上一節點輸出的文件
step4:在本地搭建 OCR 服務
目前 OCR 任務主流實現方案有兩種:使用傳統卷積神經網絡模型或多模態大模型進行處理,前者識別速度快、消耗資源少,而后者識別精度和魯棒性更好,但對算力要求較高。本文介紹一種基于卷積神經網絡的方案,利用第三方工具快速在本地運行。
搭建流程:
1.安裝第三方OCR服務:pip install marker-pdf[full]
2.安裝API服務:pip install -U uvicorn fastapi python-multipart
3.啟動OCR服務:marker_server --host 0.0.0.0 --port 8001
完成上述操作后,即可使用 dify 工作流進行 OCR 識別服務。
私有化部署方案:澎峰科技大模型一體機
前述方案采用的輕量化模型,優勢在于資源消耗低,在 CPU 環境下即可流暢運行。然而,對于金融、法律等領域中,部分文檔的識別精準度和版面還原度有更高要求的場景,采用多模態大模型進行處理會是更優選擇。多模態大模型雖然能帶來更高的識別精度與魯棒性,但其對算力資源的要求也相應更高。
為滿足企業對高性能、數據私有化的需求,澎峰科技推出DeepFusion 系列 AI 一體機,為企業智能化轉型提供一站式本地化部署解決方案。
該方案深度融合了業界領先的 DeepSeek、Qwen 等系列大模型,確保企業數據在本地處理,安全無虞,完美適配復雜的辦公自動化、數據分析與智能客服等場景。
旗艦性能,應對復雜需求:目前已發布的 DeepFusion DF110、DF210 一體機,支持部署 DeepSeek 滿血版、Qwen3-235B 等尖端大模型,推理性能強勁,能夠從容應對最復雜的辦公需求。
高性價比,賦能中小企業:我們深知,高效的AI應用同樣可以在中小規模模型上實現。為此,澎峰科技推出了 DeepFusion DF50 一體機。該機型針對 30B 及以下規模的高效模型進行了深度推理優化,實現了卓越性能與高性價比的平衡,旨在助力更多中小企業輕松實現 AI 轉型。
-
智能體
+關注
關注
1文章
288瀏覽量
11021 -
OCR
+關注
關注
0文章
161瀏覽量
16754 -
澎峰科技
+關注
關注
0文章
71瀏覽量
3366
原文標題:使用澎峰科技OCR識別服務插件,在dify中搭建OCR智能體
文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Dify攜手亞馬遜云科技加速全球企業生成式AI應用規模化落地
OCR識別訓練完成后給的是空壓縮包,為什么?

手把手教你Coze智能體搭建,讓智能設備秒變天氣預報小助手

阿普奇視覺控制器AK7在OCR識別場景中的應用

瀾舟智搭:企業級智能Agent搭建平臺
請問如何在量產中對智能DAC或AFE的NVM進行編程?
利用OpenVINO搭建本地智能體流水線
如何搭建智能制造工廠
明治案例 | PE編織袋【大視野】【OCR識別】

在Dify中使用PerfXCloud大模型推理服務

評論