在前些天的2021世界人工智能大會上,上海合合信息科技股份有限公司帶來的智能文字識別技術吸引了眾多關注。合合信息將形象豐富的甲骨文進行排列組合后,再將其復刻在龜甲上,組合成了一個個網絡熱詞,如“單身狗”、“白富美”、“買它買它”等依次被識別出來。令人忍俊不禁的同時,也讓大家看到了合合信息在智能文字識別領域的研究成果——能“讀懂”甲骨文的智能文字識別技術,成為全場最受關注的 “黑科技”產品之一。
甲骨文出土于商代,因刻寫在龜甲和獸骨上而出名,是我國已發現的古代文字中時代最早、體系較為完整的文字,也是世界四大古文字之一。但因年代久遠,多數甲骨殘缺嚴重,素材獲取困難,拓片清晰度較低等問題,給甲骨文的識別帶來了困難。而以圖片形式出現在出版物上的甲骨文,也給文字檢索帶來了難題。
隨著數字化、智能化時代的到來,伴隨著人工智能的引進,甲骨文學者有了新的幫手——智能識別技術,能實現甲骨文的自動識別、撮合,既有效提高了甲骨文識別的質量,也提高了甲骨文識別工作的效率。
據了解,本次大會上合合信息展示的智能文字識別技術主要有三個核心技術層,首先是智能圖像處理技術,能對用戶拍攝的復雜文檔圖像進行預處理,有效提升了文檔圖像質量;其次是基于深度學習的復雜場景文字識別技術,能應對各種復雜場景下文字識別,主要是利用合合信息自主研發的手寫印刷混排識別、防強干擾識別、扭曲文字和復雜印章識別等一系列的先進深度學習識別技術;最后是自然語言處理技術,可對識別出來的文字進行下一步的文意解讀和語義理解。
合合信息的智能文字識別技術的落地場景是考古工作者及博物館工作者,將甲片信息錄入到電子信息中,依靠該智能轉換識別技術能提升他們信息采集及錄入等相關工作的效率。從長遠來看,合合信息希望對甲骨文的閱讀、對研究古文的文學價值、歷史價值及書法價值,做出貢獻和幫助。
除了甲骨文外,合合信息還展示了該技術能識別50多種不同國家的一些語言,包含不同的文字大小和樣式,達到了秒級識別的水平。未來,合合信息將繼續探索文字識別領域,致力將其廣泛應用于各種實際場景。
fqj
-
智能化
+關注
關注
15文章
5109瀏覽量
57034 -
數字化
+關注
關注
8文章
9373瀏覽量
63189
發布評論請先 登錄


差示掃描量熱儀:探索物質熱行為的精密儀器

LMS Test.Lab:振動噪聲測試領域的全能王者
應急啟動:超級電容應用的新領域

光庭信息在科技創新領域榮獲兩項殊榮
識別QR Code和PDF417的條碼掃描模組

評論