【導讀】平常為大家推薦的資源中,以英語語言占據大多數。今天 特別要為大家推薦兩個跟中文相關的資源工具。先簡單介紹下這兩個資源工具都是什么。第一個,漢字轉拼音的工具——即將中文字符轉換成它的拼音。除了支持 JavaScript,還可以支持 Python、Go、Rust 等多種語言??梢哉f是非常 nice 的一個中文資源工具了。第二個是新華字典的 API,收錄包括 14032 條歇后語,16142 個漢字,264434 個詞語,31648 個成語。有需要的同學可以收藏留著用,覺得不錯記得分享點贊。
漢字轉拼音工具
▌功能
將中文字符轉換為拼音??捎糜跐h字注音、排序、檢索任務。
▌特性
根據詞組智能匹配最正確的拼音。
支持多音字。
簡單的繁體支持, 注音支持。
支持多種不同拼音/注音風格。
▌支持版本
1.Node.js/JavaScript 版
注:這個版本同時支持在 Node 和 Web 瀏覽器環境運行;
作者:hotoo;來源:GitHub
https://github.com/hotoo/pinyin
2.Python 版
作者:mozillazg;來源:GitHub
https://github.com/mozillazg/python-pinyin
3.Go 版
作者:mozillazg;來源:GitHub
https://github.com/mozillazg/go-pinyin
4.Rust 版
作者:mozillazg;來源:GitHub
https://github.com/mozillazg/rust-pinyin
▌一些注意事項
1.為什么沒有 y, w, yu 幾個聲母?
1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]
因為根據《漢語拼音方案》, y,w,ü (yu) 都不是聲母。
聲母風格(INITIALS)下,“雨”、“我”、“圓”等漢字返回空字符串,因為根據《漢語拼音方案》, y,w,ü (yu) 都不是聲母,在某些特定韻母無聲母時,才加上 y 或 w,而 ü 也有其特定規則。 —— @hotoo
如果你覺得這個給你帶來了麻煩,那么也請小心一些無聲母的漢字(如“啊”、“餓”、“按”、“昂”等)。 這時候你也許需要的是首字母風格(FIRST_LETTER)。 —— @hotoo
參考:
hotoo/pinyin#57,#22,#27,#44
如果覺得這個行為不是你想要的,就是想把 y 當成聲母的話,可以指定strict=False, 這個可能會符合你的預期,詳見strict 參數的影響
1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]4>>>pinyin('下雨天',style=Style.INITIALS,strict=False)5[['x'],['y'],['t']]
2.拼音數據
單個漢字的拼音使用pinyin-data的數據
詞組的拼音使用phrase-pinyin-data的數據
3.node 版和 web 版有什么異同?
pinyin目前可以同時運行在 Node 服務器端和 Web 瀏覽器端。 API 和使用方式完成一致。但 Web 版較 Node 版稍簡單,拼音庫只有常用字部分,沒有使用分詞算法, 并且考慮了網絡傳輸對詞庫進行了壓縮處理。
由于分詞和繁體中文的特性,部分情況下的結果也不盡相同。由于這些區別,測試不同運行環境的用例也不盡相同。
更多詳細安裝與使用教程可訪問 GitHub 鏈接進行訪問~
各版本 GitHub 地址:
https://github.com/hotoo/pinyin
https://github.com/mozillazg/python-pinyin
https://github.com/mozillazg/go-pinyin
https://github.com/mozillazg/rust-pinyin
新華字典 API
▌介紹
作者本來的目的是想可以實現成語接龍,苦于沒有現成可用的數據庫,自己就從各個網站抓取整理了一份。所有的數據都作者從網上找的。放在 Github 是為了方便自己的使用,同時也能方便有類似需求的人不用去做這些 trival 的工作。所有抓取數據的腳本都在倉庫里。
中華新華字典數據庫和 API 。收錄包括 14032 條歇后語,16142 個漢字,264434 個詞語,31648 個成語。所有的數據放在 data/ 目錄。
▌數據庫與 API 介紹
1.成語(idiom.json)
2.詞語(ci.json)
3.漢字(word.json)
4.歇后語(xiehouyu.json)
-
網絡傳輸
+關注
關注
0文章
143瀏覽量
17902 -
python
+關注
關注
56文章
4825瀏覽量
86213
原文標題:漢語轉拼音工具、新華字典API——兩個支持Python的中文資源
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
控件中出現的中文如何變為英文?例如visa資源名稱下拉里的刷新兩個字,去掉也行。
有什么方法能夠在lineout跟headphone兩個輸出通道實現不同信號的輸出?
最全面的PCB設計工具資源匯總
合并兩個排序的鏈表
一個電路有兩個電源如何分析

評論