女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python pacp模塊:自動識別文字中的省市區(qū)并將其繪圖

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-06-27 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個用于提取簡體中文字符串中省,市和區(qū)并能夠進(jìn)行映射,檢驗和簡單繪圖的python模塊。

舉個例子:

["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)"]
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |地址                 |
|上海市|上海市|徐匯區(qū)|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區(qū)|萬安塘西工業(yè)區(qū)        |

注:“地址”列代表去除了省市區(qū)之后的具體地址

也可以將大段文本中所有提到的地址提取出來,并且自動將相鄰的存在所屬關(guān)系的地址歸并到一條記錄中(0.5.5版本新功能):

"分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)"
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |
|上海市|上海市|徐匯區(qū)|
|福建省|泉州市|洛江區(qū)|
|江蘇省|南京市|鼓樓區(qū)|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話,施舍個star,謝謝。

常見安裝問題:

在 windows 上可能會出現(xiàn)類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools, 安裝完成后,再重新使用 pip install cpca 安裝,即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform,該方法可以輸入任意的可迭代類型(如list,pandas的Series類型等),然后將其轉(zhuǎn)換為一個DataFrame,下面演示一個最為簡單的使用方法:

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結(jié)果為(adcode為官方地址編碼):

   省     市    區(qū)          地址              adcode
0 上海市 上海市  徐匯區(qū)     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區(qū)     萬安塘西工業(yè)區(qū)        350504
2 北京市 市轄區(qū)  朝陽區(qū)     北苑華貿(mào)城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區(qū)名的,可以添加一個pos_sensitive=True參數(shù):

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下:

     省    市    區(qū)        地址               adcode        省_pos  市_pos 區(qū)_pos
0  上海市  上海市  徐匯區(qū)  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區(qū)  萬安塘西工業(yè)區(qū)         350504     -1      0      3
2  北京市  市轄區(qū)  朝陽區(qū)  北苑華貿(mào)城            110105     -1     -1      0

從大段文本中提取多個地址(0.5.5版本新功能):

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
df

結(jié)果為(注意 transform_text_with_addrs 獲得的數(shù)據(jù),“地址”列都是空的):

    省     市     區(qū)    地址   adcode
0  上海市  市轄區(qū)  徐匯區(qū)       310104
1  福建省  泉州市  洛江區(qū)       350504
2  江蘇省  南京市  鼓樓區(qū)       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數(shù)

繪圖:

模塊中還自帶一些簡單繪圖工具,可以在地圖上將上面輸出的數(shù)據(jù)以熱力圖的形式畫出來.

這個工具依賴folium,為了減小本模塊的體積,所以并不會預(yù)裝這個依賴,在使用之前請使用pip install folium .

代碼如下:

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動識別
    +關(guān)注

    關(guān)注

    3

    文章

    227

    瀏覽量

    23381
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86729
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    手寫數(shù)字識別是一種經(jīng)典的模式識別和圖像處理問題,旨在通過計算機(jī)自動識別用戶手寫的數(shù)字。本文將教會你如何使用基于RV1106的LockAI視覺識別模塊
    的頭像 發(fā)表于 06-30 15:44 ?443次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b><b class='flag-5'>模塊</b>:手寫數(shù)字<b class='flag-5'>識別</b>

    揭秘單裝自動識別銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    單裝自動識別銘牌安裝于大型裝備的規(guī)定位置,采用射頻識別技術(shù),用于裝備的遠(yuǎn)距離自動識別。該設(shè)備的核心功能是依托RFID技術(shù),實現(xiàn)目標(biāo)個體身份及關(guān)鍵屬性數(shù)據(jù)的自動化、非接觸式采集與
    的頭像 發(fā)表于 06-25 15:55 ?159次閱讀
    揭秘單裝<b class='flag-5'>自動識別</b>銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    工信部電子信息司領(lǐng)導(dǎo)蒞臨行芯科技調(diào)研

    近日,工業(yè)和信息化部電子信息司王世江副司長一行到行芯科技進(jìn)行專題調(diào)研,省市區(qū)經(jīng)信部門相關(guān)負(fù)責(zé)人隨行陪同。
    的頭像 發(fā)表于 06-11 10:38 ?761次閱讀

    新大陸自動識別亮相印尼市場行業(yè)盛會

    這個5月,新大陸自動識別(Newland AIDC)攜手印尼合作伙伴,以一場硬核科技盛宴掀起東南亞智能浪潮!作為本次活動的金牌贊助商,新大陸自動識別全面展示了在智能數(shù)據(jù)采集方面的最新成果。來自制造、物流、汽車等多領(lǐng)域的行業(yè)決策者和技術(shù)專家齊聚,見證數(shù)據(jù)賦能的無限可能。
    的頭像 發(fā)表于 05-29 16:14 ?352次閱讀

    rfid技術(shù)是如何應(yīng)用在集裝箱自動識別的呢?

    在現(xiàn)代集裝箱物流管理,快速、準(zhǔn)確地識別集裝箱號碼是提升港口、堆場和海關(guān)運作效率的關(guān)鍵。隨著技術(shù)的發(fā)展,RFID(射頻識別)技術(shù)與OCR視覺識別相結(jié)合,為集裝箱
    的頭像 發(fā)表于 04-18 10:13 ?296次閱讀
    rfid技術(shù)是如何應(yīng)用在集裝箱<b class='flag-5'>自動識別</b>的呢?

    MS7026 新一代視頻解碼芯片

    MS7026 是一顆 NTSC、PAL,視頻解碼的產(chǎn)品。基于內(nèi)部的模式檢測模塊,對輸入信號進(jìn)行自動識別并將其轉(zhuǎn)換成數(shù)字 8-Bit ITU-RBT656 信號。MS7026 功能支持 3D 視頻解碼和隔行到逐行視頻的轉(zhuǎn)換。
    發(fā)表于 04-14 18:04

    垃圾短信?手機(jī)自動識別垃圾短信邏輯的分析

    作者:京東科技 賈玉龍 1 背景 隨著智能手機(jī)的普及和移動互聯(lián)網(wǎng)的發(fā)展,短信作為一種傳統(tǒng)的通訊方式,仍然保持著其獨特的地位。然而,隨著垃圾短信的泛濫,手機(jī)自動識別垃圾短信的技術(shù)也在不斷進(jìn)步。對于提供
    的頭像 發(fā)表于 12-16 10:19 ?976次閱讀

    Arduino采集雷達(dá)模塊數(shù)據(jù)與串口繪圖

    Arduino采集雷達(dá)模塊數(shù)據(jù)與串口繪圖
    的頭像 發(fā)表于 12-14 11:44 ?836次閱讀
    Arduino采集雷達(dá)<b class='flag-5'>模塊</b>數(shù)據(jù)與串口<b class='flag-5'>繪圖</b>

    客流統(tǒng)計自動識別攝像頭

    隨著城市化進(jìn)程的加快和商業(yè)活動的日益繁榮,客流統(tǒng)計成為了商家和城市管理者關(guān)注的重要指標(biāo)。為了更精準(zhǔn)地獲取客流數(shù)據(jù),客流統(tǒng)計自動識別攝像頭應(yīng)運而生,成為現(xiàn)代商業(yè)和公共管理不可或缺的工具。客流統(tǒng)計
    的頭像 發(fā)表于 12-10 15:32 ?635次閱讀
    客流統(tǒng)計<b class='flag-5'>自動識別</b>攝像頭

    中國物品編碼中心一行蒞臨新大陸自動識別參觀調(diào)研

    近日,中國物品編碼中心總工程師李建輝,中國物品編碼中心產(chǎn)品運營開發(fā)部副主任、中國自動識別技術(shù)協(xié)會秘書長方方等一行蒞臨新大陸自動識別公司參觀調(diào)研。福建省標(biāo)準(zhǔn)化研究院副院長林孟朝、福建省標(biāo)準(zhǔn)化研究院編碼應(yīng)用研究所所長周順驥陪同調(diào)研。新大陸
    的頭像 發(fā)表于 11-19 09:32 ?997次閱讀

    MCU串口自動識別波特率原理分析

    現(xiàn)在的單片機(jī)資源越來越豐富了,其中我們常用的串口也是內(nèi)部集成了多個,關(guān)鍵功能也越來越強(qiáng)了。 我們有些應(yīng)用可能會用到串口自動識別波特率,今天就來講講MCU串口自動識別波特率底層的常見的原理,以及MCU的案例。
    的頭像 發(fā)表于 10-23 16:12 ?1998次閱讀
    MCU串口<b class='flag-5'>自動識別</b>波特率原理分析

    智能化升級:機(jī)載無人機(jī)攝像頭如何自動識別目標(biāo)?

    機(jī)載無人機(jī)攝像頭在智能化升級的過程自動識別目標(biāo)的能力得到了顯著提升。這一過程涉及多個關(guān)鍵技術(shù)和算法,以下是關(guān)于機(jī)載無人機(jī)攝像頭如何自動識別目標(biāo)的詳細(xì)解析: 一、圖像采集與預(yù)處理 高清攝像頭
    的頭像 發(fā)表于 09-19 15:23 ?1665次閱讀
    智能化升級:機(jī)載無人機(jī)攝像頭如何<b class='flag-5'>自動識別</b>目標(biāo)?

    光學(xué)識別字符是自動識別技術(shù)嗎

    光學(xué)識別字符(Optical Character Recognition,簡稱OCR)是一種自動識別技術(shù),它能夠?qū)⒏鞣N類型文檔(如掃描的紙質(zhì)文檔、PDF文件或數(shù)字相機(jī)拍攝的圖片)文字
    的頭像 發(fā)表于 09-10 15:43 ?833次閱讀

    水位自動識別攝像機(jī)

    隨著科技的不斷發(fā)展,水位自動識別攝像機(jī)作為一種智能技術(shù)產(chǎn)品,正在逐漸應(yīng)用于各種領(lǐng)域,為監(jiān)測水位提供了更加便捷、準(zhǔn)確的方法。這種攝像機(jī)可以自動識別水位的高低,實時監(jiān)測水域情況,為防洪排澇、水資源
    的頭像 發(fā)表于 07-31 10:34 ?760次閱讀
    水位<b class='flag-5'>自動識別</b>攝像機(jī)

    多光譜明火自動識別攝像機(jī)

    當(dāng)今社會,火災(zāi)事故頻發(fā),給人們的生命財產(chǎn)帶來了嚴(yán)重的危害。為了提高火災(zāi)預(yù)警和應(yīng)急處置的效率,多光譜明火自動識別攝像機(jī)應(yīng)運而生。這種先進(jìn)技術(shù)結(jié)合了多光譜成像和人工智能技術(shù),可以實時監(jiān)測周圍環(huán)境并
    的頭像 發(fā)表于 07-27 15:24 ?671次閱讀
    多光譜明火<b class='flag-5'>自動識別</b>攝像機(jī)