女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

分享10個Pandas在實際應用中肯定會用到的技巧

數據分析與開發 ? 來源:機器之心 ? 作者:機器之心 ? 2022-11-21 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


	

pandas是數據科學家必備的數據處理庫,我們今天總結了10個在實際應用中肯定會用到的技巧。

1、Select from table where f1=’a’ and f2=’b’

使用AND或OR選擇子集:

dfb=df.loc[(df.Week==week)&(df.Day==day)]
OR的話是這樣dfb=df.loc[(df.Week==week)|(df.Day==day)]

2、Select where in

從一個df中選擇一個包含在另外一個df的數據,例如下面的sql

select*fromtable1wherefield1in(selectfield1fromtable2)

我們有一個名為“days”的df,它包含以下值。

3bcecdd4-6955-11ed-8abf-dac502259ad0.png

如果有第二個df:

3be44466-6955-11ed-8abf-dac502259ad0.png

可以直接用下面的方式獲取

days=[0,1,2]
df[df(days)]

3、Select where not in

就像IN一樣,我們肯定也要選擇NOT IN,這個可能是更加常用的一個需求,但是卻很少有文章提到,還是使用上面的數據:

days=[0,1,2]
df[~df(days)]

使用~操作符就可以了

3bfd4f4c-6955-11ed-8abf-dac502259ad0.png

4、select sum(*) from table group by

分組統計和求和也是常見的操作,但是使用起來并不簡單:

df(by=['RepID','Week','CallCycleDay']).sum()

如果想保存結果或稍后使用它們并引用這些字段,請添加 as_index=False

df.groupby(by=['RepID','Week','CallCycleDay'],as_index=False).sum()

3c14cc94-6955-11ed-8abf-dac502259ad0.png

使用as_index= false,可以表的形式保存列

5、從一個表更另外一個表的字段

我們從一個df中更改了一些值,現在想要更新另外一個df,這個操作就很有用。

dfb=dfa[dfa.field1='somevalue'].copy()
dfb['field2']='somevalue'
dfa.update(dfb)

這里的更新是通過索引匹配的。

6、使用apply/lambda創建新字段

我們創建了一個名為address的新字段,它是幾個字段進行拼接的。

dfa['address']=dfa.apply(lambdarow:row['StreetName']+','+
row['Suburb']+','+str(row['PostalCode']),axis=1)

7、插入新行

插入新數據的最佳方法是使用concat。我們可以用有pd. datafframe .from_records一將新行轉換為df。

newRow=row.copy()
newRow.CustomerID=str(newRow.CustomerID)+'-'+str(x)
newRow.duplicate=True
df=pd.concat([df,pd.DataFrame.from_records([newRow])])

8、更改列的類型

可以使用astype函數將其快速更改列的數據類型

df=pd.read_excel(customers_.xlsx')
df['Longitude']=df['Longitude'].astype(str)
df['Latitude']=df['Longitude'].astype(str)

9、刪除列

使用drop可以刪除列:

defcleanColumns(df):
forcolindf.columns:
ifcol[0:7]=="Unnamed":
df.drop(col,inplace=True,axis=1)
returndf

10、地圖上標注點

這個可能是最沒用的技巧,但是他很好玩

這里我們有一些經緯度的數據:

3c37a2b4-6955-11ed-8abf-dac502259ad0.png

現在我們把它根據經緯度在地圖上進行標注:

df_clustercentroids=pd.read_csv(centroidFile)
lst_elements=sorted(list(dfm.cluster2.unique()))
lst_colors=['#%06X'%np.random.randint(0,0xFFFFFF)foriinrange(len(lst_elements))]
dfm["color"]=dfm["cluster2"]
dfm["color"]=dfm["color"].apply(lambdax:lst_colors[lst_elements.index(x)])

m=folium.Map(location=[dfm.iloc[0].Latitude,dfm.iloc[0].Longitude],zoom_start=9)

forindex,rowindfm.iterrows():
folium.CircleMarker(location=[float(row['Latitude']),float(row['Longitude'])],radius=4,popup=str(row['RepID'])+'|'+str(row.CustomerID),color=row['color'],fill=True,fill_color=row['color']
).add_to(m)

forindex,rowindf_clustercentroids.iterrows():
folium.Marker(location=[float(row['Latitude']),float(row['Longitude'])],popup=str(index)+'|#='+str(dfm.loc[dfm.cluster2==index].groupby(['cluster2'])['CustomerID'].count().iloc[0]),icon=folium.Icon(color='black',icon_color=lst_colors[index]),tooltip=str(index)+'|#='+str(dfm.loc[dfm.cluster2==index].groupby(['cluster2'])['CustomerID'].count().iloc[0])).add_to(m)

m

結果如下:

3c62f5cc-6955-11ed-8abf-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7256

    瀏覽量

    91857
  • SQL
    SQL
    +關注

    關注

    1

    文章

    783

    瀏覽量

    45138

原文標題:分享 10 個 Pandas 的小技巧!

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【中科昊芯Core_DSC280025C開發板試用體驗】+3.DSP基礎外設調試(含源碼)

    的文件。 至于中斷函數中,肯定會涉及到一些業務邏輯相關數據和功能函數,所以,我增加了回調函數機制(這個是參考ST的Hal庫機制) 這樣的好處是,工程文件不會交叉調用,看起來沒有那么亂糟糟的。當然,這只
    發表于 07-13 16:07

    工業物聯網網關會用到哪些電子模組

    工業物聯網網關通常會用到通信模組、主控模組、安全模組、接口擴展模組和電源管理模組等,以下是具體介紹: 通信模組:用于實現網關與外部網絡或設備的通信連接。常見的有5G/4G模組,如華為MH5000、移
    的頭像 發表于 07-11 17:56 ?279次閱讀

    工業RTU會用到哪些芯片

    工業RTU(遠程終端單元)通常會用到處理器芯片、通信芯片、數據采集芯片、存儲芯片和電源管理芯片等。
    的頭像 發表于 07-05 09:15 ?164次閱讀

    工業網關會用到哪些芯片

    工業網關通常會集成多種芯片以滿足其復雜的功能需求,具體可能會用到以下幾類芯片: 處理器芯片:這是工業網關的核心部件,負責執行控制指令、數據處理以及運行操作系統等任務。可能會采用高性能的ARM架構
    的頭像 發表于 07-03 17:26 ?184次閱讀

    HTTP協議工業領域會用到

    HTTP協議工業領域會用到,并且工業互聯網、設備管理、數據交互等多個方面發揮著重要作用,以下為你詳細介紹: 工業互聯網場景 設備接入與管理 原理:工業互聯網平臺中,各類工業設備(
    的頭像 發表于 06-03 09:17 ?186次閱讀

    實際硬件設計中非常經典巧妙的20電路合集,帶分析,收藏起來慢慢看!

    1、防反接保護(二極管)實際電子設計中,防反接保護電路非常重要,不要覺得自己肯定不會接錯,實際上無論多么小心,還是會犯錯誤......最簡單的就是利用二極管了,利用二極管的單向導電性
    發表于 03-24 13:49

    請問DMD芯片可以用透明硅膠膠封不?

    DMD芯片是由精微反射鏡面組成的,這些鏡面肯定會有開合的,不知道這些鏡面的上層是否有玻璃等透明材質做隔離,要是有的話,感覺理論上是可以用透明硅膠對DMD芯片做整體膠封的?
    發表于 02-26 06:03

    如何通過仿真準確的預測信號完整性

    ,我們就可以計算得到信號的帶寬。一般來說芯片廠家提供的仿真模型無論是IBIS還是Spice模型都是很信號帶寬相匹配的。比如說一器件的IBIS模型中肯定不會包含serdes信號的模型,如果器件中有serdes接口廠家肯定會提供S
    的頭像 發表于 01-22 11:51 ?1882次閱讀
    如何通過仿真準確的預測信號完整性

    LabVIEW抽象消息使用教程(上)

    自學LabVIEW的Actor FrameWork的消息與抽象消息的時候肯定會覺得非常模糊。小編將給大家帶來一有關抽象消息的教程,分為上下兩期,本期將帶領大家創建Actor中的方法并為方法創建對應的消息。
    的頭像 發表于 01-03 14:22 ?1228次閱讀
    LabVIEW抽象消息使用教程(上)

    淺析射頻無線遙控器定制的意義——射頻肯定會取代紅外

    定制再多的產品,也不會有重碼問題。另一方面,各設備廠商之間可以達成配對協議,設計一遙控器可以配對多臺設備的功能,這樣既可以節省資源浪費,也方便人們的換裝。
    的頭像 發表于 12-10 10:33 ?821次閱讀
    淺析射頻無線遙控器定制的意義——射頻<b class='flag-5'>肯定會</b>取代紅外

    ADS114S06 Demo代碼中找不到頭文件是怎么回事?

    ADS114S06提供的Demo軟件中沒有找到相應的頭文件,搜索也是搜索不到相應的頭文件的,一個個文件里面看也沒有找到。我準備要移植到項目里面了,但是這些沒有頭文件,沒有定義的宏,肯定會報錯的。能否幫忙提供一下支持。謝謝。
    發表于 11-28 06:41

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發表于 11-20 09:52 ?658次閱讀
    RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

    使用TLV3501做了一單限比較器,可以使用到10MHZ,但是實際使用時卻達不到,為什么?

    目前使用TLV3501做了一單限比較器,比較閾值為1V,仿真正常,可以使用到10MHZ,但是實際使用時卻達不到,只能用1Mhz左右, 仿真圖如下: 請問
    發表于 08-29 07:23

    功放芯片中說的失真10%實際應用中怎么衡量?

    功放芯片中說的失真10%實際應用中怎么衡量
    發表于 08-14 06:03

    OPA552很容易損壞是怎么回事?

    您好!板子上有16路OPA552做直流電源輸出電路,輸出電壓范圍-10V~+30V,V+=32V,V-=-15V,實際使用中沒有什么問題,但是OPA552經常會損壞,不是超過功率損壞,16路中
    發表于 08-01 06:31