女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python數據可視化:類別比較圖表可視化

jf_Vqngj70R ? 來源:美男子玩編程 ? 作者:美男子玩編程 ? 2022-11-15 15:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在學習本篇博文之前請先看一看之前發過的關聯知識:

Python數據可視化:如何選擇合適的圖表可視化?

根據表達數據的側重內容點,將圖表類型分為6大類:類別比較圖表、數據關系圖表、數據分布圖表、時間序列圖表、局部整體圖表和地理空間圖表(有些圖表也可以歸類于兩種或多種圖表類型)。

本篇將介紹類別比較圖表的可視化方法。

類別比較型圖表的數據一般分為:數值型和類別型兩種數據類型,主要包括:柱形圖、條形圖、雷達圖、詞云圖等,通常用來比較數據的規模。如下所示:

e016fbd8-649a-11ed-8abf-dac502259ad0.png

1

柱狀圖

柱形圖是一種以長方形的長度為變量的統計圖表。柱形圖用于顯示一段時間內的數據變化或顯示各項之間的比較情況。

在柱形圖中,類別型或序數型變量映射到橫軸的位置,數值型變量映射到矩形的高度。控制柱形圖的兩個重要參數是:“系列重疊"和“分類間距”。

  • “分類間距"控制同一數據系列的柱形寬度;

  • “系列重疊"控制不同數據系列之間的距離。

下圖為常見的柱形圖類型:單數據系列柱形圖、多數據系列柱形圖、堆積柱形圖和百分比堆積柱形圖。

e05c82a2-649a-11ed-8abf-dac502259ad0.png

1.1、單數據系列柱形圖

通過一個示例了解單數據系列柱形圖的使用,實現代碼如下所示:

mydata = pd.DataFrame({'Cut': ["Fair", "Good", "Very Good", "Premium", "Ideal"],
                       'Price': [4300, 3800, 3950, 4700, 3500]})


Sort_data = mydata.sort_values(by='Price', ascending=False)


fig = plt.figure(figsize=(6, 7), dpi=70)
plt.subplots_adjust(left=0.1, right=0.9, top=0.9, bottom=0.1)
plt.grid(axis="y", c=(217/256, 217/256, 217/256))  # 設置網格線
# 將網格線置于底層
ax = plt.gca()  # 獲取邊框
ax.spines['top'].set_color('none')  # 設置上‘脊梁’為紅色
ax.spines['right'].set_color('none')  # 設置上‘脊梁’為無色
ax.spines['left'].set_color('none')  # 設置上‘脊梁’為無色


plt.bar(Sort_data['Cut'], Sort_data['Price'],
        width=0.6, align="center", label="Cut")


plt.ylim(0, 6000)  # 設定x軸范圍
plt.xlabel('Cut')
plt.ylabel('Price')
plt.show()

	

效果如下所示:

e081bb26-649a-11ed-8abf-dac502259ad0.png

1.2、多數據系列柱形圖

通過一個示例了解多數據系列柱形圖的使用,實現代碼如下所示:


	
x_label = np.array(df["Catergory"])
x = np.arange(len(x_label))
y1 = np.array(df["1996"])
y2 = np.array(df["1997"])


fig = plt.figure(figsize=(5, 5))
plt.subplots_adjust(left=0.1, right=0.9, top=0.9, bottom=0.1)  # 設置繪圖區域大小位置


plt.bar(x, y1, width=0.3, color='#00AFBB', label='1996', edgecolor='k',
        linewidth=0.25)  # 調整y1軸位置,顏色,label為圖例名稱,與下方legend結合使用
plt.bar(x+0.3, y2, width=0.3, color='#FC4E07', label='1997',
        edgecolor='k', linewidth=0.25)  # 調整y2軸位置,顏色,label為圖例名稱,與下方legend結合使用
plt.xticks(x+0.15, x_label, size=12)  # 設置x軸刻度,位置,大小


# 顯示圖例,loc圖例顯示位置(可以用坐標方法顯示),ncol圖例顯示幾列,默認為1列,frameon設置圖形邊框
plt.legend(loc=(1, 0.5), ncol=1, frameon=False)


plt.yticks(size=12)  # 設置y軸刻度,位置,大小
plt.grid(axis="y", c=(217/256, 217/256, 217/256))  # 設置網格線
# 將y軸網格線置于底層
# plt.xlabel("Quarter",labelpad=10,size=18,)                          #設置x軸標簽,labelpad設置標簽距離x軸的位置
# plt.ylabel("Amount",labelpad=10,size=18,)                                   #設置y軸標簽,labelpad設置標簽距離y軸的位置




ax = plt.gca()  
ax.spines['top'].set_color('none')  # 設置上‘脊梁’為無色
ax.spines['right'].set_color('none')  # 設置右‘脊梁’為無色
ax.spines['left'].set_color('none')  # 設置左‘脊梁’為無色


plt.show()

	

效果如下所示:

e09a4de4-649a-11ed-8abf-dac502259ad0.png

1.3、堆積柱形圖

通過一個示例了解堆積柱形圖的使用,實現代碼如下所示:


		
# -*- coding: utf-8 -*-
# %%
import pandas as pd
import numpy as np
from plotnine import *




mydata = pd.DataFrame(dict(Name=['A', 'B', 'C', 'D', 'E'],
                           Scale=[35, 30, 20, 10, 5],
                           ARPU=[56, 37, 63, 57, 59]))


# 構造矩形X軸的起點(最小點)
mydata['xmin'] = 0
for i in range(1, 5):
    mydata['xmin'][i] = np.sum(mydata['Scale'][0:i])


# 構造矩形X軸的終點(最大點)
mydata['xmax'] = 0
for i in range(0, 5):
    mydata['xmax'][i] = np.sum(mydata['Scale'][0:i+1])


mydata['label'] = 0
for i in range(0, 5):
    mydata['label'][i] = np.sum(mydata['Scale'][0:i+1])-mydata['Scale'][i]/2


base_plot = (ggplot(mydata) +
             geom_rect(aes(xmin='xmin', xmax='xmax', ymin=0, ymax='ARPU', fill='Name'), colour="black", size=0.25) +
             geom_text(aes(x='label', y='ARPU+3', label='ARPU'), size=14, color="black") +
             geom_text(aes(x='label', y=-4, label='Name'), size=14, color="black") +
             scale_fill_hue(s=0.90, l=0.65, h=0.0417, color_space='husl') +
             ylab("ARPU") +
             xlab("scale") +
             ylim(-5, 80) +
             theme(  # panel_background=element_rect(fill="white"),
    #panel_grid_major = element_line(colour = "grey",size=.25,linetype ="dotted" ),
    #panel_grid_minor = element_line(colour = "grey",size=.25,linetype ="dotted" ),
    text=element_text(size=15),
    legend_position="none",
    aspect_ratio=1.15,
    figure_size=(5, 5),
    dpi=100
))
print(base_plot)

2

條形圖

條形圖與柱形圖類似,幾乎可以表達相同多的數據信息。

在條形圖中,類別型或序數型變量映射到縱軸的位置,數值型變量映射到矩形的寬度。條形圖的柱形變為橫向,從而導致與柱形圖相比,條形圖更加強調項目之間的大小對比。尤其在項目名稱較長以及數量較多時,采用條形圖可視化數據會更加美觀、清晰,如下圖所示:

e139e822-649a-11ed-8abf-dac502259ad0.png

2.1、單數據系列條形圖

通過一個示例了解單數據系列條形圖的使用,實現代碼如下所示:


		
df = pd.read_csv('Stackedbar_Data.csv')


df = df.sort_values(by='Pensions', ascending=True)


df['Country'] = pd.Categorical(df['Country'], categories=df['Country'], ordered=True)
df


# %%
base_plot = (ggplot(df, aes('Country', 'Pensions')) +
             # "#00AFBB"
             geom_bar(stat="identity", color="black", width=0.6, fill="#FC4E07", size=0.25) +

實現效果如下所示:

e1547b56-649a-11ed-8abf-dac502259ad0.png

2.2、多數據系列條形圖

通過一個示例了解多數據系列條形圖的使用,實現代碼如下所示:


			
df = pd.read_csv('Stackedbar_Data.csv')

效果如下所示:

e17e22da-649a-11ed-8abf-dac502259ad0.png

2.3、堆積條形圖

通過一個示例了解堆積條形圖的使用,實現代碼如下所示:

df = pd.read_csv('Stackedbar_Data.csv')
Sum_df = df.iloc[nonedisplay: none;'>

e1986816-649a-11ed-8abf-dac502259ad0.png

2.4、百分比堆積條形圖

通過一個示例了解百分比堆積條形圖的使用,實現代碼如下所示:

df = pd.read_csv('Stackedbar_Data.csv')

							

效果如下所示:

e1faa5bc-649a-11ed-8abf-dac502259ad0.png

4

詞云圖

詞云圖通過使每個字的大小與其出現頻率成正比,顯示不同單詞在給定文本中的出現頻率,這會過濾掉大量的文本信息,使瀏覽者只要一眼掃過文本就可以領略文本的主旨。

詞云圖會將所有的字詞排在一起,形成云狀圖案,也可以任何格式排列:水平線、垂直列或其他形狀,也可用于顯示獲分配元數據的單詞。如下圖所示:

e33cfb5a-649a-11ed-8abf-dac502259ad0.png每個圓圈表示一個數值刻度,而徑向分隔線(從中心延伸出來的線)則用于區分不同類別或間隔(如果是直方圖)。刻度上較低的數值通常由中心點開始,然后數值會隨著每個圓形往外增加,但也可以把任何外圓設為零值,這樣里面的內圓就可用來顯示負值。條形通常從中心點開始向外延伸,但也可以以別處為起點,顯示數值范圍(如跨度圖)。

此外,條形也可以如堆疊式條形圖般堆疊起來,如下圖所示:

e3d8bd60-649a-11ed-8abf-dac502259ad0.png

8

熱力圖

熱力圖是一種通過對色塊著色來顯示數據的統計圖表,繪圖時需指定顏色映射的規則。例如,較大的值由較深的顏色表示,較小的值由較淺的顏色表示;較大的值由偏暖的顏色表示,較小的值由較冷的顏色表示等。

通過一個示例了解熱力圖的使用,實現代碼如下所示:

import numpy as np
import pandas as pd
from plotnine import *
from plotnine.data import mtcars


mat_corr = np.round(mtcars.corr(), 1).reset_index()
mydata = pd.melt(mat_corr, id_vars='index', var_name='var', value_name='value')
mydata


# %%
base_plot = (ggplot(mydata, aes(x='index', y='var', fill='value', label='value')) +
             geom_tile(colour="black") +
             geom_text(size=8, colour="white") +
             scale_fill_cmap(name='RdYlBu_r') +
             coord_equal() +
             theme(dpi=100, figure_size=(4, 4)))
print(base_plot)


# %%
mydata['AbsValue'] = np.abs(mydata.value)


base_plot = (ggplot(mydata, aes(x='index', y='var', fill='value', size='AbsValue')) +
             geom_point(shape='o', colour="black") +
             # geom_text(size=8,colour="white")+
             scale_size_area(max_size=11, guide=False) +
             scale_fill_cmap(name='RdYlBu_r') +
             coord_equal() +
             theme(dpi=100, figure_size=(4, 4)))
print(base_plot)


# %%
base_plot = (ggplot(mydata, aes(x='index', y='var', fill='value', size='AbsValue')) +
             geom_point(shape='s', colour="black") +
             # geom_text(size=8,colour="white")+
             scale_size_area(max_size=10, guide=False) +
             scale_fill_cmap(name='RdYlBu_r') +
             coord_equal() +
             theme(dpi=100, figure_size=(4, 4)))
print(base_plot)

							

效果如下所示:

e3f754d2-649a-11ed-8abf-dac502259ad0.png

e41ddce2-649a-11ed-8abf-dac502259ad0.png

e4472886-649a-11ed-8abf-dac502259ad0.png


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 可視化
    +關注

    關注

    1

    文章

    1264

    瀏覽量

    21863
  • 圖表
    +關注

    關注

    0

    文章

    33

    瀏覽量

    9013
  • python
    +關注

    關注

    56

    文章

    4827

    瀏覽量

    86755

原文標題:Python數據可視化:類別比較圖表可視化

文章出處:【微信號:美男子玩編程,微信公眾號:美男子玩編程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用協議分析儀進行數據分析與可視化

    使用協議分析儀進行數據分析與可視化,需結合數據捕獲、協議解碼、統計分析及可視化工具,將原始數據轉化為可解讀的
    發表于 07-16 14:16

    工業設備可視化管理系統是什么

    工業設備可視化管理系統是一種基于物聯網(IoT)、大數據、云計算、數字孿生等技術,對工業設備的運行狀態、性能參數、維護信息等進行實時監測、數據整合與可視化呈現的智能管理平臺。它通過將復
    的頭像 發表于 05-27 14:56 ?213次閱讀
    工業設備<b class='flag-5'>可視化</b>管理系統是什么

    可視化組態物聯網平臺是什么

    可視化含義:組態是一種用于構建復雜物聯網系統的工具,它提供了豐富的圖形組件和可視化元素,使得用戶可以通過簡單的拖拽操作來創建自定義的界面。可視化則強調將物聯網系統產生的大量
    的頭像 發表于 04-21 10:40 ?296次閱讀

    可視化數據大屏:連線構建視覺新秩序 #數據可視化 #可視化大屏

    可視化
    阿梨是蘋果
    發布于 :2025年03月18日 16:12:04

    VirtualLab Fusion中的可視化設置

    通過以下控件進行重置、加載和保存: 主窗口設置 字體配置 數字顯示 文檔窗口設置 1D數據數組可視化設置 顏色表 諧波場視圖
    發表于 02-25 08:51

    VirtualLab Fusion應用:光波導k域布局可視化(“神奇的圓環”)

    特定光波導布局的光導和耦合條件。 概念 方向轉換器計算器 可以通過“開始”>“計算器”找到方向轉換器計算器,這有助于演示指定角度的不同方式。 k域可視化 k域可視化:平面波的傳播
    發表于 02-21 08:53

    七款經久不衰的數據可視化工具!

    量的激增,單純通過數字和文本來分析數據已不再高效。數據可視化則提供了一種直觀、互動性強的方式,幫助人們通過視覺元素,如柱狀圖、折線圖、餅圖、熱力圖等圖表形式,理解復雜的
    發表于 01-19 15:24

    什么是大屏數據可視化?特點有哪些?

    介紹: 特點 直觀易懂:大屏數據可視化通過圖表、圖形和其他可視化元素,將復雜的數據轉化為直觀易懂的形式,使得用戶無需深入挖掘
    的頭像 發表于 12-16 16:59 ?686次閱讀

    如何找到適合的大屏數據可視化系統

    選擇合適的大屏數據可視化系統是企業或組織在數字轉型過程中至關重要的一步。一個優秀的大屏數據可視化系統能夠實時呈現關鍵業務
    的頭像 發表于 12-13 15:47 ?491次閱讀

    Minitab 數據可視化技巧

    數據分析領域,數據可視化是一種將數據以圖形或圖像的形式展示出來的技術,它可以幫助我們更直觀地理解數據,發現
    的頭像 發表于 12-02 15:40 ?1404次閱讀

    智慧能源可視化監管平臺——助力可視化能源數據管理

    博達可視化大屏設計平臺在智慧能源領域的價值體現在實時監控、數據可視化、決策支持和效率提升等方面。借助該平臺,企業可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產和生活,實現能
    的頭像 發表于 11-29 10:00 ?951次閱讀
    智慧能源<b class='flag-5'>可視化</b>監管平臺——助力<b class='flag-5'>可視化</b>能源<b class='flag-5'>數據</b>管理

    智慧樓宇可視化的優點

    監控與管理:智慧樓宇可視化系統可以實時監測樓宇各項數據指標,包括能耗、水量、空氣質量、安全等情況,讓管理者隨時了解樓宇運行狀態,及時發現問題并做出調整。 2.數據可視化呈現:通過
    的頭像 發表于 11-19 14:25 ?480次閱讀

    智慧園區數據可視化優勢體現在哪些地方

    智慧園區數據可視化是當今數字化時代的重要工具,為園區管理者和決策者提供了強大的分析和展示數據的能力。以下是智慧園區數據可視化的應用優勢,詳細
    的頭像 發表于 11-15 10:30 ?518次閱讀
    智慧園區<b class='flag-5'>數據</b><b class='flag-5'>可視化</b>優勢體現在哪些地方

    工業數據可視化管理平臺是什么

    數據可視化管理平臺應運而生,它以其獨特的功能和優勢,正在成為工業數字轉型的重要工具。 工業數據可視化管理平臺的定義 工業
    的頭像 發表于 08-28 14:21 ?636次閱讀