Seaborn绘制pairplot图

软件发布|下载排行|最新软件

当前位置:首页IT学院IT技术

Seaborn绘制pairplot图

尤而小屋   2022-09-28 我要评论

大家好,我是Peter~

本文记录的使用seaborn绘制pairplot图,主要是用来显示两两变量之间的关系(线性或非线性,有无较为明显的相关关系等),官网学习地址:

https://seaborn.pydata.org/generated/seaborn.pairplot.html

参数

主要参数为:

seaborn.pairplot(data,  # 绘图数据
                 hue=None,  # 针对某一字段进行颜色分类
                 hue_order=None,  # 指定分组顺序
                 palette=None,  # 控制色调
                 vars=None,  # 变量
                 x_vars=None, 
                 y_vars=None, 
                 kind='scatter', # scatter', ‘kde', ‘hist', ‘reg'
                 diag_kind='auto', # ‘auto', ‘hist', ‘kde', None
                 markers=None, # 控制散点的样式  “+” “s” "D"
                 height=2.5,  # 高度
                 aspect=1, # 宽度
                 corner=False,  # 对角线是否显示
                 dropna=False,   # 是否去掉控制
                 plot_kws=None,  # 控制非对角线图例样式
                 diag_kws=None,  # 控制对角线图例样式
                 grid_kws=None,  # 网格设置 
                 size=None)  # 默认 6,图的尺度大小(正方形)

导入数据

import pandas as pd
import numpy as np

import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
sns.set_style('darkgrid',{'font.sans-serif':['simhei','Arial']})

导入seaborn中默认的数据集:

默认情况

In [3]:

sns.pairplot(df)

plt.show()

参数kind

空值非对角线上图形的类型,选择为

In [4]:

sns.pairplot(df, kind="kde")

plt.show()

sns.pairplot(df, kind="hist")

plt.show()

sns.pairplot(df, kind="reg")  # 使用回归

plt.show()

参数hue

主要是用来进行分类

In [7]:

sns.pairplot(df, hue="species")

plt.show()

sns.pairplot(df, hue="sex")
plt.show()

参数diag_kind

控制对角线上的图的类型,可选"hist"与"kde"

In [9]:

sns.pairplot(df, hue="species", diag_kind="hist")

plt.show()

参数palette

主要是用来控制色调,下面是收集到的色系:

Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PRGn_r, Paired, Paired_r, Pastel1, Pastel1_r, Pastel2, Pastel2_r, PiYG, PiYG_r, PuBu, PuBuGn, PuBuGn_r, PuBu_r, PuOr, PuOr_r, PuRd, PuRd_r, Purples, Purples_r, RdBu, RdBu_r, RdGy, RdGy_r, RdPu, RdPu_r, RdYlBu, RdYlBu_r, RdYlGn, RdYlGn_r, Reds, Reds_r, Set1, Set1_r, Set2, Set2_r, Set3, Set3_r, Spectral, Spectral_r, Wistia, Wistia_r, YlGn, YlGnBu, YlGnBu_r, YlGn_r, YlOrBr, YlOrBr_r, YlOrRd, YlOrRd_r, afmhot, afmhot_r, autumn, autumn_r, binary, binary_r, bone, bone_r, brg, brg_r, bwr, bwr_r, cividis, cividis_r, cool, cool_r, coolwarm, coolwarm_r, copper, copper_r, crest, crest_r, cubehelix, cubehelix_r, flag, flag_r, flare, flare_r, gist_earth, gist_earth_r, gist_gray, gist_gray_r, gist_heat, gist_heat_r, gist_ncar, gist_ncar_r, gist_rainbow, gist_rainbow_r, gist_stern, gist_stern_r, gist_yarg, gist_yarg_r, gnuplot, gnuplot2, gnuplot2_r, gnuplot_r, gray, gray_r, hot, hot_r, hsv, hsv_r, icefire, icefire_r, inferno, inferno_r, jet, jet_r, magma, magma_r, mako, mako_r, nipy_spectral, nipy_spectral_r, ocean, ocean_r, pink, pink_r, plasma, plasma_r, prism, prism_r, rainbow, rainbow_r, rocket, rocket_r, seismic, seismic_r, spring, spring_r, summer, summer_r, tab10, tab10_r, tab20, tab20_r, tab20b, tab20b_r, tab20c, tab20c_r, terrain, terrain_r, twilight, twilight_r, twilight_shifted, twilight_shifted_r, viridis, viridis_r, vlag, vlag_r, winter, winter_r

In [10]:

sns.pairplot(df,hue="species",palette="husl")

plt.show()

参数markers

In [13]:

sns.pairplot(df, hue="species", diag_kind="hist", markers=["o", "s", "D"])

plt.show()

参数height

控制整个图形的大小

In [14]:

sns.pairplot(df, height=1.5)

plt.show()

sns.pairplot(df, height=4)

plt.show()

参数aspect

用来控制图形的宽度,默认是1,显示效果为:

sns.pairplot(df, hue="species", aspect=3)

plt.show()

参数corner

只展示一半的图形,整体的图形是关于主对角线对称的

In [16]:

sns.pairplot(df, corner=True)

plt.show()

参数vars

控制需要显示的变量

In [17]:

df.columns

Out[17]:

Index(['species', 'island', 'bill_length_mm', 'bill_depth_mm',
       'flipper_length_mm', 'body_mass_g', 'sex'],
      dtype='object')

In [18]:

sns.pairplot(df,vars=["island","bill_length_mm","sex"])

plt.show()

参数-x_vars/y_vars

必须同时指定

In [19]:

sns.pairplot(
    df,
    x_vars=["bill_length_mm", "bill_depth_mm", "flipper_length_mm"],
    y_vars=["bill_length_mm", "bill_depth_mm"],
)

plt.show()

参数-plot_kws/diag_kws

  • plot_kws:用于控制非对角线上的图的样式
  • diag_kws:用于控制对角线上图的样式

In [20]:

sns.pairplot(
    df,
    plot_kws=dict(marker="+", edgecolor="b",linewidth=1),
    diag_kws=dict(fill=False),
)

plt.show()

sns.pairplot(df, 
             diag_kind="kde", 
             markers="+",
             plot_kws=dict(s=50, edgecolor="b", linewidth=1),
             diag_kws=dict(shade=True)
            )

plt.show()

参数-dropna

缺失值的处理,默认是

In [22]:

sns.pairplot(df, dropna=True)  

plt.show()

返回值-PairGrid

关于返回值的自定义内容请参考官网:

https://seaborn.pydata.org/generated/seaborn.PairGrid.html#seaborn.PairGrid

In [24]:

g = sns.pairplot(df, diag_kind="kde")
g.map_lower(sns.kdeplot, levels=6, color=".4")

plt.show()

Copyright 2022 版权所有 软件发布 访问手机版

声明:所有软件和文章来自软件开发商或者作者 如有异议 请与本站联系 联系我们