Seaborn散点图

时间:2020-02-23 14:41:51  来源:igfitidea点击:

在Seaborn的数据可视化系列中,将重点介绍Seaborn散点图以进行数据可视化。

什么是散点图?

散点图分别表示两个连续值之间的关系。
它描述了在数据集值的每一部分中,一个数据变量如何受到另一数据变量的影响。

因此,现在让我们开始使用Seaborn库绘制散点图。

Seaborn散点图入门

在进行打印之前,我们需要使用以下命令安装Seaborn Library:

pip install seaborn

安装库后,我们需要将库导入Python环境中以加载函数并绘制数据以使用以下命令将其可视化:

import seaborn

创建散点图

" seaborn.scatterplot()函数"用于绘制数据并使用散点图可视化描述值之间的关系。

语法:

seaborn.scatterplot(x,y,data)

  • x:需要在x轴上绘制的数据变量。

  • y:要在y轴上绘制的数据变量。

  • data:指针变量,其中存储了整个数据。

范例1:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
Year = [1,3,5,2,12,5,65,12,4,76,45,23,98,67,32,12,90]
Profit = [80, 75.8, 74, 65, 99.5, 19, 33.6,23,45,12,86,34,567,21,80,34,54]

 
data_plot = pd.DataFrame({"Year":Year, "Profit":Profit})

 
sns.scatterplot(x = "Year", y = "Profit", data=data_plot)
plt.show()

在上面的示例中,我们使用散点图绘制了"年"和"利润"之间的关系。
此外,我们使用了pyplot.show()函数以适当的绘图格式显示数据。

范例2:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
sns.scatterplot(x = "drat", y = "qsec",data=data)
sns.set(style='darkgrid',)
plt.show()

在上面的示例中,我们已经表示了作为参数传递给函数的数据集的两个数据列之间的关系。

在Seaborn散点图中分组变量

如上所示,散点图描述了两个因素之间的关系。
我们可以进一步描述多个数据变量之间的关系,即一个数据变量的变化如何影响整个图中其他数据变量的表示。

在接下来的部分中,我们将研究以下方式,我们可以通过这些方式来描述多变量相关性:

  • 色调
  • 风格
  • 尺寸

1.使用参数"色相"

" hue"参数可用于对多个数据变量进行分组,并根据用于绘制数据值的标记的不同颜色来显示它们之间的依赖性。

语法:

seaborn.scatterplot(x,y,data,hue)

  • hue:数据参数,围绕该参数将绘制传递的数据值的依赖性。

例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
sns.scatterplot(x = "drat", y = "qsec",data=data, hue='am')
sns.set(style='whitegrid',)
plt.show()

在上面的示例中,我们针对数据集的数据变量" am"绘制了" drat"和" qsec"数据变量之间的依存关系。
数据变量是分类变量,即数据值介于0-1之间。
因此,使用色相,变量am的两个数据值0和1使用两种不同的颜色表示。

2.参数"样式"

使用"样式"作为参数,我们可以使用用于描述数据值的不同类型的散布图标来描述多个数据变量及其依赖性之间的关系。

语法:

seaborn.scatterplot(x,y,data,style)

  • 样式:数据参数,用作绘制多变量关系的参考。

例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
sns.scatterplot(x = "drat", y = "qsec",data=data, hue='am',style='am')
sns.set(style='whitegrid',)
plt.show()

在上面的示例中," o"和" x"等不同的绘图模式有助于描绘x,y轴变量之间的依赖性,并以" am"变量作为参考。

3.使用参数"大小"

"大小"参数以一种方式生成图,从而使用不同大小的散布图来描述多个图之间的依存关系。

语法:

seaborn.scatterplot(x,y,data,size)

例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
sns.scatterplot(x = "drat", y = "qsec",data=data,size='am',hue='am')
sns.set(style='whitegrid',)
plt.show()

可以清楚地看到,不同大小的散布标记有助于描述作为参数传递给它的数据值之间的关系,以作为参考。

使用"调色板"参数的Seaborn散点图

我们可以使用Seaborn调色板以更好的方式可视化数据。
包含调色板参数可以帮助我们用不同的Seaborn颜色图值表示数据。

Seaborn色彩图中可用的各种调色板颜色可帮助绘制数据值。

范例1:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")

sns.scatterplot(x = "drat", y = "qsec",data=data,size='am',hue='am',palette='Spectral')
sns.set(style='whitegrid',)
plt.show()

在上面的示例中,我们使用了调色板" Spectral"来可视化数据。

范例2:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")

sns.scatterplot(x = "drat", y = "qsec",data=data,size='am',hue='am',palette='hot')
sns.set(style='whitegrid',)
plt.show()

在此示例中,我们使用了调色板" hot"以及size参数来描绘不同的颜色图以及散布标记的大小。

使用"标记"可视化散点图

"标记"是用于表示数据值的分散模式。
使用标记可以帮助在图形和可视化方面为绘图增加价值。

语法:

seaborn.scatterplot(x,y,markers)

  • markers:代表我们要在绘图中灌输的标记设计的列表。

例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")

sns.scatterplot(x = "drat", y = "qsec", data=data, hue='am', style='am', markers=['*', 'o'], palette='hot')
sns.set(style='dark',)
plt.show()