python seaborn柱状图,python分布图怎么做

　　在本文中，我们将介绍10个例子，帮助您掌握如何使用Python中的Seaborn库来创建图表。本文详细讲解了样例代码，有兴趣的可以看看。

　　00-1010前言例1例2例3例4例5例6例7例8例9例10

前言

　　第一个例子是创建一个基本的直方图。它将连续变量的值范围划分为离散的区间，并显示每个区间中有多少个值。

　　sns.displot(

　　数据=df，

　　x=价格，

　　kind=hist ，

　　纵横比=1.4

　　)

　　我们将df的名称传递给数据参数。x参数接受要绘制的列名。aspect参数调整大小的纵横比。还可以改变高度。

示例 1

　　在第一个例子中，我们可以清楚地看到price列中有一些异常值。柱状图右边有一条长尾，说明价格非常高的房子很少。

　　减少这种异常值影响的一种方法是取该值的对数。displot函数可以使用log_scale参数来执行此操作。

　　sns.displot(

　　数据=df，

　　x=价格，

　　kind=hist ，

　　纵横比=1.4，

　　对数标度=10

　　)

　　价格是以10的幂表示的。现在我们对房价的分布有了更好的概述。

示例 2

　　我们还可以调整直方图中的仓数量。在某些情况下，最好使用较少的方框，这样我们可以得到一个更有条理的概览。

　　用于此调整的参数是box。

　　sns.displot(

　　数据=df，

　　x=价格，

　　kind=hist ，

　　纵横比=1.4，

　　log_scale=10，

　　箱数=20

　　)

示例 3

　　数据集还包含分类变量。例如，类型列有三个类别，即H(房子)、T(联排别墅)和U(单元)。我们可能需要分别检查每个项目的分配情况。

　　一种选择是在同一可视化中用不同的颜色显示它们。我们只需要将列名传递给hue参数。

sns.displot(

　　这个图为我们提供了2条信息:

每个类别的大小与房屋的数量有关。h类是最大的一类。
每类房屋的价格分布。

示例 5

　　另一个检查每个类别分布的选项是创建单独的子图。我们可以对这个任务使用col或row参数。给定列中的每个类别都有一个子图。

sns.displot(

例子 6

　　displot函数还允许生成二维直方图。因此，我们得到了关于两列中值的观察值(即行)分布的概述。

　　我们使用价格和距离列创建一个。我们只是将列名传递给x和y参数。

sns.displot(

　　较暗的区域密度更大，所以它们包含了更多的观测数据。两列看起来都是正态分布，因为密集的区域在中心。

　　你可能已经注意到，我们使用了一个元组作为log_scale参数的参数。因此，我们可以为每个列传递不同的比例。

例子 7

　　Kde图还可以用于可视化变量的分布。它们和直方图很相似。然而，kde图使用连续的概率密度曲线来表示分布，而不是使用离散的箱。

　　kind参数设置为kde，以生成kde图。

sns.displot(

示例 8

　　与直方图类似，可以为不同的类别分别绘制kde图。我们的数据集包含房屋的区域信息。我们看看不同地区的价格变化。

sns.displot(

　　南方大都市区的平均房价似乎最高。

示例 9

　　另一种检查变量分布的方法是使用ecdf图。它表示低于给定列中每个唯一值的观察值的比例或计数。

　　这是一种可视化的累计和。因此，我们能够看到更密集的值范围。

sns.displot(

　　曲线斜率高的值范围有更多的观测值。例如，我们没有很多房子的距离超过30。与此相反，在10到15的距离范围内有很多房子。

示例10

　　ecdf图也支持hue、col和row参数。因此，我们可以在一个列中区分不同类别之间的分布。

sns.displot(

　　对于数据分析或机器学习任务，了解变量(即特征)的分布是非常重要的。我们如何处理给定的任务可能取决于分布。

　　在这篇文章中，我们看到了如何使用Seaborn的displot函数来分析价格和距离栏的分布。

　　以上就是Python+Seaborn绘制分布图的示例详解的详细内容，更多关于Python Seaborn分布图的资料请关注盛行IT软件开发工作室其它相关文章！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

python seaborn柱状图,python分布图怎么做

目录

前言

示例 1

示例 2

示例 3

示例 5

例子 6

例子 7

示例 8

示例 9

示例10

相关文章阅读