pythondataframe排序,pandas对数据进行排序

  pythondataframe排序,pandas对数据进行排序

  相关学习推荐:python教程

  今天是pandas数据处理s专题的第六篇文章。先说DataFrame的排序和聚合操作。

  在上一篇文章中,我们主要介绍了DataFrame中的apply方法,如何广播DataFrame中的每一行或每一列,以便我们在短时间内处理整个数据。今天,我们来谈谈如何根据我们的需要对一个数据帧进行排序,以及如何使用一些汇总运算。

  00-1010分拣是我们非常基本的需求。这种需求被进一步细分为根据索引排序和根据值排序.的熊猫让我们先来看看排序党在序列。

  法。

  

Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。这两个方法都会返回一个新的Series:

  

索引排序

对于DataFrame来说也是一样,同样有根据值排序以及根据索引排序这两个功能。但是由于DataFrame是一个二维的数据,所以在使用上会有些不同。最简单的差别是在于Series只有一列,我们明确的知道排序的对象,但是DataFrame不是,它当中的索引就分为两种,分别是行索引以及列索引。所以我们在排序的时候需要指定我们想要排序的轴,也就是axis。

  

默认的情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。

  

我们还可以传入ascending这个参数,用来指定我们想要的排序顺序是正序还是倒序

  

值排序

DataFrame的值排序有所不同,我们不能对行进行排序,只能针对列。我们通过by参数传入我们希望排序参照的列,可以是一列也可以是多列。

  

排名

有的时候我们希望得到元素的排名,我们会希望知道当前元素在整体当中排第几,pandas当中也提供了这个功能,它就是rank方法。

  

我们可以发现我们随手输入的一串数字当中,包含两个7,7是Series当中最大的数字,但是它们的排名为什么是6.5呢?

  

其实很简单,因为7出现了两次,分别是第6位和第7位,这里对它所有出现的排名取了平均,所以是6.5。如果我们不希望它取平均,而是根据出现的先后顺序给出排名的话,我们可以用method参数指定我们希望的效果。

  

method的合法参数并不止first这一种,还有一些其他稍微冷门一些的用法,我们一并列出。

  

如果是DataFrame的话,默认是以行为单位,计算每一行中元素占整体的排名。我们也可以通过axis参数指定以列为单位计算:

  

汇总运算

最后我们来介绍一下DataFrame当中的汇总运算,汇总运算也就是聚合运算,比如我们最常见的sum方法,对一批数据进行聚合求和。DataFrame当中同样有类似的方法,我们一个一个来看。

  

首先是sum,我们可以使用sum来对DataFrame进行求和,如果不传任何参数,默认是对每一行进行求和。

  

除了sum之外,另一个常用的就是mean,可以针对一行或者是一列求平均。

  

由于DataFrame当中常常会有为NA的元素,所以我们可以通过skipna这个参数排除掉缺失值之后再计算平均值。

  

另一个我个人觉得很好用的方法是descirbe,可以返回DataFrame当中的整体信息。比如每一列的均值、样本数量、标准差、最小值、最大值等等。是一个常用的统计方法,可以用来了解DataFrame当中数据的分布情况。

  

除了介绍的这些方法之外,DataFrame当中还有很多类似的汇总运算方法,比如idxmax,idxmin,var,std等等,大家感兴趣可以去查阅相关文档,但是根据我的经验一般用不到。

  

想了解更多编程学习,敬请关注php培训栏目!

  

以上就是pandas技巧之 DataFrame中的排序与汇总方法的详细内容,更多请关注盛行IT软件开发工作室其它相关文章!

  

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

标签: python

相关文章阅读

  • pycharm添加pandas,pycharm如何导入pandas模块
  • pycharm添加pandas,pycharm如何导入pandas模块,在Pycharm中安装Pandas库方法(简单易懂)
  • pandas组内排序,pandas对数据进行排序
  • pandas组内排序,pandas对数据进行排序,Pandas分组与排序的实现
  • pandas去重操作,pandas 去重计数
  • pandas去重操作,pandas 去重计数,pandas中的数据去重处理的实现方法
  • pandas中groupby函数的参数,pandas中groupby函数的参数,Pandas之groupby( )用法笔记小结
  • pandas中groupby函数的参数,pandas.groupby
  • pandas 过滤数据,pandas 过滤特定的值
  • pandas 过滤数据,pandas 过滤特定的值,Pandas--过滤缺失数据--pd.dropna()函数的用法说明
  • pandas reshape,
  • pandas reshape,,Pandas中resample方法详解
  • ,,pandas应用实例之pivot函数详解
  • ,,Pandas常用累计、同比、环比等统计方法实践过程
  • ,,Pandas之ReIndex重新索引的实现
  • 留言与评论(共有 条评论)
       
    验证码: