python datetime排序,pandas dataframe排序

  python datetime排序,pandas dataframe排序

  本文主要介绍了python数据分析中的数据框架数据排序和排序方法,具有很好的参考价值。希望对大家有帮助。如有错误或不足之处,请不吝赐教。

  00-1010 1.整理数据2。按某一列降序排序3。按多列升序和降序排序4。分类统计结构5。排名数据

  

目录

 

  DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind=quicksort ,na_position=last ,ignore_index=False)

  By:要排序的名称列表

  Axis:轴,0表示行,1表示列。

  升序:升序或降序,默认为True,升序。

  inplace:是直接在数据上修改的吗?True表示直接修改df,False表示复制。

  Kind:指定了排序算法,

  Na_position:空值(NaN)的位置,是数据开头的第一个空值,也是数据结尾的最后一个空值。

  Ignore_index:布尔值,是否忽略索引。True值标记索引(从0开始的整数值),False值忽略索引。

  

1.数据排序

 

  进口熊猫作为pd

  Exel file= c: 用户 管理员 桌面 python数据分析代码 code 03 46 mrbook.xlsx

  df=pd。data frame(PD . read _ excel(Exel file))

  PD . Set _ option( display . max _ rows ,1000) #设置要显示的最大行数

  PD . Set _ option( display . max _ columns ,1000) #设置要显示的最大列数。

  PD . set _ option( display . unicode . east _ Asian _ width ,True)

  PD . set _ option( display . unicode . ambiguity _ as _ wide ,True)

  #按“销售量”列降序排序

  1=df.sort _ values (by= sales ,升序=False)

  打印(df1)

  如图所示:

  

2.按某列降序排序

 

  #先按书名降序排列,再按销量降序排列。

  2=df.sort _ values (by=[图书名称,销售量])

  

3.按多列升降序排列

 

  对类别进行分组,并按降序计算总销售额。

  3=df.groupby ([类别]) [销售]。sum()。重置索引()

  4=DF3.sort _ values (by= sales ,升序=False)

  打印(df4)

  其结构如下:

  

4.对统计结构排序

 

  DataFrame.rank(axis-0,method=average ,numeric_only=None,na_option=keep ,ascending=True,pct=False)

  Axis:轴,0表示行,1表示列。

  Method:表示相同值下使用的排序方法,参数如下:average:默认值,平均排名;Min:最低排名;Max:最大排名;第一:按第一次出现的顺序;Dense:密集排序类似于最小排序,但排序每次只增加1,相同排序的数据只占一个名词。

  Numeric_only:对于DataFrame,如果设置值为True,则只对数字列进行排序。

  上升的:上升或下降的。默认值为True。

  Pct:布尔值,是否以百分比形式返回排名,默认值为False。

  实例:

  对于销量相同的产品,按照顺序排名的平均值进行平均排名。

  #先排序

  Df=df.sort_values(by= sales ,升序=False)

  #平均排名按顺序排名的平均值。

  Df[订单排名]=df[销售]。排名(升序=假)

  这里两个数字销量相同,分别为3和4,平均值为3.5。

  对于销量相同的产品,按照它们在原表中出现的顺序进行排序。

  #先排序

  Df=df.sort_values(by= sales ,升序=False)

  Df[订单排名]=df[销量]。rank (method= first ,ascending=false)

  结果如下:正常结果。

  对于销量相同的产品,按顺序排序,取最小值排序最大。

  #先排序

  Df=df.sort_values(by= sales ,升序=False)

  Df[订单排名]=df[销售]。rank (method= min ,升序=false)

  排名如下:相同数字按最低排名填写。

  销量相同的产品,按顺序排序,取最大值排序最多。

  #先排序

  Df=df.sort_values(by= sales ,升序=False)

  Df[订单排名]=df[销售]。排名(method= max ,ascending=false)

  排名如下:相同数字按最高排名填写。

  以上个人经验,希望给你一个参考,也希望你能支持盛行的IT软件开发工作室。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: