pandas函数大全,python中pandas用法

  pandas函数大全,python中pandas用法

  Pandas是一个python数据分析库,它提供了许多函数和方法来加快数据分析的过程。下面这篇文章主要介绍python基础中熊猫常用的基本函数的相关信息,供大家参考。

  00-1010前言1、汇总函数2、特征统计函数3、唯一值函数4、替换函数汇总

  

目录

 

  本文主要梳理了熊猫常用的基本功能,主要分为五个部分:

  汇总要素统计函数唯一值函数替换函数排序函数

  

前言

 

  常用的主要有四种:

  Tail():返回表格或序列的最后N行head():返回表格或序列的前N行info():返回表格的信息概要describe():返回表格中数值列对应的主要统计量N。默认值为5。

  df.describe()

  #运行截图

  身高体重

  计数183.000000000

  意思是16860 . 668686866617

  性传播疾病8 . 58686 . 88888888886

  145.40000000元人民币

  257.15000046.000000

  501.90000051.000000

  757.50000065.000000

  最大193.90000089.000000

  

1、汇总函数

 

  许多统计函数是在数列和数据帧上定义的。最常见的有:

  总和(平均值)中位数(中值)var(方差)std(标准差)最大最小用法示例

  df_demo=df[[身高,体重]]

  df_demo.mean()

  聚合函数

  Quantile(返回分位数)count(返回非缺失值的个数)idxmax(最大值对应的索引)聚合函数,该函数有一个公共参数axis,axis=0表示逐列聚合,axis=1表示逐行聚合。

  df_demo.mean(轴=1)。头部()

  

2、特征统计函数

 

  唯一值函数常用的四个函数:

  Unique() :获取一个唯一值的列表——计算出在指定的列中存在哪些唯一值。nu nique():Number of unique values-计算出指定列中存在多少个唯一值。value_counts():获取唯一值及其对应的频率drop_duplicates():重复数据删除()drop_duplicates()基本用法.

  关键参数keepfirst:保留第一个重复行,最后删除后面的重复行:删除重复项,除最后一个出现False:消除所有重复组合。列是必需的。

  代码:

  #原始数据样本

  df_demo=df[[性别,转移,姓名]]

  df_demo

  性别转换名称

  0女N杨

  1男N长强佑

  2孙梅北部的马累

  3女北孙

  4男N高娟你

  ..

  195联邦应急管理局

  le N Xiaojuan Sun

  196 Female N Li Zhao

  197 Female N Chengqiang Chu

  198 Male N Chengmei Shen

  199 Male N Chunpeng Lv

  200 rows × 3 columns

  

  

#现给Gender,Transfer两列去重

 

  

 Gender Transfer Name

 

  由此可见,使用了first参数,保留第一次出现的重复行,删除后面的重复行

  在未指定参数的情况下,keep默认first;

  指定last

  案例如下:

  

df_demo.drop_duplicates([Gender, Transfer], keep=last)

 

  

 Gender Transfer Name

 

  last:删除所有的重复行,只保留出现的最后一个

  drop_duplicates() & duplicated()的区别

  duplicated和drop_duplicates的功能类似,但前者返回了是否为唯一值的布尔列表,其keep参数与后者一致。其返回的序列,把重复元素设为True,否则为False。 drop_duplicates等价于把duplicated为True的对应行剔除。

  

 

  

4、替换函数

 

  替换函数有三类:

  

  • 映射函数:replace()…

  • 逻辑函数:(1)where (2)mask

  • 数值替换

 

  replace的用法

  

#原本的数据

 

  

 Gender Transfer Name

 

  

#替换Gender,女替换为0,男替换为1

 

  

0 0

 

  逻辑替换

  逻辑替换包括了where和mask,这两个函数是完全对称的:where函数在传入条件为False的对应行进行替换,而mask在传入条件为True的对应行进行替换,当不指定替换值时,替换为缺失值(NAN)

  

s = pd.Series([-1, 1.2345, 100, -50])

 

  

0 -1.0

 

  

s.where(s<0, 100)

 

  

0 -1.0

 

  

s.mask(s<0)

 

  

0 NaN

 

  

 

  

总结

 

  到此这篇关于python基础篇之pandas常用基本函数汇总的文章就介绍到这了,更多相关pythonpandas常用函数内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: