python可以去重的数据类型,去重的函数是什么
数据去重可以使用重复()和drop_duplicates()两个方法。
数据框。重复(subset=None,keep=first )返回布尔级数表示重复行
参数:
子集:列标签或标签序列,可选
仅考虑用于标识重复项的某些列,默认情况下使用所有列
keep:{first , last ,False},默认第一
首先:标记重复,真的除了第一次出现。
最后:标记重复,真的除了最后一次出现。
错误:将所有重复项标记为没错。
相关推荐: 《Python基础教程》
将数组作为铭牌导入
进口熊猫作为螺纹中径
来自熊猫进口系列,数据框架
df=pd.read_csv( ./demo _ duplicateCSV’)
打印(df)
打印(df[Seqno].unique()) # [0 .1.]
# 使用复制查看重复值
# 参数保持可以标记重复值{first , last ,False}
打印(df[Seqno].重复())
0错误
一正确
2正确
3正确
四错误
名称:序列号,数据类型:布尔值
# 删除系列重复数据
打印(df[Seqno].drop_duplicates())
0 0.0
4 1.0
名称:序列号,型号:浮动64
# 删除数据帧重复数据
打印(df。drop _ duplicates([ Seqno ])#按照序号来去重
价格序列号符号时间
0 1623.0 0.0 APPL 1473411962
4 1649.0 1.0 APPL 1473411963
# drop _ dujplicates()第二个参数保持包含的值有:first、last、False
打印(df。drop _ duplicates([ Seqno ],keep= last )#保存最后一个
价格序列号符号时间
3 1623.0 0.0 APPL 1473411963
4 1649.0 1.0 APPL 1473411963
以上就是大蟒去重函数是什么的详细内容,更多请关注盛行信息技术软件开发工作室其它相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。