python可以去重的数据类型,去重的函数是什么

　　数据去重可以使用重复()和drop_duplicates()两个方法。

　　数据框。重复(subset=None，keep=first )返回布尔级数表示重复行

　　参数：

　　子集：列标签或标签序列，可选

　　仅考虑用于标识重复项的某些列，默认情况下使用所有列

　　keep:{first ， last ，False}，默认第一

　　首先：标记重复，真的除了第一次出现。

　　最后：标记重复，真的除了最后一次出现。

　　错误：将所有重复项标记为没错。

　　相关推荐：《Python基础教程》

　　将数组作为铭牌导入

　　进口熊猫作为螺纹中径

　　来自熊猫进口系列，数据框架

　　df=pd.read_csv( ./demo _ duplicateCSV’)

　　打印(df)

　　打印(df[Seqno].unique()) # [0 .1.]

　　# 使用复制查看重复值

　　# 参数保持可以标记重复值{first ， last ，False}

　　打印(df[Seqno].重复())

　　0错误

　　一正确

　　2正确

　　3正确

　　四错误

　　名称：序列号，数据类型：布尔值

　　# 删除系列重复数据

　　打印(df[Seqno].drop_duplicates())

　　0 0.0

　　4 1.0

　　名称：序列号，型号：浮动64

　　# 删除数据帧重复数据

　　打印(df。drop _ duplicates([ Seqno ])#按照序号来去重

　　价格序列号符号时间

　　0 1623.0 0.0 APPL 1473411962

　　4 1649.0 1.0 APPL 1473411963

　　# drop _ dujplicates()第二个参数保持包含的值有：first、last、False

　　打印(df。drop _ duplicates([ Seqno ]，keep= last )#保存最后一个

　　价格序列号符号时间

　　3 1623.0 0.0 APPL 1473411963

　　4 1649.0 1.0 APPL 1473411963

　　以上就是大蟒去重函数是什么的详细内容，更多请关注盛行信息技术软件开发工作室其它相关文章！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。