如何筛选出excel表中重复数据,python筛选出重复数据
要求
前段时间有个朋友问能不能写个脚本,快速从execl表单中分离出重复数据和非重复数据。想想看,好像python实现起来更快。我花了一段时间写了下面的脚本。
准备环境
Python版本:3.6.2
用python3.6写的,用python2.7的话应该是兼容的。
如果您使用python2.7,记得在文件前面加上前缀
# -*-编码:utf-8 -*-
否则文件中的中文会报错,所以推荐Python3。
开发环境:Archlinux
在Linux下开发测试,但在windows下运行应该没问题。
包装:xlrd xlwt
Xlrd用于读取execl表中的数据;Xlwt用来写execl文件。直接用pip install安装即可。
pip安装xlrd
Pip xlwt代码
必需的模块
获取重复的行号。
将它写入文件。
主功能运行处理
地址:3359gitee.com/jalright/scripttodo/blob/master/unique _副本. py
(标题里的代码格式会比较乱,放这里吧)
施用方式
例如:1.xlsx
将代码保存为unique_duplicate.py,输入终端或dos。
python唯一_重复. py 1.xls
生成结果:
如果需要比较指定的列,请在文件名后指定(如果只指定第一列,则比较第一列到最后一列的数据)。
比较第二列之后的数据
python唯一_重复. py 1.xls 2
比较第二列和第五列的数据:
python unique _ duplicate . py1 . xls 2 5摘要
起初,脚本只是直接比较一整行数据。后来朋友要求越来越多,然后代码越来越长。想找时间修改一些,写一些备注之类的,然后就没时间了。如果我有时间复习,反正我可以用。
一点点积累会让你走得更快!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。