python查找列表中的重复值,python检查列表重复元素
查找A文件中,与B文件中内容不重复的内容
#!usr/雪白的高山/python
导入系统
导入操作系统
字符串查找函数,使用二分查找法在列表中进行查询
极好的雪白的高山阿里搜索(值,行):
right=len(lines) - 1
左=0
a=value.strip()
而左=右:
middle=int(右左1)/2)
b=线条[中间]。条状()
如果a==b:
返回一
如果一个乙:
右=中间- 1
否则:
左=中间一
返回0
DPT=100000 # DPT是每个文件的数据的意思
fileAName=sys。argv[1];
文件bname=sys。argv[2];
#第一步:先拆掉B文件,作为比较基准,临时文件命名为温度1、温度2、温度
打印(拆分比对文件.\n )
fB=open(fileBName)
tempFileNo=1
temp filename="temp { 0 } " .格式(tempFileNo)
fTemp=open(tempFileName, w )
line=fB.readline()
lineCount=0
正在…行:
如果lineCount=DPT:
fTemp.flush()
fTemp.close()
tempFileNo=tempFileNo 1
temp filename="temp { 0 } " .格式(tempFileNo)
fTemp=open(tempFileName, w )
lineCount=0
fTemp.write(行)
行数=行数一
line=fB.readline()
fTemp.flush()
fTemp.close()
fB.close()
打印(拆分完成,一共{0}个临时文件,{1}条数据\n .格式(临时文件号,(临时文件号-1)*DPT行数)
#第二步:把A文件与B文件拆出来的临时文件逐个进行比较,将结果轮流写入文件结果0,结果一
# 最后写入的结果文件就是最终结果
fA=打开(文件名)
resultTempFile={result0 , result 1 };
tempIndex=0
fOut=打开(重复, w )
repeatCount=0
对于我加入范围(1,临时文件号1):
打印(比较第{0}个临时文件.\n .格式(一))
如果0==tempIndex:
resultTempFile=result0
tempIndex=1
否则:
resultTempFile=result1
tempIndex=0
fResult=open(resultTempFile, w )
fTemp=open(temp{0}).格式(一))
lineSet=fTemp.readlines()
fTemp.close()
lineList=list(lineSet)
lineList.sort()
line=fA.readline()
正在…行:
如果0==雪白的高山阿里搜索(行,行列表):
fResult.write(行)
否则:
写(行)
重复计数=重复计数一
line=fA.readline()
fA.close()
fResult.flush()
fResult.close()
fA=open(resultTempFile)
fA.close()
fOut.flush()
fOut.close()
打印(比较完成,重复数据{0}条。格式(重复计数))
os.rename(resultTempFile, result )
#第三步:结束后把临时文件都删掉
打印(删除临时文件.\n )
当临时文件号0:
temp filename="temp { 0 } " .格式(tempFileNo)
os.remove(临时文件名)
tempFileNo=tempFileNo - 1
打印(脚本结束。\n )
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。