python查找列表中的重复值,python检查列表重复元素

  python查找列表中的重复值,python检查列表重复元素

  查找A文件中,与B文件中内容不重复的内容

  #!usr/雪白的高山/python

  导入系统

  导入操作系统

  字符串查找函数,使用二分查找法在列表中进行查询

  极好的雪白的高山阿里搜索(值,行):

  right=len(lines) - 1

  左=0

  a=value.strip()

  而左=右:

  middle=int(右左1)/2)

  b=线条[中间]。条状()

  如果a==b:

  返回一

  如果一个乙:

  右=中间- 1

  否则:

  左=中间一

  返回0

  DPT=100000 # DPT是每个文件的数据的意思

  fileAName=sys。argv[1];

  文件bname=sys。argv[2];

  #第一步:先拆掉B文件,作为比较基准,临时文件命名为温度1、温度2、温度

  打印(拆分比对文件.\n )

  fB=open(fileBName)

  tempFileNo=1

  temp filename="temp { 0 } " .格式(tempFileNo)

  fTemp=open(tempFileName, w )

  line=fB.readline()

  lineCount=0

  正在…行:

  如果lineCount=DPT:

  fTemp.flush()

  fTemp.close()

  tempFileNo=tempFileNo 1

  temp filename="temp { 0 } " .格式(tempFileNo)

  fTemp=open(tempFileName, w )

  lineCount=0

  fTemp.write(行)

  行数=行数一

  line=fB.readline()

  fTemp.flush()

  fTemp.close()

  fB.close()

  打印(拆分完成,一共{0}个临时文件,{1}条数据\n .格式(临时文件号,(临时文件号-1)*DPT行数)

  #第二步:把A文件与B文件拆出来的临时文件逐个进行比较,将结果轮流写入文件结果0,结果一

  # 最后写入的结果文件就是最终结果

  fA=打开(文件名)

  resultTempFile={result0 , result 1 };

  tempIndex=0

  fOut=打开(重复, w )

  repeatCount=0

  对于我加入范围(1,临时文件号1):

  打印(比较第{0}个临时文件.\n .格式(一))

  如果0==tempIndex:

  resultTempFile=result0

  tempIndex=1

  否则:

  resultTempFile=result1

  tempIndex=0

  fResult=open(resultTempFile, w )

  fTemp=open(temp{0}).格式(一))

  lineSet=fTemp.readlines()

  fTemp.close()

  lineList=list(lineSet)

  lineList.sort()

  line=fA.readline()

  正在…行:

  如果0==雪白的高山阿里搜索(行,行列表):

  fResult.write(行)

  否则:

  写(行)

  重复计数=重复计数一

  line=fA.readline()

  fA.close()

  fResult.flush()

  fResult.close()

  fA=open(resultTempFile)

  fA.close()

  fOut.flush()

  fOut.close()

  打印(比较完成,重复数据{0}条。格式(重复计数))

  os.rename(resultTempFile, result )

  #第三步:结束后把临时文件都删掉

  打印(删除临时文件.\n )

  当临时文件号0:

  temp filename="temp { 0 } " .格式(tempFileNo)

  os.remove(临时文件名)

  tempFileNo=tempFileNo - 1

  打印(脚本结束。\n )

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: