python查找重复文件,python筛选文件夹里的图片

  python查找重复文件,python筛选文件夹里的图片

  步骤

  1.首先按照图片的大小(字节)对所有图片进行分类,然后进行分类对比。

  2.重复的图片可能会连续出现(因为重复的图片大小相同)

  如果要判断文件夹中是否有相同的图片,需要对文件夹中的所有图片进行分类,逐一判断两张图片是否相同。

  如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。

  实例

  if__name__==__main__:

  Load_path=E:\\测试图片集(未删除重复项) #要删除重复项的文件夹

  save _ path= e : \ \ Test Photo Collection(重复照片) #一个空文件夹,用于存储检测到的重复照片。

  os.makedirs(save_path,exist_ok=True)

  #获取图片列表file_map,dictionary {文件路径filename:文件大小image_size}

  file_map={}

  image_size=0

  #遍历文件路径下的文件和文件夹(包括子目录)

  forparent,dirnames,filename sinos . walk(load _ path):

  # fordirnameindirnames:

  #print(parentis%s,dirnameis%s%(parent,dirname))

  forfilenameinfilenames:

  #print(parentis%s,filenameis%s%(parent,filename))

  # print( thefullnameofthefile is % s % OS . path . join(parent,filename))

  image _ size=OS . path . getsize(OS . path . join(parent,filename))

  file _ map . set default(OS . path . join(父级,文件名),image_size)

  #获取的图片列表按文件大小image_size排序。

  file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)

  file_list=[]

  对于文件名,image_sizeinfile_map:

  文件列表.追加(文件名)

  #取出重复的图片

  file_repeat=[]

  对于currIndex,filenameinenumerate(file _ list):

  dir _ image1=file _ list[currIndex]

  dir _ image2=file _ list[currIndex 1]

  Result=比较两张图片是否相同(dir_image1,dir_image2)

  If(result==两张图一样):

  file _ repeat . append(file _ list[currIndex 1])

  打印( \ n某些图片:,file _ list [currindex],file _ list [currindex 1])

  else:

  打印( \ n不同的图片:,file _ list [currindex],file _ list [currindex 1])

  currIndex=1

  ifcurrIndex=len(file _ list)-1:

  破裂

  #将重复的图片移动到一个新文件夹中,以消除与原文件夹的重复。

  forimageinfile_repeat:

  shutil.move(image,save_path)

  Print(去除重复照片:,image)以上是python判断文件夹中重复图片的方法。希望对你有帮助。更多python学习方向:Python基础课程

  本教程运行环境:windows7系统,Python 3.9.1,DELL G3电脑。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • windows下cmd中切换路径与目录查看,cmd怎么切换路径到文件夹
  • windows下cmd中切换路径与目录查看,cmd怎么切换路径到文件夹,cmd命令打开及切换目录路径的实现
  • wget下载文件到指定目录,wget下载整个文件夹
  • wget下载文件到指定目录,wget下载整个文件夹,wget下载整个网站(整个子目录)或特定目录
  • u盘exe病毒如何根除,如何根除U盘文件夹exe病毒
  • u盘exe病毒如何根除,如何根除U盘文件夹exe病毒,U.EXE病毒删除方法
  • svn在eclipse中的使用,eclipse不显示svn路径,Eclipse设置svn忽略文件或文件夹(svn-ignore)的操作
  • Linux系统删除文件夹命令,linux系统中删除文件的命令
  • Linux系统删除文件夹命令,linux系统中删除文件的命令,Linux系统删除文件夹和文件的命令
  • jsp 上传文件夹,jsp多文件上传
  • jsp 上传文件夹,jsp多文件上传,JSP组件commons-fileupload实现文件上传
  • dos 删除文件夹命令,dos 删除文件夹 目录不是空的
  • dos 删除文件夹命令,dos 删除文件夹 目录不是空的,dos 删除文件夹 rd
  • Win10共享文件夹怎么设置访问密码,win10共享文件夹设置密码后没有权限访问
  • win10用户的文件名怎么改,window10怎样更改用户文件夹名称
  • 留言与评论(共有 条评论)
       
    验证码: