python遍历文件夹下所有文件,python读取文件夹中的所有文件
遍历目录读取操作系统代码。walk))文件目录遍历
遍历代码
前几天做了excel拼接的预处理。一开始我以为拼接有多难,但是拿到源文件真的崩溃了。一个大文件有几个小文件,到处都是excel文件。另外,每个excel文件中工作表的页数和名称都乱七八糟,毫无规律可言。每一张excel表格都充满了各种人为的痕迹,东一榔头,西一棒子,都是以前的业务员插的透视表。简而言之,这是一个非常脏的数据集。
然后,我们来一个一个的阅读暴力扫描方法。先读取数据。那么清洁问题一定是一场灾难。
下面的代码用于读取包含子文件夹的大文件夹下的所有excel文件,并读取excel的所有shell页面上的数据。
importadaaspdimportosdfs=PD . data frame(# OS . walk)file_path是file _ path下root_dir的所有子文件夹和文件,遍历sub_dir源数据):ForFileInfiles: iffile.endswith(。xlsx): #绝对路径文件名=os.path.filesheet _ name=none)。keys(是excel表格中所有表页的名称,ForSheetinpd。Read _ Excel(文件名,获取工作表名=无)。keys sheet _ name=sheet)Excel _ name=file . replace(。xlsx ," ")#增加两列记录数据所属的excel页和sheet页的步骤非常有用,因为我在清理后续数据的时候遇到了莫名其妙的数据而不知道。
1) Root是指当前正在遍历的该文件夹的地址。
2) dirs是一个列表,内容是这个文件夹中所有目录的名称。不包括子目录。
3) files是同一个列表,其中包含该文件夹中的所有文件名。不包含子目录。
我们实际使用中最常用的返回值是文件。
#目录中的所有最终文件名都是root、dirs、filesinos . walk(r c:(users)Desktop 652020.9-12)):print(files)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。