python循环读取文件夹之中的文件,python遍历目录所有文件并读取
本文设想了目录的文件夹结构来读取您想要递归遍历的文件。
想法
首先,遍历父文件夹中的所有内容。如果内容是文件【其他条件,比如读取PDF和Excel】,直接读取。如果没有,递归地重复前面的操作。
文档的结构就不用说了。上菜。首先,让我向您展示文件的结构。
实现代码如下:
print(OS.getcwd(。rsplit((\ )[-1])for iinos . listdir)OS . getcwd)))3360 ifos . path . isdir))t { }。格式(一) )
对应的代码如下。
importsimportdocximportpandasaspddefread _ word(cur _ dir):for子文件inos . list dir(cur _ dir)33365292;遍历该文件夹下的每个文件或文件夹sub _ file _ ABS _ path=OS . path . join(cur _ dir,sub_file) #可能已经拼写为完整路径,完整路径file _ path=OS.path.join (cur)方便使用ifOS.path.isfile(sub_file))判断是否== docx :# docx file FP=docx . document)Content= for infp . paragraphs 3360 Content=p . text data . l document=[file _ path . r split(.
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。