用python批量处理excel,python办公自动化教程百度资源

  用python批量处理excel,python办公自动化教程百度资源

  本文主要为大家介绍Python办公自动化批量处理文件实现实例,有需要的朋友可以借鉴一下,希望能有所帮助。祝大家进步很大,早日升职加薪。

  00-1010简介需求分析Python实现结论

  

目录

  不难说,工作中最麻烦的事情就是用同样的方法处理一堆文件夹里的文件,但是很复杂。所以一定要记得使用Python遇到机械操作的时候要合理偷懒!今天我用Python通过处理微博的热搜数据来批量处理文件夹中的文件,主要会涉及到:

  Python批量读取不同的文件夹()Pandas数据处理()Python操作Markdown文件()

  

引言

  先说明一下需要完成的任务。这是我们的文件夹结构。

  因为没有办法爬微博的历史热搜,所以只能写一个爬虫每天定时抓取保存热搜,所以我在分析数据的时候,用了上图所示的数据。日常数据以玩偶的形式保存在三级目录中,热搜保存在markdown文件中。我打开就是这种情况。

  我要做的就是把这三个月的微博热搜数据处理成这样。

  这很难吗?如果手动的话,你只要依次点击三次,进入日常数据文件夹,然后打开md文件,手动复制粘贴到Excel中即可。如果没有几万块的数据,可以一整天不吃饭!现在我们来看看如何用Python光速处理。

  

需求分析

  在操作之前,我们先思考一下如何使用Python。其实和手工流程差不多:先把所有文件都读完,然后每天处理保存数据。所以第一步是提取我们需要的所有文件路径,先导入到相关的库中。

  进口熊猫作为pd

  导入操作系统

  导入全球

  从pathlib导入路径

  读取所有文件名的方法有很多,比如使用OS模块。

  但是由于我们是多层文件夹,使用OS模块只能一层一层的读取,写多个循环效率很低,所以告别os.path,使用Pathlib进行操作,三行代码就可以完成。见评论。

  从pathlib导入路径

  p=Path(/users/liuhan Shuo/desktop/hot search data/)#初始化并构造Path对象

  File=list (p.glob (* */*。md)) #获取所有降价文件`/pre

  看看结果吧。

  成功读取热搜数据下多层文件夹中的所有md文件!但是新的问题来了。每天有两个热搜总结,一个在11点,一个在23点。考虑到将会有重合的数据,我们将在处理它们之前对它们进行去重复,这很简单。不管是用正则表达式,还是按奇偶位置提取,这里我用lambda表达式来得到。

  file=list(filter(lambda x : str(x))。find (23磅)=0,FileList))

  现在我们每天只剩下23个热搜数据。虽然它是一个markdown文件,但Python仍然可以轻松处理它。让我们打开其中的一个看看。

  使用with语句打开文件的方式和打开其他文件的方式类似,返回一个列表,但是这个列表不能被我们直接使用。第一个元素包含时间,后面几天的热搜和热度不直接存储,包含一些markdown语法中无用的符号和换行符。清理这些数据是常规操作。就用下面这段代码,主要用正则表达式,读注释。

  用打开(文件)作为f:

  lines=f.readlines()

  Lines=[i.strip() for i in lines] #删除空字符

  数据=列表(过滤器(无,行))

  删除数据[0]

  数据=数据[0:100]

  Date=re.findall (year(。)2 ,字符串(文件))[0]

  内容=数据[:2] #奇偶校验分区

  rank=data[1:2]

  #摘录内容和排名

  对于范围内的I(len(content)):

  content[i]=re.findall(、(。),内容[i])[0]

  对于范围内的I(len(rank)):

  rank[i]=re.findall((。),排名[i])[0]`的

  最后,您只需要编写一个遍历每一天的文件并清理它,然后创建一个DataFrame来存储每一天的数据。

  如你所见,我们没有使用太复杂的代码就成功地实现了我们的需求!

  

Python实现

  以上是用Python解放双手,再次偷懒的案例。你可能在日常工作中读不到Markdown文件,但是通过这个案例,希望你能学会如何批量处理文件夹,批量读取清理数据。更重要的是,在工作和学习中,遇到需要重复运算的任务时,能想到用Python自动解决吗?

  源代码

  以上是Python OA批处理文件实现实例的详细内容。关于Python OA批处理文件的更多信息,请关注盛行IT软件开发工作室的其他相关文章!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: