用Python实现办公自动化,python自动办公

  用Python实现办公自动化,python自动办公

  知乎有人问:用python进行办公自动化都需要学习什么知识呢?

  这可能是很多非IT专业人士面临的困惑,想在工作中使用python,却不知道怎么做?Python在办公自动化领域越来越普及,批量处理是加班族的福音。

  办公自动化无非就是excel,ppt,word,mail,文件处理,数据分析处理,爬虫。这次我们来看看python自动化办公的那些知识点。

  python基础excel自动化ppt自动化word自动化邮件处理文件批量处理数据处理与分析自动化爬虫.

  python基础能做这些事情的前提是会用Python,至少要熟悉基本语法,会写小脚本。

  对于python语法的要求,可以根据python基础教程查一下需要学什么,找个免费视频教程跟着学,然后多练习打代码。如果你习惯阅读,可以买一本入门的python书籍,以备将来参考。

  主要内容基础数据类型不可变数据(三):数字(Number)、字符串(String)、元组(Tuple)

  数据(3):列表(List)、字典(Dictionary)、集合(Set)运算符算术运算符、逻辑运算符、赋值运算符、比较运算符、位运算符.数字类型整数(int)、浮点(float)、复杂条件控制语句if. 否则如果.else语句循环语句while语句function def定义函数,函数调用,参数传递,匿名函数.迭代迭代过程,迭代器,生成器,生成器表达式文件操作open()函数,read,readlines,write.方法os模块处理系统文件和目录模块模块导入,常见的标准模块,常见的第三方库错误和异常try/except语句都是面向对象的简单掌握面向对象的概念。

  之前编的python基础语法核心部分仅供参考:一文读懂python的map、reduce函数一文搞懂Python迭代器和生成器一文搞懂Python匿名函数一文搞懂Python文件读写一文搞懂Python循环技巧一文搞懂Python错误和异常一文搞懂python日期时间处理

  语法是关键。在学习其他工具库之前,必须了解python编程的基本概念。

  否则会很痛苦。

  excel自动化办公一族其实可以用VBA解决自动化问题,但是很多人可能不会用。

  python excel有很多第三方库可用,比如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。

  这些库可以很容易地添加、删除、重写和格式化修改excel文件。当然,不建议你全部尝试,那样会耗费太多时间。Xlwings和熊猫就够了,基本可以解决excel自动化的所有问题。

  Xlwing不仅可以读写excel,还可以进行格式调整和VBA操作,功能非常强大,简单易用。

  之前给xlwings写过入门教程:xlwings,让excel飞起来!

  以及xlrd和xlwt的使用:教你使用Python批量读写excel文件

  也可以查询xlwings的具体用法(中文摘要):https://www.jianshu.com/p/e21894fc5501https://www.jianshu.com/p/b534e0d465f7https://www.jianshu.com/p/de7efe591c12.

  当然,最好能看到官网的教程:

  https://www.xlwings.org/

  Pandas是一种常见的数据处理工具。还支持excel的读写,界面友好。这个后面会讨论。

  如果对python自动处理excel感兴趣,也可以买一本专门的教材来看。

  ppt自动化python当然支持ppt的自动处理。主要的库是pywin32com和pptx,可以创建和修改ppt文件。

  推荐pptx库,目前主流的ppt处理库。

  学习网站:https://python-pptx.readthedocs.io/en/latest/

  word自动化python操作Word的库:

  python-docx、import docx:仅对windows平台有效pypiwin32、import win32com:跨平台,但不能处理doc格式的word文本。doc格式不是基于xml的textract、import textract:兼顾了“doc”和“docx”,但是安装过程需要一定的依赖。可以用python批量生成word文件。建议用docx,不需要太多。

  学习网站:https://python-docx.readthedocs.io/en/latest/

  邮件处理python处理邮件也极其方便。smtplib、imaplib、email配合使用,实现邮件的撰写、发送、接收、阅读等一系列自动化操作,省时省力。

  我写过发送邮件的教程,亲测可用:干货 解放双手,用Python实现自动发送邮件

  看了很多其他教程,有各种各样的问题需要不断修正,可以先运行上面的代码。

  文件批量处理文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等。如果手工的话,真的会很累。

  Python在处理批量操作方面有着独特的优势,成千上万的文件修改可能只需要几秒钟。

  Os python是一个文件操作的库,可以在电脑上添加、删除、检查文件。

  学习网站:https://www.runoob.com/python3/python3-os-file-methods.html

  https://

  方法os.chdir(path)改变当前工作目录os.getcwd()返回当前工作目录os.listdir()返回由path os指定的文件夹中包含的文件或文件夹名称的列表makedirs(path[,mode])创建一个名为path os的文件夹remove(path)用path删除文件。

  数据处理和分析我只是做数据分析,python基本上是主要工具,所以这一块无疑是python自动化办公最有价值的部分。

  数据处理的数据库主要有pandas,numpy,matplotlib,sklearn。

  Pandas是一个不断改进的python数据科学库。其数据结构非常适合数据处理,熊猫融入了大量的分析函数方法、常用的统计模型和可视化处理。

  如果使用python进行数据分析,数据预处理中几乎90%的工作都需要熊猫来完成。

  熊猫已经在一些企业对分析师的考题中作为必选工具,所以如果你想成为一名数据分析师,请努力学习使用熊猫。

  Numpy是python的数值计算库,包括熊猫在内的很多分析库都是基于numpy。

  numpy的核心功能包括:

  Ndarray,一个快速且节省空间的多维数组,具有向量算术运算和复数广播能力,是一个标准的数学函数,用于快速运算整组数据(无需写循环),是一个读写磁盘数据的工具,也是一个操作内存映射文件的工具。线性代数、随机数生成和傅立叶变换函数。用于集成C、C、Fortran等语言编写的代码的A C APInumpy对于数值计算尤其重要,因为它可以高效地处理大型数组数据。这是因为:

  相比python的内置序列,numpy数组使用的内存更少,numpy无需Python的for循环就可以对整个数组进行复杂的计算matplotlib和seaborn是Python的主要可视化工具。建议大家学习一下,数据呈现和数据分析一样重要。

  Sklearn和keras,sklearn是python机器学习库,涵盖了大部分机器学习模型。Keras是一个深度学习库,里面包含了高效的数值库Theano和TensorFlow。

  这些都是众所周知的存储库,强烈推荐学习它们。

  之前写过很多关于python数据分析处理的回答和文章,这里就不赘述了。

  好看不火 怎么才有数据分析思路?如何系统地学习Python 中 matplotlib, numpy, scipy, pandas?霸气的发卡入门Python数据科学全教程

  自动化爬虫相信爬虫是大家最感兴趣的。python爬虫有很多实现库,如urllib、requests、scrapy等。以及xpath、beautifulsoup等解析库。

  爬虫入门容易,学起来难,所以初学者可以尝试写一些简单的爬虫,比如豆瓣,知乎,微博。

  所有的箱子都为你准备好了:霸气的发卡如何入门Python爬虫使用requests爬取拉勾网python职位数据实操 从0到1教你用Python来爬取整站天气网

  推荐你学习requests和bs4入门爬虫,并提供相应的中文学习网址:https://2.python-requests.org//zh_CN/latest/.

  https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

  其它其他不常见的自动化办公库,比如处理pdf,图片,视频,音频,这里就不介绍了。有兴趣的可以在本文末尾留言。你用过哪些python库,解决过哪些问题?

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: