python自动办公,python在自动化办公的应用
知乎有人问:使用python进行办公自动化需要学习哪些知识?
这可能是很多非IT专业人士面临的困惑,想在工作中使用python,却不知道怎么做?
Python在办公自动化领域越来越普及,批量处理是加班族的福音。
办公自动化无非就是excel、ppt、word、邮件、文件处理、数据分析处理、爬虫。这次我就来打理一下python自动化办公的那些知识点。
Python基金会
Excel自动化
Ppt自动化
文字自动化
邮件处理
文档的批处理
数据处理和分析
自动化爬虫
以下是详细的解释。
Python基金会
做这个的前提条件是会用Python,至少熟悉基本语法,会写小脚本。
对于python语法的要求,可以根据python基础教程查一下需要学什么,找个免费视频教程跟着学,然后多练习打代码。如果你习惯阅读,可以买一本入门的python书籍,以备将来参考。
语法
主要内容
基本数据类型
不可变数据(3):数字(Number),字符串(String),元组(Tuple)
可变数据(3):列表(List)、字典(Dictionary)和集合(Set)
运算符
算术运算符、逻辑运算符、赋值运算符、比较运算符、按位运算符.
数字类型
整数(Int)、浮点(float)、复数(complex)
条件控制语句
如果. 否则如果.else语句
循环语句
While语句,for语句
功能
定义函数、函数调用、参数传递、匿名函数.
重复
迭代、迭代器、生成器、生成器表达式
文档功能
Open()函数,read,readline,readlines,write.方法
操作系统模块
处理系统文件和目录
组件
模块导入、通用标准模块和通用第三方库
错误和异常
Try/except语句
面向对象的
简单掌握一下面向对象的概念。
语法是关键。在学习其他工具库之前,必须了解python编程的基本概念。
否则会很痛苦。
Excel自动化
办公室一族其实可以用VBA解决自动化问题,但是很多人可能不会用。
python excel的第三方库有很多,比如xlwings,xlsxwriter,xlrd,xlwt,pandas,xlsxwriter,win32com,xlutils等等。
这些库可以很容易地添加、删除、重写和格式化修改excel文件。当然,不建议你全部尝试,那样会耗费太多时间。Xlwings和熊猫就够了,基本可以解决excel自动化的所有问题。
Xlwing不仅可以读写excel,还可以进行格式调整和VBA操作,功能非常强大,简单易用。
我之前写过xlwings的入门教程:
Xlwings,让excel飞起来!
Pandas是一种常见的数据处理工具。还支持excel的读写,界面友好。这个后面会讨论。
如果对python自动处理excel感兴趣,也可以买一本专门的教材来看。
Ppt自动化
Python当然支持ppt的自动处理。主要的库是pywin32com和pptx,可以创建和修改ppt文件。
推荐pptx库,目前主流的ppt处理库。
文字自动化
操作python Word的库:
Python-docx,导入docx:仅对windows平台有效
Pypiwin32,导入win32com:跨平台,但不能处理doc格式的word文本,这种格式不是基于xml的。
Textract,导入textract:兼顾了“doc”和“docx”,但是安装过程需要一些依赖关系。
可以用python批量生成word文件。建议用docx,不需要太多。
邮件处理
Python处理邮件也极其方便。smtplib、imaplib、email配合使用,实现邮件的撰写、发送、接收、阅读等一系列自动化操作,省时省力。
看了很多其他教程,有各种各样的问题需要不断修正,可以先运行上面的代码。
文档的批处理
文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等。如果手工的话,真的会很累。
Python在处理批量操作方面有着独特的优势,成千上万的文件修改可能只需要几秒钟。
Os python是一个文件操作的库,可以在电脑上添加、删除、检查文件。
方法
功能
os.chdir(路径)
更改当前工作目录
os.getcwd()
返回当前工作目录
os.listdir()
返回由path指定的文件夹中包含的文件或文件夹的名称列表。
os.makedirs(路径[,模式])
创建一个名为path的文件夹
os.remove(路径)
删除路径为的文件。
.
.
数据处理和分析
我是做数据分析的,python基本上是主要工具,所以这一块无疑是python自动化办公最有价值的部分。
数据处理的数据库主要有pandas,numpy,matplotlib,sklearn。
Pandas是一个不断改进的python数据科学库。其数据结构非常适合数据处理,熊猫融入了大量的分析函数方法、常用的统计模型和可视化处理。
如果使用python进行数据分析,数据预处理中几乎90%的工作都需要熊猫来完成。
熊猫已经在一些企业对分析师的考题中作为必选工具,所以如果你想成为一名数据分析师,请努力学习使用熊猫。
Numpy是python的数值计算库,包括熊猫在内的很多分析库都是基于numpy。
numpy的核心功能包括:
Ndarray,一种快速且节省空间的多维数组,具有向量算术运算和复杂广播能力
标准数学函数,用于快速运算整组数据(无需编写循环)
读写磁盘数据的工具和操作内存映射文件的工具。
线性代数、随机数生成和傅立叶变换函数
一个C API,用于集成用C、C、Fortran和其他语言编写的代码
Numpy对于数值计算尤其重要,因为它可以有效地处理大型数据数组。这是因为:
与Python的内置序列相比,numpy数组使用的内存更少。
Numpy可以对整个数组进行复杂的计算,而不需要Python的for循环。
Matplotlib和seaborn是python的主要可视化工具。建议大家都学一学。数据呈现和数据分析一样重要。
Sklearn和keras,sklearn是python机器学习库,涵盖了大部分机器学习模型。Keras是一个深度学习库,里面包含了高效的数值库Theano和TensorFlow。
这些都是众所周知的存储库,强烈推荐学习它们。
之前写过很多关于python数据分析处理的回答和文章,这里就不赘述了。
自动化爬虫
相信爬虫大家都很感兴趣。python爬虫有很多实现库,如urllib、requests、scrapy等。以及xpath、beautifulsoup等解析库。
爬虫入门容易,学起来难,所以初学者可以尝试写一些简单的爬虫,比如豆瓣,知乎,微博。
其他的
其他不常见的自动化办公库,比如处理pdf,图片,视频,音频,这里就不介绍了。
有兴趣的可以在本文末尾留言。你用过哪些python库,解决过哪些问题?
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。