python 文档处理,python处理word文档格式
大家好,我是麻辣。
之前跟大家分享过一个:《Python实例篇:自动操作Excel文件(既简单又特别实用)》。
根据很多粉丝的反馈,很有用,所以在群众的号召下,今天再给大家来一波Python操作Word文档。我已经更新分享很久了,所以你订阅我的博客不会错的。
平时大家在工作学习中都会操作Word文件格式,尤其是在数据量很大的时候。人工识别操作非常容易出错。今天我就带大家用python来处理Word文件。
前言工具生成word案例阅读操作Word文档摘要:
工具python3.7
路径
超过
python-docx
使用以下代码生成一个Word case以创建一个demo.doc文档:
从docx导入文档
从docx.shared导入Cm,Pt
从docx.document将文档导入为Doc
#建立文档对象
文档=文档()
#操作文档标题
Document.add_heading(这是python写的!,0)
#操作段落文本
P=document.add_paragraph(我喜欢python,因为它可以做很多事情.)
#段落添加内容
run=p . add _ run(‘每个人也可以学!’)
#加粗跑步内容
run.bold=True
#设置运行字体
run.font.size=Pt(18)
#标题级别设置
Document.add_heading(我是一级标题,level=1)
#操作图片(图片所在的路径)
Document.add_picture(刘亦菲. png ,width=cm (5.2))
#添加有序列表
document.add_paragraph(
我被命令列表1 ,
)
document.add_paragraph(
我被命令列表1 ,
)
#添加一个无序列表
document.add_paragraph(
我是无序列表1 ,
)
document.add_paragraph(
我是无序列表2 ,
)
#设置表格内容
记录=(
(“孙悟空”,“男”,“1111-1-1”),
(《白》,《女》,《2222-2-2》)
)
#添加表格,行设置行列设置列
table=document . add _ table(rows=1,cols=3)
hdr_cells=table.rows[0]。细胞
#设置列名
Hdr_cells[0]。text= name
Hdr_cells[1]。text=性别
Hdr_cells[2]。text=出生日期
#操作写入线
对于记录中的姓名、性别、生日:
row_cells=table.add_row()。细胞
row_cells[0]。text=name
row_cells[1]。文本=性
row_cells[2]。text=生日
#保存文档文档
Document.save(demo.docx )具有以下效果:
更多属性设置请参考官方文件:https://python-docx.readthedocs.io/en/latest/index.html
阅读word文档的现有文档,如下所示:
读取代码:
从docx导入文档
从docx.document将文档导入为Doc
#获取文档路径并循环读取内容
Doc=Document(离职证明. Docx) #类型:doc
对于no,p in enumerate(文档段落):
print(no,p.text)的效果如下:
如果需要批量操作,可以使用字典组织数据类型,如名称、开始时间、结束时间、作业等。然后用循环写文件批量生成这样的文档。
总结:当需要批量操作文档时,可以使用python-docx库进行操作,可以大大提高工作效率。如果需要更多的属性操作,请参考上面的官方文档。
本文五包辣条
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。