python docx读取word的表格,python如何读取word文档
Word看起来很复杂,不方便结构化。其实word文档大概有几种内容:段落、表格、字符。我现在要分析的word文档基本都是段落和表格。本文主要讲述了从word中分析表格,构造表格信息的方法。
1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。
2、安装后,就可以读取word文件。
importdocx
Fn=rD:长恨歌. docx doc=docx.document (fn) #逐段阅读所有数据
paragraph doc . paragraphs 3360 print(paragraph . text)#根据表格读取所有数据。
fortableindoc . tables : for rowin table . rows : force llirow . cells : print(cell . text)
Table_num=len(doc.tables)#获取文档的表格数
打印(表格编号)
Table_0=doc.tables[0]#选择第一个表格
Table_rows=len(table_0.rows)#获取第一个表格中的行数
打印(表格行)
Tab=doc。表格[0]。行数[0]。cells [0] #获取第一个表格的第一行第一列中的数据
打印(tab.text)
Par=doc.paragraphs[2]#读取第三个数据
Print(par.text)以上是python在word中读取表格内容的方式。希望对你有帮助。更多python学习方向:Python基础课程
本教程运行环境:windows7系统,Python 3.9.1,DELL G3电脑。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。