python tkinter 下拉选择框,python单选框

  python tkinter 下拉选择框,python单选框

  如何识别Word文档前言中的复选框一、程序思路和准备程序思路:准备:二、准备。使用步骤1。导入库2。将Word文档转换成html,在3中读取。用Xpath III提取所需的数据。总结遇到的问题。

  前言:我在将Word文档中的数据汇总成Excel表的过程中遇到了一个问题(《小菜鸟:将Word文档中的数据汇总成Excel表》的Python Note 001)。我无法通过直接提取文档中的check控件来识别它是否被选中。我在网上找了很久,也没有找到相应的解决办法。我苦思良久,终于想出了一个曲折的方法。如果有更好的方法,请来和我交流!

  一、程序思路和编写程序思路:我觉得,我用win32com库调用Word打开,然后不能直接提取。Word是如何识别然后显示的?后来我想,如果转换成html,浏览器能识别吗?我试了一下,用浏览器打开,能够正常显示。我再次打开调试模式,找到了复选框对应的标签。我发现html中选中的复选框的符号是或 r ,未选中的是“o”或“…”。于是我想到了以下方法:

  1.将Word文档转换为html格式。

  2.读入html文件

  3.用Xpath提取相应的标签信息

  4.判断是否打勾。

  准备:这里使用了lxml库中的etree函数,可以将html转换成xpath可识别的xml。

  二。使用步骤1。从lxml导入etree 2引入库。将Word文档转换成html,读入html _ path= d:\ t5 . HTML doc . Save as(HTML _ path,8) #另存为HTML,8代表HTML doc . close()f=codecs . open(HTML _ path, r ,Gbk )# Read HTML Content=f . Read()f . close()tree=etree.html(Content)3 .用Xpath Found=tree . Xpath(/html/body/div/div/table/tr[18]/TD[4]/p[1 Span[2]/text())[0]#用Xpath提取数据。xpath路径可以在浏览器调试模式下复制,not found=tree . XPath(/html/body/div/div/table/tr[18]/TD[4]/p[2]/span[2]/text(=not found):# judge which _ found= developed elif((not found== )或(not found== r )(found=not found):which _ found= undified else:when _ found= error III .用xpath提取数据时遇到的问题,我用浏览器复制了xpath路径,但是无论如何都提取不出来。我尝试了很多次提取一个空列表,然后在网上查了一下。原来浏览器有时候会添加一些标签进行展示,而且在使用中。上面我提到过,xpath路径是/html/body/div/div/table/tr[18]/TD[4]/p[1]/span[2]/text(),但是从浏览器复制过来的是/html/body/div/tbody/table/tr[11我当时觉得不是这个原因,所以遇到这样的问题,不妨先检查一下xpath路径是否正确。

  总结以上方法很曲折,程序运行很慢,但我只能想到这个方法。如果你有更好的方法,请来和我交流!

  第一次写技术分享文章,较为粗略,有问题可以私信和我交流!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: