python tkinter 下拉选择框,python单选框

　　如何识别Word文档前言中的复选框一、程序思路和准备程序思路：准备：二、准备。使用步骤1。导入库2。将Word文档转换成html，在3中读取。用Xpath III提取所需的数据。总结遇到的问题。

　　前言：我在将Word文档中的数据汇总成Excel表的过程中遇到了一个问题(《小菜鸟：将Word文档中的数据汇总成Excel表》的Python Note 001)。我无法通过直接提取文档中的check控件来识别它是否被选中。我在网上找了很久，也没有找到相应的解决办法。我苦思良久，终于想出了一个曲折的方法。如果有更好的方法，请来和我交流！

　　一、程序思路和编写程序思路：我觉得，我用win32com库调用Word打开，然后不能直接提取。Word是如何识别然后显示的？后来我想，如果转换成html，浏览器能识别吗？我试了一下，用浏览器打开，能够正常显示。我再次打开调试模式，找到了复选框对应的标签。我发现html中选中的复选框的符号是或 r ，未选中的是“o”或“…”。于是我想到了以下方法：

　　1.将Word文档转换为html格式。

　　2.读入html文件

　　3.用Xpath提取相应的标签信息

　　4.判断是否打勾。

　　准备：这里使用了lxml库中的etree函数，可以将html转换成xpath可识别的xml。

　　二。使用步骤1。从lxml导入etree 2引入库。将Word文档转换成html，读入html _ path= d:\ t5 . HTML doc . Save as(HTML _ path，8) #另存为HTML，8代表HTML doc . close()f=codecs . open(HTML _ path， r ，Gbk )# Read HTML Content=f . Read()f . close()tree=etree.html(Content)3 .用Xpath Found=tree . Xpath(/html/body/div/div/table/tr[18]/TD[4]/p[1 Span[2]/text())[0]#用Xpath提取数据。xpath路径可以在浏览器调试模式下复制，not found=tree . XPath(/html/body/div/div/table/tr[18]/TD[4]/p[2]/span[2]/text(=not found):# judge which _ found= developed elif((not found== )或(not found== r )(found=not found):which _ found= undified else:when _ found= error III .用xpath提取数据时遇到的问题，我用浏览器复制了xpath路径，但是无论如何都提取不出来。我尝试了很多次提取一个空列表，然后在网上查了一下。原来浏览器有时候会添加一些标签进行展示，而且在使用中。上面我提到过，xpath路径是/html/body/div/div/table/tr[18]/TD[4]/p[1]/span[2]/text()，但是从浏览器复制过来的是/html/body/div/tbody/table/tr[11我当时觉得不是这个原因，所以遇到这样的问题，不妨先检查一下xpath路径是否正确。

　　总结以上方法很曲折，程序运行很慢，但我只能想到这个方法。如果你有更好的方法，请来和我交流！

　　第一次写技术分享文章，较为粗略，有问题可以私信和我交流！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读