python 怎样从word文档中提取特定信息,python读取word文档中的数据
首先读取数据,然后根据正则表达式进行过滤,最后输出过滤结果。
我得到了can数据,因为我可以读取txt文件。不是一般的CSV文档。
文件的屏幕截图
数据格式
数据格式混乱。
进口熊猫作为PD
将numpy作为np导入
进口re
if __name__==__main__ :
file=open()/users/Qiao/desktop/ASC _ to _ CSV/logging _ 2。ASC ,mode=r ))
data=file.readlines(
#file.close(
findword=u (。33D。)
lastlist=[]
对于数据中的行:
#result=re.match([2][6][0],line ) ) ) ) ) ) ) 652
pattern=re.compile .
results=pattern.findall(line))。
str=“”。join(结果))).
f1=打开( text2.txt , a ,编码=utf-8 )
F1。write (str))。
是,打印(字符串)
#对于结果中的结果:
#lastlist.append(result))。
# list=set(最后一个列表))
#打印(列表)
#对于列表中的l:
#打印(左))
# F1=打开( text1.txt , a ,编码=utf-8 ).
# f1。写(L))。
#打印(结果)
f1.close()).
可以通过通常的文件读取操作来获得文件信息。
如果要过滤信号,必须根据过滤条件读取每行的read行。
这样,每一行数据的数据都以列表的形式存在于数据中。
通过添加过滤条件
findword=u (。33D。)
即选择33D的整行。
然后创建一个文件并保存到一个文件中,最初是列表格式的数据。他不能保存数据。列表格式必须转换为字符串格式。
str=“”。join(结果))).
然后保存到文件并关闭文件。
结束了。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。