xml报文中文乱码,python解决中文乱码
用大蟒解析可扩展标记语言文件,出现异常信息如下:
XML。解析器。外籍人士。expat错误:格式不正确(无效令牌):第13行,第31列相关推荐: 《Python入门教程》
解决方式:
将文件重新编码成utf-8格式就可以了。
在Linux操作系统操作系统下一种取巧的解决方式:
对于中文,这里选了一种取巧的方法。即先通过编码转换命令将可扩展标记语言文件变成utf-8格式,然后将可扩展标记语言中指定编码格式的内容去掉即可。
可参考如下代码:
cmd= iconv 文件名-t utf-8 utf。 tmp
操作系统(cmd)
utf_filename=utf.tmp
f=打开(utf _文件名)
data=f.read()
f.close()
操作系统( rm-futf.tmp )
#-deletetheencodetypeinxmlfile-
#result=re.sub(regex,newstring,subject)
数据=数据。替换( encoding= GB 2312 ,)
数据=数据。替换( encoding= GB 2312 ,)
#self.dom.unlink
自我。DOM=XML。多姆。迷你王国。解析字符串(数据)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。