python爬虫如何去掉标签,去掉html标签
大蟒去除超文本标记语言标签的方法:1 、" pattern.sub(,html)"方法;2、“BeautifulSoup(html, html.parser )”方法;3、“response.xpath(string .))"方法。
本文操作环境:windows7系统、python3.6.4版,戴尔自交第三代电脑。
大蟒去除超文本标记语言标签的几种方法
进口是
从bs4导入美丽的声音
从什么是导入诡异又阴森的树形灯
html=p你好/pbr/font哈哈/fontb大家好/b
# 方法一
模式=re.compile(r[^],re。s)
result=pattern.sub(,html)
打印(结果)
br#方法二
soup=BeautifulSoup(html, html.parser )
print(soup.get_text())
# 方法三
响应=etree .HTML(text=html)
#打印(目录(响应))
print(response.xpath(string .)))
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好【推荐:python视频教程】以上就是大蟒怎么去除超文本标记语言标签的详细内容,更多请关注盛行信息技术软件开发工作室其它相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。