python获取网页标签中的内容,selenium 获取标签内容
driver.page_source硒的页面_来源方法可以获取到页面源码
跟爬虫有点相似,获取到页面资源,提取出我们需要的信息
案例以煎蛋网为例,获取首页的全部标题(获取页面源码-使用是正则提取需要的标题)
代码
#编码:来自selenium的utf-8导入webdriverimport重新分类简丹():def _ _ init _ _(self):self。浏览器=网络驱动程序.chrome()self。浏览器。get( http://jandan。net/)自我。浏览器。最大化_ window()self。浏览器。隐式_等待(3)def get _ page _ title(self):self。page=self。浏览器。page _ source #非贪婪匹配,匹配所有满足target=_blank ./a/h2 格式的信息,结果显示是一个列表自我。标题=回复。find all(r target= _ blank (*?)/a/h2 ,自我。页)为标题在自我。titles:print(title)if _ _ name _ _= _ _ main _ _ :Jian _ Dan=简丹()剑_丹。get _ page _ title()结果
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。