最近在学习Python和网络爬虫,就想到了把两者结合起来,于是有了这篇文章。
不得不说python入门非常简单。在网上查了一下,大部分都是python2的帖子,就随便写了一个python3的。代码很简单,就不解释了。粘贴代码即可。
复制代码如下:# test RDP导入urllib.request导入rebr #账号信息登录数据={}数据['Fromurl']=' '数据['Fromurl Temp']=' '数据['loginid']=' 12345 '数据['password']=' 12344。MSIE 5.5windows)' # log in address # URL=' 3358192 . 168 . 1 . 111:8080/log in check ' post data=URL lib . parse . urlencode(data)post data=post data . encode(' UTF-8 ')Headers={ ' user-agent ':user _ agent } # log in RES=URL lib . request . urlopern(URL,post data)# Get page htmlbrstrResult=(RES . read()。decode(' UTF-8 ')#用正则表达式取出所有A标签p=re.pile。)'.*?(.*?)/a’)for m in p . finder(strresultt):print(m . group(1))# group(1)是href中的内容,group(2)是标签中的文本。
我查看了cookie、异常等的处理。但我没有花时间去处理它们。毕竟我当时只是想通过写爬虫来学习python。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。