Python代理服务器,python使用代理访问外网

  Python代理服务器,python使用代理访问外网

  啥也不说,先上代码

  #-*-编码:utf-8-*-#-*-编码:utf8-*-导入URL lib 2导入美汤导入codecsUser _ Agent= Mozilla/5.0(Windows NT 6.3;wow 64 RV:43.0)Gecko/2010 01 01 Firefox/43.0 header={ } header[ User-Agent ]=User _ Agenturl= http://www .西祠戴笠。 req=URL lib 2 .Request(url,headers=header)RES=URL lib 2。urlopen(请求).read()soup=BeautifulSoup .美汤(RES)IPS=汤。查找所有( tr )f=编解码器。打开(./proxy , w , utf-8)for x in range(1,len(IPS)):IP=IPS[x]TDS=IP。find all( TD )IP _ temp=TDS[1].内容[0] \t tds[2].contents[0] \ n f . write(IP _ temp)f . close()import URL Li导入套接字套接字。setdefaulttimeout(3)f=open(./proxy)fd_proxy=codecs.open( ./access.txt , w , utf-8 )lines=f . readlines()proxy=[]for I in range(0,len(lines)): ip=lines[i].条带( \n ).split( \ t )proxy _ host= http:// IP[0]: IP[1]proxy _ temp={ http :proxy _ host } proxy。追加(proxy _ temp)URL= http://IP。chinaz。com/getip。proxy:try:RES=URL lib中代理的“aspx”。urlopen(URL,proxy=proxy).read()FD _ proxy。write(proxy[ http ] \ n )打印RES异常,e:打印代理打印e继续f . close()FD _ proxy。关闭()我们获取的代理服务器网址位于http://www.xicidaili.com/nn/1

  里面会经常更新可用的代理服务器ip,如图所示

  在旅行队浏览器页面右键弹出快捷菜单,选择显示页面源文件就能看到如下界面:

  我们先获得tr字段,然后从tr字段中选择互联网协议(互联网协议的缩写)地址所在的任务描述字段就能把代理服务器地址给提取出来,同样的方法提取端口号,然后保存为文件代理人。

  保存下来后,不能保证每一个代理服务器地址都是可以连接的,需要进行测试,后半部分代码就是把保存在代理人文件中的互联网协议(互联网协议的缩写)地址一个个拿出来,通过访问页面http://ip.chinaz.com/getip.aspx进行测试。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: