python 爬虫 多线程,python 线程并发

  python 爬虫 多线程,python 线程并发

  大蟒并发编程实战(四):使用多线程,python爬虫被加速10倍_wx5de339d64c54e的技术博客_博客

  大蟒创建多线程的方法

  单线程、多线程爬取博客园速度对比tmp/blog_spider.py

  导入请求

  URL=[

  fhttps://www.c.com/#p{page}

  对于范围(1,50 ^ 1)中的页面

  ]

  定义抓取(网址):

  r=requests.get(url)

  打印(url,len(r.text))

  爬网(URL[0])01。多线程爬行。巴拉圭

  导入博客_蜘蛛

  导入线程,时间

  极好的单线程():

  打印(单线程开始)

  对于blog _ spider.urls中的网址:

  blog_spider.craw(网址)

  打印("单线程结束")

  极好的多线程():

  打印(单线程开始)

  线程=[]

  对于blog _ spider.urls中的网址:

  线程。追加(

  穿线Thread(target=blog_spider.craw,args=(url,))

  )

  对于螺纹中的螺纹:

  thread.start()

  对于螺纹中的螺纹:

  thread.join()

  打印("单线程结束")

  if __name__==__main__ :

  start=time.time()

  单线程()

  end=time.time()

  打印(单线程成本: ,结束-开始,秒)

  start=time.time()

  多线程()

  end=time.time()

  打印(多线程开销: ,结束-开始,秒)爬取速度对比

  可以看到,速度足足提高了8倍,当然和电脑的性能也有关系

  单线程

  多线程

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: