微博爬虫搜索,爬虫爬取微博

  微博爬虫搜索,爬虫爬取微博

  表tr td背景颜色=橙色本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰,更不会影响计算机信息系统的正常运行。不得将代码用于非法用途,如侵立删!/td /tr /table

  记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?container id=100103 type={ chanenl } & q={ quote(self。words)} page _ type=搜索所有页面={ page }用户信息https://**********?标题=基本资料value={userid} 代理配置==使用袜子需安装:pip install-U requests[socks]==

  def _proxy(self): 调用:return: #判断互联网协议(互联网协议)是否过期new _ time=日期时间。日期时间。现在()如果自我。过期时间和新时间日期时间。日期时间。strptime(self。expire _ time, %Y-%m-%d %H:%M:%S): # #当前时间小于到期时间证明可用# if new _ time日期时间。日期时间。strptime(self。expire _ time, %Y-%m-%d %H:%M:%S): print(f 当前使用IP:{ self。代理}过期时间:{ self。expire _ time } )return Proxy=Proxy()IP _ port,expire _ time=Proxy。main()自我。头=代理。标题本身。Proxy={ http : socks 5://{ } .格式(ip_port), https: socks5://{} .format(IP _ port)} self。过期时间=过期时间根据关键词获取userid def _get_userid(self,response):userid=[]content=JSON。负载(响应)卡=内容[数据][卡]#数据列表对于卡中卡:如果卡[card_type]!=11: # 状态=11返回的是用户数据列表卡[卡_组]:用户id。append(card _ group[ user ][ id ])#用户编号返回用户编号根据使用者辩证码获取信息def _parse_json(self,RES):content=JSON。负载(RES)数据={ }数据[用户id ]=content[ data ][ userInfo ][ id ]# userid data[用户名]=内容[数据][用户信息][屏幕名称] #用户名# 性别性别=内容[数据][用户信息][性别]数据[性别]=女if sex==f else 男数据[微博认证名称]=content[ data ][ userInfo ][ verified _ reason ]#微博认证名称数据[简介]=内容[数据][用户信息][描述] #简介数据[粉丝数量]=内容[数据][用户信息][追随者_计数]#粉丝数量数据[发布微博量]=内容[数据][用户信息][状态计数]#发布微博量数据[关注量]=内容[数据][用户信息][ follow _ count ]#关注量数据[用户头像]=内容[ data ][ userInfo ][ profile _ image _ URL ]#用户头像数据[移动端地址]=内容[数据][用户信息][个人资料url] #移动端地址数据[关键词]=self.words返回数据数据保存def _save_xls(self,data): 保存数据数据:字典格式必须和表头长度一样:return: #判断文件是否存在如果存在则读取然后插入新数据,不存在则创建一个新数据帧并添加表头file=f"{ PATH }/数据/关键词-{self.words} .xlsx Header=[用户id ,用户名, 性别, 微博认证名称, 简介, 粉丝数量, 发布微博量, 关注量, 用户头像, 移动端地址, 关键词]如果不是OS。路径。存在(f"{ PATH }/数据):OS。mkdir(f"{ PATH }/数据)如果不是os.path.exists(文件):#创建一个新的文件并写入表头df=pd .数据帧(列=标题)否则:#读取现有文件df_read=pd.read_excel(文件)df=pd .数据帧(df_read) #定义一行新数据数据为一个字典新数据=pd .DataFrame(data,index=[1]) #自定义索引为:1 ,这里也可以不设置索引号把定义的新数据添加到原数据最后一行ignore_index=True,表示不按原来的索引,从0开始自动递增df=df.append(新数据,忽略索引=真)#保存数据工作表名称工作表名指数是否添加索引页眉表头df.to_excel(file,sheet_name=self.words,index=False,header=True)数据:

  表tr td背景颜色=橙色本文仅供学习交流使用,如侵立删!/td /tr /table

  原创作品出自博主之手,

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • 怎样保存微博视频到手机相册,将微博视频保存到手机相册
  • 基于python编写一个微博抽奖小程序游戏,基于python编写一个微博抽奖小程序多少钱
  • 基于python编写一个微博抽奖小程序游戏,基于python编写一个微博抽奖小程序多少钱,基于Python编写一个微博抽奖小程序
  • 微博视频博主认证方法有哪些,微博视频博主认证方法不一样
  • 微博怎么悄悄关注教程图片,微博怎么悄悄关注教程中的人
  • 微博视频怎么搞合集,怎样做微博合集
  • 微博昵称不可用什么意思-,微博说昵称不可使用是什么原因
  • 怎么循环播放微博视频,微博视频设置单个循环
  • 怎么注册微博账号不用手机号,如何不用手机注册微博账号
  • python爬取微博热点,如何用python爬取公众号文章
  • 微博水印怎么弄到中间详情里,微博水印在中间怎么弄
  • python自动发微博评论怎么发,Python发微博
  • 微博来自个人主页是什么意思呀,什么叫微博主页
  • 微博如何删视频,微博删除视频怎么看
  • 微博批量删除微博教程图片,微博批量删除微博教程是真的吗
  • 留言与评论(共有 条评论)
       
    验证码: