python爬取基金持仓,python抓取基金数据

  python爬取基金持仓,python抓取基金数据

  本文主要介绍python爬虫对场内ETF基金的获取。ETF是场内交易基金,可以进行日内交易,交易属性比场外基金强一点。以下基于python相关资料,可以给朋友们参考一下。

  00-1010 1前言2 ETF列表及简称3 ETF信息获取3.1 ETF列表信获取3.2基金简称4最终结果显示

  

目录

  我们之前介绍过基金变动的信息,但是这些基金都是场外的。今天我们要介绍一个有门槛的投资产品——ETF。只有开立证券账户的玩家才能进场。ETF是场内交易基金,可以进行日内交易。它的交易属性比场外基金强一点,马上开始引入话题。

  

1 前言

  ETF变动和基本信息的获取方式与场外基金相同。如何获取ETF基金的全面名单?

  #获取基金信息列表

  http://fund.eastmoney.com/data/fbsfundranking.html

  以下是ETF信息列表所展示的信息:

  在交易ETF时,通常会有一个简称。取简称有点麻烦。您需要访问一个页面,然后通过bs4获取它来解析元素。

  #分析后可以发现,基金代码的前缀代表这个市场,5上海市场1-深圳市场,以房地产ETF和光伏ETF为例。

  http://quote.eastmoney.com/sz159707.html

  http://quote.eastmoney.com/sh515790.html

  

2 ETF列表和简称

  

3 ETF 信息获取

  ETF信息我们通过访问列表发现,在访问列表数据时,我们向后台请求一个api接口,然后向前端返回一个响应消息。

  http://fund.eastmoney.com/data/rankhandler.aspx?op=phdt=fbft=ctrs=GS=0sc=zzfst=desc pi=1pn=50

  看到这里就觉得很幸福。我不需要解析html文件。当我通过请求获取数据时,我发现我没有返回no access right。我想可能是我没有携带cookie的原因,但是我也没有登录。请求报头可能需要携带一些页面信息。于是,经过尝试,最终确定要携带的信息是3360。

  标题={

  Host: fund.eastmoney.com ,

  referer : http://fund . eastmoney.com/data/fbsfundranking . html

  }

  最终我们获取基金列表的代码应该这样写:

  调试后获取到的结果如下图所示:

  

3.1 ETF列表信获取

  得到基金的简称是比较简单的。通过分析发现,简称位于span class=quote_title_0 wryh 光伏ETF/span。您可以通过访问页面获取元素来获得缩写的描述。

  具体的代码如下图所示:

  

3.2 获取基金的简称

  经过两个步骤:获取基金列表和获取基金简称,我们得到了如下图所示的最终结果,我们已经达到了获取信息3360的目的。

  未来我们会将基金信息和ETF信息合并起来存储在数据库中,方便后续的数据分析。

  这篇关于收购python爬虫的ETF基金的文章到此为止。更多关于收购python ETF基金的信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: