爬虫爬取基金数据,python获取基金数据
本文主要介绍python爬虫获取的资金列表。python爬虫是收集数据最直接、最常用的方法,可以利用Python爬虫获取大量数据。下面介绍更多相关内容,有需要的可以参考一下。
00-1010 1前言2从哪里获取数据3如何抓取数据?
目录
Python爬虫是收集数据最直接、最常用的方法。python爬虫可以用来获取大量数据,非常简单快捷。大部分网站都是使用模板开发,使用的模板可以快速生成大量布局相同内容不同的页面。这时候只需要为一个页面开发一个爬虫就可以了,因为爬虫也可以抓取同一个模板生成的不同内容。
1 前言
给大家准备好了,打开这个连接,就能找看到对应的基金信息:.
http://fund.eastmoney.com/jzzzl.html
有了资金连接,我们要做的就是怎么把它弄下来。从123开始,我偶然发现了后台访问的接口。是不是很神奇?是时候上图了,,大家可以看到如下图:?
#这是原始连接
http://fund.eastmoney.com/Data/Fund_JJJZ_Data.aspx?lx=1sort=zdf,descpage=2,200onlySale=0
#在我用postman删除了一些参数后,发现简化的连接如下,忍不住吐槽一下。此时仍有参数以中文首字母传递。
# lx显然是type的缩写。排序就是对一些可以忽略的字段进行排序。如果有页面,2200是第二页,每页200页。onlySale是可以出售的条件。
http://fund.eastmoney.com/Data/Fund_JJJZ_Data.aspx?lx=1sort=zdf,descpage=2,100onlySale=0
2 哪里去获取数据呢
我们这里用的是python,需要安装的类库是Requests/DemJSON/Pretty Table/JSON。是不是特别简单?
#安装命令如下
#发起请求
pip安装请求
#将不太严格的json格式转换为json
pip安装demjson
#格式化打印数据
pip安装表
#将json格式的文本转换为json
pip安装json
我可以在这里上传代码。简单的逻辑就是先抓取api接口返回的信息,然后解析消息,将返回的结果转换成json格式,只选择需要获取的内容,最后输出获取的结果。
导入请求
导入json
导入demjson
从漂亮的桌子进口漂亮的桌子
#数据表的列表头字段
title_list=[code , name , value]
#查询基金列表信息
定义查询_资金_列表(page=1):
req _ URL= http://Fund . eastmoney.com/Data/Fund _ JJJZ _ Data . aspx?lx=1sort=zdf,descpage={},20onlySale=0 。格式(页面)
response=requests.get(请求url)
#输出响应标题
#打印(response.headers)
#获取请求的结果并替换它,否则结果不能格式化为json
resp _ body=response . text . replace( var db=,)
#本来首选这个json,因为json不支持像{a :1}这样的转换,所以用了demojson。
# JSON _ data=JSON . loads(resp _ body)
#将对象转换为json对象,将不规则的json格式化为json对象。
resp _ body=demjson . decode(resp _ body)
#获取结果数组
fund_list=resp_body[datas]
body_list=[]
对于fund_list:中的节点
tmp=[]
tmp.append(节点[0])
tmp.append(节点[1])
tmp.append(节点[3])
body_list.append(tmp)
#创建一个对象PrettyTable来打印输出结果。
bt=PrettyTable()
#将标题信息放入bt
bt.field_names=title_list
#将表格内容放入bt中
bt.add_rows(body_list)
#打印结果
打印(bt)
if __name__==__main__:
#此处只打印第一页,不写循环打印结果。每个人都会。
查询_资金_列表(1)
最终输出的结果如图所示 :
我们最终达到的结果就是这样一个结果。有了这些结果,我们就可以把它们以结构化的方式存储起来,放入数据库供查询和使用。
代码基金名称最新净值005585银河文体混合1.6363001907 SDIC瑞银灵活配置混合A3.3055001908 SDIC瑞银灵活配置混合C3.1667164818工银中证传媒指数(LOF)A0.9231............后续会抓取基金的基本信息和变动信息,建立模型展示。
这就是这篇关于Python爬虫收购基金名单的文章。有关Python收购列表的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望你以后能支持风行IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。