python爬取东方财富网股票信息,python爬取股票数据
本文主要介绍python爬虫对股票北上资金头寸的数据。文章以python的相关资料为基础,展开了抓取数据的细节,有一定的参考价值,有需要的小伙伴可以参考一下。
00-1010数据分析、数据捕获和模型建立的前言摘要
目录
我们已经讲过如何获取股票的k线数据。今天我们来分析一下股票的资金流入情况。股票的涨跌都是资金推动的,北上资金是风向标。今天我们就来抓取一下北上资金对股票的每日持仓变动和资金变动情况。
前言
照例先贴一下数据的访问地址:
#以海尔智家为例,贴上资料的页面连接地址,再吐槽一下拼音前缀。
https://data . eastmoney.com/hsgtcg/stockhd statistics/600690 . html
下图是北上资金的每日访问数据页面。我们希望捕获股份数量、股份市值、股份百分比和市值变化的信息。
通过浏览器后台的接口可以看到这样一个接口数据:
这个接口的参数为:
#请求地址数据。这里的参数和要求的不一样,因为我试过其他参数,可以忽略。以下是必要的参数
https://datacenter-web.eastmoney.com/api/data/v1/get?
#排序字段和排序类型,-1是相反的顺序。
sortColumns=交易日期
排序类型=-1
#最后两个参数很简单,只是分页参数。
页面大小=50
页码=1
#报告类型,固定为北向资本数据。
report name=RPT _ MUTUAL _ HOLDSTOCKNORTH _ STA
#返回的数据列,默认情况下全部返回
列=全部
#获取数据的参数是股票代码和交易日期。
filter=(SECURITY _ CODE= 600690 )(TRADE _ DATE= 2021-10-29 )
数据分析
我们已经分析了获得资金的参数。下面是如何使用python获取数据并显示出来。我们仍然使用requets来获取数据。
我们需要首先组装请求的参数。这里的fliter只传入代码,日期是固定的。这个个人感觉就是查询的ES,否则不会这样传入参数。建议做参数转换,直接传不太好。
查询返回的数据是json格式的。解析之后,我们使用prettyTable打印结果。
因为得到的数据没有格式化,显示的位数比较长,所以对股数、市值等数据进行格式化显示。
代码如下:
#十亿就格式化成十亿,一万就格式化成一万。
定义校准编号:
如果abs(编号/100000000) 0:
Return str (round (num/10000000,3))亿
else:
Return str(round(num/10000,3))万
最终我们得到的结果如下:
数据抓取
我们已经获取到了股票的北上资金的情况,我们建立一个简单的模型筛选一下:
1.选择北上资金最近一个月连续加仓,且涨幅超过流通股1%的股票。在这个模型中,我们可以根据最近一个月每天的持仓百分比,y=kx b建立一个线性规划模型来计算斜率和截距,但是这个感觉有点复杂。我们可以简化一下,只是偷懒计算一下,计算当天持仓和一个月前持仓的差额。
具体代码如下:
# rate_list是持股比例的集合。将比率添加到集合。为什么这里是22?
#一般一个月有22个交易日,所以减去22就是一个月前的持仓比例。
定义校准型号(费率列表):
如果len(rate_list)=22:
cur_node=rate_list[0]
pre_node=rate_list[22]
返回当前节点-前节点
返回-100
建立模型
今天我们用接口获取了北上资金对于个股的持仓数据,建立了一个简单的分析模型来选股。这个技术实现起来比较简单,学习和练习就够了。
这篇关于python爬虫抓取北方股票持仓数据的文章到此为止。关于python爬取数据的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。