python爬取东方财富网股票信息,python爬取股票数据

　　本文主要介绍python爬虫对股票北上资金头寸的数据。文章以python的相关资料为基础，展开了抓取数据的细节，有一定的参考价值，有需要的小伙伴可以参考一下。

　　00-1010数据分析、数据捕获和模型建立的前言摘要

前言

　　照例先贴一下数据的访问地址：

　　#以海尔智家为例，贴上资料的页面连接地址，再吐槽一下拼音前缀。

　　https://data . eastmoney.com/hsgtcg/stockhd statistics/600690 . html

　　下图是北上资金的每日访问数据页面。我们希望捕获股份数量、股份市值、股份百分比和市值变化的信息。

　　通过浏览器后台的接口可以看到这样一个接口数据：

　　这个接口的参数为：

　　#请求地址数据。这里的参数和要求的不一样，因为我试过其他参数，可以忽略。以下是必要的参数

　　https://datacenter-web.eastmoney.com/api/data/v1/get?

　　#排序字段和排序类型，-1是相反的顺序。

　　sortColumns=交易日期

　　排序类型=-1

　　#最后两个参数很简单，只是分页参数。

　　页面大小=50

　　页码=1

　　#报告类型，固定为北向资本数据。

　　report name=RPT _ MUTUAL _ HOLDSTOCKNORTH _ STA

　　#返回的数据列，默认情况下全部返回

　　列=全部

　　#获取数据的参数是股票代码和交易日期。

　　filter=(SECURITY _ CODE= 600690 )(TRADE _ DATE= 2021-10-29 )

数据分析

　　我们已经分析了获得资金的参数。下面是如何使用python获取数据并显示出来。我们仍然使用requets来获取数据。

　　我们需要首先组装请求的参数。这里的fliter只传入代码，日期是固定的。这个个人感觉就是查询的ES，否则不会这样传入参数。建议做参数转换，直接传不太好。

　　查询返回的数据是json格式的。解析之后，我们使用prettyTable打印结果。

　　因为得到的数据没有格式化，显示的位数比较长，所以对股数、市值等数据进行格式化显示。

　　代码如下：

　　#十亿就格式化成十亿，一万就格式化成一万。

　　定义校准编号：

　　如果abs(编号/100000000) 0:

　　Return str (round (num/10000000，3))亿

　　else:

　　Return str(round(num/10000，3))万

　　最终我们得到的结果如下：

数据抓取

　　我们已经获取到了股票的北上资金的情况，我们建立一个简单的模型筛选一下：

　　1.选择北上资金最近一个月连续加仓，且涨幅超过流通股1%的股票。在这个模型中，我们可以根据最近一个月每天的持仓百分比，y=kx b建立一个线性规划模型来计算斜率和截距，但是这个感觉有点复杂。我们可以简化一下，只是偷懒计算一下，计算当天持仓和一个月前持仓的差额。

　　具体代码如下：

　　# rate_list是持股比例的集合。将比率添加到集合。为什么这里是22？

　　#一般一个月有22个交易日，所以减去22就是一个月前的持仓比例。

　　定义校准型号(费率列表):

　　如果len(rate_list)=22:

　　cur_node=rate_list[0]

　　pre_node=rate_list[22]

　　返回当前节点-前节点

　　返回-100

建立模型

　　今天我们用接口获取了北上资金对于个股的持仓数据，建立了一个简单的分析模型来选股。这个技术实现起来比较简单，学习和练习就够了。

　　这篇关于python爬虫抓取北方股票持仓数据的文章到此为止。关于python爬取数据的更多信息，请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

python爬取东方财富网股票信息,python爬取股票数据

目录

前言

数据分析

数据抓取

建立模型

相关文章阅读

去评论

去顶部