python爬取基金数据,爬虫爬取基金数据
本文主要介绍python爬虫获取基金净值信息的细节。文章以钱的两篇文章为基础,详细介绍了Python的相关信息,有需要的可以参考。
00-1010 1前言2获取基金净值3数据库结构设计4如何存储数据5总结
目录
在上一篇文章中,我们已经获取了基金的阶段性变化信息和ETF信息,所以在本章中,我们将继续之前的内容,获取基金的价格信息,并将之前抓取的数据存储到数据库中,以便于我们后续的分析。
1 前言
获取基金的净值信息,即最近一个交易日的基金价格,如下图,显示单位净值更新日期、价格、波动区间信息。顺便也可以了解一下资金规模的信息。当同类基金不知道如何选择时,我们可以选择按照基金的大小进行逆向排序,选择较大的进行投资,这样可以大概率保证投资收益的稳定可靠。
通过过度分析可以知道,基金的价格信息需要先获取class=dataItem0 的dl标签,基金规模信息的获取方式也如上图所示。我们可以知道div class= infooff 标签中表的第二个td的刻度信息是3360。
单位净值日期获取方式:
Dtp标签内容
基金净值和变动信息获取方式:
DD . datanumspan[0]标记为单位净值DD . datanumspan[1]标记为基金规模信息的获取方式:.变化百分比
divtabletd[2]
基于以上分析,我们最终的代码如下图所示,通过以上方式我们就获取到了基金的价格信息数据:.
打印的结果如下图所示:
代码159779价格1.0007% 0.07基金_规模3.55更新_日期2021-11-19
2 获取基金净值
在获取到数据之后,需要将数据进行结构化存储
3 数据库结构设计
如果需要存储,就需要使用数据库。java中有各种存储数据的orm框架,但是Python中没有这种繁重的操作,需要自己编写sql进行操作。首先,我们需要安装用于操作数据库的类库。
#安装pymysql
pip安装pymysql
接下来需要配置数据库的连接信息,通过连接信息写两个方法,一个是查询数据库的信息,一个是修改数据库的信息(添加/删除/更改)。修改数据时,一定要记住commit()数据库信息,否则无法保存成功。
4 如何进行数据存储
介绍了如何获取基金的价格信息,并设计了数据库结构和数据存储的操作方法。因为代码和表格结构会占用大量文案,所以本文展示了地图。
这篇关于Python爬虫获取基金净值信息的细节的文章到此为止。关于Python收购的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。