python kdj实现,
大蟒金融风控评分卡模型和数据分析微专业课(博主亲自录制视频):http://dwz.date/b9vv
http://博客。csdn。net/csqazwsxedc/article/details/51336322(转)
# 一个股与指数的回归分析## 1.1 数据加载加载分析所需的计算机编程语言库
将statsmodels.api作为钐导入
将statsmodels.formula.api作为系统管理功能导入
将statsmodels.graphics.api作为冲锋枪导入
进口容易受骗的人
%matplotlib内联
将matplotlib.pyplot作为血小板计数导入
将数组作为铭牌导入
进口熊猫作为螺纹中径
来自熊猫进口系列,数据框架
从科学计算导入统计
将海生的作为社交网站(Social Network Site的缩写)导入
确定起止时间为2015年一月一日至2015年12月31日
导入日期时间
start=datetime.datetime(2015,1,1)
end=datetime.datetime(2015,12,31)
获取"上证综指"2015年股价数据,记为数据获取"机器人"公司2015年股价数据,记为数据qr。
从pandas.io.data导入DataReader
datass=DataReader(000001 .SS ,雅虎,开始,结束)
datajqr=DataReader(300024 .SZ ,雅虎,开始,结束)
d:\软件\新建文件夹(4)\ lib \ site-packages \ pandas \ io \ data。py:33:未来预警:熊猫。io。数据模块被移到一个单独的包(熊猫-datareader)中,在未来的版本中将从熊猫中删除。安装熊猫-数据阅读器包(https://github。com/pydata/pandas-datareader)后,可以将导入"从熊猫. io导入数据,wb "改为"从熊猫_datareader导入数据,wb .未来警告)
datass.head()
OpenHighLowCloseVolumeAdj Close
日期
2015-01-05
3350.52
3350.52
3350.52
3350.52
0
3350.52
2015-01-06
3351.45
3351.45
3351.45
3351.45
0
3351.45
2015-01-07
3373.95
3373.95
3373.95
3373.95
0
3373.95
2015-01-08
3293.46
3293.46
3293.46
3293.46
0
3293.46
2015-01-09
3285.41
3285.41
3285.41
3285.41
0
3285.41
datajqr.head()
OpenHighLowCloseVolumeAdj Close
日期
2015-01-01
39.39
39.39
39.39
39.39
0
39.37083
2015-01-02
39.39
39.39
39.39
39.39
0
39.37083
2015-01-05
38.83
39.33
37.30
39.01
20750100
38.99101
2015-01-06
38.76
41.29
38.50
41.22
24357600
41.19994
2015-01-07
41.21
41.60
40.05
40.18
16364700
40.16044
## 1.2 个股与上证指数数据探索性分析
close_ss=datass[Close]
close_jqr=datajqr[Close]
得到上证综指2015年各交易日收盘价的简单统计结果,如下所示。共有233个上证综指的股价数据,指数的平均值为3739.79,最小值为2927.29,最大值为5166.35。
close_ss.describe()
计数233.000000平均值3739.794893标准538.105387最小值2927.290000 25% 3320.680000 50% 3617.060000 75% 4034.310000最大值5166.350000名称:关闭,数据类型:浮动64得到机器人公司2015年各交易日收盘价的简单统计结果,如下所示。共有261个上证综指的股价数据,股价的平均值67.31,最小值为39.01,最大值为128.00。
close_jqr.describe()
计数261.000000平均值67.317433标准值20.643055最小值39.010000 25% 51.800000 50% 68.500000 75% 82.550000最大值128.0000000名称:关闭,数据类型:浮动64观察上证综指和机器人公司的股价波动图,如下所示,可以看到,上证综指与机器人公司的股价波动有着相对一致的趋势,机器人公司股价波动较上证综指更大。
图,ax=PLT。子情节(nrows=1,ncols=2,figsize=(15,6))
close_ss.plot(ax=ax[0])
ax[0].set_title(SZZZ )
close_jqr.plot(ax=ax[1])
斧[1].set_title(JQR )
stock=pd.merge(datass,datajqr,left_index=True,right_index=True)
股票=股票[[Close_x , Close_y]]
stock.columns=[SZZZ , JQR]
stock.head()
SZZZJQR
日期
2015-01-05
3350.52
39.01
2015-01-06
3351.45
41.22
2015-01-07
3373.95
40.18
2015-01-08
3293.46
40.15
2015-01-09
3285.41
39.36
根据股价得到上证综指和机器人公司的日收益率序列,如下所示。
daily _ return=(股票。diff()/股票。shift(周期=1).德罗普纳()
daily_return.head()
SZZZJQR
日期
2015-01-06
0.000278
0.056652
2015-01-07
0.006714
-0.025230
2015-01-08
-0.023856
-0.000747
2015-01-09
-0.002444
-0.019676
2015-01-12
-0.017072
0.004827
观察日收益率序列的简单统计,如下所示。上证指数日平均收益率0.000556,最低-0.0849,最高0.0769。机器人公司平均股价0.003665,最低-10.00,最高数据异常。
daily_return.describe()
SZZZJQR
数数
232.000000
232.000000
意思是
0.000556
0.003665
标准
0.025194
0.050061
部
-0.084907
-0.100017
25%
-0.011398
-0.021297
50%
0.002583
-0.000724
75%
0.016720
0.026968
最大
0.076940
0.209524
观察异常数据
每日回报[每日回报[JQR] 0.105]
SZZZJQR
日期
2015-10-12
0.07694
0.209524
经分析,当日股价数据异常的原因主要是缺少10月8日和10月9日的股价数据,导致当日收益率的计算基数为2015年9月30日。
画出上证指数和机器人公司日收益率的波动图。
fig,ax=PLT . subplot(nrows=1,ncols=2,figsize=(15,6))
daily_return[SZZZ]。plot(ax=ax[0])
ax[0]。set_title(SZZZ )
每日_回报[JQR]。plot(ax=ax[1])
ax[1]。set_title(JQR )
画出上证指数和机器人公司日收益率的直方图和密度图,如下图。可以发现,总体来看,上证综指和机器人公司的日收益率服从正态分布。相对而言,机器人公司的日收益率低于上证指数。
fig,ax=PLT . subplot(nrows=1,ncols=2,figsize=(15,6))
SNS . distplot(daily _ return[ SZZZ ],ax=ax[0])
ax[0]。set_title(SZZZ )
SNS . distplot(daily _ return[ JQR ],ax=ax[1])
ax[1]。set_title(JQR )
画出上证指数和机器人公司股价日收益率的散点图,如下图。
fig,ax=PLT . subplot(nrows=1,ncols=1,figsize=(12,6))
PLT . scatter(daily _ return[ JQR ],daily_return[SZZZ])
PLT . title(“JQR和SZZZ之间的每日回报散点图”)
散点图显示,上证综指与机器人公司股价之间可能存在线性正相关关系。
1.3个股与上证指数的回归分析
将statsmodels.api作为sm导入
添加截距项。
daily_return[intercept]=1.0
以个股为自变量,上证综指为因变量,对个股和上证综指进行了回归分析。得到回归结果,如下图。
型号=sm。OLS(daily_return[JQR],daily_return[[SZZZ ,截距]])
结果=model.fit()
结果摘要()
OLS回归结果
离开变量:
网址
r平方:
0.382
型号:
内源性阿片样物质
可调R平方:
0.379
方法:
最小平方
f统计量:
142.0
日期:
Fri,2016年3月18日
概率(F统计量):
8.29e-26
时间:
22:16:56
对数可能性:
421.79
数量意见:
232
AIC:
-839.6
Df残差:
230
BIC:
-832.7
Df模型:
一个
协方差类型:
不稳健
coefstd errtPt[95.0% Conf。里面的]
上证综合指数
1.2275
0.103
11.915
0.000
1.025 1.431
拦截
0.0030
0.003
1.151
0.251
-0.002 0.008
综合:
8.703
德宾-沃森:
1.824
Prob(综合):
0.013
雅尔克-贝拉(JB):
9.653
倾斜:
0.350
Prob(JB):
0.00801
峰度:
3.714
Cond。号码
39.8
最小二乘回归的结果表明,机器人公司股票的日收益率与上证综指的日收益率之间存在显著的正相关关系。其中,可确定系数为0.382,表明上证指数日收益率对机器人日收益率有较强的解释力,模型拟合效果较好。F统计量和综合统计量的P值接近于0,自变量的作用显著。t统计量的p值接近0,说明上证指数的变量显著。自变量系数为1.2275,说明机器人公司股票的日收益率波动大于上证指数,这只股票的风险更大,可能的得失也更大。上证综指日均收益率波动1%,个股日收益率波动1.2275%。德宾-沃斯顿检验值为1.824,表明产量数据不存在序列相关性。Jarque-Bera的p值接近于0,说明日收益率数据服从正态分布。
Python机器学习生物信息学系列(博主实录):http://dwz.date/b9vw
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。