可以使用numpy中的什么函数进行线性回归分析,python计算相关性的函数
本文主要介绍Python数据分析Numpy中常用的相关函数的解释。有需要的朋友可以借鉴一下,希望能有所帮助。祝大家进步很大,早日升职加薪。
00-1010摘要:一、股票相关性分析二。多项式III。极值知识
目录
NumPy包含了大量的函数,旨在使用起来更加方便。掌握这些功能可以提高你的工作效率。这些函数包括数组元素的选择和多项式运算。让我们通过下面的例子来了解更多。
通过对一家公司股票收盘价的分析,了解一些Numpy的一些功能。在实践中,一家公司的股价紧跟另一家公司的股价,这两家公司可能是同一领域的竞争对手,也可能是同一家公司的不同子公司。有可能两家公司经营的业务类型相同,面临的挑战相同,需要的原材料和资源相同,争夺的客户类型相同。
其实这样的例子还有很多,如果我们要检查它们是否真的有关联。一种方法是看两家公司股票收益的相关性。强相关是指两者之间存在一定的相关性(尤其是使用的数据不足时,误差可能更大)。
摘要:
1.导出两个相关的股票数据():
2.分别从CSV文件中读取相关数据。
close=np.loadtxt(data036.csv ,分隔符=,,usecols=(5,),转换器={1:datestr2num},unpack=True)
new _ close=NP . load txt( data 999 . CSV ,分隔符=,,usecols=(5,),转换器={1:datestr2num},unpack=True)
3.协方差描述的是两个变量一起变化的趋势,实际上就是归一化前的相关系数。Cov函数用于计算股票收益率的协方差矩阵。完整的代码如下:
将numpy作为np导入
从日期时间导入日期时间
将matplotlib.pyplot作为plt导入
定义一个函数
返回datetime . strptime(s . decode( ascii ), %Y-%m-%d )。日期()。工作日()
Close=np.loadtxt (data036.csv ,分隔符=,,usecols=(5,),转换器={1:datestr2num},unpack=true) #导入data036.csv数据
new _ close=NP . load txt( data999.csv ,分隔符=,,usecols=(5,),转换器={1:datestr2num},unpack=true) #导入data 999 . CSV数据
协方差=np.cov (close,new _ close) #使用numpy.cov()函数计算两个数列的协方差矩阵。
Print(close.mean()) #求收盘的平均值
Print(new_close.mean())#求new_close的平均值
打印(协方差: , \n ,协方差)
运行结果:
48.40690476190476
18.85157142857143
协方差:
[[30.46934553 1.5201865 ]
[ 1.5201865 8.96031113]]
1)使用对角线函数查看矩阵对角线上的元素。
Print (diagonal element:,协方差. diagonal ()) # diagonal查看对角线上的元素。
运行结果:
对角线元素:[30。43360 . 33333333331
2)用trace函数计算矩阵的迹,即对角线上元素的和。
Print(协方差trace ,协方差. trace ()) #对角线上元素的总和
3)两个向量的相关系数被定义为协方差除以它们各自的标准偏差的乘积。向量a和b的相关系数计算公式:corr(a,b)=cov(a,b)/(std(
a)*std(b))
covar = covariance/ (np.std(close) * np.std(new_close))print("相关系数矩阵:", covar)
运行结果:
相关系数矩阵: [[1.84843969 0.09222295][0.09222295 0.54358223]]
注意:由于covariance是一个矩阵,因而得到的covar也是一个矩阵
相关系数是两只股票的相关程度。相关系数的取值范围在 -1 到 1 之间。根据定义,一组数值与自身的相关系数等于 1 ,numpy中使用 corrcoef 函数计算相关系数
closecorr = np.corrcoef(close,new_close)print("相关系数:",\n, closecorr )
运行结果:
相关系数:[[1. 0.09200338]
[0.09200338 1. ]]
对角线上的元素即close和new_close与自身的相关系数,因此均为1。相关系数矩阵是关于对角线对称的,因此另外两个元素的值相等,表示close和new_close的相关系数等于new_close和close的相关系数。
判断两只股票的价格走势是否同步的要点是,它们的差值偏离了平均差值2倍于标准差的距离,则认为这两只股票走势不同步。代码如下:
difference = close - new_closeavg = np.mean(difference)
dev = np.std(difference)
print ("Out of sync:", np.abs(difference[-1]-avg)>2*dev)
运行结果:
Out of sync: False
二、多项式
微积分里有泰勒展开,也就是用一个无穷级数来表示一个可微的函数。实际上,任何可微的(从而也是连续的)函数都可以用一个N次多项式来估计,而比N次幂更高阶的部分为无穷小量可忽略不计。
NumPy中的 ployfit 函数可以用多项式去拟合一系列数据点,无论这些数据点是否来自连续函数都适用。
继续使用close和new_close的股票价格数据。用一个三次多项式去拟合两只股票收盘价的差价。
t = np.arange(len(close)) #得到close数列的长度poly = np.polyfit(t, close - new_close, 3) #利用长度t和两只股票的价差,生成一个三项式,三项式有3个系数和一个常量
print("Polynomial fit", poly)
运行结果:
Polynomial fit: [ 1.61308827e-07 -4.34114354e-04 1.84480028e-01 1.33680483e+01]
用我们刚刚得到的多项式对象以及 polyval 函数,推断下一个差值:
print ("Next value:", np.polyval(poly, t[-1] + 1))#用生成的多项式拟合求下一个差值
print(difference[-1])#打印最后一个实际的差值
运行结果:
Next value: 26.22293628782965426.21
在极限情况下,差值可以在某个点为0。使用 roots 函数找出拟合的多项式函数什么时候到达0值:
print( "Roots", np.roots(poly))#root返回多项式的根
运行结果:
Roots [2138.21411788 615.9134063 -62.92728874]
三、求极值的知识
极值是函数的最大值或最小值。在高等代数微积分中,这些极值点位于函数的导数为0的位置,然后再求导数函数的根,即找出原多项式函数的极值点。
1)使用 polyder 函数对多项式函数求导
der = np.polyder(poly)print("Derivative", der)
2)求出导数函数的根,即找出原多项式函数的极值点
print( "Extremas", np.roots(der))
运行后即得到如下:
Derivative: [ 4.83926482e-07 -8.68228709e-04 1.84480028e-01]Extremas [1547.84609151 246.28739879]
3)用 polyval 计算多项式函数的值,并用matplotlib显示
vals = np.polyval(poly, t)print(vals:,vals)
print(max value:, np.argmax(vals))
print(min value:, np.argmin(vals))
plt.plot(t,difference)
plt.plot(t,vals)
plt.show()
运行结果如下:
以上就是Python数据分析Numpy中常用相关性函数的详细内容,更多关于Python数据分析Numpy相关性函数的资料请关注盛行IT软件开发工作室其它相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。