python时间序列分析模块,python时间序列模型
经典的时间序列预测方法都假设,如果一个时间序列具有显著的自相关性,那么历史值将非常有助于预测当前值。但是取多少历史值需要通过分析相关函数图和偏相关函数图来获得。介绍了如何定义相关函数图和偏相关函数图,还介绍了滞后图。
什么是自相关函数和偏自相关函数?先解释下滞后阶N。如果当前值与前两个周期相关,则n=2。然后我们可以用时间序列及其二阶滞后序列训练一个自回归模型来预测未来值。自相关函数(ACF)表示时间序列与N阶滞后序列之间的相关性(考虑中间时间的影响,如t-3对T的影响,也考虑t-2和t-1对T的影响)。偏自相关函数(PACF)表达的是时间序列与N阶滞后序列之间的纯相关性(不考虑中间时间内数值的影响,比如t-3对T的影响,t-2和t-1对T的影响就不考虑)。如果用自回归方程来预测时间t的值,那么每个滞后阶的系数就是每个滞后阶下的偏自相关值。比如下面等式中的1,2,3分别是一阶,二阶,三阶滞后下的偏相关值。
和ACF PACF可视化从statsmodels.tsa.stattools导入ACF,pacf form stats models . graphics . TSA plots导入plot _ ACF,plot _ PAC fdf=PD . read _ CSV( https://raw . githubusercontent . com/selva 86/datasets/master/a10 . CSV )#计算ACF和PACF最多50 lags# acf_50=acf(df.value,nlags=50)# pacf _ 50=pacf(df . value,nla
如果ACF呈现长尾(如上左图所示),则表明趋势,需要区分。如果ACF的一阶滞后被截断,可能是差值过大(差值会降低相关性)。如果ACF稍微拖尾然后截断,选择微分阶更合适。此时可以用前n个历史时刻的值进行自回归来预测当前值,n的值可以参考pacf的截断位置。假设右图是差分后的PACF图,在二阶滞后后(从0阶开始,原序列与原序列的相关度为1),突然下降到相关的置信区间,也就是说95%的概率是不相关的,所以该序列可以用于二阶滞后自回归。什么是相关置信区间?对于白噪声序列,按理说不会有自相关。我们期望自相关为0,但由于随机扰动的存在,它不会为0。一般假设随机扰动符合标准正态分布(均值为0,标准差为1),那么这个随机扰动的95%置信区间(一般为95%,但这个概率也可以调整)可以用下面的公式计算
标准正态分布的z得分表示与平均值有几个标准差,除以根号T表示有偏样本的标准差。
这里,在95%的置信度下,Z得分=1.96,标准差=1,T是序列长度,则置信区间计算如下:
对于白噪声序列,95%的自相关落在这个置信区间内。
而这个置信区间就是上面acf和pacf图中的相关区间,也就是说,如果滞后阶数和原序列的相关度落在这个区间内,就意味着没有相关。
滞后图滞后图是由时间序列和相应的滞后次序序列构成的散点图。它可以用来观察自相关。
来自熊猫。绘图导入滞后_绘图PLT。rcparams。更新({ ytick。左:假,轴。title pad :10 })# Importss=PD。read _ CSV( https://raw。githubusercontent。com/selva 86/datasets/master/sunspotarea。CSV )# Plotfig,axes=PLT。潜水艇
好吧,本篇就这么多内容啦~,感谢阅读O(_)O。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。