时间序列残差分析,残差序列相关

　　残差=y-yhat

　　一般我们就停止在这里了

　　但是如果残差表现的有某种形式，代表我们的模型需要进一步改进，如果残差表现的杂乱无章，代表确实没什么别的信息好提取了

　　现在用最天真的的型号-上一个时间的值=yhat看看残差表现吧

　　关于残差，可以看我的另一篇文章https://mp.csdn.net/postedit/82989567

　　从熊猫导入序列从熊猫导入数据帧从熊猫导入串联系列=系列。from _ CSV(每日总女性分娩数。CSV ，header=0)#创建滞后数据集值=数据框(系列。值)数据框=concat([值。shift(1)，values)，axis=1)dataframe.columns=[t-1 ， t 1]#拆分为训练集和测试集sx=数据帧。值strain _ size=int(len(X)* 0.66)train，test=X残差表现如下：

　　现在看看基本信息

　　1.均值-越接近0越好

　　接近零的值表示预测没有偏差，而正值和负值表示预测有正偏差或负偏差。

　　print(residuals.describe())

　　结果如下

　　数125.000000

　　平均值0.064000

　　标准9.187776

　　最小值-28.000000

　　25% -6.000000

　　50% -1.000000

　　75% 5.000000

　　最大30.000000

　　意思是和0还是有点差距

　　2.直方图密度图关于；在…各处；大约残差

　　我们希望残差分布越接近正太越好

　　如果图显示的分布明显为非高斯分布，则表明建模过程做出的假设可能不正确，可能需要不同的建模方法。

　　较大的偏差可能意味着有机会在建模之前对数据进行转换，例如取对数或平方根。

　　#直方图

　　residuals.hist()

　　pyplot.show()

　　#密度图

　　residuals.plot(kind=kde )

　　pyplot.show()

　　3.即时通信软件图检验正太更快速的方式

　　从pandas导入系列从pandas导入数据框从pandas导入concat从matplotlib导入pyplotimport numpyfrom stats模型。图形。gofplots导入QQ plotseries=series。from _ CSV(每日总女性分娩数。CSV ，header=0)#创建滞后数据集值=数据框(系列。值)数据框=concat([值。shift(1)，values)，axis=1)数据帧。columns=[ t-1 ]#拆分为训练和测试集sX=数据帧越接近对角线越好

　　4.自回归图

　　残差的自回归越小越好！

　　我们没有在整个图上看到明显的自相关趋势。在滞后七可能有一些正的自相关值得进一步研究，这似乎是重要的。

　　https://机器学习掌握。com/visualize-time-series-residue-forecast-errors-with-python/

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读