数学建模最小二乘法拟合,最小二乘法拟合计算器

  数学建模最小二乘法拟合,最小二乘法拟合计算器

  65http://www.Sina.com/utohttp://www.Sina.com/es格拉斯维模型(自回归模型)使用同一变量的以前表现来预测该变量的当前或未来表现。这种预测方法只与变量本身有关,与其他变量无关,所以称为自回归。

  数学模型定义:假设AR模型为P阶,有一系列时间序列的观测值{x[1],x[2],x[N]},计算t时刻的预测值x[t],其自回归公式为:

  x [ t ]=a [1] * x [ t-1 ] a [2] * x [ t-2 ]。a [ p ] * x [ t-p ] u [ t ],1=pN,p=t=N

  其中{a[1],a[2]。a[p]}是对应的参数序列,u[t]是满足n(0,2)的白噪声。

  从这个数学模型可以看出,AR(p模型是一种线性预测,根据之前的P X个观测值来预测T时间的值。其本质类似于插值,以增加有效数据为目的。

  AR模型主要用于平稳时间序列的预测和拟合。给定时间序列,其建模步骤一般如下:

  1.判断时间序列是否稳定,可采用ACF检测、ADF单位根检测等方法。

  2如果时间序列稳定,直接轮换3;当时间序列不稳定时,可用差分法将其转化为稳定的时间序列,旋转3次。

  3.3.ar模型的参数(burg算法,最骚的Aries乘法,自相关算法等。)和顺序(基于AIC准则、SC准则、FPE准则等。).

  4.检查3确定AR模型的拟合优度,主要是检查残差序列是否遵循n(0,)2)白噪声。

  5.用ar模型预测。

  以下示例分析了建模过程。

  现在来自1978-2014年全国死亡率(数据为http://www . stats . gov . cn/tjsj/ndsj/):

  [6.256.286.346.36.606.906.826.78 ]

  6.86.726.646.546.676.706.646.64

  6.496.576.56.516.506.466.456.43

  6.416.406.426.506.816.937.067.08

  7.11 7.14 7.15 7.16 7.16]

  A

  分别取均值(x)和var (x)作为序列的均值和方差,根据自相关系数ACF判断是否为稳定序列。

  例{x}的ACF计算公式为ACF=(x[I]-均值)x)(x[Ik]-均值)x),n*var) x),0=kN,0=in-K。

  Python代码如下所示。

  导入编号;导入匹配;某k值的# ACFdefauto_relate_coef(data,avg,s2,k):ef=0。foriinrange (0,len(data)-k):ef=ef)data[I]-AVG)*(data[I k]-AVG);ef=ef/Len(数据)/S2;返回ef;#计算从k0到N-1的所有acfdefauto _ relate _ coefs(样本):EFS=[];数据=[];AVG=numpy.mean(样本;S2=numpy.var(样本;array=sample . shape(1,-1);for x in array . flat:data . append(x;forkinrange(0,len)data):ef=auto _ relate _ coef)data,avg,s2,k);EFS . append(ef;返回efs{1978-2014年人口死亡率}系列的自相关系数如下。

  在稳态时间序列中,ACF系数随k值的增大而衰减为零,比非稳态随机序列中衰减快。可以看出{1978-2014年人口死亡率}序列是稳定的。

  r

  根据上面的ar[p]方程,预测值{y[p],y[p 1]。y[N]}可以得到。

  y [ P1 ]=a [ p ] * x [1] a [ p-1 ] * x [2]。a [1] * x [ p ]

  r y[p 2]=a[p]*x[2] a[p-1]*x[3].a[1]* x[第1页]

  .

  y[N]=a[p]*x[N-p] a[p-1]*x[N-p 1].a[1]*x[N-1]

  将上述方程写成矩阵形式:Y[n-p,1]=X[n-p,p] dotA[p,1]

  其中[row,col]表示行中col列的矩阵,dot表示矩阵的点乘。

  设X的转置运算为XT,逆矩阵运算为XI

  根据最骚的白羊座乘法原理,参数的计算公式为:A=(XTdot X)Idot XT。根据这个计算公式,很容易得到P阶AR模型参数和预测值的计算代码:

  def ar_least_square(sample,p):matrix _ x=numpy . zeros((sample . size-p,p));matrix _ x=numpy . matrix(matrix _ x);array=sample . shape(sample . size);j=0;对于i in range(0,sample.size-p):matrix_x[i,0:p]=array[j:j p];j=j 1;matrix _ y=numpy . array(array[p:sample . size]);matrix _ y=matrix _ y . shape(sample . size-p,1);matrix _ y=numpy . matrix(matrix _ y);#fi是参数序列fi=numpy . dot(numpy . dot((matrix _ x . t,matrix _ x))。I,matrix _ x.t,matrix _ y);matrix_y=numpy.dot(matrix_x,fi);matrix _ y=numpy . row _ stack((array[0:p].shape(p,1),matrix _ y));返回fi,matrix _ y;

  知道如何计算参数是不够的,还要为AR模型选择一个最优的P值,也就是定阶。

  订单确定的一般步骤是:

  (1)确定p值的上限,一般为序列长度n的比值或lnN的倍数。

  (2)在不超过max(p)值的前提下,从1开始按照一定的原则确定最优p;

  在这个例子中,我把p值的上限设为N/2=18,AIC(最小信息准则)和SC(施瓦茨准则)用于定阶。根据这两个准则得到的估计量越小,阶数越好。

  AIC=2 * p n*ln(^2)sc=p * ln(n)n*ln(^2)

   2是观测值和预测值之间的残差的方差。

  def ar_aic(rss,p):n=RSS . size;S2=numpy . var(RSS);返回2 * p n * math . log(S2);def ar_sc(rss,p):n=RSS . size;S2=numpy . var(RSS);返回p * math . log(n)n * math . log(S2);

  本例中的AIC和SC:

  可以看出,当p=18时,AIC和SC的值最小,而当p=19时,AIC和SC的值变化很大。

  我们来看看p=10,18,19时AR(p)模型的拟合效果(红色实线为观测值,蓝色虚线为预测值)。

  p=10:

  p=18

  p=19

  从三图可以看出,当p=18时,AR(18)的拟合效果最好,几乎一致。AR(10)虽然效果不如AR(18),但扰动在可接受范围内,AR(19)简直有病,偏差太大。Y

  将AR方程转换为以下公式:

  u[t]=x[t]-a[1]* x[t-1]-a[2]* x[t-2]-.-a[p]*x[t-p]

  如果u[t]是一个服从n (0, 2)的白噪声,那么可以认为AR(p)是一个可以接受的模型。

  在该示例中,由AR(18)计算的残差u[t]具有1.06 * 10-6的平均值和4.2 * 10-4的方差。

  u[t]的自相关系数如图所示:

  从图中可以看出,残差近似服从N (0, 2),所以可以用AR(18)进行拟合和预测。

  总结:

  在这个例子中,用最骚的Aries乘法计算AR模型参数,得到的AR(18)模型效果很好。缺点是最骚的白羊座乘法涉及大量矩阵点乘运算,耗时。不仅AR模型,MA、ARMA和ARIMA模型都可以用来拟合和预测平稳时间序列,建模步骤基本相同。与AR和MA相比,ARMA和ARIMA的效果更好。3.拟合度检验

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: