python异方差检验,python计算平均数,方差,标准差

  python异方差检验,python计算平均数,方差,标准差

  主页

  特别纵队

  大蟒

  文章详细信息

  0

  说到统计,异方差的检验

  优雅开水于今日10:13发布。

  我们前面讲过异方差,如何用图解法判断是否存在异方差。本文谈的是如何用统计学的方法来判断是否存在异方差。

  检验异方差的统计方法有很多。在本节中,我们只讨论更常见和常用的白色测试。

  现在假设我们建立以下回归方程:

  如果想用怀特检验来检验上述方程是否具有异方差性,主要分为以下几个步骤:

  1 .第一步:

  方程的残差ui可以通过方程的普通ols估计得到。

  第二步:

  将第一步中估计的残差作为Y,构建以下等式:

  上面构建的方程看起来很复杂,但主要由三部分组成:原方程的解释变量,解释变量的平方,解释变量之间的相互作用。

  方程构造完成后,对方程进行估计和求解。

  第三步:

  回想一下什么是异方差,就是残差项和一个或几个x之间存在相关性。

  如果步骤2中方程的每个系数都是0,是否意味着残差与任何x无关?我们称之为原始假设。反之,只要有一个系数不为0,就说明残差与X有关,即存在异方差。我们称之为替代假说。

  在原来的假设下,可以知道步骤2中方程的R 2乘以样本量N服从自由度等于步骤2回归方程中变量个数的卡方分布。

  在服从卡方分布的前提下,通过与卡方分布的临界值进行比较,可以判断原假设是否成立。

  第四步:

  如果计算的nR^2显著高于所选显著性水平的卡方临界值(p_value值),则需要拒绝方程具有异方差性的原始假设。

  如果存在异方差,还可以检查step2方程估计结果中各个变量的显著性,然后确定是哪个变量造成了异方差。

  需要注意的是,如果模型包含多个变量,那么多个变量相互作用项的引入会大大降低方程的自由度,所以可以根据情况选择不添加。

  当然,以上过程并不需要我们自己去实现。Python也有现成的包可以调用:

  stats models . stats . diagnostic . spec _ white(resid,exog)

  Resid表示原方程的残差,exog表示步骤2中的方程形式。上述函数将最终输出卡方值、对应的p _值和自由度。

  关于异方差的更多信息,可以点击文章开头的相册部分。

  Mysqlpython数据挖掘数据库网络爬虫

  《阅读35》发表于今日10:13。

  募捐

  分享

  本作品为原创,采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议。

  专一套装的数据分析之路

  微信官方账号:《专一的西装的数据分析之路》,分享数据分析相关内容。

  焦点栏

  优雅的开水

  微信官方账号:《专一的西装的数据分析之路》,分享数据分析相关内容。

  1声望

  0粉丝

  注意作者

  0条评论

  投票时间

  提交评论

  优雅的开水

  微信官方账号:《专一的西装的数据分析之路》,分享数据分析相关内容。

  1声望

  0粉丝

  注意作者

  宣传栏

  我们前面讲过异方差,如何用图解法判断是否存在异方差。本文谈的是如何用统计学的方法来判断是否存在异方差。

  检验异方差的统计方法有很多。在本节中,我们只讨论更常见和常用的白色测试。

  现在假设我们建立以下回归方程:

  如果想用怀特检验来检验上述方程是否具有异方差性,主要分为以下几个步骤:

  1 .第一步:

  方程的残差ui可以通过方程的普通ols估计得到。

  第二步:

  将第一步中估计的残差作为Y,构建以下等式:

  上面构建的方程看起来很复杂,但主要由三部分组成:原方程的解释变量,解释变量的平方,解释变量之间的相互作用。

  方程构造完成后,对方程进行估计和求解。

  3.ste

  回想一下什么是异方差,就是残差项和一个或几个x之间存在相关性。

  如果步骤2中方程的每个系数都是0,是否意味着残差与任何x无关?我们称之为原始假设。反之,只要有一个系数不为0,就说明残差与X有关,即存在异方差。我们称之为替代假说。

  在原来的假设下,可以知道步骤2中方程的R 2乘以样本量N服从自由度等于步骤2回归方程中变量个数的卡方分布。

  在服从卡方分布的前提下,通过与卡方分布的临界值进行比较,可以判断原假设是否成立。

  第四步:

  如果计算的nR^2显著高于所选显著性水平的卡方临界值(p_value值),则需要拒绝方程具有异方差性的原始假设。

  如果存在异方差,还可以检查step2方程估计结果中各个变量的显著性,然后确定是哪个变量造成了异方差。

  需要注意的是,如果模型包含多个变量,那么多个变量相互作用项的引入会大大降低方程的自由度,所以可以根据情况选择不添加。

  当然,以上过程并不需要我们自己去实现。Python也有现成的包可以调用:

  stats models . stats . diagnostic . spec _ white(resid,exog)

  Resid表示原方程的残差,exog表示步骤2中的方程形式。上述函数将最终输出卡方值、对应的p _值和自由度。

  关于异方差的更多信息,可以点击文章开头的相册部分。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: