样本方差之和等于总体方差,由样本方差求总体方差
在样本方差计算中,选择值n-1的基础是:
数学基础:https://www.zhihu.com/question/28964121
作者:杨凡
链接:https://www.zhihu.com/question/28964121/answer/289715220
来源:知乎
版权归作者所有。
方差除以而不是除以的表达式真的是日经题目。其实唯一的解释是,除法的定义可以使样本方差作为总体方差的估计量无偏。
换句话说,如果样本是从(总体)均值为(总体)方差为的总体中随机抽取的,那么样本均值定义为,样本方差定义为,得出如下结论:这是公正的体现。这里需要注意的是,不要求总体是正态总体,任何随机分布的总体都具有上述性质。
这里有一点关于公正的重要性。事实上,统计量或某个参数的估计量应该是无偏的,这比想象的更重要。例如,如果有偏差,我不能直接从最终估计值中减去偏差吗?这其实隐含了所谓的“偏差”。你确切地知道它是多少,这也暗示了“偏差”是一个常数。其实一个估计量是有偏的,当然也可以偏到——,这样就无法知道是什么了。其次,如果你对统计学有很深的了解,你就会知道,我们所谓的点估计,其实就是用一个随机变量(比如这里的和)来估计一个参数(非随机变量)的值,而这个随机变量对应的是一个分布(比如正态总体下,)。所以即使总数是参数不变,不同批次的样本做出的点估计(s)也是不一样,无偏性是有保证的。即使这些点估计量互不相同,但如果批次(不是样本)越来越多,这些点估计量的直方图就必须以真值周围的正态分布来绘制。
如果你觉得上面的分析为了解释不太自然,那么你可以考虑这样一个例子。设它是从正态人口中随机抽取的样本,具有(人口)均值和(人口)方差,然后根据最大似然估计(MLE),(注意这里的MLE解是除以)。不同的估算方法会有不同的统计数据。例如,如果使用限制最大似然估计(REML),这里的估计就变成了,(注意这里的REML是用除法求解的)。你自然会问,为什么两种方法的结果不一样?或者说REML到底限制了什么?这时候你可以用自由度来解释:在和未知的情况下,回忆你求解MLE的过程,求导后设为零,从而得到两个方程,从第一个方程先开始求解,也就是说可以不用第二个方程求解,但是可以带入第二个方程,然后才能连续求解。MLE不考虑求解过程的细节,所以得到的和除以;REML考虑到了这个细节,所以除以。
最后,作为总体方差的估计,这种划分有时是有优势的,即使有偏差:比如在已知的情况下,可以达到C-Rao的下界;未知时,无法达到C-Rao的下界。
此外,请参考:https://blog.csdn.net/Hearthougan/article/details/77859173.
模型计算与验证:通过计算机建立模型,并在一定程度上采用“穷举”的方法进行实际测量和验证,可以更直观地验证数学理论的结果,并不严谨。
为什么样本n-1-python_backup-blog park的标准差的分母是https://www.cnblogs.com/webRobot/p/7722820.html?
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。