样本方差之和等于总体方差,由样本方差求总体方差

　　在样本方差计算中，选择值n-1的基础是：

　　数学基础：https://www.zhihu.com/question/28964121

　　作者：杨凡

　　链接：https://www.zhihu.com/question/28964121/answer/289715220

　　来源：知乎

　　版权归作者所有。

　　方差除以而不是除以的表达式真的是日经题目。其实唯一的解释是，除法的定义可以使样本方差作为总体方差的估计量无偏。

　　换句话说，如果样本是从(总体)均值为(总体)方差为的总体中随机抽取的，那么样本均值定义为，样本方差定义为，得出如下结论：这是公正的体现。这里需要注意的是，不要求总体是正态总体，任何随机分布的总体都具有上述性质。

　　这里有一点关于公正的重要性。事实上，统计量或某个参数的估计量应该是无偏的，这比想象的更重要。例如，如果有偏差，我不能直接从最终估计值中减去偏差吗？这其实隐含了所谓的“偏差”。你确切地知道它是多少，这也暗示了“偏差”是一个常数。其实一个估计量是有偏的，当然也可以偏到——，这样就无法知道是什么了。其次，如果你对统计学有很深的了解，你就会知道，我们所谓的点估计，其实就是用一个随机变量(比如这里的和)来估计一个参数(非随机变量)的值，而这个随机变量对应的是一个分布(比如正态总体下，)。所以即使总数是参数不变，不同批次的样本做出的点估计(s)也是不一样，无偏性是有保证的。即使这些点估计量互不相同，但如果批次(不是样本)越来越多，这些点估计量的直方图就必须以真值周围的正态分布来绘制。

　　如果你觉得上面的分析为了解释不太自然，那么你可以考虑这样一个例子。设它是从正态人口中随机抽取的样本，具有(人口)均值和(人口)方差，然后根据最大似然估计(MLE)，(注意这里的MLE解是除以)。不同的估算方法会有不同的统计数据。例如，如果使用限制最大似然估计(REML)，这里的估计就变成了，(注意这里的REML是用除法求解的)。你自然会问，为什么两种方法的结果不一样？或者说REML到底限制了什么？这时候你可以用自由度来解释：在和未知的情况下，回忆你求解MLE的过程，求导后设为零，从而得到两个方程，从第一个方程先开始求解，也就是说可以不用第二个方程求解，但是可以带入第二个方程，然后才能连续求解。MLE不考虑求解过程的细节，所以得到的和除以；REML考虑到了这个细节，所以除以。

　　最后，作为总体方差的估计，这种划分有时是有优势的，即使有偏差：比如在已知的情况下，可以达到C-Rao的下界；未知时，无法达到C-Rao的下界。

　　此外，请参考：https://blog.csdn.net/Hearthougan/article/details/77859173.

　　模型计算与验证：通过计算机建立模型，并在一定程度上采用“穷举”的方法进行实际测量和验证，可以更直观地验证数学理论的结果，并不严谨。

　　为什么样本n-1-python_backup-blog park的标准差的分母是https://www.cnblogs.com/webRobot/p/7722820.html?