python 拟合分布,什么是统计分布拟合

  python 拟合分布,什么是统计分布拟合

  我试图用statsmodels将泊松分布拟合到我的数据,但我对结果和如何使用该库感到困惑。

  我的真实数据将是一系列数字,我想我应该能够将其描述为泊松分布加上一些异常值,所以最后我想做一个稳健的数据拟合。

  但是出于测试目的,我只是使用scipy.stats.poisson来创建一个数据集samp=scipy.stats.poisson.rvs (4,size=200)

  所以要拟合statsmodels,我觉得我只需要一个常量 endog res=sm.poisson (samp,np.ones _ like (samp))。适合()

  打印汇总()泊松回归结果

  ==============================================================================

  离开变量:y数量观察值:200

  模型:泊松Df残差:199

  方法:最大似然测向模型:0

  日期:Fri,2014年6月27日。 0.000

  时间:14:28:29对数似然比:-404.37

  收敛:真LL-空:-404.37

  LLR p值:南

  ==============================================================================

  系数标准误差z Pz [95.0% Conf。里面的]

  -

  常数1.3938 0.035 39.569 0.000 1.325 1.463

  ==============================================================================

  好吧,这看起来不对,但如果我是res.predict()

  我得到一个4.03的数组(这是这个测试样本的平均值)。

  所以基本上,首先我很困惑如何从statsmodel解释这个结果。其次,如果我对分布的稳健参数估计感兴趣,而不是趋势拟合,我可能会做一些完全不同的事情,但我应该怎么做呢?

  编辑

  要回答我问题的第二部分,我真的应该提供更多细节。

  我有一个在开始时间后随机发生的事件。当我绘制许多事件的延迟时间直方图时,我看到分布看起来像比例泊松分布加上几个异常值,这些异常值通常是由底层系统中的问题引起的。所以我只想找出数据集的期望时延,排除离群值。如果不是异常值,我可以简单地找到平均时间。我想我可以手动排除它们,但我想我可以找到更严格的东西。

  编辑

  在进一步的思考中,我会考虑其他分布,而不是拘泥于泊松分布。我的问题的细节可能会分散对原始问题的注意力,但我还是把它们留在这里了。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: