python 拟合分布,什么是统计分布拟合
我试图用statsmodels将泊松分布拟合到我的数据,但我对结果和如何使用该库感到困惑。
我的真实数据将是一系列数字,我想我应该能够将其描述为泊松分布加上一些异常值,所以最后我想做一个稳健的数据拟合。
但是出于测试目的,我只是使用scipy.stats.poisson来创建一个数据集samp=scipy.stats.poisson.rvs (4,size=200)
所以要拟合statsmodels,我觉得我只需要一个常量 endog res=sm.poisson (samp,np.ones _ like (samp))。适合()
打印汇总()泊松回归结果
==============================================================================
离开变量:y数量观察值:200
模型:泊松Df残差:199
方法:最大似然测向模型:0
日期:Fri,2014年6月27日。 0.000
时间:14:28:29对数似然比:-404.37
收敛:真LL-空:-404.37
LLR p值:南
==============================================================================
系数标准误差z Pz [95.0% Conf。里面的]
-
常数1.3938 0.035 39.569 0.000 1.325 1.463
==============================================================================
好吧,这看起来不对,但如果我是res.predict()
我得到一个4.03的数组(这是这个测试样本的平均值)。
所以基本上,首先我很困惑如何从statsmodel解释这个结果。其次,如果我对分布的稳健参数估计感兴趣,而不是趋势拟合,我可能会做一些完全不同的事情,但我应该怎么做呢?
编辑
要回答我问题的第二部分,我真的应该提供更多细节。
我有一个在开始时间后随机发生的事件。当我绘制许多事件的延迟时间直方图时,我看到分布看起来像比例泊松分布加上几个异常值,这些异常值通常是由底层系统中的问题引起的。所以我只想找出数据集的期望时延,排除离群值。如果不是异常值,我可以简单地找到平均时间。我想我可以手动排除它们,但我想我可以找到更严格的东西。
编辑
在进一步的思考中,我会考虑其他分布,而不是拘泥于泊松分布。我的问题的细节可能会分散对原始问题的注意力,但我还是把它们留在这里了。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。