简述区间估计的含义,下列关于区间估计的说法中
这里的场景是:给定一组数据,估计一个区间,使区间内的数据大致均匀分布,保证区间内的数据能包含总数据的大部分。
(在统计学中,“区间估计”是指从样本中获得的值与总体真实值之间的误差)
一.工具
Python:
熊猫包:绘图和数据分析比Java有优势。
Java:
Range类:生成区间范围,方便判断数据是否在区间内;
谓词类;
表达式
二、应用场景
假设有一组不规则数据X[x1,x2,x3,x4,x5,x6,…],需要估计其有效区间范围[a,b],可以保证大部分数据落在范围a,b内。
三、计算方法
排序,从小到大;取1/4处的值,假设X;取3/4处的值,假设是Y;a=x-1.5 *(y-x);b=y 1.5 *(y-x);四。原则
类似于盒图绘制原理,求数据的四分位数。
如果用一组数据画直方图,选择横坐标的第一反应是用数据的最小值作为起点,用数据的最大值作为终点(刻度)。但这里有个问题:如果数据分布不均匀(标准差较大),比如100个值中最小值为1,最大值为1000,但其他所有值都小于5,那么画出来的图就不“漂亮”。最好的办法是找一个区间,这个区间可以包含大部分数据。求四分位数是一个相对简单的方法,来源于经验,但在大多数情况下是有用的。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。