python一致性检验,python t检验显著差异
1.什么是统计显著性检验?
在统计学中,统计显著性是指结果背后有原因,而不是随机或偶然的。
SciPy为我们提供了一个名为scipy.stats的模块,该模块具有进行统计显著性检验的功能。
以下是执行此类测试时的一些重要技术和关键词:
统计假设
假设是关于整体参数的假设。
虚假设
假设观察值在统计上不显著。
假设
它假设这些观察是由于某种原因。
它取代了无效假设。
例如:
为了评估学生,我们将采取以下措施:
“学生比平均水平差”——这是一个无效的假设;
“学生优于平均水平”——作为一种替代假设。
单尾检验
当我们的假设只检验值的一侧时,叫做“单尾检验”。
例如:
对于最初的假设:
“均值等于k”,我们可以有另一个假设:
“平均值小于k”,或:
“平均值大于k”
双尾检验
当我们的假设检验两个值时。
例如:
对于最初的假设:
“均值等于k”,我们可以有另一个假设:
“平均值不等于k”
这种情况下,平均值小于或大于k,需要两边都检查。
阿尔法值
阿尔法值是一个有意义的水平。
例如:
要拒绝零假设,数据必须接近极限。
通常该值为0.01、0.05或0.1。
p值
p值表示数据实际上有多接近极限。
将p值与alpha值进行比较,以确定统计显著性。
如果p=,我们将拒绝最初的假设,并说该数据具有统计学意义。否则,我们接受原来的假设。
2、T检验
t检验用于确定两个变量的平均值之间是否存在显著差异。并告诉我们它们是否属于同一个发行版。
这是一个双尾检验。
函数ttest_ind()接受两个相同大小的样本,并生成一个t统计和p值的元组。
例如:
找出给定值v1和v2是否来自同一个分布:import numpy as np
从scipy.stats导入ttest_ind
v1=np.random.normal(大小=100)
v2=np.random.normal(大小=100)
res=ttest_ind(v1,v2)
打印(分辨率)
结果:Ttest _ indResult(statistic=0.408333510339674095,pvalue=0.68346891833752133)
如果只想返回pvalue,请使用pvalue属性:
示例:将numpy作为np导入
从scipy.stats导入ttest_ind
v1=np.random.normal(大小=100)
v2=np.random.normal(大小=100)
res=ttest_ind(v1,v2)。pvalue
打印(分辨率)
结果:
0.68346891833752133
3、KS测试
KS检验用于检查给定值是否服从分布。
该函数将待测值和CDF作为两个参数。
CDF可以是返回概率的字符串或可调用函数。
它可以用作单尾或双尾测试。
默认情况下,它是双尾的。我们可以将参数替换作为两边的字符串传递,较小的一边或较大的一边。
例如:
找出给定值是否服从正态分布:导入numpy作为np
从scipy.stats导入kstest
v=np.random.normal(大小=100)
res=kstest(v, norm )
打印(分辨率)
结果:
KstestResult(统计值=0.047798701221956841,p值=0.97667161777515)
4.数据的统计描述
要查看数组中值的汇总,我们可以使用describe()函数。
它返回以下描述:观察值的数量(nobs)
最小值和最大值=最小最大值
意思是
变化
歪斜
峭度
例如:
显示数组中值的统计描述:import numpy as np
从scipy.stats导入描述
v=np.random.normal(大小=100)
res=describe(v)
打印(分辨率)
结果:
描述结果(
nobs=100,
minmax=(-2.0991855456740121,2.137414964),
均值=0.11503747689121079,
方差=0.99418092655064605,
偏度=0.013953400984243667,
峭度=-0.676867686866
)
5.正态检验(偏度和峰度)
正态性检验基于偏度和峰度。
normaltest()函数返回原始假设的p值:
“X来自正态分布”。
偏斜度(skew):
数据对称性的测量。
对于正态分布,该值为0。
如果为负,则表示数据向左倾斜。
如果为正,则数据偏斜是正确的。
峰度(峭度):
衡量数据是否服从正态分布的标准。
正峰度意味着尾巴很重。
负峰度意味着轻微拖尾。
例如:
查找数组中值的偏度和峰度:将数组作为铭牌导入
从scipy.stats导入偏斜度、峰度
v=np.random.normal(大小=100)
打印(倾斜)
打印(峰度)
结果:0.11684463286486565
-0.1879320563260931
例如:
查找数据是否来自正态分布:将数组作为铭牌导入
从scipy.stats导入正常测试
v=np.random.normal(大小=100)
打印(正常测试)
结果:正常测试结果(统计值=4.4783745697002848值=0.1065598635538)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。