python一致性检验,python t检验显著差异

  python一致性检验,python t检验显著差异

  1.什么是统计显著性检验?

  在统计学中,统计显著性是指结果背后有原因,而不是随机或偶然的。

  SciPy为我们提供了一个名为scipy.stats的模块,该模块具有进行统计显著性检验的功能。

  以下是执行此类测试时的一些重要技术和关键词:

  统计假设

  假设是关于整体参数的假设。

  虚假设

  假设观察值在统计上不显著。

  假设

  它假设这些观察是由于某种原因。

  它取代了无效假设。

  例如:

  为了评估学生,我们将采取以下措施:

  “学生比平均水平差”——这是一个无效的假设;

  “学生优于平均水平”——作为一种替代假设。

  单尾检验

  当我们的假设只检验值的一侧时,叫做“单尾检验”。

  例如:

  对于最初的假设:

  “均值等于k”,我们可以有另一个假设:

  “平均值小于k”,或:

  “平均值大于k”

  双尾检验

  当我们的假设检验两个值时。

  例如:

  对于最初的假设:

  “均值等于k”,我们可以有另一个假设:

  “平均值不等于k”

  这种情况下,平均值小于或大于k,需要两边都检查。

  阿尔法值

  阿尔法值是一个有意义的水平。

  例如:

  要拒绝零假设,数据必须接近极限。

  通常该值为0.01、0.05或0.1。

  p值

  p值表示数据实际上有多接近极限。

  将p值与alpha值进行比较,以确定统计显著性。

  如果p=,我们将拒绝最初的假设,并说该数据具有统计学意义。否则,我们接受原来的假设。

  2、T检验

  t检验用于确定两个变量的平均值之间是否存在显著差异。并告诉我们它们是否属于同一个发行版。

  这是一个双尾检验。

  函数ttest_ind()接受两个相同大小的样本,并生成一个t统计和p值的元组。

  例如:

  找出给定值v1和v2是否来自同一个分布:import numpy as np

  从scipy.stats导入ttest_ind

  v1=np.random.normal(大小=100)

  v2=np.random.normal(大小=100)

  res=ttest_ind(v1,v2)

  打印(分辨率)

  结果:Ttest _ indResult(statistic=0.408333510339674095,pvalue=0.68346891833752133)

  如果只想返回pvalue,请使用pvalue属性:

  示例:将numpy作为np导入

  从scipy.stats导入ttest_ind

  v1=np.random.normal(大小=100)

  v2=np.random.normal(大小=100)

  res=ttest_ind(v1,v2)。pvalue

  打印(分辨率)

  结果:

  0.68346891833752133

  3、KS测试

  KS检验用于检查给定值是否服从分布。

  该函数将待测值和CDF作为两个参数。

  CDF可以是返回概率的字符串或可调用函数。

  它可以用作单尾或双尾测试。

  默认情况下,它是双尾的。我们可以将参数替换作为两边的字符串传递,较小的一边或较大的一边。

  例如:

  找出给定值是否服从正态分布:导入numpy作为np

  从scipy.stats导入kstest

  v=np.random.normal(大小=100)

  res=kstest(v, norm )

  打印(分辨率)

  结果:

  KstestResult(统计值=0.047798701221956841,p值=0.97667161777515)

  4.数据的统计描述

  要查看数组中值的汇总,我们可以使用describe()函数。

  它返回以下描述:观察值的数量(nobs)

  最小值和最大值=最小最大值

  意思是

  变化

  歪斜

  峭度

  例如:

  显示数组中值的统计描述:import numpy as np

  从scipy.stats导入描述

  v=np.random.normal(大小=100)

  res=describe(v)

  打印(分辨率)

  结果:

  描述结果(

  nobs=100,

  minmax=(-2.0991855456740121,2.137414964),

  均值=0.11503747689121079,

  方差=0.99418092655064605,

  偏度=0.013953400984243667,

  峭度=-0.676867686866

  )

  5.正态检验(偏度和峰度)

  正态性检验基于偏度和峰度。

  normaltest()函数返回原始假设的p值:

  “X来自正态分布”。

  偏斜度(skew):

  数据对称性的测量。

  对于正态分布,该值为0。

  如果为负,则表示数据向左倾斜。

  如果为正,则数据偏斜是正确的。

  峰度(峭度):

  衡量数据是否服从正态分布的标准。

  正峰度意味着尾巴很重。

  负峰度意味着轻微拖尾。

  例如:

  查找数组中值的偏度和峰度:将数组作为铭牌导入

  从scipy.stats导入偏斜度、峰度

  v=np.random.normal(大小=100)

  打印(倾斜)

  打印(峰度)

  结果:0.11684463286486565

  -0.1879320563260931

  例如:

  查找数据是否来自正态分布:将数组作为铭牌导入

  从scipy.stats导入正常测试

  v=np.random.normal(大小=100)

  打印(正常测试)

  结果:正常测试结果(统计值=4.4783745697002848值=0.1065598635538)

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: