python数据分析就业,python数据分析方向的第三方库是
Python数据分析-T检验和F检验:两组数据哪个更好?(一)__姜俊泽的技术博客_博客
t,F测试1。导言2。假设检验2.1原始假设和替代假设2.2接受域和拒绝域2.3两种错误3。单样本假设检验3.1选择零假设和相反假设3.2选择显著性水平 3.3确定检验统计量,这个统计量和确定检验的决策规则。用p值或临界值描述3.4从总体中随机抽取一个样本,从样本中计算检验统计量的值。如有可能,以p值3.5为例计算。
1.引言在某一指标上比较两种模型的优劣,可以直接进行比较,同时为了使比较结果更有说服力,可以采用统计检验的方法。
t检验用于比较这两组k个样本的均值,f检验用于比较这两组k个样本的方差。
即两个模型分别运行k次,用T检验比较这两组k个样本的均值,用f检验比较这两组k个样本的方差。均值越大,方差越小,模型对当前指数越好,越稳定。
2.假设检验假设检验是以抽样分布为基础的,因为利用这些抽样分布的分布特征和统计量可以导出估计和假设检验的概率公式。
平均值的抽样分布用于总体估计和假设检验:
如果分布是正态分布,则用于均值估计和假设检验的抽样分布是标准正态分布(Z统计)。如果总体方差未知,用于均值估计和假设检验的抽样分布是t分布(t统计)。使用卡方分布(卡方统计)对总体方差进行估计和假设检验。
2.1原始假说和替代假说原始假说和替代假说在不同的教材中名称不同,但含义相同。它们是假设检验理论的基础。具体介绍请回顾:假设检验原理3354原假设和备择假设的建立。
在参数检验中,首先要对一个一般参数建立一个假设,然后在后续的抽样推断中以这个假设为前提进行检验。这个假说被称为原始假说,由H0表示。
如果测试结果不能拒绝原来的假设,就接受这个假设。如果检验结果否定了原来的假设,另一个假设3354必须接受替代假设,用H1表示。
因此,原始假说和替代假说是对立的。参数假设成立后,检验结果要么是原假设,要么是备择假设,必须选择其一。
2.1.1示例
当灯泡制造商向用户提供一批灯泡时,它声称,
这批灯泡的平均使用寿命为1600小时。
为了验证厂家的说法,需要使用样本数据进行检验。因此,用户必须首先做出以下假设
然后用户选择样本并计算样本的数据。
如果样本数据接近1600小时,可以接受原假设;
如果样本数据远离1600小时(远高于或低于1600小时),则原始假设将被拒绝,替代假设将被接受。
在一般假设检验中,我们会在检验前并排写出两个假设,即:
以上假设是参数等于某个值,备选假设不等于某个值。类似于这种假设的检验称为双边假设检验。有时还有另一种检验形式,叫做单侧假设检验。
比如,灯泡厂商在向用户提供一批灯泡时,声称这批灯泡的平均寿命至少为1600小时。
在这种情况下,用户需要通过样本数据检查1600是否有效。
此时是否长于1600小时,是用户需要研究的问题。
一般原则是将此设为备选假设,记为
如果检验结果显示不能拒收H0,不代表灯泡平均寿命高于1600小时,也就是厂家的说法不可信。
如果样品测试的结果表明H0可以被拒绝
与右假设检验(左假设检验)相反,它的备择结构被设置为小于某个值。
比如有人告诉用户,某一种灯泡的平均寿命不到1600小时,用户要测试这个人的说法。
这个时候用户在研究会不会小于1600小时,所以他要设置1600作为备选假设,也就是有
如果样本数据可以拒绝H0,它将接受H1: 1600,即该人的陈述是可信的。否则,如果H0被接受,此人的陈述就不可信。这个检验属于左假设检验。
2.2接受域和拒绝域假设设定后,需要设定一个判断样本数据多少的准则,才能接受或拒绝原假设。这个准则就是给出一个小概率,根据“小概率事件原理”(小概率事件会发生)做出判断。这里小概率用表示,称为显著性水平。
比如假设假设后给定一个小概率=0.05,这样就可以在假设成立的分布中确定两个区域:一个是接近=1600的区域,称为接受区域;另一种是远离=1600的区域,称为拒绝域。
从上图可以看出,接受域的概率区间为1-,拒绝域的区间概率为,两边各有/2。
在判断假设时,无论是单侧检验还是双侧检验,都适用以下判断原则:
如果样本值落在接受域内,则接受原始假设,而拒绝备选假设;如果样本值落在被拒绝的域内,则原始假设被拒绝,而替代假设被接受。
2.3两种错误理想的假设检验是,当H0是正确假设时,可以判定为接受。当H0是一个不正确的假设时,可以判断为拒绝。但从样本统计数据判断整体参数时,由于样本数据是随机的,判断时可能会出现四种结果:
H0是真的,但它被判断为拒绝。这类错误是“弃真”错误,即把真理当假,也叫第一类错误。H0是真实的和被接受的,这是正确的歧视。H0是虚假的和被拒绝的,这是正确的歧视。H0是假的,被接受了。这种错误称为“取伪”错误,即把伪当真,也称为第二类错误。结论
韦珍
错误的
接受
真实的判断
“误取”错误
拒绝
“放弃真理”的错误
真实的判断
从上表可以看出,当检验结果否定了原来的假设时,判断可能是正确的,也可能是“弃真”的错误。虽然不可能判断产生“假”错误的概率,但是从前述可知,拒绝域的概率是。所以在假设检验中,犯“弃真”错误的最大概率就是给定的显著性水平。
当检验结果接受H0的原始假设时,这种区分可能是正确的也可能是错误的。通常用来表示出现虚假错误的概率,的概率由真实总体参数的分布决定。在假设检验中,由于真实的总体参数值未知,的概率值也是未知的。
因此,在测试中,如果结论是H0被拒绝,H1被接受,出错的概率很小()。但是如果结论是H0被接受,H1被拒绝,那么出错的概率()是未知的。从这个角度来看,所谓接受H0,其实就是不能拒绝H0,也就是没有充分的证据只能接受。
虽然考察时是未知的,但对于固定的总体,当给定时,的值就确定了,如下图所示:
当真实总体均值为1时,假设总体均值为0,(1 0)。如果样本数据落入区,结论是正确的,即0被剔除。如果样本数据落入可接受域,则原始假设0将被接受,这产生了“假”错误。
进行假设检验时,一般按以下四个步骤进行:
根据问题建立原假设和备选假设;选择合适的样本统计量,确定H0为真时的抽样分布;选择显著性水平和de
3.1选择零假设和相反假设。一个零假设和一个相反假设形成一对统计假设(请复习原假设和相反假设的概念描述:假设检验原理3354原假设和替代假设的建立)。这类成对统计假设可分为两类三种:单边假设检验和双边假设检验(两类);假设有三种:无方向反对,左反对,右反对。
单侧假设检验:当只有一个方向的变化很重要(一种新型减肥药实际减了多少体重)或者研究假设预测了一个具体的变化方向(一种新型的治疗性肿瘤会减少)时,宜采用单侧假设。有的需要检查是大了还是小了。
双侧假设检验:对于探索性研究和质量控制,因为任何一个方向的变化都要进行检验,所以单一检验是不合适的。应采用双侧假设检验,如控制产品的重量和产品中某种物质的含量。
3.2选择显著水平回忆估计理论,总体均值的区间估计概率公式如下:
其中,1-称为置信度或置信系数,(1-)100%称为置信度。以双尾为例:
在假设检验理论中,是假设检验的显著性水平,因为它用来评价样本结果的显著性。如果点估计与零假设中的假设参数相差很大,以至于P,则零假设将被拒绝,其结果称为统计显著;如果P ,则零假设被接受,结果被认为没有统计学意义。如上图所示,临界域为统计显著域,接受域为非统计显著域。
显著性水平在测试前设定为0.05或0.01。例如,当=0.05时,分析者会在报告中写明“在0.05显著水平(或5%显著水平)进行统计假设检验”,如果P0.05,则剔除原假设,结果称为统计显著;如果P 0.05,接受零假设,结果没有统计学意义。
从上图可以看出,如果P0.05,阴影面积大于P0.01,那么P0.05可以说是“显著结果”,P0.01可以说是“高度显著结果”。第一类错误的概率P0.01小于P0.05。
3.3确定检验统计量,由统计量和确定检验决策规则,用P值或临界值描述。
3.4从总体中随机抽取样本,并从样本中计算检验统计值。如果可能,计算P值。根据假设检验的总体参数和已知信息,选择假设检验的统计量。
总体均值的假设检验
您可以从下表中选择:
总体方差的假设检验
可以用卡方分布。
3.5例如,如果电池制造商最近设立了一个项目来改进计算器电池,该项目要求改进后的电池比现有电池持续更长时间,已知计算器中电池寿命的测量值呈正态分布,平均值为100.3分钟,标准偏差为
6.25分钟.现在,一种改进的电池被开发出来,理论上可以持续更长时间。根据初步测试,假周期寿命测量也是正态分布,标准差为6.25分钟。选取一个n=20的改进电池样本,平均值为
在105.6min,在显著水平=0.05下,进行H0: =100.3min的单侧检验,用P值(Z值)描述决策。
因为电池寿命的增加是重要的并且在理论上是合理的,所以右边的统计假设成立:
当z统计时,用p值(或z值,表示右尾决定规则)
如果(),拒绝。
计算P值(临界Z值)
查标准正态分布表,Z=3.363对应的概率是0.4996。
因为Z=3.363 1.645,所以我们拒绝零假设,接受相反的假设。同样,我们也可以比较P值。因为P=0.0004=0.05,所以我们拒绝零假设,接受相反的假设。因此,可以通知公司,在0.05的显著水平上,可以认为新电池具有长的使用寿命。
版权属于a
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。