python 计算p值,python计算两个数平均值
我们在做A/B实验评估时需要p_value的帮助。本文记录了如何使用python计算两组数据的显著性。
一、代码
# TTest.py
# -*-编码: utf-8 -*-
#创建于2020-05-20 20:36
# TTest.py
# @author:惠文华
##导入包
将numpy作为np导入
从scipy导入统计
def get_p_value(arrA,arrB):
a=np.array(arrA)
b=np.array(arrB)
t,p=stats.ttest_ind(a,b)
返回p
if __name__==__main__:
get_p_value([1,2,3,5,],[6,7,8,9,10])二、T检验:两样本T检验
双样本t检验是比较两个样本所代表的两个总体平均值之间是否存在显著差异。除了要求样本来自正态分布外,还要求两个样本的总体方差相等,即“方差齐性”。
检验原假设:样本均值无差异(=0)。
命令Python stats.ttest_ind(数据1,数据2)
当不确定两个总体方差是否相等时,首先要用levene检验来检验两个总体是否具有方差齐性。stats.levene(数据1,数据2)。如果返回结果的P值远大于0.05,那么我们认为两个总体具有方差齐性。如果两个总体不具有方差齐性,则需要添加参数equal_val并将其设置为False,如下所示。
统计数据。ttest _ ind (data1,data2,equal _ var=false)//ttest默认具有方差齐性。
三、结果解释
当P值小于某一显著性水平(如0.05)时,认为样本均值存在显著差异。具体分析要看选择双边假设还是单边假设(也分小于和大于)。双边测试注意stats.ttest_ind。
当t的值大于0时,第一组数据优于第二组数据的置信度为((1-p)* 100)%。比如p=0.05,那么我们有95%的把握第一组数据比第二组数据好。
相关学习推荐:python视频教程
以上是如何基于python计算两组数据的P值的细节。其他相关文章请多关注盛行的IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。