python求相关性系数,python回归系数
用PYTHON计算偏相关系数在统计学中,我们经常用皮尔逊相关系数来衡量两个变量之间的线性关系。然而,有时我们对理解两个变量之间的关系感兴趣,同时控制第三个变量。
例如,假设我们想要测量学生的学习时间和期末考试成绩之间的相关性,同时控制学生在班级中的当前成绩。在这种情况下,我们可以用偏相关来衡量学习时间和期末考试成绩的关系。
例如:Partial Correlation in Python
假设我们有以下数据框架,它显示了10名学生的当前成绩、总学习时间和期末考试成绩:
要在控制currentGrade的同时计算hours和examScore之间的部分相关性,我们可以使用pingouin包中的partial_corr()函数,该函数使用以下语法:
partial_corr(data, x, y, covar)
其中:
数据:数据帧的名称
x,y:数据帧中列的名称
covar:数据框架中协变量列的名称(例如,您控制的变量)
#安装并导入pingouin包pip将pingouinimport pingouin安装为pg#在控制gradepg.partial_corr(data=df,x=hours ,y=examScore ,Covar= current grade )n r ci 95% R2Adj _ R2P-瓦尔B F10幂皮尔逊100.191 [-0.5,0.73]0.036-0.2380 . 5980 . 4380 . 082我们可以看到随着学习时间的增加。如果当前分数不变,测试分数也会增加。
要一次性计算多个变量之间的部分相关性,可以使用.pcorr()函数:
#计算所有成对偏相关,四舍五入到小数点后三位。round(3)currradeyoursxamscorecurrentgrade 1.000-0.311 0.736小时-0.3111.000 0.191 exam score 0.7360 . 191 1.000在https://www.statology.org/partial-correlation-python/.翻译
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。