excel计算斯皮尔曼相关系数,皮尔逊相关系数怎能计算
相关分析相关分析是研究同一位置两个或两个以上随机变量之间相关性的统计分析方法。通过分析不同特征或数据之间的关系,找到关键影响和驱动因素。在实际工作应用中,它经常用于特征发现和选择。对于不同数据类型的变量,应选择不同的检验方法,如下表所示。
数量变量型检验方法有连续变量的皮尔逊相关系数、简单线性回归、有序分类变量的Mantel-Haenszel趋势检验、Spearman相关系数、无序分类变量的Kendall tau-b相关系数、Fisher精确检验的卡方检验、相对风险、比率、卡方检验和Phi ()系数、Fisher精确检验皮尔逊相关系数(简称为Pearson积差相关系数、PPMCC或PCCs)用于衡量两个变量X和Y之间的相关性(线性相关),它们的值在-之间
1.适用范围
两个变量之间是线性关系,都是连续数据。这两个变量的总和是正态分布,或接近正态的单峰分布。两个变量的观测值是成对的,每对观测值是相互独立的。2.原理
利用两个变量之间的协方差和变量的标准差计算得出(分子是协方差,分母是两个变量标准差的乘积)3.Python实现
import panda as PD import numpy as NP # data #这里求相关系数df=PD . data frame(NP . random . randn(20)。reshape (4,5),index=[1,2,3,4],columns=[a c , d ,])x=df . values correlation _ matrix=NP . corrcoef(x . T)r=correlation _ matrix[:-1]。to list()for I in range(len(r)):print(str(r[I]))4.其他补充
为什么输出会有nan?
皮尔逊相关系数是利用两个变量之间的协方差和变量的标准差计算出来的。如果相关系数是nan,说明数据有问题。
检查数据类型是否为非数字。你可以用info()来检查数据是否都一样,结果分母中的标准差为0.计算相关系数之前需不需要标准化?。
不需要标准化,因为相关系数是标准化的统计量。从上面的计算公式可以看出,这是一个标准化的过程,即相关系数就是标准化的协方差。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。