R语言求相关系数矩阵,python求相关系数矩阵
相关矩阵,也称为相关系数矩阵,是由矩阵的列之间的相关系数组成的。即,相关矩阵的第I行和第J列中的元素是原始矩阵的第I列和第J列的相关系数。
定义:
设(X1,X2,x3,xn)为N维随机变量,任意Xi和Xj存在相关系数ij(I,j=1,2,N)。以IJ为元素的N次矩阵称为这个维随机向量的相关矩阵。当标记为R时,即
属性:关联矩阵的对角元素是1。相关矩阵是对称矩阵。
在python中,利用熊猫的corr可以得到相关系数矩阵。代码如下。
Corrdf=full.corr () corrdf输出(仅剪切部分):
默认情况下,为每个行和列对返回人员的相关系数。可以通过肯德尔的tau或者斯皮尔曼的秩相关系数(例如,corr)方法=Spearman )或。corr) method=Kendall 通过传递方法的参数。
也可以按降序排列相关系数矩阵。Ascending=False表示降序。
corr [存活]的输出。sort _ values(升序=false):
幸存1.00000 title _ Mrs 0.344935 title _ miss 0.332795 pclass _ 10.285904 FAMILY DF _ small 0.279855 fare 0.257307 CABIN _ b 0.110 652 pclass _ 20.093349 title _ master 0.085221 parch 0.081629 CABIN _ f 0.057935 title _ f 0.0577通常可以选择绝对值在0.1以上的特征进行建模。如果需要建立强关联模型,请选择更强的关联特征。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。