python分类变量相关性分析,python典型相关分析
r语言也是目前常用的数据分析编程语言之一。通过目前用户和科学家的开发,其功能也比较强大。本文用R语言corrplot制作了相关系数矩阵的热图。
数据集中有506个观察样本和14个变量:
image.png
首先,将数据导入R软件。
我的数据
摘要(我的数据)。
然后计算相关系数,下载相关系数矩阵corrplot包。
表示留数
下载install.packages(corrplot )相关系数矩阵corrplot软件包
Corrplot(RES,method=shade ,shade.col=NA,tl.col=black ,tl.srt=45,order=AOE) #绘制相关系数矩阵
获取图形:
image.png
相关系数图的颜色越深,两个变量之间的相关系数越接近1。从图中可以看出,在波士顿房价中值的MEDV列中,与LSTAT、PTRATIO、RM等变量的相关性最大。
让我们关注一个名为corrplot的函数。
在命令corrplot(RES,method=shade ,shade.col=NA,tl.col=black ,tl.srt=45,order=AOE )中
Res:表示要可视化的相关系数矩阵;
Method=shade 是指指定圆形、四边形、椭圆形、数值、阴影、颜色或饼图的图形的方法。method=c(圆形,正方形,椭圆, nunu)
Shade.col=NA:指定图形显示的颜色。默认情况下,它显示为统一的颜色。
Tl.col:指定文本标签的颜色,即几何图形的文本标签是什么颜色。默认值是黑色;
Tl.srt=45,表示字符标签的大小;
Order=AOE :指定相关系数的排序方法。可以是原始顺序(original)、特征向量角度顺序(AOE)、第一主成分顺序(FPC)、层次聚类顺序(hclust)和字母顺序。一般)AOE),排序结果比FPC好)。
根据corrplot函数的不同属性,可以转换属性以创建具有不同相关系数矩阵的热图。
image.png
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。