python连续变量离散化,离散数学 python
概念
1.连续属性的离散化是指将连续属性的取值范围分成若干个离散的区间,最后用不同的符号或整数值来表示落在每个子区间内的属性值。
2、实现、分组,将分组好的结果转换成one-hot编码(哑变量)
实例
#1)准备数据
数据=pd。Series([165,174,160,180,159,163,192,184],index=[No1:165 , No2:174 , No3:160 , No4:180 , No5:159 , No6:163 , No7:192 , No8:184
#2)分组
#自动分组
sr=pd.qcut(data,3)
Sr. Value _ Counties () #看看每组有多少数据。
#3)转换为一键编码
pd.get_dummies(sr,前缀=height )
#自定义分组
bin=[150,165,180,195]
sr=pd.cut(数据,箱)
#get_dummies
Pd.get_dummies(sr,前缀= height )以上是python数据离散化的介绍。希望对你有帮助。更多python学习方向:Python基础课程
本教程运行环境:windows7系统,Python 3.9.1,DELL G3电脑。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。