python连续变量离散化,离散数学 python

  python连续变量离散化,离散数学 python

  概念

  1.连续属性的离散化是指将连续属性的取值范围分成若干个离散的区间,最后用不同的符号或整数值来表示落在每个子区间内的属性值。

  2、实现、分组,将分组好的结果转换成one-hot编码(哑变量)

  实例

  #1)准备数据

  数据=pd。Series([165,174,160,180,159,163,192,184],index=[No1:165 , No2:174 , No3:160 , No4:180 , No5:159 , No6:163 , No7:192 , No8:184

  #2)分组

  #自动分组

  sr=pd.qcut(data,3)

  Sr. Value _ Counties () #看看每组有多少数据。

  #3)转换为一键编码

  pd.get_dummies(sr,前缀=height )

  #自定义分组

  bin=[150,165,180,195]

  sr=pd.cut(数据,箱)

  #get_dummies

  Pd.get_dummies(sr,前缀= height )以上是python数据离散化的介绍。希望对你有帮助。更多python学习方向:Python基础课程

  本教程运行环境:windows7系统,Python 3.9.1,DELL G3电脑。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: