onehot编码举例,python one-hot编码

  onehot编码举例,python one-hot编码

  0.引言热码的概念经常被提及,那么什么是热码呢?我来总结一下。

  什么是一键代码?一热码:又称一位有效编码,主要码N位状态寄存器N个状态。每个状态都是他使用的一个独立的寄存器位,任意时刻都是http://www。

  独热码将分类变量表示为只有一位有效。首先,分类值必须映射到一个整数值。每个整数值都表示为一个二进制向量,不包括整数索引,该索引为零并标记为1。

  以上是官方术语的定义,但好像不是特别清楚。我给你举个例子。

  2.至于2的例子。一键代码,提供了一些实际的例子。在上面的描述中,独热码也被称为N种编码之一。

  假设学生的性别[男女]是编码的。

  根据上述公式概念,N个状态由N位状态寄存器编码。这里有两个特征,即N=2,可以表示为。

  男\右箭头[1,0];

  女性\右箭头[0,1];

  假设学生的成绩【小学、初中、高中】是编码的。

  如上所述,可以表述如下。

  小学\右箭头[1,0,0];

  初中\右箭头[0,1,0];

  高中\ rightarrow [0,0,1];

  假设学生的特长【钢琴、绘画、舞蹈、篮球】都是有编码的。

  如上所述,可以表述如下。

  Piano \ rightarrow [1,0,0,];

  绘画\右箭头[0,1,0,0];

  舞蹈\右箭头[0,0,1,0];

  篮球\右箭头[0,0,0,1];

  那么,如果是这样的样本【男,初中,篮球】,可以表示为【1,0,0,1,0,0,1】。

  3.OneHotEncoder Fromsklearn。预处理ImportOneHotEncoder #模拟训练数据x=[0,0,2],[1,2,3]1]1)enc=onehotencode(spare=false)enc . fit(x)x)#测试数据x _ test

  [[0 . 1 . 1 . 0 . 0 . 0 . 1 . 0]]上述代码中有四个训练数据,特征数为3。对应上面的例子,第一列训练数据是0.110,也就是第二排学生性别特征[男,女] 0.210正好是对应的年级特征[小学,初中,高中2,3,第三排01是完全符合特长的[钢琴,绘画,舞蹈,篮球];训练数据1: 0,0,2表示【男,小学,舞蹈】,其他类似;测试数据1,0,2表示【女,小学,舞蹈】。从二进制向量的例子可以选择[0,1,1,0,0,0,0,0,0,1,0]。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: