onehot编码举例,python one-hot编码
0.引言热码的概念经常被提及,那么什么是热码呢?我来总结一下。
什么是一键代码?一热码:又称一位有效编码,主要码N位状态寄存器为N个状态。每个状态都是他使用的一个独立的寄存器位,任意时刻都是http://www。
独热码将分类变量表示为只有一位有效。首先,分类值必须映射到一个整数值。每个整数值都表示为一个二进制向量,不包括整数索引,该索引为零并标记为1。
以上是官方术语的定义,但好像不是特别清楚。我给你举个例子。
2.至于2的例子。一键代码,提供了一些实际的例子。在上面的描述中,独热码也被称为N种编码之一。
假设学生的性别[男女]是编码的。
根据上述公式概念,N个状态由N位状态寄存器编码。这里有两个特征,即N=2,可以表示为。
男\右箭头[1,0];
女性\右箭头[0,1];
假设学生的成绩【小学、初中、高中】是编码的。
如上所述,可以表述如下。
小学\右箭头[1,0,0];
初中\右箭头[0,1,0];
高中\ rightarrow [0,0,1];
假设学生的特长【钢琴、绘画、舞蹈、篮球】都是有编码的。
如上所述,可以表述如下。
Piano \ rightarrow [1,0,0,];
绘画\右箭头[0,1,0,0];
舞蹈\右箭头[0,0,1,0];
篮球\右箭头[0,0,0,1];
那么,如果是这样的样本【男,初中,篮球】,可以表示为【1,0,0,1,0,0,1】。
3.OneHotEncoder Fromsklearn。预处理ImportOneHotEncoder #模拟训练数据x=[0,0,2],[1,2,3]1]1)enc=onehotencode(spare=false)enc . fit(x)x)#测试数据x _ test
[[0 . 1 . 1 . 0 . 0 . 0 . 1 . 0]]上述代码中有四个训练数据,特征数为3。对应上面的例子,第一列训练数据是0.110,也就是第二排学生性别特征[男,女] 0.210正好是对应的年级特征[小学,初中,高中2,3,第三排01是完全符合特长的[钢琴,绘画,舞蹈,篮球];训练数据1: 0,0,2表示【男,小学,舞蹈】,其他类似;测试数据1,0,2表示【女,小学,舞蹈】。从二进制向量的例子可以选择[0,1,1,0,0,0,0,0,0,1,0]。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。