python对数据标准化,python对数据进行规范化
在python的sk learn . prep dessing库中,有:
标准化和规范化是两种数据预处理方法。现在让我们一起来学习它们。
标准化也称为均值去除和方差缩放。顾名思义,就是把均值移出来,把方差变成1。注意:注释在特征上操作,即在列上操作。对于同一列中的所有功能,我们通过对该列执行以下操作来标准化它们:
是一列特征,均值(Xing (x )),但X的均方差(也叫标准差)std(X).
从sklearn导入预处理import numpy as npX _ train=NP . array([[1。 -1. 2.], [ 2. 0. 0.], [ 0. 1. -1.]]) scaler=预处理. standardscaler()。fit (x _ train) print (mean: \ n ,scaler.mean _) print (std: \ n ,scaler . scale _)x _ scaled=scaler . transform。
正常化:Normalization是scaling individual samples to have unit norm的过程。规范化对simple(即行)进行操作。比如一个simple有N个特征,那么我们把这N个特征归一化,也就是把这N个特征缩放到单位范数(设这N个特征的范数为1)。如果你不懂范数的概念,可以看这里。这在文本分类和聚类算法中经常用到,在计算相似度时也经常用到。
常用的L1和L2公式:
缩放到单位范数:例如,我将n个特征缩放到L1范数空间,即n个特征的绝对值加1。
X=[[ 1。 -1. 2.], [ 2. 0. 0.], [ 0. 1. -1.]]X _ normalized=preprocessing . normalize(X,norm=l2)print(X_normalized)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。