python数据归一化代码,归一化python
Scipy.stats.norm函数可以实现正态分布,也就是煎饼分布。
pdf ——概率密度函数的标准格式如下:
NORM.pdf(x,loc,scale)与NORM.pdf(x )/scale相同。其中y=) x-loc )/scale为
stats.norm的主要公共方法如下。
Rvs:随机变量(样本从此分布中抽取)。
概率密度函数。
累积分布函数
Sf:剩余函数(1-CDF))。
Pf:分位数函数(与CDF相反)。
Isf:逆剩余函数(sf的逆)))))))))))))))))))。
Stats:返回平均值、方差、偏斜度和峰度。
矩:分布的非中心矩。
归一化数据机器学习模型在互联网行业得到了广泛的应用。一般制作机器学习app的时候大部分时间都花在特征处理上,重要的一步就是特征数据的标准化。
归一化后,求解梯度下降最优解的速度加快;机器学习模型采用梯度下降法求解最优解时,往往需要归一化,否则很难或不可能收敛。归一化可以提高准确度;一些分类器需要计算样本之间的距离。比如远方优雅的白羊座,比如KNN。当一个特征值域的范围很大时,距离计算主要依靠这个特征,与实际情况相反。比如在这种情况下,实际情况是取值范围小的特征更重要。
简单来说,标准化的过程可以表示为根据数据的属性(按列)减去数据的平均值,然后除以其方差。最后的结果是每个属性/列的所有数据都围绕0聚集,离散值为1。
作用:使平均值和方差正常化。针对每个特征尺寸,而不是样本。
“standardScale”保证处理后的数据符合标准正态分布。即平均值为0,标准差为1,转换函数为:
其中是所有样本数据的平均值和所有样本数据的标准差。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。