python数据归一化代码,归一化python

　　Scipy.stats.norm函数可以实现正态分布，也就是煎饼分布。

　　pdf ——概率密度函数的标准格式如下：

　　NORM.pdf(x，loc，scale)与NORM.pdf(x )/scale相同。其中y=) x-loc )/scale为

　　stats.norm的主要公共方法如下。

　　Rvs:随机变量(样本从此分布中抽取)。

　　概率密度函数。

　　累积分布函数

　　Sf:剩余函数(1-CDF))。

　　Pf:分位数函数(与CDF相反)。

　　Isf:逆剩余函数(sf的逆)))))))))))))))))))。

　　Stats:返回平均值、方差、偏斜度和峰度。

　　矩：分布的非中心矩。

　　归一化数据机器学习模型在互联网行业得到了广泛的应用。一般制作机器学习app的时候大部分时间都花在特征处理上，重要的一步就是特征数据的标准化。

　　归一化后，求解梯度下降最优解的速度加快；机器学习模型采用梯度下降法求解最优解时，往往需要归一化，否则很难或不可能收敛。归一化可以提高准确度；一些分类器需要计算样本之间的距离。比如远方优雅的白羊座，比如KNN。当一个特征值域的范围很大时，距离计算主要依靠这个特征，与实际情况相反。比如在这种情况下，实际情况是取值范围小的特征更重要。

　　简单来说，标准化的过程可以表示为根据数据的属性(按列)减去数据的平均值，然后除以其方差。最后的结果是每个属性/列的所有数据都围绕0聚集，离散值为1。

　　作用：使平均值和方差正常化。针对每个特征尺寸，而不是样本。

　　“standardScale”保证处理后的数据符合标准正态分布。即平均值为0，标准差为1，转换函数为：

　　其中是所有样本数据的平均值和所有样本数据的标准差。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读