python产生,python特征值
业内常说,数据决定模型效果的上限,机器学习算法通过数据特征预测模型效果。好的特征可以显著提高模型效果。这意味着特征生成(即从数据设计中处理模型的可用特征)是特征工程中的一个重要步骤。
一、特征生成作用
1.增加特征的表达能力,提高模型效果;
(比如体重除以身高是表达健康的重要特征,而单纯看身高或体重对健康的表达有限。)
2.它可以集成到业务理解设计特性中,以增加模型的可解释性。
二、特征生成方法
1、聚合方式
有一对多字段,对对应的记录进行分组汇总,统计平均值、计数、数值等数据特征。
#自定义分组聚合统计功能
defx2_sum(集团):
returnsum(第**2组)
df . group by( cust _ no ). C1 . apply(x2 _ sum)2、转换方式
通过字段之间的加、减、乘、除等运算生成数据特征的过程,不同的字段类型采用不同的转换方法。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。