python中字符型数据,python字符串有哪些表示形式
python特征生成中字符类型有截取、字符长度和频次。
一、python特征生成中字符类型
1、截取
当字符类型的值过多时,我们通常可以截取字符类型变量来减少模型过拟合。比如具体的家庭住址,可以把字符串截取到城市级别的粒度。
2、字符长度
计算字符串长度。例如,在传输场景中,传输消息中的字数在某种程度上可以描述传输的类型。
3、频次
二、python特征类型中字符使用
1、截取第一位字符串
df[I1_0]=df[I1]。2、字符长度地图(lambdax:str(x)[:1])
df[ I1 _伦]=df[I1]。apply(lambdax:len(str(x)))
显示(df . head())3、字符串频次
I1。值计数()
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。