python类new方法,python中__new__的用法

  python类new方法,python中__new__的用法

  计算机编程语言之类别编码器:类别编码器库的简介、安装、使用方法之详细攻略

  目录

  类别编码器库的简介

  1、支持15种不同编码

  类别编码器库的安装

  类别编码器库的使用方法

  1、一个无监督的例子

  2、一个有监督的例子

  类别编码器库的简介一组sci工具包-学习风格的转换器,用不同的技术将类别变量编码成数字。一组sci工具包-学习风格的转换器,用不同的技术将分类变量编码成数字。虽然序数编码、单热编码和散列编码在现有sci工具包-学习版本中具有类似的等价性,但这个库中的变形金刚都有一些有用的特性:

  对熊猫数据文件作为输入(可选作为输出)的一流支持可以显式配置数据中的哪些列按名称或索引编码,或推断非数字列,而不管输入类型可以根据训练集随意删除任何方差很低的列吗可移植性:培训数据转换器泡菜它,以后重用它,然后得到同样的东西。完全兼容实例管道,输入一个类似数组的数据集,像任何其他转换器

  1、支持15种不同编码后向差分编码基于二进制多项式编码计数编码器广义线性混合模型编码器哈辛格勒默特编码詹姆斯-斯坦编码器留下一个估计值一个多项式编码求和编码目标编码器证据包装器的权重

  文档:http://贡献。sci工具包-学习。组织/类别_编码器/

  类别编码器库的安装点安装类别-编码器

  类别编码器库的使用方法有两种类型的编码器:无监督和有监督的。

  1、一个无监督的例子从类别_编码器导入*将熊猫作为螺纹中径从sklearn.datasets导入load_boston#准备一些数据bunch=load _ Boston()y=bunch。targetx=PD .DataFrame(bunch.data,columns=bunch.feature_names)#使用二进制编码对两个分类特征进行编码senc=BinaryEncoder(cols=[CHAS , RAD]).fit(X)#转换数据集数值_数据集=enc。变换(X)

  2、一个有监督的例子从类别_编码器导入*将熊猫作为pdfrom sklearn.datasets导入load_boston#准备一些数据bunch=load _ Boston()y _ train=bunch。target[0:250]y _ test=bunch。目标X _ train=PD .DataFrame(bunch.data[0:250],columns=bunch。特征名称)X测试=PD .DataFrame(bunch.data[250:506],columns=bunch.feature_names)#使用目标编码对两个分类特征进行编码senc=TargetEncoder(cols=[CHAS , RAD])#转换数据集training _ numeric _ dataset=enc。fit _ transform(X _ train,y _ train)测试_数值_数据集=enc。转换(X _ test)

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: