python 预测模型,bp神经网络预测模型python

  python 预测模型,bp神经网络预测模型python

  大蟒简单预测模型

  步骤1 :导入所需的库,然后导入测试和训练数据集。

  导入熊猫,熊猫包,然后导入标签编码器、random、RandomForestClassifier和梯度推进分级机函数

  进口熊猫作为螺纹中径

  导入编号为公证人

  froms kle arn。预处理导入标签

  导入随机

  froms kle arn。ensembleimportrandomforestclassifier

  froms kle arn。ensembleimportgradientboostingclassifier

  #训练,读取测试数据集

  火车=PD。read _ CSV(c:/users/analyticsvidhya/desktop/challenge/train .CSV)。

  测试=PD。read _ CSV(c:/users/analyticsvidhya/desktop/challenge/test .CSV))

  #培训,创建测试数据集标志

  火车=火车

  测试=测试

  fullData=pd.concat(,axis=0) #联合培训,测试数据集

  步骤2 :该框架的第二步不需要使用python,而是进行到下一步。

  步骤3 :显示数据集的列名称或摘要

  fullData.columns #表示所有列的名称

  fulldata.head(10)表示数据框中的前10条记录

  可以使用fulldata.describe(#describe)函数查看数值字段的概要

  步骤4 ) a ) ID变量b)目标变量c)分类变量d)数值变量e)确定其他变量。

  ID_col=

  target_col=

  cat_cols=

  num _ cols=list(set(list)完整数据。columns))set)cat _ cols)-set)id _ col)-set)target _ col-set

  其他_栏=#训练,设置测试数据集的标识符

  步骤5 :识别缺少的值变量并创建标志

  isnull().任何)#返回真实的或假的,真的表示存在缺少值,而错误的则相反

  num_cat_cols=num_cols cat_cols #组合数值变量和分类变量

  #为具有缺少值的变量创建新变量

  #缺少值标志为1,否则为0

  对于数量_类别_列中的变量:

  iffulldata.isnull(.any )=True:

  fulldata=fulldata.isnull(*1

  步骤6 :填充缺少的值

  用平均值填充缺少的值

  完整数据=完整数据。填写na(完整数据。均值),原地=真)。

  #用-9999填充分类变量的缺少值

  完整数据=完整数据。填充na(值=-9999)。

  步骤7 :建立分类变量的标签编码器,将数据集划分为训练和测试集,再将训练数据集划分为训练集和测试集。

  #创建分类特征的标签编码器

  对于目录栏中的变量:

  数量=标签编码器()

  完整数据=number.fit _ transform(完整数据。如同类型( str ))

  #目标变量也是分类变量,因此通过标签编码器进行转换

  完整数据=number.fit _ transform(完整数据。如同类型( str ))

  train=fullData=Train]

  test=fullData=Test]

  train=NP.random.uniform (0,1,Len ) ) ).75

  Train,Validate=train=True],train=False]

  步骤8 :将填充和虚假(缺失值标志)变量传递给模型,并使用随机林预测类。

  e特征=列表(集合(列表(完整数据。columns))-set(id _ col)-set(set)other _ col))

  x _ train=火车。值

  y _ train=火车。值

  x _ validate=Validate.values

  y _ validate=Validate.values

  x _ test=测试值

  随机种子(100).

  RF=randomforestclassifier(n _ estimators=1000))

  RF.fit(x火车,y火车).

  步骤9 :检查并预测绩效

  状态=射频。预测_概率(x _验证)

  fpr,tpr,_=roc_curve(y_validate,status))))))。

  ROC_AUC=AUC(FPR,tpr))。

  打印roc_auc

  最终状态=RF.predict _ proba (x _ test)

  测试=最终状态

  测试。to _ CSV(c:/users/analyticsvidhya/desktop/model _ output .CSV ,列=)

  《来源于科技文献,经本人整理归纳,仅供学习和分享,如有侵权请联系删除》

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: