python 预测模型,bp神经网络预测模型python
大蟒简单预测模型
步骤1 :导入所需的库,然后导入测试和训练数据集。
导入熊猫,熊猫包,然后导入标签编码器、random、RandomForestClassifier和梯度推进分级机函数
进口熊猫作为螺纹中径
导入编号为公证人
froms kle arn。预处理导入标签
导入随机
froms kle arn。ensembleimportrandomforestclassifier
froms kle arn。ensembleimportgradientboostingclassifier
#训练,读取测试数据集
火车=PD。read _ CSV(c:/users/analyticsvidhya/desktop/challenge/train .CSV)。
测试=PD。read _ CSV(c:/users/analyticsvidhya/desktop/challenge/test .CSV))
#培训,创建测试数据集标志
火车=火车
测试=测试
fullData=pd.concat(,axis=0) #联合培训,测试数据集
步骤2 :该框架的第二步不需要使用python,而是进行到下一步。
步骤3 :显示数据集的列名称或摘要
fullData.columns #表示所有列的名称
fulldata.head(10)表示数据框中的前10条记录
可以使用fulldata.describe(#describe)函数查看数值字段的概要
步骤4 ) a ) ID变量b)目标变量c)分类变量d)数值变量e)确定其他变量。
ID_col=
target_col=
cat_cols=
num _ cols=list(set(list)完整数据。columns))set)cat _ cols)-set)id _ col)-set)target _ col-set
其他_栏=#训练,设置测试数据集的标识符
步骤5 :识别缺少的值变量并创建标志
isnull().任何)#返回真实的或假的,真的表示存在缺少值,而错误的则相反
num_cat_cols=num_cols cat_cols #组合数值变量和分类变量
#为具有缺少值的变量创建新变量
#缺少值标志为1,否则为0
对于数量_类别_列中的变量:
iffulldata.isnull(.any )=True:
fulldata=fulldata.isnull(*1
步骤6 :填充缺少的值
用平均值填充缺少的值
完整数据=完整数据。填写na(完整数据。均值),原地=真)。
#用-9999填充分类变量的缺少值
完整数据=完整数据。填充na(值=-9999)。
步骤7 :建立分类变量的标签编码器,将数据集划分为训练和测试集,再将训练数据集划分为训练集和测试集。
#创建分类特征的标签编码器
对于目录栏中的变量:
数量=标签编码器()
完整数据=number.fit _ transform(完整数据。如同类型( str ))
#目标变量也是分类变量,因此通过标签编码器进行转换
完整数据=number.fit _ transform(完整数据。如同类型( str ))
train=fullData=Train]
test=fullData=Test]
train=NP.random.uniform (0,1,Len ) ) ).75
Train,Validate=train=True],train=False]
步骤8 :将填充和虚假(缺失值标志)变量传递给模型,并使用随机林预测类。
e特征=列表(集合(列表(完整数据。columns))-set(id _ col)-set(set)other _ col))
x _ train=火车。值
y _ train=火车。值
x _ validate=Validate.values
y _ validate=Validate.values
x _ test=测试值
随机种子(100).
RF=randomforestclassifier(n _ estimators=1000))
RF.fit(x火车,y火车).
步骤9 :检查并预测绩效
状态=射频。预测_概率(x _验证)
fpr,tpr,_=roc_curve(y_validate,status))))))。
ROC_AUC=AUC(FPR,tpr))。
打印roc_auc
最终状态=RF.predict _ proba (x _ test)
测试=最终状态
测试。to _ CSV(c:/users/analyticsvidhya/desktop/model _ output .CSV ,列=)
《来源于科技文献,经本人整理归纳,仅供学习和分享,如有侵权请联系删除》
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。