python中决策树,python决策树结果怎么看
本文主要介绍python决策树预测学生成绩。可以用来预测学生的成绩。可以选择部分或全部特征,可以分析参数对结果的影响,可以调整和优化参数。决策树可以被可视化以分析参数。
00-1010 1.数据准备1.1头文件介绍1.2将student_1.csv数据拖动到代码的同一个文件夹中,同时读取文件中的数据1.3特性选择2。数据处理2.1处理G1、g 2和G3 2.2也处理Pedu参数的连续值2.3由于数据集中的每个参数差别很大,所以这里把特征参数改为数字形式。3.经过训练的模型3.1决策树3.1.1开始训练训练集中的数据。3.1.2使用训练好的模型预测G3的值。3.1.3优化模型中的参数,输出优化后的最佳得分3.1.4由优化后的模型绘制决策树3.2集成学习3.2.1决策树3.2.2 Bagging算法3.2.3这里用集成学习的随机森林算法训练模型,估计模型的得分3.2.4这里用集成学习的AdaBoost算法训练模型。对模型3.2.5进行评分估计这里使用集成学习的GBDT算法对模型进行训练,对模型4进行评分估计。评估结果33605。结论分析。
目录
1.数据准备
在编写头文件之前,您需要下载安装所需的依赖包。一些无法通过pip安装的内容是手动导入的。
1.1 引入头文件
1.2 把student_1.csv数据拖入代码的同一文件夹下,同时读取文件中的数据
课件中选取了16个特征值,这里我用所有特征值进行处理。
1.3 特征选取
2.数据处理
连续处理离散值,并设置lambda函数来计算G1、G2和G3。
2.1 对G1、G2、G3处理
2.2 同样对Pedu参数进行连续值处理
2.4对于当前处理的数据集,划分训练集和测试集,设置随机种子等其他参数。
2.3 由于数据集中每个参数差异比较大,所以这里把特征参数统一改为数字形式
3训练得到的模型
3.1 决策树
经训练的模型用于设置视觉显示的图像参数。
3.1.1 开始对训练集中的数据进行训练
对训练好的模型进行评分。
style="text-align:center">
3.1.3 对模型中的参数进行优化,输出优化后最好的分数
3.1.4 优化后的模型来绘制决策树
输出优化后的分数。
3.2 集成学习
重新划分数据集用于训练模型。
3.2.1 Decision Tree
这里采用集成学习的多个决策树方式进行训练模型,以及模型的评估。
3.2.2 Bagging算法
这里采用集成学习的Bagging算法进行训练模型,对模型做出分数估测。
3.2.3 这里采用集成学习的Random Forest算法进行训练模型,对模型做出分数估测
3.2.4 这里采用集成学习的AdaBoost算法进行训练模型,对模型做出分数估测
3.2.5 这里采用集成学习的GBDT算法进行训练模型,对模型做出分数估测
4.评价结果:
5.结论分析
根据决策树和集成学习两大类的训练模型可以看出:两种方式实现各有千秋,同样由优缺点。
决策树在优化参数前后预测结果有了较明显的提升,并且有可视化的图片便于观察。集成学习中的Bagging算法对于预测结果是最好的,随之的得分情况也是最高。但是AdaBoost算法的表现就相对不够。
以上就是python决策树预测学生成绩等级实现详情的详细内容,更多关于python决策树预测学生成绩等级的资料请关注盛行IT软件开发工作室其它相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。