随机森林算法python实现,python随机森林分类模型
随机森林或随机决策森林是一种用于分类、回归和其他任务的集成学习方法。其操作方式是在训练时构建大量决策树,将类输出为单一树类(分类)或平均预测(回归)模式。随机决策森林纠正了决策树过度适应训练集的习惯。
随机决策森林的第一个算法是由Tin Kam Ho使用随机子空间方法创建的。在Ho的公式中,这是实现ladmla Kleinberg提出的“随机判别”分类方法的一种方法。
Leo Breiman和Adele Cutler开发了该算法的扩展,“随机森林”是他们的商标。这个扩展融合了Breiman的“装袋”思想和随机选择的特点。它首先由Ho提出,然后由Amit和Geman独立提出,以建立一组变化受控的决策树。
Esemoble learning是决策树分类的一个版本。你可以在不同的时间采用多种算法,把它们组合起来,做出更强大的功能。在RF中,我们从训练集中获取数据点,构建与这些数据点相关的决策树,观察子集,选择N棵我们想要构建或建模的树,对每个新的数据点迭代这个过程。预测Y.RF可以显著提高我们预测的准确性,因为我们数据集的任何变化都只会影响几棵树,所以不是所有的树都会受到影响。这让我想起游戏里我们有一个装着很多气球的罐子,我们要猜罐子里有多少个气球。最好的方法是不要单独猜测这个数字,
要在Python中实现RF,我们需要通过sklearn.ensemble库和RandomForestRegressor类创建我们的回归器,并创建对象,然后将它们应用于我们的函数矩阵,该函数矩阵指定了我们希望在森林中拥有的树的数量。Python代码如下:#数据预处理
#导入库
将numpy作为np导入
将matplotlib.pyplot作为plt导入
进口熊猫作为pd
#导入数据集
dataset=pd.read_csv(Data.csv )
X=dataset.iloc[:1:2]。价值观念
Y=dataset.iloc[:2]。价值观念
#将随机森林回归模型拟合到数据集
来自sk learn . like导入RandomForestRegressor
regressor=RandomForestRegressor(n _ estimators=300,random_state=0)
regressor.fit(X,y)
#预测新的结果
y_pred=regressor.predict(6.5)
#可视化决策树回归结果
X_grid=np.arange(min(X),max(X),0.1)
X _ grid=X _ grid . shape((len(X _ grid),1))
plt.scatter(X,y,color=red )
plt.plot(X,regressor.predict(X_grid),color=blue )
plt.title(真实或虚张声势(随机森林回归))
plt.xlabel(职位级别)
plt.ylabel(薪金)
plt.show()
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。