随机森林算法python实现,python随机森林分类模型

  随机森林算法python实现,python随机森林分类模型

  随机森林或随机决策森林是一种用于分类、回归和其他任务的集成学习方法。其操作方式是在训练时构建大量决策树,将类输出为单一树类(分类)或平均预测(回归)模式。随机决策森林纠正了决策树过度适应训练集的习惯。

  随机决策森林的第一个算法是由Tin Kam Ho使用随机子空间方法创建的。在Ho的公式中,这是实现ladmla Kleinberg提出的“随机判别”分类方法的一种方法。

  Leo Breiman和Adele Cutler开发了该算法的扩展,“随机森林”是他们的商标。这个扩展融合了Breiman的“装袋”思想和随机选择的特点。它首先由Ho提出,然后由Amit和Geman独立提出,以建立一组变化受控的决策树。

  Esemoble learning是决策树分类的一个版本。你可以在不同的时间采用多种算法,把它们组合起来,做出更强大的功能。在RF中,我们从训练集中获取数据点,构建与这些数据点相关的决策树,观察子集,选择N棵我们想要构建或建模的树,对每个新的数据点迭代这个过程。预测Y.RF可以显著提高我们预测的准确性,因为我们数据集的任何变化都只会影响几棵树,所以不是所有的树都会受到影响。这让我想起游戏里我们有一个装着很多气球的罐子,我们要猜罐子里有多少个气球。最好的方法是不要单独猜测这个数字,

  要在Python中实现RF,我们需要通过sklearn.ensemble库和RandomForestRegressor类创建我们的回归器,并创建对象,然后将它们应用于我们的函数矩阵,该函数矩阵指定了我们希望在森林中拥有的树的数量。Python代码如下:#数据预处理

  #导入库

  将numpy作为np导入

  将matplotlib.pyplot作为plt导入

  进口熊猫作为pd

  #导入数据集

  dataset=pd.read_csv(Data.csv )

  X=dataset.iloc[:1:2]。价值观念

  Y=dataset.iloc[:2]。价值观念

  #将随机森林回归模型拟合到数据集

  来自sk learn . like导入RandomForestRegressor

  regressor=RandomForestRegressor(n _ estimators=300,random_state=0)

  regressor.fit(X,y)

  #预测新的结果

  y_pred=regressor.predict(6.5)

  #可视化决策树回归结果

  X_grid=np.arange(min(X),max(X),0.1)

  X _ grid=X _ grid . shape((len(X _ grid),1))

  plt.scatter(X,y,color=red )

  plt.plot(X,regressor.predict(X_grid),color=blue )

  plt.title(真实或虚张声势(随机森林回归))

  plt.xlabel(职位级别)

  plt.ylabel(薪金)

  plt.show()

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: