随机森林算法python实现,python随机森林分类模型

　　随机森林或随机决策森林是一种用于分类、回归和其他任务的集成学习方法。其操作方式是在训练时构建大量决策树，将类输出为单一树类(分类)或平均预测(回归)模式。随机决策森林纠正了决策树过度适应训练集的习惯。

　　随机决策森林的第一个算法是由Tin Kam Ho使用随机子空间方法创建的。在Ho的公式中，这是实现ladmla Kleinberg提出的“随机判别”分类方法的一种方法。

　　Leo Breiman和Adele Cutler开发了该算法的扩展，“随机森林”是他们的商标。这个扩展融合了Breiman的“装袋”思想和随机选择的特点。它首先由Ho提出，然后由Amit和Geman独立提出，以建立一组变化受控的决策树。

　　Esemoble learning是决策树分类的一个版本。你可以在不同的时间采用多种算法，把它们组合起来，做出更强大的功能。在RF中，我们从训练集中获取数据点，构建与这些数据点相关的决策树，观察子集，选择N棵我们想要构建或建模的树，对每个新的数据点迭代这个过程。预测Y.RF可以显著提高我们预测的准确性，因为我们数据集的任何变化都只会影响几棵树，所以不是所有的树都会受到影响。这让我想起游戏里我们有一个装着很多气球的罐子，我们要猜罐子里有多少个气球。最好的方法是不要单独猜测这个数字，

　　要在Python中实现RF，我们需要通过sklearn.ensemble库和RandomForestRegressor类创建我们的回归器，并创建对象，然后将它们应用于我们的函数矩阵，该函数矩阵指定了我们希望在森林中拥有的树的数量。Python代码如下：#数据预处理

　　#导入库

　　将numpy作为np导入

　　将matplotlib.pyplot作为plt导入

　　进口熊猫作为pd

　　#导入数据集

　　dataset=pd.read_csv(Data.csv )

　　X=dataset.iloc[:1:2]。价值观念

　　Y=dataset.iloc[:2]。价值观念

　　#将随机森林回归模型拟合到数据集

　　来自sk learn . like导入RandomForestRegressor

　　regressor=RandomForestRegressor(n _ estimators=300，random_state=0)