线性回归的python实现,多元线性回归python实现代码
目录
1.回归分析的步骤:
2.需要满足的条件
3.绘制矩阵数据的散点图。
4.代码实践案例
多元回归:研究一个因变量和几个自变量之间线性关系的方法。
1.回归分析的步骤:01。根据预测目标确定自变量和因变量。
02绘制散点图以确定回归模型的类型。
03估计模型参数,建立回归模型。
04测试回归模型。
回归方程的精度是用来表示实际观测点与回归方程的拟合程度的指标,用判断系数来衡量。
决定系数=相关系数r的平方=ESS/TSS=1-RSS/TSS
其中,具体公式如图所示
TSS总偏差的平方和
ESS回归平方和
RSS残差平方和
05使用回归模型进行预测
2.需要满足的条件可以用四个字来概括:线性、独立、常态、同质。
(1)自变量和因变量之间存在线性关系。
这可以通过绘制“散点图矩阵”来检查因变量随其各自变量值的变化。如果因变量Yi和一个自变量X i之间存在曲线趋势,可以通过变量变换进行修正。常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。
(2)观测值是相互独立的。
任意两个观测残差的协方差都是0,说明自变量之间不存在多重共线性。如何处理多重共线性,请参考《多元线性回归模型中多重共线性问题处理方法》。
(3)残差E服从正态分布N(0,2)。方差2=var (ei)反映了回归模型的精度,越小,得到的回归模型预测Y的精度越高。
(4)E的大小不随所有变量的变化而变化,即方差齐性。
3.绘制矩阵数据的散点图:pandas . tools . plotting . scatter _ matrix(矩阵,图形大小,对角线)
[数]矩阵
图形尺寸
对角线是直方图
4.代码练习案例导入熊猫;导入matplotlib从pandas.tools.plotting导入散点_矩阵;data=pandas . read _ CSV( d:\ \ PDM \ \ 4.2 \ \ data . CSV )font={ family : sim hei } matplotlib . RC( font ,* * font) scatter _ matrix (data [[ 月营业额],FIG size=(10,10),diagonal= KDE) data [[店铺面积,最近的车站,月营业额]])。corr()x=data[[店铺面积,最近的站]]y=data[[月营业额]] from sklearn.linear _ model导入线性回归#建模lrModel=LinearRegression()#训练模型lrModel.fit(x,Y)# score lrModel.score(x,y)# predict lrmodel.predict ([10,110],[20,110]]) #查看参数lrModel.coef_#查看截距lrModel.intercept
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。