线性回归方程python代码,python怎么做线性回归

  线性回归方程python代码,python怎么做线性回归

  多元线性回归:研究因变量和多个自变量之间线性关系的方法。

  一元线性回归是一种特殊的多元线性回归。多元线性回归的分析步骤与一元线性回归相同:回归分析的步骤:

  根据预测目标,确定自变量和因变量。绘制散点图并确定回归模型的类型。估计模型参数,建立回归模型。测试回归模型。回归方程的精度是用来表示实际观测点与回归方程的拟合程度的指标,通过调整判断系数来衡量。

  调整系数=ess/TSS=1-(RSS/TSS)*(n-1/n-k-1)

  其中:TSS:总偏差的平方和

  ESS:回归平方和

  RSS:残差平方和

  n:样本数量

  k:回归模型预测自变量的个数。案例:现有10家已开店并营业的商店,有店铺面积、最近车站的距离及月营业额,现有一家新的店面,要求预测月营业额是多少

  以下是分析过程:

  第一步是根据预测目标确定自变量和因变量。

  因变量:月营业额

  自变量:商店面积,到最近车站的距离。

  代码演示:

  进口熊猫;导入matplotlib从pandas.tools.plotting导入散点_矩阵;# Import data data=pandas . read _ CSV(r c:\ users \ WWW12 \ desktop \ da \ Python DM \ 4.2 \ data . CSV )

  第二步是画散点图,确定回归模型的类型。

  #画出单变量和因变量的散点图,求相关系数plt.scatter(数据[店铺面积],数据[月营业额])plt.scatter(数据[最近站],数据[月营业额])

  数据[[店铺面积,月营业额]]。corr()Out[6]:店铺面积,月营业额,店铺面积,1.00000 0.892385,月营业额,0.892385 1.000000data[[ [最近站,月营业额]]。corr()Out[7]:最近的站月成交量1.00000-0.775083-0.775083 1.00000。可以看出,两个自变量都与因变量强相关,因此可以采用多元线性回归模型来解决这个问题:

  #绘制多个变量之间的散点图:scatter_matrix()方法font={ family : sim hei } matplotlib . RC( font ,* * font) scatter _ matrix (data [[店铺面积,最近车站,月营业额])Fig size=(10,10),diagonal= kde) # Diagonal参数表示变量与变量本身之间的绘制方式,kde代表直方图#查找相关系数矩阵数据[[店铺面积,最近车站,月营业额]]。corr()Out[9]:店铺面积1.00000-0.492155 0.892385距离最近车站-0.492155 1.0000-0.775083 3月营业额0.892385-0.775083 1.00

  可以看出,店铺面积与月营业额正相关,离车站的距离与月营业额负相关。三个变量基本都是正态分布。接下来,我们可以使用多元线性回归模型进行建模。

  代码与简单线性回归完全相同:

  X=data[[店铺面积,最近车站]]y=data[[月营业额]] from sklearn.linear _ model导入线性回归#建模lrModel=LinearRegression()#训练模型lrModel.fit(x,Y)# Score LR模型。Score (x,y) out [24]: 0.9452358526817111 #调整判断系数得分较高,模型拟合较好#预测LR模型。Predict ([[10,110],[20,110]]) out [26 [858.09638609]]) #查看参数lrmodel . coef _ out[28]:array([[41.51347826,-0.34088269]]) #查看intercept lrmodel . intercept _ out[29]:array([65.3233

  pandas . tools . plotting . scatter _ matrix(matrix,figsize,digonal)

  Matrix: matrix figsize:绘图大小digonal:变量和自身之间的绘图函数kde是一个直方图。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: