如何在Python中绘制多元线性回归将一个依赖特征(目标变量)与一个独立特征(简单回归)或多个独立特征(多重回归)之间的关系建模的策略称为线性回归。线性回归算法的工作前提是这两类变量都有线性关系。如果这种关系存在,我们就可以计算模型的必要系数,从而根据新的或不可见的数据进行预测。 变量描述性分析通常,在进一步应用多元线性回归之前,绘制数据的可视化图表是一个好主意,可以更好地理解数据,并检查每个特征之间是否存在关系。我们将利用Seaborn包中的pairplot()方法绘制特性之间的关系。该函数将生成一个带有直方图和散点图的连接每个特征的图。 在本教程中,我们将使用各种库,包括Numpy、Pandas、Scikit-Learn和Scipy,学习如何从头开始在Python中应用和可视化线性回归过程。 导入库在我们的第一步中,我们将导入一些我们需要的Python库,如NumPy、Pandas、sklearn、matplotlib等。此外,我们将使用Pandas库从GitHub存储库加载数据集,并将数据集转换为一个名为df的数据帧。 代码 输出: (545, 4)价格区卧室层0 13300000 7420 4 3 1 12250000 8960 4 42 12250000 9960 3 2 3 12215000 7500 42 4 11410000 7420 42 特征选择我们将使用成对图来观察特征之间的关系。 代码 输出: 从图的第一行可以看出,数据集的价格和面积特征之间存在线性关系。我们可以看到,其余变量的散点图是随机的,它们之间没有关系。我们应该只取它们之间有关系的多个独立特征中的一个。而在这里,价格是目标变量,所以不需要下降和功能。 多重共线性多元线性回归模型假设在回归中使用的预测因子或自变量之间不存在相关性。使用Pandas数据框架中的corr()方法,我们可以计算数据的每两个特征之间的Pearson相关系数值,并构建一个矩阵来查看任何预测因子之间是否存在任何相关性。之后,我们可以使用Seaborn的热图()图将矩阵显示为热图。 代码 输出: 各自变量的Pearson相关系数矩阵为:面积卧室层面积1.000000 0.151858 0.083996卧室0.151858 1.000000 0.408564层0.083996 0.408564 1.000000 建立多元线性回归模型让我们继续开发我们的回归模型。现在我们已经看到了特征之间没有关系和共线性,我们可以使用所有的特征来建立模型。我们将使用Sklearn的linear_model库的LinearRegression()类来创建我们的模型。 代码 输出: 截距:157155.2578429943系数数组:[4.17726303e+02 4.18703502e+05 6.73797188e+05] 我们将尝试使用下面的代码单元格将模型转换为三维图形。我们的数据点将在图表上显示为灰点,线性模型将表示为蓝色平面。 代码 输出:
下一个话题
Python物理计算:Python函数简介
|