简单线性回归利用women数据集进行分析,响应变量位于前,预测变量位于后,用~链接,数据集为women。通过输出结果获得预测等式:weight = -87.52 + 3.45*height。Residuals表示残差的分位点,Residual standard error表示模型用身高预测体重的平均误差。Estimate表示回归方程参数的估计,Std.Error表示回归方程参数的标准差。Multiple R-squared和Adjusted R-squared表示回归方程对样本的拟合程度。t value用于检验解释变量的显著性,pr(|t|)表示该值的显著性。F-statistic和p值(1.09e-14)用于检验方程整体的显著性,表明模型在P=0.001水平上通过显著性检验。
多项式回归通过添加一个二次项(x^2)来提高预测精度。新预测等式为:weight = 261.88 - 7.35*height + 0.083*height^2。在p<0.001水平下,回归系数都显著,模型的方差解释律增加到了99.9%。
多元线性回归使用数据集来解释。代码展示了所有预测变量解释了各州谋杀率57%的方差。
有交互项的多元线性回归讲解了预测变量的交互项。代码显示了马力与车中的交互项显著,意味着响应变量与其中一个预测变量的关系依赖于另一个预测变量的水平,例示每加仑汽油行驶英里数与汽车马力的关系依车重不同而不同。
回归诊断涉及标准方法,如正态性、独立性、线性、同方差性和多重共线性。正态性通过正态QQ图检验,独立性需从收集数据中验证,线性通过残差图与拟合图判断,同方差性通过位置尺度图检查,多重共线性则通过VIF值分析。异常观测点包括离群点、高杠杆值点和强影响点。
对数据进行调整,包括删除观测点、变量变换和选择最佳回归模型。删除离群点或强影响点以提高数据集的正态假设拟合度,变量变换可改善模型效果,选择最佳模型使用AIC值比较。变量选择方法包括逐步回归和全子集回归。
温馨提示:答案为网友推荐,仅供参考