跳到主要内容

线性模型

ModelMathematical ExpressionDescription
Ordinary Least SquaresminwXwy22\min_{w} \|Xw - y\|_2^2拟合一个带有系数的线性模型,以最小化观测目标与预测目标之间的残差平方和。对异常值敏感;如果特征相关(多重共线性),则不稳健。
Ridge RegressionminwXwy22+αw22\min_{w} \|Xw - y\|_2^2 + \alpha \|w\|_2^2为模型添加L2正则化,以解决普通最小二乘法的一些问题。对多重共线性更稳健;具有由α\alpha控制的偏差-方差权衡。
Lasso Regressionminw12nsamplesXwy22+αw1\min_{w} \frac{1}{2n_{\text{samples}}} \|Xw - y\|_2^2 + \alpha \|w\|_1添加L1正则化以强制系数向量的稀疏性。适用于特征选择;生成的模型系数较少。
Elastic Netminw12nsamplesXwy22+αρw1+α(1ρ)2w22\min_{w} \frac{1}{2n_{\text{samples}}} \|Xw - y\|_2^2 + \alpha \rho \|w\|_1 + \frac{\alpha (1-\rho)}{2} \|w\|_2^2结合L1和L2正则化,通过两个参数控制模型复杂度。平衡岭回归和Lasso回归的优点;当特征之间存在相关性时非常有用。
Logistic Regressionminw,ci=1nlog(1+exp(yi(XiTw+c)))\min_{w, c} \sum_{i=1}^{n} \log (1 + \exp (-y_i (X_i^T w + c)))用于二元分类问题,使用逻辑函数估计概率。为二元分类任务提供概率解释。
Polynomial RegressionDepends on the degree of the polynomial features created from XX.通过添加多项式项扩展线性模型,从而能够拟合更广泛的数据。可以拟合非线性模式;注意高次多项式可能导致过拟合。
RidgeCVSame as Ridge, with α\alpha optimized by CV.具有内置alpha参数交叉验证的岭回归,用于确定最佳正则化。便于自动化α\alpha的选择。
LassoCVSame as Lasso, with α\alpha optimized by CV.具有内置交叉验证的Lasso回归,用于选择最佳的α\alpha值。适用于高维数据;自动化α\alpha的选择。