当前位置：首页 > news >正文

简单线性回归01

news 2025/7/16 4:11:38

内容来源
线性回归分析导论原书第5版机械工业出版社

内容提要

简单线性回归模型

回归参数的最小二乘估计

简单线性回归模型

$y=\beta_0+\beta_1x+\varepsilon$

其中

截距 $\beta_0$ 与斜率 $\beta_1$ 为未知常数

$\varepsilon$ 为随机误差项。假设随机误差项的均值为 $0$ ，且方差 $\sigma^2$ 未知

此外，通常假设误差是不相关的，不相关意味着一个误差的值不取决于其他误差的值

方便起见，视回归变量 $x$ 由数据分析师控制且测量误差可忽略，而视相应变量 $y$ 为随机变量。

也就是说，对于每个 $x$ 的可能值，存在一个 $y$ 的概率分布，这一分布的均值为

$E(y|x)=\beta_0+\beta_1x$

方差为

$Var(y|x)=Var(\beta_0+\beta_1x+\varepsilon)=\sigma^2$

回归参数的最小二乘估计

$\beta_0$ 与 $\beta_1$ 的估计

假设有 $n$ 对数据 $x_i,y_i)$

最小二乘准则为

$S(\beta_0,\beta_1)=\sum^n_{i=1}(y_i-\beta_0-\beta_1x_i)^2$

$\beta_0$ 和 $\beta_1$ 的最小二乘估计量分别为 $\hat{\beta}_0$ 和 $\hat{\beta}_1$ ，则

$\frac{\partial S}{\partial\beta_0} \bigg|_{\hat{\beta}_0,\hat{\beta}_1}= -2\sum^n_{i=1}(y_i-\hat{\beta}_0-\hat{\beta}_1x_i)=0\\ \frac{\partial S}{\partial\beta_1} \bigg|_{\hat{\beta}_0,\hat{\beta}_1}= -2\sum^n_{i=1}(y_i-\hat{\beta}_0-\hat{\beta}_1x_i)x_i=0\\$

化简

$n\hat{\beta}_0+\hat{\beta}_1\sum^n_{i=1}x_i=\sum^n_{i=1}y_i\\ \hat{\beta}_0\sum^n_{i=1}x_i+\hat{\beta}_1\sum^n_{i=1}x^2_i =\sum^n_{i=1}y_ix_i$

解得

$\hat{\beta}_0=\overline{y}-\hat{\beta}_1\overline{x}$

以及

$\hat{\beta}_1=\frac {\sum^n_{i=1}y_ix_i-\frac{(\sum^n_{i=1}y_i)(\sum^n_{i=1}x_i)}{n}} {\sum^n_{i=1}x^2_i-\frac{(\sum^n_{i=1}x_i)^2}{n}}$

上式中的分母为 $x_i$ 的校正平方和，分子为 $x_i$ 与 $y_i$ 的校正叉积和，可以用更紧凑的记号表示为

$S_{xx}=\sum^n_{i=1}x^2_i-\frac{(\sum^n_{i=1}x_i)^2}{n} =\sum^n_{i=1}(x_i-\overline{x})^2$

$S_{xy}=\sum^n_{i=1}y_ix_i- \frac{(\sum^n_{i=1}y_i)(\sum^n_{i=1}x_i)}{n} =\sum^n_{i=1}y_i(x_i-\overline{x})$

即

$\hat{\beta}_1=\frac{S_{xy}}{S_{xx}}$

所以简单回归分析模型拟合为 $\hat{y}=\hat{\beta}_0+\hat{\beta}_1x$

最小二乘估计量的性质

注意到， $\hat{\beta}_0$ 与 $\hat{\beta}_1$ 是观测值 $y_i$ 的线性组合（注意力惊人!）

$\hat{\beta}_1=\frac{S_{xy}}{S_{xx}}=\sum^n_{i=1}c_iy_i\\ \hat{\beta}_0=\sum^n_{i=1}(\frac{1}{n}-\overline{x}c_i)y_i$

其中 $c_i=(x_i-\overline{x})/S_{xx}$

最小二乘估计量 $\hat{\beta}_0$ 与 $\hat{\beta}_1$ 是模型参数 $\beta_0$ 与 $\beta_1$ 的无偏估计量

$\begin{align*} &E(\hat{\beta}_1)=E\bigg(\sum^n_{i=1}c_iy_i\bigg)\\ &=\sum^n_{i=1}c_iE(y_i)\\ &=\sum^n_{i=1}c_i(\beta_0+\beta_1x_i)\\ &=\beta_0\sum^n_{i=1}c_i+\beta_1\sum^n_{i=1}c_ix_i \end{align*}$

又 $\sum^n_{i=1}c_i=0$ 及 $\sum^n_{i=1}c_ix_i=1$ ，所以

$E(\hat{\beta}_1)=\beta_1$

同理可证

$E(\hat{\beta}_0)=\beta_0$

方差

$\begin{align*} &Var(\hat{\beta}_1)=Var\bigg(\sum^n_{i=1}c_iy_i\bigg)\\ &=\sum^n_{i=1}c^2_iVar(y_i)\\ &=\sigma^2\sum^n_{i=1}c^2_i=\frac{\sigma^2}{S_{xx}} \end{align*}$

$\begin{align*} &Var(\hat{\beta}_0)=Var(\overline{y}-\hat{\beta}_1\overline{x})\\ &=Var(\overline{y})+\overline{x}^2Var(\hat{\beta}_1) -2\overline{x}Cov(\overline{y},\hat{\beta}_1)\\ \end{align*}$