当前位置：首页 > news >正文

《SMO算法公式推导》拉格朗日乘子上界和下界

news 2025/4/19 9:00:51

本文是将文章《SMO算法公式推导》中的问题单独拿出来做一个详细的解析，便于初学者更好的理解。

在 SMO（Sequential Minimal Optimization） 算法中，优化两个拉格朗日乘子 $\alpha_1$ 和 $\alpha_2$ 时，受到了多种约束条件的限制。为了确保优化后的 $\alpha_1$ 和 $\alpha_2$ 保持在合法的范围内，算法会计算 上界（Upper Bound） 和 下界（Lower Bound），并在这个区间内调整 $\alpha_1$ 和 $\alpha_2$ 的值。

这些界限确保了两个拉格朗日乘子的值既满足优化的线性约束，又保持在 $[0, C]$ 的范围内（其中 $C$ 是 SVM 的惩罚参数）。下面详细解释上界和下界的含义及其推导过程。

1. SMO 中的约束条件

在 SVM 的对偶问题中，拉格朗日乘子 $\alpha_i$ 需要满足以下约束条件：

线性约束： $\alpha_1 y_1 + \alpha_2 y_2 = k$ （其中 $k$ 是常数，由其他不变的乘子和标签决定）。
边界约束： $\leq \alpha_1 \leq C$ 和 $\leq \alpha_2 \leq C$ 。

这些约束确保了我们优化得到的 $\alpha_1$ 和 $\alpha_2$ 保持在合法的范围内。为了满足这些约束条件，SMO 会为 $\alpha_2$ 计算出一个上界和下界，并在此范围内对 $\alpha_2$ 进行优化调整。

2. 上界和下界的推导

根据 $y_1$ 和 $y_2$ 的符号（即它们是相同的还是不同的标签），上界和下界的计算方式有所不同。下面分别解释这两种情况。

(1) 当 $y_1 = y_2$ 时

如果 $y_1$ 和 $y_2$ 的符号相同（即 $y_1 = y_2$ ），我们知道约束条件为：
$\alpha_1 + \alpha_2 = k$

为了保证 $\alpha_1$ 和 $\alpha_2$ 的取值保持在 [0, C] 范围内，SMO 会计算 $\alpha_2$ 的上下界。

上界 $H$ ：由于 $\alpha_1 \leq C$ ，那么 $\alpha_2$ 的最大值 $H$ 是：
$\min(C, k)$

这里， $\alpha_1 + \alpha_2$ ，所以 $\alpha_2$ 的最大值不能超过 $k$ 或 $C$ ，二者取其较小者。
下界 $L$ ：由于 $\alpha_1 \geq 0$ ，那么 $\alpha_2$ 的最小值 $L$ 是：
$\max(0, k - C)$

这里， $k$ 是常数， $\alpha_2$ 的最小值不能小于 0 或 $k - C$ ，二者取其较大者。

(2) 当 $y_1 \neq y_2$ 时

如果 $y_1$ 和 $y_2$ 的符号不同（即 $y_1 = 1$ ， $y_2 = -1$ 或反过来），我们知道约束条件为：
$\alpha_1 - \alpha_2 = k$

在这种情况下， $\alpha_2$ 的上界和下界如下：

上界 $H$ ：由于 $\alpha_1 \leq C$ ，那么 $\alpha_2$ 的最大值 $H$ 是：
$\min(C, C - k)$

这里， $\alpha_1 - \alpha_2$ ，所以 $\alpha_2$ 的最大值不能超过 $C - k$ 。
下界 $L$ ：由于 $\alpha_1 \geq 0$ ，那么 $\alpha_2$ 的最小值 $L$ 是：
$\max(0, -k)$

这里， $\alpha_2$ 的最小值不能小于 0 或 $- k$ ，二者取其较大者。