当前位置：首页 > news >正文

线性判别分析 (LDA)中目标函数的每个部分的具体说明

news 2025/12/23 1:56:49

公式：

$\frac{\left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2}{w^T \Sigma_0 w + w^T \Sigma_1 w} = \frac{w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w}{w^T (\Sigma_0 + \Sigma_1) w}$

符号说明：

$F$ ：
这是目标函数，代表我们要最大化的值。LDA 的核心目标是找到一个投影向量 $w$ ，使得类间距离最大化、类内散度最小化。这个函数的最大化表示最佳投影方向。
$w$ ：
投影向量（或称权重向量），它是我们要优化的对象。这个向量定义了将高维数据投影到低维（通常是一维）时的方向。通过选择合适的 $w$ ，我们能够更好地区分不同的类。
$\mu_0$ 和 $\mu_1$ ：
分别是类 0 和类 1 的均值向量。这些向量表示每个类样本的中心点或平均位置。
- $\mu_0$ ：类 0 的样本均值（一个列向量）。
- $\mu_1$ ：类 1 的样本均值（一个列向量）。
$\Sigma_0$ 和 $\Sigma_1$ ：
分别是类 0 和类 1 的协方差矩阵，它们表示类内散布的情况。协方差矩阵描述了类内样本的分散性和相关性。
- $\Sigma_0$ ：类 0 的协方差矩阵。
- $\Sigma_1$ ：类 1 的协方差矩阵。
$w^T$ ：
$w^T$ 是 $w$ 的转置，它是一个行向量（1×n），与列向量相乘时可以计算出标量。转置表示将列向量 $w$ 转化为行向量。
$w^T \mu_0 - w^T \mu_1$ ：
这是类 0 和类 1 的均值向量在方向 $w$ 上的投影差，表示两类中心在投影方向上的距离。通过找到最合适的 $w$ ，我们希望这个投影差（类间差异）尽可能大。
$\left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2$ ：
这是类 0 和类 1 均值投影差的欧氏距离的平方。它表示两个类中心在投影方向上的差异，用于度量类间散度。 $\left\| \cdot \right\|_2$ 是 L2 范数（欧氏距离）。
$(\mu_0 - \mu_1)$ 和 $(\mu_0 - \mu_1)^T$ ：
- $\mu_0 - \mu_1$ 是类 0 和类 1 的均值向量差，它表示两个类的中心点之间的差异。
- $(\mu_0 - \mu_1)^T$ 是该差向量的转置，它与 $w$ 的乘积用于表示类间差异的矩阵形式。
$w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w$ ：
这表示的是类间散度的矩阵形式。通过这个表达式，我们能够将类间的中心差异转化为矩阵运算，以方便后续的优化计算。
$w^T \Sigma_0 w$ 和 $w^T \Sigma_1 w$ ：
这是类 0 和类 1 的协方差矩阵在方向 $w$ 上的投影，表示类内散度。通过找到合适的 $w$ ，我们希望类内散度尽可能小。
$w^T (\Sigma_0 + \Sigma_1) w$ ：
这是类内散度的总和（类 0 和类 1 的协方差矩阵之和），它表示了数据在方向 $w$ 上的总散度。我们希望这个值最小，以确保同类数据尽可能聚集在一起。