当前位置: 首页 > news >正文

线性判别分析 (LDA)中目标函数的每个部分的具体说明

公式:

F = ∥ w T μ 0 − w T μ 1 ∥ 2 2 w T Σ 0 w + w T Σ 1 w = w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w T ( Σ 0 + Σ 1 ) w F = \frac{\left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2}{w^T \Sigma_0 w + w^T \Sigma_1 w} = \frac{w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w}{w^T (\Sigma_0 + \Sigma_1) w} F=wTΣ0w+wTΣ1w wTμ0wTμ1 22=wT(Σ0+Σ1)wwT(μ0μ1)(μ0μ1)Tw

符号说明:

  1. F F F
    这是目标函数,代表我们要最大化的值。LDA 的核心目标是找到一个投影向量 w w w,使得类间距离最大化、类内散度最小化。这个函数的最大化表示最佳投影方向。

  2. w w w
    投影向量(或称权重向量),它是我们要优化的对象。这个向量定义了将高维数据投影到低维(通常是一维)时的方向。通过选择合适的 w w w,我们能够更好地区分不同的类。

  3. μ 0 \mu_0 μ0 μ 1 \mu_1 μ1
    分别是类 0 和类 1 的均值向量。这些向量表示每个类样本的中心点或平均位置。

    • μ 0 \mu_0 μ0:类 0 的样本均值(一个列向量)。
    • μ 1 \mu_1 μ1:类 1 的样本均值(一个列向量)。
  4. Σ 0 \Sigma_0 Σ0 Σ 1 \Sigma_1 Σ1
    分别是类 0 和类 1 的协方差矩阵,它们表示类内散布的情况。协方差矩阵描述了类内样本的分散性和相关性。

    • Σ 0 \Sigma_0 Σ0:类 0 的协方差矩阵。
    • Σ 1 \Sigma_1 Σ1:类 1 的协方差矩阵。
  5. w T w^T wT
    w T w^T wT w w w 的转置,它是一个行向量(1×n),与列向量相乘时可以计算出标量。转置表示将列向量 w w w 转化为行向量。

  6. w T μ 0 − w T μ 1 w^T \mu_0 - w^T \mu_1 wTμ0wTμ1
    这是类 0 和类 1 的均值向量在方向 w w w 上的投影差,表示两类中心在投影方向上的距离。通过找到最合适的 w w w,我们希望这个投影差(类间差异)尽可能大。

  7. ∥ w T μ 0 − w T μ 1 ∥ 2 2 \left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2 wTμ0wTμ1 22
    这是类 0 和类 1 均值投影差的欧氏距离的平方。它表示两个类中心在投影方向上的差异,用于度量类间散度。 ∥ ⋅ ∥ 2 \left\| \cdot \right\|_2 2 是 L2 范数(欧氏距离)。

  8. ( μ 0 − μ 1 ) (\mu_0 - \mu_1) (μ0μ1) ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0μ1)T

    • μ 0 − μ 1 \mu_0 - \mu_1 μ0μ1 是类 0 和类 1 的均值向量差,它表示两个类的中心点之间的差异。
    • ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0μ1)T 是该差向量的转置,它与 w w w 的乘积用于表示类间差异的矩阵形式。
  9. w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0μ1)(μ0μ1)Tw
    这表示的是类间散度的矩阵形式。通过这个表达式,我们能够将类间的中心差异转化为矩阵运算,以方便后续的优化计算。

  10. w T Σ 0 w w^T \Sigma_0 w wTΣ0w w T Σ 1 w w^T \Sigma_1 w wTΣ1w
    这是类 0 和类 1 的协方差矩阵在方向 w w w 上的投影,表示类内散度。通过找到合适的 w w w,我们希望类内散度尽可能小。

  11. w T ( Σ 0 + Σ 1 ) w w^T (\Sigma_0 + \Sigma_1) w wT(Σ0+Σ1)w
    这是类内散度的总和(类 0 和类 1 的协方差矩阵之和),它表示了数据在方向 w w w 上的总散度。我们希望这个值最小,以确保同类数据尽可能聚集在一起。

总结:

  • 分子部分:表示类间差异,目的是最大化两类中心在投影方向上的距离。
  • 分母部分:表示类内散布,目的是最小化每类数据在投影方向上的分散性。

这个公式是线性判别分析(LDA)的优化目标函数。通过最大化该函数,我们能够找到一个最佳的投影方向 w w w,使得不同类之间的区分度最大,而类内的样本尽可能聚集。


http://www.mrgr.cn/news/35819.html

相关文章:

  • 将Docker中nginx静态资源目录映射到宿主机的某个目录及配置文件映射到宿主机
  • Day46 | 动态规划 :线性DP 最长递增子序列
  • D63【python 接口自动化学习】- python基础之数据库
  • Mac的极速文件搜索工具,高效管理文件
  • XXL JOB DockerCompose部署
  • LaTeX之四:如何兼容中文(上手中文简历和中文论文)、在win/mac上安装新字体。
  • 【P1320 压缩技术(续集版)】
  • 优化理论及应用精解【11】
  • Prompt输出限制怎么写?用CCoT限制输出长度的推理,大幅提高LLM准确性
  • 在pycharm中怎样调试HTML网页程序
  • C语言课程设计题目二:图书信息管理系统设计
  • vulnhub靶场Matrix-win全流程
  • 【设计模式-策略】
  • 双十一有哪些好物值得入手?五款超值数码好物分享!
  • C# 用统一代码动态查询数据库并显示数据
  • 芒果TV《航海少年团》强强联合,优质少儿动画乘风起航
  • W39-02-jmeter中如何实现:下一个请求是需要根据前一个请求返回值进行循环请求
  • Latex学习
  • 【每天学点AI】五个阶段带你了解人工智能大模型发展史!
  • PLC控制系统应用的抗干扰问题
  • 可变剪接分析一步到位,这个 R 包够猛!
  • 表观项目文章速递,平均IF=9.7
  • 【tbNick专享】虚拟机域控、成员服务器、降级等管理
  • oracle 分表代码示例
  • Jetpack02-LiveData 数据驱动UI更新(类似EventBus)
  • 《AI设计类工具系列之三——Magic Design》