当前位置: 首页 > news >正文

Domain Adaptation领域自适应--李宏毅机器学习笔记

个人学习笔记,如有错误欢迎指正,也欢迎交流,其他笔记见个人空间 

背景与问题定义

传统监督学习假设:训练集与测试集数据分布一致。

Domain Shift:测试数据分布与训练数据不同,模型泛化性能骤降 。

例如在黑白图像上训练数字分类器,测试时用彩色图像,准确率骤降。

Domain Adaptation(领域自适应) 

目标:在Source Domain(有标签)上训练的模型能在Target Domain(无标签或少量标签)上保持良好性能。

基础思路:学习领域无关的表示

  • 引入Feature Extractor,提取源域与目标域的共享特征。

  • 要求:无论输入图片来源哪一域,提取的特征分布应尽可能一致。

这样就可以用这些 Feature, Source Domain 上训练一个模型 直接用在 Target Domain 上,
接下来的问题就是 , 怎麼找出这样一个 Feature Extractor

关键技术:Domain Adversarial Training

  • 模型结构:

    • Feature Extractor:提取特征。

    • Label Predictor:分类器。

    • Domain Classifier:判断特征来自 Source 还是 Target。

    • 希望 Source Domain 的图片 丢进  Feature Target Domain 的图片丢进去  Feature提取出的特征 看起来要分不出 差异
  • 类比于 GAN:

    • Feature Extractor 类似 Generator;

    • Domain Classifier 类似 Discriminator。

问题:会不会Feature Extractor每次故意提取出无效的特征导致训练失败?

并不会,因为虽然需要混淆 Source 和 Target 的域差异(欺骗 Domain Classifier),同时又要提取对分类有用的特征(服务于 Label Predictor)。

训练方法:

对于 Source Domain的图片,是有标签的。所以可以制定一个Loss L,Ld是 Domain Loss,即领域判别的损失

可以理解为 

  • 它想让分类器分类准(minimize L);

  • 同时又让 Domain Classifier 无法判断出域(maximize Ld)。

通过这里我们可以再回答一遍Feature Extractor会不会训练成故意提取出无效的特征?

如果Feature Extractor 把所有输入都映射为 zero vector,那么 Domain Classifier 完全无法判断这是 Source 还是 Target → Ld 很高 ✅(它被骗了);但是,Label Predictor 完全无法分类 → L 也会很高 ❌


http://www.mrgr.cn/news/98470.html

相关文章:

  • rk3588 驱动开发(一)字符设备开发
  • Python 垃圾回收机制全解析:内存释放与优化
  • Windows 图形显示驱动开发-WDDM 1.2功能—无显示器系统支持
  • WINUI——Background小结
  • 【Pandas】pandas DataFrame iterrows
  • NLP高频面试题(四十三)——什么是人类偏好对齐中的「对齐税」(Alignment Tax)?如何缓解?
  • chain_type=“stuff 是什么 ? 其他方式有什么?
  • STM32F407实现内部FLASH的读写功能
  • 天元证券|8家汽车零部件上市公司一季度业绩预喜
  • MySQL索引和事务
  • 学习笔记十二——Rust 高阶函数彻底入门(超详细过程解析 + 每步数值追踪)
  • 【Linux】基础 IO(文件描述符、重定向、缓冲区)
  • LVGL Animation Image(Animimg)控件详解
  • 怎样完成本地模型知识库检索问答RAG
  • Oracle REGEXP_SUBSTR
  • 2025.4.15六年之约day11
  • 华为OD机试真题——阿里巴巴找黄金宝箱 IV(2025A卷:200分)Java/python/JavaScript/C++/C语言/GO六种最佳实现
  • Transformer 介绍
  • ubuntu24.04终端优化(Zsh + Oh My Zsh)
  • 算法思想之前缀和(二)