当前位置：首页 > news >正文

Domain Adaptation领域自适应--李宏毅机器学习笔记

news 2025/4/16 6:16:28

个人学习笔记，如有错误欢迎指正，也欢迎交流，其他笔记见个人空间

背景与问题定义

传统监督学习假设：训练集与测试集数据分布一致。

Domain Shift：测试数据分布与训练数据不同，模型泛化性能骤降。

例如在黑白图像上训练数字分类器，测试时用彩色图像，准确率骤降。

Domain Adaptation（领域自适应）

目标：在Source Domain（有标签）上训练的模型能在Target Domain（无标签或少量标签）上保持良好性能。

基础思路：学习领域无关的表示

引入Feature Extractor，提取源域与目标域的共享特征。
要求：无论输入图片来源哪一域，提取的特征分布应尽可能一致。

这样就可以用这些 Feature，在 Source Domain 上训练一个模型，直接用在 Target Domain 上，

接下来的问题就是 , 怎麼找出这样一个 Feature Extractor

关键技术：Domain Adversarial Training

模型结构：
- Feature Extractor：提取特征。
- Label Predictor：分类器。
- Domain Classifier：判断特征来自 Source 还是 Target。
- 希望 Source Domain 的图片 ，丢进 Feature 跟 Target Domain 的图片丢进去 Feature提取出的特征 看起来要分不出 差异
类比于 GAN：
- Feature Extractor 类似 Generator；
- Domain Classifier 类似 Discriminator。

问题：会不会Feature Extractor每次故意提取出无效的特征导致训练失败？

并不会，因为虽然需要混淆 Source 和 Target 的域差异（欺骗 Domain Classifier），同时又要提取对分类有用的特征（服务于 Label Predictor）。

训练方法：

对于 Source Domain的图片，是有标签的。所以可以制定一个Loss L，Ld是 Domain Loss，即领域判别的损失

可以理解为

它想让分类器分类准（minimize L）；
同时又让 Domain Classifier 无法判断出域（maximize Ld）。

通过这里我们可以再回答一遍Feature Extractor会不会训练成故意提取出无效的特征？

如果Feature Extractor 把所有输入都映射为 zero vector，那么 Domain Classifier 完全无法判断这是 Source 还是 Target → Ld 很高 ✅（它被骗了）；但是，Label Predictor 完全无法分类 → L 也会很高 ❌

http://www.mrgr.cn/news/98470.html

相关文章：

rk3588 驱动开发（一）字符设备开发

Python 垃圾回收机制全解析：内存释放与优化

Windows 图形显示驱动开发-WDDM 1.2功能—无显示器系统支持

WINUI——Background小结

【Pandas】pandas DataFrame iterrows

NLP高频面试题（四十三）——什么是人类偏好对齐中的「对齐税」(Alignment Tax)？如何缓解？

chain_type=“stuff 是什么？其他方式有什么？

STM32F407实现内部FLASH的读写功能

天元证券｜8家汽车零部件上市公司一季度业绩预喜

MySQL索引和事务

学习笔记十二——Rust 高阶函数彻底入门（超详细过程解析 + 每步数值追踪）

【Linux】基础 IO（文件描述符、重定向、缓冲区）

LVGL Animation Image（Animimg）控件详解

怎样完成本地模型知识库检索问答RAG

Oracle REGEXP_SUBSTR

2025.4.15六年之约day11

华为OD机试真题——阿里巴巴找黄金宝箱 IV（2025A卷：200分）Java/python/JavaScript/C++/C语言/GO六种最佳实现

Transformer 介绍

ubuntu24.04终端优化（Zsh + Oh My Zsh）

算法思想之前缀和(二)