当前位置：首页 > news >正文

论文研读——《RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion》

news 2026/1/2 17:14:53

本文的是有关无线电信号生成的一篇文章。

论文简介

名词补充

现有RF数据生成模型

论文贡献

RF-Diffusion

时频扩散

时频扩散——正向销毁过程

时频扩散——逆向恢复过程

时频扩散——条件生成

分层扩散Transformer

分层扩散Transformer——层次结构

分层扩Transformer——基于注意力的扩散块（ADB）

分层扩散Transformer——复值模块设计

分层扩散变压器——相位调制编码

实验设计

实验设计——数据收集

实验设计——对比不同的数据生成模型

实验设计——扩散方法对比

实验设计——网络设计对比

案例分析

案例分析——WiFi手势识别

案例分析——5G FDD信道估计

总结

论文简介

RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion

题目：RF-Diffusion：通过时频扩散生成无线电信号

出处：MobiCom 2024 CCF A

作者：Guoxuan Chi1, Zheng Yang1, Chenshu Wu2, Jingao Xu1, Yuchong Gao3,Yunhao Liu1, Tony Xiao Han4

单位：1清华大学 2香港大学 3北京邮电大学 4华为技术有限公司

我们提出了 RF-Diffusion，这是第一个针对 RF 信号量身定制的生成式扩散模型。RF-Diffusion 可用于RF 数据增强、信道估计和信号去噪等各种基本无线任务，推动 AIGC 在 RF 领域大放异彩。

我们提出了时频扩散理论，这是超越传统基于去噪的扩散方法的先进演进。时频扩散（TFD）与其定制的分层扩散Transformer(HDT) 的集成可以提高时间序列采样的精度，并平衡关注数据的频谱细节。

我们通过案例研究的大量评估结果显示了 RF-Diffusion 的有效性。

名词补充

AIGC：人工智能生成内容 (Artificial Intelligence Generated Content)，它利用深度神经网络等人工智能技术自动生成各种类型的内容，例如图像、文本、音频等。AIGC 在计算机视觉 (CV) 和自然语言处理 (NLP) 领域取得了突破性的进展。

扩散模型：(Diffusion Model) 是一种新兴的深度生成模型，在图像生成、文本生成等领域取得了突破性的成果。它通过迭代添加和去除噪声的过程，逐渐学习并捕捉数据分布的复杂特征，从而能够生成高保真度的数据样本。

时频扩散：(TFD) 是本文提出的一个新型扩散模型理论，旨在解决现有扩散模型在生成射频信号时的局限性。TFD 模型通过在时域添加噪声和频域进行模糊，能够有效地破坏原始射频信号的分布，并在反向过程中进行精确恢复，从而生成高质量的射频信号。

现有RF数据生成模型

基于环境建模的生成模型扩散模型

这种方法利用 LiDAR 点云或视频片段来制作环境的详细 3D 模型。然后，它使用物理模型（如射线追踪）来模拟 RF 信号如何与周围环境相互作用，最终有助于预测接收器可能捕获的信号。然而，一个值得注意的局限性是该方法没有充分考虑目标的材料和特性如何影响 RF 信号传播。

数据驱动的概率生成模型

当前的创新利用生成对抗网络 (GAN) 和变分自动编码器 (VAE) 等模型来增强 RF 数据集。本质上，这些模型学习训练数据中的分布，然后生成遵循该分布的新 RF 数据。

然而，这些模型主要侧重于扩展特征级分布，由于其受限的表示能力，难以精确生成原始 RF 信号。扩散模型与上述生成模型相比，其独特的噪声添加（即噪声化）和去除（即去噪）迭代过程可以精确捕获复杂的原始数据分布。

论文贡献

我们提出了 RF-Diffusion，这是第一个基于扩散模型的通用 RF 信号生成模型。为了克服上述挑战，我们通过重新审视其理论基础、整体 DNN 架构和详细的运算符设计，将现有的基于去噪的扩散模型扩展到时频域，使 RF-Diffusion 能够生成多样化、高质量和时间序列的 RF 数据。

时频扩散理论（正向过程）

提出时频扩散 (TFD) 理论作为一种新范式，以指导扩散模型提取和利用时间和频域中的 RF 信号特征。具体而言，我们证明了扩散模型可以通过在时域中添加噪声和在频域中模糊来有效地破坏和恢复高质量的 RF 信号。

分层扩散Transformer设计（反向过程）

进一步重新设计了现有基于去噪的扩散模型的 DNN，使其与 TFD 兼容。从自上而下的角度来看，派生的 DNN 被称为分层扩散Transformer(HDT)，使 RF 扩散能够生成高质量的 RF 数据。

RF-Diffusion

时频扩散

时频扩散——正向销毁过程

RF-Diffusion 的正向销毁过程旨在模拟无线信号在传播过程中受到的噪声和模糊效应，从而将原始信号逐渐转化为噪声。这个过程分为两个主要步骤：

频率域模糊 (Frequency Blur):

对原始信号进行傅里叶变换，将其从时间域转换到频率域。使用预先定义的高斯卷积核在频率域进行循环卷积操作，使信号频谱变得模糊，从而消除信号中包含的频率信息。

时间序列噪声 (Time-series Noise):

在原始信号上添加复数高斯白噪声，其中噪声的标准差由一个预先定义的参数控制。噪声的添加会干扰信号幅度的细节，使信号变得难以识别。

时频扩散——正向销毁过程

给定一个遵循特定分布 𝒙0 ~ 𝑞(𝒙0) 的信号，前向破坏过程会产生一系列随机变量 𝒙1、𝒙2、……、𝒙t 。此过程中的每个扩散步骤都会从时域和频域破坏原始分布，𝒙t 扩散步骤 t 时的信号状态。

𝒙t 的计算如下，其中𝛼𝑡是一个介于 0 和 1 之间的参数，控制噪声添加的程度，𝒈𝑡 是一个高斯卷积核，𝝐是复数高斯白噪声。

时频扩散——逆向恢复过程

逆向恢复过程，其核心目标是逐步消除噪声和模糊，将噪声分布恢复为原始 RF 信号。逆向恢复过程的目标是学习一个参数化的概率分布 𝑝𝜃 (𝒙0)，使其能够近似原始分布 𝑞(𝒙0)。为了实现目标，可以最小化 𝑞(𝒙0) 和 𝑝𝜃 (𝒙0) 之间的 KL 散度。

其中，𝑞(𝒙𝑡−1|𝒙𝑡, 𝒙0) 表示实际的逆向恢复过程，而 𝑝𝜃 (𝒙𝑡−1|𝒙𝑡) 表示由模型拟合的逆向恢复过程。𝝁𝜃 是指训练好的参数化模型中，根据当前扩散步骤的输入 𝒙𝑡 和条件输入 𝒄，预测的上一个步骤信号 𝒙𝑡−1 的均值。

时频扩散——条件生成

条件输入𝒄定义了特定的场景，包括不同的房间、Tx-Rx 部署、人类活动类型和信号带宽，此输入指导生成过程生成与条件分布𝑝𝜃 (𝒙|𝒄) 一致的数据。

增强实用性。条件生成机制使RF-Diffusion系统能够根据各种条件组合生成不同类别的信号。这消除了为每种信号类型训练单独模型的需要，从而显着提高了模型在实际应用中的实用性。
增加信号多样性。训练有素的条件生成模型会在训练数据集的条件标签空间内创建具有任何可以想象的特征组合的多样化样本，从而将模型的通用性扩展到训练集的初始范围之外，确保数据增强有助于下游任务的性能改进。

分层扩散Transformer

分层扩散Transformer——层次结构

分层扩散Transformer（HDT）是 RF-Diffusion 模型的核心组件，负责将时间-频率扩散理论转化为实际可用的生成模型。HDT 采用分层架构，将非各向同性噪声分解为两个部分：空间维度上的独立高斯噪声和沿时间维度的不同信息和噪声权重。

空间去噪阶段：每个模块独立处理输入序列的一个样本，主要消除高斯噪声的影响。
时间-频率去模糊阶段：将空间去噪模块的处理结果拼接起来，并作为序列输入，估计时间-频率域中信号的真实均值。

分层扩Transformer——基于注意力的扩散块（ADB）

在去噪和时间-频率去模糊阶段，输入数据都经过一系列 Transformer 块进行处理。ADB 包含以下模块：

多头自注意力模块：从噪声输入中提取自相关特征，捕捉信号的高层次表示。
多头交叉注意力模块：学习输入与其对应条件之间的潜在关联，增强条件生成能力。
自适应层归一化：将扩散步骤信息嵌入模型，提高生成信号的质量和多样性。

分层扩散Transformer——复值模块设计

为了有效处理复数无线信号，HDT 采用复数神经网络架构。对注意力模块和前馈模块进行改进，使其支持复数运算。

复数注意力模块：同时考虑了元素之间的相关性和相位信息，Hermite 内积可以有效地捕捉复数向量之间的相关性，同时保留相位信息。修改后的 Softmax 函数只对内积的幅度进行 Softmax 操作，而保持相位信息不变。
复数前馈模块：将复数线性变换分解为实数运算，并分别对实部和虚部进行非线性激活。

分层扩散变压器——相位调制编码

Transformer 模型在处理序列数据时，缺乏对位置信息的感知能力。这个阶段的主要目的是为了给模型输入的信号序列添加位置信息，帮助模型更好地理解和学习信号序列中不同时间点之间的关系。

PME 通过给序列中每个元素的相位添加一个固定偏移量来实现位置编码。这个偏移量与元素的位置相关，因此模型可以根据相位偏移量来推断元素的位置。

RF-Diffusion的正向过程和逆向过程展示如下：

实验设计

实验设计——数据收集

数据集包括在三种不同场景下收集的无线信号，这些场景包括房间选择、设备位置和人为因素（包括其位置、方向和活动）的变化。我们将每个序列的条件标签编译成条件向量 𝒄，以指导训练和采样阶段。

Wi-Fi。我们基于在 5.825 GHz 下工作、带宽为 40 MHz 的商用 NIC IWL5300 收集 Wi-Fi 信号。发射器将 Wi-Fi 数据包注入 3 个接收器以提取与环境相对应的信道状态信息 (CSI)。
FMCW。使用毫米波雷达 IWR1443记录 FMCW 信号。该雷达设备可以放置在每个场景的两个不同位置中的任意一个，工作频段为 77 GHz 至 81 GHz。
收集了超过 20,000 个 Wi-Fi 序列和 13,000 个 FMCW 序列。每个序列都有一个关联的条件标签，指示房间、设备放置、人员 ID、位置、方向和活动类型。本文进行的所有实验均符合 IRB 政策。

实验设计——对比不同的数据生成模型

DDPM。去噪扩散概率模型 (DDPM) 将高斯噪声引入原始数据，随后学习逆转该过程，从而从噪声中生成原始数据。
DCGAN。深度卷积生成对抗网络 (DCGAN) 是一种广为人知的 GAN。在 DCGAN 中，两个模型（即生成器和鉴别器）以对抗方式同时进行训练。经过训练后，生成器可以生成令人信服地绕过鉴别器审查的数据。
CVAE。条件变分自动编码器 (CVAE) 学习数据的高斯隐式表示，从而实现数据生成。该方法在传感和通信系统中被广泛采用，以合成无线特征。

RF-Diffusion生成RF数据

RFDiffusion 生成的 RF 信号保真度高，与地面实况的平均结构相似度达到 81%。这一性能比 DDPM、DCGAN 和 CVAE 等流行的生成模型高出 18.6% 以上。

实验设计——对比不同的数据生成模型

为了进行全面评估，我们采用了两个指标，这两个指标在以前的研究中都常用于评估数据驱动的生成模型。

SSIM：结构相似性指数测量 (SSIM) 是通过分析两个样本的均值和协方差来衡量两个样本之间相似性的一个主要标准。

FID ：Fréchet 初始距离 (FID) 通过测量真实数据和合成数据的高级特征之间的 Fréchet 距离来评估生成模型。

RF-Diffusion 生成的 Wi-Fi 信号平均 SSIM 为 0.81，分别比 DDPM、DCGAN 和 CVAE 高出 25.4%、18.6% 和 71.3%。 RF-Diffusion 的 FID 达到 4.42，比上述比较方法高出 42.4%、63.0% 和 57.3%。

实验设计——扩散方法对比

为了验证我们提出的时频扩散理论的有效性，我们保留了 RF-Diffusion 的网络模型架构，但用两种替代方案取代了时频扩散过程：1) 高斯扩散，类似于 DDPM，仅在信号幅度中引入高斯噪声；2) 模糊扩散，仅执行频谱模糊。

如图所示，时频扩散比高斯扩散的SSIM提高了13.9%，比模糊扩散的SSIM提高了79.2%。在FID方面，时频扩散分别比另外两种方法高出41.3%和83.5%。结果表明，时频扩散理论成功地将两种扩散方法在正交空间上结合起来，从而实现了优势互补。

实验设计——网络设计对比

为了展示我们提出的分层扩散Transformer (HDT) 的优势，我们将其与以下对象进行比较：1) 单级扩散Transformer (SDT)，它是 HDT 的简化形式，只有一个阶段用于端到端数据恢复 2) U-Net，这是一种流行扩散模型。

HDT 的 SSIM 比 SDT 提高了 7.7%，与 U-Net 相比显著提高了 18.9%。当使用 FID 指标进行评估时，HDT 继续领先于 SDT 和 U-Net，领先幅度分别为 48.2% 和 49.3%。

案例分析

案例分析——WiFi手势识别

RF-Diffusion 在 Wi-Fi 手势识别中的应用主要表现为数据增强工具，通过生成高质量的合成信号，提升现有无线感知系统的性能。

实验结果：在跨域场景下，与未使用数据增强的模型相比，RF-Diffusion 将 Widar3.0 和 EI 的识别精度分别提高了 4.7% 和 11.5%。在域内场景下，RF-Diffusion 将 Widar3.0 和 EI 的识别精度分别提高了 1.8% 和 8.7%。随着合成数据比例的增加，识别精度呈现先上升后下降的趋势，说明过量的合成数据可能会影响模型性能。

案例分析——5G FDD信道估计

RF-Diffusion 作为一种基于扩散模型的生成式模型，为 5G FDD 信道估计提供了一种新的思路。它利用上行链路信道状态信息作为条件输入，通过生成式方式估计下行链路信道状态信息 (CSI)。

更高的正 SNR 对应于预测信道与地面真实值之间的接近度增强。RF-Diffusion 在所有比较方法中实现了最高的 SNR，平均 SNR 为 27.01，分别比 NeRF2 和 FIRE 高出 34.6% 和 77.5%，与基于码本的标准实现相比，性能提升了 5 倍以上。

总结

本文介绍了 RF-Diffusion，这是专为 RF 信号设计的开创性生成扩散模型。RF-Diffusion 通过采用新颖的时频扩散过程，擅长生成高保真时间序列信号。此过程可捕捉 RF 信号在空间、时间和频域中的复杂特征。然后，该理论框架被转化为基于分层扩散Transformer的实用生成模型。RF-Diffusion 表现出非凡的多功能性。它在基本无线任务方面具有巨大潜力，从提高无线传感系统的准确性到估计通信系统中的信道状态，为 AIGC 在无线研究中的应用提供了启示。

项目地址 https://github.com/mobicom24/RF-Diffusion

论文地址 RF-Diffusion: Radio Signal Generation via Time-Frequency Diffusion | Proceedings of the 30th Annual International Conference on Mobile Computing and Networking

查看全文

http://www.mrgr.cn/news/35307.html