文献阅读分享:XSimGCL - 极简图对比学习在推荐系统中的应用
XSimGCL: Towards Extremely Simple Graph Contrastive Learning for Recommendation
🌟 研究背景
随着推荐系统在电商、社交平台等领域的广泛应用,如何在数据稀疏的情况下提供准确的个性化推荐成为一大挑战。对比学习作为一种自监督学习方法,能够从无标签的原始数据中提取通用特征,从而缓解数据稀疏性问题。然而,对比学习在推荐系统中的具体作用机制尚未完全明晰,尤其是图增强在其中扮演的角色。现有的基于对比学习的推荐模型大多采用图增强来生成不同视图,但这些增强方法的有效性和必要性仍存在争议。
🔍 相关工作
在推荐系统领域,基于图神经网络(GNNs)的模型因其出色的用户-项目关系建模能力而备受关注。LightGCN作为其中的佼佼者,通过简化图卷积网络(GCN)的结构,高效地利用用户-项目交互数据进行推荐。然而,面对数据稀疏性问题,仅依靠图结构信息难以充分挖掘用户和项目的潜在特征。对比学习的引入为这一问题提供了新的解决方案。SGL模型通过节点/边dropout等图增强方法,最大化不同图视图下学习到的表示的一致性,取得了显著的性能提升。但也有研究表明,对比学习模型的性能并不总是依赖于复杂的图增强策略,这促使研究者重新审视对比学习在推荐系统中的应用。
🔄 模型图输入输出转变
XSimGCL模型的输入为用户-项目二分图的初始节点嵌入和邻接矩阵。与传统的基于图增强的对比学习模型不同,XSimGCL不再依赖于对图结构的扰动来生成不同视图,而是通过在每一层的聚合嵌入中添加不同的均匀随机噪声来实现。这些噪声相当于在嵌入空间中对节点进行微小的扰动,从而生成扰动表示。模型的输出为经过对比学习优化后的用户和项目嵌入,这些嵌入在保持与原始交互数据一致的同时,具有更加均匀的分布特性,有助于缓解推荐过程中的流行度偏差问题。
🧪 实验
实验部分,作者在四个大型且高度稀疏的基准数据集上对XSimGCL进行了全面评估,包括Yelp2018、Amazon-Kindle、Alibaba-iFashion和Amazon-Electronics。这些数据集涵盖了不同的推荐场景,具有不同的用户和项目数量以及交互密度。评估指标包括Recall@20和NDCG@20,分别从准确性和排名质量两个方面衡量模型的推荐性能。实验结果表明,XSimGCL在所有数据集上均取得了优异的性能,相较于基于图增强的对比学习模型,其在推荐准确性和训练效率上都有显著提升。
🚀 方法介绍 & 创新
XSimGCL的核心在于其创新的噪声增强方法和简化的模型架构。具体来说,XSimGCL通过在每一层的聚合嵌入中添加不同的均匀随机噪声来生成扰动表示,这些噪声向量的模长被限制为一个小常数ϵ,以确保扰动的幅度可控。同时,XSimGCL采用了跨层对比的策略,即对比不同层的嵌入表示,而非仅对比最终层的表示。这种跨层对比方式充分利用了不同层嵌入信息的差异性,有助于模型学习到更加丰富和鲁棒的特征表示。此外,XSimGCL通过共享单次传递的方式统一推荐和对比任务,极大地简化了模型的计算过程,减少了额外的前向和后向传播开销,提高了模型的训练效率。