来源:Frontiers of Computer Science 发布时间:2024/12/13 16:48:15
选择字号:
FCS 文章精要:南京航空航天大学陈松灿、李绍园等:带有噪声和偏移标签分布的鲁棒域自适应

论文标题:Robust domain adaptation with noisy and shifted label distribution

期刊:Frontiers of Computer Science

作者:Shao-Yuan LI, Shi-Ji ZHAO, Zheng-Tao CAO, Sheng-Jun HUANG, Songcan CHEN

发表时间:31 Jan 2024

DOI:10.1007/s11704-024-3810-0

微信链接:点击此处阅读微信文章

引用格式:

Shao-Yuan LI, Shi-Ji ZHAO, Zheng-Tao CAO, Sheng-Jun HUANG, Songcan CHEN. Robust domain adaptation with noisy and shifted label distribution. Front. Comput. Sci., 2025, 19(3): 193310

阅读原文:

问题概述

无监督域自适应(UDA)旨在将知识从一个带有标签的源域转移到一个数据分布不同的未标记的目标域。尽管以前的UDA方法在源域标签清晰时取得了成功,但获得清晰的标签本身是昂贵的。在源域存在标签噪声的情况下,传统的UDA方法会因为不处理标签噪声而受到损害。这个问题引起了重视,导致了对鲁棒UDA技术的探索。然而,现有的鲁棒UDA方法往往会过滤掉源域中的噪声样本或专注于最小化分布差异,忽视了低质量噪声样本的再利用,并忽略了标签分布偏移(LDS)问题。

技术步骤

RSLR是一种针对标签噪声在无监督域自适应(UDA)中的挑战而设计的方法。它采用了一种伪标签策略,其中LNets 和对噪声源样本预测伪标签,保留高度可靠的伪标签以形成伪标记样本的子集。通过数据增强和集成技术,可以在和的预测中识别出一致的伪标签。目标函数确保获取干净且自信的伪标记样本,既适用于源域又适用于目标域,并构建平衡的子集以解决标签分布偏移(LDS)问题。LNets 和使用正常的交叉熵损失和平衡伪标记样本上的一致损失进行训练,而TNet 则在平衡的伪标记目标样本上进行训练。值得注意的是,RSLR通过同时处理数据协变量转移、LDS和高标签噪声,与以往方法有所区别。这种综合方法使RSLR能够在具有嘈杂标签的UDA任务中取得稳健的性能。

实验结果

我们对四个基准数据集进行了大量实验:MNIST和SYN-DIGITS,以及Office-31和Office-Home数据集。实验结果表明,RSLR在这些数据集上表现出色,超越了以往的方法。

期刊简介

Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办,南京大学支持,SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;两次入选“中国科技期刊卓越行动计划”(一期梯队、二期领军)。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
多波段观测揭示磁星快速射电暴可能起源 新型沸石分子筛合成领域取得突破性进展
热带森林“赢家”更小更快 《自然》2024年十大人物公布
>>更多
 
一周新闻排行
 
编辑部推荐博文