百科问答小站 logo
百科问答小站 font logo



你所在的专业领域,有哪些综述文献推荐给刚入行的朋友看? 第1页

  

user avatar   li-yiming-79-73 网友的相关建议: 
      

那我必推荐我们去年在 后门学习 领域写的survey。感谢大家的支持,目前这也是后门学习领域被引次数最多的综述。

在这篇survey中我们对现有的文章进行了分类和总结,并加入了很多我们的思考。同时,我们也在Github上维护了一个资源汇总的仓库:


后门学习(backdoor learning)是一个重要且正在蓬勃发展的领域。与对抗学习(adversarial learning)类似,后门学习也研究深度学习模型的安全性问题,其研究主要包括两大领域:后门攻击(backdoor attacks)及后门防御(backdoor defenses)。

顾名思义,后门攻击希望在模型的训练过程中通过某种方式在模型中埋藏后门(backdoor),埋藏好的后门通过攻击者预先设定的触发器(trigger)激发。在后门未被激发时,被攻击的模型具有和正常模型类似的表现;而当模型中埋藏的后门被攻击者激活时,模型的输出变为攻击者预先指定的标签(target label)以达到恶意的目的。后门攻击可以发生在训练过程非完全受控的很多场景中,例如使用第三方数据集、使用第三方平台进行训练、直接调用第三方模型,因此对模型的安全性造成了巨大威胁。

目前,对训练数据进行投毒是后门攻击中最直接,最常见的方法。 如下图所示,在基于投毒的后门攻击(poisoning-based attacks)中,攻击者通过预先设置的触发器(例如一个小的local patch)来修改一些训练样本。 这些经过修改的样本的标签讲被攻击者指定的目标标签替换,生成被投毒样本(poisoned samples)。这些被投毒样本与正常样本将会被同时用于训练,以得到带后门的模型。值得一提的是,触发器不一定是可见的,被投毒样品的真实标签也不一定与目标标签不同,这增加了后门攻击的隐蔽性。 当然,目前也有一些不基于投毒的后门攻击方法被提出,也取得了不错的效果。

相对于攻击来说,后门防御的类型要更为丰富与复杂。直观上来说,后门攻击就像是使用对应的钥匙开门,因此后门防御也可以从 触发器-后门不匹配、后门移除、触发器移除 这三种设计范式下进行思考与讨论。 General Idea如下图所示:

尽管存在很多相似之处,后门学习事实上与对抗学习之间仍然存在很大的区别。一般来说,对抗攻击关注的是模型预测过程的安全性问题,而后门攻击关注的是模型训练过程的安全性。此外,后门攻击与传统的数据投毒(data poisoning)[另一个关注模型训练过程安全性的研究领域]也有很大的区别:数据投毒的目的是为了降低模型的泛化性能(即希望训练好的模型在测试集上不能有良好的表现),而后门攻击在正常设定下具有和正常模型类似的表现




  

相关话题

  如何看待事件「女博士被诈骗85万称泡实验室十年从不看朋友圈」? 
  如何评价哈工大某老师不允许实验室硕士出去实习,称「实习无用,就像跟不对等的渣男试婚」?你认同吗? 
  如何看待李嘉晖由于被曝学术造假疑似被哥大退学一事? 
  我喜欢做科研,可是没有那么高的创新性怎么办? 
  有哪些有趣、脑洞大开的学术论文? 
  有哪些「为发论文不惜性命」的研究项目/科研工作者? 
  如何评价「中科大一博士点立新规:发篇中文文章才能毕业」? 
  快毕业了,导师让留在组里做博后,海归满天飞,不知道现在国内做博后还有没有前途啊? 
  如何看待基金委 2022 新规:论文成果填写列出全部作者,不再标注一作通讯? 
  为什么我觉得最近20年科学上并没有太大的发展? 

前一个讨论
iQOOneo5 使用体验如何?
下一个讨论
化合物难溶的本质是什么?





© 2025-06-04 - tinynew.org. All Rights Reserved.
© 2025-06-04 - tinynew.org. 保留所有权利