百科问答小站 logo
百科问答小站 font logo



小样本学习中关于虚拟样本有效性的问题? 第1页

  

user avatar   h1hippie 网友的相关建议: 
      

如果虚拟样本的“输入和输出对应关系其实和Dreal是一样的”,那虚拟样本一定会失效。

所以虚拟样本必须差异化才行。

举个例子:

+表示当前任务样本,-表示非当前任务样本,颜色标识类别。

这个时候因为few-shot问题,决策边界随便画画就可以正确分类了,但是query set来了之后可能泛化性很差。

MetaGAN[1]生成的虚拟样本(负样本)就是压缩特征空间,使决策边界不要乱搞。

+表示当前任务样本,-表示非当前任务样本,红色蓝色标识当前任务类别(real),灰色标识生成负样本(fake)。

这样一来,决策边界可以稳定的在support set周围产生。

再举个例子:

@杨朔 大佬的论文[2]在做增广的虚拟样本,目的是使从support set和base-class data中生成的样本贴近待推断的query set,以达到特征空间增广的目的。这样的虚拟样本就是和题主说的real data不一样了,因为它是去估计query set的分布而不是support set (real)。

参考

  1. ^MetaGAN: An Adversarial Approach to Few-Shot Learning https://proceedings.neurips.cc/paper/2018/hash/4e4e53aa080247bc31d0eb4e7aeb07a0-Abstract.html
  2. ^FREE LUNCH FOR FEW-SHOT LEARNING: DISTRIBUTION CALIBRATION https://arxiv.org/pdf/2101.06395.pdf?ref=https://githubhelp.com



  

相关话题

  如何评价《Science》封面文章《通过概率规划归纳的人类层次概念学习》? 
  目前工业界常用的推荐系统模型有哪些? 
  如何评价基于游戏毁灭战士(Doom)的AI死亡竞赛大赛结果? 
  5-10年后,你觉得哪些科技会让我们“遗忘”现在的生活? 
  请问人工神经网络中的activation function的作用具体是什么?为什么ReLu要好过于tanh和sigmoid function? 
  相比于时下流行的机器学习方法(联接主义),传统的人工智能方法(符号主义)有什么独一无二的优势? 
  算法研究属于数学专业还是计算机专业? 
  2021年了,机器学习有什么高质量的专著? 
  精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么? 
  近几年有哪些关于机器学习中隐私(Privacy)和安全(Security)相关的研究值得关注? 

前一个讨论
如何看待网传字节跳动本月第二起员工抢救事件,现状如何?
下一个讨论
博士生发表几篇SCI论文合适?





© 2025-04-20 - tinynew.org. All Rights Reserved.
© 2025-04-20 - tinynew.org. 保留所有权利