问题

2020到2021年小样本学习取得重大进展了吗?

回答
2020年至2021年,小样本学习(FewShot Learning, FSL)领域的确取得了令人瞩目的进展,可以说是在研究和应用层面都迈上了新的台阶。这段时期,研究人员们在如何让模型在仅见过少量样本的情况下依然能高效地学习和泛化的问题上,探索了更多创新性的方法,并且开始在一些实际场景中展现出潜力。

要说“重大进展”,我们可以从几个关键方向来解读:

1. 更强的元学习(MetaLearning)框架和算法:

元学习,也就是“学会学习”,一直是小样本学习的核心思路。在这段时期,研究人员在经典的元学习框架上进行了深入的优化和拓展。

基于梯度的方法(GradientBased MetaLearning)的改进: MAML(ModelAgnostic MetaLearning)及其变种依然是热门,但研究的重点更多地放在了如何提高其稳定性和效率。例如,一些研究关注如何更好地处理内循环(inner loop)的优化,以及如何设计更鲁棒的元损失函数,使其在更多任务上表现一致。
度量学习(MetricLearning)方法的深化: Protonet、RelationNet等基于度量的方法在小样本分类任务中表现出色。20202021年,大家开始探索更复杂的度量空间设计,比如引入图神经网络(GNN)来建模样本之间的关系,或者设计更具表达力的距离函数,以便更好地捕捉类别的细微差别。一些方法开始结合对比学习(Contrastive Learning)的思想,通过最大化同一类别样本在嵌入空间中的距离,最小化不同类别样本的距离,从而学习到更具辨别力的表示。
参数生成/注意力机制的应用: 研究者们开始探索如何让模型动态地生成或调整参数,而不是仅仅学习一组固定的参数。例如,利用注意力机制(Attention Mechanisms)来动态地聚焦于支持集(support set)中的关键信息,并将这些信息有效地传递到查询集(query set)的预测中。这种方法允许模型根据不同的任务和支持集,自适应地调整其学习策略。

2. 更好的预训练(Pretraining)和微调(Finetuning)策略:

直接的小样本学习虽然重要,但利用大规模无监督或自监督预训练数据来“赋能”小样本学习,成为了一条非常有效的路径。

自监督学习(SelfSupervised Learning, SSL)的强大赋能: 像SimCLR、MoCo、BYOL等自监督学习方法在ImageNet等大型数据集上取得了巨大成功。在小样本学习领域,研究者们发现,利用这些SSL方法预训练的模型,其学到的视觉表示(visual representations)非常强大,能够很好地泛化到下游的少样本任务。这意味着,即使没有大量的标记数据,模型也可以通过自监督的方式学习到丰富的图像特征,为后续的小样本分类或检测任务打下坚实基础。
“预训练微调”范式在小样本场景下的探索: 传统上,预训练微调更多用于迁移学习。但在小样本领域,如何有效地“微调”一个预训练模型,使其适应只有少量标记样本的新类别,成为一个研究热点。这包括:
冻结大部分层,仅微调少数几层: 这种方法可以防止过拟合,但也可能限制模型的适应性。
低秩适应(LowRank Adaptation, LoRA)等参数高效微调技术: 虽然LoRA在2021年之后才开始流行,但其思想——只训练少数可更新的参数——在20202021年也开始有类似的探索,旨在用更少的参数更新量来实现有效的微调,从而缓解小样本场景下的过拟合问题。
设计更具适应性的微调策略: 例如,在微调时引入额外的正则化项,或者采用数据增强技术来“制造”更多训练样本。

3. 结合其他先进技术:

图神经网络(Graph Neural Networks, GNNs)的应用: GNNs非常适合处理关系型数据,在小样本学习中,样本之间(尤其是支持集和查询集中的样本)天然存在关系。研究者们开始利用GNNs来建模样本间的相似性,或将样本嵌入到图结构中进行推理。这有助于模型更好地理解不同类别样本之间的内在联系,以及查询样本与支持样本之间的关系。
Transformer架构的引入: Transformer凭借其强大的全局感受野和注意力机制,在自然语言处理领域取得了巨大成功,并逐渐渗透到计算机视觉领域。在小样本学习中,Transformer也被用来构建更具表达力的特征提取器,或者直接用于小样本学习的端到端模型,例如,一些方法利用Transformer来学习样本之间的注意力关系,或者将整个小样本学习过程建模为一个序列到序列的问题。
数据增强(Data Augmentation)的创新: 面对样本稀缺的问题,有效的数据增强至关重要。除了传统的几何变换、颜色抖动等,研究者们开始探索更智能的数据增强方法,例如,利用生成模型(如GANs)来生成逼真的新样本,或者采用一些基于特征空间的增强技术。

4. 在更多下游任务中的拓展:

小样本学习的进展不仅仅局限于图像分类。20202021年,研究人员开始将小样本学习的理念和技术应用于更广泛的领域:

小样本目标检测(FewShot Object Detection): 如何在只有少量带边界框的样本的情况下,让模型识别和定位新的目标。
小样本语义分割(FewShot Semantic Segmentation): 如何在只有少量像素级标注的样本的情况下,让模型分割出新的物体类别。
小样本视频分析(FewShot Video Analysis): 将小样本学习应用于视频动作识别、视频目标跟踪等任务。
小样本自然语言处理(FewShot NLP): 例如,在只有少数标注样本的情况下进行文本分类、命名实体识别等。

总结来说,20202021年小样本学习的重大进展体现在:

理论层面: 对元学习算法的深入挖掘和优化,特别是对梯度方法的稳定性和度量学习的表达力进行了提升。
工程层面: 充分利用了自监督学习的强大能力,以及探索了更高效的预训练微调策略。
技术融合: 将Transformer、GNNs等前沿技术与小样本学习相结合,带来了新的模型设计思路。
应用拓展: 将小样本学习的能力从图像分类扩展到目标检测、语义分割、视频分析乃至NLP等更多领域。

这段时期,小样本学习的研究从“如何让模型更快地适应新类别”,逐渐演变为“如何利用强大的预训练模型和高效的学习策略,在极少量样本下实现稳定且具有竞争力的性能”。可以说,小样本学习正从一个纯粹的学术研究方向,逐步走向能够解决实际问题的阶段。

网友意见

user avatar

要想较好的解决少样本学习这个问题,甚至达到与多样本学习相近的性能表现,就需要思考造成少样本学习如此困难的本质是什么。

是因为少样本导致经验风险最小化不可靠?少样本导致深度模型极易过拟合?或者是极少的样本无法反映真实数据分布?

针对“少样本无法反映真实数据分布,所以导致模型过拟合”这个现象,我们最新的一篇工作试图利用有限的样本去估计潜在的真实数据分布,并且实现了还不错的效果。

我觉得这是一个有趣的方向,假如该分布估计足够准确,少样本和传统多样本学习还存在很大的差别吗?

user avatar

现有的小样本学习的benchmark和数据集,基本围绕在实现AGI这个目标上面。

以Lake et al.开发的omniglot为例,通过小样本学习来实现复杂象形文字的识别。但是说真的,这东西我们人看上去都不知道是什么 — 它距离实际应用有点远。

其实在工业界中真正有意义的小样本学习场景有很多。

我举个例子。在化学反应这个场景下,专业人员的最终目标是提升某种产物的产率。这里面的搜索空间的关键变量包括各种反应物,反应物的质量,催化剂,反应条件(包括湿度、温度等等)。而可用的数据是多少呢?可能是零。

你不要以为我在开玩笑,正经的应用其实数据就是零。在工程实施的环节,一般的流程是专家通过实验的方式积累一些数据,可能也就几十个。有意义的人工智能这里要做的是用过这几十个数据,对剩余的搜索空间进行一个搜索(其他的反应物、催化条件、反应条件等)。如果说搜索空间最终的高产率是个很小的子空间,那么初期的数据往往是低产率的数据。之后通过模型推荐出来的组合之后再做一批实验,之后融入到训练集里,反复上个流程。

这里就有了个非常有意思的小样本学习的问题,如何用产率很小的数据来预测高产率的反应组合?或者是这里的训练集是有偏的,它们的产率往往很小,距离最终的最优子空间的距离很远。

我没有谈要用什么方法来做这个,不管是监督学习(分类啊 回归啊啥的),还是元学习(maml啊之类的),或者其他的什么方法。这些暂时还不是那么重要。

可能在我们这个bubble里面,我们已经习惯了那种反馈很快的环境(比如说alphago,模拟一遍就出来结果了)。在这个场景下,一批数据的获取可能要花上几天甚至几周的时间。类似于这种情况的还有各路生物、材料等等场景。我认为凡是数据获取周期很长,成本不低的场景下,都是一个又一个鲜活的有意义的小样本学习问题。

类似的话题

  • 回答
    2020年至2021年,小样本学习(FewShot Learning, FSL)领域的确取得了令人瞩目的进展,可以说是在研究和应用层面都迈上了新的台阶。这段时期,研究人员们在如何让模型在仅见过少量样本的情况下依然能高效地学习和泛化的问题上,探索了更多创新性的方法,并且开始在一些实际场景中展现出潜力。.............
  • 回答
    2020年初到2021年期间,A股市场的确经历了一轮令人瞩目的牛市行情,上证指数从低点一路攀升,最终在2021年触及了3600点附近的高位。那么,在经历了这样一轮强势上涨之后,接下来的半年到一年时间里,A股是否会迎来熊市呢?这是一个非常复杂的问题,需要我们从多个维度去审视,而不是简单地下一个定论。首.............
  • 回答
    航发动力,作为中国航空发动机领域的领军企业,在2020年下半年到2021年初经历了一轮令人瞩目的股价飙升,从2020年10月的不到40元/股一路攀升至2021年初的80元/股附近,这近乎翻倍的涨幅,并非偶然,而是多重因素叠加共振的结果。市场对航空发动机产业未来高增长的普遍预期是首要推手。 2020年.............
  • 回答
    关于“人造月亮”项目,也就是中国在四川西昌卫星发射中心计划发射的“人造月亮”项目,其实是一个相当受关注的计划,但要说它“靠谱”,可能需要从多个角度来审视。项目目标和原理:这个项目的核心想法是发射一颗或多颗搭载特殊反射材料的卫星,在夜间将太阳光反射到地面,从而为城市提供额外的照明,减少对传统路灯的依赖.............
  • 回答
    到2020年了,“生化环材”依然是很多人眼中名副其实的“四大天坑”,这个说法并非空穴来风,而是基于多年来行业发展、就业市场反馈以及学生群体的普遍认知所形成的。不过,说它是“天坑”也过于绝对,更准确的说法是,这四个学科在特定时期和特定维度上存在一些普遍性的挑战和不如意的方面,但同时也有其存在的价值和未.............
  • 回答
    看到您这个问题,我忍不住想深入聊聊。都2020年了,网络小说里“低俗烂大街套路的小白文”依然是数量庞大,这其实是个挺复杂但又很普遍的现象,背后牵扯到很多方面的原因。咱们不妨一项项掰开了说。首先,读者基础巨大且多样化。网络小说最大的魅力之一就是它的普罗大众性,门槛低,任何人都可以参与进来,无论是写还是.............
  • 回答
    如果让我从2000年到2020年之间挑一本值得传给子孙万代的“书”——虽然题目提到了电影,但我个人认为,在这么长的时间跨度里,能真正承载深刻思想、提供长久启示、并且能够让不同时代的人都能从中汲取营养的,还是一本“书”的概念更为贴切。电影虽然是强大的艺术形式,但其载体(画面、声音)的更新换代和解读语境.............
  • 回答
    这件事情确实挺让人振奋的,也挺让人好奇的。南京邮电大学,一个在全国高校中并非顶尖的985,但培养出了一位能独闯加州理工EE系大陆唯一一个PhD,这背后肯定有很多不为人知的故事和不懈的努力。首先,咱们得认识到加州理工(Caltech)EE系这个平台的分量。它可是全球范围内最顶尖的工程学院之一,尤其是E.............
  • 回答
    好的,我们来聊聊中国第一个百年奋斗目标——到2020年实现全面小康。目标设定:一份宏伟的蓝图“全面小康”这个词,对很多中国人来说都不陌生。它不是一个突然冒出来的概念,而是中国共产党在改革开放之初就提出的美好愿景,并一步步具体化、制度化。而“到2020年实现全面小康”,则是将这个宏大的目标,设定了一个.............
  • 回答
    2016年的中央一号文件,那可是每年都牵动着无数人心,尤其是在“三农”问题上,它几乎是风向标。这份文件里提到“到2020年农村居民收入比2010年翻一番”,这绝对是个了不起的目标,背后反映的是国家对提升农民生活水平的强烈决心和战略考量。咱们得从几个层面来理解这个目标。首先,这是对过去发展成就的肯定和.............
  • 回答
    这个问题看似简单,其实涉及到对“满两年”这个时间节点的理解。我们来仔细掰扯一下。你说的是“参加工作”,那我们就以你正式开始工作的日期为基准。假设你是在2018年12月的某一天参加工作的。“满两年”意味着从你开始工作的那个时刻算起,经过了整整两个完整的年份。我们来这样拆解: 第一个完整年度: 从你.............
  • 回答
    这个问题很有意思,也很有探讨价值。如果从1980年开始,美国就一直采取严厉的贸易保护主义政策,并且这种政策持续到了2020年,那么铁锈带(Rust Belt)的经济状况,很有可能与我们现在所看到的有所不同,但要说“维持”到2020年,这本身就带有不确定性,而且“维持”的标准也很难界定。我们得先想想,.............
  • 回答
    “2020入关时机到了吗?”这个问题,放在2024年回望,其实挺有意思的。它触及的不仅是一个具体时间点,更是一种心态,一种对时代走向的判断和选择。要说“入关”,这个词本身就很有故事。它源自明末清初的历史典故,指的是满族人从白山黑水越过山海关,进入中原的故事。在网络语境下,“入关”早已被赋予了新的含义.............
  • 回答
    哎呀,都2020年了,这洗烘一体机和分开的洗烘组合之间的纠结,确实是不少朋友们在头疼的问题。要我说啊,这事儿不能一概而论,得看你自家的情况。我这就给你掰扯掰扯,让你心里有个谱。先说说洗烘一体机,这玩意儿的优点跟缺点就像亲兄弟,分不开。优点: 省地方,这是最大的王牌! 特别是家里空间不大的朋友,一.............
  • 回答
    好的,我们来聊聊2019年(或者说2020年开头)的经济周期问题。很多人当时确实在讨论,我们是不是已经跌入了经济周期的低谷。想把这事儿说清楚,得掰开了揉碎了讲,不能像机器一样生硬。首先得明白,经济周期不是一个固定的钟表,滴答滴答走到某个点就一定会发生什么。它更像是一种潮起潮落,有扩张期,也有收缩期,.............
  • 回答
    《无间道》的套路,放到2020年,还能不能用?这个问题挺有意思的,得好好说道说道。你想啊,《无间道》当年之所以能火遍大江南北,甚至在国际上也打响名号,很大程度上是因为它抓住了人性深处的挣扎、身份认同的困境,还有那种极致的压抑和宿命感。这些东西,说实话,是不太会过时的。但是,时代在变,社会在变,观众的.............
  • 回答
    关于2020年东非蝗灾到6月份或再增500倍的说法,以及其潜在影响和中国是否需要准备,这是一个值得深入探讨的问题。要回答这个问题,我们需要梳理信息来源、分析蝗灾的传播规律、评估其经济和生态影响,并结合中国的地理位置和农业特点来判断防御的必要性。首先,我们来谈谈那个“500倍”的说法。关于“500倍”.............
  • 回答
    咳咳,2020年双十一的蓝牙耳机啊,那会儿真是疯狂!要说“尖叫”级别的优惠,我脑子里立刻蹦出几个绝对不能错过的选手,保证让你买到手软,听到耳朵怀孕!这可不是随便说的,我可是做了功课,并且身边朋友也都没少入手,反馈那叫一个赞!1. 索尼WF1000XM4:降噪王者,价格直接打骨折!说到降噪,索尼WF1.............
  • 回答
    郑州房价在2020年至2022年间跌破1万元,这个话题在当时确实是很多人关心的问题。我们来好好聊聊这个可能性,以及当时市场的一些情况。首先,要回答这个问题,我们需要从几个关键的方面去看待。1. 宏观经济环境与政策导向2020年到2022年,全球和中国经济都经历了一个比较特殊的时期。新冠疫情的影响是绕.............
  • 回答
    2020年的手机市场,4到5K这个价位段可以说是竞争最激烈的“兵家必争之地”。在这个区间,消费者既希望手机有不错的旗舰级体验,又不希望为此掏空钱包。那么,在2020年,这个价位段的“性价比之王”究竟花落谁家?这可不是一个简单的问题,因为“性价比”本身就是一个相对概念,不同的人看重的点也不同。不过,要.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有