你说的小样本迁移,指的是few-shot learning,还是目标域只有少量有标记数据的情况呢?
如果是few-shot learning,那这个领域已经很成熟了,可以直接用元学习方法来解。
如果是目标域只有很少量的有标记数据,那通常做法都是finetune,或者在finetune过程中加入一些控制机制,例如调节样本权重,动态调节学习率,加入课程学习等等。总的来说都是在finetune的大框架下进行的操作。
这是由于目标域小样本带来了过拟合问题,使得我们必须有针对性的设计学习策略。
所以你的问题的焦点就是如何减小过拟合现象。在这个方面,我们也做了一些工作,近期就会开源。主要思想是利用Transformer结构,插入adapter层,来避免过拟合。同时,我们采用了元学习和融合学习的方法进行小样本迁移,在语音识别任务取得了提高。