百科问答小站 logo
百科问答小站 font logo



什么是meta-learning? 第1页

  

user avatar   sleepy-bag 网友的相关建议: 
      

这篇文章是参考下面这位大牛的博客写下的,我提取了一下大牛的想法,用自己的思路重新阐述一遍,加入了一些自己的insight。但是由于精力有限,本文不介绍任何一篇具体的论文。想看更具体的内容可以去看大牛博客里的介绍。


首先简单说一下传统的机器学习是在干嘛:传统的机器学习方法是针对一个特定的,一般是有大量数据的数据集 ,试图学习出一个预测模型 (其中 是模型 的参数,决定了 性能 ),使得模型对于测试集上的数据的预测 有最小的误差。

这个思路在数据集 D 有大量可得数据的情况下是行得通的。然而事实上在很多情况下,有的数据集数据量非常少,我们很难在上面直接训练出来一个有用的机器学习模型。那么这个问题如何解决呢?

从人类学习分类物体的过程来看,人类认识新的物体并不需要很多的样本作为支撑,这从某些角度说明人类在学习一个新任务的时候,比机器学习模型拥有更多的先验知识。比如说,我小的时候知道了书本是方的,杯子是圆的,那么我不光知道了如何分类书本和杯子,我还同时建立了这么一个概念:“形状不同的物体很可能不是同一类物体”。同理我有很多其它的知识,比如”颜色不同,物体不同“,”查克拉不同,物体不同“。这些知识归结起来,可以认为是规定了我“如何去学习一个新知识”的方法。所以很多年以后我再看到鼠标和键盘的时候,我不需要见识特别多的键盘和鼠标,只要根据以往的经验,看看颜色,看看形状,识别一下查克拉,我发现根据形状能很轻易地判断鼠标和键盘,于是我就很快知道了该如何区分这两者。

所以有的人就这么想:虽然我要做的这个数据集数据很少,但是我有很多其它数据很多的数据集呀。如果模型可以先在其它数据比较多的数据集上学到这些有关“该如何学习新的知识”的先验知识,由此让模型先学会“如何快速学习一个新的知识”,岂不美哉?

到这里差不多就是meta-learning的motivation了。然后就是如何去做。首先我们先来明确一下meta-learning的目标:从多个给定的数据丰富的数据集 捕捉跨数据集的总体信息(颜色,形状和查克拉很重要),从而当我们有一个新的数据较少的数据集 时,可以根据 的特征( 比如根据数据集的特征来看,可能得出内的分类和形状比较相关)。来利用这些从其它数据集学到的先验知识来做出判断。然后根据解决方案的建模方法的不同,meta-learning可以分为两种思路:


第一种思路比较简单粗暴。meta-learning模型不是要根据数据集的特征来利用先验信息吗?那好,我直接把我的模型定义为 ,这里 T 代表训练集,要注意 是包含标签信息的。这样一来,先验知识被编码到参数 当中, 可以根据 x 所属的数据集 的特征来确定如何分类当前样本 x。

这个思路可以继续分为基于度量与基于模型两种。

基于度量的思路把 定义为一个与kNN类似的模型,先判断 x 与 中各数据的距离,然后按比例将 中数据的标签整合作为 x 的标签输出。这种方法中模型要学习的也就是度量方法,即如何计算不同样本之间的距离,不同的距离度量可以产生不同的模型。

而基于模型的思路不直接定义 的形式,而是直接用神经网络的方式学习出全部的 。学习的过程也很简单:在训练中的每一步里,向模型暴露一部分训练数据的标签(这些数据被视作 g 参数表中的 ),同时隐藏另一部分训练数据的标签(这部分数据被视作 g 参数表中的 x),使模型学会利用有标签数据的信息来对无标签数据作出预测;而在测试过程中,暴露标签的数据也就是一个数据集 中的整个训练集 ,隐藏标签的数据也就是 中的整个测试集。


第二种建模思路是这样的:我们知道在一个数据集上学习一个模型就是要根据它的训练集 得出 的最优参数 。那么我们既然是要学会如何学习,自然就是要建模这个学习过程,也就是把学习过程建模为 。 就是meta-learning要学习的目标( 是它的参数),即“决定了我们会对一个新的数据集生成一个什么样的模型 ”的所谓“学习方法”。

这样一来,通过给定多个数据丰富的数据集 ,我们在学习 的参数 的过程中也渐渐学到了一个比较好的 。从而当我们有一个新的数据较少的数据集 时,可以根据从其它数据集学到的先验知识 学到比较靠谱的模型参数。不同的 的选择就产生了不同的meta-learning方法。现有的方法一般还是使用梯度下降, 的建模思路主要有两种

  1. 直接用 产生参数 . 而在很多情况下,模型参数 不能一步优化到最优值,所以 往往是迭代式的:。现在的迭代式建模思路主要集中在参数更新过程中模型参数 与其梯度 的相对于 的比例调节上。此时将RNN作为 应该是比较典型的一种做法。
  2. 使用 生成 的初值,使得模型之后能够利用梯度下降快速下降到一个比较好的极值点。比较出名的MAML方法就是采用这个思路。

user avatar   ren-min-you-dian-chu-ban-she-19 网友的相关建议: 
      

梁思申家庭,从剧中的暗示来看,应该是49年之前的上海工商业者。他们家至少他父母这一支还算是爱国的,49年之后并没有跑路而是留了下来,属于政治上靠得住的工商业者,文革之后被国家启用。

这样的家庭基本上在海外都有亲属,改革开放之后才重新联系上,这也是梁思申改革开放之后选择移民国外的原因之一。

梁思申自视甚高,她说自己没有歧视,但宋运辉说得对,她就是歧视了。她确实想促成中国的发展,但另一方面她心里已经内化了西方资本的逻辑,她认为中国要发展,做西方的附庸就是理所应当的。她并不知道,也没想过,为什么重点国企必须由中国掌握控股权的原因,也不在乎,只要她能完成这笔投资,受到老板的表扬,她的价值就实现了。

剧中对梁思申这一路人的小心思写的是很好的。这就是改革开放中华人华侨的真实想法。

她和宋运辉的矛盾,不是谁和谁斗气,或者性格冲突,而是根本立场不同。对梁思申来说,单子能谈成,中国市场开拓出来,她就实现了自己在美国人中的价值;但是对宋运辉,他就必须考虑中国化工几年甚至几十年之后的长远利益,为了这些利益,政治底线是不能退让的。

梁思申说自己受了歧视,实际上和宋运辉说的歧视并不是一回事。梁说的,是她作为美国华人所受到的种族歧视,这种歧视,宋和大部分中国人当然没有体会,也没有理由就要体会。毕竟梁还是要在美国社会混的,宋和大部分中国人不需要。

宋说的歧视,则是西方大公司利用自己的优势地位,并不把中国当做平等的合作伙伴,而是趁机控制中国的经济命脉。这点,梁实际上是不在乎的。毕竟,就算控制了又能怎么样?梁还是吃香的喝辣的,大不了回美国去。

对吉恩一路人来说,梁当然就是个工具。毕竟买办永远也不可能和老板真的平起平坐。

当然,梁思申并不坏,我相信她主观上也是想为中国好的。但是她长期受美国的教育,认为中国处处落后,美国的一定先进,所以自己有先天的权力去决定东海应该如何如何,还自以为是为中国好,实际上就是个二鬼子。

宋运辉也不傻,这点他肯定早就看透了,但是为了合资,一直到吃饭之前都没捅破。宋也一直在和日本还有其他公司联系,该摊牌就摊牌,可见也没有对梁这边报不切实际的希望。


大结局了补充一下:最后两集说明梁的层次还是比宋差远了。她以谈判为要挟,不仅救不了宋,而且会让上级部门更加怀疑宋和梁有不正当的交易。她以为靠自己就能扳动洛达,靠一个洛达就能改变党的组织原则。而她实际上就是个工具人,不可悲么?

最后她和宋的谈话,宋对她是大失所望的。本来吃饭的时候,宋以为她回来投资是为了帮助中国的建设,结果因为她自己的一点私心,说不投就不投了。她看得上的人就行,其他中国人统统不行。我相信随着改革的深入,梁思申这种人如果不改变自己看问题的方式,会走到完全西化派的路子上。




  

相关话题

  自动驾驶汽车遇到突发情况,面临[撞坏千万豪车]还是[撞死人]的两难选择,它的程序会如何设计? 
  如何看待阿里巴巴 AI labs 引进两位年薪百万美元的科学家?意味着阿里在AI 方面会有哪些新探索? 
  行人轨迹预测有哪些有效的方法和普遍的base方法?或者public dataset? 
  学生网络用知识蒸馏损失去逼近教师网络,如何提高学生网络的准确率? 
  生成式对抗网络GAN有哪些最新的发展,可以实际应用到哪些场景中? 
  我们到底该不该继续发展人工智能? 
  马斯克旗下的脑机接口公司 Neuralink 宣布 2020 上半年将进行人体测试,将带来哪些影响? 
  所谓大数据分析,究竟要学什么? 
  如何评价AlphaGo Zero? 
  如何激怒一位人工智能(机器学习、深度学习、强化学习等)爱好者? 

前一个讨论
怎样做好学术 PPT?
下一个讨论
可以用钢琴弹出人说话的语调吗?





© 2024-05-17 - tinynew.org. All Rights Reserved.
© 2024-05-17 - tinynew.org. 保留所有权利