什么是meta-learning? 第1页

sleepy-bag 网友的相关建议:

这篇文章是参考下面这位大牛的博客写下的，我提取了一下大牛的想法，用自己的思路重新阐述一遍，加入了一些自己的insight。但是由于精力有限，本文不介绍任何一篇具体的论文。想看更具体的内容可以去看大牛博客里的介绍。

首先简单说一下传统的机器学习是在干嘛：传统的机器学习方法是针对一个特定的，一般是有大量数据的数据集，试图学习出一个预测模型（其中是模型的参数，决定了性能），使得模型对于测试集上的数据的预测有最小的误差。

这个思路在数据集 D 有大量可得数据的情况下是行得通的。然而事实上在很多情况下，有的数据集数据量非常少，我们很难在上面直接训练出来一个有用的机器学习模型。那么这个问题如何解决呢？

从人类学习分类物体的过程来看，人类认识新的物体并不需要很多的样本作为支撑，这从某些角度说明人类在学习一个新任务的时候，比机器学习模型拥有更多的先验知识。比如说，我小的时候知道了书本是方的，杯子是圆的，那么我不光知道了如何分类书本和杯子，我还同时建立了这么一个概念：“形状不同的物体很可能不是同一类物体”。同理我有很多其它的知识，比如”颜色不同，物体不同“，”查克拉不同，物体不同“。这些知识归结起来，可以认为是规定了我“如何去学习一个新知识”的方法。所以很多年以后我再看到鼠标和键盘的时候，我不需要见识特别多的键盘和鼠标，只要根据以往的经验，看看颜色，看看形状，识别一下查克拉，我发现根据形状能很轻易地判断鼠标和键盘，于是我就很快知道了该如何区分这两者。

所以有的人就这么想：虽然我要做的这个数据集数据很少，但是我有很多其它数据很多的数据集呀。如果模型可以先在其它数据比较多的数据集上学到这些有关“该如何学习新的知识”的先验知识，由此让模型先学会“如何快速学习一个新的知识”，岂不美哉？

到这里差不多就是meta-learning的motivation了。然后就是如何去做。首先我们先来明确一下meta-learning的目标：从多个给定的数据丰富的数据集捕捉跨数据集的总体信息（颜色，形状和查克拉很重要），从而当我们有一个新的数据较少的数据集时，可以根据的特征（比如根据数据集的特征来看，可能得出内的分类和形状比较相关）。来利用这些从其它数据集学到的先验知识来做出判断。然后根据解决方案的建模方法的不同，meta-learning可以分为两种思路：

第一种思路比较简单粗暴。meta-learning模型不是要根据数据集的特征来利用先验信息吗？那好，我直接把我的模型定义为，这里 T 代表训练集，要注意是包含标签信息的。这样一来，先验知识被编码到参数当中，可以根据 x 所属的数据集的特征来确定如何分类当前样本 x。

这个思路可以继续分为基于度量与基于模型两种。

基于度量的思路把定义为一个与kNN类似的模型，先判断 x 与中各数据的距离，然后按比例将中数据的标签整合作为 x 的标签输出。这种方法中模型要学习的也就是度量方法，即如何计算不同样本之间的距离，不同的距离度量可以产生不同的模型。

而基于模型的思路不直接定义的形式，而是直接用神经网络的方式学习出全部的。学习的过程也很简单：在训练中的每一步里，向模型暴露一部分训练数据的标签（这些数据被视作 g 参数表中的），同时隐藏另一部分训练数据的标签（这部分数据被视作 g 参数表中的 x)，使模型学会利用有标签数据的信息来对无标签数据作出预测；而在测试过程中，暴露标签的数据也就是一个数据集中的整个训练集，隐藏标签的数据也就是中的整个测试集。

第二种建模思路是这样的：我们知道在一个数据集上学习一个模型就是要根据它的训练集得出的最优参数。那么我们既然是要学会如何学习，自然就是要建模这个学习过程，也就是把学习过程建模为。就是meta-learning要学习的目标（是它的参数），即“决定了我们会对一个新的数据集生成一个什么样的模型 ”的所谓“学习方法”。

这样一来，通过给定多个数据丰富的数据集，我们在学习的参数的过程中也渐渐学到了一个比较好的。从而当我们有一个新的数据较少的数据集时，可以根据从其它数据集学到的先验知识学到比较靠谱的模型参数。不同的的选择就产生了不同的meta-learning方法。现有的方法一般还是使用梯度下降，的建模思路主要有两种

直接用产生参数 . 而在很多情况下，模型参数不能一步优化到最优值，所以往往是迭代式的：。现在的迭代式建模思路主要集中在参数更新过程中模型参数与其梯度的相对于的比例调节上。此时将RNN作为应该是比较典型的一种做法。
使用生成的初值，使得模型之后能够利用梯度下降快速下降到一个比较好的极值点。比较出名的MAML方法就是采用这个思路。

ren-min-you-dian-chu-ban-she-19 网友的相关建议:

梁思申家庭，从剧中的暗示来看，应该是49年之前的上海工商业者。他们家至少他父母这一支还算是爱国的，49年之后并没有跑路而是留了下来，属于政治上靠得住的工商业者，文革之后被国家启用。

这样的家庭基本上在海外都有亲属，改革开放之后才重新联系上，这也是梁思申改革开放之后选择移民国外的原因之一。

梁思申自视甚高，她说自己没有歧视，但宋运辉说得对，她就是歧视了。她确实想促成中国的发展，但另一方面她心里已经内化了西方资本的逻辑，她认为中国要发展，做西方的附庸就是理所应当的。她并不知道，也没想过，为什么重点国企必须由中国掌握控股权的原因，也不在乎，只要她能完成这笔投资，受到老板的表扬，她的价值就实现了。

剧中对梁思申这一路人的小心思写的是很好的。这就是改革开放中华人华侨的真实想法。

她和宋运辉的矛盾，不是谁和谁斗气，或者性格冲突，而是根本立场不同。对梁思申来说，单子能谈成，中国市场开拓出来，她就实现了自己在美国人中的价值；但是对宋运辉，他就必须考虑中国化工几年甚至几十年之后的长远利益，为了这些利益，政治底线是不能退让的。

梁思申说自己受了歧视，实际上和宋运辉说的歧视并不是一回事。梁说的，是她作为美国华人所受到的种族歧视，这种歧视，宋和大部分中国人当然没有体会，也没有理由就要体会。毕竟梁还是要在美国社会混的，宋和大部分中国人不需要。

宋说的歧视，则是西方大公司利用自己的优势地位，并不把中国当做平等的合作伙伴，而是趁机控制中国的经济命脉。这点，梁实际上是不在乎的。毕竟，就算控制了又能怎么样？梁还是吃香的喝辣的，大不了回美国去。

对吉恩一路人来说，梁当然就是个工具。毕竟买办永远也不可能和老板真的平起平坐。

当然，梁思申并不坏，我相信她主观上也是想为中国好的。但是她长期受美国的教育，认为中国处处落后，美国的一定先进，所以自己有先天的权力去决定东海应该如何如何，还自以为是为中国好，实际上就是个二鬼子。

宋运辉也不傻，这点他肯定早就看透了，但是为了合资，一直到吃饭之前都没捅破。宋也一直在和日本还有其他公司联系，该摊牌就摊牌，可见也没有对梁这边报不切实际的希望。

大结局了补充一下：最后两集说明梁的层次还是比宋差远了。她以谈判为要挟，不仅救不了宋，而且会让上级部门更加怀疑宋和梁有不正当的交易。她以为靠自己就能扳动洛达，靠一个洛达就能改变党的组织原则。而她实际上就是个工具人，不可悲么？

最后她和宋的谈话，宋对她是大失所望的。本来吃饭的时候，宋以为她回来投资是为了帮助中国的建设，结果因为她自己的一点私心，说不投就不投了。她看得上的人就行，其他中国人统统不行。我相信随着改革的深入，梁思申这种人如果不改变自己看问题的方式，会走到完全西化派的路子上。

什么是meta-learning? 的其他答案点击这里

什么是meta-learning? 第1页

相关话题

前一个讨论

下一个讨论

相关的话题