物理专业的学生如何看待机器学习和大数据这些方向呢？第1页

lykquitphy 网友的相关建议:

既然是物理如何看待的，我就不按照科班的说法说机器学习了。

先说宏观的相同点：

机器学习同物理相同的地方都在于找到一个目标函数，然后求最小值（或者极小），然后比对实验（测试数据），那个解释的好就用那个。而建立目标函数过程中，建模方式都类似于先拟合少体关系，然后推向多体。比如我要建立两个来自不同物体的像素点的关系，我认为猫的像素点同猫的像素点是”强相关的“，因此可以用一个正系数的二次函数多项式描述两个像素点的耦合。猫和狗的像素点是“不相关的”，因此用一个负系数的二次函数多项式描述像素点的耦合。然后为了建立多个像素点的关系，就需要将这些两体耦合项全都加起来取负号，然后称其为能量函数并尝试最小化它。优化这些多项式系数，就能完成一个图像分割的任务。

不相同点：

机器学习里面相对物理世界最大的不同是对称性的考虑。

现代物理的能量函数是依靠对称性写出来的，而非牛顿时代的少体关系学拟合，然后让其N体化。例如，量子场论基本可以从时空的对称+SU(N) 规范对称写出非常多的拉格朗日量。物理学现行的范式，也是目前大统一理论的范式，就是企图通过更高的对称容纳下更多的自由度，然后通过逐渐的对称破缺，而获得形形色色的世界。传统通过实验观测，拟合少体作用然后N体化的模型在物理领域称之为有效模型，按机器学习的说法，有效模型就是说其泛化能力只能限制在你跑脑袋的那些实验数据上，超出这些数据类型就不能用了。这里特别强调对称破坏，打个比方，一个高维的球的对称性是极高的，但是我们没法观测到任何有意义的信息，任何方向都能解释同样的事情，除非对称破坏，变成一个椭球，由于高维椭球长轴可以取很多方向，这样选择某个方向，便对应于物理世界某个可检验的实验。

这一点机器学习，尤其深度学习都考虑的非常不足。虽说早期图像特征确实考虑各种拉伸不变，旋转不变，但缺乏层次感。到了大部分深度学习中要考虑平移，旋转等不变性，整体每层的变换要融入对称来作的人确实有，感觉太少，估计机器实现问题导致不太主流。

开下个人的脑洞：

我也一直觉得低级别的特征往往是对称程度非常高的，逐层映射过程中，实际每层都带有一定的对称破坏，逐渐形成后面的特征才是有意义的特征。比如第一层是平移旋转不变的，第二层只有平移不变。。。越高级的特征，对称破坏实际也越大。有些事实，正如CNN中第一层一般出来的是线段，feature map中会有各种平移和旋转角度的线段，第二层只有各种平移的角，旋转性质少了很多。越到高级特征，基本没有任何对称可言了。我目前也在思考逐层映射是不是也可以看成是一种对称破缺机制，能不能将这种机制变成一个更加广泛的建模技术。

不过不管咋说：面试了一阵子，感觉码农眼里的机器学习大抵是这样子的：xx分钟写某排序，xx分钟写树翻转，xx分钟写CUDA下的LR，xxxx分钟写个过亿用户行为的随机森林。。。。毕竟现实需求太过残酷，没人愿意废脑子去尝试新的模型方法。哪怕学术界也因为CNN太好用，框架多，去考虑更远的更深人也不多，直接各种CNN到处连跑效果的比比皆是。。。

估计大部分搞物理理解机器学习最难的地方应该是：为何总是有用一堆这么low的模型抠实现细节抠到死的人，会认为自己是搞人工智能的？

还好，我为了饭碗，已经迈过这个心理坎站到码农那边了。。。

物理专业的学生如何看待机器学习和大数据这些方向呢？的其他答案点击这里

前一个讨论

如何评价电影《爵迹》？

下一个讨论

对 Lisp 新手来说，学习哪种方言、使用哪些参考书和开发软件更适合？

物理专业的学生如何看待机器学习和大数据这些方向呢？第1页

相关话题

前一个讨论

下一个讨论

相关的话题

物理专业的学生如何看待机器学习和大数据这些方向呢？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

物理专业的学生如何看待机器学习和大数据这些方向呢？第1页