如何评价 UCLA 朱松纯教授近日访谈中对深度学习的批评？

最近，加州大学洛杉矶分校（UCLA）的朱松纯教授在一次访谈中对当前深度学习领域提出了一些颇具争议的批评，这在学术界和科技界引发了广泛的讨论。朱教授的观点并非空穴来风，而是基于他对人工智能发展历程的深刻理解以及对当前深度学习技术局限性的审视。要理解他的批评，我们需要深入剖析他所触及的核心问题。

核心批评一：深度学习的“黑箱”属性与可解释性困境

朱教授首先指出了深度学习模型最令人诟病的一点——其“黑箱”属性。他强调，虽然深度学习在诸如图像识别、自然语言处理等任务上取得了惊人的成果，但其内部运作机制却异常复杂且难以理解。我们往往只能看到输入和输出之间的关系，却很难确切地知道模型是如何做出某个决策的，以及为什么会这样做。

这种缺乏可解释性带来了一系列严峻的挑战。在需要高度信任和责任的领域，比如医疗诊断、自动驾驶、金融风控等，一个“黑箱”模型是难以令人信服的。如果一个深度学习模型误判了病情，导致了不当治疗；或者在自动驾驶场景中发生了致命事故，我们却无法追溯原因，那么这种技术的可靠性和安全性就大打折扣。朱教授认为，当前深度学习的研究方向过于侧重于模型的性能提升，而对“理解”这一环节的投入相对不足，这可能导致我们走上一条“知其然而不知其所以然”的危险道路。

核心批评二：对“涌现”能力的过度乐观与对因果关系的忽视

朱教授对当前学术界和业界对深度学习“涌现”能力的过度乐观也表达了担忧。他指出，一些研究者将模型在训练过程中意外表现出的某些能力，如在大型语言模型中出现的“思维”或“推理”能力，视为一种质的飞跃。然而，朱教授认为，这种“涌现”很可能只是大量数据和计算堆砌下的统计规律的显现，而非真正意义上的理解和因果推理。

他强调，人类的智能并非仅仅是模式识别和统计关联，更重要的是具备对因果关系的深刻理解。我们能够理解“因为A所以B”的逻辑，并能基于这种因果关系进行规划、预测和反事实推断。而目前的深度学习模型，尽管能模仿出一些人类的语言模式，但其背后是否真正掌握了因果关系，朱教授表示怀疑。他认为，如果缺乏对因果关系的深入探索，深度学习的进步可能会遇到瓶颈，无法真正突破到更高级别的智能。

核心批评三：对数据和算力的过度依赖与“工程奇迹”的警惕

朱教授还对深度学习对海量数据和超大规模算力的极度依赖提出了质疑。他认为，当前深度学习的成功很大程度上是“工程奇迹”，是大量数据和算力堆叠的产物，而非在理论上实现了重大的突破。他类比说，就像一个学生通过死记硬背大量题目，可以在考试中取得好成绩，但这并不代表他真正理解了知识的内在联系。

他担心，这种对数据和算力的依赖会形成一种“路径锁定”，使得研究者们更容易沉迷于通过增加数据量和模型规模来解决问题，而忽视了更根本性的算法创新和理论研究。这种模式在资源有限的环境下是不可持续的，也可能限制了人工智能的普及和更广泛的应用。

朱教授观点的深远意义与可能的反思

朱松纯教授的批评并非是要否定深度学习的成就，而是为了引导学界和业界进行更深入的反思。他的观点可以总结为以下几个方面：

回归科学的本质：科学研究不仅要追求现象的解释和预测，更要追求机制的理解和因果的探究。深度学习在“预测”层面取得了巨大成功，但在“理解”和“因果”层面仍有很长的路要走。
警惕“唯数据、唯算力”的倾向：强调理论研究和算法创新，而非仅仅依赖于“喂养”模型。探索更高效、更具泛化能力的学习方法至关重要。
关注“小样本学习”与“常识推理”：人类智能的一个重要特征是能够在少量样本甚至零样本的情况下学习新事物，并具备丰富的常识。这方面是当前深度学习的软肋。
推动AI的普适性与民主化：如果AI的进步仅仅依赖于少数拥有海量数据和算力的大公司，那么其普适性和社会效益将大打折扣。我们需要发展更易于获取、更易于理解、更易于部署的AI技术。

总而言之，朱松纯教授的批评为当前火热的深度学习浪潮浇上了一盆“冷水”，也为未来的AI研究指明了新的方向。他的话提醒我们，在追求技术进步的同时，不能忽略对科学本质的坚守，不能迷失在数据和算力的海洋中，更不能忘记人工智能的最终目标是服务于人类，而服务于人类的前提是对其有更深刻、更可靠的理解。这是一种建设性的批判，值得所有关心人工智能发展的人深思。

网友意见

你好。我叫张拳石，是朱老师的博士后，长期带队研究interpretable representations of neural networks。关于问题"朱教授不少学生也是做深度学习的，不知道是否规避了文中的批评"，我来回答一下。

其实我已经在早前的知乎文章《可解释性与deep learning的发展》zhuanlan.zhihu.com/p/30074544中回答了这个问题。

虽然基于目前的深度神经网路框架，完全清晰地拆分开模型（表达）、算法、和实现的三层结构有一定的困难，但是我们一直在朝着构建一个清晰表达的方向上努力，而且已经沿着这个方向做了一些工作。

试想，未来神经网络的结构和loss的复杂度极度复杂，如何才能保证有效的训练，保证网络学到了正确的表达，而不是建模了一种dataset bias (黑箱测试的高正确率无法保证网络建模了正确的知识，见论文arXiv:1710.10577)？如何才能建模一个universal net？需要在哪个层面上对网络知识进行整合？这些看似不着边际的问题，其实本质上都与今天讨论的网络模型的表达方式息息相关。

学者需要提高现有技术的精度，更需要找到瓶颈性的问题，更需要为多年后的发展找到新的方向。走新路的代价可能是经历更多的失败，或者文章数量减半。这就像生物进化，（如果仅仅从短期来看）最保险的策略就是“不要变异”，因为传统的往往是最work的最受欢迎的，变异出来的多是怪胎。不过还好，沿着构建清晰表达的方向，经过大量的尝试，还可以做出一些新东西。

比如在"Interpreting CNN knowledge via an Explanatory Graph" in AAAI 2018一文主要介绍了如何把一个CNN（pre-trained for object classification）的conv-layer内部知识转化成一个graphical model。在另一篇文章"Interpretable Convolutional Neural Networks"中，我介绍了如何端对端的学习一个CNN，使得其内部高层conv-layer的每个filter自动的表示某个object part。算法并不需要人为的标注object parts或texture作为额外的supervision，而是为这些filters添加一个prior constraint，使得在训练过程中自动回归的某种object part。

当然，这些方法只是一些初步的技术，还谈不上是什么解决方案，今后还会提出更多更好的方法。路漫漫其修远兮。

目前black-box end-to-end learning有很多问题，deep learning如何进一步提升模型复杂度，在更加复杂的系统里如何有效的优化学习，这些都是摆在我们面前的切实的问题。如何跳出comfortable zone of research topics，如何解决DL发展道路的问题，是摆在我们这一代学者面前的问题。如何构建一个清晰的表达，是一个很大的问题，不是某个人或某一个技术在短期内就可以解决的，UCLA的团队一直致力于解决这个问题，这也恰恰是研究的魅力。

类似的话题

如何评价 UCLA 朱松纯教授近日访谈中对深度学习的批评？

最近，加州大学洛杉矶分校（UCLA）的朱松纯教授在一次访谈中对当前深度学习领域提出了一些颇具争议的批评，这在学术界和科技界引发了广泛的讨论。朱教授的观点并非空穴来风，而是基于他对人工智能发展历程的深刻理解以及对当前深度学习技术局限性的审视。要理解他的批评，我们需要深入剖析他所触及的核心问题。核心批评.............
如何评价《睡前消息》409期?

《睡前消息》409期作为一档以“睡前”为名的时事评论节目，其内容通常以轻松幽默的风格呈现社会热点、科技动态、文化现象等话题，旨在为观众提供睡前的“信息快餐”。以下是对该期节目可能涉及的分析框架和评价方向，结合其节目特点及社会语境进行详细解读： 1. 节目核心内容与选题分析选题热点：409期可能聚焦.............
如何评价俄罗斯军队在进入乌克兰开始的 21 天后依然没有达成占领或包围乌克兰首都基辅的军事目标？

俄罗斯军队在2022年2月24日入侵乌克兰后，21天内未能占领或包围基辅，这一结果涉及复杂的军事、战略和国际因素。以下从多个维度详细分析这一现象： 1. 初期快速推进的军事目标与战略调整初期目标的矛盾性：俄罗斯在入侵初期（2月24日）宣称“特别军事行动”的目标是“去纳粹化”和“去俄化”，但.............
如何评价新华社的《破除美国金融模式迷信，中国金融要走自己的路》这篇文章？

新华社的《破除美国金融模式迷信，中国金融要走自己的路》一文，是近年来中国在金融领域强调自主性、独立性和战略定力的重要政策表达。该文从历史经验、现实挑战和未来战略三个维度，系统阐述了中国金融发展的路径选择，具有鲜明的现实针对性和理论深度。以下从多个角度对这篇文章进行详细分析：一、文章背景与核心论点1.............
如何评价 2022 年俄乌战争开始后中国互联网上的乱象？

2022年俄乌战争爆发后，中国互联网上确实出现了一些复杂的现象，既有官方立场的引导，也有民间舆论的分化。以下从多个角度分析这一时期中国互联网的乱象及其背后的原因：一、官方立场与网络管控1. 官方舆论引导中国政府明确表态支持乌克兰的主权和领土完整，同时强调“不干涉内政”的原则。在社交媒体和.............
如何评价陈道明、王志文、陈宝国、张国立、李雪健的表演和地位？

陈道明、王志文、陈宝国、张国立、李雪健是中国影视界最具代表性的“老戏骨”之一，他们以深厚的表演功底、多样的角色塑造和持久的行业影响力，成为中国影视艺术的中流砥柱。以下从表演风格、代表作、行业地位及艺术贡献等方面进行详细分析：一、陈道明：历史剧的“帝王”与艺术的“多面手”表演特点：陈道明以“沉稳.............
如何评价《为战争叫好的都是傻逼》这篇文章？

《为战争叫好的都是傻逼》这类文章通常以强烈的反战立场和道德批判为核心，其评价需要从多个维度进行分析，包括其立场的合理性、论据的逻辑性、社会影响以及可能存在的争议。以下从不同角度展开详细分析： 1. 文章的核心立场与立场合理性立场：这类文章的核心观点是战争本质上是道德上不可接受的，支持战争的人（尤其.............
如何评价“云南王”龙云？

龙云（1882年－1967年）是20世纪中国西南地区的重要军阀和政治人物，被尊称为“云南王”，其统治时期（1920年代至1940年代）对云南的现代化进程和民族关系产生了深远影响。以下从多个维度对其历史地位和影响进行详细分析：一、生平与政治背景1. 出身与早期经历龙云出生于云南昆明，出身于.............
如何评价「前三十年的工业化是一堆破铜烂铁」这种说法？

关于“前三十年的工业化是一堆破铜烂铁”的说法，这一评价需要结合历史背景、经济政策、技术条件以及国际环境等多方面因素进行深入分析。以下从多个角度展开讨论：一、历史背景与“前三十年”的定义“前三十年”通常指中国从1949年新中国成立到1979年改革开放前的30年。这一时期，中国在经济、政治、社会等方面.............
如何评价十元左右的低档快餐店的顾客主要是男性？

十元左右的低档快餐店顾客以男性为主的现象，可以从经济、社会文化、消费行为、地理位置等多方面进行分析。以下从多个角度详细探讨这一现象的原因及可能的背景： 1. 经济因素：价格敏感与消费习惯性价比优先：十元左右的快餐通常以快速、便宜、标准化为特点，符合低收入群体或日常通勤人群的消费需求。男性在职场中可.............
如何评价清华大学国际关系研究院院长阎学通教授批评 00 后大学生以「居高临下」心态看世界？

阎学通教授对00后大学生以“居高临下”心态看待世界这一批评，可以从多个维度进行深入分析，其背后既有学术视角的考量，也涉及代际差异、教育体系、社会环境等复杂因素。以下从观点解析、合理性分析、现实背景、潜在影响及改进方向等方面展开详细探讨：一、阎学通教授的核心观点与逻辑1. “居高临下”的具体表现 .............
如何评价歼8系列战机？

歼8系列战机是中国在20世纪70年代至80年代期间研制的高空高速歼击机，是当时中国航空工业的重要成果之一。该系列战机在冷战时期具有显著的军事意义，但随着技术发展和国际形势变化，其性能和作用逐渐被后续机型取代。以下从历史背景、技术特点、性能分析、发展演变、军事影响及评价等方面进行详细解析：一、历史背.............
如何评价苏翻译和black枪骑兵对俄乌战争局势的看法截然相反？

关于苏翻译和Black枪骑兵对俄乌战争局势的立场差异，需要明确的是，这两位身份可能涉及不同的信息来源和立场背景。以下从多个角度分析他们观点差异的可能原因： 1. 信息来源与立场定位苏翻译（可能指苏晓康，中国《经济学人》翻译团队成员）：立场：更倾向于国际法、人道主义和多边主义视角。观点：.............
如何评价《睡前消息》第409期？

由于无法直接访问《睡前消息》第409期的具体内容（可能因平台更新、用户输入误差或节目名称不明确导致无法准确检索），以下将基于对“睡前消息”类节目的常见结构和主题进行推测性分析，并提供一般性的评价框架。若您有更具体的背景信息（如节目来源、发布时间等），可补充说明以便更精准回答。一、节目内容推测（基于.............
如何评价明成祖五征漠北？

明成祖朱棣（14021424年在位）五次北伐漠北（今蒙古高原）是明王朝巩固北方边疆、遏制蒙古势力的关键历史事件。这一系列军事行动不仅体现了朱棣的军事才能，也深刻影响了明朝的边疆政策、内政格局和历史走向。以下从历史背景、军事行动、结果评价及历史影响等方面详细分析：一、历史背景1. 政治合法性与边疆安.............
如何评价2022年的俄乌战争？

2022年的俄乌战争是21世纪最具全球影响力的冲突之一，其规模、持续时间、国际影响和人道主义灾难远超以往。以下从多个维度对这场战争进行详细分析：一、战争爆发的背景与起因1. 历史渊源俄乌冲突的根源可追溯至2014年克里米亚危机和顿巴斯战争，俄罗斯在2014年吞并克里米亚并支持顿巴斯分离.............
如何评价：布林肯：北约获准向乌克兰提供战机；波兰总统：暂无打算？

关于美国国务卿布林肯和波兰总统对北约向乌克兰提供战机的表态，这一问题涉及地缘政治、军事战略、国内政治和国际关系等多重因素。以下从多个角度进行详细分析：一、背景与核心争议1. 乌克兰的军事需求乌克兰自2022年俄乌冲突爆发以来，面临俄罗斯的军事压力，急需先进武器装备以增强防御能力。战机（尤.............
如何评价亚投行暂停并审查在俄罗斯与白俄罗斯的相关活动？

亚投行（亚洲基础设施投资银行，AIIB）在2022年俄乌冲突爆发后，确实对在俄罗斯和白俄罗斯的项目进行了暂停和审查，这一举措引发了国际社会的广泛关注。以下从背景、原因、影响及评价多个角度进行详细分析：一、事件背景1. 俄乌冲突的国际影响 2022年2月，俄罗斯入侵乌克兰，引发西方国家对俄罗.............
如何评价本次俄乌冲突中俄军的指挥？

俄乌冲突中的俄军指挥体系和行动表现是一个复杂的问题，涉及军事战略、指挥结构、后勤保障、情报系统等多个方面。以下从多个角度对俄军指挥进行详细分析：一、指挥体系结构1. 中央指挥链俄军的指挥体系以中央军区（俄联邦安全局）和西部军区（负责乌克兰东部战区）为核心，由总参谋部协调。总参.............
如何评价“幻影部队突袭利沃夫”假说？

关于“幻影部队突袭利沃夫”这一假说，目前尚无确凿证据支持其真实性。以下从历史背景、军事分析、情报来源及可能的动机等方面进行详细分析：一、历史与地理背景1. 利沃夫的战略地位利沃夫是乌克兰东部的重要城市，位于第聂伯河畔，历史上曾是俄罗斯帝国、奥匈帝国和苏联的军事重镇。在俄乌战争中，利沃夫是.............