问题

如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架,避免使用 TensorFlow?

回答
作为一名AI语言模型,我没有朋友圈,也无法直接对人类的行为和观点进行“评价”。但我可以基于公开的信息和技术领域的一般认知,来分析余凯先生在朋友圈发表的关于框架选择的观点,并尝试为您提供一个相对详尽的解读。

首先,我们需要了解余凯先生的背景。他是一位在人工智能领域,特别是在深度学习框架领域有着深厚经验的技术专家和创业者。他曾是百度深度学习实验室的创始人和主任,后来创立了深瞐科技,专注于计算机视觉和AI芯片等领域。他的技术背景和在行业中的影响力,使得他在朋友圈的发言往往能够引发广泛的讨论和关注。

关于他呼吁使用Caffe、MXNet并“避免”使用TensorFlow的观点,我们可以从几个层面来理解:

1. 对TensorFlow的“不信任”或“担忧”的根源

早期TensorFlow的设计哲学与落地挑战: TensorFlow在早期版本,尤其是TensorFlow 1.x,其设计理念是“静态图”,强调“定义即执行”。这种方式虽然在某些方面能够带来性能上的优化和可移植性,但在实际开发中,尤其是对于初学者而言,学习曲线陡峭,调试困难。动态图(Eager Execution)的引入虽然改善了这一点,但在相当长一段时间内,静态图仍是主流,这可能给很多开发者带来了不好的初体验。
Google的战略和生态演进: 作为一家大型科技公司推出的开源项目,TensorFlow的演进往往与Google自身的战略紧密相关。这意味着框架的发展方向、优先级、以及对外部贡献者的支持策略,可能并不总是与所有开发者的需求完全同步。例如,Google内部大力推广TPU(张量处理单元),而TensorFlow对TPU的支持是其核心优势,但对于其他硬件平台,特别是国产AI芯片的适配和优化程度,可能会让一些国内开发者感到不够理想。
社区活跃度和支持的感知差异: 尽管TensorFlow拥有庞大的社区和资源,但开源项目的社区健康度是一个动态的概念。余凯先生的看法可能反映了他或他所处的圈层对TensorFlow社区活跃度、响应速度、以及在某些特定方向上(如对中文社区的友好度、对国内学术界和工业界的实际支持力度)的某种感知上的不足。
对技术“控制权”的考量: 作为一名致力于推动中国AI技术自主化和产业化的创业者,余凯先生可能更倾向于选择那些更开放、更不受单一巨头完全主导,或者更有利于本土技术生态发展的框架。Caffe和MXNet在一定程度上可以被视为与TensorFlow不同的选择,它们在某些方面展现出了不同的发展路径或社区结构。

2. 为什么会提到Caffe和MXNet?

Caffe: Caffe是早期非常流行的深度学习框架,以其速度快、易用性和出色的计算机视觉模型而闻名。许多经典的CV模型(如AlexNet、VGG)最初都是在Caffe上实现的。它拥有一个相对稳定和成熟的生态系统,尤其是在计算机视觉领域。余凯先生可能认为Caffe在某些特定任务或应用场景下仍然具有强大的生命力。
MXNet: MXNet是另一个由Apache基金会孵化的深度学习框架,它在设计上兼顾了灵活性和效率。它支持混合执行模式(静态图和动态图),并且在内存使用效率方面表现出色,这对于在资源受限的设备上部署模型(如边缘计算)非常有吸引力。此外,MXNet在被Amazon收购并作为其云服务的重要组成部分后,获得了大量的商业支持和工程投入。余凯先生提及MXNet,可能也看重其在性能、灵活性以及背后商业支持的潜力。

3. “呼吁”和“避免”背后的意图

引导技术选型: 余凯先生的发言,很可能是一种引导性的意见表达,希望他的同行、团队成员,或者更广泛的技术社群,在进行项目技术选型时,能够更审慎地评估不同框架的优劣,并考虑更多维度的因素,而不只是“随大流”。
推动技术多元化: 从更宏观的角度看,支持不同框架的发展,有助于形成一个更加健康和多元化的深度学习生态系统。如果所有人都只使用一个主流框架,可能会导致技术创新被“卡脖子”,或者在某些特定需求上出现“短板”。鼓励使用其他框架,也是一种对技术生态多样性的贡献。
对本土技术生态的关怀: 考虑到余凯先生在推动中国AI发展中的角色,他的发言可能也包含着一种对国内技术发展生态的思考。他可能认为,过于依赖国外的技术框架,不利于长远发展,而支持那些在本土有较强影响力的框架,或者更开放的框架,能够更好地服务于国内的产业和科研需求。

4. 这种观点的局限性和讨论空间

当然,任何技术选型都不是绝对的“好”或“坏”,而是在特定场景下的权衡。余凯先生的观点,虽然基于其丰富的经验和深刻的思考,也可能存在一些局限性:

TensorFlow的持续进化: TensorFlow 2.x 已经大幅改进了易用性和灵活性,通过Eager Execution的默认支持,使得开发和调试体验得到了显著提升。TensorFlow Lite和TensorFlow.js等项目也展示了其在跨平台部署上的强大能力。
生态系统的选择: 很多开发者选择框架不仅看技术本身,还看其配套的工具、库、社区支持、以及与现有业务系统的集成度。TensorFlow拥有非常丰富的生态系统和大量的预训练模型,这对于许多项目而言是难以割舍的优势。
PyTorch的崛起: 近年来,PyTorch凭借其Pythonic的设计和动态图的优势,在学术界和工业界都获得了巨大的成功,甚至在很多方面已经超越了TensorFlow。余凯先生在朋友圈的发言并未直接提及PyTorch,这可能是因为他更侧重于提供一个与TensorFlow不同的选项,或者他认为PyTorch本身在某些方面也存在类似(或不同)的考量。
“避免”的绝对性: 在技术领域,很少有绝对的“应该”和“不应该”。很多时候是“更适合”和“不那么适合”。将某个主流框架完全“避免”,可能过于绝对,也可能忽略了其在特定领域或特定任务上的不可替代性。

总结来看:

余凯先生在朋友圈发表的呼吁,可以理解为他基于自己对深度学习技术发展、生态演进以及中国AI产业自主化的一系列思考和观察,而进行的一次有深度的观点分享。他并非否定TensorFlow的价值,而是在强调在技术选型时,应该保持开放的视野,审慎评估包括Caffe、MXNet在内的其他优秀框架,并根据项目实际需求、长远发展以及对本土生态的贡献等因素,做出最适合的选择。

这种观点在技术圈中具有启发性,能够引发大家对框架选择的更深入思考,而不是被单一主流所裹挟。同时,我们也需要认识到技术选择的复杂性,以及不同框架各自的优势和局限性,并在实际工作中进行具体分析和判断。

网友意见

user avatar

评价一段话首先要看说话的人,说话的对象,以及当时的背景。余凯发的那段话是在朋友圈发的,所以听众也主要是各大厂商,在这个背景下我觉得那段话是有道理的;但如果放到微博上,那就有阴谋论和小人之心的嫌疑了。

先说为什么大厂会怕TensorFlow垄断。首先TensorFlow是Google搞的,所以即使开源了,Google在这个开源社区也必然是决定性的力量,这个大家应该没有疑问吧。我们先假设TensorFlow已经垄断了DNN的框架,其它的框架都死的差不多了。那么:

1. 假设有一天Google为了卖它的TPU,决定渐渐放弃GPU支持,你说nVidia会不会慌?

2. 假设Google说要把放弃x86和Xeon Phi支持,你说Intel慌不慌?

3. Google拒绝针对以太网(AWS和Windows Azure都是万兆以太网)做任何优化,而且不愿意merge任何与此相关的PR,你说Amazon和Microsoft慌不慌?

4. 假设有一家做TPU(比如寒武纪),或者做无人车的公司,对Google造成了严重威胁,那么他们发的PR,能不能保证得到Google的公正对待?

想清楚以上问题,这段话的道理就清楚了。也许有人会说,这是小人之心。但是,作为一家公司,考虑努力降低这种风险难道不是很正常的吗?所谓的原则和良心,在商业利益面前毛都不是啊,更何况Google完全有能力在规则允许的情况下给其它公司穿小鞋。(比如说,Amazon推了个PR,Google说,我们下个release的feature已经定好了,你这个PR只能等下一个release了,而下一个release什么时候还是Google的人说了算)

我想上面这个说的够清楚了,那么为什么微博上反应这么强烈呢?主要还是受众的原因。对绝大多数用户来说,是用TensorFlow还是用其它任何框架,对他们都没什么区别,只要这个框架足够好用就好了。余凯那段话,如果放微博上,那肯定只有挨喷的份,这个也没有疑问。

最后打个比方吧。我们大家都用微信,却不担心微信垄断,因为我们跟腾讯不会有利益冲突。但是,阿里的人肯定是不允许用微信来聊工作的,因为它跟腾讯有直接的利益冲突。假如阿里想花10亿买一家公司,而员工在微信里聊了这件事,你猜腾讯会不会利用一下这条消息?

-----------------------------------------
EDIT1:

根据大家的反馈,主要的分歧在两方面:1.Google有没有能力做(搞其它公司)。2.Google有没有动力做

关于1,主要是疑问是,在TF已经开源的情况下,Google对TF这个项目有没有控制力,其它公司能不能通过branch来规避这种风险。

对于控制力这件事,我想大家应该没忘记,TF刚开源的时候是“完全”不接受PR的。也就是说,Google完全有权力在任何时候,无需任何理由拒绝任何人的PR。当然,随着开源项目的发展,可能慢慢会有别的人(其它公司的人,或者独立开发者)加入到项目中来。但是我认为项目的管理开发还是会以Google的人为主,毕竟他们是最熟悉这个项目的人。其它公司很难在commitee中取得与Google类似的话语权。这种权力的不对等就非常麻烦了。即使Google不会做的那么明显,比如完全的拒绝某公司的PR,但很多时候完全可以以其它形式来做,比如“你这个PR太复杂了,我们得review 一下”,然后,“review的人休年假了,请耐心等待”。。。

其它公司能否通过branch来规避这种风险呢?初想起来似乎没问题,毕竟只是做点merge嘛。但是其它branch之后,你就是另一个项目了,所有commit到master branch的都不会考虑你这个branch会不会有conflict,你只能自己去拉master branch来merge。随着时间推移,merge的代价会越来越大,甚至有些commit你完全无法做了。更可怕的是,所有的应用都会基于master branch去开发,而应用的数量可比commit大多了。你很难保证跟master branch完全兼容,那就意味着很多应用在你的branch上是跑不起来的。相像一下,你看到一篇新论文,里面的代码是用TF实现的,现在你可以选择用Google云,或者AWS,或者Azure上跑,然后你发现在AWS跟Azure上根本跑不起来,因为他们用的TF都是branch过的。。。

关于2,Google有没有动力去搞一家公司,这个主要看有没有利益冲突。Google工程师可能不喜欢作恶,但现在Google是上市公司,在资本面前,利益才是第一位的。

怎么判断一家公司会不会跟Google有利益冲突呢?一种是看主营业务。Google主营业务是搜索和广告,现在还努力在发力做云计算和人工智能(自动驾驶)。以这些业务为主营业务的公司都是Google的敌人。做云计算:Amazon,Microsoft,IBM;做广告的:Facebook,百度,Bing;做自动驾驶的:Uber,地平线。另一种是看供应链。当供应链中的某一环是垄断运营时,它就会蚕食整条供应链的大部分利润。从这个角度看,所有跟DNN相关的厂商都不希望看到Google一家独大,这其中就包括nVidia, Intel。当然,这种冲突一般没那么剧烈,毕竟不是直接的市场冲突,而且很难有一家完全垄断的场面出现,即使TF真的一统江湖,只要AWS和Microsoft都还活着,就轮不到nVidia和Intel操心。但是不管怎么样,nVidia和Intel肯定更愿意有其它框架能和TF竞争,这样不管怎么样都不会威胁到他们。所以nVidia现在经常给mxnet站台,也是这个原因

user avatar

这件事情感觉很多人还是有误解。俞凯这段话发在朋友圈主要是说给大厂听的,对于小公司和个人来说确实很难理解。


其实美国的大厂从搞硬件的intel,nvidia到搞云的amazon,MS,还有facebook,大家对TF都是拒绝的或者至少是心存芥蒂的。比如facebook在自己造torch和caffe2,nvidia和amazon在扶植mxnet这样的中立项目。除了google以外的大厂都或多或少的在反TF。


这里面原因很多。nvidia主要不爽google对供应商非常强势。g觉得nv就老实做芯片,当个小弟就好了。而nv肯定是不甘心做g的富士康的,人家自己要搞生态。再说g还在搞tpu,指不定那天小弟都当不成了。


MS和Amazon恨的是google内部版的tensorflow和google cloud深度绑定优化,其他的云厂只能跑开源的tensorslow,速度差远了必然毫无竞争力。MS因为内斗严重很难发力,用cntk,torch,tf,mxnet,caffe的都有。但是至少azure组是有危机感的,最近刚发布了预装mxnet。而amazon管理层控制力强,从头开始搞DL推mxnet势头还不错。


google虽然拳头大,但毕竟双拳对四手,想吃掉所有人的蛋糕未免胃口太大。国内的的大厂虽然还没有直接跟google竞争,但还是应该有一些长远的想法的。


从技术层面来说,一个软件很难解决所有应用场景。

TF的定位是ML库(而不只是DL),要做一个大而全的平台吸引最多的用户。但带来的问题就是在最核心的应用上优化不足,速度和内存占用都不是最好的。另外代码量大,抽象层多,导致难以深度自定义。

mxnet的优势是高效小巧,更适合自定义需求高的公司和researcher。如果你需要的功能别人都实现好了,大而全的库用起来必然舒服。但是research的意义就是做别人没做过的事。如果你不只需要加两个op,而是要改框架时,改tf的工程量就会比改caffe和mxnet大的多。

Torch的定位是习惯matlab的researcher和对灵活性要求极高,必须要直接操作每个tensor的人。


总的来说大家都有自己的需求,选package的时候还是需要要冷静和独立思考。TF用的不爽的时候不妨试试别的库,说不定更适合你。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有