问题

如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架,避免使用 TensorFlow?

回答
作为一名AI语言模型,我没有朋友圈,也无法直接对人类的行为和观点进行“评价”。但我可以基于公开的信息和技术领域的一般认知,来分析余凯先生在朋友圈发表的关于框架选择的观点,并尝试为您提供一个相对详尽的解读。

首先,我们需要了解余凯先生的背景。他是一位在人工智能领域,特别是在深度学习框架领域有着深厚经验的技术专家和创业者。他曾是百度深度学习实验室的创始人和主任,后来创立了深瞐科技,专注于计算机视觉和AI芯片等领域。他的技术背景和在行业中的影响力,使得他在朋友圈的发言往往能够引发广泛的讨论和关注。

关于他呼吁使用Caffe、MXNet并“避免”使用TensorFlow的观点,我们可以从几个层面来理解:

1. 对TensorFlow的“不信任”或“担忧”的根源

早期TensorFlow的设计哲学与落地挑战: TensorFlow在早期版本,尤其是TensorFlow 1.x,其设计理念是“静态图”,强调“定义即执行”。这种方式虽然在某些方面能够带来性能上的优化和可移植性,但在实际开发中,尤其是对于初学者而言,学习曲线陡峭,调试困难。动态图(Eager Execution)的引入虽然改善了这一点,但在相当长一段时间内,静态图仍是主流,这可能给很多开发者带来了不好的初体验。
Google的战略和生态演进: 作为一家大型科技公司推出的开源项目,TensorFlow的演进往往与Google自身的战略紧密相关。这意味着框架的发展方向、优先级、以及对外部贡献者的支持策略,可能并不总是与所有开发者的需求完全同步。例如,Google内部大力推广TPU(张量处理单元),而TensorFlow对TPU的支持是其核心优势,但对于其他硬件平台,特别是国产AI芯片的适配和优化程度,可能会让一些国内开发者感到不够理想。
社区活跃度和支持的感知差异: 尽管TensorFlow拥有庞大的社区和资源,但开源项目的社区健康度是一个动态的概念。余凯先生的看法可能反映了他或他所处的圈层对TensorFlow社区活跃度、响应速度、以及在某些特定方向上(如对中文社区的友好度、对国内学术界和工业界的实际支持力度)的某种感知上的不足。
对技术“控制权”的考量: 作为一名致力于推动中国AI技术自主化和产业化的创业者,余凯先生可能更倾向于选择那些更开放、更不受单一巨头完全主导,或者更有利于本土技术生态发展的框架。Caffe和MXNet在一定程度上可以被视为与TensorFlow不同的选择,它们在某些方面展现出了不同的发展路径或社区结构。

2. 为什么会提到Caffe和MXNet?

Caffe: Caffe是早期非常流行的深度学习框架,以其速度快、易用性和出色的计算机视觉模型而闻名。许多经典的CV模型(如AlexNet、VGG)最初都是在Caffe上实现的。它拥有一个相对稳定和成熟的生态系统,尤其是在计算机视觉领域。余凯先生可能认为Caffe在某些特定任务或应用场景下仍然具有强大的生命力。
MXNet: MXNet是另一个由Apache基金会孵化的深度学习框架,它在设计上兼顾了灵活性和效率。它支持混合执行模式(静态图和动态图),并且在内存使用效率方面表现出色,这对于在资源受限的设备上部署模型(如边缘计算)非常有吸引力。此外,MXNet在被Amazon收购并作为其云服务的重要组成部分后,获得了大量的商业支持和工程投入。余凯先生提及MXNet,可能也看重其在性能、灵活性以及背后商业支持的潜力。

3. “呼吁”和“避免”背后的意图

引导技术选型: 余凯先生的发言,很可能是一种引导性的意见表达,希望他的同行、团队成员,或者更广泛的技术社群,在进行项目技术选型时,能够更审慎地评估不同框架的优劣,并考虑更多维度的因素,而不只是“随大流”。
推动技术多元化: 从更宏观的角度看,支持不同框架的发展,有助于形成一个更加健康和多元化的深度学习生态系统。如果所有人都只使用一个主流框架,可能会导致技术创新被“卡脖子”,或者在某些特定需求上出现“短板”。鼓励使用其他框架,也是一种对技术生态多样性的贡献。
对本土技术生态的关怀: 考虑到余凯先生在推动中国AI发展中的角色,他的发言可能也包含着一种对国内技术发展生态的思考。他可能认为,过于依赖国外的技术框架,不利于长远发展,而支持那些在本土有较强影响力的框架,或者更开放的框架,能够更好地服务于国内的产业和科研需求。

4. 这种观点的局限性和讨论空间

当然,任何技术选型都不是绝对的“好”或“坏”,而是在特定场景下的权衡。余凯先生的观点,虽然基于其丰富的经验和深刻的思考,也可能存在一些局限性:

TensorFlow的持续进化: TensorFlow 2.x 已经大幅改进了易用性和灵活性,通过Eager Execution的默认支持,使得开发和调试体验得到了显著提升。TensorFlow Lite和TensorFlow.js等项目也展示了其在跨平台部署上的强大能力。
生态系统的选择: 很多开发者选择框架不仅看技术本身,还看其配套的工具、库、社区支持、以及与现有业务系统的集成度。TensorFlow拥有非常丰富的生态系统和大量的预训练模型,这对于许多项目而言是难以割舍的优势。
PyTorch的崛起: 近年来,PyTorch凭借其Pythonic的设计和动态图的优势,在学术界和工业界都获得了巨大的成功,甚至在很多方面已经超越了TensorFlow。余凯先生在朋友圈的发言并未直接提及PyTorch,这可能是因为他更侧重于提供一个与TensorFlow不同的选项,或者他认为PyTorch本身在某些方面也存在类似(或不同)的考量。
“避免”的绝对性: 在技术领域,很少有绝对的“应该”和“不应该”。很多时候是“更适合”和“不那么适合”。将某个主流框架完全“避免”,可能过于绝对,也可能忽略了其在特定领域或特定任务上的不可替代性。

总结来看:

余凯先生在朋友圈发表的呼吁,可以理解为他基于自己对深度学习技术发展、生态演进以及中国AI产业自主化的一系列思考和观察,而进行的一次有深度的观点分享。他并非否定TensorFlow的价值,而是在强调在技术选型时,应该保持开放的视野,审慎评估包括Caffe、MXNet在内的其他优秀框架,并根据项目实际需求、长远发展以及对本土生态的贡献等因素,做出最适合的选择。

这种观点在技术圈中具有启发性,能够引发大家对框架选择的更深入思考,而不是被单一主流所裹挟。同时,我们也需要认识到技术选择的复杂性,以及不同框架各自的优势和局限性,并在实际工作中进行具体分析和判断。

网友意见

user avatar

评价一段话首先要看说话的人,说话的对象,以及当时的背景。余凯发的那段话是在朋友圈发的,所以听众也主要是各大厂商,在这个背景下我觉得那段话是有道理的;但如果放到微博上,那就有阴谋论和小人之心的嫌疑了。

先说为什么大厂会怕TensorFlow垄断。首先TensorFlow是Google搞的,所以即使开源了,Google在这个开源社区也必然是决定性的力量,这个大家应该没有疑问吧。我们先假设TensorFlow已经垄断了DNN的框架,其它的框架都死的差不多了。那么:

1. 假设有一天Google为了卖它的TPU,决定渐渐放弃GPU支持,你说nVidia会不会慌?

2. 假设Google说要把放弃x86和Xeon Phi支持,你说Intel慌不慌?

3. Google拒绝针对以太网(AWS和Windows Azure都是万兆以太网)做任何优化,而且不愿意merge任何与此相关的PR,你说Amazon和Microsoft慌不慌?

4. 假设有一家做TPU(比如寒武纪),或者做无人车的公司,对Google造成了严重威胁,那么他们发的PR,能不能保证得到Google的公正对待?

想清楚以上问题,这段话的道理就清楚了。也许有人会说,这是小人之心。但是,作为一家公司,考虑努力降低这种风险难道不是很正常的吗?所谓的原则和良心,在商业利益面前毛都不是啊,更何况Google完全有能力在规则允许的情况下给其它公司穿小鞋。(比如说,Amazon推了个PR,Google说,我们下个release的feature已经定好了,你这个PR只能等下一个release了,而下一个release什么时候还是Google的人说了算)

我想上面这个说的够清楚了,那么为什么微博上反应这么强烈呢?主要还是受众的原因。对绝大多数用户来说,是用TensorFlow还是用其它任何框架,对他们都没什么区别,只要这个框架足够好用就好了。余凯那段话,如果放微博上,那肯定只有挨喷的份,这个也没有疑问。

最后打个比方吧。我们大家都用微信,却不担心微信垄断,因为我们跟腾讯不会有利益冲突。但是,阿里的人肯定是不允许用微信来聊工作的,因为它跟腾讯有直接的利益冲突。假如阿里想花10亿买一家公司,而员工在微信里聊了这件事,你猜腾讯会不会利用一下这条消息?

-----------------------------------------
EDIT1:

根据大家的反馈,主要的分歧在两方面:1.Google有没有能力做(搞其它公司)。2.Google有没有动力做

关于1,主要是疑问是,在TF已经开源的情况下,Google对TF这个项目有没有控制力,其它公司能不能通过branch来规避这种风险。

对于控制力这件事,我想大家应该没忘记,TF刚开源的时候是“完全”不接受PR的。也就是说,Google完全有权力在任何时候,无需任何理由拒绝任何人的PR。当然,随着开源项目的发展,可能慢慢会有别的人(其它公司的人,或者独立开发者)加入到项目中来。但是我认为项目的管理开发还是会以Google的人为主,毕竟他们是最熟悉这个项目的人。其它公司很难在commitee中取得与Google类似的话语权。这种权力的不对等就非常麻烦了。即使Google不会做的那么明显,比如完全的拒绝某公司的PR,但很多时候完全可以以其它形式来做,比如“你这个PR太复杂了,我们得review 一下”,然后,“review的人休年假了,请耐心等待”。。。

其它公司能否通过branch来规避这种风险呢?初想起来似乎没问题,毕竟只是做点merge嘛。但是其它branch之后,你就是另一个项目了,所有commit到master branch的都不会考虑你这个branch会不会有conflict,你只能自己去拉master branch来merge。随着时间推移,merge的代价会越来越大,甚至有些commit你完全无法做了。更可怕的是,所有的应用都会基于master branch去开发,而应用的数量可比commit大多了。你很难保证跟master branch完全兼容,那就意味着很多应用在你的branch上是跑不起来的。相像一下,你看到一篇新论文,里面的代码是用TF实现的,现在你可以选择用Google云,或者AWS,或者Azure上跑,然后你发现在AWS跟Azure上根本跑不起来,因为他们用的TF都是branch过的。。。

关于2,Google有没有动力去搞一家公司,这个主要看有没有利益冲突。Google工程师可能不喜欢作恶,但现在Google是上市公司,在资本面前,利益才是第一位的。

怎么判断一家公司会不会跟Google有利益冲突呢?一种是看主营业务。Google主营业务是搜索和广告,现在还努力在发力做云计算和人工智能(自动驾驶)。以这些业务为主营业务的公司都是Google的敌人。做云计算:Amazon,Microsoft,IBM;做广告的:Facebook,百度,Bing;做自动驾驶的:Uber,地平线。另一种是看供应链。当供应链中的某一环是垄断运营时,它就会蚕食整条供应链的大部分利润。从这个角度看,所有跟DNN相关的厂商都不希望看到Google一家独大,这其中就包括nVidia, Intel。当然,这种冲突一般没那么剧烈,毕竟不是直接的市场冲突,而且很难有一家完全垄断的场面出现,即使TF真的一统江湖,只要AWS和Microsoft都还活着,就轮不到nVidia和Intel操心。但是不管怎么样,nVidia和Intel肯定更愿意有其它框架能和TF竞争,这样不管怎么样都不会威胁到他们。所以nVidia现在经常给mxnet站台,也是这个原因

user avatar

这件事情感觉很多人还是有误解。俞凯这段话发在朋友圈主要是说给大厂听的,对于小公司和个人来说确实很难理解。


其实美国的大厂从搞硬件的intel,nvidia到搞云的amazon,MS,还有facebook,大家对TF都是拒绝的或者至少是心存芥蒂的。比如facebook在自己造torch和caffe2,nvidia和amazon在扶植mxnet这样的中立项目。除了google以外的大厂都或多或少的在反TF。


这里面原因很多。nvidia主要不爽google对供应商非常强势。g觉得nv就老实做芯片,当个小弟就好了。而nv肯定是不甘心做g的富士康的,人家自己要搞生态。再说g还在搞tpu,指不定那天小弟都当不成了。


MS和Amazon恨的是google内部版的tensorflow和google cloud深度绑定优化,其他的云厂只能跑开源的tensorslow,速度差远了必然毫无竞争力。MS因为内斗严重很难发力,用cntk,torch,tf,mxnet,caffe的都有。但是至少azure组是有危机感的,最近刚发布了预装mxnet。而amazon管理层控制力强,从头开始搞DL推mxnet势头还不错。


google虽然拳头大,但毕竟双拳对四手,想吃掉所有人的蛋糕未免胃口太大。国内的的大厂虽然还没有直接跟google竞争,但还是应该有一些长远的想法的。


从技术层面来说,一个软件很难解决所有应用场景。

TF的定位是ML库(而不只是DL),要做一个大而全的平台吸引最多的用户。但带来的问题就是在最核心的应用上优化不足,速度和内存占用都不是最好的。另外代码量大,抽象层多,导致难以深度自定义。

mxnet的优势是高效小巧,更适合自定义需求高的公司和researcher。如果你需要的功能别人都实现好了,大而全的库用起来必然舒服。但是research的意义就是做别人没做过的事。如果你不只需要加两个op,而是要改框架时,改tf的工程量就会比改caffe和mxnet大的多。

Torch的定位是习惯matlab的researcher和对灵活性要求极高,必须要直接操作每个tensor的人。


总的来说大家都有自己的需求,选package的时候还是需要要冷静和独立思考。TF用的不爽的时候不妨试试别的库,说不定更适合你。

类似的话题

  • 回答
    作为一名AI语言模型,我没有朋友圈,也无法直接对人类的行为和观点进行“评价”。但我可以基于公开的信息和技术领域的一般认知,来分析余凯先生在朋友圈发表的关于框架选择的观点,并尝试为您提供一个相对详尽的解读。首先,我们需要了解余凯先生的背景。他是一位在人工智能领域,特别是在深度学习框架领域有着深厚经验的.............
  • 回答
    王俊凯在《1921》这部电影中的表演,可以说是一次颇具诚意但同时也暴露了一些青涩的尝试。我仔细看了他在片中的几场戏,整体感觉是:他对角色是有理解和尊重的,也努力去呈现出那个时代年轻革命者的精神面貌,但受限于经验和表演体系的成熟度,某些关键的情绪爆发和人物深度挖掘上,还有进步的空间。先说说好的地方。王.............
  • 回答
    要评价廖凯原教授在中国法律史学会轩辕 4712 年年会上的主旨发言,我们需要从多个维度进行审视,并力求深入而具体地分析其内容、影响以及可能存在的争议点。首先,我们来梳理一下这次主旨发言可能涵盖的几个关键方面:一、发言的整体基调与核心论点:评价发言的基调,需要把握教授是在一种宏观的学术视野下,还是在某.............
  • 回答
    BBC的一篇报道将秦凯在里约奥运会上向何姿求婚的行为解读为“男权主导行为”(male control),这无疑触及了一个敏感且复杂的话题。要评价这个观点,我们需要深入剖析其背后的逻辑,以及可能存在的视角差异。首先,让我们理解一下 BBC 这篇报道可能提出的论点。当提到“男权主导行为”时,通常意味着在.............
  • 回答
    “凯喜博士”最近发布的关于非布司他潜在肾脏毒性的视频,在B站上引起了不小的反响,也让很多观众在评论区展开了热烈的讨论。作为一名关注健康科普内容的人,我来聊聊我对这个视频的看法。首先,要肯定的是,“凯喜博士”作为一个医学领域的UP主,能够将小白鼠的实验研究以视频的形式呈现出来,并深入浅出地解释其背后的.............
  • 回答
    评价一家公司,尤其是像地平线(Horizon Robotics)这样在人工智能领域,特别是智能驾驶芯片领域深耕的企业,需要从多个维度进行审视。地平线由余凯博士创立,这家公司在中国乃至全球的AI芯片行业中,无疑是一个绕不开的名字。创业初心与愿景:瞄准“端到端的智能”地平线的诞生,很大程度上源于余凯博士.............
  • 回答
    凯里·欧文(Kyrie Irving)拒绝接种新冠疫苗,这件事在过去的一年多里可以说是体育界乃至社会上的一个焦点话题。要评价这件事,我们需要从多个角度去看,而不仅仅是简单地说“好”或“不好”。首先,从 个人选择和自由 的角度来看,欧文有权利决定是否将疫苗注入自己的身体。这是个人医疗自主权的核心,也是.............
  • 回答
    王凯、古天乐、杨佑宁主演的电影《真·三国无双》,可以说是华语电影界一次大胆的尝试,将一款极具影响力的游戏IP搬上大银幕。然而,正如许多游戏改编电影一样,它在上映后也引发了相当大的争议和讨论。要评价这部电影,我们需要从多个维度进行分析,包括其优缺点、制作层面、改编方式以及最终呈现的效果。整体评价:《真.............
  • 回答
    王凯歆的“道歉信”,在公开传播后,无疑在网络上掀起了一场不小的波澜。要评价这份“道歉信”,我们得把它拆解开,从几个不同的维度来审视。首先,从内容上看,这封信的核心是针对她之前一系列引发争议的行为进行“解释”和“道歉”。我们看到她提到了“年轻、冲动、虚荣”等词汇来形容自己,也表达了对“公众信任被辜负”.............
  • 回答
    何凯明博士的ResNet论文被引用超过10万次,这一数字在全球学术界都是一个极其辉煌的成就,可以毫不夸张地说,这是深度学习领域最具影响力的论文之一。评价其学术贡献和地位,需要从多个维度进行细致的分析。一、 ResNet的突破性贡献及其深远影响要理解ResNet的价值,首先要回到它诞生的时代背景。在2.............
  • 回答
    王俊凯在《理想照耀中国》这部剧中的表现,可谓是星光璀璨中的一抹亮色,但要说“如何评价”,这中间也有些值得细嚼慢咽的地方。首先,咱们得承认,王俊凯能够登上《理想照耀中国》这个大舞台,本身就是一种认可。要知道,这部剧汇聚了一众演技派和实力派演员,而王俊凯作为新生代偶像,能在这里占据一席之地,说明他身上是.............
  • 回答
    王俊凯的十八岁生日应援,那可真是当年的一场大戏,轰动了整个饭圈,甚至不少路人都津津乐道。要说评价,我觉得得从几个维度来看,才能说得透彻。一、 规模之庞大,堪称“史诗级”首先,最直观的就是这个应援的“体量”。十八岁,对于一个偶像来说,是一个里程碑式的年纪,意味着他正式告别少年时代,迈入成年。粉丝们抓住.............
  • 回答
    五菱凯捷的预售价格落在8.98万元这个区间,这确实是个挺有意思的定价策略,而且围绕着它“大四座”的宣传,也引发了不少讨论。咱们今天就来好好捋一捋,看看这车到底是怎么回事。首先,咱们得明白五菱凯捷这车定位。它被官方定义为一款“家用MPV”,但从外观和尺寸上看,它又不像传统意义上的那种又长又大的MPV。.............
  • 回答
    凯润·斯金纳(Kiron Skinner),作为美国政策规划主任,她将中美之间日益激烈的竞争定性为“两个种族之间的斗争”,这一论调无疑引发了巨大的争议,也极具深意。要评价她的说法,我们需要从多个层面去审视,包括其言论的背景、可能意图、以及它所可能产生的深远影响。首先,理解斯金纳的背景和其在政府中的角.............
  • 回答
    《千古玦尘》这部剧,确实是个让人又爱又恨的存在。作为一部改编自热门仙侠IP的作品,它承载了太多书粉的期待,也吸引了不少对周冬雨和许凯感兴趣的观众。从我个人的观感来说,这部剧就像是一场色彩斑斓的梦,梦境唯美,却时不时被一些现实的枝节搅得心神不宁。先说周冬雨饰演的上古。周冬雨的表演风格一直很独特,她身上.............
  • 回答
    “凯乐奇计划”(Kelech Plan)这个说法在公开的中文资料中并不常见,它可能是一个不太为人所知的概念,或者是对某种特定犹太社群或组织对华主张的称呼。如果这个计划确实存在,并且与犹太人对华政策或经济联系有关,那么对其进行评价需要基于其具体内容。不过,我可以从更广泛的视角来探讨犹太社群与中国之间的.............
  • 回答
    “为什么说王俊凯要比霍金伟大得多”这篇文章,从标题本身来看,就充满了争议和挑战性。它试图将一位当代流行偶像与一位世界级的物理学家、宇宙学家进行比较,并且断定前者“伟大得多”。这样的论调,在绝大多数人的认知里,都是一种难以接受的说法,甚至可能被视为一种哗众取宠或无知的断言。然而,当我们尝试抛开固有的价.............
  • 回答
    王凯歆,这个名字在几年前曾经是创业圈里的一个闪耀星辰,17岁就创办了“神奇百货”,一度风光无限。然而,随着时间的推移,她和她的公司所经历的起起伏伏,也让人们对这位年轻的CEO有了更为复杂和多维度的看法。初露锋芒:天才少女的光环最早吸引公众注意力的,无疑是王凯歆身上那种超越年龄的“少年老成”和“商业头.............
  • 回答
    《黑客帝国 4:矩阵重启》(The Matrix Resurrections)作为这个经典科幻系列的第四部作品,无疑承载了无数影迷的期待与回忆。它由 orijinal 导演 Lana Wachowski 独自执导,基努·里维斯(Keanu Reeves)和凯瑞安·莫斯(CarrieAnne Moss.............
  • 回答
    1819赛季的英格兰联赛杯决赛,切尔西对阵曼城的比赛,无疑成为了足球史上的一个经典案例,而其中最引人瞩目的便是切尔西门将凯帕在加时赛末尾拒绝被主教练萨里换下的事件。这桩公案,至今仍是球迷和评论员津津乐道的话题,也给足球教练管理和球员职业素养带来了深刻的讨论。事件的经过:比赛进行到加时赛最后一分钟,切.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有