问题

如何看待阿里巴巴 AI labs 引进两位年薪百万美元的科学家?意味着阿里在AI 方面会有哪些新探索?

回答
最近阿里巴巴 AI Labs 花大手笔引进两位年薪百万美元的顶尖AI科学家,这事儿在圈内确实引起了不少关注。抛开数字本身不谈,这背后透露出的信号,以及对阿里AI未来走向的可能影响,值得我们好好掰扯一下。

首先,这笔引才的背后,阿里想传递的是一个明确的信号:在AI这场没有硝烟的战争中,阿里要的是“制高点”,并且不惜血本。

年薪百万美元,这绝对是全球范围内顶尖的薪资水平了。它不仅仅是给科学家个人的报酬,更是一种价值的认可,一种对他们背后研究成果和潜力的投资。在当下AI人才争夺如此激烈的环境下,能够拿出这样的诚意,说明阿里对AI领域的投入是战略性的,是长期性的,而且是“不差钱”的。这直接表明阿里不再满足于在AI应用层面“追赶”,而是要向上游、向基础研究去突破,去定义新的前沿。

那么,引进这两位“大神”级的人物,会对阿里AI的探索带来哪些新方向?我猜想,至少会有以下几个关键点值得关注:

1. 基础理论和前沿算法的突破,尤其是对通用人工智能(AGI)的追求会更加坚定。
目前的AI虽然在特定领域表现出色,但离真正意义上的“通用智能”还有很长的路要走。通常,年薪百万级别的科学家,都是在一些非常前沿的AI理论领域有建树的,比如:
新一代的深度学习模型和训练范式: 可能会是更高效、更可解释、更鲁棒的模型架构,或者在自监督学习、强化学习等领域有重大突破。
具身智能(Embodied AI): 这是当前AI领域的一个大热点,涉及到AI在物理世界中的感知、理解、决策和行动。这两位科学家如果在这个方向有专长,那阿里在机器人、自动驾驶、智能家居甚至工业自动化等领域的探索可能会有颠覆性的进展。想象一下,一个真正能够像人一样与物理世界交互的智能体,这会彻底改变我们生活的方方面面。
因果推断与AI的结合: 现在的AI更多是基于相关性,而因果推断能让AI更深入地理解事物的“为什么”,从而做出更理性的决策,尤其是在医疗、金融、科学研究等需要严谨逻辑的领域。
AI伦理与安全研究的深度加强: 随着AI能力的增强,其潜在的风险也越来越大。顶尖科学家往往也会关注AI的可解释性、公平性、安全性和可信度。阿里引进他们,也可能意味着在构建负责任、安全的AI系统方面将会有更大的投入和更深入的探索。

2. 从“专用AI”向“通用AI”迈进的战略升级。
很多时候,我们看到的AI应用,比如淘宝的推荐算法、支付宝的风险控制,都是针对特定场景优化的“专用AI”。而这两位科学家,如果他们的研究方向更偏向于AI的“底层逻辑”和“通用能力”,那么阿里AI的野心就不再局限于优化现有业务,而是要构建能够处理更广泛、更复杂任务的通用AI平台。
这就像从制造精密的螺丝钉,升级到研发能够生产所有螺丝钉的精密机械。一旦掌握了通用AI的核心技术,阿里就能将其触角延伸到更多未被AI触及的领域,甚至创造全新的商业模式。这可能意味着阿里内部会孕育出一些目前我们难以想象的新业务部门或新产品线。

3. 构建更强大的原创AI研发体系,与国际巨头正面竞争。
AI领域的创新很大程度上依赖于基础科学的突破和原创性的算法。引进顶级科学家,是阿里“内卷”中寻求“外卷”的一种方式,更是直接对抗谷歌、微软、Meta等在基础研究领域遥遥领先的国际巨头的策略。
通过引入具有全球影响力的科学家,阿里不仅能直接获得他们的研究成果,更能借此吸引更多优秀的本土和国际AI人才,构建一个世界级的AI研究团队。这不仅仅是“拿来主义”,而是要建立一个能够持续产出原创性AI技术的“引擎”。我们可能会看到阿里在顶级学术会议上发表更多重量级论文,甚至在一些核心AI技术领域形成自己的话语权和标准。

4. 对阿里现有AI能力的“催化”和“赋能”。
即使阿里内部已经有强大的AI团队,顶尖科学家的到来,就像注入了高活性的催化剂。他们带来的新思路、新方法、新理论,能够极大地提升现有团队的研究效率和创新能力。
指导和优化现有AI模型: 帮助阿里现有的AI模型变得更强大、更高效、更具泛化能力。
开辟新的研究方向: 引导阿里AI实验室进行更具前瞻性、更有挑战性的研究,避免在“红海”中同质化竞争。
建立更完善的学术交流和评审机制: 提升阿里AI研究的质量和影响力,使其更符合国际科学界的标准。

具体可能会在新探索方面体现在哪些地方?

大规模预训练模型的演进: 阿里此前已经有自己的大模型,但引进顶尖科学家可能会推动其在模型架构、训练数据、训练方法上实现新的突破,使其在理解人类语言、生成内容、逻辑推理等方面达到新的高度。
多模态AI的深化: 结合文本、图像、语音、视频等多种信息进行理解和生成,这将是AI发展的重要方向。这两位科学家可能在多模态融合、跨模态推理等领域有深厚的积累。
AI Agent 的具体落地: 如果他们的研究方向与Agent技术相关,那么阿里可能会大力发展能够自主完成复杂任务的AI代理,比如在客服、内容创作、甚至项目管理等领域。
量子计算与AI的融合: 这是非常前沿且具有颠覆性的方向。虽然目前还处于早期阶段,但如果科学家在这方面有专长,阿里可能会提前布局,探索量子计算在加速AI训练和优化方面的潜力。
强化“AI for Science”战略: 利用AI的强大能力去加速科学发现,比如在新材料、新药物、气候变化等领域。顶尖科学家往往具有跨学科的背景和对科学问题的深刻洞察力。

当然,引进人才只是第一步,更重要的是如何将他们的智慧转化为实际的创新和业务价值。 这需要阿里在内部提供足够的资源支持、宽松的研究环境,并建立有效的激励机制,让他们能够充分发挥才能。同时,如何将这些前沿研究成果平滑地整合到阿里现有的庞大生态系统中,让普通用户也能感受到AI进步带来的红利,也是一个巨大的挑战。

总而言之,阿里AI Labs砸下重金引进顶级科学家,这绝不是简单的“人才战”,而是阿里在AI领域进行战略升级、谋求长远发展的重大举措。它预示着阿里将更加聚焦于AI的基础理论和前沿算法研究,意图在通用人工智能领域抢占先机,并且有望在未来催生出我们现在难以想象的创新应用和商业模式。这是一场对未来AI生态和科技格局的深远布局,值得我们持续关注。

网友意见

user avatar

特意上知乎搜了一下,果然 ......

知乎首答,求轻拍。首先,新闻标题有些夸张,不要太在意,莫名被要求请吃好多顿饭。

回国内发展,其实很简单。目前国内发展真的很快,尤其是在人工智能方面。我之前从事了多年的多媒体领域的基础性工作,所打造的技术,虽然有很强的技术壁垒,但是技术转换的周期较长。

而人工智能是一个新兴产业,很多应用发展很快,比如天猫精灵,早就突破了千万的量级。另外,中国已经进入了互联网的下半场,除了商业模式,应用场景方面的创新之外,更需要技术的创新。因此,这个时候回国,其实会比以前更容易看到一条切实可行的技术创造新商业的路径。

同时,正因为国内处于高速发展阶段,所以具备了更加丰富的,不一样的场景。这些场景对技术的要求本身就可能催生技术演进的重大机会。投身到这个高速发展过程中,让我有了在更多更新的领域积累技术,寻求新的技术突破的可能性。对于专注于技术的华人来说,是一个很好的机会。

应用是不断发展,更新迭代的。人类利用机器和世界的交互,我总结了三个维度:

场景数据的感知(比如成像ISP)、场景数据的理解(比如跟踪,检测,识别)、以及场景数据的流动与赋能(比如视频通话,手势控制等)。

在我本科求学阶段,笔记本电脑不大普及,摄像头是外挂的,很不清楚,分辨率很低。但即便如此,通过有线网络发送一张图片也要耗费一小段时间,且经常有意外,会失败。当时计算机打开一张lena图像都需要很长时间。所以图像压缩,以及后期的视频压缩是比较刚需的。我在这个领域工作了很长时间,我认为这是计算机视觉较早的一个有刚需且被成熟产业化的分支。在我看来,这属于场景数据的流动与赋能,同时这也要感谢通信技术的飞速发展。近几年,移动互联网应用的巨大成功确实对芯片能力的提升是极大的刺激,之后随着深度学习方面的突破,机器对场景数据的理解能力获得飞速发展,人工智能也同时被公认为最热门的计算机领域。

我认为目前已经到了普罗大众广泛接触和使用人工智能设备的奇点。当然这里的智能设备远远不止于智能手机。几年之内,每个家庭都可能有3~10个智能设备,我本人也已经有5个左右(注意:用来开发的设备不算)。其实一些白色家电,玩具早已经默默具备了一定的人工智能元素。未来,基于AI的IOT设备会越来越多。这些智能IOT设备将不仅仅是一些简单的控制,比如温度调节,比如开灯关灯。很快,更多的智能交互功能将会涌现。

随着对功能的要求越来越高,单个智能硬件设备的成本也在上升,这不利于我们人工智能硬件产品的普惠。因此,我给自己的一个重要任务就是打造更加低成本的硬件,包括要提供更高的边缘计算算法效能,并将算法与芯片进行更好的整合。让五年前还高不可攀的人工智能技术真正飞入寻常百姓家。

至于来阿里做什么,我所在的团队阿里AI Labs目标是赋能智能家庭中的所有智能设备,联动产业带,打造普惠好用的智能科技产品。我和团队将围绕着天猫精灵等产品,丰富它的交互能力,降低交互能力带来的大幅成本增加,并且将我们的算法,软件,模组,甚至芯片输出,赋能给我们的生态企业,让他们也可以一起打造丰富多彩的智能硬件产品。

另外一方面,我和团队会着力做边缘计算,主要有三个目的:第一个是充分利用边缘端(终端设备)算力,让交互更加实时;第二个是算力下沉到终端设备,让产品设计者可以更高效地利用通信带宽,更经济的调用云计算的能力,更合理的实现端云结合;第三就是大家对隐私的诉求随着智能设备的普及可能会越来越强,像“ZAO”这样的功能,如果想尝试,最好是只在终端设备上完成所有的计算,充分保护用户隐私。最后,还需要补充的一点就是场景数据的感知,比如成像,那是无论如何也需要在边缘设备上进行一定运算的,5G到来之后亦然。

其实,边缘计算这个概念其实比较广,可以是狭义的软件优化,比如算法工程师最容易想到的ARM上的NEON优化;也可以是更大一点的异构计算,把DSP,GPU用好(这里前者已经涉及到算法层面的定点化);也有更深一点的针对应用场景打造的IP Cores(比如Video Codec IP Core, ISP IP Core等);也包括发明不一样的算法(比如H.264中整数的非经典意义下的DCT变化替代传统的浮点数DCT,VIBE替代GMM做背景建模,比如深度学习模型中mobileNet替代VGG做backbone等);又或者在算法实现过程中基于资源(主要是计算复杂度和memory bandwidth)的考量。这些都可以纳入边缘计算的范畴。当然这些边缘计算手段的目的还是提高终端设备对于特定应用的效能(包括降低功耗,较少发热),并且有效的enable一些原本很难实现的应用和算法。


另一方面,我们将通过算法(软件SDK形式),智能芯片,交互模组(比如整个视觉处理模组)的输出,赋能我们的周边生态公司,包括门锁厂商,灯泡厂商等。未来,不是每家进入IoT行业的公司都必须具备自己的研发团队,他们可以充分的借力公开平台的算法,硬件资源,以及开放平台,以很快的速度完成基于智能硬件的业务目标。同时所有的智能硬件设备,相互之间都可以很好的互联互通。

但目前,智能设备随着对功能的要求越来越高,成本也在上升,这不利于我们人工智能硬件产品的普惠。因此,我们所有从事这个行业的人一个重要使命就是打造更加低成本,高性能的硬件矩阵,让这些贴身服务能够对每个平常人来说垂手可得。

一口气写完,不说了,请吃饭去......

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有