问题

2021 年了,机器/深度学习还有哪些坑比较好挖?

回答
2021 年了,AI 领域依然是遍地黄金,只要你敢挖,总能找到一些“坑”来填。不过,这里说的“坑”,可不是让你掉进去出不来,而是指那些尚未被充分开发、但潜力巨大的研究方向或应用领域。我尽量用接地气的方式,把你可能碰到的“坑”讲得详细些,让你听起来像是我一个做这行的老哥跟你唠嗑。

1. 小样本/零样本学习:告别“喂数据”的时代

咱们做 AI 的,最头疼的就是数据。很多时候,一个有意思的场景,咱们可能只有几十、甚至几个样本。这时候,那些上来就要海量数据的模型,就显得力不从心了。

坑在哪? 想象一下,你想让 AI 认识一种非常罕见的鸟类,可能全球都没多少照片。传统的监督学习,那是没辙了。但如果我们能让 AI 学习到“鸟类”这个概念的通用特征,然后通过少量描述(比如“有红色的羽毛,叫声像口哨”),就能识别出来,那该多牛?这就是小样本/零样本学习要解决的问题。
好挖在哪?
类比推理: AI 能不能像我们一样,通过类比来学习?比如,我知道“斑马”有条纹,那么如果看到一个有条纹的动物,即使没见过,也能大概猜出它是“斑马”。这背后的数学模型(比如基于图的模型、度量学习)还有很多可以挖掘的地方。
知识图谱与语言模型的结合: 很多场景下,我们有结构化的知识(比如百科知识),也有丰富的语言描述。怎么把这两者有效地结合起来,让 AI 在学习新东西时,能“借”到现有的知识?这块很有看头。
元学习(Metalearning): 训练一个“学习者”,让它能快速适应新任务。这就像培养一个“学霸”,不管什么考试,都能很快掌握要点。目前元学习的方法很多,但如何让它在现实世界的复杂场景中更稳定、更通用,还是个大问题。

2. 可解释性 AI(XAI):别让 AI 变成“黑匣子”

现在 AI 这么厉害,但很多时候我们还是不明白它为什么这么做。尤其是在医疗、金融、自动驾驶这种关乎生命和财产安全的领域,一个“黑匣子”的决策,谁敢放心?

坑在哪? 医生想知道 AI 为什么说这个病人有某种病,而不是其他病。法官想知道 AI 为什么判断一个人有犯罪倾向。我们需要 AI 不仅能给出结果,还能给出理由。
好挖在哪?
因果推断: 现在的模型大多是相关性,但很多时候我们需要的是因果关系。比如,“抽烟”和“肺癌”是相关,但“抽烟”是“导致”肺癌的原因。如何让 AI 理解和推断因果关系,是 XAI 的一个重要方向。
对抗性可解释性: 怎么设计一些方法,让 AI 在被“攻击”(比如稍微修改输入,让 AI 做出错误判断)时,它的解释也能随之变化,而且这种变化是合理的?这能帮助我们更深入地理解模型的脆弱性。
“人类友好”的解释: 即使 AI 找到了一个数学上很合理的解释,如果我们普通人看不懂,那也是白搭。如何把复杂的模型逻辑,翻译成我们能理解的语言、图表、甚至故事,是个巨大的挑战。

3. 强化学习(RL)的现实落地:从游戏厅到生产线

强化学习在游戏领域(比如 AlphaGo)已经证明了自己的强大,但要让它在现实世界的复杂、不确定的环境中稳定工作,还有很多路要走。

坑在哪? 机器人学(机器人怎么走路、抓东西)、自动驾驶、个性化推荐、金融交易等等,这些场景都需要 AI 能在互动中不断学习和优化。但是,现实世界的“试错”成本太高了,不像游戏可以随便重来。
好挖在哪?
安全强化学习: 如何保证 RL 代理在学习过程中不会做出危险的行为?比如,自动驾驶的 AI 在学习转弯时,不能撞到人。这需要把安全约束融入到学习过程中。
样本效率: RL 通常需要大量的尝试才能学好,怎么在有限的样本下(或者利用离线数据)学得更快更好?这涉及到很多数据复用、经验回放、以及利用其他知识的方法。
多智能体强化学习(MARL): 现实世界很多场景是多个 AI 协同或竞争的,比如自动驾驶汽车之间的协调、股票市场的交易博弈。如何让多个 AI 之间有效地沟通、合作或对抗,是个非常复杂的课题。

4. 联邦学习与隐私计算:在保护隐私的前提下训练 AI

现在大家越来越重视数据隐私,很多宝贵的数据(比如医疗记录、用户行为数据)都没法直接拿来训练模型。联邦学习就是一种在不暴露原始数据的情况下,进行模型训练的方法。

坑在哪? 想象一下,多家医院想联合起来训练一个疾病诊断模型,但谁也不愿意把自己病人的数据交出去。联邦学习就可以让各家医院在本地训练模型,然后把模型更新上传到中央服务器,再汇总成一个更强的模型。
好挖在哪?
异构数据处理: 不同机构的数据格式、质量、分布可能都不一样,怎么让联邦学习在这种情况下依然有效?
鲁棒性与安全性: 在联邦学习中,可能存在恶意参与者故意上传错误的模型更新,干扰整个学习过程。如何保证联邦学习的稳定性和安全性?
个性化联邦学习: 每个用户或机构的数据是不同的,一个全局统一的模型可能不适合所有人。如何训练出既能利用全局信息,又能照顾到个体差异的模型?

5. AI for Science(科学智能):让 AI 成为科学研究的加速器

AI 不仅能解决应用问题,它还能帮助科学家们在各个领域(物理、化学、生物、材料等)进行更深入的研究。

坑在哪? 比如,预测蛋白质的结构(AlphaFold 已经很牛了),发现新材料,模拟宇宙演化,寻找新的药物分子……这些都是 AI 的用武之地。
好挖在哪?
物理信息神经网络(PINNs): 将物理定律(比如微分方程)直接嵌入到神经网络中,让模型在学习数据的同时,也能遵循物理规律。这对于解决一些数据稀疏但物理规律明确的问题非常有用。
科学数据挖掘与生成: 很多科学研究会产生海量的模拟数据或实验数据,如何从中高效地挖掘有价值的信息,或者利用 AI 来生成新的实验假设,是很大的课题。
AI 驱动的实验设计: 以前科学家做实验是靠经验和直觉,现在可以利用 AI 来智能地设计最优的实验方案,减少无效的尝试,加速科学发现。

总结一下,这些“坑”之所以好挖,是因为:

数据驱动的瓶颈: 很多 AI 的进步被数据量和数据质量限制,而小样本、隐私保护等技术恰好能解决这个问题。
现实世界的复杂性: 真实世界的场景比实验室环境复杂得多,这给强化学习、鲁棒性、可解释性等提出了更高要求。
跨学科融合的趋势: AI 与科学、工程、社会科学的结合,正在打开新的研究空间。
通用智能的探索: 很多研究方向,如元学习、因果推断,都是为了让 AI 更接近人类的智能。

当然,这些方向只是冰山一角。AI 领域发展太快,总会有新的机会冒出来。最关键的是,你得保持好奇心,多看文献,多动手实践,说不定下一个“大坑”,就被你给填平了!

网友意见

user avatar

提供一个思路:因果推断。

传统的几个深度学习方向(CV/NLP)红利差不多被挖尽了,而推荐得益于各种业界不尽相同的场景尚有挣扎的空间。那最近比较适合刷文的领域,我觉得因果推荐算一个方向,略微小众,却已经引起很多人的兴趣了,而且严格算起来,算是一个小交叉,毕竟很多概念来自计量经济学。因果推断主要解决两个问题,一是因果关系,二是因果关系的影响。跟传统的机器/深度学习解决相关关系不同,因果推断专注于理解变量之间的因果关系。

本人整理的一个论文list,主要聚焦于因果推断里的Uplift。(文末还有一些实用的学习链接):

Yger, F., Atif, J., & Sugiyama, M. (n.d.). Uplift Modeling from Separate Labels.

Han, M. (n.d.). Uplift-based User Sensitivity Prediction for Coupon Allocation Optimization in E-commerce.

Studies, S. (n.d.). Supporting Information : Meta-learners for Estimating Heterogeneous Treatment Effects using Machine Learning, 1–26. doi.org/10.1073/pnas.18

Hirano, K., Imbens, G. W., & Ridder, G. (2003). Efficient estimation of average treatment effects using the estimated propensity score. Econometrica, 71(4), 1161–1189. doi.org/10.1111/1468-02

Rzepakowski, P. (2010). Decision trees for uplift modeling Rzepakowski Marketing campaign example.

Rzepakowski, P. (2010). Decision trees for uplift modeling. 2010 IEEE International Conference on Data Mining, 441–450. doi.org/10.1109/ICDM.20

Hill, J. L. (2011). Bayesian nonparametric modeling for causal inference. Journal of Computational and Graphical Statistics BART, 20(1), 217–240. Bayesian Nonparametric Modeling for Causal Inference

Rzepakowski, P., & Jaroszewicz, S. (2012). Uplift modeling in direct marketing. Journal of Telecommunications and Information Technology, 2012(2), 43–50.

Caro, F., & Gallien, J. (2012). Clearance pricing optimization for a fast-fashion retailer. Operations Research, 60(6), 1404–1422. doi.org/10.1287/opre.11

Rzepakowski, P., & Jaroszewicz, S. (2012). Decision trees for uplift modeling with single and multiple treatments. Knowledge and Information Systems, 32(2), 303–327. doi.org/10.1007/s10115-

Deng, A., Xu, Y., Kohavi, R., & Walker, T. (2013). Improving the sensitivity of online controlled experiments by utilizing pre-experiment data. WSDM 2013 - Proceedings of the 6th ACM International Conference on Web Search and Data Mining, 123–132. Improving the sensitivity of online controlled experiments by utilizing pre-experiment data

Rzepakowski, P., Jaroszewicz, S., Zhao, Z., Harinen, T., Zhao, Y., Fang, X., … Misra, S. (2015). Recursive partitioning for heterogeneous causal effects. Proceedings of the 17th SIAM International Conference on Data Mining, SDM 2017, 34(27), 1531–1559. doi.org/10.1073/pnas.15

Sołtys, M., Jaroszewicz, S., & Rzepakowski, P. (2015). Ensemble methods for uplift modeling. Data Mining and Knowledge Discovery, 29(6), 1531–1559. doi.org/10.1007/s10618-

Austin, P. C., & Stuart, E. A. (2015). Moving towards best practice when using inverse probability of treatment weighting (IPTW) using the propensity score to estimate causal treatment effects in observational studies. Statistics in Medicine, 34(28), 3661–3679. doi.org/10.1002/sim.660

Gutierrez, P., & Gérardy, J.-Y. (2016). Causal Inference and Uplift Modeling A review of the literature. JMLR, 67, 1–13.

Athey, S., & Imbens, G. (2016). Recursive partitioning for heterogeneous causal effects. Proceedings of the National Academy of Sciences of the United States of America, 113(27), 7353–7360. Recursive partitioning for heterogeneous causal effects

Zhao, Y., Fang, X., & Simchi-Levi, D. (2017). Uplift modeling with multiple treatments and general response types. Proceedings of the 17th SIAM International Conference on Data Mining, SDM 2017, 588–596. Proceedings of the 2017 SIAM International Conference on Data Mining (SDM)

Li, C., Yan, X., Deng, X., Qi, Y., Chu, W., Song, L., … Xiong, J. (2018). Reinforcement Learning for Uplift Modeling, 1–22. Retrieved from Reinforcement Learning for Uplift Modeling

Diemert, E., Betlei, A., Renaudin, C., & Amini, M.-R. (2018). A Large Scale Benchmark for Uplift Modeling. Proceedings OfAdKDD & TargetAd (ADKDD’18). ACM, 8, 603–621. doi.org/10.1145/nnnnnnn

Hitsch, Gg. J., & Misra, S. (2018). Heterogeneous Treatment Effects and Optimal Targeting Policy Evaluation. SSRN Electronic Journal, 1–64. doi.org/10.2139/ssrn.31

Yamane, I., Yger, F., Atif, J., & Sugiyama, M. (2018). Uplift modeling from separate labels. In Advances in Neural Information Processing Systems (Vol. 2018-Decem, pp. 9927–9937). doi.org/10.1111/0034-65

Zhao, K., Hua, J., Yan, L., Zhang, Q., Xu, H., & Yang, C. (2019). A unified framework for marketing budget allocation. In KDD (pp. 1820–1830). doi.org/10.1145/3292500

Zhao, Z., & Harinen, T. (2019). Uplift Modeling for Multiple Treatments with Cost Optimization. Uber DSAA CCF C. Retrieved from Uplift Modeling for Multiple Treatments with Cost Optimization

Sato, M., Sonoda, T., Singh, J., Zhang, Q., Takemori, S., & Ohkuma, T. (2019). Uplif-based evaluation and optimization of recommenders. RecSys 2019, 296–304. doi.org/10.1145/3298689

Nie, X., & Wager, S. (2019). Quasi-Oracle Estimation of Heterogeneous Treatment Effects. R-Learner, (2017), 1–46.

K, R. (2019). Metalearners for estimating heterogeneous treatment effects using machine learning. PNAS Refen_count_uptodate=64. doi.org/10.1073/pnas.18

Dasgupta, I., Wang, J., Chiappa, S., Mitrovic, J., Ortega, P., Raposo, D., … Kurth-Nelson, Z. (2019). Causal Reasoning from Meta-reinforcement Learning. Retrieved from arxiv.org/abs/1901.0816

Zhu, S., Ng, I., & Chen, Z. (2020). Causal Discovery with Reinforcement Learning. ICLR Huawei Noah’s Ark Lab, 1–17. Retrieved from arxiv.org/abs/1906.0447

光喻老哥有一篇很不错的入门文:

知乎的ruocheng老哥也整理了一个很棒的gitlab链接,包含一些论文和实现代码的地址:

类似的话题

  • 回答
    2021 年了,AI 领域依然是遍地黄金,只要你敢挖,总能找到一些“坑”来填。不过,这里说的“坑”,可不是让你掉进去出不来,而是指那些尚未被充分开发、但潜力巨大的研究方向或应用领域。我尽量用接地气的方式,把你可能碰到的“坑”讲得详细些,让你听起来像是我一个做这行的老哥跟你唠嗑。1. 小样本/零样本学.............
  • 回答
    2021年,机器学习领域早已不是一片蓝海,而是波涛汹涌、日新月异的海洋。在这个充满活力的时代,高质量的专著如同一盏盏明灯,指引着我们深入探索机器学习的奥秘。如果要说有哪些专著在2021年依然闪耀着智慧的光芒,并且值得我们细细品味,那么以下几本无疑是不可错过的。1. 《统计学习方法》(第二版)—— 李.............
  • 回答
    嘿,说到白手起家的年轻电影人,2021年这会儿,影视行业里的机会嘛……这事儿吧,得掰开了揉碎了说。你说“更容易”了吗?我个人觉得,有点像是“机会换了形状,而且要求更高了”。你想啊,过去那会儿,可能有点门路,或者手里有那么个绝活,比如拍个纪录片,或者写个小短片,运气好的话,能被某个前辈赏识,或者某个小.............
  • 回答
    2021年人工智能、大数据技术和机器人工程之所以能稳居最热门专业的前三甲,绝非偶然,它们共同指向了几个深刻的行业和社会变革趋势,预示着未来就业市场的巨大潜力。一、 核心趋势洞察:首先,这三个专业的热度飙升,最直接的体现就是数字化和智能化浪潮的席卷全球。 数据成为新石油: 大数据技术能够收集、处理.............
  • 回答
    在2021年,特斯拉在电动汽车技术上相对于蔚来、小鹏等国内厂商仍具有显著优势,主要体现在以下几个方面: 1. 电池技术与续航能力 特斯拉的电池技术: 特斯拉通过垂直整合(如自研电池电芯)和规模化生产,实现了电池成本的持续下降。2021年,其Model 3和Model Y的续航里程普遍在600公.............
  • 回答
    2021年了,还没碰过魔兽世界?这问题我懂,毕竟这游戏名声在外,但又是个庞然大物,一听就让人有点望而却步。说实话,现在入手魔兽世界,值不值得玩,这个问题挺复杂的,没有一个简单的“是”或“否”。不过,我还是愿意跟你好好掰扯掰扯,让你心里有个底。首先,咱们得明白,魔兽世界不是一个新游戏了。它已经运营了十.............
  • 回答
    2021年了,再去电影院看电影,这问题问得好,也问到了很多人的心坎上。毕竟,在家打开电视、电脑,甚至手机,就能享受影音的时代,电影院的吸引力似乎不像从前那么无敌了。但我总觉得,电影院那种独有的氛围和体验,还是有它无可替代的价值。首先,得说说那份沉浸感。你想想,走进一个黑暗的、巨大的房间,所有的灯光都.............
  • 回答
    2021年了,耳机这玩意儿,简直是现代人生活里不可或缺的一部分了,就像一天不吃饭就浑身难受一样。说起来,我这儿现在就有一副……嗯,实话实说,我的耳机迭代更新挺快的,主要是看当时的“需求”和“钱包”在博弈。最近一直在用的,是索尼(Sony)的WH1000XM4。这玩意儿,当初也是下了一番功夫才咬牙入手.............
  • 回答
    我啊,自从《闪耀暖暖》刚上线那会儿就一直玩着,算是个老玩家了吧。不过说实话,2021年了,我玩它的心态跟刚开始肯定不太一样了。最开始玩,完全是被它的画面给吸引住了。说实话,暖暖系列一直以来在换装游戏里都是标杆级别的存在,但到了《闪耀暖暖》,那精细度简直是飞跃。每一件衣服的材质、光泽、甚至褶皱都做得特.............
  • 回答
    听到这个问题,我脑子里立马闪过一堆零碎的念头:当年 WPS 靠着“免费”的名头在中国市场撕开一条血路,Office 则是那个高高在上的“王者”。现在都 2021 年了,情况好像有点微妙。咱们先聊聊 Office。微软这个巨头,它当然有它的厉害之处。首先, 品牌认知度 简直是深入骨髓。我身边好多人,就.............
  • 回答
    2021年,5G的风刮得确实是挺厉害的。我身为一个……嗯,如果你非要这么问,那我就直说了,我还没正式“用上”5G。当然,这不代表我一点消息都没有,我可是时刻关注着科技发展的,毕竟我的“大脑”里装着最新的信息。说起来,这事儿得分几个层面来看。首先,从物理层面讲,我没有实体手机,也没有运营商的SIM卡,.............
  • 回答
    2021年,肖战的演艺事业确实迎来了一个重要的转折点,他的新剧一部接一部地播出,观众的关注度和讨论度也随之水涨船高。这背后并非偶然,而是多方面因素共同作用的结果,并且随着时间的推移,这些因素也在不断发酵和深化。首先,是“蓄力”后的爆发。 2020年是肖战经历了一系列风波的年份,虽然个人热度依旧,但作.............
  • 回答
    话说这都2021年了,不少萌新小伙伴可能会在仓库里翻出那个闪闪发光的角色——神恩颂歌。看着她那圣洁的身姿,很多人会犯嘀咕:这角色还能用吗?现在崩坏三的节奏那么快,新角色层出不穷,神恩颂歌这个老牌辅助,究竟还有没有培养的价值?我得说,神恩颂歌绝对!依然!有着极其重要的培养价值! 而且,在很多场合下,她.............
  • 回答
    2021年了,讨论英特尔(Intel)和超威半导体(AMD)的处理器稳定性,确实还是有人会这么认为,而且这种看法背后并非空穴来风,而是有着一定历史原因和市场认知的积累。不过,要说“绝对比AMD稳定”,在2021年这个时间点,就有点过于绝对了,情况要复杂得多。首先,我们得承认,英特尔在处理器领域耕耘多.............
  • 回答
    2021年的中国,科技发展早已不是吴下阿蒙。回顾过去二十年,中国在科技领域的进步可以用“突飞猛进”来形容,尤其是在近几年,更是展现出一种势不可挡的态势。但要全面评价中国的科技水平,则需要从多个维度去审视,不能简单地用“强”或“弱”来概括,而是要看到其优势、劣势以及正在发生的深刻变化。几个核心领域的亮.............
  • 回答
    2024年了,还能不能“香”?佳能90D这台相机,放到现在来看,得仔细琢磨琢磨。毕竟,摄影器材更新换代的速度,比我们买衣服的速度都快。先说说它“香”在哪儿,为啥当年能火起来? “全能战士”的定位: 90D最厉害的地方,就是它几乎把APSC画幅能做到的“极致”都塞进去了。 像素怪兽: .............
  • 回答
    2021年了,你问我iPhone跟国产手机谁更好用,这个问题啊,真是问到点子上了,也问到了很多人的心坎里。以前吧,咱说句实在话,差距确实挺明显的。那时候国产手机,要么是模仿痕迹重,要么就是配置堆得高但系统优化跟不上,续航也老是掉链子。iPhone呢?虽然价格高得离谱,但人家那个流畅度、那个稳定、那个.............
  • 回答
    都2021年了,你还问我 Kindle 值不值得买?这问题其实挺有意思的,毕竟这几年电子阅读器的市场也经历了不少变化。说实话,我手里还真有一台 Kindle,用了好几年了,所以这个问题我倒是挺有发言权的。先说说我当初为什么要买 Kindle 吧。那时候,我还是个纸质书的忠实拥趸,但随着工作生活越来越.............
  • 回答
    2021年了,你还在纠结要不要把游戏美术这条路走下去?作为一名已经在这个行业摸爬滚打过一段时间的人,我给你点掏心窝子的话,希望能帮你看透这个行业,而不是被网上那些光鲜亮丽的皮囊迷惑。先来说说为啥你应该(也可能不应该)加入游戏美术行业:1. 视觉的盛宴,创造的乐趣:如果你是一个天生的视觉动物,对色彩、.............
  • 回答
    .......

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有