2020 年过去了，人工智能领域都有哪些突破? 第1页

youngfish42 网友的相关建议:

AI已在哪些领域战胜了人类

我在另一个回答中整理了 人工智能已在哪些领域超越了人类的表现

过去的五年中有很多突飞猛进的表现。

比如以下五项游戏，人工智能已经超越了人类水平。

Arimaa（印度门兽棋）: 2015[38][39]
Shogi（日本将棋）: c. 2017[10]
Go（围棋）: 2017[40]
Heads-up no-limit hold'em poker: 2017[11]
Six-player no-limit hold'em poker: 2019[41]

以下两款游戏中取得了与人类高手正面对抗的水准。

Dota 2: 2018[44]
StarCraft II: 2019[46]

就是有点可惜，在过去的一年里（2020年），没有决定性的例子。

向领域巨头学习—Jeff Dean万字长文回顾2020谷歌AI十大进展

如果想要了解某个领域的进展，从该领域的巨头可以较为全面知晓这些信息。

而谷歌公司无疑是很好的一个例子，而正好他们也做了对2020年的AI技术回顾^[1]^[2]。

不论是抗击新冠疫情，还是用于医学诊断与研究，AI为健康带来了更多可能。

人工智能帮助我们更好了解身边环境，并帮助人们在日常生活中以及在灾难情况下做出有用的预测。

人工智能为无障碍社会作出贡献。

自然语言处理方面表现得越来越好，相信用不了多久机器翻译水平就能超越普通大众了。

@桔了个仔前面的回答介绍了 transformer 模型发挥的作用。

Responsible AI（负责任的AI）快速发展中，可解释模型、隐私与安全保护在路上。

@lokinko 前面的回答从联邦学习的角度介绍了我们是怎么使用AI保护用户隐私的。

机器感知有很大改善，但仍具有巨大的潜力。

与人类相比，机器可以调动更多来自不同传感器的数据来观测场景和物体，而如何使用单一数据或者结合多个模态的数据来感知这个世界，依旧是一个开放问题。

从人类智能中汲取灵感的机器智能，正在不断进化中，基于元学习、强化学习等策略的机器人取得了越来越令人惊喜的表现。

好了，上面简单展示了2020年人工智能领域的发展，根据我个人的小小猜测，未来的人工智能工作会朝着易用性（更方便的框架和通用模型）、可信性（可解释性、安全、隐私）、多样性等方面发展。

扩展阅读

另外推荐几篇资料，用于拓展阅读。
1. Google Research: Looking Back at 2020, and Forward to 2021

谷歌AI团队在AI领域的回顾与未来的展望（虽然主要是谷歌公司工作，但也很有代表性）

2. A Brief History of Deep Learning Frameworks

深度学习框架简史：TF和PyTorch双头垄断，未来十年迎来黄金时期

回顾了21世纪以来深度学习框架的发展史，非常有趣的一篇科普文章。

3. AI Experts Predict 2021 Trends

几位AI领域专家对2021年的领域趋势作出了预测。

4. Best of arXiv.org for AI, Machine Learning, and Deep Learning – January 2021

某公司盘点了近期最重要的几篇论文。

5. The Journey of Artificial Intelligence

一个盘点人工智能领域里程碑和时间线的网站。

参考

^ Google Research: Looking Back at 2020, and Forward to 2021 http://ai.googleblog.com/2021/01/google-research-looking-back-at-2020.html
^Jeff Dean万字长文：2020谷歌10大领域AI技术发展 https://new.qq.com/omn/20210117/20210117A049RO00.html

jzwa 网友的相关建议:

在过去没多久的2020年，我相信对于绝大多数人来说，抗疫无疑占据了生活的方方面面，疫情带来了很多的伤痛，同时也在无形中使得AI技术在战斗中迅速发展，不仅在抗疫初期起到了不可或缺的作用，也将在后疫情常态下持续的发挥作用。

1 抗疫初期AI的作用

在新冠疫情刚刚肆虐的初期，首要任务是研究清楚这种病毒的性质，并进行科学的防控。AI可谓贯穿了疫情防控的整个过程，IDC将疫情防控简单分成四道防线：1）公共卫生防线，2）医疗诊治防线，3）重要场所防线，4）社区治理防线。每一道防线都充满了AI和大数据技术的身影。

如果将AI的功能细分，那么AI主要起到以下三个方面的作用：

1.1 大数据收集以及分析 —— 及时提供关于人们安全和经济影响的信息

这里面就包括了，疫情情况实时汇总以及疫情的走向分析，在去年严重的时候，每天的第一件事就是打开支付宝，微信或者任何一个网页的首页都是疫情的实时情况，同时各种数据的收集与汇总，能让拥有智能终端的人可以实时的接收到最新的数据。

同时，在最初的寻找传染源的过程中，AI技术也发挥了不可或缺的作用，AI和大数据技术会迅速的筛查与感染者有过接触的人，做到快速响应与报告生成，已最快的程度找到潜在的感染者，避免进一步更严重的事态。

另外，疫情情况的准确预测是合理防控手段的主要科学依据，全世界范围内已经有多个AI预测模型上线，其中包括但不限于，“兰州大学开发的‘新冠肺炎疫情全球预测系统’，它是全球首个、引入大气学科中天气预报的技巧、将政府的管控措施考虑其中、不仅做预测还能做归因分析、完全自主知识产权。”，另外这个系统不再局限于新冠肺炎疫情预测，而是朝着全球流行病学预测的方向发展。

此外，国外的很多国家也都有相应的预测模型，都为疫情的防控提供了关键的参考信息，比如我现在所在的英国，利用AI技术进行疫情的整体预测，以及疫苗注射以及周围感染情况的移动端预测以及播报，都是减缓疫情的有效手段。

1.2 治疗和诊断——推进有关疫苗开发、诊断和治疗方案的研究

AI辅助制药：这里不得不提到AI强大的能力，即中国确定首次爆发后不到三个月的时间里，已经在人类中测试了针对新冠病毒的疫苗，这在以前是不可想象的，因为通常来说疫苗的研究通常会持续几年甚至几十年，而在去年的9月份，在AI的助力下，就已经有34种候选疫苗开始了实验。

AI在寻求疫苗方面发挥了重要作用。这些工具可帮助研究人员了解病毒及其结构，并预测其哪些成分会引发免疫反应，这是疫苗设计的关键步骤。它们可以帮助科学家选择潜在疫苗的成分并弄清实验数据。它们还可以帮助科学家随着时间的推移跟踪病毒的基因突变。这种信息密集型的工作以前是会旷日持久的，并且难免出错，但是AI对于这种工作会不知疲倦并一丝不苟的完成。

AI辅助诊断：在没有快速检验盒出现之前，新冠的诊断大多还依靠CT图像诊断。而大量的CT图像对于医生是个巨大的负担，而应用而生的医学影像AI完美的解决了这个问题，医疗AI有助于提升影诊断的工作效率，减轻医务人员工作负担，减少误诊漏诊现象的发生，尤其是能为大规模流行性疾病的早筛提供有力技术支持。

不仅仅针对于新冠，医疗AI的优势在很多的疾病上都有建树，体现在五个方面：一是通过深度学习技术训练模型，进而对病灶进行分割检出；二是利用形态学参数，对病灶进行定量分析；三是通过分类算法，对病灶进行准确分类，比如结节、肿瘤等；四是对病灶进行定性分析，比如对肿瘤的良恶性进行倾向性判断；五是可基于AI诊断结果结合临床经验自动生成结构化报告。

1.3 传播准确的信息——信息自助获取已经辟谣

AI智能健康助理

虚拟健康助理等远程医疗实践可以帮助人们通过AI技术进行自我分类，判断自己是否可能被感染，了解接下来需要采取哪些措施，这是非常有效的初步筛查手段。增强型医疗诊断和分类也是能在这一领域大展身手的关键AI能力。特别是在疫情初期人员短缺的情况下，虚拟健康助理起到了不可或缺的作用。

以我的经历来看，英国普遍面临着医疗人员短缺的窘境，所以不可能让所有人都能有机会去医院进行救治，那么通过与虚拟健康助理的交流，能让自己粗略的评估自己的情况，并且在后续的治疗中，与智能健康助理的交流也能成为临床治疗的一个参考。

NLP自然语言处理技术用于遏制谣言传播

突如其来的疫情，大众对于信息的即时性、透明度和传达效率有了更高的关注。我们不仅是各种信息的接收端，同时也是各种信息的生产端和中转站。各种有关疫情的信息持续充斥在信息场中，不断更新着微博的热搜，也给了虚假信息可乘之机。2020年2月上旬，世卫组织提出了“infodemic”一词，即information+epidemic，也就是“信息疫情”——网上各种真假不一的混杂消息。

面对铺天盖地的消息，依靠人力一一鉴别几乎是不可能的事情，那么自然语言处理和情感识别技术就成为了关键性的工具，

观点提取

自然语言处理会将信息中心的关键词提取出来，并从整体上理解全文大意。

2. 情绪分析

自然语言处理技术能够对文章的情感进行极值分析（积极还是消极）、12种细节情绪分析（焦虑、愤怒、兴奋等等）、情绪浓度分析（1-10分）以及对文本整体情绪影响最大的关键词分析。例如人工智能在对Trump在推特上说的话进行情绪分析，得出了较为强烈的“愤怒”情绪，且情绪关键词是“fake news”。

3. 智能识谣

人工智能能够通过大量事实核查数据的训练，从新闻源权重、作者权重、信息真实度等等指标对新闻的真实性进行智能识别，最后得出一个消息真实度的分析报告，以备于后续的决策处理。

2 AIOT在抗疫中的作用？

这个部分具体说一下AIoT技术在抗疫中发挥的关键作用，AIoT可以称之为智慧物联网，全称为 Artificial Intelligence of Things.

2.1 IoT是什么？

首先提到物联网 IoT（Internet of things）的定义。它的概念可以追溯到1980年代初期，全球第一台隐含物联网概念的设备为位于卡内基·梅隆大学的 可乐贩卖机，因为它连接到了互联网，因此可以在网络上检查库存，以确认还可供应的饮料数量。

根据上面的特征，简单来说IoT是能够让互联网连接对象使用嵌入式传感器进行数据收集和交换的网络。

具体来说，IoT具有五个特征，同图2所示，分别是

Collect 收集
Store 储存
Process 处理
Analyze 分析
Control 控制

这也是一个标准的处理过程，我们拿智能音箱点歌来举例

用户说出具体的名字将音箱唤醒，比如说小爱同学或者siri，这时候音箱会开启信息收集模式。
用户说出想要听的歌名，这时候助手会将这首歌存储下来，以备之后在点播。
将用户的命令就是NLP处理。
对用户的命令就行分析。
得到分析结果，搜索具体的歌名，然后开始播放该首歌，这也就是控制。

2.2 AIoT是什么？

AIoT也成为智慧物联网，广义的讲，指的是人工智能技术与IoT技术的融合以及在实际中的应用。

如同图2所示的那是，AI的加入会赋予IoT一个更强的功能，也就是ACT。IoT收集了海量的数据，并且在持续不断的进行收集，但是IoT本身并不具备很强的处理能力，而AI的出现恰好弥补了这一点，两者结合，AI会利用IoT海量数据进行机器学习和算法训练，给与IoT之前没有的感知和识别能力，使得万物智能互联。

AI是大脑，IoT是连接。

2.3 AIoT在疫情中起到的作用?

AIoT设备其实已经遍布我们的生活了，其中最常见但也不被注意到的就是手机，手机可以成为一个AIoT智能终端，可以与其他的AIoT设备进行交互，远程下达指令，控制灯光，车辆，接收并处理各项事务等。

AI红外体温检测

放置于重要人流聚集地，疏散地的远距离红外体温检测装置，可以高效快速的筛选体温异常人员，既保护了工作人员，也极大的提升了检测效率。

另外还有蓝牙腋下体温贴，它可以24小时监控和上报隔离人群的异常体温。

2. AI面部识别

AI面部识别已经是很成熟的技术了，已经大范围的开始使用，特别是刑事侦查等，在疫情期间对于传染源追踪的工作上发挥了显著的作用。

3. AI语音控制设备

例如语音控制电梯等设备，免接触的设计对于减少病毒的传播发挥了很有效的作用。

4. AI无人车，无人设备

医疗机器人也在疫情中扮演了重要的角色，它可以全自动完成病区消毒、医疗物品配送等工作，减轻医护人员工作负担的同时还减小交叉感染的风险。

5. 远程教育/办公

在疫情期间，绝大多数的学习和工具场景都从线下转到了线上，很多的相关AIoT工具被用于远程工作和教育中，这也将将促进远程工作和教育的加快和成熟化。

3 AIoT的未来展望

AIoT技术与AI,IOT,5G和大数据技术密不可分，既相互依赖又相互促进。他们的结合又能产生出很多的细分领域，比如智慧医疗，智慧城市，智慧工业，智慧家居等，AIoT产业在之前的五年中持续的飞速增长，并随着5G技术的普及，预计将会迸发出更强大的潜力。

但是随着技术的飞速进步，也面临着不小的问题，平台安全性和产业标准混乱。数据安全隐患广泛存在于互联网中，AIoT也例外。此外，另一核心挑战是标准体系不完备。物联网连接技术和设备的多样性，是导致无法形成统一标准体系的强大阻力。

即使现在AIoT技术存在不少的问题，但AIoT将持续保持高速发展态势，未来一定是属于万物相连，智能交互的时代。

dong-xi-97-29 网友的相关建议:

本回答不涉及专业知识，主要是一些随想与杂谈，大家放心观看

以古为镜，可以知兴替，要对AI当下与未来进行剖析，一定离不开它的历史。

自1950年AI之父艾伦图灵发表论文Can Machine Thinking?，并在论文中提出了著名的图灵测试后，人工智能，就成为了一个注定影响人类命运的名词。

六年后，麦卡锡、香农等科学泰斗在达特茅斯会议上提出了AI(Artificial Intelligence)概念，正式标志着人工智能学科的建立。随后，AI神经网络的雏形-感知机Perceptron问世，为数十年后深度学习的爆发埋下伏笔。

在经历了从符号推理、专家系统到联结主义学派后，人工神经网络逐渐成为AI研究的主要方向。到了1984年，杰弗里辛顿和Yan Lecun等人受到Hopfield模型中能量函数的启发，分别提出了反向传播算法，并在之后提出受限玻尔兹曼机，这标志着人工智能的第一次大爆发。

有趣的是，Hinton在剑桥大学读书时创立的计算机神经科学小组，孕育出了后来大名鼎鼎的DeepMind，也就是打败柯洁、李世石的AI阿尔法狗初号机背后的公司。随后数年，大量人工智能技术落地与突破，从BERT到GPT-3，从ALEXNET到RESNET，每个领域都在深度学习的加持下焕发新生。这，代表着属于人工智能的新时代到来。

从历史上看，AI的发展始终伴随着兴衰涨落，整个行业曾在两次大低谷徘徊数年，反而给予了后来者更多的信心——也造就了如今的人工智能。站在2020年这个节点，你会发现，小到人脸识别，大到航天科工，AI无处不在又无隐无踪，据麦肯锡全球研究院的调查报告显示，预计到 2030 年，狭义人工智能应用将为全球经济增加约 13 万亿美元的GDP，单从总量来看，其影响力将超过 19 世纪的蒸汽机。

过去一年，经历疫情与危机，AI对人类社会的帮助显得愈发重要，这个问题下也有很多业内大佬谈了各自领域的发展，也都比较专业，这里我想从科普与畅想的角度，不带任何专业名词地谈谈从人工智能的“现在”和“未来”，并确保没有任何AI学术背景的知友也能理解。

AI对人类生活的影响如何？

辩证法告诉我们，凡事都有两面性。虽然作为AI从业者，我是一个坚定的拥趸，但不可否认，人工智能存在很多亟待解决的问题。

第一个问题，AI对个人时间的剥夺。

我在读书时的研究方向就是机器学习在搜索推荐的应用，这一度让我着迷。但随着研究的深入，我发现大多数算法只不过是在无意义地浪费人们的有限时间，以此产生更多的流量与转化。如今的工业界，很多高深的模型层层堆叠，恨不得把用户所有信息都拿到手中变成特征，而业务导向下训练出的AI自然也能够以非常高的置信度进行精准推送，并最终带来千人千面的信息茧房和多巴胺成瘾，反而违背了算法被创造的初衷。

第二个问题，AI对个人隐私的泄露。

虽然大多数隐私泄露其实是底层数据库的问题，但AI无疑增加了个人信息表征化、碎片化的风险。曾经的身份识别，需要账号密码或是本人验证，而如今，基于深度学习的人脸识别、指纹识别甚至静脉识别，你可能都不需要打开手机，唯一ID就会被定位和获取，这导致了不同程度的个人隐私泄露、个人肖像权侵犯等。去年大火的DEEPFAKE和它的升级版（基于对抗神经网络的某些算法），如果给定大量数据和调优参数，甚至可以伪造出肉眼难以分辨的视频。

而这只是问题的冰山一角。指纹和人脸识别留下的生物特征信息、自动驾驶留下的个人行踪记录、手机APP保存的个人隐私数据，医院里留存的诊断治疗记录……我们的各种行为都带来了更多的风险。就像我一直说的，算法本身没有善恶，但掌握算法的人有。值得认可的是，国家在去年出台了信息安全与大数据监管的相关法律，以及涉及跨国并购（针对某TOK）的算法安全条例，但这些还远远不够，我们在人工智能立法上仍然任重而道远。

当然，正视这些问题，才能更好地解决它们，视而不见不可取，因噎废食则更愚蠢，和AI所带来的价值相比，这些可解的问题已经显得不那么重要。

        >>>Now, what is the value?

最能普遍感受到的价值是生活便利度的提高，包括智能搜索、路径规划、自动驾驶、能源调度、工业检测等等。可以说，在经历了第四次工业革命的浪潮后，AI对生活的影响已经到了常人难以想象的程度，以手机为例，现代智能机的底层硬件加速、以及你所用到的几乎每一个规模化的软件应用，绝大多数都由算法驱动。

除了手机，如今的公共交通系统基本都是由调度AI在辅助运作，你路过的每个路口，天网中的视觉AI都会识别记录。在部分发达地区，即使你足不出户，水电能源系统也会由算法分配。换句话说，只要不回归刀耕火种的原始生活，那么在未来，你将越来越离不开人工智能，它为生活带来极大便利，提高了整体社会的运行效率，让每个人的生活时间成本降低，是一种最泛化的价值。

但是让我们再深入思考一个问题：算法为你节省下来的时间，真的属于你了吗？目前来看不是的，大多数时候它们还是属于你的老板，因为你还要加班。这就引出了AI的第二个，也是最重要的一个价值，劳动力解放。

马克思所讲的劳动的解放，实际上就是劳动关系的解放，以及劳动关系之下的社会束缚的解放。在马克思看来，无产阶级是推动这种解放的主体力量，同时也是重构世界秩序的主体力量。按照他的说法，共产主义社会将是一种自由人的联合体。因此，实现共产主义社会的一个基本前提，就是人类能够在相当程度的生产力基础上真正成为自由人。

在我看来，未来10年人工智能时代的社会生产，很可能让大多数人从繁重的工作中解脱出来，获得大量的闲暇时间，这在很大程度上为自由人的实现提供了物质基础，比如告别996、实现个人价值。激进点来说，我们可以将人工智能堪称是通往共产的捷径，也是促进全球改革的加速器。

未来的AI会如何发展？

现在，基于这两种价值，我们可以再聊聊AI的未来。我认为AI的发展可以归纳为两个大方向，AI本身的认知智能度，以及AI设备的现实延展度。

认知智能度，是区分强/弱人工智能的标准之一，从《HER》中具有完全独立思考能力的人工智能，到《黑镜》中带有个人感情的AI，无一不展示了人造智慧的无穷魅力。但其实，目前的AI还谈不上有多少认知，大多数智能仍然与人工有关。

不过这并不意味着认知智能无法突破，人脑也是由海量神经元组成，单一来看它们只是一些功能区域或神经突触组合成的逻辑门，但却也产生了无数有趣的思想。这其中的门道，需要很多人终其一生去探索。

虽然2020年的人工智能已经在“听、说、读、写、感知、决策”等领域已经达到或超越了人类水准，比如阿尔法狗的“下棋”能力、绝悟的“游戏”能力，但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。

认知智能以认知体系为基础，以类脑结构功能和机制为基础。人工智能以感知体系为基础，以统计、数学、信息论为基础。因此这就决定了目前的人工智能技术体系不可能产生综合系统化的认知能力和类脑能力，包括理解，记忆，学习，情感，逻辑等方面。而随着人工智能两大交叉传统技术体系（机器学习、深度学习）天花板的到来，未来将必定发展出全新的理论体系，来继承，发展，创新，突破现有的人工智能体系。

毋庸置疑的是，未来的认知智能将从认知心理学、脑科学中汲取灵感，并结合跨领域知识图谱、因果推理、元学习等技术，建立稳定获取和表达知识的有效机制，让知识能够被机器理解和运用，实现从感知智能到认知智能的关键突破。

现实延展度定义下的AI有两种，一种是泛结构AI，一种是仿生式AI。

泛结构AI指的是任何以可行物理结构存在的AI，小到纳米机器人、大到自动驾驶汽车，总之它们通常不是什么碳基生物形状，而是服务于特殊用途的模样。

这里以自动驾驶为例，简单来说，L0-L2是真人驾驶员掌控。L1是“动手”级别，L2可以适当“放手”；L3-L4真人驾驶员与机器共同掌控；L3要“睁大眼睛”；L4可以“基本放心”；L5则可以选择完全交给机器掌控。从商业化的角度来看，L5是远景目标，L3应用有限，L2和L4是最佳应用，目前已经规模商用的是L2-L3。

过去一年，包括特斯拉在内的很多厂商都迎来了重要突破，L4在不久后也将不再是什么遥不可及的东西。这意味着今年，也就是2021年将是自动驾驶具有里程碑意义的一年，也标志着自动驾驶革命的开端。1920年代，汽车开始大量涌入城市，随后完成了全面机动化。一百年后历史重演，汽车工业曾如何改变历史，自动驾驶也将如何改变当下。

5年内自动驾驶会逐渐落地，已经成为一个公认的事实，也是历史大势，这意味着很多：绝对事故数降低、新兴职业产生、公路经济变革。在泛结构AI中，仅自动驾驶这一项，就将为我们的生活带来非常非常大的影响。

仿生式AI则比较好理解，一般是以动物或人为模板，创造出的一类有形的人工智能。

这在过去只是一种超前的构思，存在于各大科幻电影中，比如《机械公敌》、《星球大战》。但如今已经有一些非常前沿的公司可以造出承载此类AI的容器，这其中独一档的就是波士顿动力。

我在讲座中曾与人讨论过这类AI的实用性——毕竟在学术界看来，AI的形状只是表象。我当然也非常认同，因为无形的AI是本，只追求形状是舍本逐末。真正的强人工智能不需要有形，它的智慧无处不在，就像《超体》中的Lucy。

但我同样认为，对于任何一个阶段的人工智能来说，经过百万年岁月进化而来的，可以胜任很多工作的智人身体结构，都是一个值得被发掘的宝藏。我们现在说它没用，是因为技术没达到，而不是它真的没用。子非AI，安知AI不知智人身体之用？如此而已。

通俗点来看，如果只是站在普通人类的角度看，一个人造智慧+一个人造躯体，对社会产生的影响绝对超过一个只会下棋的阿尔法狗和一堆只会跟着程序跳舞的灵活机械。而在我看来，让抖音上的小姐姐或快手上的老铁们认识并接受AI，有时候也是一种进步。

在未来，人工智能的发展已经被写进中美国策，大势已定，浩浩汤汤。我常说，很多人研究AI，却忘了怎么站在一个不懂AI的普通人角度来思考AI的问题。虽然技术的发展在巨头们的带领下一路狂奔，我倒更希望在新一轮浪潮到来之时，可以少一些资本的贪婪，多一些百姓的便利，让AI真正成为造福于民的技术。

参考文献

《麦肯锡全球研究院-人工智能报告》
《人工智能与国家安全报告》
阿里巴巴达摩院2020年十大科技趋势
《中华人民共和国数据安全法》
Can Machine Thinking? -Alan Turing
Learning Representations by Back-propagating errors
《中国人工智能40年发展简史》
《2020人工智能发展报告白皮书》
《2019-2020年人工智能产业人才发展报告》
《人工智能产业发展深度报告：格局、潜力与展望（上）》
《人工智能发展简史》
《2019年中国人工智能产业研究报告
《深度学习(deep learning)发展史》

zhu-wang-xiao-miao-o 网友的相关建议:

谢谢邀请

众所周知，2016年，谷歌宣布了AlphaGo的横空出世。接着，其便迎来了与李世石的世纪人机大战，历经五局鏖战，最终以4比1的总分获得胜利。这件棋坛盛事，可以说是人工智能在公众视野里的最终一个引爆点了。

自此以后，人工智能便成为了一个公众口中热度很高的话题。基于人工智能的发展和应用，也开始陆陆续续地涌现，可谓是遍地开花。

2020年的人工智能领域，则更是如此。

对于公众而言，2020年度最为出圈的人工智能领域突破性工作，当属Deepmind 团队的 AlphaFold 2了，我认为，其可以称得上是2020年的新版“AlphaGo”了。

2020年11月，在第14届蛋白质结构预测技术的关键测试（Critical Assessment of protein Structure Prediction，CASP）竞赛中，AlphaFold 2得到了接近90分的成绩（中位分数为92.4），表现良好，已经接近于实验取得结构的水平，并且全面碾压了来自学术界和产业界的其他竞争对手，完美地向世人展示了人工智能是如何来推动和加速新的科学发现的。

AlphaFold 2的这一巨大突破，直接引爆了全网的热点，Nature、Science纷纷报喜，生物届和AI领域的大牛们也集体祝贺，被誉为是“解决了五十年来生物学的大挑战”的巨大成就。哥大生物学助理教授MohammedAlQuraishi更是评价道：蛋白质结构AI从此进入了“ImageNet时代”。

上图展示的，是该次比赛中的各小组Z-scores的得分，其计算方法为样本值相对于总体平均值的差除以标准差，可以看出，AlphaFold 2与第二名以及后面组的得分相差很大，明显好于平均水平，好到是可以当成离群点或者异常点来进行剔除的程度了。

从排名数据中可以看到，AlphaFold 2系统对所有蛋白靶点3D结构预测的中位GDT评分为92.4分，即使对于一些非常难以被解析的蛋白靶点，其也有87的分数，表现非常优异。

其实，早在2018年，也就是第13届CASP比赛中，DeepMind团队就用CNN+Rosetta组成的AlphaFold来预测蛋白质结构，首次参加CASP就拔得头筹，取得了第一名的好成绩。

不过，第一版取得成功的主要原因还是算力问题，当时的后面几名小组如C-I-TASSER、Multicom、C-QUARK等也都利用了深度学习的技术，所以AlphaFold在方法论的设计上实际并无多少突破，当时的很多小组也和DeepMind团队一样，都是用CNN或者RNN来构建自己的模型，并实现已有方法的优化。这种情况对于以往的工作来说，也算是做出了不小的突破，但这种严重路径依赖的状态对于日益增长的算力来说并不是一个最佳的解决方案。

而新的AlphaFold 2，则可以说是从根本上完完全全的战胜了全部的竞争对手。正好比AlphaGo能下出各种匪夷所思的落子，以至于柯洁惊叹"自己这辈子都打败不了AI了"一样，许多人也对新的AlphaFold 2发出了如此高度的感慨，高呼其“解决了五十年来生物学的大挑战”。

18年的AlphaFold在CASP13中成功使用深度学习来预测距MSA（Multiple sequence alignment，多序列比对）的残基距离，然后，将这些预测转换为电势，接着使用简单的梯度下降算法将其最小化（例如L-BFGS）以找到良好的结构。而这个想法，在两年后的CASP14中仍然被许多研究小组采用，其中包括那些排名靠前的小组。

但是，这一次，DeepMind决定开发端到端模型。他们没有使用MSA来预测约束，而是创建了一种深度学习体系结构，该体系结构将MSA作为输入，最后输出完整的结构。不同于先生成残基之间距离再通过其他方法产生结构的方法，AlphaFlod2这次使用了端到端的方法直接通过网络产生结构，还利用了Attention Module增强学习效果。

他们建立了一个基于注意力机制的神经网络系统，使用170,000个结构组成的数据集，通过端到端进行了训练，并在之后通过不断地迭代，使得AlphaFold系统学习到了基于氨基酸序列，精确预测蛋白结构的强大能力。

AlphaFold 2将折叠好的蛋白质当成具有3D结构的“空间图”来处理，折叠的蛋白质可以被认为是“空间图”，那其中的氨基酸便自然成就为了“空间图”中的节点和线条。这种“空间图”的构建，对于理解蛋白质内的物理相互作用及其进化历史是非常重要的。

通过上述这一套基于注意力机制的人工智能神经网络模型，CASP14上使用的最新版AlphaFold 2，可以高效的解析不同蛋白质的“空间图”结构，同时，系统会试图解释这个图的结构原理，并对它正在构建的隐式图进行推理。此外，模型还会使用进化相关的氨基酸序列，多序列比对（MSA）和对氨基酸对的表示来完善蛋白质结构的预测。另外，模型还使用了内部置信度度量指标，来对蛋白质结构进行衡量。

虽然一部分氨基酸侧链的精确位置仍然是一个很大的难题，但Alphafold 2已经能够在很大程度上解决蛋白质结构的预测问题了。深度学习和Attention model等人工智能领域的方法在其中起到了巨大的决定性作用。

但是，由于深度学习的部分不可解释性，Alphafold 2也因此有了很多的质疑。

其中便包括了德国马克斯·普朗克发育生物学研究所，蛋白质进化学系主任安德烈·卢帕斯。因此，他提出了一个特殊的挑战，即预测一种来自古细菌群中古细菌物种的膜蛋白。

之后的一切表明，X-射线晶体学显示的实验结果，完全符合AlphaFold 2模型返回的那张长着两个长长螺旋的蛋白质结构图像，这样的预测结果，不仅从实验层面上没有驳倒AlphaFold 2，反而更进一步证实了AlphaFold 2的强大之所在。

所以，若要问到2020年人工智能领域最伟大，同时也最具有突破性的成就，AlphaFold 2自然是当之无愧的NO.1了。

至少，是我心目中的NO.1

2018年，AlphaFold 开始被用来预测蛋白质结构.

同样是在2018年，Google发布了论文《Pre-training of Deep Bidirectional Transformers for Language Understanding》，文章中所提出的BERT模型，成功在高达11项的 NLP 任务中取得了state of the art 的结果，赢得自然语言处理学界的一片赞誉之声。

自2001年Bengio等人提出第一个神经语言模型起，NLP这项工作便在人工智能界开始了一项长足跋涉之旅。2013年的词嵌入、2014年的sequence-to-sequence 模型、2015年的注意力机制等等，一直到2018年10月推出的划时代意义的BERT模型，都表明NLP领域一直在不断地高速前进和蓬勃发展。

依然是2018年，在NLP领域大放光彩的Bert模型旁边，还站着另一位陪跑选手，在用自己的努力孤独地坚持着，向着更亮的远方默默前进，它便是OpenAI GPT（Generative Pre-Training）。

最开始，GPT只是个12层单向的Transformer，而后，2019年初的GPT-2，提出了meta-learning，用了15亿参数的大模型，将所有的NLP任务输入输出进行了整合，成为当时生成模型界的霸主。

2020年，新一步的极限挑战又开始了，45TB的训练数据，1750亿个参数，1200万美元的花费，造就了异常强大的GPT-3模型，GPT-3像之前一样使用单向语言模型训练方式，但其将目光聚焦于更通用的NLP模型之上。

通过对大量文本进行预训练，然后对特定任务进行微调，证明了GPT-3在许多NLP任务和基准方面的巨大收获。实验显示，无论是在Zero-shot、One-shot还是Few-shot的情况下，GPT-3都有着很好的表现。

据OpenAI的报道，截至目前目前已有超过300个APP开始使用GPT-3，平均每天产出约45亿个词，更甚者，GPT-3目前已经可以扮演虚拟角色，来与我们进行交互行为。有时候，GPT-3的强大会远超我们的想象。

感谢各个互联网公司的巨额资金投入，更要感谢广大科研工作者们的不懈努力和认真钻研，让人工智能和我们的科学与生活越来越近，让我们愈发感受到了人工智能的魅力，和其带给这个世界的巨大变化。

接下来几年，AI还会高速发展吗？我认为答案是可以肯定的，目前，深度学习还处于发展的高峰阶段，接下来，随着5G的慢慢普及，更强算力芯片的不断涌现，边缘计算+云计算的持续进步，计算存储一体化的突破，我相信，未来一段时间，人工智能发展的脚步绝不会停止，相反，人工智能会更加大踏步的向前迈进。

AI也不光是纸上谈兵，实际上有很多的落地产品，也都或多或少影响到了人们的现实生活，自AlphaGo横空出世起，各类棋牌类竞技游戏相继被人工智能所攻破，接着，便是各类形形色色的产品开始问世。

微软搜索开始推出了自己的人工智能产品小冰；百度也开始测试自己的无人车了；Style Transfer技术生成了各种千奇百怪的艺术图片；计算机视觉技术开始进入普通人的生活，同时也接入了如病例分析、医疗影像诊断等医学领域，并且取得了不俗的成果。

未来，AI对人类的实际生活造成的影响只会越来越多，妄图一夜之间梨花漫地，自然是不现实的。但AI对生活造成的影响是逐步向我们走来的，无人驾驶，智能购物，更便捷的出行等，这都是我们一点点可以感受得到的，同时我也相信，以后会做的更好。

未来可期，希望我们能够共同加油！

hexin_marsggbo 网友的相关建议:

感谢 @亚马逊云科技的邀请，我的方向主要是AutoML，所以就介绍一下这个领域在2020的一些发展吧。

智能体-王者荣耀

论文：Mastering Complex Control in MOBA Games with Deep Reinforcement Learning

在游戏方面的研究一直在进行着，主要用到的技术是深度强化学习（deep reinforcement learning, DRL）。

在2015年，有研究用deep Q-Network训练agent玩Atari游戏，下面是游戏列表，看看你都玩了哪些游戏。

2016年让人工智能大火的AlphaGo诞生。2018年，OpenAI团队利用AI技术在Dota2游戏中战胜了专业玩家。

之前参加过腾讯内部举办的Workshop，其中他们就分享了他们利用AutoML在王者荣耀游戏上搜索超参的工作。之后腾讯在2020年的一篇被AAAI接收的论文（简称MOBA1v1）使用DRL技术在王者荣耀1V1模式下完胜人类玩家。下图是AlphaGo和MOBA1V1的对比，可以看到后者的搜索和动作空间都远大于AlphaGo，而且我们都体验过被460的折磨，所以算法对实时性的要求也是非常高的。

看看下面的系统设计，可以粗略地感受一下每时每刻需要处理的信息量之大。之前还以为是腾讯会直接通过后台数据拿到所有对象的数据，没想到是通过每一帧的图像信息提取特征的。

1V1已经战胜人类了，之后继续用AutoML在5V5中战胜人类还会远吗？期待~

国产AI框架

在2020年之前，国内的AI框架只有百度的PaddlePaddle在艰难地求生。而到了2020年后，一批国产AI框架如雨后春笋般都冒出来了。

旷世-天元（MegEngine）

2020.03.26 旷世开源了天元深度学习框架，官方称 MegEngine 具有"训练推理一体化"特性，其中"训练"是在 Python 环境中进行的，而"推理"则特指在 C++ 环境下使用训练完成的模型进行推理。早期智能手机人脸识别都用到了旷世的技术，难不成就是用的这个框架？

华为Mindspore

2020.03.28 华为发布了MindSpore框架。这个框架没怎么用过，不过之前在华为实习的时候有幸参与了Vega框架的实现，里面不少算子就提供了对MindSpore的支持，所以可能华为内部也不少工作都是基于MindSpore开发的。

清华大学-计图（Jittor）

2020.04.02 清华大学开源了自研的 计图（Jittor）深度学习框架。

清华大学发布深度学习框架--计图（Jittor）-清华大学新闻网

计图创新的采用了统一计算图，用户并不需要手动切换，计图可以动态的将计算图拆分成可以优化的子静态图。让计图在保持动态图灵活性的同时，还可以发挥出静态图的运算性能。计图与国际主流平台相比，具有多项先进特性，其统一计算图的特性如下图所示。

Oneflow

2020.07.31 Oneflow正式在GitHub上开源。OneFlow 从研发之初就主打高效性，致力于解决大规模分布式 AI 训练问题。Oneflow发布前几天的时候加入了一个技术讨论群，Oneflow创始人袁进辉也在群里，然后每天像手机预告一下发布Oneflow的预告海报，还时不时回复群里人的问题，第一次感觉离大佬这么近哈哈哈

袁进辉在一次采访中说道：

遍地黄金的日子过去了，低垂的果子已经没了”，技术创新主导的时代必将来临，让我们有“像鹰一样的眼光，像狼一样的精神，像熊一样的胆量，像豹一样的速度”，去抓住属于技术人的机遇。

希望国产AI框架越做越好！

AutoML平台&框架

既然已经有了Pytorch、TensorFlow、PaddlePaddle、Keras、MNext，还有一批国产框架诞生，肯定是因为还有不少问题仍待解决。

我认为其中一个发展方向应该就是实现AutoML的全自动化的框架平台，我之前的一篇文章简要介绍了AutoML技术的发展，尤其重点总结了NAS（Neural Architecture Search）技术。

NAS技术也越来越被广泛应用到各个领域，未来应该也会变成一个非常basic的组件，我们除了可以直接调用别人设计好的网络结构，也可以直接通过NAS来搜索自定义的网络结构。更多技术细节可以阅读我们的综述论文。

其实不少AI公司都推出了自己的AutoML平台，比如

百度-EasyDL

谷歌-Google Cloud AutoML

阿里巴巴-阿里云机器学习平台PAI（Platform of Artificial Intelligence）

微软-Azure Machine Learning

亚马逊-SageMaker

不过以上平台都是商用的，换句话说你如果想自定义AutoML算法，这些平台并不能满足你的需求。我个人比较推荐的可以自定义的框架（我自己亲测好用的）如下，这两个我真的推荐无数次了，对AutoML感兴趣的朋友一定要试试

微软NNI

华为Vega

另外，我们实验室也基于NNI搜索了用于COVID-19 CT图像分类，这个工作已被AAAI2021接收，代码已开源，感兴趣的可以看看

微信公众号：AutoML机器学习

MARSGGBO♥原创
如有意合作或学术讨论欢迎私戳联系~
邮箱:marsggbo@foxmail.com

huangzhe 网友的相关建议:

谢邀。

2020是艰难的一年，世界似乎放缓了步伐，不过，在人工智能领域，依然有一些新东西，让大家在灰暗的气氛中，看到人类的智慧水平在突破新极限。

1. 《Money is all you need》——钞能力

哈哈原谅我用这个标题，因为2020年出现了两个巨无霸级的语言模型。

第一个是GPT-3，发布于5月份，是著名人工智能科研公司 OpenAI 开发的文字生成 (text generation) 人工智能。当时当时就以1,750亿参数量引发行业轰动，其参数数量让当时的其他模型难以望其项背。到底这个参数数量有多强？来张直观点的图吧。右上角的是GPT-3，图片下方的是其他模型。

当GPT-3出来时，AI行业里的每个人都如下图里的这个小哥，每个人都想拿到access。

虽然我加入了waiting list，但直到现在，我依然还没申请到access。而申请到access的小伙伴就真的是幸运儿了。GPT-3的玩法也是让人大开眼界。例如有人用GPT-3做了自动生成UI，生成代码的工具。

然而，仅仅隔了几个月，参数数量更多的语言模型又出来了。这个模型发布于今年1月初，但由于农历年还没过，所以也勉强算是2020年的突破，嘿嘿。这次是来自谷歌大脑团队的Switch Transformers。前面刚说到的GPT-3有1750亿个参数，而Switch Transformer直接翻个数量级，1.6万亿个参数^[1]

不过除了Money之外的东西还是有点意思的。虽然堆叠参数带来复杂度的提升，但速度上确是有点东西。例如预训练速度比自家的T5-based的快了七倍

另一方面，由于采用了混合专家（Mix of Expert，MoE）对于不同的输入，会选择不同的参数。多个专家（或者专门从事不同任务的模型）被保留在一个更大的模型中，针对任何给定的数据，由一个“门控网络”来选择咨询哪些专家。结果即使参数爆炸，但计算成本不变。

但无可否认的事，即使采取了创新的方法来提升训练效率，Money is still what I need，一般公司真的训练不起。在超大算力资源的加持下，GPT-3训练一次的要花费460万美元，训练时间为355个GPU年，总成本据称达到1200万美元。Switch Transformers的训练费用没有公布，但毕竟比GPT-3还要高一个数量级，所以训练费用估计也是不低的。

2. AlphaFold 2发布，解决生物学届50年难题

AlphaFold2是DeepMind公司的开发的AI系统，没错，就是开发Alpha Go那个公司。AlphaFold2人工智能系统在第14届国际蛋白质结构预测竞赛（CASP）中取得桂冠，得分接近90分^[2]。蛋白质结构预测这是一个很特别的领域，原本我并没有太放在心上。但看了一些报告后，我还是被震撼到了。

这个比赛意在解决克里斯蒂安·安芬森在1972年诺贝尔化学奖的获奖感言中，提出的一个著名的假设：理论上，蛋白质的氨基酸序列应该完全决定其结构。这个假设引发了50年的探索，即能够仅基于1D氨基酸序列通过计算预测蛋白质的3D结构。

然而，一种蛋白质在进入最终的3D结构之前，理论上可以折叠的方式数量是天文数字。到底是多大的数字呢？这么说把，AlphaGo面对的围棋问题复杂度也就是10^171，根据美国分子生物学家Cyrus Levinthal估计，一种典型蛋白质有10^300种可能的构象，也就是说，蛋白质折叠问题比围棋复杂度高出129个数量级！

为了解决这个问题，蛋白质结构预测的评估标准和全球社区CASP于1994年成立，每两年进行一次比赛，推动这个问题的解决。比赛自然有分值，大家认为，90分以上将被认为是与实验所确定的结构相一致。

而AlphaFold2在比赛中得分已经接近90分了，远超上一个版本的AlphaFold，更超越人类组。从这个标准来看，AlphaFold目前的预测结果已经非常接近于实验所确定的蛋白质结构。

马里兰大学的生物学家Shady Grove看到这个结果后感叹：这是一个已有50年历史的问题，我从没想过一辈子中能看到这个。怪不得有的搞蛋白质结构研究的朋友都在纷纷自嘲：「要失业了」。

这里说句题外话。有的说法称「21世纪是生物学的世纪」，不过我认为这句话可能并不完整，21世纪生物学应该会有很大发展，但人工智能在其中将发挥重要作用，即使是搞生物的，也不能忽视人工智能知识的补充。

3. AI帮助人类抗击疫情

人类文明史上有多次重大的疫情。这次新冠疫情已经在全球肆虐一年多了，但这次战疫，人类有了人工智能这个工具。

在传播阶段，人工智能也能帮助人类切断病毒传播途径。根据JPMorgan的研究报告^[3]，在这次疫情中，人工智能和大数据在这几方面帮助人类抵御传染病蔓延：

「人群健康可视化」有助于及早发现、提早干预甚至提前预防
机器人对表面进行消毒有助于控制病毒传播
基因测序和识别病毒蛋白质形状的工具可以加快发现有效的治疗方法和开发疫苗

在诊断阶段，人工智能也帮助人类快速识别患者。例如美国西奈山伊坎医学院科学家团队采用AI算法，将胸部CT扫描结果和临床症状、暴露史及实验室检测结合起来，以快速诊断新冠病毒阳性患者；腾讯开发的AI辅助诊断新冠肺炎的解决方案，在患者CT检查后最快2秒就能完成AI模式识别，1分钟内即可为医生提供辅助诊断参考。^[4]

在治疗阶段，人工智能也帮助人类寻找治疗方案。在新冠爆发初期，新药研发来不及，AI可以从不同角度切入推荐老药新用方案，大大缩短找寻时间。

这让人不禁想，如果AI技术晚发展几年，那么人类在这场疫情中会不会遭受更大的苦难。

4. 公平的AI继续发展

这是我最近比较感兴趣的领域，所以专门做一个章节来讲讲，即使这个领域在2020年看上去突破并没有那么大。

事实上，在机器学习公平性领域，已经有了一些公平性工具包（例如 AIF360、fairlearn、faimess-indicators、fairness-comparison）都提供了分析工具，可以在现有数据集上执行这种基于误差度量的分析。

2020年2月，谷歌发布了ML-fairness-gym，这是一套用于构建简单模拟的组件，用于探索在社会环境中部署基于机器学习的决策系统可能带来的长期影响。在论文《Fairness is not Static: Deeper Understanding of Long Term Fairness via Simulation Studies》（公平性并非静态：通过模拟研究加深对长期公平性的理解）中，对于自动化决策系统对当前机器学习公平性的学术文献中一些既定的长期影响，演示了如何使用 ML-fairness-gym 来对这些影响进行研究。

2020 年 7 月，康奈尔大学 Thorsten Joachims 教授团队发表了公平无偏的排序学习模型 FairCo，一举夺得了国际信息检索领域顶会 SIGIR 2020 最佳论文奖。^[5]

排序是匹配用户和内容（文章、视频、音乐）主要手段。在推荐和搜索场景中，目前的排序算法存在对用户和内容双方不公平的问题。这篇论文提出了一种兼顾公平性、稳定性和实用性的 FairCo 算法，通过构建公平性的无偏统计量，控制曝光公平性以及实际排序的质量，并且可以随着数据的变化而自适应地动态调整。通过FairCo 对用户偏好的分布不敏感，能够解决「富者越富」的问题，

总结与展望

回顾2020年人工智能领域的突破，可以让我们更好的把握趋势。有的人可能看完觉得，2020年的人工智能行业是否发展放缓了？其实，人工智能的发展，并不适合以年作为单位，毕竟行业的发展非线性的。其实现在人工智能领域依然有很多问题亟待解决，例如黑盒子可解释性，推理问题等等。也许有人觉得，2020年的一个趋势，就是人工智能研究对算力要求越来越高，高到只有谷歌这样的大公司才能负担得起，但这里不是隐藏一个很好的机会吗？什么机会？没错，就是设计更高效更精简架构的机会。

而未来五年，十年，我认为会出现几个个趋势：1.轻量化的人工智能将会继续发展； 2. 人工智能专用芯片的效率将会得到进一步提升。3.保护隐私和保证公平的AI将继续得到重视。

但发展速度的话，无法预测。但可以肯定的是，人工智能浪潮也许并不是一直飞速发展，但这浪潮依然还在滚滚往前，不停歇。

参考

^SWITCH TRANSFORMERS: SCALING TO TRILLION PARAMETER MODELS WITH SIMPLE AND EFFICIENT SPARSITY https://arxiv.org/pdf/2101.03961.pdf
^AlphaFold: a solution to a 50-year-old grand challenge in biology https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
^人工智能和大数据成为抗击新冠肺炎的新工具 https://privatebank.jpmorgan.com/gl/zh-cn/insights/investing/ai-and-big-data-new-tools-in-the-fight-against-covid-19
^AI算法可快速诊断新冠肺炎患者准确度与资深胸放射科医生相当 http://www.xinhuanet.com/tech/2020-05/21/c_1126011858.htm
^Controlling Fairness and Bias in Dynamic Learning-to-Rank https://arxiv.org/abs/2005.14713

lokinko 网友的相关建议:

感谢 @亚马逊云科技的邀请，在这里给大家讲讲2020年隐私保护在人工智能领域和医疗领域结合的应用。

随着信息化的普及，智能设备逐渐融入了我们的生活中。在推动社会发展和生产力进步的过程中，也冲击着个人信息安全的保护意识。

肆意横行的“熊猫烧香”病毒席卷全国，给当时网络安全意识薄弱的互联网群体上了第一课，教会大家防火墙的使用意识。

网络购物的普及，也使得钓鱼网站如雨后春笋般层出不穷。钓鱼网站通过模仿官方网站的设计界面，引导并诱骗你输入自己的社交账号密码或者银行卡信息。

近几年整蛊的手机文件恶搞互传，频频中弹的木马病毒......

日益严峻的安全问题折射出了对于个人信息安全保护的缺失。

网络安全、硬件安全、数据安全，归根到底还是信息隐私安全。

今年3·15 晚会集中曝光了一系列的数据安全问题。

智能摄像头滥用人脸识别功能；

消费者只要进了其中一家店，在不知情的情况下，就会被摄像头抓取并自动生成编号,以后顾客再去哪家店，去了几次，科勒卫浴都会知道。人脸信息属于个人独有的生物识别信息，一旦泄露，将严重威胁用户的财产安全、隐私安全等。

个人简历数据被公司员工泄露；

简历信息被盗反映出公司方没有能力保护重要数据、或者因管理能力不足造成了底层员工的监守自盗。包含如此完整的信息泄露以及明码标价，应当用法律的铁拳把这种苗头锤死在土壤里。

手机清理软件窃取用户隐私；

通过对隐私数据信息进行分析，给他们打上“容易被误导”的群体画像标签。各种低俗、劣质，甚至带有欺骗套路的广告和内容接踵不断地推送到老人的手机上，诱骗老年人进行消费。

低复制成本、高效率、高可用性的人脸识别等技术的快速普及，正应验着那句

命运赠送的礼物，早已暗中标明了价格。

随着智能家电走进大众生活，大家是否越来越少感知到它们的存在了呢？

这些智能的背后依托着日常使用的数据，依靠这些数据使得装置变得更加“适用”。

而“适用”的背后又是什么呢？

信息安全问题！

民法典最基本的个人信息数据包括：

身份信息（姓名、地址、身份证号等）；网络数据（位置、IP地址、Cookie 数据、RFID 标签等）；医疗保健和遗传数据；生物识别数据（虹膜、指纹等）；种族或民族数据；政治观点及性取向等。

可以暂停搜索一下自己的大脑，平时有没有可能有哪些隐私容易泄露？

身份信息和种族/民族数据、政治观点等是不是经常出现在简历、调查表里面？

网络数据和生物识别数据是不是在电脑端、手机端里都存放着？

医疗保健和遗传数据是不是在医院资料里也有？

故事还在上演......

卖家表示，只需要一套5000元的破解摄像头软件，就可以搞到家庭摄像的ID用户名和密码。随后，“业务员”向记者演示短短半小时，仅吉林一省全省3000多个家庭摄像头的ID密码就被轻松破解。

人工智能领域对数据的应用可谓五花八门应有尽有。

从 DeepFake 模仿人脸和声音信息进行诈骗和敲诈、到大数据杀熟再到个性化的购物推荐。

隐私数据越是重要，守护它的责任和意义就越是重大。

在人工智能领域内的隐私保护，就要提及近几年广受关注的联邦学习技术了。

2016 年起，Google 团队提出了联邦学习的框架，号称

用户数据不离开本地，减少隐私数据泄露风险。

这个理念引领着研究者对信息安全保护的探索。

既然目前的技术无法完全解释人工智能这个“黑盒“

那么我们在训练模型的时候就采用上传模型参数来替代原有的数据上传。

聪明的想法往往就会令人拍案叫绝，在保证人工智能依旧较强的可用性前提下，联邦学习实现了

隐私保护个体，数据挖掘整体

的理想目标。

AI + 医疗

医疗大数据正在成为行业趋势，

想起我年初在医院拔牙，因为有根牙神经离牙太近，医生诊断可能有风险，

拍完CT影像后，她用了一套智能辅助系统，点击我的牙神经后自动显示存在的风险，

包括拔牙后可能误伤到牙神经会导致面部部分麻痹，拔牙后创面会有多大，牙齿形状该怎么拔等等。

智能 AI 背后依靠着的正是基于用户医疗数据。

但是存在着这样一个问题，每个医院并非都有大量的医疗数据，而少量数据在人工智能技术下的有效性并非那么能够得到保证。

能共享医疗数据吗？

当然不行。医院有严格的数据保护制度，数据绝对不被允许私下共享出去。

传统流程是每次把数据用于新的研究之前，就要向受试者说明，获得受试者的同意。

这样尊重用户知情权的情况下会显著增加医院和个人的工作量，成本难以承受。

对于脑肿瘤分割问题的联邦学习应用

脑肿瘤分割 (Brain tumor segmentation) 是生成对肿瘤部位的准确定位并显示其轮廓，但是由于脑肿瘤在位置，形状等特性的高度不一致性，往往只能通过医生的诊断来确认，因此开发准确的自动分割方法成为了业界公认的挑战。

2020年，SCIENTIFIC REPORTS(Nature旗下)期刊里的一篇文章通过对深度学习模型进行训练，能获得具有优良性能的分割模型，

通过联邦学习架构进行模型上传、聚合、下载的方式，在保证数据不离开本地的情况下达到了传统上传数据 99% 性能的模型。

这对于医学领域来说可谓喜从天降。

大胆展望下未来，乡镇医院共享着优质模型的效果，

对于疑难杂症经验不足的小医院也可以享受到大数据带来的福利。

经验的不足可以由系统辅助支撑。

另一方面，公司们对于隐私的保护也开始逐步推行，

知乎:

当您使用知乎提供的搜索功能时，我们会收集您查询的关键字和您在搜索结果中的点击情况，但仅会存储在您的设备本地，我们不会向知乎服务器上传您的历史关键词。

微信:

我们会收集你的语音内容、待转换的语音或文字信息......我们实时处理之后，向你返回处理结果，不会保存你的数据。

隐私权赋予权利人对私人生活的控制权，

技术的进步不应越过伦理和法规的尺度，

保护隐私就是在保护我们自己。

rumor-lee 网友的相关建议:

列几个自己长期看好且有突破的方向

对比学习

NLP领域的无监督预训练从18年底就爆发了，20年初终于在图像领域也有了突破。

不是生成式的预训练，而是判别式。对比学习的思想是说我们不用抓住数据的所有特征，只需要能判断出单个样本的特征就足够了。

通过对比学习训练出的图像encoder在领域内可以超越有监督数据的训练效果：

更多模型可以参考：

多模态生成

GPT2、GPT3的生成效果不用多说了，强大的OPEN AI再次用transformer实现了文本->图像（DALLE）的多模态生成。

同时基于对比学习训练了开放域的图像-文本关系判别模型（CLIP），在20个任务上都比ImageNet有监督训练出来的编码器要好：

这个模型也在最近被用在了图像修改上，通过StyleGAN与CLIP的组合将图像按照输入文本修改：

通过多模态生成打开脑洞，估计会有不少好玩儿的应用。

风格迁移

图像风格迁移不是很新的技术了，但最近的突破就在于这些应用越来越快速，且可以放到移动端体验。前段时间火爆的「蚂蚁牙黑」：

最近又有更实时的研究成果Facebit：

图像、文本、语音的迁移也有很多脑洞，比如虚拟偶像、视频变脸、模仿个人语言风格的助理。

接下来AI还会高速发展吗？

AI发展是长期的工作，我对接下来2、3年的发展不是很乐观，几年前的AI爆发得力于算力与数据的进步，但目前的技术已经很接近现有算力/数据的天花板，估计需要下一波基础CS技术的突破才会出现更颠覆性的模型。

2020 年过去了，人工智能领域都有哪些突破? 的其他答案点击这里