百科问答小站 logo
百科问答小站 font logo



人工智能已在哪些领域超越了人类的表现? 第1页

  

user avatar   zhu-wang-xiao-miao-o 网友的相关建议: 
      

谢谢小鱼哥邀请

其实在网络安全方面,也有很多工作运用到了人工智能的技术,并且超越了人类的表现,下面列举一些我所知道的例子,可能一时半会想不全面,之后会慢慢更新。

1.网络攻击

历史上,安全社区一直都是以防御的方式来使用机器学习(ML)的,例如对恶意二进制文件进行分类或发现异常网络流量。但是,在攻击方面,其实也有很多人工智能的参与,并且其效果胜过了人类。

1.1 钓鱼攻击

钓鱼攻击,指的是一种企图从电子通信中,通过伪装成信誉卓著的法人媒体以获得如用户名、密码和信用卡明细等个人敏感信息的犯罪诈骗过程。而网钓,则通常是透过e-mail或者即时通信进行,是一种利用社会工程技术。

如何提高网络钓鱼的成功率呢?这是一个很有趣的问题

在2016年Black Hat USA的议题中,出现了一项有趣的研究:Weaponizing data science for social engineering:Automated E2E spear phishing on Twitter ,研究的主要内容是使得犯罪活动也可以从大数据和人工智能中受益,而不仅仅是入侵检测之类的防御手段。

社交网络,对于美国人来说,尤其是Twitter,可以方便访问很多的个人数据(包括),有着友好的API接口,非常多的文字信息,因此是一个应用AI的极好场所。

攻击的第一步是选取目标对象,首先,会利用twitter的API获取一个twitter用户名列表,然后会提取一部分用户特征,例如用户的网民,在线频率,转发或者发表推文的时间、地点与频率,以及位置等信息,根据这些训练一个分类模型,将用户按照被钓鱼概率的大小排序,然后选取一部分被钓鱼概率较高的用户。

其次,攻击者选取了SNAP_R网络模型,该模型采用了LSTM和马尔可夫模型,能够对特定用户的推文、评论和转发的内容进行训练,来生成用户感兴趣的话题和内容,然后发送钓鱼推文来入侵被攻击者。

根据文章内容显示,采取上述措施之后,钓鱼推文的成功率最高可达66%,而通过人类手工筛选用户发送,成功率只有45%左右,如果随机发送,成功率最高只有14%。

1.2 恶意软件样本生成(GAN)

生成对抗网络(Generative Adversarial Network,GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。生成对抗网络由一个生成网络与一个判别网络组成。

生成网络从潜在空间(latent space)中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出。

其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

这项工作很,容易被人想到去隐藏一些攻击样本,使得当前的恶意检测工具失效,来达到黑客入侵的目的,很显然,他们也做到了。

文章:Generating Adversarial Malware Examples for Black-Box Attacks Based on GAN 中就设计了这样的方法(MalGAN),通过MalGAN方法来生成对抗恶意软件样本,逃避现有的检测软件。

他们的实验结果很完美,几乎做到了100%的逃避率,完胜人工队

2.网络防御

2.1 漏洞分析

CGC(Cyber Grand Challenge),这是美国DARPA(国防高等研究计划署)举办的自动网络攻防竞赛。CGC旨在建立实时自动化的网络防御系统,并且能够快速且大量的应对新的攻击手法,来应对频发的网络攻击,并降低攻击出现到防御生效之间的时间差。

2016年的Defcon CTF比赛上,迎来了漏洞分析领域首次人机黑客的大战,比赛最终由来自ForAllSecure的机器人Mayhem夺得了冠军。

利用AI来挖掘漏洞,应该是以后的必然趋势了,因为目前很多病毒的感染性很强,传播速度极快,且构造越来越复杂,单凭人类自身以及很难跟上这样的速度,也很难分析出如此复杂的漏洞了,必须要以来自动化的AI工具才行。

虽然目前利用AI来挖掘漏洞目前还存在一些例如逻辑漏洞无法检测等等的局限性,但我相信AI在漏洞分析领域的普遍使用是以后的必然事件。

2.2 提高恶意检测器效果

这篇工作出自网络安全四大顶会之一的CCS,即2020年CCS论文《Enhancing State-of-the-art Classifiers with API Semantics to Detect Evolved Android Malware

文章提出利用将API 语义聚类的方法,来检测不断改进的安卓恶意软件,称为API-Graph的框架,使用 API 语义的相似性来增强安卓恶意软件检测器的效果,用来代替之前的人工不断更新。

目前对Android恶意软件的改进,主要通过再学习或者主动学习,这样做会付出很大代价,即成千上万个恶意软件样本的标签和巨大的人工成本,劳动里都浪费在这里了,效率很低,而且人工改进后的检测器很快又会被攻击者所逃避,能正常使用的时间非常短。

这篇文章的工作,通过检索语义等效的相似API的使用,利用改进的Android恶意软件之间的相似性API语意信息来增强最新的恶意Android软件分类器,从而降低分类器的退化速度,节省了大量主动学习和再学习所需的人工工作,并且达到了更好的防止分类器衰退的效果。

研究主要利用恶意软件开发人员倾向于使用语义相似的API来实现相同或相似的功能这一点,来完成防御工作。

结果表明,API-Graph可将四个分类器中要标记的样本数量显着减少32%–96%,并且模型的可持续性和空间稳定性都大大增加。

以上,谢谢


user avatar   youngfish42 网友的相关建议: 
      


为什么提出这个问题

自问自答,先碎碎念一下~

这个问题其实是在回顾 你所在的行业有哪些说出去很「凡尔赛」的发展成果 时想到的,

要说人工智能领域的发展,肯定还是需要同人类进行比较。


那么常听说人工智能表现很好,到底好到什么程度,如果只用简单的数据可能还是不太明白,

但如果能和人类的表现作比较,我们就能较为方便地知道到底好在哪里。

更进一步地,如果人工智能在某些领域已经获得了超越普通大众,超越人类熟练者,

甚至超越人类顶级专家的表现,那无疑说明这个领域已经取得了较好的成果。





经过多方查询,小鱼发现 wiki 上已经整理了这样的一份清单[1]。现简要展示如下:

评价等级说明

(根据与人类表现的对比区分)

  1. 最优表现(不会有更好的表现了,有些是人为解决的)
  2. 超人表现(比所有人类表现得更好)
  3. 高人表现(比大多数人表现得更好)
  4. 类人表现(与大多数人表现得相似)
  5. 亚人表现(比大多数人表现得更差)

举例

现在列举一下前两项(最优表现超人表现)。

最优表现

  • Tic-tac-toe (井字棋)
  • Connect Four: 1988
  • Checkers (aka 8x8 draughts)(西洋跳棋): Weakly solved (2007)[26]
  • Rubik's Cube(魔方): Mostly solved (2010)[27]
  • Heads-up limit hold'em poker: Statistically optimal in the sense that "a human lifetime of play is not sufficient to establish with statistical significance that the strategy is not an exact solution" (2015)[28]



超人表现





后面其他例子就不再赘述,有时间梳理人工智能史的时候,

或许会将上面的竞争故事逐一盘点下来~ 有兴趣请参照下面的界面:


总的来说,人工智能已经在少数领域取得了超越人类的表现,

但是这并不意味着现在的人工智能有思考的能力,

当前发展的人工智能尚属于弱人工智能的范畴,

强人工智能(AGI)的研发还处于非常初级的阶段。




人类和人工智能的进步依旧任重而道远!

参考

  1. ^Progress_in_artificial_intelligence https://www.wikiwand.com/en/Progress_in_artificial_intelligence

user avatar   ding-wei-feng-69 网友的相关建议: 
      

这个还蛮多的,我说一个日常接触到的领域吧。

CT+AI 的辅助诊断,准确率已经和影像医生很接近,甚至超过了。商汤,觅影的一些产品已经进入商用阶段了,新冠识别率有些能到96%。 CT 的AI辅助诊断,很多医院都开始引入进来,作为一个辅助手段来帮助影像医生提高工作效率,减少人为的错误。

我是比较乐见AI在医疗领域的使用的,特别是影像这块。AI在处理影像,做特征分析和识别上还是比较擅长的,如果不求100%准确率,只是作为辅助诊断的话,是有助于更加有效的治疗病人的。

缺点也是有的,就是对带宽要求很高,百兆光起步,最好独占千兆光纤,但这个消耗对于增加的医疗准确性来说,不算太大。


user avatar   huangzhe 网友的相关建议: 
      

可以说是非常多领域了。这里列举一些:

  • 1997年5月,IBM开发的深蓝,击败国际象棋世界冠军卡斯帕罗夫。
  • 2016年,alpha go战胜李世石,柯洁。
  • 图像和物体识别领域,完胜人类。

更详细的可以参考小鱼的这个列表:人工智能已在哪些领域超越了人类的表现?

实在太多了,没法全部列举。列举这些领域,不仅费时费力,而且难以记住。

我们如何判断人工智能在哪些领域超越(或者即将超越)人呢?

在多数条件和边界都清晰的决策对弈边界清晰的任务中,人工智能早已超过人类。

如果「边界和条件清晰」的决策中还没超过人类,那就是边界比较大,算力(钞能力)还没到达那里,但超过人类是迟早的事。复杂度越低的游戏,AI越容易超越人类。

例如我们都知道,象棋AI很早就战胜人类了,而围棋AI战胜人类则是这几年的事。根据微软研究院的一篇文章[1],各种游戏的复杂度如下:

国际象棋比围棋复杂度低了一百多个数量级,所以战胜人类的国际象棋AI很早就出现,而战胜人类的围棋AI出现得较晚,很符合我们认知,是吧。这里补充点,去年AlphaFold2解决的蛋白质预测问题,复杂度是10^300,也就是说,蛋白质折叠问题比围棋复杂度高出一百多个数量级!这也是为啥这个成就不仅仅在生物界翻起巨浪,而且也令整个科技界震惊,因为人工智能能解决问题的复杂度又上了新台阶。

这里引出一个问题,为啥还没出现完全战胜人类的麻将AI?

因为从博弈论的角度来讲,围棋是完全信息动态博弈,而麻将属于非完全信息动态博弈。相比完全信息博弈游戏的人工智能,设计能够在非完全信息博弈项目上战胜人类的人工智能程序要难得多。在麻将对局中,每位选手只能看到自己的 13 张手牌与已经打出去的牌,场内大量的隐藏信息无法看到。过高的随机性影响了算法模型的训练。

虽然麻将AI无法在单局中保证战胜人类,但如果是多场麻将比赛综合呢?如果从这个角度看,AI也能战胜人类。2019年,微软开发了麻将AI Suphx,在竞技平台“天凤”上超越该平台公开房间顶级人类选手的平均水平。

日本在线麻将竞技平台“天凤”,因其完善的竞技规则、专业的段位体系,成为了业界知名的高水平专业麻将平台,受到职业麻将界的广泛承认。天凤吸引了全球近 33 万名麻将爱好者,其中不乏大量的专业麻将选手。

登上天凤十段后,Suphx 在 5000 余场比赛中的稳定段位超过 8.7,相比人类顶级玩家的 7.4,整整高出了 1.3 个段位,以往最强的「爆打」的稳定段位更是只有 6.5。

在条件和边界不清晰的决策中,人工智能还没完全超过人类(但不代表没机会超过)。


而在涉及情感方面的领域,AI依然落后于人类。例如心理咨询之类的。因为人类自己都不知道自己有些能力是怎么获得的,例如同理心,AI能做到吗?虽然说AI可以通过语料分析或则面部识别来判断人类当前心情,但人类的情绪并不是只有「高兴、悲伤」等几种状态的,人类情绪更多的时候是「五味杂陈」。

参考

  1. ^哪类游戏AI难度更高?用数学方法来分析一下 https://www.msra.cn/zh-cn/news/features/difficulty-of-ai-games



  

相关话题

  机器学习能否用于综合评价?具体怎么操作? 
  学习人工智能,术语看不懂怎么办? 
  如何评价字节跳动 AI 副总裁马维英离职,将加入清华大学张亚勤团队? 
  什么是「科技自立」?我们如何实现科技自立? 
  你曾经都被哪些黑科技「电」到? 
  据各种情报综合分析,这两天知乎被谁攻击了? 
  如何利用「EQ 均衡器」进行调音,音质效果如何? 
  如何评价FAIR提出的MaskFormer,在语义分割ADE20K上达到SOTA:55.6 mIoU? 
  是否可以通过科技使生物一劳动就释放多巴胺? 
  全面屏已经够大了,折叠屏是伪需求吗? 

前一个讨论
2020 年过去了,人工智能领域都有哪些突破?
下一个讨论
如何看待中方专家组称在蝙蝠和穿山甲中发现的冠状病毒相似度不足以使其成为新冠病毒的直接祖先?





© 2025-01-19 - tinynew.org. All Rights Reserved.
© 2025-01-19 - tinynew.org. 保留所有权利