百科问答小站 logo
百科问答小站 font logo



如何看待兼修网络安全和人工智能? 第1页

  

user avatar   zhu-wang-xiao-miao-o 网友的相关建议: 
      

先上结论:这个问题,我认为不是能否都可以学好的问题,而是说面临着海量的数据和层出不穷的安全漏洞,如果我们在未来还想要解决日益增多的Web安全问题,人工智能是必须应该掌握的一项技能或者说工具。

最近几年,人工智能是热度很高的一个话题。AlphaGo的横空出世,以及紧接着其与李世石的世纪人机大战,可以说是人工智能在公众视野中的最后一个引爆点。

自此之后,越来越多的人工智能产品开始出现在公众视野中,可谓是眼花缭乱,给人的感觉是人工智能遍地开花。

近些年来,基于人工智能的产品更是推陈出新,遍地都是。

包括围棋和象棋等在内的各个棋牌类竞技游戏相继被人工智能攻破;微软搜索开始推出了自己的人工智能产品小冰;百度也开始用码农人肉测试自己的无人车了;Style Transfer技术生成了各种千奇百怪的艺术图片;计算机视觉技术开始进入普通人的生活,同时也接入了如病例分析、医疗影像诊断等医学领域,并且取得了不俗的成果。

无论人们接不接受,都不能改变人工智能正在迅速渗透进我们日常生活的这个现实。

从上面的表述中也可以看出,在机器学习领域,大多数的实用方向都指向了图像识别、广告推荐和个性化画像等,也有人用“黄赌毒”来形容目前AI的落地领域(如纳米酱所云)

相比于上述提到的各个行业来说,网络安全是一个较为传统的行业。因此,在很长的一段时间内,网络安全和机器学习技术是分开来演化和发展的,两者并无交集。基于规则和黑白名单以及人工分析等的检测方法已经发展了很久,使用的技术从规则、黑白名单、模型、沙箱,最后终于发展到了机器学习这条路上,实现了两者的成功会面。

存储和计算能力的爆发式增长,让我们获得了比以往更全面、实时地获取以及分断数据的潜在能力,但面对产生的海量信息.,如何快速准确地转化为业务需求则需要依赖一些非传统的手段。

就安全领域来说,原先依赖于规则的问题解法过于受限于编写规则的安全专家自身知识领域的广度和深度,以及对问题本质的理解能力。但我们都知道,安全漏洞层出不穷,攻击利用的方式多种多样,仅仅依赖于规则进行问题的发现,在现阶段的威胁形势下慢慢就显得不大够用了。依靠极其有限的网络专家总结的经验以及各大厂商之间的样本交换更是如此。

网络安全的防护对抗发展到今天,各种技术已经日趋专业和精细化,通过古老的string-match的防御方式越来越不能适应新的攻击环境。纵观安全行业近十余年的攻击方式,从最早的单机小工具发展到如今的分布式、大数据、自动化等攻击方式,防御的方式不得不随之不断升级,而结合机器学习是必须做出的决定。

例如,安全监控的建立可能会产生海量的web日志数据,如何通过这些数量巨大的数据来分析发现业务异常和安全问题呢?人工智能显然要比人工更加适合这项任务。

从网络安全的角度来看,借助人工智能这项如日中天的工具来解决日益复杂的安全问题是必然的选择;从人工智能的角度来看,网络安全问题或许是人工智能的下一个突破口也说不准。

写到这里才发现,问题描述中提到了“Web安全和人工智能是否可以都学好?”这个问题。所以,基于上述分析,我个人粗浅的认为,不是是否能可以学好的问题,而是说面临着海量的数据和层出不穷的安全漏洞,如果我们在未来还想要解决日益增多的Web安全问题,人工智能是必须应该掌握的一项技能或者说工具。

现如今,已经有一些机器学习/深度学习方面的工作被用来保障web安全,或者应用至安全领域的其它方向。

下面举一些简单的示例,用来说明AI在安全方面的应用

例如,用SVM来识别XSS攻击

利用上述从Web日志中所提取出的特征,在一个各有20万样本的模型上进行训练,并且在一个各有5万样本的模型上进行测试,最后运行结果的准确率已经可以达到80%。

如果我们在更大的数据集上做测试,或者使用其他模型以及进一步增加特征个数和后面环节的半自动化或者自动验证,这个准确率会更高,例如用下面的扩展特征做到了90%以上的准确率。

另外,还可以根据XSS攻击载荷数据来训练模型,并通过指定种子按照需求来生成XSS攻击载荷

再比如,利用隐马尔科夫链来识别DGA域名

除了web的应用,人工智能还广泛涉及到其他安全领域

例如上述的登录日志,通过知识图谱可以构建出如下拓扑结构来识别盗号行为——初步判断activesyncid2可能盗取了mike的账号

还可以通过日志数据来判断是否遭遇撞库攻击

从拓扑图和日志数据可以看出,大量账户从ip1登录且ua字段相同,登录失败和成功的情况均存在,可以判断大概率发生了撞库攻击。

通过使用ADFA-LD中的Java溢出攻击数据可以训练模型来检测Java溢出攻击

识别垃圾邮件

之前和群里的朋友还讨论过关于利用恶意代码图像来检测二进制文件的想法。

这个概念最早是由加利福尼亚大学的Nataraj和Karthi keyan在他们的论文《Malware Images:Visualization and Automatic Classification》中提出来的,思路非常新颖,把一个二进制文件用灰度图的形式展示出来,利用图像中的纹理特征对恶意代码进行聚类。

就目前的文章来看,恶意代码图像的形式并不固定,研究人员可根据实际情况进行调整和创新改进。

人工智能在安全领域的研究和应用越来越多,上面只是举了一些简单的示例。

我认为以后网络安全和人工智能的结合会更加的紧密,利用AI来解决安全问题会成为一种常见的方法和手段。

不能保证全部,但是在某些安全领域,两者兼修是必然的。




  

相关话题

  如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法? 
  如果未来机器最终取代人工劳动,仰仗人力资源的中国经济会不会崩溃? 
  大数据听着很牛,实际上也很牛吗? 
  从围棋角度看李世石与 AlphaGo 的第二局比赛有哪些关键之处? 
  如何看待美国研究人员设计出的「无法被黑的芯片」? 
  大脑的本质就是一个 CPU 吗? 
  如何看待清华首个 AI 学生华智冰? 
  ISP给的100M带宽到底是怎么算的? 
  360发布首款支持国密算法的浏览器对网络安全有哪些影响? 
  从事网络安全领域在以后会吃香吗? 

前一个讨论
每个人都会去世,为什么年轻的时候都这么努力?
下一个讨论
如何评价 Mac 版微信开始内测「朋友圈」功能?电脑版微信使用体验怎么样?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利