百科问答小站 logo
百科问答小站 font logo



如何看待 AI 换脸软件「ZAO」的爆火? 第1页

  

user avatar   tiancaomei 网友的相关建议: 
      

有几个细节:

  1. 它的视频素材,看到了抖音、爱奇艺、腾讯视频、芒果的LOGO。这保证了素材最基本的娱乐性和话题性,这实际上是二(三)次创作?如果一个用户从抖音里下载后上传素材,素材是会在平台内部公开流通的,这样原始素材不知道怎么定义版权和法律风险。原本apple store里也有很多影视剧换脸的app,它们没有这么多有话题的起始素材。这个结合授权协议,意思就是不负责原始视频素材里的肖像权。
  2. 视频是预先处理过的,大家实时上传图片,大量降低了处理视频所需的实时算力(虽然现在服务器已经排满了)
  3. 人脸处理和识别已经很成熟了,速度很快,所以看到有一些自动查找面孔、名人肖像权匹配的基础功能
  4. 同样可以制造fake面孔表情包,但是话题性就不如从抖音等挑选的素材。

Finally. 这是一个fake face对个人用户的应用范例,把一个鬼畜视频制作工具,功能性减弱,却把社交性和传播性发挥的很好。

原本的医疗图像、安防监控都是对大公司、技术驱动的,AI和个人用户市场需求的结合或许预示着公共AI(云)算力市场即将火爆起来。

附上版权声明。


user avatar   fei-te-yang-51 网友的相关建议: 
      

不是新鲜玩意儿。github上早就有了:

这个项目实际上是一个利用机器学习来替换视频中的面部的工具,通过运行脚本可以直接使用。

通过收集原图像和替换图像的大量视频和图片素材,将素材剪辑成为段视频,替换data_src.mp4和data_dst.mp4,然后使用一些脚本修改其中的参数,可以得到训练之后的模型,最后会将换脸后的图片合成视频。当然,这个不是最早的技术,2017年左右Deep fakes才算是最早的“换脸”产品,然后在外网势不可挡(后因大量被用于P站,遭到各大“被换脸”女星抵制)。

法律、道德等维度都有高赞回答谈到了,我们就聊下实际使用的技术

从本质上来说,类似ZAO这样的“换脸”是一种使用AI深度学习,从而将一张图片中人的脸换到其他人的图片上的技术。事实上,被“换脸”的视频在运行中也是被拆分为图片了,所以它和换脸人的图片要求基本一样,视频要清晰,视频中要只出现被换脸人的一个人的脸,如果有其他人的脸,需要把它去掉。

当然,最开始这项技术对硬件和视频、换脸人图片的质量甚至是数量都有非常高的要求:

硬件方面,尽量1060往上,内存至少8g,这只是标配,在这个标准配置下,图片训练时间至少为6小时。(低于这个配置也可以跑,但质量和耗时就不好估量了)

满足条件后,训练一个AI换脸模型需要3个步骤:

  1. 提取数据
  2. 训练
  3. 转换

其中,1和3用到了数据预处理,另外3还用到了图片融合技术。所以主要包含的技术框架有:图像预处理、网络模型、图像融合等

具体原理思路为:对于每张脸,都训练一套编码器和相应的解码神经网络。编码时,使用的是第一个人的图片。而解码时,则使用第二个人解码器。

也就是说,既然我们想要将两张脸互换,那么我们可以设计两个不同的解码网络,也就是使用一个编码网络去学习两张不同人脸的共同特征,而使用两个解码器去分别生成他们。

因此,设计一个输入端或者说一个编码器,分别输入两个不同的脸,然后两个解码器,就可以通过隐含层来分别生成两张不同的人脸了。

回归到ZAO上来,在我看到这个问题时,ZAO的服务器已经崩溃了

我预估,接下来的节奏应该是:

借钱 -> 抵押 -> 融资 -> 被起诉 -> 不妥协 -> 被取代 -> 被监管 -> 妥协 -> 融合 -> 变现 -> 离场


user avatar   julyedu.com 网友的相关建议: 
      

大概就是背心上缺个logo吧。



user avatar   huangshang98 网友的相关建议: 
      

我来给你回答这个问题吧。

其实这个问题不难理解,你要想理解什么是逻辑思维,你就首先要明白什么是逻辑。

逻辑是一个数学概念,逻辑这种数学概念主要包含了两种数学运算,一种叫做是非运算,也就是在0和1中间做与或非运算,这种运算叫做逻辑代数或者叫做布尔代数。与或非是三种最基础的运算方式。另一种是集合运算,例如一个班级的所有学生可以形成一个集合,其中男生可以单独形成集合,女生也一样,而班级的集合是男生和女生集合的和,一个集合如果没有成员,那这个集合就是空集。我们初中都学习过集合的概念,我就不详细说明了。

上面这段话我大概说明了一下什么叫做逻辑,我真正要告诉你的是,所有的数学法则都是用逻辑的运算法则来结构在一起的。而我们真实的世界是使用数学法则来运作的。换句话来说,运用正确的逻辑分析,你可以把世界上所有的事物都互相联系起来,形成逻辑的闭环。

而符合现实的逻辑闭环,就是科学体系。科学本身有两个要求,第一要求要符合现实世界,第二要求就是符合数学法则。可以看出来,数学和逻辑本身是没有差别的,严格来说,这两者是同义词。逻辑是数学的一个分支,而所有的数学都要依靠逻辑来支撑。逻辑是数学的核心,如果你认为他们俩是一回事,也不算错。我就是这么认为的。

因为现实世界是依靠数学法则来运作的,所以,你要想正确的理解现实世界,你就必须把自己的思维调整到用数学方法来理解世界这个频道上来,而这,就是逻辑思维。

希望我上面说的你已经能够理解了,然后我就可以继续说下去。

那么怎么判断一个人的逻辑思维是否清晰呢?

要说明这个问题,就必须提到一个新的概念,叫做知识结构。每一个人都是拥有自己的知识结构的。在他的领域范围之内,他是可以拥有清晰的逻辑思维的,但超过这个范围,一般的人都无能为力。

差别只在于,这个人的知识结构的范围有多大,拥有多大的覆盖面积,还有他拥有几个知识模块而已。这里我又提到了一个知识模块的概念。我必须说明一下。

人类的大脑,在认识现实世界的时候,有两个基础功能,这两个功能是分类和寻找规律。人类大脑试图在普遍的事物中需找规律(所谓的寻找规律,就是用逻辑方法理解事物),以便于理解,但这往往是不能做到的,于是不得不把能够互相理解的事物归类在一起,形成一个知识模块,一般人都有若干这样的模块,人类依靠这些模块来认识和分析客观世界。

这段话可能很抽象,必须举例子了。

例如人类观察地面上的物体运动,发现凡是你不推车,车就不走,普通如此。于是人类认为,因为力的作用,物体才运动起来。没有持续的力,物体就会停止下来。这就成为一个知识模块,固定到人类的大脑中。相反,人类观察天上的星星,发现没有人推动,星星还是在运动,于是人们认为,天上是和地上不一样的,是另外一个领域,这就是分类。人类把运动分成了地上的运动和天上的运动两类,分别用不同的规律来总结。寻找规律和分类是人类大脑处理现实世界复杂关系的两种方式。而我上面说的这些就是古人理解的力学体系。

我们现在知道,天上的运动和地上的运动其实是拥有统一的规律的,这个规律就是牛顿力学系统,因为牛顿,这个分类被取消了,成为统一的一个模块,这叫做模块的融合。人类科学的进步,就是把这样一个一个的零散模块融合成一个模块的过程。

当然这是对人类整体来说的,对于单个的人来说,即便给你一本物理课本,你可能还是学不懂,你的思维中还是一个一个的模块,力学是力学,光学是光学,热力学是热力学,各自是独立的模块。但对于真正看懂的人来说,他们其实是一个整体。整个物理学是一个逻辑的整体。

什么叫做知识结构?所谓的知识结构就是一个人头脑中的模块的覆盖范围和模块的个数。模块个数越少的人,他的知识的互相融合就越彻底,思维系统就没有缝隙。单个的模块覆盖的范围就非常的大。例如,其实物理和化学是可以有机融合的,和生物学也有联系,而数学是所有学科的共同母亲。如果你真正把书读透了,就会把这些都融合成为一个模块。而在这些模块的覆盖范围之内,你的思维就绝不会有矛盾,上面我们已经说了,世界上的万事万物是可以依靠逻辑闭环完美链接的。你能做到的你的头脑中的一个模块的覆盖范围越大,那你拥有的逻辑思维能力就越强大。知识体系越完整的人,他头脑中的模块的数量就越少。相反,一个人的头脑中的模块越多,说明他的知识结构越凌乱,这种人往往面对具体问题会陷入凌乱之中。

当然,我们人类还不能做到让整个大脑成为一个模块统一运作,因为我们的科学体系本身还做不到这一点。因为物种起源的问题没有解决,物理学和生物学还是不能逻辑统一的,同样很多社会学科和自然学科是独立运作的。但真的有些人可以让自己的大脑只拥有少数几个模块,就足够应付一切事物了,那这种人,就是那种拥有强大的逻辑思维的人。

你现在理解什么叫做知识结构了吗??

分类机制有什么好处呢?分类是一种偷懒的方法,也是一种不得不用的方法,因为人的能力有限,不得不做分类这种处理。凡事找不到事物互相联系的规律的就分类,然后大脑就可以正常运作了,用来指导生活有时候也够用了。但问题是,总有些问题是我们不知道是使用那个模块来处理比较好的。于是这时候人就处在矛盾之中,因为他自己的矛盾之中,他的思维方式就不可能完整,最终的表现就是这个人逻辑混乱。

我们的生活中其实常常看见这种人。明明是有互相联系的两件事情,但他使用两个模块来分别处理,于是这两件事的逻辑链条就被斩断了。他自己的思维混乱还不听你说,因为在他的知识结构中没有办法理解两件事之间的逻辑关系。

这种事情往往发生在意识形态领域,因为在社会领域人类的知识实在是太凌乱了,本质上人是选择自己愿意相信的去相信而已。对自己不愿意相信的信息视而不见而已。

我的这篇东西可能写的有一定的深度,要正确理解可能有难度。不过我相信会对你有好处,因为你在别的地方是看不到这种知识的。

怎么判断一个人的逻辑思维是否清晰?首先你自己要拥有清晰的逻辑思维能力,否则胡搅蛮缠的那个人可能是你,其次,只要你自己拥有正确的知识体系,你是很容易理解对方的思维方式的。你甚至能正确判断对方的思维方式,判断出他的知识结构和他的模块的运作方式。

有经验的人是能够快速看懂一个人的,当然,这是一个积累的过程。拥有这种能力并不容易。

我在这里要说的是,世界上各种各样的人都有,不要因为你觉得自己是正确的就和别人辩论。 要改变一个人是非常难得,要改变一个人的知识结构是非常难得,除非他自己有这种意愿。但一般成年人都不会有这种意愿的。所以要学会和各种各样的人打交道的方式,这本身就是情商。

我给你的结论是,

通过谈话判断一个人的思维是可以做到的,不光能判断出他是否拥有逻辑思维,甚至能判断出他的知识结构,知识模块等等。但拥有这种能力是一种长年累月的积累,你是否拥有这种积累才是关键。

以上!


user avatar   gu-te-8 网友的相关建议: 
      

朋友太漂亮,那就把她拿下,性别不要卡的太死,因为要攻略美女很刺激有了目的性反而会更期待见面走在一起,我就是这么做的,所以现在这个大美女朋友不但一直和我在一起还给我钱花,我说的很粗俗很离谱可人活一次管那么多世俗规则干嘛。




  

相关话题

  当人工智能复杂到超出任何人类的理解能力时应该如何管理? 
  当前(2020年)机器学习中有哪些研究方向特别的坑? 
  三维重建 3D reconstruction 有哪些实用算法? 
  机器人有办法绕开人类为他们设定的三大原则并统治人类吗? 
  如何看待大厂争相发布 数字人 / 虚拟人 / 数智人,有哪些关键信息值得关注? 
  如果中科院自动化所黄国平博士所学专业为生化环材等天坑专业,他的博士论文致谢会如何写? 
  双12想买台按摩椅,预算2W左右有推荐的吗? 
  2020年,多标签学习(multi-label)有了哪些新的进展? 
  如何看待AI杀入斗地主领域,快手DouZero击败344个AI排名第一?未来人类斗地主能斗过AI吗? 
  如何评价deepmind最新在nature上发表的论文《在人工网络中用网格样表征进行基于向量的导航》? 

前一个讨论
从 1977 年恢复高考到现在,上大学发生了哪些变化?接到大学录取通知书是什么体验?
下一个讨论
如何看待 8 月 30 日乱港分子黄之锋被捕一事?





© 2024-11-25 - tinynew.org. All Rights Reserved.
© 2024-11-25 - tinynew.org. 保留所有权利