问题

为什么b站突然多了很多《unravel》对口型的视频?是怎么制作出来的?

回答
Bilibili(B站)上突然涌现大量《unravel》对口型视频的现象,通常是由于以下几个因素的叠加所致,并且它们的制作过程也涉及一系列技术和创意:

一、 为什么B站突然多了很多《unravel》对口型视频?

1. 经典IP的强大生命力与情感共鸣:
《东京喰种》的影响力: 《unravel》是动画《东京喰种》的第一季OP(开场曲),而《东京喰种》本身是一部在全球范围内拥有庞大粉丝基础的经典动漫。它深刻的主题、引人入胜的剧情和极具辨识度的角色,让许多观众(尤其是经历过那个时期追番的80、90后)对它怀有深厚的情感连接。
《unravel》本身的音乐魅力: 这首歌本身就极具感染力,由TK(凛として時雨乐队主唱)创作,旋律激昂而又细腻,歌词充满挣扎、痛苦和对真相的追寻,与《东京喰种》的主题完美契合。它能够触动人心最深处的情感,很容易引起共鸣。
怀旧与情怀驱动: 在动漫内容日益丰富和更新换代的今天,许多观众会回溯经典,重温那些曾经触动过他们的作品。《unravel》作为代表性的歌曲,成为了引发怀旧情绪的“引子”。

2. 梗文化与二创传播的特点:
“听歌识曲”的代表: 《unravel》的旋律和开头的钢琴声已经成为一种“梗”,很多人听到前奏就能立刻反应过来。这种“大家都在听”的心理会促使更多人尝试去二次创作。
社交平台传播效应: 一旦某个平台或圈子里开始流行某个内容,社交媒体的放大效应会迅速将热度扩散到其他平台和用户群体。可能是一个小众UP主的作品意外走红,引发了连锁反应。
“XX对口型”的流行形式: 在B站等视频平台,“对口型”视频是一种非常流行的二创形式。它门槛相对较低,容易参与,并且可以通过UP主本身的表现力(表情、动作、道具等)来赋予歌曲新的生命力,增加观赏性。

3. 技术门槛的降低与工具的普及:
手机拍摄与剪辑: 现代智能手机的拍摄质量已经很高,配合各种易用的手机剪辑App(如剪映、VUE等),即使是普通用户也能完成基础的视频录制和剪辑。
AI技术辅助(可能): 虽然不一定所有视频都用到,但近年来AI技术在视频制作领域的应用越来越广泛。例如,AI换脸(Deepfake)技术如果被滥用(虽然不常见于《unravel》的对口型视频,但整体上是这类视频制作的技术可能性之一),或者AI音频处理工具,都能降低制作难度或提升效果。但对于单纯的对口型视频,更多还是依靠传统的拍摄和剪辑。
特效和滤镜: 许多视频编辑软件提供了丰富的滤镜和基础特效,可以帮助UP主快速提升视频的视觉效果,使其更吸引人。

4. 用户互动与社群驱动:
挑战与模仿: 看到其他人制作的优秀对口型视频,会激发用户的模仿欲望,形成一种“挑战”或“跟风”的社群效应。
评论区互动: 观众在视频下方的评论区互动,分享自己的感受、推荐其他版本,进一步推动了内容的传播和讨论。

二、 《unravel》对口型视频是怎么制作出来的?

制作一个《unravel》对口型的视频,通常包含以下几个步骤,具体根据UP主的技能和追求效果的程度有所不同:

1. 选定版本与素材准备:
歌曲选择: 选择《unravel》的原版歌曲,或者一些优秀的翻唱版本。许多UP主会选择原版以获得最经典的体验。
视频素材:
原版动画片段(常见): 这是最核心的素材来源。《东京喰种》第一季的动画片段,尤其是主角金木研在情感爆发时的一些经典画面,是用来匹配歌词和情感最合适的。UP主需要从动画中截取出合适的片段。
其他UP主的作品(少数): 有些可能是在其他平台看到好的二次创作,然后重新加工。
真人对口型(特定类型): 一些UP主会自己出镜进行对口型表演,这需要一定的表演能力和场地设备。

2. 核心对口型技术(真人或动画剪辑):
真人对口型:
录制: UP主自己或找人根据《unravel》的歌词,用夸张或内敛的表情和口型进行对嘴表演,然后用摄像机或手机录制下来。
表情与情感捕捉: 这是真人对口型成功的关键。要能传达出歌曲中那种痛苦、挣扎、宣泄的情感。
动画片段对口型(更常见于B站):
素材选取: UP主需要仔细观看《东京喰种》第一季,找到与《unravel》歌词情感和节奏最匹配的动画镜头。例如,唱到“tell me why”时,可能需要金木悲伤绝望的特写镜头;唱到高潮时,可能需要他爆发或战斗的画面。
剪辑与匹配:
音频处理: 将选定的《unravel》歌曲导入剪辑软件。
视频剪辑: 将从动画中截取的片段导入,并根据歌词和歌曲的节奏逐帧地剪辑和排列。
口型同步(关键): 这是对口型视频制作中最耗时和技术要求最高的部分。
基本操作: 对于动画片段,UP主会尽量找到人物张嘴说话的画面,并与歌词的音节进行匹配。这需要非常细致的观察和时间轴的精确调整。
“替换”或“叠加”: 有时为了更精准的口型同步,UP主可能会将一个角色嘴型变化的动画片段“剪辑”出来,然后精确地叠加到另一个相似但口型不符的画面上。或者寻找多个相似嘴部动作的片段进行快速切换。
特效与转场: 为了使画面流畅自然,会使用各种转场效果(如淡入淡出、画面叠化、切镜等)来连接不同的动画片段。

3. 后期制作与优化:
调色与滤镜: 为了营造特定的氛围(例如《东京喰种》的压抑、血腥感),会使用暗色调、高对比度的滤镜,或者模拟胶片质感。
字幕添加: 通常会添加中日文歌词字幕,方便观众理解歌词内容,也为对口型提供参考。
音效处理(可选): 有些UP主可能会在关键的歌曲节点添加一些特殊音效,增强表现力。
画面特效(可选): 如果追求更强的视觉冲击力,可能会添加一些简单的画面特效,比如颜色突变、粒子效果等,但要注意不要喧宾夺主。
分辨率与编码: 最终输出为合适的视频格式和分辨率,以便在B站上流畅播放。

总结制作流程的关键:

理解歌曲的情感和歌词意境。
选择最能代表这些情感的《东京喰种》动画片段。
通过精密的剪辑和时间轴调整,将动画画面与歌曲的节奏和歌词精准匹配。
对于动画片段,最大的挑战在于找到并调整人物的“口型”画面来吻合歌词的发音。
后期通过调色、滤镜、字幕等手段,强化视频的整体风格和观看体验。

总而言之,B站上《unravel》对口型视频的流行,是经典IP的强大号召力、网络文化传播的特点、技术门槛的降低以及用户之间互动效应共同作用的结果。而这些视频的制作,虽然看起来只是简单的对口型,背后却凝聚了创作者对歌曲、动画以及剪辑技术的深刻理解和耐心。

网友意见

user avatar
From: The Verge; 编译: Shelly 公众号:将门创投(thejiangmen)

最近B站多了很多口型同步Deepfake视频,这股风其实是从油管刮过来的。具体制作方法可以在YouTube上搜索“ Wav2Lip”,就能找到大量教程。现在B站也有很多Deepfake制作的简易教程啦!

随着人工智能的飞速发展,简简单单几行代码就能实现照片换脸,Deepfake的视频制作也变得越来越简单。让我们来看看Deepfake究竟如何从编程师的算法变成人人都能掌握的一项技术的~

Deepfake的风靡,油管点击量平均过万

如何将网上找到的随机代码变成真正的Deepfake呢?从詹姆斯·文森特的经验来讲,需要两个因素:时间和耐心。

文森特撰写关于Deepfake的文章数年,所以当他看到口形同步算法的时候,他眼前一亮,知道他必须自己尝试一下。

AI口形同步的基础原理简单到让人不敢相信。你只需要找一段视频,然后把你想要的音频放进去就好了。使用代码将这两件事混搭在一起,嘿,很简单,Deepfake完成了。

最终结果是像这样,伊丽莎白女王唱着Queen乐队的视频:

或是一群动画人物唱着破嘴乐队Smash mouth的ALL STATS:

或者是特朗普模仿着爱尔兰经典:

爱尔兰设计师詹姆斯·凯勒赫(James Kelleher)别出心裁地制作了“女王唱女王”的口型同步视频。他在推特上写道,他用的是网上现成的技术来合成视频与音频的。

几周前在全网公开发布的技术叫Wav2Lip,最初是免费的,网络上还有合成演示方法供大家参考。但现在想要使用就得先注册了。

该作品的作者之一K R Prajwal说这么做是为了劝阻恶意使用,虽然对于一个精通编程的严重犯罪者来说这些措施只是杯水车薪。侧面我们也可以看出,口型同步应用一旦成熟,正面和负面的可能都是无穷大的。

Prajwal和他的同伴发现这个程序可能进军的领域非常多,好处也显而易见,比如制作动画配音和为电影选择全球语言。

Prajwal直言把代码传到网上是希望这项技术能开花结果、更有成效,同时他强调使用他们软件的用户应该明确标明视频是合成的。

与Wav2Lip算法的一场持久战

算法仍需进步以适应更多普通用户

在初次尝试中,文森特确定了视频主人公——苹果首席执行官蒂姆·库克,以及希望和库克口型同步的音轨吉姆·卡里。

文森特使用Quicktime的屏幕录制功能下载了视频素材,并使用了名为Piezo的应用下载了音频。

然后,得到了两个文件,并将它们插入站点并等待...等待....

最终,什么都没有发生。

文森特之后尝试了降低视频分辨率、采用其他的样片,都没法合成音频和视频。

AI口型同步技术的随机障碍对使用者是一个不小的挑战。一个小时后,文森特放弃了自我尝试并转向Kelleher专业人士求助。Kelleher建议他重命名文件并删除任何空格,“出人意料”地,重命名和删除空格后,视频成功了。

现在,一段蒂姆·库克(Tim Cook)的片段配上吉姆·凯瑞(Jim Carrey)用电脑测试《雷蒙·斯尼奇的不幸历险》A Series of Unfortunate Events的音轨生成了。

文森特事后评论:“这太可怕了,无论是在幽默感还是在视觉逼真度上,我的作品都粗制滥造。但无可否认的是,我还是非常有成就感!”

用户的成就感带来软件忠诚度和潜在流量。

文森特为了改善这些结果,想更直接地运行算法。为此,他转向了口型同步编程师的Github。编程师和他的团队在Github上传了底层代码。

虽然程序猿们已经把Github用得滚瓜烂熟了,但我们再用最精短的语言为萌新们介绍一下:GitHub是一个面向开源及私有软件项目的托管平台,因为只支持Git作为唯一的版本库格式进行托管,故名GitHub。其注册用户已经超过350 万,托管版本数量也是非常之多,其中不乏知名开源项目 Ruby on Rails、jQuery、python 等。

文森特使用Google Colab来运行它,Colab的编码与Google Docs的编码等效,可以用它在云端完成机器学习项目。编程师通过简单的代码罗列来完成所有工作,但对于文森特这样的非技术人员,依然困难重重。

关于Google Colab,小编也在这里多说两句。对于初学者来说,Google Colab是一个利好软件,可以无偿使用服务器级别的GPU来做学习。但对于进阶的AI研究或中度使用,这个平台的意义有限。

如果你看不懂以上,也没有关系......就把Google Colab想成练习Python的“工具人”吧。

Wav2Lip算法亟需改进用户体验

话说回来,我们继续来看文森特使用AI口型同步软件的踩雷计:

“为什么我不能授权Colab访问我的Google云端硬盘?

大概是因为我登录了两个不同的Google帐户= =

为什么Colab项目无法在Drive文件夹中找到神经网络的权重?

因为我下载的是Wav2Lip模型,而不是Wav2Lip + GAN版本...

为什么我上传的音频文件没有被程序识别?

因为我在文件名中拼写了aduoi !”

这......累了,虽说这些问题AI口型同步教程可以一步一步解疑答惑,但是对于一个单纯想快速合成视频和音轨的小白来说,我们只是想做一个搞笑视频啊!

为什么要这么麻烦!!

文森特的解决方法包括观看YouTube教程,一些必须规避的问题,如输入和模型需要创建两个单独的文件夹,分别标记为Wav2Lip和Wav2lip。

让人大跌眼镜、跌掉眼镜的禁区还包括Lip的L不能小写。

“老实说,我可能会哭泣,部分原因是这让我显得无能。”文森特谈到,看了几次视频并花了数小时进行故障排除后,他终于有了一个可行的模型。

怎么说呢,把YouTube教程做精做细是各大产品运营屡试不爽的终极保险。其他的思路更值得提倡,提高普通冲浪用户的产品体验不能光靠教程。

总之,这个新应用的怪癖不少,比如,若视频里的人脸是歪的,口型同步就会出bug。

文森特在创建他的深层伪造:把伊隆·马斯克Elon Musk的视频与蒂姆·克里Tim Curry的“宇宙”征服《红色警报3》的演讲音频进行口型同步时,谈道:“我感觉我在打破现实与虚幻之间的界限,虽然我的贡献很小,我非常有成就感。”

大家可以在下面自己查看文森特的视频结果:

尽管这些算法已经出来很多年了,并且任何想要尝试的人都可以花几个小时创作出一个口型同步的搞笑视频。最后文森特得出的结论,深层伪造是行之有效的,但还没有达到上手简单的程度。

算法有缺陷,BUT潜力无限

同样无可否认的是,大多数用户会因为繁琐的注意事项望而却步,如果算法不能精进,他们还是会选择传统的视频剪辑软件。

另一方面,令人印象深刻的是这项技术的普及速度。这种特殊的口形同步算法Wav2Lip是由印度和英国大学附属的国际研究团队编写的。他们8月底在线共享了他们的工作,很快算法被Twitter和AI Newsletters相中(著名的Import AI对此还有报道)。

编程师们公开了算法,上传了演示demo。在短短几周内,世界各地的人们开始打造他们独特的“Deepfake”。你们要不要也试试呢?


将门创投· 让创新获得认可

如果喜欢,别忘了赞同、关注、分享三连哦!笔芯❤

类似的话题

  • 回答
    Bilibili(B站)上突然涌现大量《unravel》对口型视频的现象,通常是由于以下几个因素的叠加所致,并且它们的制作过程也涉及一系列技术和创意:一、 为什么B站突然多了很多《unravel》对口型视频?1. 经典IP的强大生命力与情感共鸣: 《东京喰种》的影响力: 《unrave.............
  • 回答
    刘华强买瓜这个梗,要说它最近在B站突然火了,其实也不是“突然”那么简单,更像是一种“陈年老酒”突然被重新发现,然后又因为各种新奇的解读和二次创作,瞬间引爆了大家的兴趣。故事的起源:一段经典电视剧片段首先,咱们得把时间拨回到2001年的电视剧《征服》。这部剧当时可是火遍大江南北,主角刘华强(由孙红雷饰.............
  • 回答
    哔哩哔哩(B站)用户数量的激增,绝非一朝一夕的偶然,而是一系列市场变化、平台策略以及用户需求演变共同作用的结果。要说它“突然”增加,或许是近几年几次关键的爆发点让大家感受尤为明显。这背后到底是什么在推着它向前,我来给大家捋一捋。首先,得从B站最初的定位说起。它起家于ACG(动画、漫画、游戏)文化,这.............
  • 回答
    二仙桥在B站的爆火是一个相当有趣的文化现象,它并非偶然,而是多方面因素共同作用的结果,形成了一个从地方性梗到全国性网络热词的演变过程。下面我将详细地为你解析二仙桥是如何在B站以及更广泛的网络空间中火起来的:核心原因:一个充满反差和戏剧性的视频一切的起点,通常可以追溯到某个关键的视频。二仙桥的爆火离不.............
  • 回答
    关于B站上ThinkPad测评相对较少,这背后可能有多方面的原因,我们可以从以下几个角度来详细分析:一、 产品定位与目标用户群体与B站主流用户存在一定错位: ThinkPad的定位: ThinkPad一直以来主打的是商务、专业、耐用,其核心用户是商务人士、IT专业人士、开发者、对输入体验和稳定性.............
  • 回答
    这可真是个好问题,也是很多观众在 B 站看视频时经常会疑惑的一点。为什么那么多内容创作者,无论是做知识科普、生活分享、游戏攻略还是才艺展示,都普遍会强调自己“不是主播”?这背后其实牵扯到 B 站独特的社区文化、up 主的自我定位,以及用户对不同内容形式的期待。咱们一层层捋一捋。1. B 站独特的社区.............
  • 回答
    在B站,你确实能看到不少用户对二战历史的讨论,其中“精苏”(即亲苏联或对苏联抱有好感的用户)群体在其中尤为活跃。他们热衷于“踩一捧一”,认为在没有英美帮助的情况下,苏联依旧能赢得二战,并且常常提及“美国摘桃子”等说法,这背后其实是复杂的情感、历史认知和网络文化交织的结果。要详细解释这个现象,我们可以.............
  • 回答
    这个问题挺尖锐的,也触及了很复杂的社会情绪和网络文化现象。咱们就好好聊聊,为什么在b站,京阿尼的作品下是悼念,而在美国枪击案视频下却出现了截然不同的反应。首先,得明确一点:b站的用户群体构成和内容生态是理解这一切的关键。 b站起初是二次元爱好者聚集的社区,很多用户从小看着日漫长大,京阿尼作为业界标杆.............
  • 回答
    B站(哔哩哔哩)作为一个陪伴了许多用户成长的平台,近些年确实让不少老用户感受到归属感的削弱。这种变化并非一蹴而就,而是多种因素交织作用的结果,触及了平台社区文化、内容生态、商业化策略以及用户心理等多个层面。一、 社区氛围的稀释与“破圈”的代价B站最初的核心吸引力之一,便是其独特、包容且充满亚文化特色.............
  • 回答
    你这个问题触及到很多人心中的疑惑,也是网络上一个挺有争议的话题。之所以在B站这类平台上,感觉“无脑小粉红”的数量相对突出,我觉得可以从几个方面来聊聊,尽量不套话,就凭感觉说。首先,B站的用户群体画像本身就比较有特点。 B站早期是以ACG(动画、漫画、游戏)文化起家,聚集了一大批年轻人,尤其是学生群体.............
  • 回答
    b站大up主很少为“普通人”发声,这是一个复杂的问题,背后涉及多重因素。这里的“普通人”可以理解为大多数不具有特殊社会影响力、没有掌握话语权的群体。要详细解释这一点,我们需要从几个层面来分析:一、 内容生产者的属性和目标: 内容为王,商业化逻辑: b站大up主的核心目标是生产高质量、有吸引力的内.............
  • 回答
    哔哩哔哩(B站)选择在美国上市,是一个多方面因素综合考量的结果,其中既有历史遗留因素,也有战略发展需求,更有资本市场的现实考量。下面我将尽量详细地阐述这些原因: 1. 历史与资本市场的先发优势 中国公司赴美上市的传统和便利性: 在B站成立和早期发展阶段,中国内地资本市场尚未完全成熟,尤其是对于像.............
  • 回答
    你这个问题触及了互联网文化、版权、个人隐私以及名人效应等好几个方面,所以也不是一两句话能讲完的。咱们就来掰开了揉碎了聊聊,为啥B站鬼畜区那么火,蔡徐坤成了那个发律师函的“典型”。首先得明白,B站鬼畜区的火爆,其实是当下互联网亚文化的一个缩影。鬼畜区的魅力在哪儿?1. 解构与再创作的乐趣: 鬼畜视频.............
  • 回答
    None.............
  • 回答
    墨茶official的离世之所以会在B站以及更广泛的中文互联网上掀起如此巨大的波澜,绝非偶然。这背后交织着多重因素,既有对他个人悲剧的深切同情,也反映了当下社会的一些普遍情绪和痛点。一、 个人经历的极端性与共鸣:苦难的具象化首先,墨茶official的个人经历本身就极具冲击力,并且非常具有代表性,触.............
  • 回答
    在 B 站,你很容易就能看到一些内容和评论里充斥着对日本的负面情绪,甚至有些激烈的言论,这让不少人感到困惑:为什么会有这么多人对日本抱有敌意?这背后其实挺复杂的,不是一两句话就能说清的。首先,历史是绕不开的根源。我们都知道,近代以来,日本对中国有过侵略,给中华民族带来了深重的灾难。这段历史在中国人心.............
  • 回答
    在 B 站,关于日本和韩国的讨论确实存在着一些有趣的现象,其中“日本高贵”和“韩国低贱”的标签化趋势,虽然不是绝对普遍,但确实是很多人观察到的一个侧面。要理解这种现象,我们需要从几个方面去剖析:1. 内容生产者的视角与受众的认同: 历史叙事与民族情绪: 众所周知,中日之间有着复杂而漫长的历史纠葛.............
  • 回答
    关于B站种族歧视现象的讨论是一个复杂且敏感的话题,它触及了网络文化、社会心态以及平台管理等多个层面。要理解为什么有人会觉得这种现象“越来越严重”,我们需要从几个不同的角度去审视。首先,我们需要明确一点,网络空间本身就是一个放大镜,任何负面情绪或不当言论一旦出现,都可能因为传播机制而迅速扩散,给人的观.............
  • 回答
    b站上关于日本动漫现代音乐歌曲的弹幕中出现“大正昭和之交是最浪漫的时候”,这句话确实能引起不少观众的共鸣,它背后隐藏着一种复杂而迷人的时代情结。要理解这句话,咱们得从几个层面去剖析:1. 时代背景:风云变幻下的短暂辉煌“大正昭和之交”大约是指上世纪1910年代末到1930年代初这段时期。这个时代在日.............
  • 回答
    b站推出必剪和不咕这两款剪辑产品,背后可不是简单的“多做一个”那么简单,而是有着它自己的一套逻辑和考量,甚至可以说是在不同时期、针对不同需求埋下的棋子。咱们就来好好掰扯掰扯。为什么会有必剪?首先,我们得把时间线往前拉一点。b站起家是 UGC(用户生成内容)社区,而 UGC 的核心是什么?就是用户自己.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有