百科问答小站 logo
百科问答小站 font logo



如何看待大厂争相发布 数字人 / 虚拟人 / 数智人,有哪些关键信息值得关注? 第1页

  

user avatar   jie-zhi-61 网友的相关建议: 
      

最近,某省级卫视搞了一个名为《2060》的虚拟偶像选秀,以往活跃于小屏幕的他们上了电视。从追番平台到短视频平台、社交软件,再到上星节目,数字人随处可见,在年轻人群体中的讨论热度也居高不下。或许有些朋友对“数字人”这个词较为陌生,在数字娱乐的场景中换成“虚拟主播”相信不少人就都听说乃至了解了。

现如今无论是国内还是国外都掀起了虚拟主播的热潮,成为了泛娱乐行业极大的增长点。就国内而言,如今由传统经纪公司创造的虚拟偶像团体成功破圈,很大程度地扩大了虚拟偶像的粉丝团体,也把虚拟主播带到了新高度。与此同时,越来越多的文娱明星也开始成为了虚拟主播的“中之人”,像蔡明老师这样德高望重的前辈也开始走入虚拟主播领域。

在商业层面,一些卫视和相当多的视频网站也都开始有了各自的虚拟主播,虚拟主播一下子成为了资本、受众的香饽饽,颇有点要杀入主流娱乐行业的态势。

同时,也有越来越多的文化研究者开始讨论起虚拟主播的成功之道,而在我看来虚拟主播成功的基础无外乎有两点:一方面虚拟主播满足了观众的需求,另一方面技术的发展让虚拟主播能够应运而生。

下面我进行分别解释。


其一,是满足需求。

这方面实际上有不少文化学者都写了论文分析了这个现象。总的来说,虚拟主播的出现乃至如今大火,都是满足了受众的精神需求。

一个很重要的现象,就是情感的媒介化。中外很多对日本ACG的研究实际上都在反复强调这个观点,就是宅(Otaku)群体普遍存在某种把情感寄托于媒介的现象,比如说对动画角色的喜爱,比如说玩家们对游戏本身这个媒介的热衷等等。

而虚拟主播更进一步,就是其存在本身就是一个单独的媒介,粘合了信息传授双方的情感与叙事内涵。(引用自:张路.虚拟主播角色论:情感、现实与社会关系[J].当代动画,2021(01):22-28.)说得更直白一点,每一个虚拟主播,本身就是作为一个单独的媒介出现,而动画、游戏作为媒介本身,其角色是没有媒介所存在的互动性的。所以,虚拟主播进一步媒介化的同时,也满足了观众层面的情感寄托。

与此同时,这篇论文也分析了另外一个需求,即“一方面,与更符合一般认知期待的潜层表演——深层表演式的现实社交相比,角色表演出的情状、抑或情状与言语中的差异显然更能够引起受众对于虚拟主播的真实性共情。另一方面却由于情感本身的符号式传达的直接屏蔽了人际交流的社会环境与情感表达的复杂性,使得受众在“选择了相信”后,很难产生‘怀疑的动摇’。”(引用自:张路.虚拟主播角色论:情感、现实与社会关系[J].当代动画,2021(01):22-28.)

也就是说,虚拟主播或者虚拟偶像的存在本身是粉丝内心防御机制需求的体现,因为大家都很清楚有“中之人”,不用担心所谓的“虚假人设”或者是“装出来的”。只要入了“虚拟主播”这个坑,与他们建立起了情感连接,就建立起信任与喜欢的关系。这与现实世界中的“塌房”形成了鲜明的对比。这里没有现实世界中的种种事情,更像是单纯的喜爱与被喜爱的关系。这点在移动互联网时代显得尤为重要。


其二,是技术积累。

虚拟主播的技术本身主要是两个层面,一个是角色建模层面的技术,一个是表情、动作、语言等层面的算法积累和训练。也是从两个方面说。

从角色建模层面而言,虚拟主播普遍是有技术结构的分层。

第一层肯定是由角色设计师来完成形象的设定。如今不少日本知名的插画师都杀进虚拟主播的创作中,最过著名的莫过于深崎暮人和“京都脸”的创造者堀口悠纪子。角色设计包括角色本身的视觉形象还有角色的各种表情。如今也有基于真人的形象采集,这样便可省去了角色原画设计这一步,更多还是还原真人的形象、体态、表情。

到3D建模层面,如今3D CG的制作水平能够基本还原出来很多画师的角色设计,就精细程度而言,建模目前肯定还是无法完全还原角色设计的2D立绘,但随着3D技术的发展,差距在慢慢缩短。

在完成建模后,通过动作捕捉和表情捕捉的引入,虚拟主播的形象对所捕捉的演员相关的动作和神态都能完成精准的还原。

如果是定制化需求,需要从零开始打造一个虚拟主播,整个流程下来需要处理的内容相当多,包括人设的选取、确定,“中之人”的选取,后续还有动捕演员的选取、动作的录入、表情的调教等等。由此可见,虚拟主播的制作周期长、制作成本高,这些都致使以往所谓的“虚拟主播”都是大公司的“特权”。

但技术本身就是这样,从最开始的研发到量产,伴随着的是相关企业对方法论的总结,包括如何提升效率、如何更好地应用。而这么些年来,尤其是人工智能技术的积累、演进和应用,让虚拟主播的概念乃至内涵完成了拓展,并“飞入寻常百姓家”。

慢慢地有不少公司发现,虚拟主播并不需要所谓的“定制化”,可以根据提供的“选项”,来组合成为虚拟主播,并积极推动这些内容的量产化。同时这些主播也不光是局限在泛娱乐领域,比如这段时间我在朋友圈看到了有朋友去参观了某省会城市的展厅,里面就有真人式的“虚拟主播”在给参观的游客进行讲解,甚至还能够在线答疑。


也就是说,随着人工智能技术的发展和CG技术的积累,如今的“虚拟主播”就形成了应用场景更为广阔的“数字人”。

像我朋友圈看到的城市展厅,既省下了人工成本,互动层面也更有乐趣;而像传媒播报,虚拟主播的存在也不用为了口误来支付罚款;景区的引导与介绍,交通的疏导与讲解……数字人本身能够发挥能量的场景,可能比我们想象中还要多。

也正因为如此,考虑到近来几家互联网大厂开始逐步进入虚拟主播,确切点说是“数字人”的领域,也是看到了上述的应用场景。想想如果这些能够应用起来,还是非常有意思的。比如说我们去政务大厅办事,对接我们的并非是真人,而是一个个真人形象的办事员来处理问题,可能更有耐心、讲解起来更为顺畅;比如当我们堵在车流中,在十字路口疏导交通的是一个个虚拟形象,那么我们的“路怒症”是否会减轻一分?

这些似乎都能让这些虚拟形象,从屏幕中跳出来,真正地来到我们的生活中。

而在这些互联网大厂里,我看到有真正落地的就是腾讯的“数智人”产品了。不知道大家有没有追《镜·双城》这部动画作品。去年在推出第一季的时候,腾讯就推出了一个那笙的数智人。观众可以在网页上进行互动,如果观众夸她可爱,她还会害羞。


能表达多种情绪、有多种肢体语言,并且能和观众对话、回答问题的数智人如今已经在不少城市展厅中亮相。

除了卡通形象之外,数智人也有真人形象在更多偏正式的场合担任讲解的作用,像博物馆、城市展厅、金融展厅等等。这些数智人能够形象地表达出多样的情绪和肢体语言,并能够智能地解答访客的问题,与他们完成充分的互动。

因此,数智人能够落地的场景肯定不只是数字娱乐,像传媒播报、业务接待、文旅导览,包括政务服务都有广泛的应用空间。腾讯本身的算法积累加上在国内内容创作上属于第一线的地位,让数智人本身就有积累了大量真人与虚拟的模组;如果加上定制化的话,数智人也有不少的资源库进行选择。


由此可见,数字人的出现可谓是时也命也,既有观众在移动互联网下催生的新媒介需求,也有3D技术、AI技术的逐步提升让数字人的出现成为了可能。而这段时间,不少厂商都开始布局数字人,这些厂商不光是看到了互动娱乐、数字娱乐等泛娱乐需求,他们所剑指的还是那些能够有更广阔空间的应用场景。或许在不久的将来,会有不少城市在传媒、文旅、城市管理、金融领域,都会出现“数智人”为我们进行讲解与引导,与我们产生亲密的互动。

而我们都清楚,这些数智人的出现并不会让城市变得冰冷而机械,因为虚拟主播的存在,本身就让互联网充满了温暖。


user avatar   banfoxianren 网友的相关建议: 
      

这话题,我喜欢。

其实从问题就可以看出来,这数字人、虚拟人、数智人,名字都没有拿捏清楚,和这三个说法同时存在的还有一些,比如虚拟形象、虚拟数字人、数字孪生、虚拟替身等等。


按照某研究院的说法,虚拟人更偏重外观和智能,而数字人更加笼统,以3D图像软件或者其他仿真工具做出来的都是数字人。

按照《虚拟数字人深度产业报告》的说法,这些名字都可以指代由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等手段打造出来的具有人类外貌特征、表演能力、交互能力等等的非物理世界产物。

总归就是,各说各的,各自赋能,各自定义。

但是没关系,一个新事物在初期,都会有这样那样的定义纷争,这刚好说明虚拟数字人最大的特点,就是刚起步,依然是处在炒概念,玩噱头为主的阶段。

那我就先简单的说是数字人吧,这咱们其实经常遇到。

比如我很喜欢逛的B站,虚拟主播都有自己专门的分区了,到2020年底已经有超过3万虚拟主播存在,比前年增长了40%。


而在很多传统领域,数字人也是各种登台,比如播报个天气,比如客串个游戏。


这种立体化仿真化的数字人,背后要单向输出的内容,大多是事先设定好的。

支撑起这样从「壳」角度仿真的,是3D建模、动作捕捉技术、渲染等技术,不过不具备识别外界环境,与人交流互动的能力。

在我看来,这种数字人还处在初级阶段,更进一步的,其实在《赛博朋克2077》这款游戏里面有所体现。

比如基努里维斯作为NPC的存在,就是一方面具有了一定程度的真实感,一方面还能和玩家进行剧本设定型互动,算是比较高级的数字人了。


这里就可以单独把数智人拎出来说了,数智人和数字人的核心区别就在于那个「智」上。

虽然是一字之差,但是点睛之笔就在这个地方,当然,也是最难跨越的坎儿。

精美的卡通或者真人数字形象,那只是皮,骨架,内核在于语音交互、自然语言理解、图像识别等AI能力。

其实图灵很早就告诉我们了,要测试人工智能,就是要聊天。

所以数智人最大的考验也是最好的发挥场所,就是和人的互动。

把冰冷单纯的人机交互变成更加有真实体感的交流,这就是数智人正在做的。

现在人工智能已经越来越高级,语音语调、各种停顿、语气词等的小动作的模仿还不是关键,关键在于听得懂,能对话。

这不光涉及到自然语言理解,还需要人工智能可以把对方的话,拆解成意图和实体,当然还有无法避免的语气助词和废话。

比如你说,今天心情好,干脆去动物园溜达一圈吧。

这里面意图就是溜达,实体就是动物园,其他的就是语气助词和无关紧要的东西。

而且咱们说话,很多时候都不会完全的传递信息,而是相信对方根据自己的常识、经验、场景甚至直接来解读。

这些都是人工智能在逐步攻克的难题。

现在能做到什么程度呢?两年前就有AI冒充真人打电话去餐馆订座位让人难分真假的测试,这些,都是技术不断堆积后的产物。

不过,所谓数智人,也不是说给数字人单纯的加上人工智能就完事儿了,仿佛那是个大道至简一通百通的秘诀。

大家都知道,现在互联网行业很多都开始从ToC往ToB端转型,那种一招鲜吃遍天更多的是发生在ToC端,但是到了行业解决方案的时候,往往就需要更多的行业深耕,行业定制,行业解决方案。

这人工智能也是一样的,能订座的AI,那背后的语料库肯定更生活化,更符合预订场景。你让同样的AI去帮你做一下服务引导,或者做个单纯输出型的资讯播报,都很难做到精准场景下的适配。

这其实就是行业下沉过程中的专攻问题,不过,这也是数智人未来更广大的市场。

我觉得金融行业就是一个典型案例。

我前年的时候参加过一个国内很有牌面的商业银行的峰会,完事儿以后被带看他们的最新黑科技,里面就有一个人工智能ATM,最亮眼的我觉得就是里面的远程协助部分。

就是你用ATM遇到问题了,现在常规场景是旁边有大堂经理帮忙来处理,但是这家银行是用人工智能ATM直接解决,你对着他说话就行。

我当时是激动的心颤抖的手,要知道很多金融机构的客服中心都是成本中心,不论网店里面的员工成本,还是呼叫中心的话费、人工成本、设备器材维修等等,花的都是真金白银。

能有这样的人工智能ATM,可以进行智能互动,那可以省下很多的运营费用。

结果测试完了,非常丝滑,然后工作人员说,这其实背后是成都的客服中心远程帮助,我以为自己是在和ATM互动,结果其实还是和真人。

这就尬住了。

其实银行说要数智化转型已经很多年了,从开户到协助,从资产管理到定点理财顾问,都开始慢慢的智能化,但这种智能化不能解决交互问题。

而现在数智人的升级,就可以让我前年被戳破的幻想重新成真,数智人已经开始尝试辅助传统意义上需要由银行员工进行的,和客户交互的工作。

现在已经有一家金融机构落地了首个金融AI数字员工,我查了一下,背后提供解决方案的是腾讯云小微数智人。


这种在AI驱动下的形象逼真到就像是个真人在服务的数智人,开始为银行做审核工作。

咱们平日里面和银行打交道,其实遇到最多的就是各种申请,各种填表,各种审核,过程中因为我们的知识不对等,必然是需要有人帮忙进行指导,有问题也需要随时得到解答。

用这种金融AI数字员工,一方面是可以实现「不打烊」的服务,一方面也是可以解决人工成本攀升的问题。

而且还能避免因为人工错误导致的用户体验下降。

这套解决方案已经服务了大量用户,在这过程中,就是给了人工智能充分学习和迭代的机会,从而提供更好的金融领域客服的专业积淀。

这就是为什么我之前说,具体场景下落地是数智人未来发展的大趋势。

对C端来说,解决的是具体的问题,比如等待时间、响应速度、服务质量;对B端来说,带来的也是直白的成本节约和效率提高。

可以想象,以后金融AI数字员工这类的专精数智人能承担的工作,能包括客服、柜员、理财顾问、销售经理等多项现在银行重人力成本投入的领域。


当然这仅仅是其中一个案例,金融行业是非常需要提高客户服务质量并且降低人工成本的领域之一,类似的行业还有文教传媒和公共服务等等。

我现在能查到的是腾讯云小微的数智人已经在故宫、龙门石窟等景区提供 AI 导览服务,为游客提供个性化游览路线推荐,景点文物讲解等多种服务,不光是讲,还能问,还能声情并茂的答,非常的灵性。

这时候完全可以畅想一下,只要有交互需求的地方,数智人在未来都能有用武之地。

愿景是美好的,但是距离也是遥远的。

其实路要一步一步走,饭要一口一口吃。

一上来就说脑后插管,肉体飞升,憧憬是给力的,不过技术的积累更重要的是解决当下需求,也只能在解决现实意义问题中才能不断的迭代。

从虚拟播报,到数智人互动,仅仅是个开始,旅游行业的智能导游,传媒领域的AI主播,金融领域的虚拟面审官,这些只要是有人参与的过程,都能在数智人的协助下更进一步。

这直白带来的,第一就是大家的用户体验更加顺畅,不需要等待坐席,不需要考虑工作时间,能实现脱离时空场地束缚的全方位互动。

第二那就是可以让企业把更多的精力和资源从简单的客户服务上腾出来,投入到创新研发、产品升级等等更具有远期竞争力的领域上。

所以数智人虽然同样是一个初创的概念,但是未来具有很大的市场前景和落地空间,这种有温度、有表情、有情绪的数智人,我很期待未来的表现。


user avatar   a-san-shu 网友的相关建议: 
      

泻药


这方面或许有一些发言权。

之前几年的时候,曾经跟腾讯动漫等平台有过深入合作,可以说近距离感受到二次元文化在国内如何一步步从小众走向社会认同,也始终对二次元文化的商业价值带有浓厚兴趣。

加上曾经在日本住过几年,当地很多知名企业都会使用二次元人物作为品牌代言人,有时候一个牌子可能原来知名度一般,但只要跟某个爆款IP合作,就能迅速打开销路。

国内在二次元商业化方面,这几年发展也很快,例如说《一人之下》就曾经跟名创优品进行合作,推出联名款抱枕;《狐妖小红娘》代言品客薯片等,案例数不胜数。

除了这种植根于动漫作品的人物外,虚拟偶像现在的影响力也越来越大,如果说日本有初音未来,国内就有洛天依等虚拟偶像,都取得了不俗人气。

更不用说经典永流传的AC娘表情包、B站的2233娘、华硕的天选姬等等,泛二次元(虚拟)人物在营销领域的价值不断被挖掘出来。

我们不妨先设想一下,通常营销场景当中,广告主希望达到什么效果?消费者又会对什么更满意呢?

很明显,如何通过营销宣传帮助消费者更深刻地认知品牌,更快促成转化,就是广告主愿意投入的初衷,过去邀请明星艺人、体育巨星等作为代言人的手法,就是利用他们的“光环”效应获得公众认同。

而消费者往往因为自己喜欢代言人,所以愿意为了他们去消费,甚至造成了近年来比较严重的“饭圈经济”问题。

那么和传统的真人相比,虚拟人物到底有哪些显著优点呢?

根据我个人的观察,至少以下几种特点是真人所无法匹敌的:

1. 人设:虚拟人物的人设,就是原原本本呈现在大家面前的。傲娇少女不会突然变成腹黑,帅气男神也不会一夜过后变成肥胖油腻大叔。

而真人则不同,你很难分辨他们在公众面前(以及品牌代言)所呈现出的是不是真实的自己,也因此经常会有人设崩塌的情况,这在今年娱乐圈当中已经是吃瓜吃到撑。

普通人吃吃瓜就算了,但对于企业以及品牌方而言就面临着巨大商业风险,明星光环一旦变成黑粉狂欢,很容易形成反噬效应,让企业欲哭无泪。

2. 完成度:虚拟人物从诞生之日起就可以“量身定制”,没有跟明星经纪人进行沟通的成本,也不用担心代言者突然档期排满,并且只要客户有需求,虚拟人物就能任意做出各种高难度动作,哪怕把一档广告拍成大片也OK。

3. 成本:和真人动辄天价代言费相比,虚拟人物的“出场费”就显得性价比十足。

4. 颜值:虚拟人物的形象可以根据客户需求随时调整,搭载了人工智能技术之后,就可以在短期内生成大量的虚拟形象视频。而真人总不能突然改变画风去整容……

那么是不是以上种种导致众多大厂开始积极开发数字人/虚拟人/数智人?我觉得是也不是

肯定有以上原因,但是大厂嘛,肯定会把眼光放得更加长远。我们看到的是虚拟人可以给品牌做代言人、可以拍广告、做推广。但是大厂看到的可能就是数字人在新闻播报间、银行、博物馆、直播间…的广阔应用前景

当然,我们知道这中间是有gap的,大厂想要把电视里的虚拟偶像搬到现实,关键是人工智能。

我们可以看到目前市场上的虚拟人大多数还是传统的通过CG等影视技术生成单条视频的制作模式,这种模式做出来的视频是一次性、不可复用、不可互动的。也就是说,厂商无法批量生产内容,单条内容的成本高、性价比低,当然也不肯可能与人互动,人们只能隔着橱窗看着里面的展示品,而不能与橱窗里的TA进行对话。无法满足千人千面、流畅交互的需求。


前面提到过,因为跟腾讯动漫有过合作,所以也非常在乎这家公司对于数字人研发的表现……

既然谈到大厂,我们不妨来聊一聊腾讯的“数智人”。

数字人,数智人,听起来差不多,也只有一字之差,但“智”恰恰就是将数智人与传统数字人拉开差距的核心关键字。

“智”可以有很多含义,我们首先联想的大概是:互动性。

想一想,一个理想的数字人除了单方面地对受众“做出各种动作、说话”之外,是否还应该跟我们进行交流对话,?

我们可以看到,以腾讯的数智人为例,有AI能力的数字人,好看的皮囊背后,还有语音交互、自然语言理解、图像识别等AI能力,有了这些,数智人才能够与我们“人类”建立沟通,再也不是冷冰冰的数字机器。

当然更进一步,更深层次的是,我们希望数智人的“智”能够体现在他足够“懂”我、或者“懂”我所处的行业。这里就要分场景来谈了,就从我自己从事的媒体行业谈起,如果一个数智人足够智慧,他就可以及时应对海外突发事件的报道,真人主播就不用半夜爬起来加班了。

传统媒体如此,其他的应用场景更是能够给我们带来想象空间。

很多企业在销售端、售后端等许多场景都要跟客户交流,若是允许顾客直接跟形象有趣的数智人交流,让数智人帮忙“安利”买什么才好,会不会更有利于业绩增长?

跨国交流会议(包括跨国企业、国家组织等),如果请不到合适的真人翻译,也许数智人同样可以提供令人满意的翻译服务,还能根据国别不同展现个性化的“异域风情”,这非常适合一些产品展销会场景中,品牌方面向国际友人有效呈现产品优势,让潜在客户在一阵阵“amazing”的惊呼中完成下单。

又比如,现在我们都调侃“公司里最有能耐的是做PPT的”,而如果今后的公司年终总结汇报,都是由员工们自定义形象的数智人在屏幕中解答一年来的工作成果,并且还能代替员工回应上级的提问……

早一日引进数智人服务,将有助于不同领域的企业、单位、学校更好发挥其功能作用,在品牌口碑、业绩销量、传播影响力等多层次走上一个新高度。

这或许就是真正意义上的“科技进步改变社会”。

对了,从腾讯官方发布的数智人发展愿景看,未来数智人技术将重点向融合文字、听觉、视觉、触觉、肢体动作等多维度感知的多模态交互方式演进,除在企业服务领域持续发力外,在生活服务中也会为用户带来更多陪伴、更多信息交互以及更深的情感链接,打造有温度的交流体验,拉近人与科技的距离。

二次元之魂突然开始觉醒了……

大家想,智能家电已经走进普通人生活,但目前为止都还是相对冰冷的交互,而如果将数智人技术引进到家里,每天晚上一开门,打开电视(或者其他有屏幕的界面,甚至干脆虚拟投影)就能看到虚拟人物穿着符合个人喜好的服装,开开心心地说“欢迎回家”……

无论有什么烦恼,都可以跟TA交流,然后得到安抚或者建议。

不要忘记了,数智人的“玩法”非常多,可以尽情开脑洞。

这不就是打破次元壁嘛!

也许,随着腾讯数智人,以及其他大厂今后开展更加激烈的市场竞争,我们将在不远的将来看到虚拟人物完全融入到我们的生活之中,成为生活不可或缺的伴侣。

不多说,希望腾讯以及其他企业加把劲

……我等二次元老宅已经泪流满面了。




  

相关话题

  如果所有人类都变成资本家,把机器人当作剥削对象,会发生什么? 
  如何用一句话证明自然语言处理很难? 
  深度学习中,模型大了好还是小了好呢? 
  有什么类似于Al的炒股软件介绍给上班一族? 
  如何评价 DeepMind 在星际中的失利,以及 OpenAI 在 Dota 上的成功? 
  ICML2020有哪些值得关注的工作? 
  工业机器人普及之后会对社会产生什么影响? 
  机器人领域最好的会议是什么? 
  如何看待华为轮值董事长徐直军称「华为 AI 彻底摆脱了美国任何技术」,华为 AI 技术现在是什么进展? 
  离开互联网算法岗,切入最近大行其道的AI生物医药研发靠谱吗? 

前一个讨论
身处信息繁杂的时代,我们该如何跳出「消费茧房」?
下一个讨论
媒体发文称「元宇宙要警惕资本绑架、伦理风险、立法监管空白等问题」,如何看待近期的元宇宙全线热潮?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利