百科问答小站 logo
百科问答小站 font logo



交通银行机器人是如何做到如此智能的? 第1页

  

user avatar    网友的相关建议: 
      

谢邀。利益相关,语音从业者。

“整合了包括语音识别(ASR)、语音合成(TTS)和自然语言理解(NLU)技术甚至图像、人脸和声纹等多项顶尖人工智能技术”,我相信他们有这些技术,至于是不是顶尖的,不评论。但是,这些技术和最近疯传的那个视频并没有什么卵关系。当前的 ASR 和 NLU 能不能做到视频中的水平,我就不评论了。即使不做语音这行,每天接触到的灵犀、Siri、小娜这些已经代表了当前这两项技术的顶尖水平,你们可以自己对比判断。就是那所谓的 TTS,一耳朵就听出来根本是后边人说话,过了一道变声而已,变声是很简单的技术,风靡一时的汤姆猫就是基于它的。网上有开源的库 soundtouch,有兴趣的可以自己玩玩。另外,中文语音合成的老大科大讯飞的 TTS 效果,你们应该都听过,很容易听出和真人说话的差别。根据恐怖谷理论,当人造的东西做得越接近真人时,它仅有的那一点差距就会显得越显著。视频里那声音,虽然经过了变声,但其发音、韵律明显不是合成出来的。

@莫英华 说的“机器人有一定的语音自动应答功能,就像siri,但能连接远程客服作为智能化的补充”是对的,不过宣传文案里大力强调其人工智能技术多么多么牛逼,宣传视频里却是人肉智能的演示,呵呵。




  

相关话题

  中国目前的人工智能在全球处于什么水平? 
  孙正义在2014年说日本2050年经济能超过美国成第一,如果真成真了,世界会如何?? 
  ai将来可以熟练运用公式解应用题吗?那为什么我还要起早贪黑地学解公式,而不是研究怎么搞这个ai? 
  人类为什么不能用机械臂来制作传统美食“三不沾”呢? 
  电子游戏要发展到什么时候,玩家才可以直接通过打字或者语音的方式与NPC对话? 
  计算机系学生应该怎样正确管理自己的电脑? 
  AlphaGo 与李世石的第五局比赛中有哪些值得关注之处? 
  这种不考试,以娱乐为主的机器人教育对于中小学生及幼儿的意义何在? 
  如何看待timm作者发布ResNet新基准:ResNet50提至80.4,这对后续研究会带来哪些影响? 
  很多人认为元宇宙是骗人的,为什么还是全球很多著名大公司投巨资去做? 

前一个讨论
Emacs 有什么奇技淫巧?
下一个讨论
大家来谈谈公司里,实习生做的奇葩事情?





© 2025-02-04 - tinynew.org. All Rights Reserved.
© 2025-02-04 - tinynew.org. 保留所有权利