百科问答小站 logo
百科问答小站 font logo



如何看待Rokid发布的语音AI芯片KAMINO18? 第1页

  

user avatar   li-lei-up 网友的相关建议: 
      

也刚好看到这个新闻了,所以就说两句。

对Rokid最早了解是他们家在知乎上的开屏广告,当时对他们的认知主要是他们家的语音识别。后来从其他渠道了解到Rokid和中科院自动化所的合作,作为院友,所以也对他们的研发比较感兴趣,毕竟这些年来中科院也一直在推动者产业化的发展,以此来顺应经济转型的大局,当然最成功的是联想集团和科大讯飞了。

这次Rokid Jungle发布会上,Rokid北京AI实验室负责人就是来自中科院的高鹏博士,2008届模式识别与智能系统专业的大佬,莅临现场的还有他的导师,现在已经是自动化所的所长徐波研究员。据说其研究团队也有大量的人员来自中科院,因此团队的实力还是比较强大的。

为什么要搞芯片?

这是我想很多人看到这个发布会后第一的瞬间的想法。

之前云知声CEO有一个观点是“做语音的公司如果不做芯片必死无疑”,为什么?

因为语音公司发展的核心是技术,技术最大的限制之一就在于芯片。现在大厂的芯片都是量产的,所以很多时候很难做到适应公司发展的“私人订制”,这让我想起了之前不少手机厂商就是被芯片厂活活的给限制死了。现在的语音领域越来越细化,这种情况下,对芯片的自主设计就更为关键,让芯片能够更加个性化的适应产品的需求,符合场景的运算尤为关键,尤其是在语音识别这种复杂环境情况下,语义识别、用户体验等这些都对芯片提出了更高的要求,这已经不是传统芯片能够满足的了,这也是为什么现在很多语音公司都在争相去投入了芯片领域。

题主提到的第一个问题是:所谓的KANIMO18真的有官方描述的那么强大么?

我觉得这个问题要从两方面来看,一方面,Rokid语音芯片并非单打独斗,而是和业内知名的杭州国芯联合研发,首先解决了高功耗问题。众所周知由于智能音箱需要保持待机且随时响应的需求,因此功耗非常高。而KANIMO18在设计的时候也重点考虑了芯片各个模块的工作频率和启停时间,并进一步设计多级唤醒机制,从而降低功耗。

另一方面,能够更好的适应自家产品,这一点尤为重要。 Rokid创始人兼CEO祝铭明(Misa)的说法很有意思,那就是:芯片并不是运算更快就更好,和应用场景最匹配的才是最好的。”

Rokid这次推出的芯片主要设计就是符合自己公司产品的设计,比如高集成度,把ARM、NPU、DSP、DDR、DAC等多个核心部件集成于KAMINO18中,从而产生一个一枚硬币大小的芯片模组。而Rokid重点关注的是语音设备,因此也对相应的算法做出了有目的性的优化,比如自定义唤醒词、离线语音指令等等形成一个完整的os,这样可以更好地服务自家的产品。

所以说,kanimo18的强大,不仅在于集成度和低功耗设计,更在于能够更适合他们自己的产品。

当然,到底如何,除了公司自己的介绍,第三方的看法也很关键。这一次,若琪的发布会上提到了他们和喜马拉雅FM的合作。


众所周知喜马拉雅FM可是大名鼎鼎的音频知识分享平台,国内领域第一,拥有超过四亿多用户,行业占有率更是超过73%。这次发布会上,喜马拉雅FM副总裁、硬件事业部总经理李海波也宣发,喜马拉雅FM将与Rokid确定战略合作关系,在喜马拉雅FM即将推出的儿童智能音箱晓雅Mini上,也会搭载ROKID
KAMINO18的产品。

可以说,获得了喜马拉雅FM的认可,本身就是对相关产品的一种肯定。他们这种业内大佬的认知肯定要比我们普通人的认知更为敏锐也更深入。

题主提到的第二个问题是:是不是“一个蹭中美芯片大战热度的公司?”

看到这个问题,我也不得不多说两句。

作为格力股东,前段时间芯片概念股大涨的时候,格力宣布做芯片,结果自己逆市跌。面对这种让人困惑的局面,当时网友给出了个搞笑却值得深思的回答:

别人家宣布做芯片只是玩玩而已,格力宣布做芯片确实真的要做芯片。

其实这个让人莞尔一笑却又陷入沉思的笑话背后,却让我们看到了当前的芯片困局。

相信最近一段时间的贸易战,也让很多人对芯片有所了解,毕竟这是贸易大战,我们的芯片受到了非常严重的限制,作为全球最大的芯片需求国,芯片之争已经成为了中美对决的擂台,中兴通讯更是一会儿ICU一会儿太平间的被折腾。

其背后的根源就是:芯片难做。

知乎上曾经有过专门的讨论

中国的芯片现状如何?

结果却是普遍不乐观。芯片投入周期长,研发难,未来发展芯片还是困难重重。

但是这样就不做芯片了?

当然不是。这次芯片大战已经看到了技术受制于人的严重后果,真是被人卡着脖子。

现在做芯片,可能是产出少甚至未来不乐观,但是至少有一线希望;如果彻底不做芯片,那么我们就无任何希望。

所以,我对任何做芯片的行为,都是持有支持的态度,哪怕我们的芯片如何的原始和落后,只要我们开始做了,就是好事,毕竟:不积跬步无以至千里。

当然了,回到ROKID芯片,他是不是在蹭热度?我看不是,毕竟中美贸易大战今年才开打,根据高鹏博士的介绍,他们早在几年前就开展了芯片研发。所以这次只不过是恰逢其会罢了。

但是,无论如何,做芯片既是语音厂商的必走一步,更是我国的必然途径,所以,我支持做芯片。

参考:Rokid Jungle发布会AI语音芯片KAMINO18面世 探索智能生活


user avatar   xiepanda 网友的相关建议: 
      

Rokid这个牌子呢,关心人工智能领域的可能听说过。最近参加了他们的发布会,看到了KAMINO18这个芯片,到还是对这家公司的to B端产品有点看好的。

上周我有事去杭州见一下朋友,恰巧撞上Rokid开新品发布会,于是就找杭州朋友要了个门票去看了一下

一进会场首先是一个站在大手上的黑哥哥在唱黑炮,大概是暖场DJ的感觉。吊着安全绳,唱得很带感,还不停和下面的我们互动,我一直担心他会掉下来

发布会开始前,有一些小的展示,是这家公司的工程师们业余用专业知识做的一些黑科技小应用(不小心拍到的小姐姐,并不是管家小仙女本女)。所有的小应用展示里面,最有意思的是一个用视频拍摄脸部来监测心跳的技术,排队体验的人比较多,忘了拍照,现场观感是作为工程师的业余小创作,算是很有趣了。

最大的感触就是这应该是个很活泼的公司,在工作之余,工程师们依靠自己公司的技术,居然开发出来了那么多好玩有趣的东西。并且在发布会之前拿出来和大家分享,真的是有趣的一次黑科技体验。

现场有很多工作人员,包括一些明显是外地分公司来得员工,听现场工作人员介绍,因为是第一次办发布会,所以全是内部布置和安排,喊来了全部员工(公司总部在杭州,在北京和硅谷都有研发基地),有点半发布会半年会的性质。

现场依次发布了三款产品,便携智能音箱、KAMINO18芯片和智能眼镜。

其中智能音箱属于成熟产品,加入了一些非语音交互方式(手持晃动)。智能眼镜是实验性产品,在CES亮相过,这次发布会发布的是改良后的版本,现场介绍说是年底量产。


当然,我本人最关心的其实还是KAMINO18芯片。

很多智能音箱类设备都是用的通用芯片方案,而KAMINO18则是一款高集成度的智能AI语音芯片。第一眼的优势就是小,发布现场用的是一元硬币的来做的对比


为了验证这个事情,我在发布会结束后,还去产品展示区看了一下,确实和宣传大小一样大

这种功能目标明确的芯片,除了高集成度外,低功耗和低成本一般也都是买点。KAMINO18 18作为一款音频人工智能芯片,最核心的自然是NPU部分,可以支持TensorFlow。而ARM、DSP、DAC这些常见核心组件自然不用说了。

板上自带的麦克风,加上Rokid自己的语音交互算法(相控阵麦克风、离线指令、关键词唤醒等),基本上把一台智能音箱该有的核心功能都包全了。这么多加起来,比起高大全的通用芯片,还能便宜不少。

发布会少不了一些炫技的视频,发布KAMINO18的时候的视频很有意思。


视频里是一个小女孩,用一个KAMINO18芯片,两个扬声器,一些简单的电路组件,一些纸板,拼出来一个智能音箱的过程。

视频并没有那么酷炫,但是把高集成度这个点是展示的非常好了。


我感觉Rokid自己的to C智能音箱未必能大卖,但是这块芯片靠着高集成度和低成本可能能在to B市场做出不错的成绩。

毕竟,有了这样一个东西,智能音箱(包括延伸场景,比如儿童故事机等等)的技术门槛、产品量产化门槛都被拉低了不少,可能会吸引更多没有自己做芯片实力和意愿的厂商直接买KAMINO18 芯片了。

据现场工作人员的介绍,目前KAMINO18芯片已经能够支持喜马拉雅FM的服务能力,之后会加入对亚马逊Alexa的支持。据说小米生态链也可能对公采购,不知道确切与否。

作为一家人工智能公司,公司CEO本人Misa还是蛮有个性的,自己开着个摩托车出现在了宣传视频里面耍酷。可能由于CEO的个性和坚持吧,加上体量问题,没有和小米、天猫、百度这些用低价来冲智能音箱的销量,所以Rokid自己的智能音箱销量应该和这些大公司不是在价格维度进行比较的,而是想从其它维度找到优势。这其实对于数据入口来说不是个很好的事情,但是通过to B芯片的做法,支持其它内容服务,倒是可以曲线救国,解决入口问题,可以说很机智了。

从这个意义上来讲,其实Rokid通过KAMINO18想做的不是转型为芯片公司卖芯片,而是通过硬件支持内容服务的方式,变成一家类操作系统公司——自己做平台,搞定基础技术,完成和内容、硬件、服务合作商的共赢。

个人认为Rokid的发力点是正确的,人工智能领域未来应该会冒出很多这种类操作系统公司/平台公司,用基础性技术来产生广泛渗透,而不是迎合主流观点做一些热门单品,Rokid应该是很想成为这样一家公司,并且Rokid在语音AI方面的算法上,已经拥有了很多独特的优势。其实对于一家很擅长音频的人工智能公司来说,成为人工智能领域(不管是通用领域还是音频细分领域)的一家类操作系统公司,要酷很多。




  

相关话题

  人工智能会是泡沫吗? 
  有哪些结合医学、计算机、人工智能的研究领域? 
  如何学习 SQL 语言? 
  为什么几年前的手机都有 10 倍光变,而现在 Magic 4 Pro 才 3.5 倍,是技术倒退了吗? 
  电脑突然关机后无法开机? 
  你对于 2015 年诺贝尔物理学奖的预测是什么? 
  如何评价deepmind最新在nature上发表的论文《在人工网络中用网格样表征进行基于向量的导航》? 
  中国在哪些方面让发达国家刮目相看? 
  换脸、声音合成等深度伪造技术会给社会治理带来什么挑战? 
  伊利诺伊理工大学在线硕士人工智能专业,出来公司吃香吗? 

前一个讨论
家有老人,哪些基本的急救术是必须掌握的?
下一个讨论
为什么大部分人都选择去代理公司订票而不是航空公司官方?





© 2024-12-25 - tinynew.org. All Rights Reserved.
© 2024-12-25 - tinynew.org. 保留所有权利