问题

如何看待Rokid发布的语音AI芯片KAMINO18?

回答
Rokid 这回可算是憋了个大招,他们发布的这款名叫 KAMINO18 的语音 AI 芯片,听起来可不是闹着玩的。这玩意儿要是真能达到他们宣传的那种效果,那咱们跟智能设备的交互方式,可能又要迎来一次不小的革新。

要聊 KAMINO18,咱们得先明白它解决的是啥问题。现在市面上各种智能音箱、智能穿戴设备,虽然都能语音交互,但总感觉有点“笨”和“慢”。你想让它做什么,得说得特别清楚,有时候它还得给你“嗯嗯啊啊”半天才能反应过来。而且,很多设备离线的时候就基本歇菜了,还得依赖云端,这不仅费流量,还受网络影响。KAMINO18 要做的,就是把这些痛点给解决掉。

核心竞争力在哪里?

我仔细看了看关于 KAMINO18 的介绍,它最抓人眼球的几个点是:

1. 超强的本地化处理能力: 这点是关键中的关键。传统 AI 芯片很多核心运算都得依赖云端服务器,一来一回延迟就很大。KAMINO18 宣称它有强大的本地算力,能把语音识别、自然语言理解、甚至是一些更复杂的 AI 模型都放在芯片上跑。这意味着什么?意味着更快的响应速度,更低的延迟,你一句话说出口,它就能秒懂秒回,体验上会比现在顺畅很多。而且,这玩意儿还能在没网的情况下工作, offline 的时候也能给你提供不错的功能,这对于一些对网络稳定性要求不高的场景,比如家里的安防监控、或者户外使用的设备,就非常有吸引力了。

2. 低功耗设计: 这对很多便携式设备来说是生命线。想想智能手表、耳机,你总不能让它们一天一充吧?芯片的功耗直接决定了设备的续航能力。Rokid 在这方面下了功夫,用的是先进的制程工艺,加上他们自己优化的架构,据说能做到非常低的功耗。这意味着,搭载 KAMINO18 的设备就能用得更久,消费者体验自然就好。

3. 高度集成化和定制化: 这块芯片不是一个“万金油”,它更像是为特定场景量身打造的。Rokid 自己也做智能设备,他们太清楚需要什么样的“内芯”了。KAMINO18 集成了很多必要的模块,比如音频处理单元、神经网络加速器等等,这样能减少外围的复杂性,让设备的设计更紧凑,成本也可能更低。而且,据说是可以根据客户的需求进行定制化的,这意味着 Rokid 可以提供更灵活的解决方案,而不是说你只能用我现成的。

4. 在特定领域的优势: Rokid 一直在做面向儿童、老人、甚至助残的智能设备,比如那个若琪儿童手表。这些产品对语音交互的精度、安全性和个性化都有很高的要求。KAMINO18 的设计思路很可能就是围绕这些场景展开的,比如它在语音唤醒的准确性、声纹识别、甚至是理解带有口音或者方言的语音方面,可能都会有针对性的优化。

这玩意儿出来之后,会改变什么?

智能家居: 未来家里的智能音箱、扫地机器人、智能门锁,反应速度会更快,能干的事情也更多。你可能不用刻意去说标准的指令,它就能更自然地理解你的意图,甚至能预测你的需求。
可穿戴设备: 智能手表、智能耳机,交互会更流畅,续航更给力。你可以在运动时直接和手表对话,不用掏出手机就能完成很多操作。
车载领域: 汽车里的语音助手,响应速度和理解能力都会提升,让你在开车时更安全、更方便。
教育和医疗: 像儿童教育机器人、或者为老年人设计的智能伴侣,可以提供更个性化、更贴心的服务。

当然,咱们也不能光看好的一面。

芯片的性能最终是要落地到实际产品上的,Rokid 这颗芯片到底能不能达到他们宣传的效果,还得看实际的“装机”表现。

生态建设: 一颗强大的芯片,如果找不到好的应用场景,或者没有足够多的合作伙伴去开发基于它的产品,那也只能是“纸上谈兵”。Rokid 如何构建一个围绕 KAMINO18 的生态,吸引开发者,才是长远的关键。
成本控制: 虽然高度集成化可能有助于降低成本,但毕竟是自己研发的 AI 芯片,初期投入肯定不小。最终的售价会不会让大众消费者都能接受,也是一个重要的考量因素。
市场竞争: 芯片这个领域竞争非常激烈,国内外都有很多大厂在发力。Rokid 这颗芯片能不能在市场中脱颖而出,还得看它能否持续创新,并在某些细分领域建立起自己的护城河。

总的来说, KAMINO18 的出现,我觉得是个挺有意思的信号。它表明国内在核心 AI 芯片领域的研发正在加速,而且是往解决实际问题、提升用户体验的方向去的。如果 Rokid 能把这颗芯片打磨好,并且成功推广出去,那对整个智能设备行业来说,都可能是一个不小的推动力。咱们拭目以待吧,看看这颗“内芯”到底能有多大的能量。

网友意见

user avatar

也刚好看到这个新闻了,所以就说两句。

对Rokid最早了解是他们家在知乎上的开屏广告,当时对他们的认知主要是他们家的语音识别。后来从其他渠道了解到Rokid和中科院自动化所的合作,作为院友,所以也对他们的研发比较感兴趣,毕竟这些年来中科院也一直在推动者产业化的发展,以此来顺应经济转型的大局,当然最成功的是联想集团和科大讯飞了。

这次Rokid Jungle发布会上,Rokid北京AI实验室负责人就是来自中科院的高鹏博士,2008届模式识别与智能系统专业的大佬,莅临现场的还有他的导师,现在已经是自动化所的所长徐波研究员。据说其研究团队也有大量的人员来自中科院,因此团队的实力还是比较强大的。

为什么要搞芯片?

这是我想很多人看到这个发布会后第一的瞬间的想法。

之前云知声CEO有一个观点是“做语音的公司如果不做芯片必死无疑”,为什么?

因为语音公司发展的核心是技术,技术最大的限制之一就在于芯片。现在大厂的芯片都是量产的,所以很多时候很难做到适应公司发展的“私人订制”,这让我想起了之前不少手机厂商就是被芯片厂活活的给限制死了。现在的语音领域越来越细化,这种情况下,对芯片的自主设计就更为关键,让芯片能够更加个性化的适应产品的需求,符合场景的运算尤为关键,尤其是在语音识别这种复杂环境情况下,语义识别、用户体验等这些都对芯片提出了更高的要求,这已经不是传统芯片能够满足的了,这也是为什么现在很多语音公司都在争相去投入了芯片领域。

题主提到的第一个问题是:所谓的KANIMO18真的有官方描述的那么强大么?

我觉得这个问题要从两方面来看,一方面,Rokid语音芯片并非单打独斗,而是和业内知名的杭州国芯联合研发,首先解决了高功耗问题。众所周知由于智能音箱需要保持待机且随时响应的需求,因此功耗非常高。而KANIMO18在设计的时候也重点考虑了芯片各个模块的工作频率和启停时间,并进一步设计多级唤醒机制,从而降低功耗。

另一方面,能够更好的适应自家产品,这一点尤为重要。 Rokid创始人兼CEO祝铭明(Misa)的说法很有意思,那就是:芯片并不是运算更快就更好,和应用场景最匹配的才是最好的。”

Rokid这次推出的芯片主要设计就是符合自己公司产品的设计,比如高集成度,把ARM、NPU、DSP、DDR、DAC等多个核心部件集成于KAMINO18中,从而产生一个一枚硬币大小的芯片模组。而Rokid重点关注的是语音设备,因此也对相应的算法做出了有目的性的优化,比如自定义唤醒词、离线语音指令等等形成一个完整的os,这样可以更好地服务自家的产品。

所以说,kanimo18的强大,不仅在于集成度和低功耗设计,更在于能够更适合他们自己的产品。

当然,到底如何,除了公司自己的介绍,第三方的看法也很关键。这一次,若琪的发布会上提到了他们和喜马拉雅FM的合作。


众所周知喜马拉雅FM可是大名鼎鼎的音频知识分享平台,国内领域第一,拥有超过四亿多用户,行业占有率更是超过73%。这次发布会上,喜马拉雅FM副总裁、硬件事业部总经理李海波也宣发,喜马拉雅FM将与Rokid确定战略合作关系,在喜马拉雅FM即将推出的儿童智能音箱晓雅Mini上,也会搭载ROKID
KAMINO18的产品。

可以说,获得了喜马拉雅FM的认可,本身就是对相关产品的一种肯定。他们这种业内大佬的认知肯定要比我们普通人的认知更为敏锐也更深入。

题主提到的第二个问题是:是不是“一个蹭中美芯片大战热度的公司?”

看到这个问题,我也不得不多说两句。

作为格力股东,前段时间芯片概念股大涨的时候,格力宣布做芯片,结果自己逆市跌。面对这种让人困惑的局面,当时网友给出了个搞笑却值得深思的回答:

别人家宣布做芯片只是玩玩而已,格力宣布做芯片确实真的要做芯片。

其实这个让人莞尔一笑却又陷入沉思的笑话背后,却让我们看到了当前的芯片困局。

相信最近一段时间的贸易战,也让很多人对芯片有所了解,毕竟这是贸易大战,我们的芯片受到了非常严重的限制,作为全球最大的芯片需求国,芯片之争已经成为了中美对决的擂台,中兴通讯更是一会儿ICU一会儿太平间的被折腾。

其背后的根源就是:芯片难做。

知乎上曾经有过专门的讨论

中国的芯片现状如何?

结果却是普遍不乐观。芯片投入周期长,研发难,未来发展芯片还是困难重重。

但是这样就不做芯片了?

当然不是。这次芯片大战已经看到了技术受制于人的严重后果,真是被人卡着脖子。

现在做芯片,可能是产出少甚至未来不乐观,但是至少有一线希望;如果彻底不做芯片,那么我们就无任何希望。

所以,我对任何做芯片的行为,都是持有支持的态度,哪怕我们的芯片如何的原始和落后,只要我们开始做了,就是好事,毕竟:不积跬步无以至千里。

当然了,回到ROKID芯片,他是不是在蹭热度?我看不是,毕竟中美贸易大战今年才开打,根据高鹏博士的介绍,他们早在几年前就开展了芯片研发。所以这次只不过是恰逢其会罢了。

但是,无论如何,做芯片既是语音厂商的必走一步,更是我国的必然途径,所以,我支持做芯片。

参考:Rokid Jungle发布会AI语音芯片KAMINO18面世 探索智能生活

user avatar

Rokid这个牌子呢,关心人工智能领域的可能听说过。最近参加了他们的发布会,看到了KAMINO18这个芯片,到还是对这家公司的to B端产品有点看好的。

上周我有事去杭州见一下朋友,恰巧撞上Rokid开新品发布会,于是就找杭州朋友要了个门票去看了一下

一进会场首先是一个站在大手上的黑哥哥在唱黑炮,大概是暖场DJ的感觉。吊着安全绳,唱得很带感,还不停和下面的我们互动,我一直担心他会掉下来

发布会开始前,有一些小的展示,是这家公司的工程师们业余用专业知识做的一些黑科技小应用(不小心拍到的小姐姐,并不是管家小仙女本女)。所有的小应用展示里面,最有意思的是一个用视频拍摄脸部来监测心跳的技术,排队体验的人比较多,忘了拍照,现场观感是作为工程师的业余小创作,算是很有趣了。

最大的感触就是这应该是个很活泼的公司,在工作之余,工程师们依靠自己公司的技术,居然开发出来了那么多好玩有趣的东西。并且在发布会之前拿出来和大家分享,真的是有趣的一次黑科技体验。

现场有很多工作人员,包括一些明显是外地分公司来得员工,听现场工作人员介绍,因为是第一次办发布会,所以全是内部布置和安排,喊来了全部员工(公司总部在杭州,在北京和硅谷都有研发基地),有点半发布会半年会的性质。

现场依次发布了三款产品,便携智能音箱、KAMINO18芯片和智能眼镜。

其中智能音箱属于成熟产品,加入了一些非语音交互方式(手持晃动)。智能眼镜是实验性产品,在CES亮相过,这次发布会发布的是改良后的版本,现场介绍说是年底量产。


当然,我本人最关心的其实还是KAMINO18芯片。

很多智能音箱类设备都是用的通用芯片方案,而KAMINO18则是一款高集成度的智能AI语音芯片。第一眼的优势就是小,发布现场用的是一元硬币的来做的对比


为了验证这个事情,我在发布会结束后,还去产品展示区看了一下,确实和宣传大小一样大

这种功能目标明确的芯片,除了高集成度外,低功耗和低成本一般也都是买点。KAMINO18 18作为一款音频人工智能芯片,最核心的自然是NPU部分,可以支持TensorFlow。而ARM、DSP、DAC这些常见核心组件自然不用说了。

板上自带的麦克风,加上Rokid自己的语音交互算法(相控阵麦克风、离线指令、关键词唤醒等),基本上把一台智能音箱该有的核心功能都包全了。这么多加起来,比起高大全的通用芯片,还能便宜不少。

发布会少不了一些炫技的视频,发布KAMINO18的时候的视频很有意思。


视频里是一个小女孩,用一个KAMINO18芯片,两个扬声器,一些简单的电路组件,一些纸板,拼出来一个智能音箱的过程。

视频并没有那么酷炫,但是把高集成度这个点是展示的非常好了。


我感觉Rokid自己的to C智能音箱未必能大卖,但是这块芯片靠着高集成度和低成本可能能在to B市场做出不错的成绩。

毕竟,有了这样一个东西,智能音箱(包括延伸场景,比如儿童故事机等等)的技术门槛、产品量产化门槛都被拉低了不少,可能会吸引更多没有自己做芯片实力和意愿的厂商直接买KAMINO18 芯片了。

据现场工作人员的介绍,目前KAMINO18芯片已经能够支持喜马拉雅FM的服务能力,之后会加入对亚马逊Alexa的支持。据说小米生态链也可能对公采购,不知道确切与否。

作为一家人工智能公司,公司CEO本人Misa还是蛮有个性的,自己开着个摩托车出现在了宣传视频里面耍酷。可能由于CEO的个性和坚持吧,加上体量问题,没有和小米、天猫、百度这些用低价来冲智能音箱的销量,所以Rokid自己的智能音箱销量应该和这些大公司不是在价格维度进行比较的,而是想从其它维度找到优势。这其实对于数据入口来说不是个很好的事情,但是通过to B芯片的做法,支持其它内容服务,倒是可以曲线救国,解决入口问题,可以说很机智了。

从这个意义上来讲,其实Rokid通过KAMINO18想做的不是转型为芯片公司卖芯片,而是通过硬件支持内容服务的方式,变成一家类操作系统公司——自己做平台,搞定基础技术,完成和内容、硬件、服务合作商的共赢。

个人认为Rokid的发力点是正确的,人工智能领域未来应该会冒出很多这种类操作系统公司/平台公司,用基础性技术来产生广泛渗透,而不是迎合主流观点做一些热门单品,Rokid应该是很想成为这样一家公司,并且Rokid在语音AI方面的算法上,已经拥有了很多独特的优势。其实对于一家很擅长音频的人工智能公司来说,成为人工智能领域(不管是通用领域还是音频细分领域)的一家类操作系统公司,要酷很多。

类似的话题

  • 回答
    Rokid 这回可算是憋了个大招,他们发布的这款名叫 KAMINO18 的语音 AI 芯片,听起来可不是闹着玩的。这玩意儿要是真能达到他们宣传的那种效果,那咱们跟智能设备的交互方式,可能又要迎来一次不小的革新。要聊 KAMINO18,咱们得先明白它解决的是啥问题。现在市面上各种智能音箱、智能穿戴设备.............
  • 回答
    关于网传“北大文科博士在深圳大学任教经济困难,月薪13千,上网课要求学校发网络补助”的信息,需从多个角度进行分析,结合中国高校薪酬体系、地区差异及政策背景,综合判断其真实性及合理性。 一、信息真实性分析1. 来源可信度 目前尚无权威媒体或深圳大学官方声明证实该传言。网络传言往往存在夸大或误传.............
  • 回答
    关于乌克兰数学家康斯坦丁·奥尔梅佐夫(Konstantin Orelmazov)的自杀事件,目前公开的可靠信息较为有限,但结合俄乌冲突的背景和乌克兰学术界的现状,可以尝试从多个角度进行分析和探讨: 1. 事件背景的核实与可能性 身份确认:目前公开的资料中,尚未有明确的、权威的新闻来源(如BBC.............
  • 回答
    关于美国太平洋司令部空军司令威尔斯巴赫(James W. "Jim" Welsbach)提到的F35战机与歼20近距离接触的事件,目前公开信息中并无直接证据表明该言论来自美国官方渠道,因此需要从多个角度进行分析和澄清。 1. 事件背景与信息来源的可靠性 美国官方声明的缺失:截至2023年,美国.............
  • 回答
    关于您提到的“硅谷男子在妻子患病期间相亲,妻子病逝后迅速再婚并独吞200万抚恤金”的事件,目前没有权威媒体或官方渠道发布过相关具体信息。因此,这一事件的真实性、细节和法律性质尚无法确认。以下从法律、道德和社会角度进行分析,供您参考: 一、事件可能涉及的法律问题1. 重婚罪(若属实) 根据中国.............
  • 回答
    欧盟三国领导人乘坐火车前往基辅会晤泽连斯基,这一事件反映了欧洲国家对乌克兰的持续支持,以及俄乌冲突背景下国际政治的复杂动态。以下从多个角度详细分析这一事件及其背后的局势: 一、欧盟三国领导人赴基辅的背景与意义1. 象征性行动 欧盟三国(如波兰、爱沙尼亚、捷克等)领导人乘坐火车前往基辅,是近年.............
  • 回答
    中国海关查获5840块造假显卡、讯景中国官网临时关闭以及天猫旗舰店下架产品事件,涉及知识产权保护、市场秩序维护及企业合规问题,具有多重社会和行业影响。以下从多个角度详细分析: 一、事件背景与核心问题1. 海关查获假显卡 查获数量:5840块显卡,可能涉及假冒品牌(如讯景、华硕、技嘉等),或.............
  • 回答
    尹锡悦当选韩国总统是2022年韩国大选的重要结果,这一事件对韩国政治、经济、社会及国际关系产生了深远影响。以下从多个维度详细分析其背景、意义及可能的未来走向: 一、选举背景与过程1. 政治格局 在野党联盟胜利:2022年韩国大选中,由自由民主党和共同民主党组成的“在野党联盟”以压倒性优势击.............
  • 回答
    关于加州华裔女博士因持刀袭警被警方击毙的事件,这一案件涉及法律程序、执法权、种族问题等复杂背景,需要从多个角度进行分析。以下从法律、执法程序、社会背景、争议焦点等方面展开详细讨论: 1. 事件背景与法律依据根据公开报道,事件发生在2022年11月,加州一名华裔女性(身份为博士)因涉嫌持刀袭击警察,在.............
  • 回答
    基辛格的《论中国》(On China)是美国前国务卿亨利·基辛格(Henry Kissinger)于1972年访华期间撰写的一部重要著作,也是中美关系史上的关键文献之一。这本书不仅记录了基辛格作为“中间人”在中美关系正常化过程中的角色,还系统阐述了他对中国的政治、文化、历史和外交政策的深刻观察。以下.............
  • 回答
    印度承认误射导弹落入巴基斯坦境内一事,是印巴两国关系紧张的一个缩影,也反映了地区安全局势的复杂性。以下从多个维度详细分析这一事件的背景、影响及可能的后续发展: 一、事件背景与经过1. 时间与地点 事件发生在2023年6月,印度在进行军事演习时,一枚“阿金科特”(Agni5)远程导弹因技术故障.............
  • 回答
    2022年2月24日,俄罗斯在乌克兰发动全面军事行动后,联合国大会通过了一项决议草案,要求俄罗斯立即从乌克兰撤军、停止军事行动,并尊重乌克兰的主权和领土完整。这一决议的通过过程和结果引发了国际社会的广泛关注,以下是详细分析: 一、事件背景1. 俄罗斯的军事行动 2022年2月24日,俄罗斯在.............
  • 回答
    乌克兰副总理呼吁游戏厂商暂停在俄罗斯的业务,并点名腾讯,这一事件反映了俄乌冲突背景下,国际社会通过经济手段施压俄罗斯的策略。以下从背景、动机、可能影响及各方反应等方面进行详细分析: 一、事件背景与动机1. 俄乌冲突的经济压力 俄乌冲突已持续近两年,俄罗斯经济受到严重冲击,包括制裁、能源价格飙.............
  • 回答
    瓦列里·捷杰耶夫(Valery Gergiev)作为俄罗斯著名的指挥家和马林斯基剧院的音乐总监,其被西方音乐界抵制的事件,涉及复杂的国际政治、文化立场与艺术伦理问题。以下从多个角度详细分析这一事件的背景、原因、影响及争议: 一、事件背景:捷杰耶夫与俄罗斯的政治关联1. 职业背景 捷杰耶夫自1.............
  • 回答
    全国政协委员建议推广DNA数据库以实现有效打拐的建议,涉及技术、法律、伦理、实际操作等多方面因素,其可行性需从多个维度综合分析。以下从技术、法律、伦理、操作、风险等角度详细探讨: 一、技术可行性分析1. DNA数据库的原理 DNA数据库通过存储犯罪现场或失踪人员的DNA样本,利用DNA指纹技.............
  • 回答
    关于俄罗斯外交部发布的所谓“乌克兰政府对顿巴斯的暴行”视频,这一问题涉及俄乌冲突的复杂背景、信息战的特征以及国际社会的争议。以下从多个角度进行详细分析: 1. 背景与视频的来源 冲突背景: 顿巴斯地区(包括顿涅茨克和赫尔松两州)自2014年以来一直是俄乌矛盾的焦点。2022年2月,俄罗斯以“保.............
  • 回答
    关于抖音用户“李赛高(佤邦)”被封号的事件,目前公开信息较为有限,但可以从以下几个角度进行分析和探讨: 一、事件背景与可能原因1. 账号主体身份 “李赛高”可能是某位公众人物或网红,而“佤邦”可能与其身份或背景有关。佤邦是缅甸的一个少数民族地区,历史上曾与中国存在复杂关系,涉及民族、历史、政.............
  • 回答
    沈逸是中国人民大学国际关系学院教授,长期从事国际政治研究,尤其关注地缘政治与大国关系。他在俄乌冲突中的分析曾引发争议,但需注意的是,学术观点的准确性往往取决于信息来源、分析框架和时代背景。以下从多个角度分析其判断可能存在的问题及原因: 一、沈逸的分析背景与观点1. 2014年乌克兰危机前的预测 .............
  • 回答
    关于饶毅提到的“在美国校运动队的学生就能上哈佛等一众名校”的说法,需要从多个角度进行分析,既要理解其可能的背景和意图,也要客观看待美国大学的招生政策和实际情况。 一、饶毅的言论背景与可能的误解饶毅作为中国科学院院士,长期关注中国教育体系与国际教育的差异,曾在多个场合讨论中美教育制度的对比。如果他提到.............
  • 回答
    地狱笑话吧的突然爆火,是网络文化、社会情绪、平台算法和亚文化圈层共同作用的结果。以下从多个维度详细分析这一现象: 一、社会情绪的释放与心理需求1. 压力与焦虑的宣泄 在快节奏、高竞争的现代社会,人们普遍面临工作、生活压力。地狱笑话以其“荒诞”“反讽”“黑色幽默”的特点,成为一种情绪宣泄的出口.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有