Rokid CEO Misa:5万台是智能音箱的入场券

2024-12-03 09:51:28 admin

雷锋网按:6 月 8 日下午,音箱 Rokid 创始人兼 CEO Misa 与媒体分享了其对 AI 和智能音箱未来两年发展趋势的场券思考。以下是音箱其演讲和采访实录,雷锋网做了不改变原意的场券删减。

Rokid CEO Misa:5万台是音箱智能音箱的入场券

很多人问我,这么多公司在做智能音箱,场券你是音箱怎么想的?对 Rokid 来说,我们做两件事情,场券一个是音箱 AI 大脑,一个是场券 AI 交互。

书和电影里,音箱包括一些宣传和半业内人士,场券经常跟大家讲 AI,音箱但其实 AI 能做的场券事情没那么多,它就是音箱提升效率和体验,偏工具化,跟你用算盘没什么不同,只不过效率更高、更智能一些。今天主要是跟大家分享一些我现在的想法,我把它叫做 AI 的全面升级。

所谓 AI 的全面升级,其中第一个趋势就是 AI 开始从感知到认知。

认知是什么概念呢?它主要分三个方面。

首先是个体认知,比如刚才高鹏(Rokid 北京 A-lab 负责人)讲到的声纹识别,就是当家里不同的人跟若琪(Rokid 发布的新款智能机器人)讲话的时候,它能识别出是谁。我相信语音技术中的个体认知就像智能手机里的触屏一样,将会引发产业的大革命。

其次是环境的认知,一个 AI 产品可以对自己所处的环境作出认知,比如判断现在是在客厅、厨房、车上、餐厅或者什么地方。

然后是对事务的认知,也有人把它叫意图认知,就是当你跟它沟通时候,机器大概能知道你要干什么。你可以给它一个具体的任务,比如“我要听歌”,可能有时候任务没那么细,像“我要从杭州去北京”,非常简单的一句话,但是涵盖了很多东西:可能我需要买机票,订酒店,叫车,预定餐厅,还有可能会见朋友,这个叫事务的认知,不久的未来也会发生。

个体认知对未来到底有什么影响?它可以把很多功能执行变得更简单,使体验更流畅。比如用户要给某人留言,原来的做法是:我是谁谁,帮我留言给谁谁。未来这个就会非常简单,就像刚才视频里一个妈妈问机器几点,机器发现这个是妈妈的时候,会把爸爸给她的留言直接报出来。

第二个趋势是未来 AI 会全面云端化。

AI 的全面云端化包括几个方面:第一,所有共享的知识都在云端,音乐内容、百科内容、用户要问的问题等;第二,个性化的知识也会存储在云端;第三,任务的状态会云端化。什么叫任务的状态?一件事,我让机器做了一半,它会在云端记住我做到哪了,下次启动后要求它继续做的时候,它可以继续做。

第三个趋势就是从单设备到多设备的互动。

未来用户家里面肯定不会只有一个 AI 设备,因此就会面临多机协作的问题——几个机器协商谁最适合接这个任务。

还有一个趋势是多维互动。现在我们用语音跟这个产品互动,而未来,不仅仅是语音,摄像头、手势、甚至一些传感器都可以进行互动。

原来大家都是使用 AI 产品的某一种特定功能,而接下来它会进入一个全新的阶段。个性的觉醒,多维的互动,状态的迁移......这些到最后又将引发场景的迁移,并行成无处不在的个性 AI。

我们可以想象,一个无处不在的 AI 将会跨设备,跨地域,并且不再拘泥于某一个具体形象。它可以是手机,可以是汽车,也可以是电视。这,才是未来。

采访实录:

记者:相比Google Home,Echo 和 Home Pod,Rokid 外星人的价格是他们的两倍还多,考虑过市场的接受度吗?

Misa:不能这样比,应该用月石跟他们比。这样比就像用保时捷跟夏利比一样,这是两类完全不同的产品,外星人是带完整显示交互设计和灯光体验的产品,跟他们是两个东西。

记者:第一款产品是有显示屏的,现在去掉了显示屏,怎么完成这种转变的?

Misa:之前我们确实觉得需要有显示屏。我们认为语音只是交互方式的一种,要看到东西,呈现更多的信息,才更方便交互。不过后来我们发现,用户家里本来就已经有多块屏幕,不需要再多一块屏。

记者:月石增加了声纹识别的功能,这也是 Google Home 的一个亮点,但它的体验并不是太好,错误率很高,Rokid 在声纹识别这方面能做到什么程度?

Misa:如果回顾历史,可以看到,从来没有一项技术是100%成功的,等到一个技术发展到100%的时候,早就被更廉价的80%的技术干掉了。很多产品都是边发展边改进技术。声纹技术也并没有成熟到100%准确,但是怎么样用一个不是100%准确的东西做出近乎100%准确的体验,这方面有很多保密的东西,不能讲太多。

记者:怎么看待同类产品间的竞争?

Misa:现在还集中在产品跟技术层面,未来会是多维度的。技术和用户对产品的接触达到一定程度,会有整个生态的多层面竞争,会比手机的竞争更复杂。

记者:Rokid 未来的对手应该都不是小公司,甚至包括用户规模以亿计的公司,在用户基数和数据积累方面应该比你们有很大优势?

Misa:数据规模上,也对也不对。建立语音技术上的数据规模,需要做不断的积累,比如方言,就得慢慢积累。AI 对数据的需求,没有大家想的那么巨大。比如听音乐,有多少种说法呢?我要听什么,给我放什么,来一首什么......两只手数得过来。如果一个场景是受限场景,或者相对的封闭场景,数据规模没有那么大,到一定程度就差不多。接下来增加一倍、十倍的量,提升的也很有限。

记者:Rokid 想做智能家居的控制中心,但很多智能家居厂商更倾向于建立自己的生态,不愿意对外开放,这个问题 Rokid 怎么解决?

Misa:我们相信两个力量。第一相信市场的力量,只要最后的玩家不是一家,一定会趋向于协作。只有一种场景下是趋向于封闭的,就是一家独大,没有竞争者,这一家来定所有规则,这里还不包括有潜在竞争者。

比如我们跟米家在对接,对接得很好,即便我们知道小米会有类似的产品推出。你不开放,别人开放,你就有可能因此被打败。成熟的市场总体来讲都是开放的,只是有些东西会保守,比如数据不会开放。以美国为例,苹果和谷歌有竞争,你有没有发现互相封杀的情况?没有,甚至Google Assistant 还有ios版本。最后大家协作是最好的方式。

记者:你觉得国内智能音箱的爆发期大概将在什么时候出现?

Misa:两年,两年就可以爆发。2019年我相信会有质的变化。AI 发展非常快,谁也不敢想象两年后会是什么样子。

记者:对于智能音箱品牌来说,达到多少销量可以顺利完成商品化?

Misa:5万台是一个门槛。国内的智能音箱市场也就几百万,5万台就证明几个产品里面有一台是你的了。

来自雷锋网报道。

智能音箱系列报道:

《亚马逊的秘密部队和差点成笑话的Amazon Echo》

《钱晨:为什么“智能音箱”可能会被做臭?》

《灵隆科技魏强:“智能音箱”可能会消失》

《DuerOS+小鱼在家,陆奇说要做一件科技巨头都没干成的事》

《云知声谢冠超:智能音箱是个伪命题》

《李志飞:想在中国复制 Echo 的成功,肯定都不靠谱》

《Echo发了快三年,为什么中国还是没一款智能的音箱?》

友链


  • 文章

    9

  • 浏览

    995

  • 获赞

    326

赞一个、收藏了!

分享给朋友看看这篇文章

热门推荐