也许是国内最全“智能音箱”评测,教你如何选 AI 音箱?

智能音箱大战早已在硅谷打响,如今,这场战火也点燃了中国市场。井喷式发展的中国智能音箱市场已经成为了科技巨头、传统行业厂商、创业公司博弈的竞技场,玲琅满目的智能音箱产品都奔赴在路上!

“百箱大战”之中,有哪些产品脱颖而出,适合入手?作为消费者,又该如何选择市场上的智能音箱产品?今天,“声学在线”就来评测一下国内主流的智能音箱产品。

声学在线从产品销量、用户关注度、生产厂商影响力等几个维度考察市面上的智能音箱产品,从中选取了6款智能音箱产品,分别是阿里巴巴旗下的“天猫精灵”X1,科大讯飞与京东合资企业推出的“叮咚音箱”A1,喜马拉雅FM推出的“小雅 AI 音箱”,联想推出的“联想智能音箱”,小米推出的“小米 AI 音箱”,Rokid 推出的“Pebble 月石”智能音箱。

评价一款“智能音箱”是否值得购买?除了颜值和价格以外,可以从两方面性能入手,第一就是产品的智能交互属性,第二就是产品的音箱属性。接下来就从这几个维度评测一下这 6 款智能音箱。

智能交互属性

什么是 AI 音箱的智能属性?对于消费者来说,最为关心的就是智能音箱的语音交互精准性,响应速度,复杂环境下的可用性,以及功能体验的人性化、智能化和个性化。声学在线从上述几方面入手,撷取了可以定量评测的指标,对这 6 款音箱进行了评测考察。

1、语音交互精准性

目前市面上的所有智能音箱都会有一个商家已经定义好的“名字”,商家称其为唤醒词。这个“名字”对于智能音箱来说特别关键,是所有用户与智能音箱交流的起点。

想要语音操控一台智能音箱,必须要叫它的“名字”,就是唤醒词,否则没有长“眼睛”的智能音箱,可不会理你。以下是今天评测的这 6 款音箱的“名字”——唤醒词。

上表为各智能音箱产品的唤醒词

知道了智能音箱的名字之后,我们就可以与音箱进行语音交互了。以往市面上,我们熟悉的产品,比如手机,平板等,都还停留在近场语音交互的阶段,我们与其交互的距离一般不超过 50 公分,在这个距离内会有一个很流畅的语音交互体验。当距离拓展到 1 m,上述设备的语音交互功能基本处于歇菜的状态,或者歇菜的边缘。

而智能音箱产品的成功的将我们的语音交互拓展到了远场语音交互的阶段。1 m范围内,我们可以实现自由流畅的语音交互体验,甚至,当距离拓展到 3 m- 5 m时,也有一个相对可以接受的语音交互体验。首先,我们就来测试一下此功能表现。

1.远场语音唤醒

第一,我们测试的是远场语音唤醒的“唤醒率”。接下来,我们就要开始“我叫你三声,你敢答应吗?”的游戏啦。我们在声学测听室中测试上述 6 款智能音箱在不同环境下,不同距离条件下的语音唤醒率以及远场拾音能力——即语音唤醒能力的精准性。

测试条件:在声学测听室环境下,设置三种环境。(1)安静环境,40dB 以内;(2)噪声环境,播放固定的 60dB 白噪声音频;(3)自噪声环境,即在音箱自身播放音频或者播报语音的情况下,唤醒智能音箱。测试距离分别为 3m 和 5m 条件,采用相同音量大小的唤醒词对智能音箱进行语音唤醒,每种测试条件下,重复十次唤醒。

图为 6 款待测试的智能音箱

测试结果:

(1)以下为在 3m 距离下唤醒失败次数的统计结果,如下图所示。

图为:3m 距离唤醒失败次数统计

由上图所示:

安静场景下,3m 距离所有智能音箱都成功被唤醒。

自噪声场景下,3m 距离表现较好的是,小米 AI 音箱,叮咚智能音箱,天猫精灵和小雅音箱。噪声场景下,3m 距离表现较好的是,叮咚智能音箱,小米 AI 音箱和联想智能音箱。

综合上述三种声音场景,3m 距离测试条件下表现最好的前三名分别是:叮咚智能音箱、小米 AI 音箱、天猫精灵。

(2)以下为在 5m 距离下唤醒失败次数的统计结果,如下图所示。

图为:5m 距离唤醒失败次数统计

由上图所示:

安静场景下,5m 距离表现较好的是:叮咚智能音箱,小米 AI 音箱,小雅音箱,Rokid音箱;

噪声场景下,5m 距离表现较好的是,天猫精灵、小米 AI 音箱和叮咚智能音箱;

自噪声场景下,5m 距离表现较好的是,小米 AI 音箱和天猫精灵。

综合上述三种声音场景,5m 距离测试条件下表现最好的前三名分别是:小米 AI 音箱、天猫精灵、叮咚智能音箱。

第二,我们来测试一下各款智能音箱的“误唤醒”情况。顾名思义,误唤醒率就是指没有说出智能音箱唤醒词的情况下,智能音箱错误的触发。试想一下,日常生活里家中的智能音箱莫名其妙的就自言自语,也是一件蛮恐怖的事情。所以误唤醒率这个参数,对于智能音箱来说也十分关键。

测试条件:小编把 6 款智能音箱放在《声学在线》的会议室中,8 小时不间断的为 6 款智能音箱播放各种音频文件,包括《奔跑吧,兄弟》、《甄嬛传》、《郭德纲相声专辑》、《我的前半生》等,收集并记录各个音箱的误唤醒情况。

测试结果:

经过 8 小时的测试,表现最差的前三名分别是:叮咚音箱、Rokid 和天猫精灵,均出现不同程度的误唤醒情况,其他音箱并没有出现。其中,最为夸张的就是叮咚智能音箱,小编每次测试天猫精灵时,叮咚都会唤醒并抢先在天猫精灵前面回答问题。以下小视频为测试天猫精灵时,叮咚音箱的误唤醒情况。

<iframe frameborder="0" src="https://v.qq.com/iframe/player.html?vid=e0545gb8o8d&tiny=0&auto=0"></iframe>

视频时长 19 秒,测试天猫精灵时,叮咚音箱误唤醒

2. 远场语音识别/语义理解能力

测试完唤醒能力,接下来我们来看看谁家音箱的语音识别与语义理解能力更胜一筹。这些能力决定与智能音箱交互的可用性、流畅性。

前期准备:下载智能音箱提供的手机 App,并按照 App 提示要求进行配网。

图为各个智能音箱的手机 App

(1)配网:各个音箱的配网过程总体均需要两分钟左右的时间。其中,Rokid 通过蓝牙连接配置网络;叮咚音箱配网过程最简单;联想音箱的配网体验最差;小米音箱、天猫精灵,小雅音箱的配网过程基本相同。

(2)APP:目前,小米 AI 音箱、天猫精灵、小雅 AI 音箱、联想音箱的手机 App 都会推出“对话记录”的功能,以方便用户查验智能音箱对你的“指示”识别的是否正确。至于音箱是否理解你的命令,个性化、智能化的回答你的问题,就考验的各个音箱背后语义理解和云端内容服务的功力深厚程度了。

对比条件:在声学测听室环境下,设置三种环境。(1)安静环境,40dB 以内;(2)噪声环境,播放同一段 60dB 的雨声音频;(3)自噪声环境,即在音箱自身播放歌曲的情况下。语音唤醒距离为 2.5米,音箱播放大音量音乐时,执行唤醒音箱并进行查询天气的功能。从 App 的对话信息中查看远场语音识别的准确性,从音箱反馈的结果来看语义理解的能力。

对比结果:

(1)安静环境下,所有的智能音箱都可以成功唤醒。除了叮咚音箱手机 App 暂时不支持提供语音识别记录,Rokid 月石不能查看完整对话记录外,其他智能音箱的“对话信息”中可以清楚的看到语音识别的结果,都可以准确无误识别出所说的话。而从智能音箱反馈的应答结果来看,语义理解输出的结果也完全正确。

(2)噪声环境(播放同一段 60dB 的雨声音频)下,距离音箱 2.5m,播放同一段雨声音乐,固定音频节点(分贝数值大约在 60dB),进行唤醒智能音箱,并执行播放音乐,查询天气等命令,以下是 6 款音箱的各自表现:

<iframe frameborder="0" src="https://v.qq.com/iframe/player.html?vid=l0545f76e30&tiny=0&auto=0"></iframe>

视频时长 4 分 23 秒

从视频中我们可以看出:

叮咚音箱播放歌曲时,反馈的结果不正确,可能是歌曲名称识别不正确,或者语义理解出现问题;

小雅音箱查询天气时,会出现识别结果不正确的现象;

联想音箱执行命令时,语音识别正确,但是语义理解会出现错误;

图为小雅 AI 音箱、联想智能音箱的语音记录截图

小米 AI 音箱在噪声环境下的表现最好,查询天气、播放音乐的语音识别和语义理解反馈的结果都是正确的;

Rokid 月石播放音乐时,出现了无反馈结果的情况;

天猫精灵播放音乐时,识别结果一直不正确。

图为小米 AI 音箱、天猫精灵 App 中的对话记录截图

总体来说,智能音箱在噪声环境下执行各种命令,还是极具考验的。其中,小米 AI 音箱在噪声环境下语音交互的表现最好。

上一页12下一页

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。