2018年3月21日,格兰研究举办了中国智能语音业务集成发展峰会,从原有的机顶盒、智能电视等视频终端等领域的研究拓展到了智能终端、智慧家庭领域,借助此次机会格兰研究发布了《中国智能语音业务与应用发展白皮书》(以下简称《白皮书》),《白皮书》从语音技术发展、语音音箱市场、语音应用现状、影响语音业务应用发展的因素几个方面主要阐述了国内外智能语音音箱的发展。
语音技术提供商在不断发力,为智能终端产品升级提供有力支撑。目前国内多数语音厂商的在安静状态下的语音识别准确率大都达到95%以上,支持5米远场交互,如今均在向非标准环境下提高远场识别准确率、降低误唤醒率及响应速度的方向发展。
语音识别技术的发展促使语音终端市场百家争鸣。人工智能技术在2017年席卷全球,其中语音识别技术的发展带动了音箱市场的发展,语音智能终端的发展使得产品的推出速度不断加快。自从2014年亚马逊推出Echo后,国内众多企业涌入语音智能音箱市场,语音智能音箱品类也在逐年递增,2015年叮咚智能音箱进入市场后,其他品牌语音智能音箱开始涌入,2016年有4款语音智能音箱推入市场,2017年下半年更是呈现出爆发式增长,密集发布10余款语音智能音箱新品。
图表 1 国内外智能音箱发布情况示意图
国内智能语音音箱skills实现方式主要包括互动式、指令式、播放式三种。用户唤起工具达成事务:设备在这里模式中,是用户和生活服务的连接桥梁。解放双手,通过语音就能控制家居、发送短信、叫外卖等等。设备为用户提供内容:设备在这里模式中,扮演的是联网音箱的基础功能,将音乐、新闻、菜谱等内容推送给终端用户。用户和设备多轮交互:不再是指令式和播报式,而是和设备的多轮对话。主要用于在娱乐领域,如问答测试、情景探险、试图对话、听音唱歌等功能。