今年,苹果智能助手Siri引发的问题不断,始终占据着媒体上的主导地位。而Siri的成功之一,即它在听到“Hey Siri”的发音时就开始倾听的功能,也已经成为《机器学习期刊》有关苹果需要应对的最新主题,这也暗示了Siri未来的改进方向。
苹果解释称,iOS设备现在不断地监听提示,并指出人工智能(AI)的进步可以消除Siri对初始训练的需求。在“个性化Siri”中,Siri团队指出,该功能面临的最大挑战是意外激活和意外错过激活。目前,苹果试图通过利用设备主人的声音设置Siri来防止这些问题,要求用户对Siri进行简短的训练,并用五种对话来创建用户资料特征。然后Siri悄悄地添加用户的35个“被接受”话语,帮助改善个人资料。
有趣的是,“Hey Siri”的触发点是,这个配置文件不仅仅是试图匹配单个语音输出,而是最终包含了这个短语的基线版本,有40个变体可被接受。Siri只会在给定的“Hey Siri”话语等于或高于平均得分的情况下才会被激活。该设备还存储了40个“Hey Siri”的请求记录,使用户的个人资料在没有经过用户重新培训的情况下得以重建,而苹果则通过软件更新改进系统。
将来,苹果希望Siri不必接受预先训练,用户的配置文件将会被清空,然后通过用户许可,随着更多请求的加入,Siri能自我成长和更新自己。该公司还在研究如何屏蔽“虚假接受”,即Siri被用户以外的其他东西唤醒。使用深度神经网络,苹果相信它可以将“虚假接受”率降低50%,降低错误拒绝率(当用户说“Hey Siri”时设备没有回应)约40%,而Siri被其他人激活的几率可降低75%。
另一个问题是让Siri在更大和嘈杂的环境中表现得更好,比如汽车或者有风的户外环境。苹果公司的团队表示,目前正在研究如何处理与用户个人资料中现有的“Hey Siri”录音严重不匹配的环境,但在所谓的“多风格训练”中取得了成功。在这种训练中,训练数据的一个子集被不同类型的噪音和混响所增强。
因为苹果始终在改进Siri,而且并不一定会改变所有调整,所以不清楚上面提到的改进会在什么时候实现。在6月份的全球开发者大会上,苹果经常强调Siri的重大变化,鉴于最近对Siri缺点的讨论,我们预计在不久的将来会听到有关Siri更重要的消息。