“侬好,吾似 Siri。”
在即将更新的 iOS 10.3 中,苹果给 Siri 增加了上海方言的支持。
这是粤语和台湾腔之后的另一种中文方言,在接受路透社的采访时,负责语音的主管 Alex Acero 解释了下他们如何给 Siri 添加一种新口音。
这是一个真人和机器共同工作的项目,苹果需要寻找声音来源录制样本,之后这些不同的词汇和句子会被算法拿来输出结果。不过即便都是中文,但每种口音对应的词汇都略有不同,所以苹果又需要真人来矫正语言模型。
具体的做法是,苹果从更多的来源获得语音范例,比如用户使用“听写”功能时产生的语音,这个功能会自动把声音变成文本。而各不相同的用户声音可能包含了环境嘈杂的背景音,之后苹果选取一部分样本,用人工听写的方式让它变成文本,以此来矫正机器算法识别出的语意。
Acero 说,这个过程能让自动听写的错误率减少一半。Siri 每增加一种语言都会做这样的样本采集,然后以两周一次的频率更新语料库。
语音技术已经变成了大公司之间的竞争。在微软、Google、亚马逊和苹果几家之中,苹果能拿来作为优势的地方也只有语言种类了。现在 Siri 支持来自 36 个国家的 21 种语言,作为对比,微软的 Cortana 覆盖 8 种语言、Google Assistant 有 4 种、亚马逊 Alexa 只会讲英语和德语。
不过四家公司有一个目标是相同的, 就是让自家的语音助手进入更多的设备。比如 Google Assistant 不仅会内置在 Android 系统里,也将要进入聊天应用 Allo、智能音箱 Google Home 和新一代手表操作系统 Android Wear 2.0 当中。苹果已经把 Siri 从手机放到了 Mac 操作系统中,同时智能家居平台 Homekit 也以 Siri 为操作的核心。
但是在语音识别的竞争远不止这些,用户期待的是更高的识别准确率,以及识别之后它能干些什么。亚马逊这方面的计划更大一些。Alex 最近刚刚宣布已经支持 10000 多项包含语音指令的技能,比如控制电器开关、播放音乐、购物等等,这个数字在一个月中增加了 3000。
毕竟,只会讲段子和唱歌的语音助手不一定是人们最需要的东西。