搜狗推出“知音”引擎 除输入法还应用到了车载导航

文 | 四月

8月3日消息,搜狗推出旗下语音交互引擎“知音”,这是一款基于深度学习算法的智能语音引擎,具有理解与思考能力。据介绍,“知音”具有识别速度快、纠错能力强、支持复杂多轮对话及匹配的服务能力。在搜狗看来,基于语义结构系统结构、搜狗垂直类应用的用户数据结合,是“知音”引擎的重要差异化优势。

产品优势

据介绍,在实际场景应用中,“知音”具有以下三点优势:1、在语音识别方面,解决用户在说话过程中因语速过快而导致的吞音问题,语音识别错误率相对下降30%以上,语音识别速度提升3倍。2、在语音交互过程中,支持用户修正错误的识别结果,可以使用自然语言进行改错,例如,用户可以说,把“张”修改为立早“章”,或者可以说,修改为文章的“章”。3、在语音理解方面,支持多轮对话,处理更复杂的用户交互逻辑,比如用户提出要去首都机场,机器可以反馈,“是去T1还是T2”,当用户确定航站楼,它会提问,是出发还是接人。

搜狗语音交互技术中心负责人王砚峰介绍,在今年3月份针对搜狗、讯飞、百度三家的语音引擎的第三方评测中,搜狗与讯飞能力持平,整体领先百度。

资源积累

活动现场,搜狗CTO杨洪涛介绍,搜狗从2012年开始研发智能语音技术,并在2013年进行深度学习探索,目前搜狗的智能语音技术已经应用到搜狗全线产品中。搜狗在线语音输入法语音助手请求次数超过1.4亿次, 用户每天使用率占8%。依托于深度学习的语义理解,搜狗语义引擎较2013年应用之初错误率降低了60%,较2015年降低了30%。

要提高语义理解能力需要基于优质的、大规模材料,据杨洪涛现场表示,而搜狗输入法用户每天能产生的预料规模达到11.7万小时。他强调,这比当前任何语音技术团队所使用的预料规模都要大。此外,搜狗表示正在通过端到端的模型、主动积累错误反馈、线上部署GPU加速等手段促进机器语义理解的智能性。

在具体应用层面,搜狗也强调了垂直类产品的场景化应用特性。

结语

凭借搜狗输入法、搜狗地图等应用的大批量用户数据基础,搜狗语音引擎在训练数据方面具有较强优势。活动尾声,杨洪涛表示出搜狗语音的开放态度,但他强调搜狗并不会做成平台类的语音引擎,仅会筛选部分垂直类场景化应用合作方。据杨洪涛透露,现阶段已达成的合作包括基于车载导航的四维图新。

受限于场景和语音背景的复杂多变,通用型的语音引擎现阶段并不能满足用户预期。将注意力和资源集中到某个痛点场景下攻破,不失为一条有效之路。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。