亚马逊不服谷歌 Alexa要支持8种自然语音

编 | 竭渴

智东西5月17日消息,亚马逊今日开始将允许Alexa语音应用的开发者免费使用8种来自于Amazon Polly的自然语音,让Alexa的语音应用程序能更具特色。这8种自然语音中,男女声都有,全部采用美式英语发音。

(Alexa支持的8个自然语音)

一、自然语音?有多自然?

Alexa新拥有的自然语音,是通过Amazon Polly提供的。Amazon Polly是亚马逊提供的基于深度学习技术将文本转换为逼真语音的服务。

Amazon Polly支持语音合成标记语言 (SSML),它是一种基于XML的W3C标准标记语言,适用于语音合成应用程序,且支持使用通用 SSML标签进行断句、重音和语调。

简而言之,Amazon Polly合成的语音有语气和声调的高低起伏、有语速的快慢交替,也会在讲话的过程中适时的停顿断句。

那么,Amazon Polly是如何将它合成的语音发送到搭载了Alexa的智能设备上的呢?

Amazon Polly可以为开发者提供一个 API,借助此 API,开发者可以将合成语音快速集成到智能设备的应用程序中。开发者只需将要转换成语音的文本发送到 Amazon Polly API,Amazon Polly便会立即将音频流发送回应用程序中。有了这个API,开发者可以选择让用户在应用程序中进行即时语音交互,或将 Amazon Polly发送回来的音频流以MP3的格式储存下来。

Amazon Polly支持的语音、语种不止8种,它可以提供几十种逼真的语音并支持多个语种。此次亚马逊仅向Alexa语音应用的开发者提供8种美式英语语音,或许是出于Alexa的很大一部分用户目前集中于美国的原因。

(Amazon Polly支持的部分语音、语种)

二、亚马逊为何要让Alexa听起来不一样?

首先,让Alexa能发出更多不同的声音,有助于提升用户使用Alexa的感观,消除人与机器之间的距离感。例如,当小朋友使用Alexa,让其读故事时,不同的语音和起伏的语调会更让小朋友有代入感。

其次,科技巨头们为了抓住更多用户,在技术应用上竞争激烈,亚马逊此举应该是回应谷歌上周于I/O大会上宣布Google Assitant将支持6种不同语音一事。谷歌I/O大会上,谷歌CEO Sundar Pichai向大家展示了Google Assitant上通过WaveNet合成的超自然语音,其中一个语音甚至来自于著名R&B歌手John Legend。Sundar Pichai说这是为了适应Google Assitan用户各种不同的发音习惯。

可见,语音助手们为了获得用户的“芳心”可谓煞费苦心。我们是不是可以期待,有一天,语音助手能开口就对我们讲出一口流利的四川话/东北话呢?

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。