智能音箱让情感重新有了温度:还是那个熟悉的声音

有人说,人会经历三次死亡:第一次是身体停止运转导致的生理上死亡;第二次是举行完葬礼代表你社会位置的消失;第三次是当世界上没人再记得你的时候,真正意义上的死亡。

当你某天将要离开这个世界的时候,你是否想过要尝试科技的方式,将自己身上独有的特点化身为情感寄托,换一种形式陪伴在家人和朋友身边呢?

今天故事的主角王先生就是一个敢为人先的科技爱好者,身患肺癌的他在叮咚智能音箱的帮助下,通过语音合成技术记录下了自己的声音,有了自己专属的TTS发音人,并将一整套语音交互对话定制在了智能音箱中。

一位特殊的智能音箱用户

“不管怎么说,用我的声音,能陪伴他们更长的时间。”

3月12日,王先生第三次来到北京完成了所有的录制内容,除了一些日常交互场景下的对话,他还特别准备了给孩子们十八岁的成人礼祝福,以及给父母和妻子的一些日常留言。

随着人工智能技术民主化进程的加快,它的应用正在覆盖我们生活中的各个场景,智能音箱是其中一个很大的品类,不过王先生只是一位普通的智能设备用户,他是如何吸引到叮咚的呢,这就要从去年底一个不经意之间的留言谈起。

当时,叮咚智能音箱的微信公众号后台收到了一位用户的留言,这位用户的疑问并不是关于产品使用上的困惑,也不是任何对于企业的吐槽,他问了一个让整个叮咚团队都非常惊讶的问题——叮咚智能音箱可以专属定制吗?

虽说消费升级的趋势下诞生了很多专属定制的服务,但是智能音箱说到底还是一款标准化的产品,专属定制就意味着对发音人系统进行全新的规划与设计并长期运维。

虽然没有这种标准服务,但是本着对每个用户都负责的态度,叮咚与这位留言的用户取得了联系,紧接着一个生动又真实的故事才呈现到我们眼前。

王先生来自河南,是一个从事电梯销售工作的80后,他原本有着自己幸福美满的家庭、稳定的生活状态和对未来的无限期待,却没想到一场意外的疾病如噩梦般打破了原本平静的一切。

2017年11月,他在医院查出了肺癌。随后他辞去了工作,一边积极接受治疗、一边在家安心陪伴父母,并开始思考关于人生的终极问题——如何才能在有限的时间给世界留下更多痕迹。

一直以来,王先生对人工智能相关的话题都非常感兴趣,也因此成为了智能叮咚智能音箱的早期用户,在长期的使用过程中,每天与音箱之间的交互对话场景早已成为了王先生和他的家人生活的一部分。

于是他就在想,能不能把智能音箱交互对话的声音换成自己的,用这种方式来陪伴家人,也算是为身边的人留下一点念想。

利用语音合成技术定制专属声音

王先生在录制自己的声音

一套语音交互录制的流程并不简单,它首先需录制用户数小时的干声,对录音开展数据标注,随后进行特征训练和技术优化,才使得韵律、音色、音质及自然度更加贴近,最终达到可媲美真人的播报效果,看似简单的需求,却要需要技术、产品和平台的全面支持。

接到消息后,京东、科大讯飞、叮咚团队马上进行紧急沟通,锁定科大讯飞专门负责语音合成业务的讯飞智声团队寻求技术帮助。沟通后讯飞智声当即决定为这位用户提供免费技术支持。

据介绍,语音合成技术的主要原理就是根据韵律建模的结果,从原始语音库中其突出相应的语音基元,之后再利用特定的语音合成技术对语音基元进行加工和调整,机器进行语音合成时,往往并没有这些文本的人声录音,而是通过音节拼接与参数调整来合成尽可能接近人声的完整语音。

在叮咚官方做出决定后一周,他们在京东奶茶馆第一次见到了来北京复诊的王先生。

王先生首先对叮咚的做法表示了感谢,起初还觉得不可思议的他如今成为了故事的主角,对于病情的话题他也没有丝毫回避,表示当前的身体状态应该能够完成长时间的录音。

通过充分的沟通后,相关工作人员也做好了准备,等待王先生前去录制。但是,王先生的病情突然发生了变化,来北京进行声音录制的工作一直被延后,从双方第一次见面到今年3月录制完毕,王先生已经经过了四次化疗。

录制完成后就是紧张的研发工作,经过技术团队的不断努力下项目已尽基本接近完成,两周后,王先生专属的TTS发音人将正式上线到他的专属智能音箱里。

科技发展应以人为本

人类历史上推动社会变迁的因素当中,科技是一个重要的驱动力,它带来了生产关系的进步,提升了人的幸福感,即使是工业革命百年之后的今天,科技的发展仍是以人为本。

比如英特尔的创始人戈登·摩尔见到霍金后,就决定开始将他使用的电脑升级至搭载英特尔处理器的设备。从那以后,英特尔保持着每两年一次的频率向霍金提供辅助设备,并免费提供技术支持。再后来,英特尔实验室专门选一批专家组建“人机交流研究团队”为霍金研发辅助情境感知工具。

曾经有一次在微软Build大会上,微软盲人程序员Saqib Shaikh在台上展示了搭载Seeing AI的智能眼镜,这款设备可以通过传感器来帮他感知并理解这个世界,这一充满人文关怀的时刻,也得到了很多人的称赞。

类似科技公司以人为本的案例不胜枚举,而叮咚为特殊用户定制声音的这个故事在于,它让让普通用户的数据有机会参与到了AI的应用当中来,并且通过自己的数据还能为家人带来一些变化,这种方式已经超越了产品本身的意义,已经从基础的功能需求上升到了到价值传递、甚至是人文关怀的层面。

人工智能这个方向还有很多技术等待着我们去探索、去解决,但“技术不是目的,技术只是手段”,通过技术来突破一些限制,帮助人们创造更美好的生活,并承担一些社会责任,这才是技术和产品的最终目的。

或许,科技本身不存在所谓的人文关怀,科技的本质是探索未知的过程,它充满着不确定性和真理优先的原则,人文关怀更多的是存在于从事科技行业的人、与之相关的企业、甚至背后的社会制度当中。(钛媒体)

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。