眼球追踪与聊天机器人 将怎样颠覆VR的交互方式?

传统的界面交互,通常使用固化在图像上的文字和图表来完成,这一点到了VR中似乎也变化不大。而这种交互形式的沿袭,放到虚拟现实的世界中甚至会让体验更差。距离掌握不佳的交互界面,会让用户觉得文字像报纸一样贴在脸上,而那些依附在控制器上的环形界面通常会因为视角的不同产生畸变,使得VR中的沉浸感遭到破坏,让整个交互过程突兀无比。

VR交互还有很大的优化空间 ,而眼球追踪技术与聊天机器人的引入也许能带来一些意想不到的帮助。

FOVE公司早在2014年就开始研究VR头显中的眼球追踪技术,试图让眼睛与虚拟现实场景产生交互,Oculus的Palmer Luckey也表示,眼球追踪能够校正很多VR画面中现存的问题。另一方面,微软首席执行官纳德拉曾经发表过一段言论,认为聊天机器人将在未来让人类的语言变成UI,通过语音对话就能控制软件的一部分界面和表单。

总体来说,眼球追踪技术与聊天机器人将会从VR的用户界面、视觉体验、操作方式等领域出发,逐层改变VR的交互方式。

  眼球追踪技术:增强场景反馈,实现画面局部渲染

简单来说,眼球追踪就是感知眼部细微变化的一种技术,根据我们观测的方向不同,眼部则会产生相应的特征,通过这些特征的比对,从而对眼睛变化形成一套可以考量的参考,进而实现针对眼睛变化的控制功能。

用户在与VR场景的模型进行互动时,往往需要通过控制器提供的指向UI来选定目标,再使用相应的按键来查看必要的信息。这种交互方式大大破坏了VR的沉浸感,它会让体验者清醒的察觉到触感的缺失。

而利用眼球追踪技术能够有效的规避这个缺点,用户能够使用眼球来定位场景中的某个模组,从而决定是否与它进行互动。例如利用眼球锁定一个房间模型,系统随后能够自动的展现出房间大小、构成材料、住户资料等相关的信息。

Samsung在早几年就试水过这项技术,他们生产的智能手机Galaxy S4搭载了较为简单的眼球控制功能,能够对视频实现暂停和续播等操作。FOVE公司则将眼球追踪技术搬到了虚拟现实中,研发了一款能够识别眼球运动的头显,以便提供更好的交互体验。

除了增强VR场景的交互体验外,眼动追踪还能实现VR画面的交互,这种交互不是表单形式的硬性交互,而是画面表现上的一种软性交互。当我们盯着画面中的某个区域时,实则只能看清楚中间1~2度范围内的物体,其它部分则会发生“失焦”,从而变得模糊不清。

通过眼球追踪技术,VR头显可以只对中间的那一部分进行局部渲染,从而让VR画面主动适配人眼,还能在一定程度上降低晕眩感。这种方案一来会让人们的虚拟现实体验更加舒适,二来能够有效的节省硬件的机能,模糊化处理周边的场景将会大大降低CPU、显卡、内存等部件的负荷,从整体上降低适配PC与主机的制造成本。

聊天机器人:替代固化的UI界面,增强人机互动

VR中聊天机器人最为基础的运用,就是替代固化的UI界面。当我们需要查看属性、地图、社交手册等表单时,只需要通过简单的语音交流就能达成,无需再去点击屏幕上放置好的浮动界面图标。

聊天机器人本身就是一个交互界面,而这项技术在智能手机端的表现最为人熟知。微软旗下就有Cortana和小冰两个知名的聊天机器人,它们都具备信息交互的功能,而Cortana更是延展到了定制行程、购物服务、软件调用等更高一层的应用上。Skype的产品经理Lilian Rincon也表示:“Cortana就像是一个秘书,无时无刻都在帮你与第三方协商。”

除此之外,Siri则是在智能问答上进行了深化。Stephen Wolfram曾经打造了一款名为“Wolfram Alpha”的智能搜索引擎,而Siri正是基于这个引擎,衍生出了回答问题的能力。Siri的答案不仅只限于文字叙述,很多时候还会调用相关的网页以及流视频来完成阐释。

事实上,聊天机器人是人工智能的一个分支,虽然人工智能要成熟起来还需要很长一段时间,但这些现存的基础功能已经可以完好的应用到VR的交互之中,为我们提供更便捷的使用方式。

在虚拟现实的世界中,通过语音上的人机互动,聊天机器人就能粗略的理解我们所要表达内容。进一步来说,VR中的虚拟角色、动物、甚至机械都能够植入聊天机器人的相关特性,从而与我们进行交互,大大增强了VR的真实性和沉浸感。

南加州大学的研究人员开发过一款名为“SimSensei”的机器学习工具,它通过语言就能察觉对话者的情绪变化。目前也有一些开发者正在着手将聊天机器人运用在成人VR的体验中,相信“SimSensei”的利用会让这种交互更为愉快。

两种技术的实现都有难点,产生变革仍需时间

眼动追踪目前还没有我们想象中的好用。首先,我们在活动眼部的时候分为主观上的移动和无意识状态下的移动,后者是身体的本能反应,几乎是不可控的。例如受到惊吓,我们就会无意识的改变观看的方向,而那个方向的事物并非是用户想要交互的对象,因此眼动追踪很容易产生误操作。

当前的眼球追踪技术还能难甄别出主观操作与误操作的区别,这就会给我们的使用带来极大的麻烦。在技术投入的早期,只能将VR内容中可交互模组的数量减少,以此来免除误操作的妨害。

眼动追踪技术除了这个巨大硬伤外,还有一些需要注意的小细节。比如在使用VR头显时难免会伴随设备的振动,这会影响到眼球追踪的精度,需要不断的优化硬件和算法。而每个个体之间的眼部运动特征都存在差异,不同人种之间的差异更大,技术的提供方也许需要针对不同的人群,进行差异化的设备定制。

对于VR中的聊天机器人来说,我们通常需要通过语音的方式与它们进行交流,这就会触及到语音识别方向的弊病。目前的语音识别只能在安静的环境下使用,而一旦涉及到地方化语音、环境嘈杂等问题,就会大大降低输入精度,从而阻碍用户与聊天机器人之间的交流。

语音操作也伴随着一个本土化的问题,针对不同的语言,需要提供不同版本的定制机器人。每个虚拟现实内容所要求的聊天机器人在功能也有差异,难以形成一套通用的解决方案。就聊天机器人本身而言,它也无法完成像鼠标点击一样的连续操作,反馈周期变向的就增加了。

然而,变革是需要时间的。对于VR来说,这些上层技术的进驻需要建立在完善的硬件以及内容的基础之上,而这个先期条件暂时都没能达成。但VR却是一个不错的技术试验场,能够逐渐让这些技术获得进步。虚拟现实的沉浸式特性,需求我们摈除手柄控制器等原始的操作方式,眼动追踪与聊天机器人无疑是交互形式的一种发展趋势。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。