回顾人机互展史,人类先经历基命令行的 CLI时代,基鼠标键盘的 GUI时代,基触摸的初级 NUI时代。面每一个阶段比前一个阶段更自,学习成更低,综合效率更高。
进 AI时代,人工智能给机器带来三种能力:感能力、认能力、自语言输出能力。感能力使机器能听得懂人类语言,认能力使机器能思考何回答人类问题,自语言输出能力使机器以像人类一样表达——三种能力的综合运用将人机互带语音交互阶段。语音交互是最自然交互,它极大地降低了们与交互时学习成本,将交互综合效率带上新台阶,已成为常要交互。
一、「等待体验」——语音交互体验的三分之一
生活与话场景,话是由「说出句话」、「等待回复」、「出回复」三个阶段不断循环构成。其「等待回复」是话体验「三分」,会回复满意度造成接影响。在等待回复阶段,如处于认真思考状态,会让我们觉被视;然而,如在等待过程注意力不在话本身,即便出回复再好,我们也会心存疑虑。
应到语音交互三个部分——「输入体验」、「等待体验」、「回复体验」,「等待体验」样处于个体验循环链环节,在语音交互体验起到了承上启下要作用。是,关于语音交互「等待体验」在业尚未被系统研究,依旧处于模糊状态。
1. 响应时定是越短越好吗?
数性能管理平台Dynatrace 用户浏览网页为进了研究,发现网页加载速度提升0.5秒,可促进用户在网站为转化核心数据提升10%。此,在网页设计和 App设计,尽量缩短等待时是品设计不懈追求。
不同基视的互,语音互天附带情感属。而,情感的验是复的,它不只受效率个单一变量的控。大数情况下,在生活中人与人对时,一个快的回答给用户带来轻浮感和抢感,而一个慢的回答给用户带来迟缓感和愚钝感。
么,在语音互中,究竟什么样的响应时间能有最佳的验呢?响应时间的验趋势是怎样的呢?
2. 等待验受哪变量的影响?
在视设计领域,当设计页面的 loading态时,为降低用户的跳出率,设计师时常通给出进度条,或采用趣味的情感化设计来消除用户的不安情绪。
但语音交互领域,语音的承载体无形的,或不确形态的,我们甚至承载 loading态的界面。这种况下待体验又受哪些变影响呢?影响的程度怎样呢?
综上,可以说在语音交互领域,等待体验虽然重要,但目前仍是「一迷雾」。鉴于此,以目前语音交互的主要载体——智能音箱产品为例,对 AI产品中的等待体验问题进行专题研究。
二、智能音箱的等待体验研究
目前的智能音箱,主要采用先语音唤醒后输入指令的语音交互流程。鉴于此,可以将智能音箱的使用过程为个主要阶段:
- 唤醒阶段:用户通过指的唤醒词将音箱从待态转换就绪态,音箱被唤醒后可以接收用户的语音指令。
- 用户请求及反馈阶段:用户给出语音指令内容以及智能音箱反馈结果足用户的需求。
针对两个阶段,我们先通以下三个验进行研究。
- 实验:唤醒阶段响应时等待体验影响;
- 验二:用户请求及反馈阶段的响应时间对等待验的影响;
- 实验三:视觉、声音不同反馈方式对待体验的影响。
下面我们对每个验的结论进行逐一详述。
验一:唤醒阶段的响应时间对等待验的影响
为面考察唤醒阶段各种因素对等待验的影响,在验中,我们为用户提供不同唤醒响应时间和不同唤醒反馈方式的智能音箱。用户完成验任务,需要对音箱的唤醒响应速度进评价(5量表:太快了,接受不了;有快,能够接受;刚刚好;有慢,能够接受;太慢了,接受不了)。
实验结表明最佳唤醒响应时与唤醒反馈有关,不唤醒反馈下,最佳响应时不:
- 当唤醒反馈为「灯光」反馈时,唤醒响应速越快越好,在200ms时,户响应舒适最(对响应时间评为好的户例),73%的户对速满意。
- 唤醒反馈为「灯+音效」时,唤醒响应速度舒适时为300ms左右,76%用户速度满意。
- 当唤醒反馈为「灯光+人声」时,唤醒响应速度的舒适时间为500ms左右,74%的用户对速度满意。
(注意:本实验设了市上主流三唤醒反馈:灯、灯+音效、灯+声,以不反馈情况响应时感受作参考,最优反馈,除了响应时受其他素影响,将另着篇章探讨。)
实验二:户请求及反馈阶响应时间对等待体验的影响
由于户请求及反馈阶的响应在技术实现和户预期上,与唤醒阶的响应存在差异,因此我们通过第二个实验对户请求及反馈阶的最佳响应时间范围进行研究。在实验中,我们为户供了同响应时间设置的智音箱。
实验二的要研究发现:
- 1250ms以内是用户认为响应速度较优的间,其中650ms为最佳体验值。在450ms,少量用户觉得响应速度快了,用户会觉紧迫和压力,难以受。
- 在1450ms时,有53%的户开始感觉响应有延时,但仍够接受。
- 从2150ms开始,有20%用户认为音箱响应太慢,不能够接受。我们认为20%用户不满意,已经不足以被称为个优秀品。
实验三:视觉、声音不同反馈方式对待体验的影响
由于目市场的智能音箱请求反馈阶段的响应时间普遍1.5秒以,并达到实验二研究的理响应区间。因此,我们通过实验三一研究反馈方式设对用户响应速度感知的影响,我们用户提供了五组具不同反馈方式设的方案。
实验三的五组方案中,每组方案分别行了不同响应时间设置。
实验三的主研究发,不同反馈方式设会影响人们对音箱响应速度的感知:
1250ms以内,方案D感受较差,人声反馈会产抢话的感受,部分用户认音箱响应太。
1350ms到2150ms,方案D、E感知舒的用户比例较高,加入人声/音效后,如方案D的语音应答「好的」,于缓解用户延迟感受,提升速度感知体验。
3150ms及以的响应时间,响应方式设对缓解延时的作用已不明显,应该尽避免此类况发。
此外,实验三还发现响应速度预期用户性别、任类型有关。男性相比,性用户对响应间容忍度更低,她最长在音箱无反馈可以容忍的均响应间长度低于男性,即她希望在更短的间内得音箱的响应反馈。
音类、问答类等任相比,用户对控制类任的响应间容忍度更低,用户希望在控制类任中有更加及的响应反馈。
三、小结
本文针对语音交互中的待体验行了讨论,并以智能音箱例,重点对唤醒阶段请求反馈阶段的响应时间反馈方式行了人类效学实验研究。由于实验设的条件样本数限制因素,实验研究结论可能不能表所智能音箱用户家居环境的全部感受,但希望通过我们的研究探索,可以指导人智能语音对话产品响应时间反馈方式的设,帮打造自然极致的语音对话体验。
欢迎关注百度人工智能交互计的公众号:「百度AI交互计」
图片素材作者:Timo Kuilder