语音用户界面(VUI)是一种依赖语音识别技术的接口,使用户能够通过语音命令与应用程序或设备进行交互。该应用程序可以在设备上本地运行,也可以托管在网络服务器或云计算平台上。设备可以是计算机、智能手机或其他类型的系统。
VUI 正在越来越多的设备和应用程序中集成,包括虚拟助手、智能音箱、智能电视、桌面和笔记本电脑以及智能家居系统。行业内三大虚拟助手——苹果的 Siri、亚马逊的 Alexa 和谷歌助手——都是依赖其内置 VUI 的典型应用示例。这些助手的 VUI 使用户能够仅通过语音请求信息和发出命令。
VUI 在用户交互方面采用了与传统接口(如图形用户界面(GUI)或命令行接口)截然不同的方法,后者需要混合使用访问设备,如显示器、键盘、鼠标、触摸板或触摸屏。这种以语音为主的方式使用户能够更快、更高效、更直观地启动自动化服务和执行日常任务。
虚拟助手不仅为普通用户提供了便利,AI 驱动的助手在企业中也能产生重大影响。
集成 VUI 的应用程序和设备通常也使用传统接口。例如,用户可以通过说“嘿 Siri”与苹果的 HomePod 智能家居中心音箱进行交互,但用户也可以触摸音箱顶部以启动对话,而无需说“嘿 Siri”,或者通过触摸音箱来调节音量或停止音乐播放。
在某些情况下,当 Siri 对更复杂的查询做出回应时,会通过用户的 iPhone 提供额外信息,而不是试图通过 HomePod 以语音响应提供过多信息。
如今的 VUI 使用户能够根据应用程序或设备以及具体情况执行广泛的任务。例如,用户可以通过 VUI 执行以下任务:
- 搜索网页。
- 在线购物。
- 播放音乐或跳过曲目。
- 在电视上搜索内容。
- 撰写短信或电子邮件。
- 设置闹钟、计时器或提醒。
- 请求实时天气或交通更新。
- 更新电子健康记录。
- 在日历中添加约会。
- 控制汽车信息娱乐系统。
供应商们持续改进他们的 VUI,增加新功能并将其集成到更多的设备和应用程序中。对人工智能(AI)技术,特别是生成式 AI 的持续投资,有望进一步扩展用户通过 VUI 能够完成的任务以及对话的直观程度。
VUI 的演变
根据凯西·珀尔的书《设计语音用户界面》,VUI 的第一阶段由1980年代开发的交互式语音响应(IVR)系统主导。这些系统能够理解电话上的语音输入并执行给定的任务。
然而,其他来源认为 IVR 系统代表了 VUI 的第二代,并指出1950年代和1960年代的努力是最初的 VUI。一个经常被引用的例子是1952年贝尔实验室开发的 Audrey 系统。Audrey 能够以高达90%的准确率识别从零到九的数字。十年后,IBM 推出了 Shoebox,它能够理解16个英语单词。在此期间还进行了其他努力,为 IVR 系统及其后续发展奠定了基础。
到2000年代初,IVR 在保险、银行、航空、货运和运输等服务行业变得普遍。IVR 能够处理入站电话并将电话转接给内部代理。它们还可以通过录音消息回答客户问题,从数据库中提取信息。
IVR 最初是为了便于任务自动化而开发的,无需客户与真人交谈,但今天它们通常用于在将来电者转接到真人代理之前,首先对来电者进行初步响应。
许多基于语音的接口现在已经进入普遍认为的 VUI 第三代。这些系统结合了自动语音识别、机器学习、自然语言处理和其他先进的 AI 技术。
像 ChatGPT 和 Microsoft Copilot 这样的应用程序结合了视觉和语音信息,形成了所谓的多模态接口。一些系统提供了整个生态系统,集成了 VUI 功能。例如,设置了 Google Home 智能设备的人可以使用 Google Assistant 语音命令控制许多设备。
VUI 设计
VUI 设计面临着 GUI 和其他接口类型所没有的独特挑战。VUI 不使用屏幕来显示信息,也不提供物理交互的选项。此外,用户无法随着时间的推移访问信息。
因此,听觉接口的瞬时特性要求 VUI 清楚地说明可能的交互选项,并仅提供必要的信息,而不使用户感到过载或困惑。此外,用户必须了解 VUI 能理解哪些语音命令以及他们可以执行的交互类型。
第三代 VUI 试图超越通常与 IVR 相关的典型单回合对话。(一个回合是用户与系统之间的一次交互。)VUI 还可以“学习”用户输入并预测他们的未来需求。尽管 VUI 设计师尚未开发出能够完全模拟人类对话的系统,但 AI 技术的快速进步正在使 VUI 变得更加智能,并帮助优化用户体验。
尽管取得了这些进展,设计有效的 VUI 仍然是一个复杂的过程,需要广泛的知识,涵盖计算机科学、人类心理学和语言学等多个领域,以及对人类认知能力、对话语言和语音技术的仔细研究。
VUIs 在商业中的应用
VUI 不仅限于消费和家庭应用。它们越来越多地进入商业环境,承诺帮助提高效率和生产力,并促进更大的客户参与。
VUI 可以帮助简化操作、简化日常任务、促进协作,并提供更有效的员工培训和教育。它们还可以使员工在需要时更容易访问所需信息,并与他人共享。此外,组织可以利用 VUI 来增强其产品和服务,并更有效地与客户互动。
供应商无疑认识到 VUI 对其商业客户的价值。例如,亚马逊的 Alexa for Business 使组织能够以多种方式使用 Alexa,从设置 Echo 设备和生成 Alexa 使用报告到丰富客户服务和构建 Alexa 支持的设备。
在物联网和云技术的支持下,VUI 可以有效地与智能家居、办公室和其他商业环境中的第三方系统集成,服务于从医疗保健和制造业到零售和在线销售等多个行业。
查看有效的语音用户界面设计,了解为什么 AI 语音技术具有优势和局限性。此外,AI 和机器学习技术正在改变商业和社会。发现企业在 AI 不断发展的过程中应关注的十大 AI 趋势。