对于许多人来说,未来与人工智能代理的关系类似于漫威电影宇宙中的角色J.A.R.V.I.S。
J.A.R.V.I.S.是“Just A Rather Very Intelligent System”的缩写,最初是由虚构的工业家和杰出投资者托尼·斯塔克创建的自然语言计算机系统。后来,它成为了斯塔克的助手,最终获得了合成身体,成为了安卓人维视。
虽然人工智能代理——自主和半自主的生成性人工智能系统,能够独立采取行动——可能远未具备获得身体的能力,但它们可能在明年某个时候接近或超越J.A.R.V.I.S。
2024年后几个月人工智能代理的流行增长,反映了2022年ChatGPT和其他生成性人工智能系统如何迅速进入并改变人工智能市场。供应商似乎从开发最新的大型语言模型(LLMs)和人工智能聊天机器人,转向创建代理和行动模型。
例如,Salesforce去年秋季推出了Agentforce,一种低代码代理构建工具。微软推出了AI Agents Service,这是一个帮助开发人员构建人工智能代理的社区中心。
其他供应商也向企业推出了人工智能代理,以自动化各种业务流程。分析公司Forrester Research列出了400家目前正在构建代理的供应商。
“现在对它们的兴奋感很强,”Forrester Research的分析师克雷格·勒克莱尔表示。“当你释放一种可以在没有人类检查和制衡的情况下推进目标的自动化时,也存在相当大的风险。”
这种兴奋与风险意味着人工智能专家和供应商对2025年的人工智能代理有许多期待。
通过真实应用消除混淆
根据人工智能市场专家的说法,一个期待是,尽管2024年为基础打下了基础,但2025年将是人工智能代理准备好进入企业的年份。
这意味着围绕代理的混淆将消失,响应公司的联合创始人兼首席信息官AJ·桑德表示:“代理与自动化、代理与机器人流程自动化(RPA)之间存在混淆。很多混淆会消失。然后我们将开始看到更多代理被部署并在现实世界中使用。”
而RPA使用机器人或机器人来自动化重复任务,而不使用人工智能,代理则涉及人工智能技术。RPA是确定性的和可预测的,但代理则不是。
“它们相似之处在于它们都是数字协作伙伴,”勒克莱尔说。“只不过当你将人工智能添加到数字协作伙伴时,我们称之为人工智能代理,更智能,能够理解上下文,知道如何不被卡住。”
桑德表示,代理的一些实际应用将在客户服务中;其他应用将在金融或欺诈检测中。
“任何复杂的事情都需要人工智能记忆、规划和执行多步骤、复杂任务,我认为代理将在其中发挥巨大作用,”桑德说。
一个复杂的应用是视频创作。
“许多这样的代理人工智能解决方案实际上可以以一种方式部署,帮助视频创作过程,”AI视频平台Colossyan的研究总监沙赫扎伊布·阿斯拉姆说。
阿斯拉姆表示,人工智能代理可以帮助制作一个引人入胜的视频,提供有力的论据,并包含一个号召行动,促使客户采取行动,例如购买产品。
“这成为一个非常强大的工具,因为它将帮助你制作一个更高参与度和更成功率的视频,”他说。
不仅代理将在视频创作等不同用例和应用中发挥作用,许多企业还将开始使用它们来解决规模问题,Gartner分析师汤姆·科肖说。
企业在规模上面临两个问题。要么因为没有足够的人来处理而无法做好工作,要么有员工做得很好,但希望能有更多的工作量。汤姆·科肖Gartner分析师
“企业在规模上面临两个问题。要么因为没有足够的人来处理而无法做好工作,要么有员工做得很好,但希望能有更多的工作量,”科肖说。“这两种情况都是人工智能代理的良好用例。到2025年,我们将看到人们意识到需要将人工智能代理集中在规模问题上。”
然而,应用和使用人工智能代理的水平是不同的,佩加系统公司的AI实验室主任兼首席科学家彼得·范德·普滕表示。
在光谱的一端,人工智能代理可以读取、整合和综合信息,并得出一定程度的结论,但不采取任何行动。光谱的另一端是当人工智能代理根据其综合的信息采取行动时,范德·普滕说。
“代理的真正成功不在于这些代理本身的智能能力,而在于你如何将它们嵌入,”他说。
然而,他继续说,大多数企业必须先试用,才能看到其价值。
“我有时对这些系统能够做的事情感到更加惊讶,”范德·普滕说。“了解的唯一方法是通过安全实验。”
更好的推理模型
另一个关于人工智能代理的期待是,LLMs将继续作为它们的“大脑”。这意味着LLMs需要在推理方面变得更好,以便人工智能代理能够更好地执行任务。
阿斯拉姆表示,这一点已经通过思维链提示得到了体现。
这个想法是,模型不是仅仅生成一个对查询的回应,而是生成多个回应,并思考步骤以找到最终的回应。
虽然这可能会很昂贵,因为企业现在需要运行多个推理来创建思维链,但这也使模型的推理能力更强,阿斯拉姆说。
他补充说,这将是人工智能行业和学术界在2025年探索的领域。
“这种将可解释性添加到模型中的方式是非常有意义的,我们将看到更多的工作和研究朝着在推理时扩展计算能力的方向发展,并使模型以系统性和推理的方式得出预测,而不仅仅是简单地创建内容,”他继续说道。
特定任务代理
尽管在2025年可能会出现更多的代理使用案例和应用,但它们不会消除人类干预的需求。
然而,随着人工智能代理带来的新一轮自动化的到来,担心工作会被取代的情绪依然存在。
行业内一些人表示,尽管人工智能代理在2025年将具有自主性,但这并不是完全的自主性。换句话说,人工智能代理将执行个人工作的一部分,但不会接管整个工作。例如,你可能会让人工智能代理找到你想使用的旅行社的联系方式,但它无法完成整个预订。
“我们将看到代理不是独立的,接管完整的工作角色,而是承担个人责任或过程的一部分,然后与传统自动化、人类以及其他代理协同工作,”UiPath的高级副总裁兼总经理马克·格林说。
接管某一责任的代理将是专门化的,并以单一目标处理任务。这将使人工智能代理在完成任务时更加准确,格林表示。
“责任越狭窄,你就越能衡量它的有效性,”他说。
人工智能代理基础设施
除了单任务人工智能代理的兴起,2025年也可能是构建人工智能代理基础设施的一年,Futurum Group的分析师奥利维尔·布朗查德表示。
达到人工智能代理与其他代理或甚至与人类协同执行任务的程度需要编排,布朗查德说。
“2025年不会是我们看到完全开发的代理人工智能的一年,”他说。“2025年是我们为其构建基础设施的一年。我们为其奠定基础。”
他补充说,可能在帮助构建基础设施方面发挥重要作用的供应商包括高通、英特尔和AMD等芯片制造商。
“高通的处理器主要将在设备上与代理人工智能合作,”布朗查德继续说道。同时,英伟达的处理器目前旨在与云中的代理人工智能合作。
“英伟达的GPU已经广泛用于训练人工智能模型,这为将成为代理人工智能层的基础,”他说。“两年后,代理人工智能将是云和设备软件的结合。”
目前,英伟达主要在云中工作,而高通则在设备上。另一方面,像苹果和三星这样的设备制造商将参与创建允许代理人工智能跨平台、设备和单个应用程序工作的编排层,布朗查德说。
“我们已经……有了这个基础,”布朗查德说。“我们还没有一种‘我可以做任何事情'的组件。”
实现编排层的一种方式是通过多模态人工智能。虽然像ChatGPT这样的生成性人工智能系统具有输入输出功能,但它们无法代表人类与其他应用程序连接。
然而,随着多模态人工智能的发展和成熟,使图像输入能够导致视频输出,这将促进代理人工智能的更好工作。
“随着模型变得更智能,这将使我们的代理更智能,”科肖说。
人工智能代理需要一个跨不同平台和设备的编排层,布朗查德说。编排层由链接组成,使人工智能代理能够从一个平台或接口转到下一个,或从一个应用程序转到下一个。
如果高通建立其编排层,而AMD建立自己的,这将使代理人工智能的互操作性面临挑战。
“如果所有的芯片制造商都在使用自己的编排层,他们不一定能够很好地相互沟通,”布朗查德说。
2025年的代理挑战
与其他人工智能技术类似,人工智能代理在2025年将面临挑战。其中之一是数据。
由于数据通常分散在不同的来源和流程中,因此可能很难为人工智能代理提供它们执行所需任务的数据,格林说。
另一个问题是缺乏对代理自动化设计过程的了解,格林补充道。
例如,行业需要了解何时人类应该与代理互动,如何互动,以及应使用哪些渠道与代理人工智能互动,他说。
还有信任的挑战,桑德说。
“如果基础技术仍然依赖于生成性人工智能和大型语言模型,这些缺陷将被代理继承,”他说。
尽管面临这些障碍,桑德继续表示,2025年将是人工智能代理的重要一年。
“我们将弄清楚代理在哪些方面有意义,如何部署它们,如何赢得信任,然后再完全放手,”他说。“这种可以完全自主的承诺,我确实认为会实现;但是否会在2025年实现,我认为不会。”
艾斯特·阿贾奥是TechTarget的编辑新闻作家和播客主持人,专注于人工智能软件和系统。