根据这家人工智能初创公司,Anthropic在周二推出了一项新功能,使计算机的使用方式更像人类。
该功能——目前已在公开测试版中推出——是供应商大型语言模型Claude 3.5 Sonnet的一部分,Anthropic在周二同时发布了该模型的更新版本,以及另一个更新模型Claude 3.5 Haiku。
计算机使用使开发人员能够指挥Claude查看屏幕、移动光标、点击按钮和输入文本。
Anthropic表示,开发人员可以利用这一新功能来自动化重复性任务、构建和测试软件,以及进行开放式研究等功能。
为此,开发人员将使用Anthropic构建的API,该API能够理解和与计算机界面进行交互。
AI代理
该工具反映了生成性人工智能市场向AI代理的转变。
向AI代理的转变以Salesforce推出大型行动模型和其代理AI平台Agentforce为标志。
Futurum Group的分析师Dion Hinchcliffe表示:“基于代理的人工智能是下一个重要趋势,大家都在努力寻找安全的实现方式。”
Hinchcliffe指出,Anthropic的新能力可以导致许多基于代理的场景,因为它使生成性人工智能技术能够使用计算机上的任何应用。
他补充说,这一新能力为企业带来了新的机会。
“绝大多数企业活动潜在地可以利用直接计算机使用的人工智能进行自动化,”Hinchcliffe继续说。
根据Anthropic的说法,像移动工作管理平台Asana、图形设计平台Canva和食品配送服务DoorDash在公开测试版发布之前就使用了计算机使用工具。
类似于RPA和BPA
尽管新的计算机使用格式看似独特,但Forrester Research的分析师Rowan Curran表示,它与许多企业流程管理市场熟悉的机器人流程自动化(RPA)、业务流程自动化(BPA)及其他任务自动化系统相似。
“我认为公司还没有准备好应对所有与安全、保障和负责任使用相关的问题。”Dion HinchcliffeFuturum Group分析师
Curran表示:“有很多软件公司提供他们推出的确切类型的能力:基本上让机器与人类界面进行交互的能力——控制光标、使用键盘等。”他补充说:“世界上已经有很多工具能够做到这一点。”
例如,IBM拥有可以执行相同任务的BPA工具。Appian也帮助供应商自动化业务任务。
Curran说:“目前尚不清楚他们如何操作这一能力,以及他们如何特别利用这一能力与其语言模型家族的关系,是否会有特定的优势。”
他补充说,AI计算机使用可能在构建更大规模和复杂的AI代理方面是有帮助和重要的,尤其是在过去几十年RPA发挥作用的传统系统中。
一些风险
尽管企业在使用这一新工具时具有显著潜力,但它也带来了风险。
Hinchcliffe表示:“我认为现在发布并不明智。我认为公司还没有准备好应对所有与安全、保障和负责任使用相关的问题。”
这一能力可能使恶意行为者更容易入侵系统,因为他们可以指挥AI系统登录计算机系统以查找其漏洞。
虽然一些企业可能会迅速尝试这一新工具,但其他企业会采取谨慎的态度。
Hinchcliffe表示:“聪明的组织会等着看是否有保障措施到位。”他说:“会有很多人希望立即使用它,而这是一个如此强大的工具,可能会无意中造成许多问题。”
Anthropic表示,计算机使用功能仍不完善。该工具目前在滚动、拖动和缩放等任务上面临挑战,而这些任务对人类而言则轻而易举。
同时,Anthropic表示,Claude 3.5 Haiku在编码任务上表现强劲,能够比之前的版本更好地遵循指令。
Claude 3.5 Haiku将在本月晚些时候通过Anthropic的第一方API、Amazon Bedrock和Google Cloud的Vertex AI提供。
Esther Ajao是TechTarget的编辑新闻作者和播客主持人,专注于人工智能软件和系统。