到底什么是人工智能代理？

Chat中文镜像

人工智能代理被认为是人工智能领域的下一个大事件，但对于它们到底是什么并没有确切的定义。在这一点上，人们对于究竟什么构成了人工智能代理无法达成一致。

简单来说，人工智能代理最好被描述为由人工智能驱动的软件，它为您完成一系列过去可能由人类客服代理、人力资源人员或 IT 服务台员工完成的工作，尽管它最终可能涉及任何任务。您要求它做事，它就会为您完成，有时会跨越多个系统，远不止是简单地回答问题。

这似乎足够简单，对吧？然而，由于缺乏明确性，事情变得复杂起来。即使在科技巨头中，也没有达成共识。谷歌认为它们是基于任务的助手，具体取决于工作内容：为开发者提供编码帮助；帮助营销人员创建配色方案；协助 IT 专业人员通过查询日志数据来追踪问题。

对于 Asana 来说，智能代理可能就像一名额外的员工，像任何优秀的同事一样处理分配的任务。Sierra 是由前 Salesforce 联席首席执行官布雷特·泰勒（Bret Taylor）和谷歌资深员工克莱·巴沃尔（Clay Bavor）创立的一家初创公司，它将智能代理视为客户体验工具，帮助人们完成远超以往聊天机器人所能做到的行动，以解决更复杂的一系列问题。

这种缺乏统一的定义确实给人留下了困惑的空间，让人不太清楚这些东西到底要做什么，但不管如何定义，这些代理的目的是在尽可能少的人工交互下以自动化的方式帮助完成任务。

Glasswing Ventures 的创始人兼管理合伙人鲁迪娜·塞塞里（Rudina Seseri）表示，现在为时尚早，这可能是缺乏共识的原因。塞塞里告诉 TechCrunch：“对于什么是‘人工智能代理’，目前没有单一的定义。然而，最常见的观点是，代理是一种智能软件系统，旨在感知其环境、进行推理、做出决策，并自主采取行动以实现特定目标。”

她说他们使用了许多人工智能技术来实现这一目标。“这些系统融合了各种人工智能/机器学习技术，如自然语言处理、机器学习和计算机视觉，以便在动态领域中运行，自主运行或与其他代理和人类用户协同运行。”

Box 的联合创始人兼首席执行官亚伦·列维（Aaron Levie）表示，随着时间的推移，随着人工智能能力的不断增强，人工智能代理将能够代表人类做更多的事情，而且已经有一些动态因素在发挥作用，推动这一演变。

莱维最近在领英上写道：“对于人工智能代理，存在多个组成部分形成一个自我强化的飞轮，这将极大地改善人工智能代理在近期和长期内能够完成的任务：GPU 价格/性能、模型效率、模型质量和智能、人工智能框架以及基础设施的改进。”

这是对该技术的一种乐观看法，它假定所有这些领域都会实现增长，但这并非必然。麻省理工学院机器人技术先驱罗德尼·布鲁克斯（Rodney Brooks）在最近接受 TechCrunch 采访时指出，人工智能必须应对比大多数技术更为棘手的问题，而且它不一定会像摩尔定律下的芯片那样以同样快速的方式发展。

布鲁克斯在那次采访中说：“当人类看到人工智能系统执行一项任务时，他们会立即将其推广到类似的事情上，并对人工智能系统的能力进行评估；不仅是对该项任务的表现，还包括相关方面的能力。他们通常都过于乐观，这是因为他们使用的是一个人在一项任务中的表现模型。”

问题在于跨系统操作很困难，而一些遗留系统缺乏基本的 API 访问权限这一事实让情况变得更加复杂。尽管我们看到了莱维所提到的稳步改进，但让软件访问多个系统，同时解决其沿途可能遇到的问题，可能比许多人想象的更具挑战性。

如果真是这样，那么每个人可能都高估了人工智能代理应该能够做到的事情。HFS 研究公司的研究负责人大卫·库什曼（David Cushman）对当前这批机器人的看法与 Asana 类似：它们是帮助人类完成某些任务的助手，以实现某种用户定义的战略目标。挑战在于帮助机器以真正自动化的方式处理意外情况，而显然我们目前还远未达到这一水平。

他说：“我认为这是下一步。这是人工智能大规模独立且有效运作的方向。所以在这里，人类设定指导方针和防护措施，并应用多种技术把人类排除在循环之外——而此前关于生成式人工智能，一切都是围绕着让人类处于循环之中。” 他说，所以关键在于让人工智能代理接管并应用真正的自动化。

Madrona Ventures 的合伙人乔恩·特罗（Jon Turow）表示，这将需要创建一个人工智能代理基础设施，一个专门为创建代理（无论您如何定义它们）而设计的技术栈。在最近的一篇博客文章中，特罗概述了目前在实际应用中运行的人工智能代理的例子以及它们如今的构建方式。

在图罗看来，人工智能代理的不断增多——他也承认，其定义仍有点难以捉摸——像其他任何技术一样需要技术栈。他在文中写道：“这一切意味着，我们这个行业要做工作来构建支持人工智能代理以及依赖它们的应用程序的基础设施。”

随着时间的推移，推理能力将逐渐提高，前沿模型将更多地引导工作流程，而开发人员则希望专注于产品和数据——这些能让他们与众不同的东西。他们希望底层平台在规模、性能和可靠性方面“正常运行”即可。

这里要记住的另一件事是，要让智能体发挥作用，可能需要多个模型，而非单个大语言模型。如果您将这些智能体视为不同任务的集合，这就说得通了。麦格理美国股票研究公司（Macquarie US Equity Research）的美国人工智能和软件研究主管弗雷德·哈维迈耶（Fred Havemeyer）表示：“我认为目前任何单个的大型语言模型，至少是公开可用的、整体式的大型语言模型，都无法处理智能体任务。我认为它们还无法进行多步骤推理，而这正是能让我对智能体的未来感到兴奋的点。我觉得我们正在接近，但目前还没达到。”

我确实认为最有效的代理很可能是多个不同模型的多个集合，带有一个路由层，将请求或提示发送给最有效的代理和模型。而且我认为这有点像一个有趣的[自动]主管，扮演着一种授权的角色。

对于哈夫迈耶来说，该行业最终正在朝着代理独立运作这一目标努力。他告诉 TechCrunch：“当我思考代理的未来时，我希望看到，并且我期待看到真正自主的代理，它们能够接受抽象的目标，然后完全独立地推导出其间的所有单独步骤。”

但事实是，就这些代理而言，我们仍处于一个过渡时期，我们不知道何时才能达到哈维迈耶所描述的最终状态。虽然到目前为止我们所看到的显然是朝着正确方向迈出的有希望的一步，但要让人工智能代理按照如今所设想的方式运行，我们仍需要一些进步和突破。重要的是要明白，我们还没有达到那个程度。