诞生于旧金山的人工智能编程马拉松,Agency 能让您看到您的人工智能代理的操作。
经过漫长的一周编程工作,你可能会以为旧金山的程序员们会退隐到湾区的山脉、海滩或者热闹的夜总会。但实际上,当一周的工作结束,人工智能编程马拉松就开始了。
在过去的几年里,旧金山掀起了人工智能编程马拉松的热潮。在任何一个周六或周日,技术专家们都会就人工智能的最新进展发表演讲,相互交流,最重要的是,将想法转化为实际的演示。有时候,编程马拉松会以现金或云服务积分的形式提供奖品,但真正的赢家离开时带走的是创业的灵感。
Agency AI 联合创始人亚历克斯·雷布曼(Alex Reibman)表示:“在这个世界上,没有比旧金山更适合开展您一生中最雄心勃勃的项目的地方了。您经常能看到大量的竞赛——比如编程马拉松——但它们并非相互竞争。其合作性和竞争性一样强。”
去年夏天在旧金山的一次黑客马拉松活动中,赖布曼决定尝试构建能够抓取网络信息的人工智能代理。随着人工智能热潮达到顶峰,代理在硅谷成为热门话题。这个术语没有确切的定义,但通常描述的是基于人工智能的机器人,它们能够利用原本并非为自动化而设计的接口和服务自动执行任务——是一种对过去需要人工干预的平凡任务的替代。
但雷布曼很快就遇到了一个问题。“它们很糟糕,”雷布曼在一次采访中说。“这些代理有 30%到 40%的时候会失败,而且常常是以意想不到的方式。”
为了解决这个问题,雷布曼的团队构建了内部调试工具,以查看他们的代理在哪里出了错。他们最终让代理的表现稍好了一些,但调试工具本身却大放异彩,赢得了黑客马拉松。
雷布曼说:“我开始在旧金山的一系列黑客马拉松和活动中展示这些工具,人们开始要求使用它们。这基本上就是我所需要的确认:我们不应该自己构建一个代理,而应该构建工具,让构建代理变得更容易。”
因此,雷布曼与联合创始人亚当·西尔弗曼(Adam Silverman)和肖恩·邱(Shawn Qiu)一起创办了 Agency,提供工具来观察人工智能代理的实际行为,并发现它们的错误之处。雷布曼告诉 TechCrunch,一年后,这些工具最终成为了 Agency 的核心产品——AgentOps 平台,目前每月有数千个团队在使用。这家初创公司现已获得由 645 Ventures 和 Afore Capital 领投的 260 万美元的种子前融资。
首席运营官亚当·西尔弗曼告诉 TechCrunch,AgentOps 就像是“针对代理的多设备管理”,会对代理的所有操作进行分析,以确保其不会失控。
西尔弗曼在一次采访中表示:“你想弄清楚你的代理是否会失控,并确定可以设置哪些限制。很多工作在于能够直观地看到你的防护栏在哪里,以及代理是否遵守这些防护栏,然后再将其投入生产。”
这家初创公司与 Cohere 和 Mistral 合作,这两家都是也提供代理创建服务的人工智能模型开发商,以便客户能够使用 AgentOps 的控制面板来查看代理如何与世界互动,以及每个代理的成本是多少。Agency 与模型无关,这意味着它可以与多种不同的人工智能代理框架配合使用,并且与诸如微软的 AutoGen、crewAI 和 AutoGPT 等流行工具集成。
除了 AgentOps 的仪表板,Agency 还提供咨询服务(Reibman 之前在咨询公司安永工作),以帮助企业开始构建代理。Agency 不愿透露任何客户的具体名称,但透露对冲基金、咨询公司和营销公司正在使用他们的工具。
例如,雷布曼表示,Agency 帮助创建了一个人工智能代理,它会撰写有关客户合作公司的博客文章。现在,同一位客户使用 AgentOps 控制面板来跟踪该代理的性能和成本。
像 OpenAI 和谷歌这样的主要参与者很可能在未来几个月推出他们的智能代理产品,而像 Agency 这样的人工智能初创公司必须想办法与这些进展合作,而不是与之对抗。
雷布曼说:“堆栈中有如此多的层次,LLM 提供商不太可能试图全部涵盖。OpenAI 和 Anthropic 正在构建代理生成器,但围绕着它还有所有这些层次,以确保您拥有可投入生产的代码库。”