Betaworks在最新的"Camp"项目中押注人工智能代理
Betaworks正在拥抱人工智能趋势,不是推出另一个LLM,而是一系列代理型模型,自动化日常任务,尽管这些任务并不简单易定义。投资者最新的“Camp”孵化器培训并资助了9家人工智能代理型初创企业,希望他们可以处理当今更加繁琐的任务。
许多公司的使用案例听起来很有前途,但人工智能往往难以实现承诺。你会相信一款全新闪亮的人工智能来帮你分类电子邮件吗?从网页中提取和构建信息又如何?有人会介意人工智能在任何时间段安排会议吗?
这些服务尚未建立起信任的因素,这在大多数改变我们行为方式的技术中都会出现。最开始询问MapQuest要前往某地的指示感觉很奇怪,直到现在GPS导航成为了日常工具。但是人工智能代理达到了这个阶段吗?Betaworks的CEO兼创始人约翰·博思威克认为是这样。(声明:前TechCrunch编辑和Disrupt主持人乔丹·克鲁克离开了TC去该公司工作。)
"你正在接触到我们花了很多时间思考的东西," 他告诉TechCrunch。 "虽然能动性人工智能还处于萌芽阶段 - 在代理人成功率等方面存在问题 - 但自 Camp 开始以来,我们已经看到了巨大的进展。"
尽管技术将继续改进,博思维克解释说,一些客户已经准备好接受它在当前状态下。
“从历史上看,我们发现顾客即使在涉及更高风险的任务时,也会抱着信念跃升,只要产品‘足够好’。原始的Bill.com尽管在OCR和电子邮件抓取方面做了一些有趣的事情,但并不总是做对,用户仍然信任它处理价值数千美元的交易,因为它让一个糟糕的任务变得不那么糟糕。随着时间的推移,通过高度沟通的界面设计,这些顾客的反馈循环创造了一个更好、更可靠的产品。”他说。
目前,Camp中产品的早期用户大多是开发人员、创始人和早期科技采用者,这一群体一直愿意耐心测试并提供反馈,最终这些产品逐渐走向主流。
Betaworks Camp 是一个为期三个月的加速器项目,在该项目中,被选择的公司将在选定主题上得到现场帮助,包括产品、战略和商业网络,之后他们将获得一个价值50万美元的支票,并在5月7号演示日之前离开。这笔支票由Betaworks、Mozilla Ventures、Differential Ventures和Stem AI共同提供。Startup公司在演示日上展示各自的特点后才能获得这笔资助。
我们事先看了阵容,以下是我觉得最引人注目的三个。
"Twin使用‘动作模型’自动化任务,这类似于我们几个月前听兔子谈论过的(但尚未发布)。通过在大量代表软件界面的数据上训练模型,它可以(这些公司声称)学会如何完成常见任务,这些任务比API能处理的更复杂,但又不至于无法交给‘聪明实习生’来处理。实际上,我们在一月份就对他们进行过报道。"
所以,与其让后端工程师构建一个定制脚本来完成某项任务,你可以用普通语言演示或描述。比如“把今天收到的所有简历放在Dropbox中的一个文件夹里,并以申请人的名字重命名,然后在Slack中给我发私信分享链接。”一旦你调整了工作流程(“糟糕,这次在文件名中添加申请日期”),它就可以成为新的工作方式。自动化占用我们80%时间的20%任务是公司的目标,能否以合理的成本做到这一点可能是真正的问题。(Twin拒绝就其模型和培训过程的性质进行详细说明。)
Skej旨在改善找到适合两个(或三个、四个……)人的会议时间时有时带来的痛苦过程。只需将机器人抄送到电子邮件或Slack线程上,它将开始协调每个人的空余时间和偏好。如果有时间表的访问权限,它会检查这些时间表;如果有人说他们更喜欢周四的下午,它会与之协调;您可以指定一些人优先级;等等。与熟练的高级助理一起工作的任何人都知道他们是不可替代的,但很有可能每一位助理都更愿意少花时间在一些只是一堆“这个怎么样?不行?这个呢?”的任务上。
作为一个厌世者,我没有这个时间表安排的问题,但我理解其他人可能会遇到问题,他们可能更倾向于“设定好就不要再管”的解决方案,只需默认接受结果。而当今的人工智能代理完全有能力做到这一点,主要任务是理解自然语言而非表格。
Jsonify是网站抓取器的一种进化,可以从相对无结构的上下文中提取数据。这种操作已经有很长时间了,但提取信息的引擎从来没有那么智能。如果是一个庞大的、扁平的文档,它们可以正常工作——如果是在网站标签中或一些编码不良的视觉列表中,本来是为人类点击而设计的,它们可能会失败。Jsonify使用当今视觉AI模型的改进理解能力,更好地解析和排序可能无法访问的数据,这对简单爬虫来说很有帮助。
你可以在特定区域搜索Airbnb的选项,然后使用Jsonify将它们全部转储到一个结构化的列表中,列出价格、距离机场的距离、评分、隐藏费用等信息。然后,你可以去Vacasa做同样的事情,提取相同的数据——可能是相同的地方(我前几天就这样做了,省了大约150美元,但我希望能够自动化这个过程)。或者,你知道,做一些专业的事情。
但LLMs固有的不精确性是否使它们成为一个可疑的工具呢?创始人保罗·汉金说:“我们已经成功构建了一个相当健壮的防护栏和交叉检查系统。”我们在运行时使用了几种不同的模型来理解页面,这些模型提供了一些验证——我们使用的LLMs经过了针对我们的用例的调优,所以它们通常即使没有防护栏层也相当可靠。通常我们看到95%以上的提取准确度,这取决于具体的用例。
我觉得这些在任何科技先进的企业都可能会有用。与之相比,其他人更多一些技术性或情境性 — 这里是剩下的6种:
- Resolvd AI - 云工作流的自主自动化。在定制集成跟上之前感觉很有用。
- Floode是一个人工智能收件箱整理工具,它可以阅读您的邮件并筛选出重要内容,同时准备适当的回复和处理措施。
- 可扩展人工智能-您的人工智能是否在退化?咨询您的医生,看看可扩展是否是您部署的正确测试和日志记录基础设施。
- 对手- 一个虚拟角色,旨在让孩子进行广泛的互动和游戏。在道德和法律上感觉像一个雷场,但总得有人去探索。
- 高维度研究 - 基础设施玩法。一个基于网络的AI代理框架,采用按需付费模式,因此如果您公司的实验失败,您只需要支付少量费用。
- Mbodi - 用于机器人技术的生成式人工智能。在这个领域,训练数据相对较少。我以为这是一个非洲单词,原来只是“embody”的发音。
毫无疑问,人工智能代理将在不久的将来日益自动化的软件工作流程中发挥一定作用,但其作用的本质和程度尚未确定。很明显,Betaworks旨在尽早踏入这一领域,即使其中一些产品尚未完全准备好迎接大众市场。
您将能在5月7日看到这些公司展示他们的代理产品。
更正:此故事已更新,表明Jsonify的创始人是保罗·汉金,而不是阿南斯·马尼瓦南。