莱塔(Letta),加州大学伯克利分校最受期待的人工智能初创公司之一,刚刚走出隐秘模式。
一家名为 Letta 的初创公司刚刚走出隐匿模式,其技术可帮助人工智能模型记住用户和对话。该公司在加州大学伯克利分校著名的实验室初创工厂创立,还宣布获得了由 Felicis 的阿斯塔西娅·迈尔斯(Astasia Myers)牵头的 1000 万美元种子资金,投后估值为 7000 万美元。
莱塔还得到了人工智能领域一众知名天使投资人的支持,比如谷歌的杰夫·迪恩(Jeff Dean)、Hugging Face 的克莱姆·德朗格(Clem Delangue)、Runway 的克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)和 Anyscale 的罗伯特·西原(Robert Nishihara)等等。
这家备受期待的人工智能初创公司由伯克利大学的博士生莎拉·伍德斯(Sarah Wooders)和查尔斯·帕克(Charles Packer)创立。这是因为它是伯克利天空计算实验室的产物,也是热门的 MemGPT 开源项目的商业实体。
由著名教授、Databricks 联合创始人 Ion Stoica 领导的伯克利天空计算实验室(Berkeley’s Sky Computing Lab)是 RISELab 和 AMPLab 的后继者,催生了 Anyscale、Databricks 和 SiFive 等公司。尤其是天空实验室,孕育了众多流行的开源大型语言模型(LLM)项目,如 Gorilla LLM、vLLM 和 LLM 结构化语言 SGLang。
伍德斯描述道:“在一年的时间框架内,大量的项目很快就从实验室里出来了。就是坐在我们旁边的那些人做出来的。所以那是一段不可思议的时光。”
MemGPT 就是这样一个项目,它是如此热门的产品,以至于在推出之前就已经走红了。
帕克告诉 TechCrunch:“有人抢了我们的风头。”这几位创始人在 2023 年 10 月 12 日(周四)发布了一份白皮书,并计划在下周一将更深入的论文和代码发布到 GitHub 上。他说,某个陌生人发现了这份白皮书,于周日将其发布到了 Hacker News 上,结果“在我们有机会恰当地发布代码、发布论文,或者发个推文之类的之前,就在 Hacker News 上疯传了。”
这种兴奋的原因在于 MemGPT 缓解了大型语言模型的一个有害问题:在其原始形式中,像 ChatGPT 这样的模型是无状态的,这意味着它们不会在长期记忆中存储历史数据。对于那些依赖于随着时间推移了解并向用户学习的人工智能应用程序来说,这是个问题,从客户支持机器人到医疗保健症状跟踪应用程序皆是如此。MemGPT 管理数据和内存,以便人工智能代理和聊天机器人能够记住以前的用户和对话。
帕克回忆说,这篇帖子在由 Y Combinator 运营的热门程序员网站 Hacker News 上置顶了 48 个小时。所以他整个周末和接下来的几天都在该网站上回答问题,同时努力准备发布代码。一旦该项目在 GitHub 上可用,指向它的链接在 Hacker News 上再次疯传。YouTube 上的采访和教程、Medium 上的帖子、GitHub 上的 11000 个星标和 1200 个分支很快就出现了。
Felicis 风投公司的迈尔斯也是通过阅读有关 MemGPT 的报道发现了伍德斯和帕克,并且立刻意识到了这项技术的商业可能性。
她告诉 TechCrunch:“这篇论文发表时我就看到了,”她随即联系了创始人。“我们有一个围绕人工智能代理基础设施的投资主题,并意识到其中一个非常重要的组成部分是数据和内存管理,以使这些对话聊天机器人和人工智能代理有效运行。”
这些创始人实际上仍然在沙丘路(Sand Hill Road)上四处奔走,与风投公司进行 Zoom 视频通话,然后才选择了最先青睐他们的那家。
与此同时,斯托伊卡为迪恩、西原和其他硅谷的大牌天使投资人牵线搭桥。“伯克利的很多教授,仅仅因为身处伯克利,人脉就非常广,”帕克回忆起天使投资的过程是多么容易时说道,“他们关注着这个实验室里即将商业化的项目。”
竞争以及 OpenAI 的威胁 o1
虽然 MemGPT 已经在市面上并被使用,但莱塔(Letta)的商业版本 Letta Cloud 尚未开始营业。截至周一,莱塔正在接受测试用户的请求。它将提供一种托管代理服务,允许开发人员在云端部署和运行有状态的代理,可通过 REST API(一种能够保持状态的编程接口)进行访问。Letta Cloud 将存储实现此目的所需的长期数据。莱塔还将为构建人工智能代理提供开发工具。
对于 MemGPT,伍德斯看到了广泛的用途。她说:“我认为我们看到的首要用例基本上是高度个性化、非常吸引人的聊天机器人。”但也有一些前沿用途,比如“癌症患者聊天机器人”,患者上传他们的病史,然后分享持续的症状,这样机器人就可以随着时间的推移学习并提供指导。
值得注意的是,MemGPT 并非独自在这方面进行努力。LangChain 可能是其最知名的竞争对手,并且已经提供了商业选项。最大的模型制造商也提供了人工智能代理制作工具,例如 OpenAI 的 Assistants API。
而且 OpenAI 的新 o1 模型可能会让其用户无需再去操心状态固定的问题。由于它是一个多步骤模型,在某种程度上,它从根本上必须维持状态,以便在回复之前进行“思考”和事实核查。
但是,伍德斯、帕克和迈尔斯看到了莱塔所提供的与 800 磅重的市场巨头 OpenAI 所做的一些关键区别。莱塔声称它将与任何人工智能模型合作,并期望其用户使用许多模型:OpenAI、Anthropic、Mistral 以及他们自己开发的模型。而 OpenAI 的技术目前只能与其自身配合使用。
更重要的是,莱塔正在使用开源的 MemGPT,并坚定地投身于自由及开源软件与黑箱大型语言模型这场辩论的开源一方,称开源对于人工智能应用程序开发者来说是更好的选择。
帕克说:“我们将自身定位为 OpenAI 的开放替代品。我认为要构建非常出色的人工智能应用程序实际上非常非常困难,尤其是当你在意像幻觉这样的问题时,如果你无法了解其内部运作情况。”
hbspt.forms.create({
区域: "na1",
门户 ID: "44101848",
表单 ID: "09f96578-8d24-4d8a-8e9f-7700cff83c29"
});