Liquid AI,麻省理工学院的新创企业,希望构建一种全新类型的人工智能

AI7号2024-01-111453

Chat中文版

由机器人学专家Daniela Rus共同创办的麻省理工学院衍生公司旨在构建由一种相对较新的人工智能模型称为液态神经网络驱动的通用人工智能系统。

这个新项目名为Liquid AI,适时地从隐匿状态中出现,并宣布已从风险投资公司和机构筹集了3750万美元资金,对于两阶段的种子轮投资来说,这个数额相当可观。投资方包括OSS Capital、PagsGroup、WordPress母公司Automattic、三星Next、Bold Capital Partners和ISAI Cap Venture,还有一些天使投资者,例如GitHub的联合创始人汤姆·普雷斯顿·维尔纳、Shopify的联合创始人托比亚斯·吕特克和Red Hat的联合创始人鲍勃·杨。

这一份交易将Liquid AI的估值定为3.03亿美元。

加入Liquid AI创始团队的有Ramin Hasani(CEO),Mathias Lechner(CTO)和Alexander Amini(首席科学官)。Hasani之前是Vanguard的首席AI科学家,后来加入MIT作为博士后研究员和研究助理。Lechner和Amini是MIT的长期研究人员,与Hasani和Rus一起创造了液体神经网络的发明。

你可能想知道什么是液态神经网络?我的同事布莱恩·希特已经对此进行了广泛的报道,我强烈建议你阅读他关于这个话题的最新采访罗斯的文章。但我将尽力概述要点。

2020年底,Hasani、Rus、Lechner、Amini等人发表的一篇名为“液态时间常数网络”的研究论文,使液态神经网络在数年的起伏后得到了广泛关注;作为一个概念,液态神经网络自2018年起就存在。

Chat中文版

哈萨尼在电子邮件采访中告诉科技新闻网站TechCrunch:“这个想法最初是在奥地利维也纳理工大学的Radu Grosu教授的实验室里发明的,当时我在那里完成了我的博士学位,莱希纳完成了他的硕士学位。”他继续说:“然后在麻省理工学院计算机科学与人工智能实验室Rus的实验室进行了改进和扩展,Amini和Rus与我和莱希纳一起加入了这项工作。”

液态神经网络由受方程控制的“神经元”组成,这些方程预测每个个体神经元随时间变化的行为,就像大多数现代模型架构一样。术语“液态神经网络”中的“液态”一词指的是该架构的灵活性;受到线虫“大脑”的启发,液态神经网络不仅比传统的人工智能模型小得多,而且运行所需的计算能力也要少得多。

我认为将液态神经网络与典型的生成性人工智能模型进行比较是有帮助的。

GPT-3是OpenAI的文本生成、图像分析模型GPT-4的前身,它包含约1750亿个参数和约50000个神经元。其中,“参数”是从训练数据中学习的模型部分,基本上定义了模型在解决问题(在GPT-3的情况下是生成文本)上的能力。相比之下,一个用于在室外环境中引导无人机的液态神经网络可能只包含20000个参数和不到20个神经元。

总的来说,参数和神经元较少意味着训练和运行模型所需的计算量较少,在人工智能计算能力稀缺的时候,这是一种吸引人的选择。以自动驾驶为例,一个设计用于驾驶汽车的液态神经网络理论上可以在树莓派上运行。

液体神经网络的体积小和简洁的结构使其具有可解释性的额外优势。直觉上来说,弄清楚液体神经网络中每个神经元的功能比弄清楚GPT-3中约50,000个神经元的功能更容易(尽管已经有一些相对成功的尝试)。

现在,已经存在一些能够实现自动驾驶、文本生成等功能的低参数模型。但是,低消耗不是液体神经网络的唯一优点。

液态神经网络(Liquid neural networks)的另一个吸引人的特点是它们能够随着时间的推移适应其参数以达到“成功”。这些网络将数据序列视为连续的整体,而不是大多数模型处理的孤立切片或快照,并动态调整其神经元之间的信号交换。这些特性使得液态神经网络能够处理周围环境和情况的变化,即使它们并没有经过相应的训练来预测这些变化,比如在自动驾驶的背景下,天气条件的变化。

在测试中,液态神经网络在预测从大气化学到汽车交通的数据集中的未来价值方面超过了其他最先进的算法。但更令人印象深刻的是,它们在自主导航方面取得的成就,至少对于我来说。

今年初,Rus和Liquid AI团队的其他成员对一名专业人类无人机驾驶员收集的数据进行了液态神经网络的训练。然后,他们将该算法部署到一组四旋翼飞行器上,在不同的户外环境中进行了长距离目标跟踪等一系列测试,包括森林和密集城市社区。

据团队表示,液态神经网络打败了其他训练用于导航的模型,成功做出决策,使得无人机能够在以前未探索的区域中找到目标,即使面临噪声和其他挑战。此外,液态神经网络是唯一能够在没有任何微调的情况下可靠地泛化到未见过情景的模型。

无人机搜救、野生动物监测和物品配送是液态神经网络更明显的应用之一。然而,Rus和液态AI团队声称该架构适用于分析任何随时间波动的现象,包括电力网络、医疗读数、金融交易和严重天气模式。只要有包含序列数据(如视频)的数据集,液态神经网络就可以训练。

那么,这家初创公司Liquid AI究竟希望用这种强大的新型架构实现什么呢?简单明了地说,就是商业化。

哈萨尼表示:“我们与构建GPT的基础模型公司竞争”,没有点名具体公司,但很明显地指向了OpenAI和在生成型人工智能领域的其他竞争对手(如Anthropic、Stability AI、Cohere、AI21 Labs等)。这轮种子融资将使我们能够构建超越GPT的业界领先的全新Liquid基础模型。”

据推测,液体神经网络架构的工作将继续进行。仅在2022年,罗斯实验室找到了一种方法,可以使液体神经网络的规模远远超出以前的计算实际可行范围;希望在不久的将来可能会出现其他突破性的发现。

除了设计和训练新模型外,Liquid AI计划为客户提供本地和私有的人工智能基础设施,并提供一个平台,使这些客户能够根据自己构思的用例来构建自己的模型 - 当然,这要遵守Liquid AI的条款。

“大型AI模型的问责和安全至关重要,”Hasani补充说。“Liquid AI为领域特定和生成性AI应用提供了更高效、可靠、可解释和有能力的机器学习模型。”

Liquid AI在波士顿以外还在帕洛阿尔托设有办事处,该公司有一个由12人组成的团队。Hasani预计到明年年初该团队人数将增加到20人。

推荐阅读

Pixel 8 Pro 成为首款搭载 Google 最新人工智能模型 Gemini 的智能手机

2024-01-111728
Chat中文版

谷歌宣布推出Cloud TPU v5p,迄今为止最强大的人工智能加速器

2024-01-11901
Chat中文版

谷歌的Gemini并不是我们预期的生成式人工智能模型

2024-01-112791
Chat中文版

谷歌的AI聊天机器人Bard经过大幅升级,采用谷歌的下一代AI模型Gemini

2024-01-11976
Chat中文版

Meta推出了一个独立的基于人工智能技术的图像生成器

2024-01-11386
Chat中文版