Covariant正在为机器人开发ChatGPT
本周,Covariant宣布推出RFM-1(机器人基础模型1)。加州大学伯克利分校人工智能衍生项目的联合创始人兼首席执行官Peter Chen告诉TechCrunch,这个平台“基本上是一个大型语言模型(LLM),但专注于机器人语言”。
RFM-1 是 Covariant Brain AI 平台部署收集的海量数据等多种因素的结果。在获得客户同意的情况下,这家初创公司一直在构建机器人版的 LLM 数据库。
陈表示:“RFM-1的愿景是为即将问世的数十亿台机器人提供动力。我们在Covariant已经成功地在仓库部署了大量机器人。但这并不是我们想要达到的极限。我们真的希望为制造业、食品加工、回收、农业、服务业甚至人们的家庭提供机器人动力。”
随着越来越多的机器人公司讨论“通用目的”系统的未来,该平台也随之推出。Agility、Figure、1X和Apptronik等人形机器人公司的突然涌现在这次讨论中发挥了关键作用。该形态特别适合适应性(就像其原型人类一样),尽管机载人工智能/软件系统的稳健程度是另一个完全不同的问题。
目前,Covariant的软件主要部署在工业机器人手臂上,执行多种熟悉的仓储任务,包括像拣选货物这样的工作。目前尚未部署在人形机器人上,但该公司承诺具有一定程度的硬件兼容性。
陈说:“我们确实很喜欢发生在更普遍用途的机器人硬件领域的许多工作。将智能拐点与硬件拐点相结合,我们将看到更多机器人应用的爆发。但很多应用还没有完全成熟,尤其是在硬件方面。要超越制作好的视频很困难。有多少人亲身与人形机器人互动过?这告诉你成熟度的程度。”
然而,Covariant在谈到RFM-1在机器人决策过程中的作用时,并不回避与人类的比较。根据它的宣传材料,这个平台“为机器人提供了类似人类的推理能力,代表了生成式人工智能首次成功地为商业机器人赋予了对语言和物理世界更深层次理解的能力。”
这是一个我们必须小心谨慎处理声明的领域,无论是与抽象或甚至是哲学概念进行比较,还是关于其随着时间推移在现实世界中的实际有效性。“类人的推理能力”是一个广泛的概念,对不同的人有不同的含义。在这里,这个观念适用于系统处理现实数据的能力,并确定在执行手头的任务时采取的最佳行动方案。
这是传统机器人系统的一个分歧,它们被编程为重复执行一项工作,直到无穷无尽。这种单一用途的机器人在高度结构化的环境中蓬勃发展,从汽车组装线开始。只要所需任务没有太大变化,机械臂就可以一遍又一遍地完成工作,直到下班时间到来,为了其多年忠诚的服务而收集金色口袋手表。
事情可能很快就会出现问题,即使是最小的偏离也可能导致故障。比如物体没有被放置在传送带上的正确位置,或者光线的调整影响了机器人上的摄像头。这些微小的差异可能会对机器人的执行能力产生巨大影响。现在想象一下,尝试让机器人使用新零件、新材料,甚至是完成全新任务。这就更加困难了。
这就是程序员传统上介入的时刻。机器人必须重新编程。往往,工厂外部的人会介入。这是资源和时间的巨大浪费。如果想要避免这种情况发生,需要发生以下两件事情之一:1)工厂工作人员需要学会编程,或者2)需要一种新的更自然的方法与机器人互动。
尽管做前者会很好,但看起来公司不太可能愿意投资资金并等待必要的时间。后者正是 Covariant 正试图通过 RFM-1 实现的目标。"机器人的 ChatGPT" 或许不是完美的类比,但在 OpenAI 创始人的背景下,这是个合理的简略说法。
从客户的角度来看,该平台呈现为一个文本字段,类似于当前面向消费者的生成式人工智能。通过输入文本命令,比如“拾起苹果”,可以通过键盘输入或语音输入,系统利用其训练数据(形状、颜色、大小等)来识别最接近描述的物体。
然后RFM-1生成视频结果,本质上是模拟,用以确定使用过去训练的最佳行动方案。这最后一部分类似于我们的大脑在执行前如何计算行动的潜在结果。
在现场演示中,该系统对诸如“拿起红色物体”甚至更多语义复杂的指令,“拿起你穿在鞋子之前穿在脚上的东西”做出反应,这导致机器人分别正确地拿起了苹果和一双袜子。
在谈论这个系统的潜力时,会被提出许多伟大的想法。至少在创始人中,Covariant有着令人印象深刻的背景。陈在伯克利大学跟着他的Covariant联合创始人和首席科学家Pieter Abbeel学习人工智能。Abbeel也在2016年成为了早期的OpenAI员工,在陈加入ChatGPT公司后一个月。Covariant是在随后的一年成立的。
陈表示,公司预计新的RFM-1平台将与Covariant软件已部署的“大多数”硬件兼容。