生成式人工智能让机器人更接近通用目标
大多数有关人型机器人的报道都理所当然地集中在硬件设计上。鉴于开发者频繁地使用“通用人形机器人”这个词组,更应该关注第一部分。经过几十年的单一目的系统发展,转向更广义的系统将是一个巨大的飞跃。但现在我们还没有到那一步。
近年来,研究人员对开发能够充分利用双足人形设计所开放的广泛动作范围的机器人智能的推动力很大。近期,使用生成式人工智能在机器人领域已成为一个炙手可热的话题。麻省理工学院的新研究指出,后者可能会对前者产生深远影响。
在通向通用系统的道路上,最大的挑战之一就是培训。我们对于如何训练人类进行不同工作有着牢固的掌握。而对于机器人技术,虽然很有希望,但目前还是零散的。有很多有前景的方法,包括强化学习和模仿学习,但未来的解决方案可能会涉及这些方法的组合,并借助生成式人工智能模型的增强。
麻省理工学院团队建议的主要用例之一是能够从这些小而特定的数据集中整理相关信息的能力。该方法被称为"政策组合"(PoCo)。任务包括像钉钉和用铲子翻东西这样有用的机器人动作。
学校指出:“研究人员训练了一个单独的扩散模型,来学习使用一个特定数据集完成一个任务的策略或政策。然后他们将扩散模型学习的策略结合起来,形成一个通用政策,使机器人能够在不同环境下执行多个任务。”
根据麻省理工学院的数据,扩散模型的应用使任务表现提高了20%。这包括执行需要多种工具的任务的能力,以及学习/适应陌生任务的能力。该系统能够将不同数据集中的相关信息结合起来,形成执行任务所需的一系列行动。
该方法的一个好处是我们可以结合政策,以实现两全其美,”该论文的主要作者王丽蕊说道。“例如,基于真实世界数据训练的政策可能能够实现更多的灵活性,而基于模拟训练的政策可能能够实现更多的泛化能力。”
这项具体工作的目标是创建智能系统,使机器人能够交换不同的工具来执行不同的任务。多功能系统的普及将使工业距离通用目标更近一步。