生成式人工智能让机器人更接近通用目标

Chat中文镜像

大多数有关人型机器人的报道都理所当然地集中在硬件设计上。鉴于开发者频繁地使用“通用人形机器人”这个词组，更应该关注第一部分。经过几十年的单一目的系统发展，转向更广义的系统将是一个巨大的飞跃。但现在我们还没有到那一步。

近年来，研究人员对开发能够充分利用双足人形设计所开放的广泛动作范围的机器人智能的推动力很大。近期，使用生成式人工智能在机器人领域已成为一个炙手可热的话题。麻省理工学院的新研究指出，后者可能会对前者产生深远影响。

在通向通用系统的道路上，最大的挑战之一就是培训。我们对于如何训练人类进行不同工作有着牢固的掌握。而对于机器人技术，虽然很有希望，但目前还是零散的。有很多有前景的方法，包括强化学习和模仿学习，但未来的解决方案可能会涉及这些方法的组合，并借助生成式人工智能模型的增强。

麻省理工学院团队建议的主要用例之一是能够从这些小而特定的数据集中整理相关信息的能力。该方法被称为"政策组合"（PoCo）。任务包括像钉钉和用铲子翻东西这样有用的机器人动作。

学校指出：“研究人员训练了一个单独的扩散模型，来学习使用一个特定数据集完成一个任务的策略或政策。然后他们将扩散模型学习的策略结合起来，形成一个通用政策，使机器人能够在不同环境下执行多个任务。”

根据麻省理工学院的数据，扩散模型的应用使任务表现提高了20%。这包括执行需要多种工具的任务的能力，以及学习/适应陌生任务的能力。该系统能够将不同数据集中的相关信息结合起来，形成执行任务所需的一系列行动。

该方法的一个好处是我们可以结合政策，以实现两全其美，”该论文的主要作者王丽蕊说道。“例如，基于真实世界数据训练的政策可能能够实现更多的灵活性，而基于模拟训练的政策可能能够实现更多的泛化能力。”

这项具体工作的目标是创建智能系统，使机器人能够交换不同的工具来执行不同的任务。多功能系统的普及将使工业距离通用目标更近一步。

推荐阅读

Databricks扩展Mosaic AI以帮助企业利用LLMs构建

一年前，Databricks以13亿美元收购了MosaicML。现在更名为Mosaic AI，该平台已成为Databricks AI解决方案的重要组成部分。今天，在公司的Data + AI…

以下是苹果在2024年WWDC主题演讲中宣布的所有内容，包括苹果智能和Siri改头换面

科技博客团队整理了苹果WWDC 2024主题演讲中所有重大新闻，方便浏览。

随着全球人工智能硬件行业竞争加剧，无晶圆厂AI芯片制造商Rebellions和Sapeon宣布合并

在过去几年中，随着对用于驱动人工智能应用的硬件需求激增，韩国的无晶圆厂人工智能芯片行业出现了一系列的筹资活动，看起来...

Linq筹集了660万美元，利用人工智能为金融分析师让研究变得更容易

当生成式人工智能工具在2022年底推出ChatGPT后开始引起轰动时，金融行业是第一个意识到这些工具在加速方面的潜力的行业之一...

为什么苹果将采用一种小型模型方法来实现生成式人工智能

这种做法非常符合苹果的风格，它将无障碍的用户体验放在首位。