一个引人注目的设计能使兔子的r1口袋AI与一群虚拟助手有所区别吗?

AI7号2024-01-11660

Chat中文版

在CES的AI设备海洋中,兔子r1(全小写,他们坚持如此)不仅因其高能见度的涂装和独特的外观而脱颖而出,还因为它对比特的专注。该公司希望你能携带第二个设备,省去打开手机的麻烦,并采取了非凡的技术手段使其运作。

r1这款200美元的设备背后的想法很简单:当你需要进行一些简单的任务,比如订车到指定位置、查找与朋友相聚的地点附近的几家餐馆或找到海边周末住宿的选择时,它可以让你将手机放在口袋里。

“我们不是要让你的手机死机,”在接受拉斯维加斯科技展前与媒体的电话会议上,首席执行官兼创始人李杰斯说道。“手机是一个娱乐设备,但如果你想要完成一些任务,它并不是最高效的工具。为了和同事安排晚餐,我们需要使用四五个不同的应用程序相互配合。大型语言模型是自然语言的通用解决方案,我们希望也有一个通用解决方案来解决这些服务——它们只需要能够理解你。”

不用拿出你的手机,解锁它,找到应用程序,打开它,然后在用户界面中操作(太繁琐了!),你可以拿出r1,用自然语言发出命令。

"打电话叫一辆优步XL,带我们去现代艺术博物馆。"

"给我一份附近步行十分钟内的五家便宜餐厅的清单。"

“列出在距离海边不超过10英里范围内,针对六名成年人的Airbnb评价最好的小木屋清单,每晚价格不超过300美元。”

r1会按照您的要求进行操作,几秒钟后会提供确认和您可能请求的任何内容。

这听起来很熟悉,对吧?毕竟,据说我们所谓的“AI助手”在过去的五六年里一直在做这个。“Siri,做这个”,“嘿,谷歌,做那个。”你说得对!但是有一个巨大的区别。

Siri、Google Assistant和Alexa等等,更适合被描述为“定制微应用的语音接口”,与我们在过去一年开始交谈的许多语言模型完全不同。当你告诉Google给你叫一辆Lyft到你当前的位置时,它使用官方的Lyft API发送相关信息并获得回应 - 实际上只是两台机器彼此交流。

并不是说这有什么问题 - 但你通过API所能做的往往非常有限。当然,助手和应用之间必须建立官方的关联关系,经过批准并付费连接。如果你喜欢的应用无法与Siri配合,或者Alexa可以接入的API已经过时,那就只能倒霉了。那些太小而无法与谷歌达成官方协议的小众应用又该如何呢?

兔子所设计的更接近我们在过去一年中看到的“代理”型人工智能。它们是通过训练在普通用户界面(如网页和应用程序)上的机器学习模型实现的。因此,它们可以像人类一样通过点击普通网页或移动应用程序上的普通按钮和字段来订购披萨,而不是通过一些专门的Domino's API。

Chat中文版

公司通过无数次的截屏和常见应用的视频培训了自己的“大动作模型”或LAM。因此,当您告诉它在Spotify上播放一张旧的Bob Dylan专辑时,它不会迷失方向。它知道去Dylan的艺术家页面,按发布日期整理专辑,向下滚动并排队播放其中最旧的专辑。或者无论您如何操作。

你可以在兔子的视频中看到这个过程。

Chat中文版

它已经知道如何与许多常见的应用程序和服务进行工作,但如果你有它不知道的应用程序,兔子声称r1可以通过观察你使用该应用程序一段时间来学习 - 尽管这种教学模式在推出时不可用。(Lyu表示他们在《暗黑破坏神4》中使其有效,所以它可能能够处理AllTrails。)

当然,R1本身实际上无法按下应用程序中的那些按钮 - 首先,它没有手指按下按钮,其次,它没有账号。针对第二个问题,兔子设置了一个称为“兔子洞”的平台,在该平台上,您可以使用登陆凭证激活服务,这些凭证不会被保存。激活后,服务器将以某种仿真环境中普通按钮按下的方式操作应用程序,就像您可能会做的那样(但是对于此方面他们没有提供详细说明)。

“就好像把手机递给你的助手一样,”Lyu慷慨地假设我们都对这种特定的便利很熟悉。“我们所做的只是让这个工具替你按下按钮。他们在后台所看到的只是你努力地尝试做事情。这是完全合法的,也符合他们的服务条款。”

更小、更便宜、更快

这家公司显然在技术方面投入了很多工作,但真正的问题是,除了手机,实际上有谁会想要携带这个东西呢?它的定价为200美元,没有订阅费,不过您需要提供一张SIM卡。这比AirPods便宜,并且它承诺带来了很多乐趣。

Chat中文版

它显然有一个优点,那就是外观。就像如果Playdate有一个创业公司创始人表弟一样,他开着一辆带有个性化车牌的鲜红特斯拉(你懂的)。它由Teenage Engineering设计,他们如今制作的一切都非常棒。

你可能会问,为什么在你可以用来交谈的东西上会有一个屏幕?其实,屏幕是用来显示一些视觉内容的,比如搜索结果或确认你的位置。我有两种想法。一种认为,要不然你该怎么做呢?另一种认为,如果你需要先确认所有这些东西,为什么不直接用你另一个口袋里的手机呢?

很明显,兔子团队认为弹出这个小巧(3英寸x3英寸x0.5英寸)且轻便(115克)的装置,并说出你想要的内容,然后使用滚轮和按钮浏览结果,比在许多情况下使用应用程序更简单。我可以理解这可能是真的-许多应用程序设计不佳,而且现在还有额外的广告风险。

但是为什么要加入摄像头呢?对于这个问题,我没有得到一个明确的答案。它具有一个有趣的磁性/自由浮动的轴,可以旋转到水平,并指向你希望的任何方向。似乎还有一些功能正在开发中,还没有准备好推出 —— 比如“这袋糖有多少卡路里?”或者“是谁设计了这栋建筑?”之类的问题。视频通话和社交媒体可能会随后出现。

该设备现在可以预订,李宇表示他们计划在三月底发货到美国。

可怕的竞争。

然而,归根结底的一个重要问题是,不是关于兔子r1是否成功地实现了其既定目标-据我所看,它确实做到了-而是面对极强大的竞争,这种方法是否可行。

谷歌、苹果、微软、OpenAI、Anthropic、亚马逊、Meta等等,它们每天都在努力提升机器学习智能体的能力。对于Rabbit来说,最大的危险不是没人购买,而是在六个月后,一个价值千亿美元的公司推出自己的行动智能体,能完成兔子80%的功能,并免费提供给你的智能手机使用。

我问了吕先生,这是不是他和他的公司的一个担忧,他的公司只有17名雇员,规模不大。

“当然我们很担心,”他回答道,“我们是一家创业公司。但仅仅因为他们能做到,不意味着我们需要停下来。”

他指出,尽管这些公司拥有丰富的资源,但它们也缺乏创业公司的敏捷性,即今天发货什么,以后可能部分发货,并且缺乏数据。他指出,语言模型“基于开源资料 - 仅仅五篇论文。”在这方面很难创造竞争壁垒。但是,Rabbit的LAM是建立在专有数据上,并针对一个非常特定的用户体验和一个非常特定的设备。

即便如此,即使兔子r1更好或更可爱,人们更喜欢简单和方便。当他们的第一个设备已经能完成大部分任务时,为什么他们要花钱再携带第二个设备呢?从短期来看,答案肯定是肯定的:Lyu表示预订量不断增加。兔子是否能活下去并生产下一代,预计是r2?即使不能,这个热门小设备可能会在我们的记忆中作为人工智能炒作潮流的一个合适的雄心勃勃的典范而流传下去。

推荐阅读

字母量子旋转公司Sandbox AQ收购Good Chemistry

2024-01-112910
Chat中文版

CES 2024:如果你错过了现场直播,如何观看Nvidia、三星、索尼和其他公司的重要发布

2024-01-112846
Chat中文版

Tack One推出了改进版儿童和老年人位置追踪器

2024-01-112444
Chat中文版

沃尔玛在CES上首次推出生成AI搜索和AI补货功能

2024-01-112666
Chat中文版

消息来源:AI照片编辑应用PhotoRoom正在以5亿至6亿美元估值筹集5,000万至6,000万美元

2024-01-112505
Chat中文版