Siri和Google助手寻求生成式人工智能为他们带来新生

AI7号2024-06-07725

Chat中文镜像

2024年WWDC的主题演讲将承担重大责任。演讲的影响远比一般的活动后市场变化大。对于Tim Cook和他的团队来说,交付好产品的压力实际上比去年Vision Pro发布前更大。

周一,苹果将公布其人工智能计划。在过去的几年里,这个问题一直是悬在Cupertino头顶上的一个巨大问号,因为谷歌和微软等竞争对手已经接受了生成式人工智能。业内普遍认为,由ChatGPT和Gemini等大型语言模型驱动的系统将深刻影响我们与设备的互动方式。

预计苹果将宣布与OpenAI合作,将其智能技术引入iPhone和Mac。苹果的近期策略是深度整合现有产品和生成式人工智能,其中Siri处于中心地位。自2011年首次亮相以来,苹果一直在推动使语音助手成为其所有操作系统的重要组成部分。

然而,在过去的13年中,Siri并没有达到苹果承诺的革命。有很多原因可以解释这一点,但主要的原因是能力。人工语音助手的概念在Siri出现之前就已经存在了数十年,但没有人能够完全掌握它的原因。随着手机制造商和应用开发者将智能手机转变为多功能设备,这些助手的工作变得越来越复杂。

尽管斯坦福研究所的工作令人印象深刻,但要实现无摩擦的体验所需的技术并未准备就绪。Siri 的联合创始人Norman Winarsky在2018年指出了潜在问题,他提到苹果最初的计划是一个功能更有限的助手,只处理娱乐和旅行等事务。“这些都是难题,而且当一个公司要处理高达10亿人口时,问题会变得更难,”Winarsky当时指出。“他们可能正寻求一种无法实现的完美水平。”

生成式人工智能还没有达到完美的水平,至少目前还没有。幻觉仍然是一个问题。这正是为什么,即使在过去几年的巨大轰动之后,我们仍然感觉自己仍处于起步阶段。如果有什么的话,我会说其中谷歌在某些方面过于激进。最好的例子就是该公司决定在搜索结果的顶部展示Gemini的决定。

当世界主导的搜索引擎将某物优先于可信赖的资源时,它需要尽可能地做对,而不是告诉人们吃胶水。谷歌将Gemini的结果标记为其“搜索实验室”的产品,但绝大多数用户并不了解这在产品成熟度方面意味着什么,也不愿意点击获取更多信息。

在过去几年里,我遇到了一些研究人员,他们用“魔法”这个词来描述“黑匣子”所围绕的大型语言模型的结果。这并不是对这个领域中所有令人惊叹的工作的抨击,而是一个意识到我们对这项技术仍然了解甚少。

亚瑟·C·克拉克表达得最好:“任何足够先进的技术都无法区分是否为魔法。”

然而,谷歌在整合千禧一代到安卓系统方面更加有意识。谷歌并没有直接取代助手,而是将其生成式人工智能平台整合到不同的应用程序中。用户还可以选择将千禧一代设为默认助手,通过在Pixel设备上分配给助手按钮来完成。目前,这一实施至少需要用户有意识地采取行动。

尽管尚未完全征服安卓,但谷歌显然在暗示不久的将来将彻底取代助手。上个月在I/O大会上,我还以为会有相关的宣布,不过我很高兴最终选择给双子座更多时间来发展。

助手的名称是否会一直保留,最终取决于品牌决策。就苹果而言,他们非常钟情于Siri这个名称。毕竟,他们已经花了十多年的时间向消费者推销这个产品。然而,不久之后,生成式人工智能将会主宰智能助手领域。

智能助手整体上正在经历一个存在的重要时刻。智能音箱已经成为像Siri、Alexa和Google助手这样平台的更广泛的风向标。在疫情期间火热之后,出货量已经下降。把这一类别描述成注定失败是不公平的,但如果没有得到适当的帮助,最终可能会失败。

生成式人工智能有望成为合乎逻辑的继任者,但围绕这些模型构建的第一批硬件设备,包括人道AI智能针和Rabbit R1,只是对这一类别仍需走多远才能被视为主流用户一致体验的证明。

苹果最终将在周一揭开面纱。尽管有传言称公司在电动汽车失败后正在将一些员工转移到生成式人工智能领域,但一切迹象都表明苹果已经让竞争对手占据了显著的先机。因此,它最合乎逻辑的做法是与像OpenAI这样的领先实力进行合作。

苹果收购Siri后不久,有人问史蒂夫·乔布斯是否试图在谷歌的游戏中击败对手。乔布斯回答说:“这是一家人工智能公司。我们不会进入搜索业务。我们不在乎它。其他人擅长做这个。”

公司目前对生成式人工智能的方法和OpenAI处于同一水平。在这个阶段,苹果无法在这个领域打败OpenAI,因此选择与其合作。但即使最好的现有模型也还需要一段时间才能完全取代当前的智能助手。