本周AI动态:消费者是否真的需要亚马逊的GenAI?

AI7号2024-02-032333

Chat中文版

跟上像AI这样快速发展的行业是一项艰巨的任务。因此,在AI能为你完成这项任务之前,这里为你提供了一个方便的综述,介绍了机器学习领域的最新故事,以及我们未涉及的重要研究和实验。

本周,亚马逊宣布了一款名为Rufus的人工智能购物助手。Rufus通过对亚马逊的产品目录以及来自互联网的信息进行训练。Rufus作为亚马逊移动应用程序的一部分存在,能够帮助找到产品、进行产品比较并提供购买建议。

亚马逊在一篇博客文章中写道:“从开始购物之旅的广泛研究,例如‘购买跑鞋需要考虑什么?’,到比较不同类型的跑鞋,例如‘越野跑鞋和路跑鞋有什么区别?’…… Rufus(Amazon的一个工具)有效地提高了顾客寻找和发现满足他们需求的最佳产品的便利性。”

这都很好。但我的问题是,真的有人迫切需要它吗?

我并不认为GenAI,特别是以聊天机器人的形式,是普通人关心的科技产品,甚至不会考虑。调查结果也支持了我的观点。去年8月,皮尤研究中心发现,在美国听说过OpenAI的GenAI聊天机器人ChatGPT的人中(占成年人的18%),只有26%尝试过使用。使用情况当然会根据年龄而有所不同,年轻人(50岁以下)使用的比例大于老年人。但事实仍然是,绝大多数人都不知道,或者不在乎使用可能是最受欢迎的GenAI产品。

GenAI存在众所周知的问题,其中包括虚构事实、侵犯版权、表达偏见和毒性言论等倾向。亚马逊之前推出的GenAI聊天机器人Amazon Q也曾经历了困难,仅在发布的第一天就泄露了机密信息。但从消费者的角度来看,我认为GenAI现在的最大问题是,几乎没有普遍吸引人的使用理由。

当然,像Rufus这样的GenAI可以帮助处理特定且狭窄的任务,如根据场合购物(例如寻找冬季服装),比较产品类别(例如唇彩和精油的区别),以及提供最佳推荐(例如情人节礼物)。然而,根据电子商务软件初创公司Namogoo最近的一项民意调查,它是否满足大多数购物者的需求尚存争议。

Namogoo对数百名消费者进行调查,了解他们在网上购物时的需求和挫折感,发现产品图片是良好电子商务体验中最重要的因素,其次是产品评论和描述。受访者排名搜索为第四重要,"简单导航"为第五;记住偏好、信息和购物历史则是最不重要的。

这句话的含义是,人们通常在购物时有一个特定的产品目标,搜索只是事后的想法。也许Rufus会改变这个情况。我倾向于认为不会,尤其是如果推出过程不顺利的话(鉴于亚马逊其他的智能购物实验的反响,这种情况很有可能)- 但我想奇迹总是存在的。

以下是最近几天的其他一些值得关注的人工智能故事:

  • 谷歌地图与智能AI进行实验:谷歌地图正引入一项智能AI功能,以帮助你发现新地点。该功能利用大型语言模型(LLMs),分析谷歌地图上超过2.5亿个地点和来自三亿多名本地向导的贡献,根据你的需求提供相关建议。
  • GenAI音乐和其他工具:在谷歌的另一条新闻中,这家科技巨头发布了GenAI音乐、歌词和图像创作工具,并在全球范围内将其更强大的LLM之一——Gemini Pro引入了其Bard聊天机器人的用户。
  • 新的开放AI模型:艾伦人工智能研究所是由已故的微软联合创始人保罗·艾伦创办的非营利性人工智能研究机构。该机构发布了几个GenAI语言模型,声称这些模型比其他模型更“开放”,并且通过许可方式使开发者可以无限制地用于训练、实验甚至商业化。
  • 美国联邦通信委员会(FCC)正准备禁止使用人工智能生成的电话:FCC建议将使用语音克隆技术进行自动拨号视为根本违法,这将使对这些欺诈行为的操作者更容易受到指控。
  • Shopify推出图像编辑器:Shopify发布了一款GenAI媒体编辑器,用于增强产品图片。商家可以选择七种样式或输入提示来生成新的背景。
  • GPTs的调用:OpenAI正在推动GPTs的采用,通过使ChatGPT用户能够在任何聊天中调用其AI模型来提供第三方应用程序。ChatGPT的付费用户可以通过输入“@”并从列表中选择一个GPT来将其引入对话中。
  • OpenAI与常识媒体合作:在一项无关的公告中,OpenAI表示他们将与常识媒体合作,常识媒体是一家非营利组织,负责评估和排名适合儿童的各种媒体和科技产品的合适性。双方将合作制定AI指南和教育材料,面向家长、教育工作者和年轻人。
  • 自主浏览:制造Arc浏览器的浏览器公司正在追求建立一个能够为您浏览互联网并获取结果的人工智能,旁路搜索引擎,伊万写道。

更多的机器学习

一个AI是否知道在特定情况、媒体或话语中什么是“正常”或“典型”的?从某种意义上说,大型语言模型非常适合识别其数据集中哪些模式最类似于其他模式。事实上,耶鲁大学的研究人员在他们对AI是否能够识别其他事物组中的“典型性”进行的研究中得出了这个结论。例如,在给定100本爱情小说的情况下,根据模型存储的关于这个流派的内容,哪本小说最“典型”,哪本小说最不“典型”?

有趣的是(同时也令人沮丧的是),Balázs Kovács教授和Gaël Le Mens教授在他们自己的研究中花了多年的时间开发了一个BERT变种模型,就在他们即将发表时,ChatGPT问世了,并且在许多方面几乎完全复制了他们的工作。“你可能会哭”,Le Mens在一份新闻稿中表示。但好消息是,这个新的人工智能和他们调整过的旧模型都表明,确实可以通过这种类型的系统在数据集中识别出典型和非典型的内容,这个发现可能在未来有所帮助。两位教授指出,尽管ChatGPT在实践中支持了他们的论点,但其封闭的性质使科学上的研究工作变得困难。

宾夕法尼亚大学的科学家们正在研究另一个奇特的概念来予以量化:常识。通过让数千人对诸如“因果循环”或“不要食用过期食品”等陈述进行评级,以衡量它们的“常识性”。并不奇怪的是,虽然出现了一些模式,但在群体层面上并没有被广泛认可的信念。

“我们的研究结果表明,每个人对常识的理解可能因人而异,使得这个概念比人们预期的更为独特,”主要作者马克·惠廷表示。为什么这个问题会出现在人工智能的新闻通讯中呢?因为就像几乎所有其他事物一样,看似“简单”的常识,实际上并不简单!然而,通过这种方式进行量化,研究人员和审计员或许能够评估人工智能具备多少常识,或者它与哪些群体和偏见相契合。

说到偏见,许多大型语言模型在吸收信息时非常随意。这意味着如果你给它们一个正确的提示,它们可能会以冒犯、错误或两者兼而有之的方式进行回应。拉蒂莫是一家初创公司,旨在通过设计更具包容性的模型来改变这种情况。

虽然关于他们的方法没有太多具体细节,但拉蒂默表示,他们的模型使用了检索增强生成技术(被认为可以改进回答),并使用了许多独特的授权内容和来自许多通常不在这些数据库中代表的文化的数据。因此,当你询问某件事时,模型不会回溯到19世纪的专著来回答你。当拉蒂默发布更多信息时,我们将了解更多关于这个模型的内容。

Chat中文版

然而,有一件事情AI模型绝对能做到,那就是种树。虚拟的树。普渡大学数字林业研究所的研究人员(我希望能在那里工作,给我打电话)开发出了一个超紧凑的模型,能够逼真地模拟一棵树的生长过程。这是一个看似简单却并非如此的问题;如果你制作游戏或电影,可以模拟树木的生长过程,但对于严肃的科学研究呢?主要作者Bedrich Benes表示:“尽管AI似乎在越来越多的领域中普及,但迄今为止,它在与自然无关的3D几何模拟方面取得了极大的成功。”

他们的新模型只有大约一兆字节,对于一个人工智能系统来说,这是非常小的。但当然,DNA甚至更小更密集,它把整个树从根到枝编码了起来。这个模型仍然以抽象的方式工作——它绝非自然界的完美模拟——但它确实表明,树木生长的复杂性可以通过相对简单的模型进行编码。

最后一个是来自剑桥大学研究人员的机器人,它可以比人类更快地读取盲文,准确率为90%。为什么这样做呢?实际上,它不是用来供盲人使用的 - 团队决定这是一个有趣且易于量化的任务,用来测试机器人指尖的灵敏度和速度。如果它能通过扫描盲文来读取,那就是个好迹象!你可以在这里阅读更多关于这个有趣方法的信息。或者观看下面的视频:

推荐阅读

欧盟的AI法案迈过了通往通过的最后一道大关

2024-02-022541
Chat中文版

在第四季度,云基础设施的收入增长达到历史最高水平

2024-02-02261
Chat中文版

苹果表示它将于今年晚些时候展示其人工智能技术成果

2024-02-02873
Chat中文版

随着Podcastle筹集到1350万美元,其创始人将其归功于亚美尼亚的“迷你硅谷”中基于AI的增长

2024-02-022533
Chat中文版

著名投资者伊拉德·吉尔和郭晓彤就资助人工智能技术的风险和收益表示:“短期来看,对我们最大的威胁是其他人。”

2024-02-021049
Chat中文版