本周人工智能新闻:生成式人工智能正在垃圾邮件式地充斥学术期刊

AI7号2024-06-19990

Chat中文镜像

大家好,欢迎阅读TechCrunch的人工智能通讯。

本周在人工智能领域,生成式人工智能开始在学术出版中滥发垃圾信息 —— 这是虚假信息传播领域一个令人沮丧的新动向。

在Retraction Watch的一篇文章中,这是一个追踪学术研究最新撤稿的博客,哲学助理教授Tomasz Żuradzk和Leszek Wroński写道,Addleton Academic Publishers出版的三本期刊似乎全都是由人工智能生成的文章组成。

这些期刊包含了遵循相同模板的论文,满是“区块链”、“元宇宙”、“物联网”和“深度学习”等时髦词汇。它们列出了相同的编辑委员会成员名单,其中有10名成员已经过世,并且在纽约皇后区的地址很普通,看起来像是一座住宅。

你可能会问:这有什么大不了的?浏览由人工智能生成的垃圾内容只是如今在互联网上做生意的成本吗?

嗯,是的。但是这些假期刊向人们展示了如何轻松地操纵用于评估研究人员晋升和招聘的体系,这可能成为其他行业知识工作者的风向标。

在至少一个广泛使用的评估系统CiteScore上,这些期刊在哲学研究中排名前十。这是怎么可能的?它们相互广泛引用彼此。(CiteScore在计算中考虑引用文献。)Żuradzk和Wroński发现,在Addleton的一本期刊中有541次引用,其中208次来自该出版商的其他虚假出版物。

“这些排名经常作为大学和资助机构衡量研究质量的指标,” Żuradzk 和 Wroński 写道。“它们在学术奖励、聘用、晋升的决策中起着关键作用,因此可能会影响研究人员的出版策略。”

有人可能会认为CiteScore是问题所在——显然它是一个有缺陷的指标。这样的观点并非毫无道理。但同样也不错的观点是说,生成式人工智能及其滥用正在以意想不到的方式扰乱着人们生计所依赖的系统,可能会造成相当大的破坏。

未来会有一种可能性,即生成式人工智能会迫使我们重新思考和重塑诸如CiteScore这样的系统,使其更加公平、全面和包容。更为严峻的另一种可能性——也是目前正在上演的——是生成式人工智能继续肆虐,制造混乱,毁掉专业生活。

希望我们能尽快纠正错误的方向。

新闻

DeepMind的配乐生成器:DeepMind是谷歌的人工智能研究实验室,称正在开发人工智能技术,用于为视频生成配乐。DeepMind的人工智能会根据配乐描述(例如“水母在水下脉动,海洋生物,海洋”)以及视频内容,创作符合视频人物和情感的音乐、音效,甚至对话。

东京大学的研究人员开发并训练了一台名为武藏的“肌肉骨骼人形机器人”来驾驶一辆小型电动车穿越测试赛道。武藏配备了两个摄像头,代替人类的眼睛,可以“看到”前方的道路以及车辆侧镜反射出的景色。

一款新的人工智能搜索引擎: Genspark是一款新的人工智能搜索平台,利用生成式人工智能根据搜索查询编写定制摘要。目前已从投资者那里筹集了6000万美元,包括蓝池创投;公司上一轮融资后的估值为2.6亿美元,这是一个令人尊敬的数字,因为Genspark将与Perplexity等竞争对手竞争。

ChatGPT的费用是多少?ChatGPT是由OpenAI开发的不断扩展的人工智能聊天机器人平台,它的费用是多少?这比你想象的要难回答。为了跟踪不同的ChatGPT订阅选项,我们已经准备了一份ChatGPT定价的更新指南。

本周的研究论文

自动驾驶汽车面临着无数种不同情况,这取决于地点和情况。如果你在双车道路上,有人打开左转向灯,这意味着他们要换车道吗?还是你应该超越他们?答案可能取决于你是在I-5还是在德国的高速公路上。

英伟达、南加州大学、华盛顿大学和斯坦福大学的研究人员在最近发表在CVPR上的一篇论文中表明,许多模糊或不寻常的情况可以通过让人工智能阅读本地驾驶手册来解决。

他们的大语言驾驶助手或LLaDa使LLM能够访问一个州、国家或地区的驾驶手册,甚至无需进行微调。文献中包含了当地的规定、习俗或标志,当出现意外情况时,比如按喇叭、高亮灯或一群羊时,系统会生成适当的行动(靠边停车、停下来、还击)。

这绝不是一个完全的端到端驾驶系统,但它展示了一条通往“通用”驾驶系统的替代路径,该系统仍然会遇到一些意外。也许这是让我们知道在陌生地方被按喇叭的原因的一种方式。

本周模特

周一,专注于为电影和图像内容创作者打造生成AI工具的公司Runway推出了Gen-3 Alpha。Gen-3通过对来自公共和内部来源的大量图像和视频进行训练,可以根据文本描述和静态图像生成视频片段。

Runway表示,Gen-3 Alpha在生成速度和保真度方面比Runway以前的旗舰视频模型Gen-2有了“重大”改进,并且可以对其创建的视频的结构、风格和运动进行精细控制。Runway称,Gen-3还可以定制以实现更“风格控制”和一致的角色,以满足“特定的艺术和叙事要求”。

Gen-3 Alpha存在一些限制,包括它的视频最多只能拍摄10秒。然而,Runway的联合创始人Anastasis Germanidis承诺,这只是下一代模型家族中的第一个视频生成模型,该家族是在Runway升级基础设施上训练的。

最近几个月出现了几种生成视频系统,其中Gen-3 Alpha只是其中最新的一个。其他还包括OpenAI的Sora,Luma的Dream Machine和Google的Veo。它们共同威胁着颠覆我们所知道的电影和电视行业 —— 前提是它们能够战胜版权挑战。

混合袋

人工智能将不会接下你下一次麦当劳的订单。

麦当劳本周宣布,将从100多家餐厅中撤下自动点餐技术,这项快餐连锁店已经测试了近三年。这项技术是与IBM共同开发的,在餐厅的汽车外卖窗口安装的。去年,这项技术因其倾向于误解顾客并犯错误而迅速走红。

Takeout最近的一篇报道表明,人工智能正普遍失去对快餐经营者的控制力,不久前,他们对这项技术及其潜力提高效率(和降低劳动成本)表示了热情。Presto是AI辅助驾驶通道领域的重要参与者,最近失去了主要客户Del Taco,并面临越来越严重的损失。

问题在于不准确。

麦当劳首席执行官克里斯·肯普辛斯基(Chris Kempczinski)在2021年6月告诉CNBC,他们的语音识别技术大约85%的时间是准确的,但人员需要协助大约五分之一的订单。与此同时,根据The Takeout的报道,Presto系统的最佳版本仅能完成大约30%的订单,没有人员的帮助。

因此,虽然人工智能正在摧毁零工经济的某些领域,但似乎一些工作 — 尤其是那些需要理解各种口音和方言的工作 — 是无法被自动化取代的。至少目前是这样。