谷歌希望在几周内解决双子座历史图像多样性问题
谷歌很有希望很快就能够重新启用其多模式生成AI工具Gemini展示人物的能力,DeepMind创始人Demis Hassabis表示。他今天表示,对于请求人类形象的功能将在“接下来几周”恢复在线。
上周用户指出该工具生成的历史不符合的图像,如将美国开国元勋描绘成一群多元化的人群,而不仅仅是白人男性,因此谷歌暂停了Gemini功能。
哈萨比斯正在巴塞罗那举行的世界移动通信大会上接受采访时回答了有关产品问题的疑问。
在被主持人问及Wired(《连线》)的Steven Levy如何解释图像生成功能出现问题时,Hassabis绕过了详细的技术解释。相反,他暗示问题是由于谷歌未能识别用户基本上是在寻找他所描述的“通用描绘”。他还说,这个例子指向了“随着先进人工智能而出现的微妙之处”。
这是一个我们都在努力应对的领域。所以,举个例子,如果你设置一个提示,要求给我一个走狗的人或医院里的护士的图片,对吧,在这种情况下,显然你想要一种‘普遍描绘’。特别是考虑到作为谷歌,我们为200多个国家提供服务,你知道,全世界的每个国家 — 所以你不知道用户来自哪里,他们的背景是什么或者处于什么情境。所以你想要展示一种非常普遍的可能性范围。
哈萨比斯表示,问题归结为“本意良好的特性”——即在双子座的图像输出中促进多样性——被“过于简单地应用在所有方面”。
他补充说,要求有关历史人物方面内容的提示“当然”应该导致“比你提供的更窄的范围”,暗示了Gemini将来可能如何应对有关人物的提示。
当然,我们很在意历史的准确性。所以我们已经将该功能下线,待修复好后会再次上线。我们希望在接下来的几周内很快恢复在线。
在回答如何防止生成式人工智能工具被坏分子利用的后续问题时,比如那些试图传播宣传的专制政权,哈萨比斯并没有简单的答案。他指出这个问题“非常复杂”,可能需要整个社会的动员和回应来确定并强制执行限制。
有一项非常重要的研究和讨论需要进行 - 不只是科技公司,还有公民社会和政府。这是一个涉及每个人的社会技术问题,应该让每个人参与讨论。我们希望这些系统具有什么价值观?它们应该代表什么?如何防止不良分子访问相同的技术,并且,正如你所说的,重新利用它们用于未被这些系统的创造者预期的有害目的。 (Note: 本答复已经采用合适的中国大陆表达方式)
谈到开源通用人工智能模型的挑战,谷歌也推出了这类模型。他补充道:“用户想要使用完全可控的开源系统... 但接下来的问题是,如何确保随着这些系统越来越强大,其下游使用不会产生危害?
我认为,今天这不是一个问题,因为这些系统仍然相对新生。但如果你向前推进三、四或五年,开始谈论下一代具备规划能力、能够在世界上行动、解决问题和目标的系统,我认为社会真的必须认真思考这些问题——如果这种技术蔓延开来会发生什么,然后从个人到流氓国家的坏人也可以利用它们。
在采访中,哈萨比斯还被问及对人工智能设备的看法,以及随着生成式人工智能不断推动新的发展,移动市场可能走向何方。他预测即将出现一波“下一代智能助手”,这些助手在人们日常生活中非常实用,而不再是之前人工智能助手时代的“花哨”的东西,这可能会重新塑造人们选择携带在身上的移动硬件。
他认为,未来人们可能会对选择什么样的设备类型提出疑问。但是五年后,手机是否真的会成为完美的形态?也许我们需要眼镜或者其他一些设备,这样人工智能系统才能更好地了解你所处的环境,并在日常生活中更加有帮助。因此,我认为还有许多令人惊奇的东西等待发明。