泰勒·斯威夫特深度伪造事件令人沮丧且本可以预防

AI7号2024-01-31274

Chat中文版

当你同时惹怒了白宫、年度时代人物以及流行文化最狂热的粉丝群时,你知道你已经搞砸了。上周,这就发生在了亚马逊创办的X平台(之前叫做Twitter),因为泰勒·斯威夫特的人工智能生成的深度伪造色情图片在网络上迅速传播。

在非同意的情况下,有关明显伪造深度假图的文章被浏览了4500多万次,获得了数十万个赞。这还不包括所有转发图像到其他帖子的账号数量——一旦图像被如此广泛传播,基本上是无法删除的。

X缺乏能够快速准确识别滥用内容的基础设施。即使在Twitter时代,这个问题也很难解决,但自从马斯克减少了Twitter的员工数量,包括其大部分可信和安全团队后,情况变得更糟了。因此,泰勒·斯威夫特庞大且热情的粉丝群开始自己动手,通过大量搜索“泰勒·斯威夫特人工智能”和“泰勒·斯威夫特深度伪造”等查询关键词,使用户难以找到滥用图片。与此同时,白宫新闻秘书呼吁国会采取行动,X仅仅禁止了几天搜索词“泰勒·斯威夫特”。当用户搜索这位音乐人的名字时,会看到一个错误提示。

这次内容审查的失败成为了一个全国性的新闻故事,因为泰勒·斯威夫特就是泰勒·斯威夫特。但如果社交平台都无法保护世界上最著名的女性之一,他们还能保护谁呢?

“如果你经历了泰勒·斯威夫特经历的事情,就像很多人一样,很可能你不会得到同样数量的支持,基于你的影响力,这意味着你无法获得这些非常重要的关怀社群的支持。” 英国诺森伯利亚大学数字公民中心的卡罗琳娜·阿尔博士告诉TechCrunch。 “在这些情况下,大多数用户不得不求助于这些关怀社群,这真的揭示了内容审核的失败。”

禁止搜索词“泰勒·斯威夫特”就像在爆管上贴一张胶带。有很多明显的变通方法,就像TikTok用户搜索“seggs”而不是性爱一样。搜索屏蔽只是X公司为了装样子而实施的措施,但它无法阻止人们只是搜索“T Swift”。Copia研究所和Techdirt创始人迈克·马斯尼克称这一努力为“一种过度使用的信任与安全的铁锤方法”。

阿尔说:“当涉及到给予妇女、非二元人和酷儿人对自己身体的掌控权时,平台的情况十分糟糕,因此它们复制了线下的虐待和父权体制。如果你的审核系统无法在危机时及时发起反应,或者无法在用户报告出现问题时及时满足用户的需求,这就是一个问题。”

那么,为了防止泰勒·斯威夫特事件,X应该做些什么呢?

艾尔斯作为她研究的一部分提出了这些问题,并建议社交平台对待内容管理进行彻底改革。最近,她与来自全球受审查和滥用影响的45名互联网用户进行了一系列圆桌讨论,以向这些平台提出改变的建议。

一项建议是社交媒体平台应对个人用户在账户或对其他账户的举报方面做出更透明的解释。

“即使平台有权限访问这些材料,你却无权访问案件记录,因为它们不愿意公开。” 阿尔说:“对于滥用问题,我认为人们需要更个性化、具体化和快速的回应,其中包括至少直接沟通,要不就面对面帮助。”

本周,X宣布将雇佣100名内容审核员在位于得克萨斯州奥斯汀的一个新的“信任和安全”中心工作。然而,在马斯克的领导下,该平台并未为保护被边缘化用户免受滥用设立一个强有力的先例。相信马斯克也会让人感到困惑,因为这位大亨一直以来并未兑现承诺的长期纪录。当他第一次购买Twitter时,马斯克宣布在做出重大决定之前会成立一个内容审核委员会,然而这一承诺没有实现。

在AI生成的深度伪造案例中,责任不仅仅落在社交平台上,还落在那些创造面向消费者的生成式人工智能产品的公司身上。

根据404媒体的调查,对斯威夫特的辱骂描绘是来自一个专门制作非自愿、露骨的深度伪造视频的Telegram群组。该群组的用户通常使用微软设计师,并借助OpenAI的DALL-E 3生成基于输入提示的图像。微软已经解决了一个漏洞,用户可以通过编写提示词,例如“泰勒‘歌手’斯威夫特”或“詹妮弗‘演员’安妮斯顿”来生成名人的图像。

微软的首席软件工程师主管Shane Jones给华盛顿州总检察长写了一封信,称他在去年12月发现了DALL-E 3的漏洞,这使得“绕过了一些旨在防止该模型生成和传播有害图像的安全保护措施“成为可能。

琼斯警告了微软和OpenAI公司关于这些漏洞,但是两个星期过去了,他没有得到任何问题得到解决的指示。所以,他在领英上发表了一封公开信,敦促OpenAI暂停DALL-E 3的使用。琼斯将他的信告知了微软,但很快被要求撤下该信。

“我们需要追究公司对其产品安全性的责任,并对公众披露已知风险负起责任,”琼斯在给州检察长的信中写道。“像我这样关心的员工不应被威胁以保持沉默。”

随着全球最具影响力的公司大力发展人工智能,各平台需要采取主动措施来管理滥用内容,但即使在制作名人换脸视频还不那么便捷的时代,违规行为仍然可以轻易地规避审查。

“这真的向我们展示了平台的不可靠,”阿尔说道。“边缘化社区需要更加信任他们的追随者和其他用户,而不是那些在技术上负责我们在线安全的人。”

推荐阅读

现在,ChatGPT用户可以直接在聊天中调用GPT

2024-01-302847
Chat中文版

Studio的新线上音乐学校利用人工智能来创建个性化课程

2024-01-302727
Chat中文版

Kore.ai是一家为企业构建对话式人工智能的初创公司,共获得1.5亿美元融资

2024-01-30673
Chat中文版

Semron希望用“记忆电容器”替代芯片晶体管

2024-01-30631
Chat中文版

短波电子邮件客户端将自动显示由人工智能提供的摘要

2024-01-302543
Chat中文版