谷歌在法国遭到2.7亿美元罚款,因为监管机构发现新闻出版商的数据被用于 Gemini

AI7号2024-03-20360

Chat中文版

在谷歌和法国竞争管理机构之间永无止境的关于新闻摘要版权保护的争端中,周三,法国竞争管理机构宣布对这家科技巨头罚款2.5亿欧元(约合今天汇率下的2.7亿美元)。

根据竞争监管机构的说法,谷歌忽略了与新闻发布商的一些之前的承诺。但这个决定尤其引人注目,因为它放弃了另一项与时俱进的做法 - 利用新闻发布商的内容来训练其生成式AI模型Bard/Gemini。

竞争监管机构发现,谷歌未能通知新闻出版商其使用他们的受版权内容进行GenAI技术。这是考虑到谷歌早前作出的承诺,旨在确保与出版商就再利用其内容进行公平付款谈判。

版权和竞争违法行为

2019年,欧盟通过了一项全欧数字版权改革,将版权保护范围扩大至新闻标题和摘要。之前,新闻聚合网站,比如谷歌新闻、发现功能和搜索结果页面上的“头条新闻”功能,会擅自展示这些新闻内容,但没有提供任何经济赔偿。

谷歌最初试图通过在法国关闭Google新闻来规避法律。但竞争管理机构迅速介入,发现其单方面行动是滥用垄断市场地位,可能对出版商造成伤害。干预实质上迫使谷歌与当地出版商就内容再利用达成协议。但在2021年,竞争管理机构发现谷歌在与当地出版商和机构谈判中存在重大违规行为,向谷歌开出了5.92亿美元的罚款。

这家科技巨头称这项制裁“不成比例”,表示将上诉。但随后试图解决争端 - 提供一系列承诺并撤回上诉。法国当局接受了这些承诺,包括向出版商提供关键信息并以公平方式进行谈判。

谷歌已与法国数百家出版商签订版权协议,这些出版商在与法国竞争局达成协议范围之内。因此,它在这一领域的业务受到非常严格的监管。

无上诉

谷歌已同意不再对Autorité最新的调查结果提出异议 - 作为快速程序和支付资金的交换。

然而,该公司新闻和出版合作伙伴业务的总经理苏利娜·康纳尔却表达了不满的情绪-在一篇长篇博客中写道,该机构提出的问题与罚款不成比例。

这篇博客文章暗示谷歌这次真的想为这场风波画上句号。康内尔也写道:"我们达成和解是因为现在是时候继续前进了,正如我们与许多出版商的协议所表明的,我们希望专注于可持续的方法,将人们与优质内容联系起来,并与法国的出版商进行建设性的合作。"

随着生成式人工智能的出现,以及竞争激烈的推出工具的急速行动,谷歌在处理内容重复利用问题时的计算方式看起来有所不同。

在这个框架中进行GenAI训练

今天法国竞争管理机构的执法显示,其集中关注谷歌利用新闻出版商和机构的内容来训练其人工智能基础模型以及相关的人工智能聊天机器人服务巴德(现在称为杰米尼)。

根据谷歌的新闻发布稿,该公司在2023年7月发布了生成式AI工具Bard,发现其使用了出版商和新闻机构的内容进行训练,但未通知版权所有者或相关部门。

就这一点而言,谷歌的辩护有两方面。在其博客文章中写道,竞争当局“并没有质疑网络内容如何被利用来改进像生成式人工智能这样的新产品,这已经在欧盟版权指令的第4条中得到解决”。

版权指令第4条规定了“对文本和数据挖掘的例外或限制” - 具体用于“合法获取作品和其他主题的再现和抽取,用于文本和数据挖掘的目的”。

然而,在其新闻稿中,法国《竞争委员会》认为尚未确定这种豁免是否适用于这里。值得注意的是,相关条款涉及“合法可获取的作品” - 而谷歌根据法律约束承诺通知版权所有者其受保护作品的使用情况,而在这种情况下显然未能做到。

竞争管理机构写道:“当涉及宣称使用新闻内容来训练人工智能服务是否属于邻近权和保护时,这个问题还没有得到答复。然而,Autorité认为谷歌违反了其承诺#1,未能通知出版商他们的内容已被用来训练巴德。”

谷歌的博客文章也简要提到了欧盟人工智能法案,暗示这是相关的。然而,该立法尚未生效,因为尚待欧洲理事会最终通过。

未来的人工智能立法还将规定开发人员必须遵守该集团的版权规定。为了达到这个目的,它引入了透明度要求 - 要求他们制定一项尊重欧盟版权法的政策,并公开发布用于训练通用人工智能模型(如Gemini/Bard)的“足够详细摘要”。

未来,对模型制造商发布培训数据摘要的要求可能会让那些受保护内容被GenAI培训吸收的新闻发布商更容易根据欧盟版权法获取公平报酬。

不能选择技术退出。

法国竞争管理局还指出,谷歌未能提供直到2023年9月28日为止的技术解决方案,以允许出版商和新闻机构选择不使用他们的内容来训练Bard,而这样的决定又不会影响他们的内容在谷歌其他服务中的显示。

直到现在,希望选择退出此使用情况的出版商和新闻机构不得不插入一项指令,以阻止谷歌对所有内容进行索引,包括搜索、发现和谷歌新闻服务。这些服务是与邻近权利相关的收入谈判的具体部分。”文章补充说:“未来,法国竞争局将仔细审查谷歌的选择退出流程的效果”。

更加技术化地说,在2023年7月至9月期间,新闻发布者可以在robots.txt文件中插入“noindex”标签,以确保其内容不被用来训练Google的人工智能模型。这个robots.txt文件位于网络服务器的根目录下,包含各种对搜索引擎的指令。Google的网络爬虫会查看这些文件中的指令来对网站进行索引。

但是,“noindex”标记意味着你的网站完全消失在谷歌搜索结果中。2023年9月,谷歌增加了更多精细化的规则,并创建了一个与“noindex”规则不同的“Google-Extended”规则。选择不参与谷歌扩展指令的网站发布者表明他们不想帮助改进Gemini的当前和未来模型。

其他缺点

法国竞争管理局还因为Google在与法国新闻出版商谈判时未能提供所有必要信息,以确保公平谈判内容的报酬,对谷歌进行了制裁。

在其新闻公布中,它写道谷歌向发布商提供的有关计算他们应被支付多少的方法论“尤为模糊不清”。

它还发现谷歌未能满足非歧视标准,旨在确保发布者获得平等对待。并指出谷歌做出了强制要求“最低门槛”来确定补偿的决定 - 即低于这一门槛谷歌将不向发布者支付任何费用 - 欧洲竞争当局将此称为引入发布者之间的歧视“在其本质上”。它的新闻稿还指出,在某一门槛以下,所有发布者“被随意分配为零报酬,而不考虑他们各自的情况”。

另外,法国竞争管理局指责谷歌在所谓的“间接收入”方面的计算存在问题,称其提出的“方案”与之前的决定或2020年10月法庭的上诉判决不符。

它还表示,谷歌未能履行更新报酬合同的承诺。

推荐阅读

Astera Labs的首次公开募股将揭示投资者对人工智能的需求有多高

2024-03-19254
Chat中文版

NVIDIA公司的黄仁勋表示,人工智能的幻觉问题是可以解决的,人工智能普遍智能还有5年才会实现

2024-03-191224
Chat中文版

微软聘请了Inflection创始人来管理新的消费者人工智能部门

2024-03-191392
Chat中文版

英伟达和高通加入开放源机器人联盟,支持ROS开发

2024-03-192189
Chat中文版

筹集了13亿美元之后,Inflection被其最大的投资者微软扼杀

2024-03-192432
Chat中文版