Reddit表示迄今为止已经通过授权数据赚取了2.03亿美元

Chat中文版

Reddit向股市上市的前景更多地取决于与AI供应商，如OpenAI等的关系，这点远比人们想象的要重要。

在今天提交给美国证券交易委员会的IPO招股书中，Reddit反复强调了它认为通过与训练AI模型的公司达成的数据许可协议，它可以获得多少好处，也已经从中获益多少。Reddit拥有超过10亿帖子和超过160亿评论。

“2024年1月，我们与某些数据许可安排达成协议，总合同价值为2.03亿美元，合同期为两至三年，”招股说明书中写道，“预计2024年12月31日结束的年度将认定至少6,640万美元的收入，其余款项将在其后确定。”

目前，有关哪些人工智能供应商正在从Reddit获得数据，仍然是一个谜。本周早些时候，彭博社和路透社报道说，一家“未具名的大型人工智能公司”——可能是谷歌——已达成一项价值约6千万美元的年度许可协议。但OpenAI也不会是一个令人惊讶的客户，尤其是考虑到OpenAI首席执行官萨姆·阿尔特曼持有Reddit 8.7%的股份（他是第三大股东），曾经是该公司董事会成员。

为什么Reddit的数据很有价值？正如Reddit解释的那样，AI模型通过例子“学习”，从而创作文章、代码、电子邮件、文章等等，像OpenAI这样的供应商会从网上搜集数百万到数十亿个这样的例子，以加入到他们的训练集中。有些例子是公共领域的，而有些则不是，或者像Reddit的内容那样，受到需要引用或特定形式补偿的限制性许可。

Reddit以前并没有为人工智能训练目的限制其数据的获取。但去年改变了态度，认为其数据不应该免费提供给CEO史蒂夫·赫夫曼所说的“世界上一些最大的公司”。

“我们的数据API能够提供对体育、电影、新闻、时尚和最新趋势等不断变化和动态话题的实时访问，”招股说明书继续说道。“我们相信Reddit庞大的对话数据和知识库将继续在训练和改进大型语言模型方面发挥作用。随着我们的内容每天更新和增长，我们预计模型将希望反映这些新思维，并使用Reddit数据更新他们的训练。”

从库存媒体库到新闻出版商，内容生产者越来越倾向于与AI供应商签订数据许可协议，因为像OpenAI的ChatGPT和谷歌的Gemini这样的聊天机器人会威胁到流量。《大西洋月刊》最近的一个模型发现，如果谷歌这样的搜索引擎将AI整合到搜索中，它会在不要求用户点击其网站的情况下，75%的时间内回答用户的查询。

供应商们受到诉讼的威胁，他们被迫寻求许可协议，因为他们面临着一系列诉讼，指控他们未经许可或支付就在数据上训练模型没有法律依据。最近，纽约时报指责 OpenAI 利用其作品有效地建立与新闻发布商竞争，损害了其业务。

OpenAI已经与图库Shutterstock以及出版商Axel Springer达成协议。Axel Springer是Politico和Business Insider的所有者。然而，据报道，这些许可证金额相对较小，每年最高为500万美元。

推荐阅读

稳定扩散3已经到来，巩固了在AI图像方面对索拉和双子的早期领先优势

稳定人工智能宣布推出稳定扩散3，这是该公司最新和最强大的图像生成人工智能模型。尽管详细信息有限，但显然这是为了抵制最近由OpenAI和谷歌宣布的竞争对手所带来的炒作。我们很快将对所有这些进行更详细的技术分析，但现在您应该……

2024-02-221962

Chrome将推出一款由Gemini技术驱动的内置人工智能写作工具

谷歌浏览器今天推出了新的人工智能写作生成器。从根本上说，这款由Gemini驱动的工具本质上就是Gmail现有的“帮我写”功能，但扩展到整个网络，并由谷歌最新的Gemini人工智能模型驱动。该公司在一月份首次宣布了这一新工具，目前仍在…

2024-02-22779

谷歌暂停AI工具Gemini生成人物图像的能力，因为存在历史不准确性

谷歌表示，他们已经暂时暂停了其旗舰生成式人工智能模型Gemini生成人物图像的能力，目的是在更新技术并改善涉及人类描述的历史准确性。公司在社交媒体平台X上发布了一篇帖子，宣布他们正在努力完善技术，然后再恢复该功能。

2024-02-22667

DatologyAI正在开发技术，自动筛选人工智能训练数据集

海量训练数据集是强大 AI 模型的入口 — 但往往也是这些模型的崩溃源。偏见来自于隐藏在大型数据集中的偏见模式，比如在图像分类集中大部分是白人 CEO 的照片。而大数据集可能是凌乱的，采用模型难以理解的格式 […]

2024-02-221197

人工智能领域的女性：Krystal Kauffman，分布式人工智能研究所的研究员

为了给以人工智能为重点的女性学者和其他人应有的、并且有些过分被忽视的关注，TechCrunch 推出了一系列访谈，聚焦那些为人工智能革命做出贡献的杰出女性。随着人工智能热潮的持续，我们将在整个年度发布多篇文章，突出那些经常被忽略的重要工作。阅读更多...

2024-02-222813