本周人工智能动态：生成AI及对创作者补偿的问题

Chat中文版

跟上人工智能这个快速发展的行业是一项艰巨的任务。因此，在有一天人工智能可以为您完成这项任务之前，这里提供了最近机器学习领域的新闻概要，以及我们没有单独报道的重要研究和实验。

顺便说一下 — TechCrunch计划很快推出一份人工智能新闻简报。敬请关注。

本周在人工智能领域，由投资巨头奥尔登环球资本所有的八家知名美国报纸，包括《纽约每日新闻》、《芝加哥论坛报》和《奥兰多哨兵报》，分别对 OpenAI 和微软提起诉讼，指控侵犯版权，涉及公司使用生成式人工智能技术。他们，就像《纽约时报》就 OpenAI 提起的持续诉讼一样，指责 OpenAI 和微软未经许可或补偿而擅自获取并利用它们的知识产权来构建和商业化生成式模型，如 GPT-4。

弗兰克·派恩，管理奥尔登报纸的执行编辑，在一份声明中表示：“我们在我们的出版物上花费了数十亿美元搜集信息和报道新闻，我们不能允许OpenAI和微软扩大窃取我们工作以发展自己业务的大科技手册。”

考虑到OpenAI与出版商的现有合作关系以及其不愿将整个商业模式放在公平使用论点上，这场诉讼很可能最终以和解和许可协议告终。但是对于其他内容创作者来说，他们的作品被用于模型训练却没有得到报酬，又该如何处理？

OpenAI似乎在考虑这个问题。

该框架评估训练数据集中的内容（例如文本、图像或其他数据）对模型生成的影响程度，采用了博弈论概念中的沙普利值。然后，根据此评估确定内容所有者的“合法份额”（即补偿）。

假设你有一个图像生成模型，训练使用四位艺术家的作品：约翰，雅各布，杰克和杰比达。你让它以杰克的风格画一朵花。通过这个框架，你可以确定每位艺术家的作品对模型生成的艺术作品的影响，从而确定每个人应该得到的补偿。

然而，这个框架存在一个缺点——计算成本很高。研究人员的解决方法依赖于对补偿的估计而不是精确计算。这能让内容创作者满意吗？我不太确定。如果OpenAI有一天真的付诸实践，我们肯定会找出答案。

以下是最近几天其他一些值得关注的人工智能故事：

微软重申禁止使用面部识别技术：Azure OpenAI 服务的条款中增加了禁止美国警察部门使用面部识别技术的语言，这是微软对 OpenAI 技术的全面管理。
AI原生初创公司的特点：AI初创公司面临着与您典型的软件即服务公司不同的一组挑战。这是来自Glasswing Ventures的创始人兼管理合伙人Rudina Seseri在上周波士顿的TechCrunch早期活动上的信息；Ron有完整报道。
人本公司推出了一项商业计划：人本公司推出了针对企业的新付费计划，同时推出了新的iOS应用。Team — 企业计划 — 为客户提供了更高优先级的访问权限，可以使用人本公司的Claude 3系列生成式AI模型，并提供额外的管理员和用户管理控制。
代码之声已经不再存在了：亚马逊的代码之声现在已经成为Q Developer，是亚马逊面向商业的生成式人工智能聊天机器人家族Q的一部分。通过AWS可用，Q Developer帮助开发者在日常工作中执行一些任务，比如调试和升级应用程序，就像代码之声一样。
刚刚走出沃尔玛旗下的山姆会员商店：山姆会员商店表示，他们将利用人工智能来加快“退出技术”进程。现在，在某些门店，山姆会员商店的顾客在离开时无需再让店员核对购物清单和收据。那些在收银台或通过“扫描购”移动应用付款的顾客现在可以直接走出门店，而无需再次核对购物清单。
自动捕鱼：捕鱼是一项本质上混乱的业务。Shinkei 正在努力改进，并通过自动化系统更加人道和可靠地处理鱼类，Devin报道可能会带来完全不同的海鲜经济。
Yelp的人工智能助手：Yelp本周宣布推出了一个新的AI聊天机器人，旨在帮助消费者与相关企业联系——该机器人采用了OpenAI模型，可以帮助他们完成任务（比如安装灯具、升级室外空间等）。该公司正将这一AI助手推出至其iOS应用的“项目”选项卡下，计划在今年晚些时候扩展到Android平台。

更多的机器学习。

Chat中文版

听起来阿贡国家实验室这个冬天举办了一场盛大的派对，他们邀请了一百位人工智能和能源领域的专家讨论快速发展的技术如何对国家基础设施和该领域的研发有所帮助。最终的报告或多或少符合你对那个群体的期望：很多空中楼阁的设想，但仍然富有启发性。

看到核能、电网、碳管理、能量储存和材料这些领域，这次聚会上浮现出的主题是，首先，研究人员需要获得高性能计算工具和资源；其次，学会识别模拟和预测的弱点（包括第一点所实现的）；第三，需要AI工具可以整合多个来源和多种格式的数据并使其可访问。我们已经看到工业各个领域中以各种方式发生着这些事情，所以这并不是什么大惊喜，但是在联邦层面没有几位专家发布文件的话什么都不会发生，所以把这记录下来是件好事。

佐治亚理工学院和美塔公司正在致力于利用一项名为OpenDAC的新大型数据库的一部分，该数据库包含大量反应、材料和计算，旨在帮助科学家设计更易于进行碳捕集过程的过程。它专注于金属有机框架，这是一种有前途和受欢迎的碳捕集材料类型，但却存在成千上万的变种，这些变种尚未得到彻底测试。

乔治亚理工团队与橡树岭国家实验室和美团的FAIR合作，模拟了这些材料上的量子化学相互作用，使用了大约4亿个计算小时，远远超出了一所大学能够轻松动员的范围。希望对从事这一领域研究的气候研究者有所帮助。这一切都在这里有记录。

我们经常听说人工智能在医疗领域的应用，尽管大多数都是在所谓的咨询角色中，帮助专家发现他们可能没有注意到的东西，或者发现技术人员可能需要花几个小时才能找到的模式。这部分原因是因为这些机器学习模型只是在统计数据之间找到连接，而没有理解是什么引起或导致了这些现象。剑桥大学和慕尼黑路德维希-马克西米利安大学的研究人员正在研究这一点，因为超越基本的相关关系对于创建治疗计划可能会有很大帮助。

由慕尼黑大学的斯特凡·福罗格尔教授领导的这项工作旨在建立能够识别因果机制而非仅仅相关性的模型：“我们向机器提供识别因果结构和正确形式化问题的规则。然后机器必须学会识别干预效果并理解，可以说，现实生活的后果如何在输入计算机的数据中得以体现，”他说。对于他们来说，现在仍处于早期阶段，他们也意识到了这一点，但他们相信他们的工作是一个重要的十年发展时期的一部分。

在宾夕法尼亚大学，研究生罗·恩卡纳西翁正在研究“算法公正”领域中的一个新角度，这一领域主要由女性和有色人种开创，已经有七八年的历史了。她的工作更专注于用户而非平台，记录她所谓的“新兴审计”。

当Tiktok或Instagram推出了一种有点种族歧视的滤镜，或是一种可以制造令人眼花缭乱效果的图像生成器时，用户会做什么？当然会抱怨，但他们也会继续使用，并学会如何规避或甚至加剧其中编码的问题。这可能不是我们想象中的“解决方案”，但它展示了用户方面的多样性和韧性 - 他们并不像你想的那样脆弱或被动。