为什么埃隆·马斯克的人工智能公司“开源”Grok很重要 - 以及为什么不重要

Chat中文版

埃隆·马斯克的xAI在周末发布了其Grok大型语言模型作为“开源”。这位亿万富翁显然希望让自己的公司与竞争对手OpenAI对立，尽管OpenAI并不如其名字一样开放。但是，像Grok这样发布代码实际上对AI开发社区有贡献吗？是和否。

Grok 是一个由 xAI 训练的聊天机器人，其填补了像 ChatGPT 或 Claude 这样的角色，功能模糊地定义：你问它，它回答。然而，这个 LLM 被赋予了一个俏皮的语气，并额外访问了 Twitter 数据，以使其与其他区分开来。

正如往常一样，这些系统几乎不可能评估，但普遍共识似乎是它与上一代中等尺寸模型如GPT-3.5相媲美。（您认为这是否令人印象深刻，考虑到短暂的开发时间框架，或者考虑到围绕xAI的预算和吹嘘是否令人失望，完全取决于您。）

无论如何，Grok是一个现代、功能强大且规模巨大的LLM，并且开发社区对这类事物的内部有更多的访问权限是更好的。问题在于如何定义“开放”，以一种不仅让公司（或亿万富翁）宣称道德高地的方式。

在人工智能领域，“开放”和“开源”这些术语被质疑或滥用并不是第一次。而且我们不只是在讨论技术上的争端，比如选择一个不那么开放的使用许可证（如果你在想，Grok 是 Apache 2.0）。

首先，AI模型在开源方面与其他软件不同。

如果你在开发一个文字处理器，那么开源化就相对简单：你将所有的代码公开发布，让社区提出改进建议或制作他们自己的版本。开源概念有价值的一部分是应用的每个方面都是原创或归功于其原始创作者 - 这种透明度和正确属性的遵守不仅仅是副产品，而且是开放概念的核心。

使用人工智能，这可能根本不可能，因为机器学习模型的创建涉及一个主要无法了解的过程，大量的训练数据被提炼到一个复杂的统计表示中，其结构没有人类真正指导，甚至理解。这个过程无法像传统代码那样被检查、审计和改进，虽然从某种意义上说它仍然有巨大的价值，但它永远不能真正公开。（标准化社区甚至还没有定义在这种情况下什么是公开的，但正在积极讨论。）

这并没有阻止人工智能开发者和公司设计并宣称他们的模型是“开放”的，这一术语在这个背景下已经失去了很多意义。有些人称他们的模型为“开放”，如果有一个面向公众的界面或API。有些人则认为，只要他们发布一份描述开发过程的论文，就可以称之为“开放”。

可以说，人工智能模型最接近“开源”的方式是当开发者公开其权重，也就是说其神经网络中无数节点的确切属性，这些节点按精确顺序执行向量数学操作，以完成用户输入开始的模式。但即使像 LLaMa-2 这样的“开放权重”模型也排除了其他重要数据，比如训练数据集和过程 —— 这些是重新从头开始创建模型所必需的。（当然，一些项目走得更远。）

甚至更重要的是，要创建或复制这些模型需要数百万美元的计算和工程资源，这实际上限制了只有拥有相当资源的公司才能创建和复制它们。

那么xAI的Grok发布在这个范围的哪个位置？

作为一个开源权重模型，任何人都可以下载、使用、修改、微调或提炼。这很好！从参数来看，它似乎是目前任何人都可以自由访问的最大模型之一——有3140亿个参数，这为好奇的工程师们提供了很多工作内容，如果他们想要测试在各种修改后它的表现如何。

这款模型的体积确实有严重的缺点。要想在原始形式下使用它，您将需要数百吉字节的高速内存。如果您现在手头没有几十万美元的Nvidia H100并排的人工智能推理装置，那就不要费力去点击下载链接了。

尽管可以说Grok在一些其他现代模型上具有竞争力，但它也远远比它们更大，这意味着完成相同任务需要更多的资源。大小、效率和其他指标之间总是存在一个等级制度，它仍然有价值，但这更多地是原材料而不是最终产品。也不清楚这是否是Grok的最新和最好版本，就像一些人通过X可以访问到的清晰调谐版本一样。

总的来说，发布这些数据是一件好事，但并没有像一些人希望的那样改变游戏规则。

很难不去想为什么马斯克在做这个。他的新兴人工智能公司是否真的致力于开源开发？还是这只是对OpenAI的恶意攻击，而马斯克目前正在与OpenAI展开亿万级的争执？

如果他们真的致力于开源软件开发，这将是许多发布中的第一次，他们希望会考虑社区的反馈意见，发布其他关键信息，描述培训数据的过程，并进一步解释他们的方法。如果不是的话，这只是马斯克为了在网上辩论时指出而已，这仍然具有价值，只是在未来几个月里，当他们试验模型时，AI界中的任何人都不会依赖它或对它给予太多关注。

推荐阅读

Quilt正在为解决方案团队打造AI助手

所谓“解决方案专家”——像销售工程师、解决方案架构师和顾问这样的人——的工作是围绕向潜在客户推销复杂的企业技术。这是一项重要的工作。但尽管如此，创业家陈丹表示，解决方案团队很少有充足的人员和资源支持。“解决方案团队为销售带来了技术信誉 […]”

2024-03-181535

科技爱好者一分钟：为什么人工智能界这周聚集在英伟达的GTC 2024活动中

芯片巨头英伟达本周举办了一场大规模的人工智能会议，作为其本周一开始的GTC活动的一部分。该公司的首席执行官兼联合创始人黄仁勋计划进行主题演讲，该公司在过去几年以其游戏硬件而闻名，如今在蓬勃发展的人工智能硬件市场上拥有庞大的市场份额。

2024-03-18651

据报道，苹果正在探索与谷歌合作，在 iPhone 上推出由 Gemini 驱动的功能

据彭博报道，苹果正寻求与谷歌合作进行巨额交易，利用Gemini人工智能模型为iPhone提供功能。这将使谷歌处于占据主导地位的位置，因为该公司已与苹果达成协议，成为Safari浏览器在iPhone上的首选搜索引擎提供商。报道援引了...

2024-03-18666

xAI开源Grok的基础模型，但没有包含任何训练代码

伊隆·马斯克的xAI已经将Grok AI模型的基础代码开源，但没有提供任何训练代码。该公司在GitHub上将其描述为“3140亿参数的专家混合模型”。在一篇博客中，xAI表示该模型并未针对任何特定的应用进行调整，比如用于对话。该公司指出，...

2024-03-182845

VC Arjun Sethi大谈销售他的公司选择策略给其他投资者听，他说他们都很买账

阿尔琼·塞迪表现出一种自信的态度，让人觉得他对事情的了解比其他人更多，或者他知道表现出高度自信可以影响他人的看法。无论哪种方式，在Zoom上告诉我说，“在五年内，我将能掌握全球50%的私人数据”，并且这将是“不可能的”时，

2024-03-172027