为什么埃隆·马斯克的人工智能公司“开源”Grok很重要 - 以及为什么不重要
埃隆·马斯克的xAI在周末发布了其Grok大型语言模型作为“开源”。这位亿万富翁显然希望让自己的公司与竞争对手OpenAI对立,尽管OpenAI并不如其名字一样开放。但是,像Grok这样发布代码实际上对AI开发社区有贡献吗?是和否。
Grok 是一个由 xAI 训练的聊天机器人,其填补了像 ChatGPT 或 Claude 这样的角色,功能模糊地定义:你问它,它回答。然而,这个 LLM 被赋予了一个俏皮的语气,并额外访问了 Twitter 数据,以使其与其他区分开来。
正如往常一样,这些系统几乎不可能评估,但普遍共识似乎是它与上一代中等尺寸模型如GPT-3.5相媲美。 (您认为这是否令人印象深刻,考虑到短暂的开发时间框架,或者考虑到围绕xAI的预算和吹嘘是否令人失望,完全取决于您。)
无论如何,Grok是一个现代、功能强大且规模巨大的LLM,并且开发社区对这类事物的内部有更多的访问权限是更好的。问题在于如何定义“开放”,以一种不仅让公司(或亿万富翁)宣称道德高地的方式。
在人工智能领域,“开放”和“开源”这些术语被质疑或滥用并不是第一次。而且我们不只是在讨论技术上的争端,比如选择一个不那么开放的使用许可证(如果你在想,Grok 是 Apache 2.0)。
首先,AI模型在开源方面与其他软件不同。
如果你在开发一个文字处理器,那么开源化就相对简单:你将所有的代码公开发布,让社区提出改进建议或制作他们自己的版本。开源概念有价值的一部分是应用的每个方面都是原创或归功于其原始创作者 - 这种透明度和正确属性的遵守不仅仅是副产品,而且是开放概念的核心。
使用人工智能,这可能根本不可能,因为机器学习模型的创建涉及一个主要无法了解的过程,大量的训练数据被提炼到一个复杂的统计表示中,其结构没有人类真正指导,甚至理解。这个过程无法像传统代码那样被检查、审计和改进,虽然从某种意义上说它仍然有巨大的价值,但它永远不能真正公开。(标准化社区甚至还没有定义在这种情况下什么是公开的,但正在积极讨论。)
这并没有阻止人工智能开发者和公司设计并宣称他们的模型是“开放”的,这一术语在这个背景下已经失去了很多意义。有些人称他们的模型为“开放”,如果有一个面向公众的界面或API。有些人则认为,只要他们发布一份描述开发过程的论文,就可以称之为“开放”。
可以说,人工智能模型最接近“开源”的方式是当开发者公开其权重,也就是说其神经网络中无数节点的确切属性,这些节点按精确顺序执行向量数学操作,以完成用户输入开始的模式。但即使像 LLaMa-2 这样的“开放权重”模型也排除了其他重要数据,比如训练数据集和过程 —— 这些是重新从头开始创建模型所必需的。(当然,一些项目走得更远。)
甚至更重要的是,要创建或复制这些模型需要数百万美元的计算和工程资源,这实际上限制了只有拥有相当资源的公司才能创建和复制它们。
那么xAI的Grok发布在这个范围的哪个位置?
作为一个开源权重模型,任何人都可以下载、使用、修改、微调或提炼。这很好!从参数来看,它似乎是目前任何人都可以自由访问的最大模型之一——有3140亿个参数,这为好奇的工程师们提供了很多工作内容,如果他们想要测试在各种修改后它的表现如何。
这款模型的体积确实有严重的缺点。要想在原始形式下使用它,您将需要数百吉字节的高速内存。如果您现在手头没有几十万美元的Nvidia H100并排的人工智能推理装置,那就不要费力去点击下载链接了。
尽管可以说Grok在一些其他现代模型上具有竞争力,但它也远远比它们更大,这意味着完成相同任务需要更多的资源。大小、效率和其他指标之间总是存在一个等级制度,它仍然有价值,但这更多地是原材料而不是最终产品。也不清楚这是否是Grok的最新和最好版本,就像一些人通过X可以访问到的清晰调谐版本一样。
总的来说,发布这些数据是一件好事,但并没有像一些人希望的那样改变游戏规则。
很难不去想为什么马斯克在做这个。他的新兴人工智能公司是否真的致力于开源开发?还是这只是对OpenAI的恶意攻击,而马斯克目前正在与OpenAI展开亿万级的争执?
如果他们真的致力于开源软件开发,这将是许多发布中的第一次,他们希望会考虑社区的反馈意见,发布其他关键信息,描述培训数据的过程,并进一步解释他们的方法。如果不是的话,这只是马斯克为了在网上辩论时指出而已,这仍然具有价值,只是在未来几个月里,当他们试验模型时,AI界中的任何人都不会依赖它或对它给予太多关注。