Mistral发布Codestral,这是其首个用于编程的生成式人工智能模型

AI7号2024-05-311254

Chat中文镜像

由微软支持、估值60亿美元的法国人工智能初创公司Mistral已发布了其首个用于编码的生成式人工智能模型,名为Codestral。

与其他代码生成模型一样,Codestral旨在帮助开发人员编写和交互代码。Mistral在一篇博客文章中解释说,它经过对80多种编程语言进行训练,包括Python、Java、C++和JavaScript。Codestral可以完成编码功能、编写测试,"填充"部分代码,并用英语回答关于代码库的问题。

Mistral将这款模型描述为“开放式”的,但这值得商榷。该初创公司的许可证禁止将Codestral及其输出用于任何商业活动。对于“开发”有例外,但即便如此也有附带条件:许可证明确禁止“员工在公司业务活动范围内的任何内部使用”。


原因可能是Codestral在训练过程中部分使用了受版权保护的内容。Mistral在博客文章中没有确认或否认这一点,但这也不足为奇;有证据表明这家初创公司先前的训练数据集包含了受版权保护的数据。

无论如何,Codestral也许不值得麻烦。这个模型有220亿个参数,需要一台性能强劲的个人电脑才能运行。(参数基本上定义了AI模型在问题上的技能,比如分析和生成文本。)虽然它在一些基准测试中超过了竞争对手(我们知道,这些测试是不可靠的),但也并非绝对优势。

尽管对大多数开发者来说不实用,并且在性能改进方面是渐进的,但Codestral肯定会引发对于依赖生成代码模型作为编程助手的智慧的争论。

开发者们当然对生成式人工智能工具至少用于一些编码任务表示欢迎。在2023年6月的Stack Overflow调查中,44%的开发者表示他们现在在开发过程中使用AI工具,而26%计划很快开始使用。然而,这些工具显然存在明显的缺陷。

GitClear对过去几年提交到项目存储库的超过1.5亿行代码进行了分析发现,生成式人工智能开发工具导致更多错误的代码被推送到代码库中。与此同时,安全研究人员警告称,这些工具可能会放大软件项目中现有的错误和安全问题;根据普渡大学的一项研究,OpenAI的ChatGPT对编程问题给出的答案有一半以上是错误的。

这并不会阻止像米斯特拉和其他公司试图将他们的模型变现(并赢得市场份额)。今天早上,米斯特拉在其Le Chat对话式人工智能平台上推出了Codestral的托管版本,以及付费的API。米斯特拉表示他们还在努力将Codestral整合到应用程序框架和开发环境中,例如LlamaIndex、LangChain、Continue.dev和Tabnine。