GitHub Copilot 的竞争对手 Codeium 以 12.5 亿美元的估值筹集了 1.5 亿美元。

Chat中文镜像

一家其产品与 GitHub Copilot 及其他人工智能驱动的编码助手竞争的初创公司已达到独角兽级别。

周四，Codeium 表示已完成由 General Catalyst 领投的 1.5 亿美元 C 轮融资，融资后该公司估值达到 12.5 亿美元。此轮融资还得到了现有投资者 Kleiner Perkins 和 Greenoaks Capital 的参与，使得公司自成立短短三年内的总融资额接近 2.5 亿美元（2.43 亿美元）。

Codeium 的联合创始人兼首席执行官瓦伦·莫汉（Varun Mohan）告诉 TechCrunch，Codeium 甚至还未动用其在 1 月份筹集的 6500 万美元 B 轮融资的部分资金。就在八个月前的当时，Codeium 的估值为 5 亿美元。

他说：“尽管我们现有的资金几乎没有受到什么影响，但我们相信这笔资金的注入将使我们能够大幅增加研发和发展，同时进行更大规模的战略押注。”

Codeium 由莫汉（Mohan）和他儿时的朋友、麻省理工学院（MIT）的校友道格拉斯·陈（Douglas Chen）于 2021 年创立。在加入 Codeium 之前，陈在 Meta 工作，在那里他帮助为 Oculus Quest 等虚拟现实头显构建软件工具。莫汉是自动驾驶送货初创公司 Nuro 的技术主管，负责管理自治基础设施团队。

这家初创公司最初是一家截然不同的公司，名为 Exafunction，专注于针对 AI 工作负载的 GPU 优化和虚拟化。但在 2022 年，莫汉和陈察觉到生成式编码领域有更大的机会，于是决定重塑品牌并转型。

莫汉说：“尽管生成式人工智能工具大量涌现，但开发人员仍在为耗时的编码任务而苦苦挣扎。”“许多由人工智能驱动的解决方案提供的通用代码片段，需要大量人工工作才能整合到现有代码库中并确保其安全性。这正是我们的人工智能编码辅助发挥作用的地方。”

Codeium 的平台由基于公共代码训练的生成式人工智能模型提供支持，能够在应用程序的整个代码库背景下提供建议。它支持约 70 种编程语言，并与许多流行的开发环境集成，包括微软的 Visual Studio 和 JetBrains 。

为了把开发者从 Copilot 及其他竞争对手那里吸引过来，Codeium 一开始就推出了慷慨的免费层级。这一策略似乎奏效了：如今，这家初创公司拥有超过 70 万用户和 1000 多家企业客户，包括 Anduril、Zillow 和戴尔。

General Catalyst 的董事总经理昆汀·克拉克（Quentin Clark）暗示，Codeium 能够赢得一些较大的合同，是因为其在产品研究中坚定地采用了以客户为中心的方法。

克拉克在一份声明中表示：“该团队的方法一直是追随客户，引领公司按照他们的要求构建解决方案——可在任何环境中部署，支持的语言比其他任何公司都多。”“Codeium 所创造的不只是一个演示、一个公告或一个想法——这是一个全面扩展的业务，许多大企业在其整个组织中都采用了该产品。”

企业往往对向第三方暴露专有代码持谨慎态度——例如，据报道，苹果去年禁止员工使用 Copilot，理由是担心机密数据泄露。为了试图减轻这种担忧，Codeium 除了标准的软件即服务计划外，还开始提供自托管安装选项。

如果愿意，公司现在可以在自己的硬件上部署 Codeium 的服务。或者，他们可以采用混合设置，将数据保存在自己的设备上，同时使用 Codeium 的服务器满足计算需求。

将数据传输到云端总是存在一定风险，但莫汉称，Codeium 采用了强大的加密技术。他补充道：“我们从不在用户数据上训练我们专有的生成式自动补全模型，从不出售数据，并确保所有数据传输都经过加密。”

Codeium 还采取了措施，从用于训练其人工智能模型的数据集里移除“未经许可”的授权代码（例如受版权保护的代码）。一些使用限制授权或受版权保护的代码训练而成的代码生成工具，已被证明在以某种方式提示时会重复使用那些代码，从而构成责任风险（即，使用这些代码的开发者可能会被起诉）。莫汉表示，由于 Codeium 的训练数据准备和过滤方法，这种情况在 Codeium 中不存在。

他补充道：“我们还会删除任何看起来与明确未经许可授权的代码相似的剩余数据，以防其他人在未提供适当归属和授权的情况下复制代码。最重要的是，对于这些大型概率模型生成的与公共代码（无论是许可授权还是未经许可授权）相似的代码，我们拥有最先进的后生成归属过滤和日志记录。”

但幻觉呢？大多数人工智能编码工具因胡编乱造而臭名昭著，这在企业环境中可能极具破坏性。

开发工具初创公司 GitClear 的一项分析发现，在过去几年中，生成式人工智能工具导致更多错误代码被推送到代码库中。普渡大学的一项研究发现，OpenAI 的 ChatGPT 对编程问题给出的答案中，超过一半是不正确的。安全研究人员已经警告称，此类工具有可能放大软件中现有的漏洞。

网络安全公司 Snyk 最近的一项调查发现，十分之九的开发者担心使用人工智能编码平台会带来更广泛的安全隐患。但莫汉声称，Codeium 所谓更优越、富含深度上下文的技术产生的结果比大多数都更值得信赖。

他说：“我们的上下文感知引擎能够将结果建立在用户代码库中已有的内容之上，从而提出更少幻觉且更符合现有语法、语义和标准的建议。”

不管基准测试是否能证明这一点，Codeium 的推销说辞似乎引起了相关高管的共鸣：今年的营收达到了八位数。莫汉表示，这家总部位于圣何塞、拥有 80 名员工的初创公司计划在 2025 年将员工人数增加到 120 人，因为它的目标是在一个有 Tabnine、Anysphere 和 Poolside 等强大竞争对手的市场中取得更大的突破。

截至 4 月，Copilot 拥有超过 130 万付费用户，Codeium 可能难以赶上——至少短期内无法做到。但这并非必须。正如莫汉正确指出的那样，鉴于开发者对 AI 编码工具的广泛采用（尽管他们有所保留），即使在这个新兴领域只占据一小部分份额，也必然有利可图。

北极星研究公司预测，到 2032 年，人工智能代码工具市场的价值将达到 271.7 亿美元。

莫汉表示：“过度炒作是该行业面临的一个挑战。这将使每家公司都更难真正让终端用户相信他们处于前沿位置。但我们相信，像 Codeium 这样追求真相和务实的人工智能公司最终将突破这种喧嚣。”