Etched正在开发一种只能运行一种模型的人工智能芯片

AI7号2024-06-251439

Chat中文镜像

随着生成式人工智能触及越来越多的行业,生产运行模型的芯片的公司受益匪浅。特别是英伟达,据估计占据了70%到95%的人工智能芯片市场,拥有巨大的影响力。从Meta到微软等云服务提供商正在花费数十亿美元购买英伟达的GPU,担心在生成式人工智能领域落后。

生成式人工智能供应商出于可以理解的原因对现状并不满意。 他们的成功很大程度上取决于主导芯片制造商的心血来潮。 因此,他们与投机的风险投资者一起,正在寻找有前途的新兴企业来挑战人工智能芯片的现任者。

Etched是众多替代芯片公司中争夺一席之地的其中之一,但它也是最有趣的之一。成立仅两年,Etched由哈佛大学退学生Gavin Uberti(前OctoML和前Xnor.ai)和Chris Zhu创立,他们与Robert Wachen和前赛普拉斯半导体首席技术官Mark Ross共同寻求创建一款只能运行人工智能模型的芯片。

这并不罕见。许多初创公司和科技巨头已经或正在开发专门运行AI模型的芯片,也被称为推理芯片。Meta拥有MTIA,亚马逊拥有Graviton和Inferentia等等。但Etched的芯片独特之处在于它们只能运行一种类型的模型:transformers。

2017年由谷歌研究人员提出的变压器已经成为目前最主要的生成式人工智能模型架构。

变形金刚是OpenAI的视频生成模型Sora的基础。它们是文本生成模型如Anthropic的Claude和谷歌的Gemini的核心。它们还驱动着艺术生成器,比如最新版本的Stable Diffusion。

“在2022年,我们打赌变压器会接管世界。” Etched的首席执行官Uberti在接受TechCrunch采访时说道。“我们已经达到了人工智能发展的一个节点,专用芯片比通用GPU性能更优越是不可避免的,全世界的技术决策者都知道这一点。”

艾刻的芯片,名为搜狐,是一种ASIC(特定应用集成电路)——一种针对特定应用定制的芯片,在这种情况下是运行变压器。Uberti声称,使用TSMC的4纳米工艺制造的搜狐可以比GPU和其他通用人工智能芯片提供更出色的推理性能,同时能耗更低。

乌贝尔蒂说:“在运行文本、图像和视频转换器时,搜狐比甚至英伟达下一代的Blackwell GB200 GPU快了一个数量级,而且成本更低。”“一台搜狐服务器可以取代160个H100 GPU……搜狐将成为商业领袖们更为经济、高效和环保的选择。”

搜狐是如何实现所有这些的?有几种方式,但最明显且直观的是优化的推理硬件和软件流程。因为搜狐不运行非转换模型,Etched团队能够摆脱与转换模型无关的硬件部件,同时减少传统上用于部署和运行非转换模型的软件开销。

在生成式人工智能基础设施竞争的拐点上,Etched即将进入舞台。除了成本问题,如今运行大规模模型所需的GPU和其他硬件组件耗电量过高,已经成为一个严重问题。

高盛预测,到2030年,人工智能有望推动数据中心对电力的需求增长160%,从而导致温室气体排放显著增加。与此同时,加州大学河滨分校的研究人员估计,全球人工智能的使用可能会导致数据中心在2027年前吸收1100亿至1700亿加仑淡水,对当地资源造成影响(许多数据中心使用水来冷却服务器)。

乌贝尔蒂乐观地 - 或者说夸大其词,这取决于你如何理解 - 把搜狐当做解决行业消费问题的方案。

“简而言之,我们未来的客户将会选择搜狐,因为他们无法负担不转向搜狐。” Uberti说道。“企业愿意冒险使用Etched,因为速度和成本对他们试图建立的AI产品至关重要。”

但是,假设Etched公司能在接下来的几个月内实现将搜狐带入大众市场的目标,那么在许多其他公司紧随其后的情况下,它能成功吗?

目前,Etched在直接竞争对手方面仍然缺乏,但人工智能芯片初创公司Perceive最近预览了一款具有变压器硬件加速的处理器。Groq也在为其ASIC投入了大量资金进行变压器特定优化。

竞争先不谈,如果变压器有一天不受青睐了呢?乌贝尔蒂说,那样的话,Etched会做出合理的选择:设计一款新芯片。说得也对。但考虑到将搜狐发展成熟所花费的时间,这算是一个相当严重的后备方案。

所有这些顾虑都没有阻止投资者们向Etched注入大量资金。

今天,Etched宣布完成了1.2亿美元的A轮融资,由Primary Venture Partners和Positive Sum Ventures共同领投。此轮融资使Etched的累计融资达到1.2536亿美元,重量级天使投资者包括Peter Thiel(Uberti,Zhu和Wachen都是Thiel Fellowship的校友),GitHub CEO Thomas Dohmke,Cruise(和Bot Company)联合创始人Kyle Vogt和Quora联合创始人Charlie Cheever也参与了本轮投资。

这些投资者可能相信Etched有合理的成功扩大销售服务器业务的机会。也许确实如此——Uberti声称,目前已有未透露姓名的客户预订了“数千万美元”的硬件。即将推出的Sohu开发者云,将让客户通过在线互动游乐场预览搜狐,预计将推动额外的销售,Uberti 表示。

目前看来,是否这已足够推动Etched及其35人团队实现公司联合创始人所设想的未来,还为时过早。即便处于最佳时期,人工智能芯片行业也可能毫不留情 —— 如人工智能芯片初创公司Mythic和Graphcore的备受关注的几乎失败,以及2023年人工智能芯片企业投资的急剧下降。

优贝蒂发起了强有力的销售宣传:“视频生成、音频模态转换、机器人技术以及其他未来的人工智能应用场景都需要像搜狐这样快速的芯片。整个人工智能技术的未来发展将取决于基础设施能否实现扩展。”