科技巨头成立行业组织,以帮助开发下一代人工智能芯片组件

AI7号2024-05-311245

Chat中文镜像

英特尔、谷歌、微软、Facebook等科技巨头正在成立一个新的产业集团,即Ultra Accelerator Link (UALink) 推广组,以指导数据中心中连接人工智能加速器芯片的组件的发展。

周四宣布,UALink推动组织提议了一个新的行业标准,用于连接越来越多服务器中的人工智能加速器芯片。该组织成员包括AMD(但目前还不包括Arm)、惠普企业、博通和思科。广义上讲,人工智能加速器是一种范围从GPU到定制解决方案的芯片,用于加快人工智能模型的训练、微调和运行。

AMD的数据中心解决方案总经理Forrest Norrod周三在一次简报会上告诉记者:“该行业需要一个开放标准,可以非常快速地推进,在一个允许多家公司为整体生态系统增加价值的开放[格式]中。”“该行业需要一个允许创新不受任何单一公司束缚迅速推进的标准。”

提议标准的第一个版本UALink 1.0将在一个计算“机架”中连接高达1024个人工智能加速器(仅限GPU)。(该组将一个或多个机架定义为一个“机架”)基于“开放标准”包括AMD的Infinity Fabric的UALink 1.0将允许在人工智能加速器附加的存储器之间进行直接加载和存储,并且通常比现有的互连规格提高速度,同时降低数据传输延迟,根据UALink Promoter Group的说法。

该团体表示将在第三季度成立一个负责监督UALink规范后续开发的财团,名为UALink联盟。UALink 1.0 将在同一时间提供给加入财团的公司,而更新的高带宽规范UALink 1.1 预计将于2024年第四季度推出。

Norrod说,首批UALink产品将在“未来几年”推出。

该团体成员名单中最引人注目的缺席是英伟达,它是迄今为止估计市场份额达80%至95%的人工智能加速器最大生产商。英伟达拒绝就此发表评论。但很容易看出为什么这家芯片制造商不热情地支持UALink。

首先,Nvidia提供了自己的专有互连技术,用于在数据中心服务器内连接GPU。该公司可能不怎么愿意支持基于竞争对手技术的规范。

而且,英伟达公司运营在一个巨大的实力和影响力的位置。

在英伟达最近的财季(2025财年第一季度),该公司的数据中心销售额,包括人工智能芯片的销售额,比去年同期增长了400%以上。如果英伟达继续保持当前的发展轨迹,今年将超过苹果成为全球第二大市值公司。

所以,简单地说,如果Nvidia不想合作,它就没有必要合作。

至于亚马逊云服务(AWS),作为唯一没有参与UALink的公共云巨头,可能正在观望模式中。他们可能在不断改进其各种内部加速器硬件努力的同时采取“观望”的态度。也可能是因为AWS在云服务市场上占据着主导地位,对于反对向顾客提供大部分GPU的英伟达并没有太多战略意义。

AWS 没有回应 TechCrunch 的评论请求。

实际上,UALink 的最大受益者除了AMD和英特尔之外,似乎还有微软、Facebook和谷歌。它们三家合计在英伟达GPU上花费了数十亿美元,用于支持其云计算和训练不断增长的人工智能模型。它们都希望摆脱对这家他们认为在人工智能硬件生态系统中占主导地位的供应商的依赖。

根据最近的一份报告,Gartner估计今年服务器中使用的人工智能加速器的价值将达到210亿美元,到2028年将增加到330亿美元。与此同时,Gartner预测,到2025年,人工智能芯片的收入将达到334亿美元。

谷歌拥有用于训练和运行AI模型的定制芯片,TPU和Axion。亚马逊已经拥有几个AI芯片家族。微软去年推出了Maia和Cobalt。而Facebook正在改进自己的加速器系列。

据报道,微软及其密切合作伙伴OpenAI计划至少花费1000亿美元在一台用于训练人工智能模型的超级计算机上,该计算机将配备未来版本的钴和莫亚芯片。这些芯片需要一个东西来连接它们,也许就是UALink。