Unbabel是首批获得欧盟超级计算机上数百万GPU训练小时的人工智能初创公司之一

AI7号2024-06-261260

Chat中文镜像

欧盟宣布了今年早些时候启动的“大型AI大挑战”的获奖者,旨在加速大规模AI模型制造商的本土创新步伐。

四家初创公司将分享100万欧元的奖金,更重要的是,在接下来的12个月里,它们将在欧盟区域高性能计算(HPC)超级计算机上共享800万GPU小时来训练他们的模型。委员会认为,这将使它们能够将模型训练时间从“数年缩短为数周”,正如其公关所说。

获奖的四家初创企业分别是:法国金融科技公司Lingua Custodia,利用自然语言处理(NLP)进行金融文件处理;比利时初创公司Textgain,也利用NLP进行文本处理,但专注于对非结构化数据进行分析,比如监测社交媒体上的仇恨言论;拉脱维亚初创公司Tilde,另一家语言专家,专注于巴尔波斯拉夫语言,提供目标语言的机器翻译和人工智能聊天机器人;以及来自葡萄牙的Unbabel,历史上将机器翻译与本地人类专家的专业知识相结合,应用人工智能为企业客户提供客户服务和提高生产效率的解决方案。

委员会表示,AI挑战赛共收到了94个提案。

Unbabel很可能是这四位获奖者中知名度最高的。这家得到Y Combinator支持的翻译公司已经存在了近十年,并在Crunchbase的统计中筹集了将近1亿美元的资金。

无论Unbabel是否需要额外的25万欧元,甚至是200万免费的GPU训练时间都有待讨论。但是即使是老牌人工智能初创公司,在过去1.5年左右发展迅猛的生成式人工智能领域,每一点帮助都可能会有所帮助。

在培训期结束时,欧盟希望所有获奖者以开放源代码许可证的形式发布他们开发的模型,用于非商业用途,或者发布他们的研究成果。

欧盟超级计算机将支持人工智能初创公司

欧盟在去年秋天乌尔苏拉·冯·德莱恩主席的联合国情峰会上公布了一项计划,扩大了初创企业对该集团超级计算硬件的访问——当时表示希望“道德和负责任的人工智能初创企业”能够成为首批获得计算支持的对象。

欧洲高性能计算联合发起 (简称 EuroHPC JU) 目前有八台运行中(九台已采购)的超级计算机,其中两台将为四位获奖者分配八百万 GPU 小时:分别是芬兰的 Lumi 和意大利的 Leonardo(它们都是预超级计算级别的高性能计算机)。 EuroHPC JU 是欧盟的超级计算机计划的完整名称。

第五家初创公司——总部位于西班牙的Multiverse Computing,专注于利用“量子启发张量网络”来提高大型语言模型的能效和速度,虽然无缘获得任何奖金,但有个安慰:该公司将获得另一台超级计算机西班牙(前超级预量子)的MareNostrum 5上的80万计算小时。

这几家欧洲初创企业正在建立大规模人工智能模型,他们并不是第一批尝试使用高性能计算硬件的企业。法国通用人工智能模型制造商Mistral去年夏天曾参与超级计算资源的早期试点阶段,创始人兼首席执行官Arthur Mensch在去年12月告诉TechCrunch,他们使用Leonardo进行了“一些小型实验”,但他说那时还没有用于模型训练。

欧洲超级计算联合体(EuroHPC JU)在历史上也为商业参与者提供了一定的计算能力。然而,对超级计算机的需求通常远远超过供应,因此人工智能初创公司基本上被优先考虑。

欧盟决策者也意识到有必要重塑和改造高性能计算基础设施,以适应生成式人工智能时代。因此,早在一月份,委员会就宣布了一揽子“人工智能创新”措施,其中包括升级超级计算机和建立支持层以提高可访问性,让人工智能初创企业更容易利用基础设施。