MLCommons希望为笔记本电脑、台式机和工作站创建人工智能基准
随着人工智能越来越多地从云端转移到设备上,人们如何准确地知道某款新笔记本电脑是否能比其他现成的笔记本电脑、台式机或一体机更快地运行基于GenAI的应用程序呢?了解这一点可能意味着在生成图像时等待几秒钟还是几分钟的区别 - 而众所周知,时间就是金钱。
MLCommons,作为一家负责多项与人工智能硬件基准测试标准相关的行业组织,希望通过发布针对“客户系统”(即消费者个人电脑)的性能基准测试来使比较购物更加容易。
今天,MLCommons宣布成立了一个新的工作组,即MLPerf Client工作组,其目标是为运行Windows、Linux和其他操作系统的台式机、笔记本电脑和工作站建立AI基准测试。MLCommons承诺这些基准测试将是“场景驱动的”,重点关注真实的最终用户使用情况,并且“以社区反馈为基础”。
为此,MLPerf Client的第一个基准测试将重点关注文本生成模型,特别是Meta的Llama 2。MLCommons执行总监大卫·坎特指出,Llama 2已经被纳入了MLCommons针对数据中心硬件的其他基准测试套件中。Meta还与高通和微软一起对Llama 2进行了大量工作,以优化Llama 2在Windows平台上的性能,从中受益的是运行Windows的设备。
坎特在一份新闻稿中表示:“现在是把MLPerf引入客户端系统的时机成熟了,因为人工智能正在成为计算的一个必然部分。”他期待着与我们的成员合作,将MLPerf的卓越性能带入客户端系统,并为广大社会带来新的功能。
MLPerf客户端工作组的成员包括AMD、Arm、华硕、戴尔、英特尔、联想、微软、英伟达和高通等,但明显不包括苹果。
苹果公司也不是MLCommons的成员,微软的一位工程总监(Yannis Minadakis)担任MLPerf客户端小组的联合主席,这样苹果公司的缺席并不完全令人惊讶。然而,令人失望的是,无论MLPerf客户端组提出什么人工智能基准测试,都不会在苹果设备上进行测试,至少在近期内不会进行。
然而,这位作家很好奇地想看看MLPerf Client能产生什么样的基准和工具,无论是否支持macOS。假设GenAI还将继续存在-没有任何迹象表明泡沫即将破裂-我不会感到惊讶地看到这些类型的指标在设备购买决策中发挥越来越重要的作用。
在我最理想的情况下,MLPerf客户端基准测试类似于在线的许多PC构建比较工具,可以提供有关特定设备的AI性能预期的指示。也许在未来,它们甚至会扩展到覆盖手机和平板电脑,考虑到高通和Arm的参与(两者都在移动设备生态系统中投资很大)。显然,现在还处于早期阶段 - 但希望能取得好的发展。