MLCommons希望为笔记本电脑、台式机和工作站创建人工智能基准

Chat中文版

随着人工智能越来越多地从云端转移到设备上，人们如何准确地知道某款新笔记本电脑是否能比其他现成的笔记本电脑、台式机或一体机更快地运行基于GenAI的应用程序呢？了解这一点可能意味着在生成图像时等待几秒钟还是几分钟的区别 - 而众所周知，时间就是金钱。

MLCommons，作为一家负责多项与人工智能硬件基准测试标准相关的行业组织，希望通过发布针对“客户系统”（即消费者个人电脑）的性能基准测试来使比较购物更加容易。

今天，MLCommons宣布成立了一个新的工作组，即MLPerf Client工作组，其目标是为运行Windows、Linux和其他操作系统的台式机、笔记本电脑和工作站建立AI基准测试。MLCommons承诺这些基准测试将是“场景驱动的”，重点关注真实的最终用户使用情况，并且“以社区反馈为基础”。

为此，MLPerf Client的第一个基准测试将重点关注文本生成模型，特别是Meta的Llama 2。MLCommons执行总监大卫·坎特指出，Llama 2已经被纳入了MLCommons针对数据中心硬件的其他基准测试套件中。Meta还与高通和微软一起对Llama 2进行了大量工作，以优化Llama 2在Windows平台上的性能，从中受益的是运行Windows的设备。

坎特在一份新闻稿中表示：“现在是把MLPerf引入客户端系统的时机成熟了，因为人工智能正在成为计算的一个必然部分。”他期待着与我们的成员合作，将MLPerf的卓越性能带入客户端系统，并为广大社会带来新的功能。

MLPerf客户端工作组的成员包括AMD、Arm、华硕、戴尔、英特尔、联想、微软、英伟达和高通等，但明显不包括苹果。

苹果公司也不是MLCommons的成员，微软的一位工程总监（Yannis Minadakis）担任MLPerf客户端小组的联合主席，这样苹果公司的缺席并不完全令人惊讶。然而，令人失望的是，无论MLPerf客户端组提出什么人工智能基准测试，都不会在苹果设备上进行测试，至少在近期内不会进行。

然而，这位作家很好奇地想看看MLPerf Client能产生什么样的基准和工具，无论是否支持macOS。假设GenAI还将继续存在-没有任何迹象表明泡沫即将破裂-我不会感到惊讶地看到这些类型的指标在设备购买决策中发挥越来越重要的作用。

在我最理想的情况下，MLPerf客户端基准测试类似于在线的许多PC构建比较工具，可以提供有关特定设备的AI性能预期的指示。也许在未来，它们甚至会扩展到覆盖手机和平板电脑，考虑到高通和Arm的参与（两者都在移动设备生态系统中投资很大）。显然，现在还处于早期阶段 - 但希望能取得好的发展。

推荐阅读

欧盟希望升级其超级计算机，以支持生成式人工智能初创企业

欧盟议员们正努力推动该集团成为创造性人工智能竞争的一方，他们提出一系列支持措施，旨在激励国内的人工智能初创企业和成长型企业。人工智能技术，尤其是基于大数据集训练且具有生成能力的人工智能模型，正得到特别关注。

2024-01-242057

谷歌宣布推出针对教育的新AI功能

谷歌宣布了一系列面向课堂管理、可访问性和人工智能驱动的问题创建和教案特性的新功能。这是在英国Bett教育技术活动上宣布的。谷歌已经提供了人工智能驱动的特性，允许教师将问题添加到YouTube视频中作为课堂作业的一部分。该公司表示，不久的将来，AI将进一步加强这些功能。

2024-01-242051

Arcee是一个专注于企业的安全平台，可用于构建GenAI

在Hugging Face工作期间，工程师Mark McQuade和Brian Benedict在帮助企业客户采用GenAI时遇到了一些挑战。一些公司不愿意使用闭源AI API，因为他们认为缺乏透明度，但也担心开源模型的安全性问题。"我们逐渐意识到，主要的挑战是克服..."

2024-01-24474

TextQL旨在在商业数据之上增加基于人工智能的智能功能

马克·海（Mark Hay）和丁乙（Ethan Ding）希望使每一个企业决策都以数据驱动。雄心勃勃？毫无疑问。但是这两位工程师在几年前的疫情期间相识，他们无比乐观。海和丁是TextQL的联合创始人，这是一个将公司现有的数据堆栈与大规模语言进行连接的平台。

2024-01-241953

谁知道并购会成为我们无法停止谈论的事情呢？

请在以下您获取播客的地方收听。大家好，欢迎回到《Equity》，这是一档关于初创公司商业的播客节目，在这里我们会揭示头条新闻背后的数字和细微之处。今天是针对初创公司的周三节目，我们将为您列出重要的风险投资轮次，并通过其他初创公司和风险投资的新闻进行聊天。以下是内容的概要...

2024-01-242487