Nvidia推出NIM，使得部署AI模型到生产环境更加顺畅

Chat中文版

在Nvidia的GTC大会上，今天宣布了Nvidia NIM，这是一个新的软件平台，旨在简化将定制和预训练的AI模型部署到生产环境中。NIM将Nvidia围绕推断和优化模型所做的软件工作整合在一起，通过将给定模型与优化推断引擎结合起来，然后将其打包成一个容器，使其作为一个微服务易于访问。

通常情况下，开发人员需要几周甚至几个月的时间才能交付类似的容器，Nvidia认为，即使公司内部有AI人才，也是如此。通过NIM，Nvidia明显的目标是创建一个AI准备的容器生态系统，利用其硬件作为基础层，并将这些精心筛选的微服务作为核心软件层，以加快公司的AI路线图。

NIM 目前支持来自NVIDIA、A121、Adept、Cohere、Getty Images 和 Shutterstock 的模型，以及来自 Google、Hugging Face、Meta、Microsoft、Mistral AI 和 Stability AI 的开源模型。NVIDIA 已经与亚马逊、谷歌和微软合作，分别在 SageMaker、Kubernetes Engine 和 Azure AI 上提供这些 NIM 微服务。它们还将整合到 Deepset、LangChain 和 LlamaIndex 等框架中。

Chat中文版

在今天的发布会上，英伟达企业计算主管Manuvir Das表示：“我们相信Nvidia GPU 是运行这些模型推理的最佳选择，而且我们认为NVIDIA NIM 是开发人员可以构建在其上以专注于企业应用的最佳软件包和最佳运行时，让他们只需让 Nvidia去以最高效的企业级方式为他们生成这些模型，以便他们能够继续完成其余的工作。”

至于推理引擎，Nvidia将使用 Triton 推理服务器，TensorRT 和 TensorRT-LLM。通过 NIM 提供的一些 Nvidia 微服务将包括用于定制语音和翻译模型的 Riva，用于路由优化的 cuOpt 以及用于天气和气候模拟的 Earth-2 模型。

公司计划随着时间的推移增加额外的功能，例如将Nvidia的RAG LLM操作员作为NIM提供，这将使构建可以引入自定义数据的生成式AI聊天机器人变得更加容易。

在没有一些客户和合作伙伴的公告的情况下，这个开发者大会就不完整了。NIM目前的用户包括Box、Cloudera、Cohesity、Datastax、Dropbox和NetApp等公司。

NVIDIA的创始人兼首席执行官黄仁勋表示：“已建立的企业平台拥有大量的数据宝藏，可以转化为生成式AI副驾驶员。与我们的合作伙伴生态系统一起创建，这些容器化AI微服务是各行业企业成为AI公司的基石。”

推荐阅读

为什么埃隆·马斯克的人工智能公司“开源”Grok很重要 - 以及为什么不重要

埃隆·马斯克的xAI公司在周末发布了其Grok大型语言模型作为“开源”。这位亿万富翁显然希望让自己的公司与竞争对手OpenAI产生分歧，尽管后者虽然名为OpenAI，却不太开放。但是像Grok这样的代码发布实际上是否有助于人工智能开发社区呢？是和否。[…]

2024-03-182014

Quilt正在为解决方案团队打造AI助手

所谓“解决方案专家”——像销售工程师、解决方案架构师和顾问这样的人——的工作是围绕向潜在客户推销复杂的企业技术。这是一项重要的工作。但尽管如此，创业家陈丹表示，解决方案团队很少有充足的人员和资源支持。“解决方案团队为销售带来了技术信誉 […]”

2024-03-181535

科技爱好者一分钟：为什么人工智能界这周聚集在英伟达的GTC 2024活动中

芯片巨头英伟达本周举办了一场大规模的人工智能会议，作为其本周一开始的GTC活动的一部分。该公司的首席执行官兼联合创始人黄仁勋计划进行主题演讲，该公司在过去几年以其游戏硬件而闻名，如今在蓬勃发展的人工智能硬件市场上拥有庞大的市场份额。

2024-03-18651

据报道，苹果正在探索与谷歌合作，在 iPhone 上推出由 Gemini 驱动的功能

据彭博报道，苹果正寻求与谷歌合作进行巨额交易，利用Gemini人工智能模型为iPhone提供功能。这将使谷歌处于占据主导地位的位置，因为该公司已与苹果达成协议，成为Safari浏览器在iPhone上的首选搜索引擎提供商。报道援引了...

2024-03-18666

xAI开源Grok的基础模型，但没有包含任何训练代码

伊隆·马斯克的xAI已经将Grok AI模型的基础代码开源，但没有提供任何训练代码。该公司在GitHub上将其描述为“3140亿参数的专家混合模型”。在一篇博客中，xAI表示该模型并未针对任何特定的应用进行调整，比如用于对话。该公司指出，...

2024-03-182845