亚马逊希望托管公司定制的生成式人工智能模型

Chat中文版

亚马逊的云计算业务AWS希望成为公司托管和优化他们定制生成式人工智能模型的首选地点。

今天，AWS宣布推出自定义模型导入（预览版），这是Bedrock中的一个新功能，Bedrock是AWS面向企业的生成式AI服务套件，允许组织导入和访问其内部生成式AI模型作为完全托管的API。

一旦公司专有模型被导入，它们就会受益于Bedrock图书馆中其他生成式人工智能模型相同的基础设施 (例如Meta的Llama 3，Anthropic的Claude 3)，包括用于扩展知识、微调和实施保障以减少偏见的工具。

亚马逊云服务(AWS)的生成式人工智能副总裁Vasi Philomin在接受TechCrunch的采访时表示：“有些AWS的客户已经在Bedrock之外使用其他工具来优化或构建自己的模型。这种自定义模型导入功能使他们可以将自己的专有模型导入Bedrock，与所有其他已经在Bedrock上的模型并列，并与Bedrock上已经存在的所有工作流一起使用。”

导入自定义模型

根据英特尔AI子公司Cnvrg最近的一项民意调查，大多数企业通过构建自己的模型并对其应用进行细化来接近生成式人工智能。同样的企业表示，他们认为基础设施，包括云计算基础设施，是部署的最大障碍，调查显示。

通过自定义模型导入，AWS旨在迅速填补需求，同时与云服务对手保持竞争力。（亚马逊首席执行官安迪·贾西在最近给股东的年度信中预示了这一点。）

有一段时间以来，谷歌的 Vertex AI 一直允许客户上传生成式人工智能模型，进行定制，并通过API提供服务。Databricks 也长期提供工具集来托管和调整自定义模型，包括最近发布的自家DBRX。

当被问及定制模型进口有何不同之处时，菲洛明声称，它——以及Bedrock——提供了比竞争对手更广泛和深入的模型定制选项，并补充说“数以万计”的客户今天正在使用Bedrock。

“首先，Bedrock提供了多种方式让客户处理模型的服务，” Philomin说道。“其次，我们有大量围绕这些模型的工作流程 — 现在客户可以直接站在我们已经提供的所有其他模型旁边。大多数人喜欢的关键点是能够在相同的工作流程下跨越多个不同的模型进行实验，然后实际上将它们从同一个地方投入生产。”

那么，提到的模型定制选项是什么呢？

Philomin指出Guardrails，这让Bedrock用户可以配置阈值来过滤 - 或者至少尝试过滤 - 模型输出中的令人讨厌的言论、暴力和个人或企业的私人信息。（生成式AI模型以问题方式出错，包括泄露敏感信息；AWS的也不例外。）他还强调了模型评估，这是Bedrock工具，客户可以使用它来测试一个或多个模型在给定一组标准下的表现如何。

经过几个月的预览，"Guardrails"和"模型评估"现在已经全面推出。

我感到有必要在这里指出，目前自定义模型导入仅支持三种模型架构，即Hugging Face的Flan-T5、Meta的Llama和Mistral的模型。Vertex AI和其他类似Bedrock的服务，包括微软在Azure上的会议, 提供更多或更少相当的安全性和评估功能（请参阅Azure AI内容安全、Vertex中的模型评估等）。这方面的工具）。

然而，Bedrock独一无二的是AWS的泰坦生成式人工智能模型系列。同时，随着自定义模型导入的发布，这一领域出现了几个值得关注的发展。

升级版泰坦型号

Titan Image Generator是亚马逊AWS的文本生成图片模型，自去年11月预览发布后，现已正式推出。与之前一样，Titan Image Generator可以根据文字描述创建新图片，或者定制现有图片，例如在保留图片主体的同时更换背景。

与之前的版本相比，菲洛敏表示，GA中的泰坦图像生成器可以生成更具有“创造性”的图像，但没有详细说明。（我猜你对这是什么意思，就跟我一样好。）

我问Philomin是否有更多关于Titan Image Generator训练的细节可以分享。

在去年11月该型号首次亮相时，AWS并没有明确说明在培训Titan Image Generator时究竟使用了哪些数据。很少有供应商会轻易地透露这些信息；他们把培训数据视为竞争优势，因此对它及相关信息保持保密。

训练数据细节也是知识产权相关诉讼的潜在来源，是向外界透露许多细节的另一个阻力。几起正在法院审理中的案件拒绝供应商的公平使用辩护，认为文本到图像工具复制了艺术家的风格，而没有得到艺术家的明确许可，并允许用户生成类似艺术家原作的新作品，而这些艺术家没有收到任何支付。

Philomin只告诉我，AWS使用第一方和授权的数据的组合。

这比十一月的更详细。但我有一种感觉，Philomin的回答不会满足每个人，尤其是那些认为生成式 AI 模型训练涉及更大透明度的内容创作者和人工智能伦理学家。

亚马逊表示，为了保护客户利益，将继续提供赔偿政策，以防万一类似Titan Image Generator这样的模型产生了可能侵犯版权的训练样本。（包括微软和谷歌在内的几家竞争对手也提供类似的政策覆盖他们的图像生成模型。）

为了应对另一个紧迫的道德威胁——深度伪造（deepfakes），AWS表示，使用Titan Image Generator创建的图像将像预览时一样带有“抗篡改”的隐形水印。Philomin表示，在GA发布版本中，水印已经被设计得更加抗压缩和其他图像编辑和操纵。

转入较少争议性的领域，我问Philomin是否像谷歌、OpenAI和其他公司一样在探索视频生成，考虑到这项技术所带来的兴奋（和投资）。Philomin没有说AWS没有......但他也没透露更多信息。

“显然，我们一直在不断寻找客户想要拥有的新功能，视频生成在与客户的对话中肯定会提出，” Philomin说道。“我希望你能继续关注。”

在最新的与Titan相关的消息中，AWS发布了其Titan Embeddings模型的第二代，即Titan Text Embeddings V2。Titan Text Embeddings V2将文本转换为称为嵌入的数值表示，以支持搜索和个性化应用程序。第一代Embeddings模型也是如此，但AWS声称Titan Text Embeddings V2在整体上更加高效、具有成本效益并且更加准确。

Philomin声称，“Embeddings V2模型的作用是将整体存储空间缩减至原来的四分之一，同时保持97%的准确度，胜过其他类似的模型。”

我们将看看实际测试是否能证实这一点。