谷歌将Gemini Pro引入到Vertex AI中

AI7号2024-01-112409

Chat中文版

上周,谷歌近期宣布的旗舰GenAI模型家族Gemini在Bard和Pixel 8 Pro上推出后,现已为使用Vertex AI的Google Cloud客户提供服务。

Gemini Pro是更强大的Gemini Ultra的轻量级版本,目前正在私密预览阶段,供一部分“特定用户”试用。现在,Gemini Pro可以通过新的Gemini Pro API在Google的全面管理的AI开发平台Vertex AI中进行公开预览。暂时来说,该API可以免费使用,但使用有一定限制(稍后会详细说明)。它支持38种语言和地区,包括欧洲,并具备聊天功能和过滤功能等特性。

“Gemini是一款最先进的原生多模态模型,具有复杂的推理和先进的编码技能。”Google Cloud首席执行官Thomas Kurian在周二的新闻发布会上表示:“现在,开发人员将能够利用它构建自己的应用程序。”

双子座 Pro API

默认情况下,Vertex 中的 Gemini Pro API 接受文本作为输入,并生成文本作为输出,类似于 Anthropic、AI21 和 Cohere 等生成文本模型的 API。另外,今天还推出了 Gemini Pro Vision 的预览版,它可以处理文本和图像(包括照片和视频),并输出类似于 OpenAI 的 GPT-4 with Vision 模型的文本。

图像处理解决了上周发布的双子座Gemini版本的一个主要批评问题——即虽然Gemini Pro型号的Bard可以在技术上“多模态”(即通过对文本、图像、视频和音频等多种数据进行训练),但却无法接受图像。在误导性的产品演示之后,人们对Gemini的图像分析性能和技能依然存在疑问。但现在,至少用户将能够亲自体验这个模型及其图像理解能力。

在Vertex AI内部,开发者可以根据特定情境和使用案例对Gemini Pro进行定制,利用与其他由Vertex托管的模型相同的微调工具。Gemini Pro还可以连接到外部API以执行特定操作,或者"接地"以提高模型响应的准确性和相关性,可以使用来自应用或数据库的第三方数据,也可以使用来自网络和Google搜索的数据。

引文核查——又是 Vertex AI 的另一个现有功能,现在也支持 Gemini Pro —— 它可以作为一种额外的事实核查措施,通过突出显示 Gemini Pro 使用的信息来源,来支持其回答的准确性。

“基准对比让我们能够将佳敏(Gemini)生成的答案与公司自身系统内的一组数据或网络信息进行比较,”库里安说。“这种对比可以提高模型答案的质量。”

库里安(Kurian)花了很多时间来强调吉米尼(Gemini) Pro的控制、管理和治理选项,似乎是在回应那些暗示吉米尼Pro不是最强模型的报道。这些保证足够让开发者相信吗?也许吧。但如果他们不相信,谷歌则将通过折扣来增加诱惑力。

在Vertex AI上,Gemini Pro的输入每个字符收费为$0.0025,而输出每个字符收费为$0.00005(Vertex的客户按照每1,000个字符支付费用,对于像Gemini Pro Vision这样的模型,按照每张图片支付费用)。这分别相比于Gemini Pro的前身,降价了4倍和2倍。而对于限定时间——直到明年初——Vertex AI的客户可以免费尝试Gemini Pro。

“我们的目标是以优惠的价格吸引开发者,”库里安坦诚地说道。

加强顶点

谷歌正在将其他新功能引入Vertex AI,希望以此来阻止开发者使用类似Bedrock的竞争平台。

有几个与Gemini Pro相关。不久之后,Vertex的客户将能够利用Gemini Pro来驱动定制的对话式语音和聊天机器人,提供谷歌所描述的“支持高级推理的动态交互”。Gemini Pro还将成为Vertex AI中驱动搜索摘要、推荐和答案生成功能的选项,利用来自不同来源(如OneDrive、Salesforce)的各种形式的文档(如PDF、图像)来满足查询需求。

库里安表示,他预计基于 Gemini Pro 动力的对话和搜索功能将在2024年“非常早期”推出。

在Vertex的其他地方,现在有了自动并行(Auto SxS)。作为对AWS最近宣布的Bedrock模型评估的回应,Auto SxS允许开发人员以“按需”、“自动化”的方式评估模型;谷歌声称Auto SxS比手动评估模型更快速和更具成本效益(尽管在独立测试之前还需进一步验证)。

Google还将从Mistral和Meta等第三方添加模型到Vertex中,并引入“逐步蒸馏”技术,该技术可以从较大的模型中创建更小、专业化和低延迟的模型。此外,Google还将其赔偿政策扩展到包括PaLM 2和其Imagen模型的输出,这意味着该公司将对因这些模型的输出而卷入知识产权纠纷诉讼的符合条件的客户进行法律辩护。

生成式人工智能模型有倾向性地重复训练数据,这对企业客户来说是一个明显的担忧。如果有一天发现像谷歌这样的供应商在没有事先获得合适的许可的情况下使用了有版权的数据来训练模型,那么该供应商的客户可能会因为将侵犯知识产权的作品引入其项目而陷入麻烦。

一些供应商声称公平使用作为辩护。但是,出于对企业的担忧,越来越多的供应商正在扩大其在GenAI产品中的赔偿政策。

谷歌不打算扩大其顶点AI的赔偿政策,覆盖利用Gemini Pro API的客户。然而,公司表示,一旦Gemini Pro API公开发布,他们将会这样做。

推荐阅读

Google的GitHub Copilot竞争对手现已正式推出,并将很快采用Gemini模型

2024-01-111294
Chat中文版

谷歌推出AI Studio,一个基于其Gemini模型的开发应用和聊天机器人的易于使用的工具

2024-01-112683
Chat中文版

OpenAI与Axel Springer达成协议,以许可新闻用于模型训练

2024-01-112295
Chat中文版

开放AI创业基金推出第二批Converge创业团队

2024-01-112041
Chat中文版

Instagram推出基于人工智能的背景编辑工具

2024-01-112235
Chat中文版