谷歌让其 Gemini 聊天机器人速度更快、应用范围更广。

AI7号2024-07-25457

Chat中文镜像

为了跟上 Anthropic 和 OpenAI 等生成式人工智能竞争对手的步伐,谷歌正在对其人工智能聊天机器人 Gemini 的免费层级进行更新。这些更新的重点是提高该平台的性能,并使其更广泛可用。

从周四开始,谷歌于 5 月宣布的轻量级多模态模型 Gemini 1.5 Flash 将以 40 种语言在约 230 个国家的网络和移动端上线。谷歌称,Gemini 1.5 Flash 在质量和延迟方面有所升级,在推理和图像理解方面的改进尤为显著。

对于谷歌来说是一个利好,在后端运行可能成本也更低。

在双子座 1.5 Flash 发布时,谷歌强调该模型是双子座 1.5 Pro 的“精简”且高效的版本,专为该公司所描述的“狭窄”、“高频”生成式人工智能工作负载而打造。鉴于为双子座这样的聊天机器人平台提供服务的开销(见:OpenAI 的 ChatGPT 账单),谷歌无疑渴望抓住降低成本的机会,特别是如果这些机会能幸运地在其他领域带来提升性能的副作用。

除了新的基础模型,谷歌表示正在将 Gemini 的上下文窗口扩展到 32,000 个标记,约合 24,000 个单词(或 48 页文本)。

上下文或上下文窗口是指模型在生成输出(例如,额外的文本)之前所考虑的输入数据(例如,文本)。具有更大上下文的模型的一些优势在于,它们能够对更长的文本片段和文件进行总结和推理(至少在理论上如此),并且在聊天机器人的情境中,它们不太可能忘记最近讨论过的主题。

此前,将文件上传至 Gemini 以进行分析的能力需要 Gemini Advanced,即谷歌每月 20 美元的 Google One AI 高级计划背后的付费版 Gemini。但谷歌表示,很快将为所有 Gemini 用户启用从 Google Drive 和本地设备上传文件的功能。

谷歌工程副总裁阿马尔·苏布拉马尼亚(Amar Subramanya)在与 TechCrunch 分享的一篇博客文章中写道:“你将能够做一些事情,比如上传你的经济学学习指南,并让 Gemini 为你创建练习题。”“Gemini 很快还能为你分析数据文件,让你发现见解,并通过图表和图形将其可视化。”

为了试图对抗幻觉现象(即像 Gemini 1.5 Flash 这样的生成式人工智能模型编造内容的情况),谷歌正在预览一项功能,在某些 Gemini 生成的答案下方显示相关网页内容的链接。在选定地区的英语 Gemini 用户将在 Gemini 生成的段落末尾看到一个“芯片”图标,其中带有指向网站的链接——如果你已授予 Gemini 访问你的 Gmail 收件箱的权限,还会有电子邮件的链接——你可以通过这些链接进一步深入了解。

这一举措是在有爆料称谷歌的生成式人工智能模型极易产生严重的幻觉之后做出的——例如,在披萨食谱中推荐无毒胶水,并编造归于真实人物的虚假书评。谷歌今年早些时候在 Gemini 中推出了一项“复查”功能,旨在突出其他在线来源证实或反驳的由 Gemini 生成的陈述。但相关的内容链接似乎是为了让 Gemini 可能获取信息的来源更加透明。

这位记者心中的问题是 Gemini 会以何种频率以及多高的准确性呈现相关链接。待定。

不过,谷歌并没有等待去充斥这些渠道。

今年早些时候在部分设备的 Messages 应用中推出 Gemini 之后,谷歌正在欧洲经济区(EEA)、英国和瑞士推出这一功能,并能够使用新添加的语言(如法语、波兰语和西班牙语)进行聊天。用户可以点击“开始聊天”按钮并选择 Gemini 作为聊天伙伴,在 Messages 应用中使用 Gemini 。

谷歌还在更多国家推出了 Gemini 移动应用程序,并在全球范围内将 Gemini 的使用权限扩展到青少年。

该公司在 6 月推出了针对青少年的双子座体验,允许学生使用他们的学校账户注册——但并非在所有国家都可以。在接下来的一周,这种情况将会改变,因为双子座将在所有通常向成年人提供服务的国家和地区向青少年开放。

在推出这项服务的同时,谷歌表示正在制定“额外的政策和保障措施”以保护青少年,但未详细说明。同时还推出了一个专门针对青少年的新引导流程,以及一个“AI 知识指南”——用谷歌的话说——“帮助青少年负责任地使用 AI”。

孩子们是在以预期的方式利用生成式人工智能工具,还是在滥用它们,这是一个存在巨大争议的话题。谷歌肯定急于避免出现这样的头条新闻:称 Gemini 是一个抄袭论文的生成器,或者能够就个人问题给青少年提供考虑不周的建议。因此,谷歌正在采取一切可能的措施来防止最坏的情况发生。