OpenAI 推出了具有更多声音和新外观的高级语音模式

AI7号2024-09-242704

Chat中文镜像

OpenAI 周二宣布,正在向更多 ChatGPT 的付费用户推出高级语音模式(AVM)。这个音频功能使与 ChatGPT 的交流更自然,最初将向 ChatGPT Plus 和 Teams 层级的用户推出。企业和教育用户将于下周开始获得使用权限。

作为推出的一部分,AVM 正在进行重新设计。该功能现在由一个蓝色的动画球体来呈现,而不是 OpenAI 在 5 月展示该技术时所呈现的动画黑点。

当 AVM 对用户可用时,用户将在 ChatGPT 应用程序中语音图标旁边收到一个弹出窗口。

好呀,请您给我提供需要翻译成简体中文的英文内容,以便我为您进行翻译。

ChatGPT 还新增了五种可供用户试用的声音:Arbor、Maple、Sol、Spruce 和 Vale。这使得 ChatGPT 的声音总数达到了九种(几乎与谷歌的 Gemini Live 一样多),此外还有 Breeze、Juniper、Cove 和 Ember。您可能会注意到,所有这些名字都受到了大自然的启发,这可能是因为 AVM 的整体目标是让使用 ChatGPT 的体验更自然。

在这一系列声音中缺少了 Sky 这一声音,它是 OpenAI 在春季更新期间展示的声音,这导致了斯嘉丽·约翰逊的法律威胁。这位在故事片《她》中饰演一个人工智能系统的女演员声称,Sky 的声音听起来与她自己的声音太相似了。OpenAI 迅速撤下了 Sky 的声音,并表示从未有意模仿约翰逊的声音,尽管当时有几名工作人员在推文中提及了这部电影。

此次推出缺少的另一个功能是:四个月前 OpenAI 在春季更新中首次推出的 ChatGPT 的视频和屏幕共享功能。该功能本应让 GPT-4 同时处理视觉和听觉信息。在演示过程中,OpenAI 的一名工作人员展示了如何向 ChatGPT 实时询问眼前一张纸上的数学问题,或者电脑屏幕上的代码。目前,OpenAI 尚未提供推出这些多模态功能的时间表。

话虽如此,OpenAI 表示,自发布 AVM 的有限 alpha 测试版以来,它已经做出了一些改进。据称,ChatGPT 的语音功能现在更善于理解口音,该公司还表示,其对话也更流畅、更快速。在我们对 AVM 进行测试期间,我们发现故障并不罕见,但该公司声称现在已经有所改善。

OpenAI 还将 ChatGPT 的一些定制功能扩展到了 AVM:“自定义指令”,它允许用户个性化设置 ChatGPT 对其的响应方式;以及“记忆”功能,它使 ChatGPT 能够记住对话以便之后参考。

一位 OpenAI 的发言人表示,AVM 在包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登在内的多个地区尚未可用。