OpenAI 推出了具有更多声音和新外观的高级语音模式

Chat中文镜像

OpenAI 周二宣布，正在向更多 ChatGPT 的付费用户推出高级语音模式（AVM）。这个音频功能使与 ChatGPT 的交流更自然，最初将向 ChatGPT Plus 和 Teams 层级的用户推出。企业和教育用户将于下周开始获得使用权限。

作为推出的一部分，AVM 正在进行重新设计。该功能现在由一个蓝色的动画球体来呈现，而不是 OpenAI 在 5 月展示该技术时所呈现的动画黑点。

当 AVM 对用户可用时，用户将在 ChatGPT 应用程序中语音图标旁边收到一个弹出窗口。

好呀，请您给我提供需要翻译成简体中文的英文内容，以便我为您进行翻译。

ChatGPT 还新增了五种可供用户试用的声音：Arbor、Maple、Sol、Spruce 和 Vale。这使得 ChatGPT 的声音总数达到了九种（几乎与谷歌的 Gemini Live 一样多），此外还有 Breeze、Juniper、Cove 和 Ember。您可能会注意到，所有这些名字都受到了大自然的启发，这可能是因为 AVM 的整体目标是让使用 ChatGPT 的体验更自然。

在这一系列声音中缺少了 Sky 这一声音，它是 OpenAI 在春季更新期间展示的声音，这导致了斯嘉丽·约翰逊的法律威胁。这位在故事片《她》中饰演一个人工智能系统的女演员声称，Sky 的声音听起来与她自己的声音太相似了。OpenAI 迅速撤下了 Sky 的声音，并表示从未有意模仿约翰逊的声音，尽管当时有几名工作人员在推文中提及了这部电影。

此次推出缺少的另一个功能是：四个月前 OpenAI 在春季更新中首次推出的 ChatGPT 的视频和屏幕共享功能。该功能本应让 GPT-4 同时处理视觉和听觉信息。在演示过程中，OpenAI 的一名工作人员展示了如何向 ChatGPT 实时询问眼前一张纸上的数学问题，或者电脑屏幕上的代码。目前，OpenAI 尚未提供推出这些多模态功能的时间表。

话虽如此，OpenAI 表示，自发布 AVM 的有限 alpha 测试版以来，它已经做出了一些改进。据称，ChatGPT 的语音功能现在更善于理解口音，该公司还表示，其对话也更流畅、更快速。在我们对 AVM 进行测试期间，我们发现故障并不罕见，但该公司声称现在已经有所改善。

OpenAI 还将 ChatGPT 的一些定制功能扩展到了 AVM：“自定义指令”，它允许用户个性化设置 ChatGPT 对其的响应方式；以及“记忆”功能，它使 ChatGPT 能够记住对话以便之后参考。

一位 OpenAI 的发言人表示，AVM 在包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登在内的多个地区尚未可用。

推荐阅读

Snapchat 利用谷歌的 Gemini 为其聊天机器人的生成式人工智能功能提供支持。

Snap 已与谷歌云达成扩大合作，为 Snapchat 的 My AI 聊天机器人中的生成式人工智能体验提供支持。该聊天机器人将利用谷歌 Gemini 的多模态功能......

2024-09-242458

Workera 的首席执行官曾受吴恩达指导。现在，他希望有一个人工智能代理来指导您。

基安·卡坦福鲁什在人工智能领域拥有最出色的导师之一：著名研究员吴恩达，他也是基安在斯坦福大学读研究生时的导师。这两人继续……

2024-09-24996

微软声称其新工具能够纠正人工智能的幻觉，但专家建议谨慎对待。

微软今日披露了“Correction”（修正）服务，该服务试图自动修正那些存在事实性错误的人工智能生成的文本。

2024-09-242117

Torq 是一家实现网络安全工作流程自动化的公司，它新获 7000 万美元资本。

随着网络攻击的数量不断增加，企业界对有助于自动应对违规行为的技术的兴趣日益浓厚。根据分析公司 Devo 在 2023 年的一项调查，80%的安全……

2024-09-24984

加密货币诈骗者入侵了 OpenAI 在 X 平台（原推特）上的新闻账号。

OpenAI 在 X（原推特）上的官方新闻账号似乎已被同一批加密货币诈骗者入侵，此前几个月该公司领导层的账号也遭遇了同样的情况。周一傍晚时分，OpenAI......

2024-09-24593