谷歌的 NotebookLM 利用 YouTube、音频文件来源和可共享的音频讨论来增强 AI 笔记功能。
谷歌周四宣布对其人工智能笔记和研究助手 NotebookLM 进行新的更新,允许用户获取 YouTube 视频和音频文件的摘要,甚至创建可共享的人工智能生成的音频讨论。这家搜索巨头旨在扩大该工具的使用案例和覆盖范围,该工具最初是在去年的 I/O 开发者大会上作为一个项目推出的,在美国首次向公众开放数月后,扩展到包括印度、英国和 200 多个国家的市场。
NotebookLM 最初由教育工作者和学习者使用,最近其用户群发生了重大转变,现在正在工作场所环境中吸引更多的人。
谷歌实验室的人工智能高级产品经理拉伊扎·马丁在一次独家采访中表示,该工具的用户目前大致分为两类,50%是教育工作者和学习者,另一半是商务专业人士。
她对 TechCrunch 表示:“人们现在正在共享笔记本,这正在产生一种网络效应。”
这促使 NotebookLM 团队推出新功能,希望增强其网络效应,使该工具在不同人群中受欢迎。
本月早些时候,NotebookLM 新增了音频概述功能,使用户能够将他们的文档转换为引人入胜的音频讨论。最新的更新扩展了这一体验,允许用户通过公共 URL 分享在 NotebookLM 中生成的音频概述。
要使用此功能,您点击工具中生成的音频概述上可用的共享图标以获取其 URL,然后您可以复制该 URL 并与他人分享。
马丁表示,她的团队看到专业人士在 NotebookLM 上上传网页、简历,甚至演示文稿来生成音频概述,然后与他们的雇主、同事或客户分享。
NotebookLM 还新增了对 YouTube 视频和音频文件(如.mp3 和.wav)的支持,将其作为新的源类型,同时它现有的支持类型包括 Google Docs、PDF、文本文件、Google Slides 和网页。这些新功能帮助用户总结 YouTube 视频的要点,并从他们的学习课程或项目的音频记录中生成要点和见解。
马丁告诉 TechCrunch ,由于谷歌实验室有一个为 NotebookLM 工作的小团队,该工具由该公司的多模态大型语言模型 Gemini 1.5 Pro 提供支持,团队为该工具添加的每一项新功能都基于用户反馈。
她说:“人工智能工具的有趣之处在于,很多假设都发生了变化。去年可能有用的东西,今年可能就没用了。”
去年年底,谷歌首先在美国推出了 NotebookLM。今年 6 月,谷歌将 NotebookLM 的使用范围扩大到了 200 多个国家。
马丁告诉 TechCrunch ,但未透露具体数字,虽然 NotebookLM 的大部分使用仍在美国,但日本已成为该工具的下一个大市场。这位高管还强调,其部分用户正在使用 NotebookLM 来获取与他们在该工具上设置的语言不同的基于人工智能的总结。
她说:“特别是在日本,我们看到很多文件不是用日语写的,但 NotebookLM 被设置为日语模式。所以人们用他们的母语进行查询,可能是用它处理复杂且密集的英语文件。”
谷歌表示,用户上传到 NotebookLM 的信息是私密的,不会被用于训练人工智能模型。要使用该工具,用户必须至少 18 岁。
不过,NotebookLM 作为一种人工智能工具,本身面临着一些固有的挑战。其中之一是,如果用户过于依赖 NotebookLM,他们可能很快就会失去阅读长篇内容和研究论文的习惯。这还可能导致过度简化的问题。
马丁告诉 TechCrunch ,她的团队非常清楚这些担忧。
NotebookLM 从用户上传的内容中提供可点击的引文,让用户更深入地了解总结的笔记。
她说:“我们努力鼓励您阅读原文。我们鼓励您仔细检查从 NotebookLM 得出的所有答案……您可以阅读 SparkNotes 或者原著,这始终取决于您自己。”
NotebookLM 目前仅限于网络使用,不过马丁表示其移动应用程序可能会在明年某个时候推出。
与此同时,团队正忙于添加更多新功能。马丁说,这些新功能将侧重于在输入方面增加更多支持,以及为输出提供新的来源。