谷歌在印地语中的人工智能概述需要进行质量升级
鉴于印度语言的多样性,数字内容公司在努力准确展示和翻译内容方面已经面临挑战。谷歌最近在该国推出的人工智能概述也面临着类似的问题。
该公司早在 8 月初就在该国为人工智能概述引入了印地语支持。印度的用户在不离开搜索页面的情况下也可以在印地语和英语之间切换。但该功能令人失望地不稳定。
一个简单的例子是我们从谷歌博客中选取的一个结果。该 GIF 展示了“Cheeni ki jagah chai mai kya daal sakte hai?”(意思是“在茶里,什么可以替代糖?”)的答案。在测试过程中,我们把单词的顺序改为“Chai mai cheeni ke jagah kya daal sakte hai?”,而谷歌根本就没有给出答案。
我们发现的另一个问题是对英语单词进行逐字翻译。当我们用印地语询问“夏天我们可以吃什么样的食物?”时,其中一个答案是“Chiknai wali cheezien”,意思是“粘性的东西”——这令人困惑。当我切换到英语时,谷歌给我显示了“油性的”作为一个选项,在食物方面,“油性的”和“粘性的”是完全不同的东西。不管怎样,这都是一个有点奇怪的建议。
在另一个例子中,当我们询问有关 YouTube 的所有权时,AI 概述用印地语说“直到 2023 年 2 月 16 日,尼尔·莫汉是谷歌的首席执行官”,这是不正确的。英文文本有正确的版本,说“截至 2023 年 2 月 16 日,尼尔·莫汉是谷歌首席执行官”。
也存在质量方面的问题。当我们询问“今年排灯节是什么时候?”时,我们没有得到一个简单的回答,而是先得到了一段关于去年排灯节的内容,然后是一组链接轮播,最后才是我们想要的实际答案。
当我们多次用印地语和英语询问是否可以吃加了香料的食物时,通过 AI 概述我们得到了不一致的答案。
然而,在与月经和怀孕等其他主题相关的方面,有更多令人担忧的结果。对于我们的一个问题,即关于某人婚后应该何时考虑要孩子,概述答案的第一段用令人困惑的印地语表示,夫妻应该至少等待两年。
它还提到,如果有人在 25 岁左右结婚,他们有“三年”——但没有具体说明是为了什么。这一段显然来源于印度一个新闻网站上的一篇印地语幻灯片文章,该文章是根据 Quora 和其他博客上的各种观点编写的这条信息。
当我们问到女性经期该吃什么食物时,一些回答建议“喝加了很多东西的牛奶”以及吃柠檬来缓解情绪波动。
谷歌的人工智能概述也缺乏背景信息。当我们询问德里的美食场所时,它建议说,Bangla Sahib Gurudwara(锡克教徒的礼拜场所)全天候开放,并且您可以在那里喝到茶,吃到像萨莫萨三角饺和kachori 这样的印度小吃。然而,这没有提及原始文章中提到的重要内容:您可以在古尔杜瓦拉外面买到这些东西,这是人工智能工具在总结时遗漏的关键词。小吃不在礼拜场所内。
对于一些类似的问题,英语的搜索结果比印地语的要好得多。这部分可能是由于该语言有更多更好的可用资源。但我们强调的一些问题是由于谷歌系统的错误造成的,例如脱离上下文的摘要和不准确的翻译。谷歌一直在努力解决在印度的搜索和语言问题,人们原本期望它在首次尝试时就能提供更好的结果。
谷歌告诉 TechCrunch,其人工智能概述仅会在对输出质量有高度信心的查询中出现,并表示该功能“根植于我们的核心搜索质量系统”,且“只会显示有顶级网页结果支持的信息”。
谷歌的一位发言人告诉 TechCrunch:“我们的测试表明,AI 概述的准确率与特色片段等其他功能相当。当出现问题时,可能是我们的系统误解了网络内容或反映了网络上的不准确之处导致的——我们会像对待所有搜索功能一样,利用这些例子来进行改进。”
谷歌可以归咎于其所引用来源的质量。然而,是谷歌的算法决定了这个问题和来源值得由人工智能进行总结。并非所有用户都会查看来源网站上的材料,而只是指责谷歌显示了不准确或难以理解的答案。
对于谷歌来说,人工智能概述一直是一项令人失望的尝试。今年早些时候,该公司因从 Reddit 上获取答案并告知用户在披萨上添加胶水而备受指责。人工智能概述还告诉另一位用户“每天吃一小块石头”,这个答案源自《洋葱报》。我们在印地语中测试的许多例子根本没有提供关于该主题的正确信息。
印度有超过 8.3 亿互联网用户,其中很大一部分使用谷歌进行搜索。如果该公司希望更多的人使用本地语言的人工智能概述,就需要在语言和内容的准确性方面加大力度。