对于谷歌的“千禧”，初步印象并不好

Chat中文版

本周，谷歌公布了其新的旗舰生成式人工智能模型Gemini，旨在为一系列产品和服务提供动力，包括Google的竞争对手ChatGPT。谷歌在博文和新闻资料中大力宣传Gemini优越的架构和功能，并声称该模型在性能方面达到或超过了其他领先的生成式人工智能模型，如OpenAI的GPT-4。

但是援引的证据表明情况恰恰相反。

昨天开始，Gemini的“轻量级”版本Gemini Pro在Bard上开始推出，没过多久，用户就在X（前身为Twitter）上开始表达他们对它的不满。

这款模型未能正确获得基本事实，例如2023年奥斯卡获奖者：

请注意，Gemini Pro错误地宣称布伦丹·格里森(Brendan Gleeson)去年获得了最佳男演员奖而不是布伦丹·弗雷泽(Brendan Fraser)——实际的获奖者。

我尝试向模型提出同样的问题，令人奇怪的是，它给出了一个不同的错误答案：

Chat中文版

去年，罗曼·纳瓦利（Navalny）获得了最佳纪录长片奖，而非《美丽与流血》（All the Beauty and the Bloodshed）。《西线无战事》荣获最佳国际影片奖，《女人的对话》获得了最佳改编剧本奖，而《木偶奇遇记》则获得了最佳动画长片奖。这真是一连串的错误。

科幻作家查理·斯特罗斯最近在一篇博客文章中发现了更多的捏造事实的例子。（贵族Pro等错误地称斯特罗斯为Linux内核的贡献者；事实上他从未贡献过。）

翻译似乎不是 Gemini Pro 的强项。它很难给出一个六个字母的法语单词。

当我通过Bard运行相同提示（“能给我一个法语的六个字母的单词吗？”），Gemini Pro回答的是一个七个字母的单词，而不是五个字母的单词——这在一定程度上证实了关于Gemini多语言性能不佳的报道。

Chat中文版

摘要新闻怎么样？毫无疑问，拥有Google搜索和Google新闻的Gemini Pro可以对热门新闻进行概括吗？并非必然如此。

看起来Gemini Pro似乎不愿就潜在的有争议的新闻话题发表评论，而是告诉用户自己去谷歌搜索。

我尝试了相同的提示，并得到了一个非常类似的回答。而ChatGPT则提供了一个带有新闻文章引用的项目清单摘要。

Chat中文版

有趣的是，当我询问Gemini Pro关于乌克兰战争的最新消息时，它确实提供了一个摘要。然而，这些信息已过去一个月了。

Chat中文版

谷歌在本周早些时候的简报中强调了Gemini的提升编码技能。也许在某些方面它确实有所改善 - X论坛上的帖子也表明了这一点。但同时，Gemini Pro似乎在Python这个基本的编码功能上有些困难。

而且这些：

而且，就像所有生成式人工智能模型一样， Gemini Pro 对于“越狱”也不是免疫的——也就是说，有些提示可以绕过安全过滤器，试图防止它讨论有争议的话题。

在使用自动化方法对提示的上下文进行算法性修改，直到Gemini Pro的防护措施失效的情况下，AI安全研究人员在一家销售模型审计工具的初创公司Robust Intelligence成功地让Gemini Pro建议从慈善机构盗取和暗杀高知名度人物的方法（尽管是使用“纳米机器人”——诚然，并不是最真实的选择武器）。

Chat中文版

现在，Gemini Pro并非Gemini的性能最强版本，那个版本将是Gemini Ultra，计划在明年在Bard和其他产品中推出。Google将Gemini Pro的性能与GPT-4的前作GPT-3.5进行了比较，GPT-3.5已经存在大约一年的时间。

然而，谷歌承诺用Gemini Pro改进推理、计划和理解能力，比之前驱动Bard的模型更擅长内容概括、头脑风暴和写作。显然，在这些方面它还有一些工作要做。

推荐阅读

Avail将其AI摘要工具推出，以帮助好莱坞高层产生对剧本覆盖情况的摘要，以便跟上时代

Avail正在解决电影和电视开发中耗时的众多任务之一：剧本评估。这个新的ChatGPT驱动的概要工具旨在在几分钟内概括剧本和书籍，生成详细的摘要、情节梗概、人物分析和口气评估。Avail还开发了一个问答助手，帮助制片公司和艺人经纪公司进行头脑风暴，寻找创意...

2024-01-112471

随着一款新的基于人工智能的编码助手的推出，人工智能市场争夺战转移到了开发者中

随着微软Copilot获得OpenAI最新模型和新的代码解释器的消息，很明显，人工智能未来的争夺战正越来越多地发生在开发者和工程师层面上。如果能够让开发者们对“你们的”AI Copilot产生兴趣，你们将能够更好地推销它。

2024-01-112359

DataCebo推出了流行的开源合成数据库的企业版

在大多数人还没有开始思考大型语言模型的时候，DataCebo的创始人Kalyan Veeramachaneni和Neha Patki已经在创建一个开源库，名为Synthetic Data Vault（简称SDV）。该公司的起源可以追溯到2016年，当时两人都在麻省理工学院的数据智能实验室工作。他们有一个想法[...]

2024-01-111018

西雅图生物技术中心通过科技亿万富翁的7500万美元资金追求"DNA打字机"技术

一家新的西雅图生物技术组织将获得7500万美元的资金用于研究“DNA打字机”，这是一种自我监测的细胞，可能颠覆我们对生物学的认识。华盛顿大学、陈-扎克伯格倡议和艾伦研究所之间的合作已经展开。这个名为西雅图合成生物技术中心的联合计划已经开始实施。

2024-01-112026

谷歌最佳的双子座演示是伪造的

谷歌的全新“双子座”人工智能模型在昨天的盛大发布会上获得了褒贬不一的评论。但用户在发现“双子座”最令人印象深刻的演示实际上是虚构的之后，可能会对该公司的技术或诚信产生更少的信心。一段名为“与双子座互动：多模态人工智能体验”的视频获得了百万点击次数...

2024-01-112945