本周AI动态:微软将AI广告贴在键盘上
跟上一个迅速发展的人工智能行业是一项艰巨的任务。所以,在一个人工智能能够帮助你之前,这里有一份方便的机器学习领域近期新闻的综合概述,以及我们没有单独报道的重要研究和实验。
本周在AI领域,微软发布了一种全新的标准PC键盘布局,其中包含了一个名为“Copilot”的特殊按键。没错,从现在开始,Windows设备将配备一个专门用于启动微软基于人工智能的助手Copilot的按键,代替原本的右CTRL键。
可以想象,此举旨在显示微软对于争夺消费者(以及企业)AI主导地位的投资的严肃性。这是微软近30年来首次更改Windows键盘布局;带有Copilot键的笔记本电脑和键盘将于2月底开始发货。
但这只是吹牛吗?Windows用户真的想要人工智能快捷方式,还是微软特定的人工智能?
微软显然在将几乎所有新旧产品都注入了“Copilot”功能,并以此做了一场大秀。在引人注目的主题演讲、精彩的演示和现在的人工智能策略,该公司将其人工智能技术置于突出位置,并押注于此来推动需求。
需求并不是一件确定的事情。但公平地说,有几家供应商成功地将热门人工智能产品转化为成功。以OpenAI为例,他们开发的ChatGPT据称在2023年年底的年化收益超过16亿美元。创作艺术平台Midjourney似乎也是盈利的,并且还没有吸引任何外部资本。
然而,请重点关注一部分。大多数供应商由于培训和运行尖端人工智能模型的费用负担沉重,不得不寻求更大规模的资本来维持生存。以Anthropic为例,据说他们正在筹集7.5亿美元的资金,这将使他们总筹集的资金超过80亿美元。
微软与其芯片合作伙伴AMD和英特尔希望人工智能处理能力能够从昂贵的数据中心转移到本地硬件,实现人工智能的大众化应用。为此,英特尔推出了新一代面向消费者的芯片,集成了专门设计的处理核心用于运行人工智能任务。此外,微软等公司还推出了适用于数据中心的新芯片,可以使模型训练的成本大幅降低。
但这并没有保证。真正的考验将是观察Windows用户和企业客户是否对这项技术感兴趣,并为之支付费用,这些用户是如此接收到了Copilot的广告轰炸。如果他们并不感兴趣,那么微软可能不久就需要再次重新设计Windows的键盘。
以下是过去几天里一些值得注意的人工智能故事:
- 副驾驶员登陆手机端:微软悄悄地将副驾驶员的客户端带到了安卓和iOS以及iPadOS平台。
- GPT 商店:OpenAI 宣布计划在接下来的一周内推出一个 GPT 商店,该商店将提供基于其文本生成 AI 模型(例如 GPT-4)的定制应用程序。GPT 商店在去年 OpenAI 的第一届年度开发者大会 DevDay 上宣布,但在去年 12 月推迟了,这几乎可以肯定是由于在初始公告之后发生的领导层变动所造成的。
- OpenAI缩小了规避风险:在OpenAI的另一条新闻中,这家初创企业通过一个爱尔兰实体将其海外业务大量引流,以减小在欧盟的监管风险。娜塔莎称,此举将减少一些隐私监管机构单方面对关切问题的行动能力。
- 培训机器人:谷歌的DeepMind机器人团队正在探索方法,让机器人更好地理解我们人类需要它们做什么。Brian写道,该团队的新系统可以管理一组协作工作的机器人,并提出可以由机器人硬件完成的任务。
- 英特尔的新公司:英特尔将成立一个新的平台公司——Articul8 AI,得到了总部位于佛罗里达州博卡拉顿的资产管理公司和投资者DigitalBridge的支持。正如英特尔的发言人解释的那样,Articul8的平台“提供了能够在企业安全范围内保护客户数据、培训和推断的人工智能能力”,对于医疗保健和金融服务等高度规范的行业的客户来说,这是一个有吸引力的前景。
- 暗黑渔业曝光:卫星图像和机器学习提供了对海洋产业,尤其是渔船和运输船数量和活动的更为详细的视角。事实证明,这些数量要远远超过公开可得数据所示——这是由全球渔业观察(Global Fishing Watch)团队以及多所合作大学的研究揭示的。该研究发表在《自然》杂志上。
- AI驱动的搜索:Perplexity AI是一个将人工智能应用于网络搜索的平台,它在一轮融资中筹集了7360万美元,公司估值为5.2亿美元。与传统搜索引擎不同,Perplexity提供了类似聊天机器人的界面,允许用户用自然语言提问(例如“我们在睡觉时会燃烧卡路里吗?”“最不被游客访问的国家是哪个?”)。
- 自动书写的临床笔记:在更多的融资消息中,总部位于巴黎的初创企业Nabla成功融资2400万美元。该公司与美国医疗巨头凯泽永久医疗集团合作,致力于为医生和其他临床人员研发一款“AI副驾驶”,能够自动记录笔记并撰写医疗报告。
更多的机器学习
在过去的一年里,可能你还记得有很多有趣的工作例子,通过对图像进行微小的修改可以让机器学习模型产生误判,比如把一张狗的照片误认为是一张汽车的照片。他们通过添加“扰动”,也就是微小地改变像素的方式来实现这一点,而这种模式只有模型能够察觉到。或者至少他们认为只有模型能够察觉到。
Google DeepMind的研究人员进行的一项实验表明,当一张花朵的照片被修改得更像猫的样子呈现给人工智能时,人们更有可能将该图片描述为更像猫,尽管它实际上并不看起来像猫。对于卡车和椅子等其他常见物体也是如此。
为什么?怎么做?研究人员并不真正知道,参与者都感觉自己只是随机选择(实际上影响力虽然可靠,但几乎不超过偶然的几率)。看起来我们比想象中更有洞察力,但这也对安全和其他措施产生影响,因为它表明潜意识信号确实可以通过图像传播而无人察觉。
这周MIT进行了一项有关人类感知的有趣实验,利用机器学习来帮助阐明一种特定的语言理解系统。基本上,像“我走到海滩上”这样的简单句子几乎不需要大脑的解码能力,而像“在哪个贵族制度的影响下发生了一场悲惨的革命”这样复杂或令人困惑的句子会产生更多、更广泛的激活,这是通过fMRI进行测量得出的。
团队比较了人类在阅读各种这样的句子时的激活读数与同样句子在一个大型语言模型的皮层区域中的激活情况。然后,他们建立了一个第二个模型,学习了这两种激活模式如何相互对应。这个模型能够预测新句子是否会对人类认知造成负担。听起来可能有点晦涩,但绝对非常有趣,相信我。
机器学习能否在与计算机界面的互动等更复杂领域模拟人类认知,这仍是一个非常开放的问题。虽然有很多研究,但仍值得关注。本周,来自俄亥俄州立大学的研究人员开发了一个名为SeeAct的系统,该系统通过大量实际示例来对机器学习的可能行动进行详细解释。
基本上,你可以要求类似GPT-4V的系统在一个网站上创建一个预订,它会理解自己的任务以及需要点击“预订”按钮,但它并不真正知道如何做到这一点。通过改进它对带有明确标签和全球知识的界面的感知能力,它可以做得更好,即使它仍然只有一部分时间能够成功。这些代理模型还有很长的路要走,但今年还是会有很多大胆的宣称!我今天刚听到一些。
接下来,让我们来看一下我从未意识到但却非常有道理的有趣解决方案。自动船舶是自动化的一个很有前景的领域,但是当海洋状况恶劣时,要确保它们沿着规定轨道航行是非常困难的。GPS和陀螺仪无法解决这个问题,能见度可能也很差,但更重要的是,控制船舶的系统并不是太复杂。因此,如果它们不知道更好的路线,它们可能会偏离目标或浪费燃料走大弯路,而这对于依靠电池供电的船舶来说是一个大问题。我从来都没有想过这一点!
韩国海洋大学(今天我学到的另一件事)提出了一个基于计算流体力学模型中船舶运动模拟的更强大的寻路模型。他们提议,对波浪作用及其对船体和推进系统的影响有更好的理解,可以严重提高自主海上运输的效率和安全性。甚至在那些船长不太确定对于给定的狂风暴雨或波浪形态来说最佳的进攻角度是什么的人工引导船只中使用也是有意义的!
最后,如果你想回顾一下去年在计算机科学领域取得的重大进展,尤其是与机器学习研究有很大交集的部分,请阅读Quanta杂志出色的回顾文章。