谷歌Deepmind推出了巨大的AlphaFold更新和免费的蛋白质组学服务网页应用程序
Google Deepmind发布了一款新版本的AlphaFold,这是他们的机器学习模型,预测蛋白质的形状和行为。AlphaFold3不仅更准确,还能预测与其他生物分子的相互作用,使其成为更多功能的研究工具—而且公司正在推出一款有限版模型供在线免费使用。
从2018年首次发布的AlphaFold开始,该模型一直是预测蛋白质结构的领先方法,根据组成它们的氨基酸序列进行预测。
尽管听起来似乎是一个狭隘的任务,但要理解蛋白质在分子水平上的作用对几乎所有生物学来说都是基础性的。近年来,像AlphaFold和RoseTTaFold这样的计算建模技术已经取代了昂贵的实验室方法,加快了成千上万研究人员在各个领域的工作。
但是这项技术仍处于持续发展阶段,每个模型都只是"前进道路上的一步",正如Deepmind创始人迪米斯·哈萨比斯在新系统的发布电话会议中所说。该公司去年底就开始透露有新系统即将发布,而现在正式首次亮相。
我会让科学博客详细解释新模型如何改进结果,但在这里只需要简单说一下,AlphaFold 3通过各种改进和建模技术,不仅更准确,而且更广泛适用。
蛋白质建模的局限之一是,即使你知道一系列氨基酸会呈现什么形状,也不意味着你一定知道它将结合到哪些其他分子以及如何结合。如果你想要实际应用这些分子,大多数人都需要通过更繁琐的建模和测试来找到答案。
“生物学是一个动态系统,你必须理解生物学的属性是如何通过细胞中不同分子之间的相互作用而产生的。你可以把AlphaFold 3看作是我们迈出的第一步,”Hassabis说。“它能够模拟蛋白质相互作用,当然还包括与其他蛋白质以及重要的DNA和RNA链相互作用的其他生物分子。”
AlphaFold 3允许同时模拟多种分子,例如一根DNA链,一些与DNA结合的分子,也许一些离子来增加趣味。下面是针对这种特定组合的结果,DNA的Ribbon沿中间上升,蛋白质粘附在侧面,我想那些离子就像小鸡蛋一样躺在中间。
这当然并不是一个科学发现本身。但是,甚至确定一个实验蛋白质会绑定在哪里,或以这种方式绑定,或者以这种形状扭曲,通常至少需要几天的时间,或者甚至可能需要几周到几个月的时间。
近几年来,这一领域的成就难以言表,但研究人员在很大程度上受到互动建模(新版本提供了一种形式)的缺乏和模型部署困难的限制。
这第二个问题或许是两者当中更大的挑战,因为虽然新的建模技术在某种程度上是“开放”的,但像其他人工智能模型一样,并不一定容易部署和操作。这就是为什么谷歌Deepmind提供AlphaFold服务器,一个免费的全托管Web应用程序,让该模型可供非商业用途。
这个工具是免费且非常容易使用的 - 我在通话中的另一个窗口中使用它,他们正在解释的时候(这就是我得到上面那张图片的方式)。你只需要一个谷歌账号,然后输入尽可能多的序列和类别 - 提供了一些示例 - 然后提交;几分钟后,你的工作应该完成,你将会得到一个实时的三维分子,颜色代表模型对该位置构象的信心程度。正如你在上面那个样本中看到的,带有提示和那些更容易暴露给不当原子的部分会更浅或为红色,表示信心程度较低。
我问是否公开版本与内部使用的模型之间是否有真正的区别;哈萨比斯说:“我们已经提供了大部分新模型的功能”,但没有进一步解释。
很明显,谷歌在展示它的实力,同时在一定程度上保留了最好的部分,当然这是他们的权利。制作一个像这样的免费托管工具需要投入大量资源——毋庸置疑,这是一个投入巨大资金的坑,对谷歌来说是一个昂贵的共享软件版本,旨在说服全球研究人员,AlphaFold 3至少应该是他们的一个利箭。
虽然如此,没关系,因为技术很可能会通过谷歌旗下的子公司以色列兰博 (Isomorphic Labs) 赚大钱(使它成为谷歌的...表亲?),该公司正在将 AlphaFold 等计算工具用于药物设计。如今,每个人都在使用计算工具,但以色列兰博率先使用 Deepmind 最新的模型,并结合“一些更具有专有性的与药物发现有关的东西”,正如哈萨比斯所指出的那样。该公司已经与礼来公司和诺华公司建立了合作关系。
AlphaFold并不是生物学的全部和终结,只是一种非常有用的工具,无数研究人员会同意这一点。它让他们可以做出Isomorphic的Max Jaderberg所说的“合理的药物设计”。
“如果我们考虑到,这对同质实验室每天的影响如何:它让我们的科学家、药物设计师能够在原子水平上创建和测试假设,然后在几秒钟内产生高度准确的结构预测…来帮助科学家理清需要进行的相互作用,以及如何推进这些设计来创造一种好的药物,”他说。“这与可能需要几个月甚至几年才能通过实验来做到这一点相比。”
尽管许多人会庆祝AlphaFold服务器等免费托管工具的成就和广泛可用性,但其他人可能会正确指出,这并不是开放科学的一次胜利。
像许多专有的人工智能模型一样,AlphaFold的训练过程和其他关键信息,关键部分是科学方法的基础,都被大部分地以及日益增加地保密。尽管发表在《自然》杂志上的论文详细介绍了其创作方法,但缺少许多重要细节和数据,这意味着想利用这个地球上最强大的分子生物学工具的科学家们必须在Alphabet、Google和Deepmind的监视下进行,而不知道哪个公司实际掌握了主导权。
多年来,开放科学倡导者一直在说,尽管这些进步令人惊叹,但从长远来看,公开分享这种信息总是更好的。毕竟,这就是科学前进的方式,而且世界上一些最重要的软件也是这样发展起来的。
让AlphaFold服务器免费提供给任何学术或非商业应用,在很多方面都是一个非常慷慨的举动。但Google的慷慨很少是无条件的。毫无疑问,许多研究人员将利用这段“蜜月期”尽可能多地使用这个模型,直到问题暴露出来。