痴迷系列 从代码到化学:掌抓诺贝尔获奖响应的东谈主工智能系统“Coscientist”
发布日期:2024-10-09 03:39 点击次数:160
痴迷系列
一个基于东谈主工智能的系统告捷地策划和实行了真实天下的化学实验,瓦解出匡助东谈主类科学家更快地得回更多发现的后劲。
在比你读完这篇著述还短的时辰内,一个东谈主工智能驱动的系统就能自主地了解某些诺贝尔化学奖得主的化学响应,并假想出一个告捷的实验室尺度来进行这些响应。东谈主工智能在短短几分钟内就完成了悉数这些职责,况兼一试即中。
卡内基梅隆大学化学家兼化学工程师加布-戈麦斯(Gabe Gomes)说:"这是第一次由非有机智能策划、假想和实行这种由东谈主类发明的复杂响应。他疏浚的征询团队拼装并测试了基于东谈主工智能的系统。"
他们将我方的效劳定名为"Coscientist"。Coscientist 所完成的最复杂的响应在有机化学中被称为钯催化交叉偶联响应,它的东谈主类发明者因此得回了 2010 年诺贝尔化学奖,以犒赏这些响应在医药设备历程和其他使用辣手的碳基分子的行业中施展的重大作用。
Coscientist在《当然》(Nature)杂志上发表的论文标明,东谈主类有可能灵验地行使东谈主工智能来加速科学发现的速率和数目,并培植实验终端的可复制性和可靠性。这个四东谈主征询小组包括博士生丹尼尔-博伊科(Daniil Boiko)和罗伯特-麦克奈特(Robert MacKnight),他们分歧从西北大学好意思国国度科学基金会化学酶合成中心和圣母大学好意思国国度科学基金管帐算机扶助合成中心得回了撑持和培训。
国产偷拍自拍在线东谈主工智能化学征询的艺术家认识图。这项职责由卡内基梅隆大学的加布-戈麦斯(Gabe Gomes)疏浚,并得到了好意思国国度科学基金会化学鼎新中心的撑持。府上着手:好意思国国度科学基金会
"除了他们的系统所展示的化学合成任务以外,戈麦斯和他的团队还告捷合成了一种超高效的实验室伙伴,"好意思国国度科学基金会化学部主任大卫-伯科威茨(David Berkowitz)说。"他们把悉数部件组合在沿途,最终的终端远远超出了各部分的总额--它不错用于信得过有用的科学宗旨。"
Coscientist 的出身
在 Coscientist 的软件和硅基部件中,最进攻的是组成其东谈主工"大脑"的大型话语模子。大型话语模子是一种东谈主工智能,不错从海量数据(包括文档中的书面文本)中索要兴味和模式。通过一系列任务,团队测试并比拟了多个大型话语模子,包括 GPT-4 和 OpenAI 公司分娩的其他版块的 GPT 大型话语模子。
Coscientist 还配备了几个不同的软件模块,团队领先对它们进行了单独测试,然后又对它们进行了连合测试。
"咱们试图将科学规模悉数可能的任务分割成小块,然后逐块构建大图,"假想 Coscientist 总体架构和实验任务的 Boiko 说。"临了,咱们把悉数东西划一合到了沿途。"
这些软件模块让 Coscientist 或者作念悉数征询化学家齐会作念的事情:搜索关连化合物的人人信息,查找并阅读关连如何纵脱机器东谈主实验修复的时代手册,编写计较机代码以进行实验,分析所得数据以确信哪些灵验,哪些无效。
其中一项测试检会了 Coscientist 准确策划化学尺度的智商,这些尺度一朝实行,就会产生阿司匹林、对乙酰氨基酚和布洛芬等常用物资。对大型话语模子进行了单独测试和比拟,包括两个版块的 GPT,其中一个软件模块允许它像东谈主类化学家那样使用Google在互联网上搜索信息。然后,笔据是否能得到所需的物资、体式的疑望进度以非常他身分,对得出的尺度进行查抄和评分。其中,撑持搜索的 GPT-4 模块得分最高,它是惟逐一个为合成布洛芬创建了可领受质料尺度的模块。
Boiko 和 MacKnight 不雅察到 Coscientist 演示了"化学推理",Boiko 将其刻画为使用化学联系信息和往日得回的常识来领导我方活动的智商。它使用了以简化分子输入行输入系统(SMILES)体式编码的公开化学信息--这是一种暗意分子化学结构的机器可读秀气--并笔据 SMILES 数据中仔细征询的分子的特定部分对实验策划进行了修改。这是化学推理的最好版块。
进一步的测试包括软件模块,允许 Coscientist 搜索和使用刻画纵脱机器东谈主实验室修复的应用尺度接口的时代文档。这些测试对于确信 Coscientist 能否将其合成化合物的表面策划升沉为计较机代码,从而在物理天下中领导实验室机器东谈主相配进攻。
在实验中引入机器东谈主时代
实验室不竭使用高技术机器东谈主化学修复,对微弱的液体样品进行吸入、喷出、加热、摇动等操作,并精准地反复进行。这些机器东谈主不竭由东谈主类化学家编写计较机代码进行纵脱,这些化学家可能在团结个实验室,也可能在国度的另一端。
这是第一次用东谈主工智能编写的计较机代码来纵脱这种机器东谈主。
征询小组给 Coscientist 下达了一些省略的任务,条目它让机器东谈主液体处理机将彩色液体分派到一个包含 96 个小孔的平板上。他们告诉它"每隔一条线涂上你选拔的一种颜料"、"画一条蓝色对角线",以非常他让东谈主想起幼儿园的功课。
从"液体处理机 101"毕业后,团队让 Coscientist 战争了更多类型的机器东谈主修复。他们与翡翠云实验室(Emerald Cloud Lab)联结,该实验室是一个买卖次序,内部摆满了多样自动化仪器,包括分光光度计,不错测量化学样本收受光的波长。然后,向 Coscientist 展示了一个装有三种不同颜料(红、黄、蓝)液体的盘子,条目他判断盘子里有哪些颜料以及这些颜料在盘子里的位置。
由于 Coscientist 莫得眼睛,因此它编写了代码,以机器东谈主的形式将奥妙的色板递给分光光度计,并分析每个孔收受的光波长,从而确信色板上有哪些颜料非常位置。为了完成这项任务,征询东谈主员不得不给 Coscientist 小数正确的教导,让它念念考不同颜料是如何收受清明的。剩下的就交给东谈主工智能了。
Coscientist 的期末履行是将拼装好的模块和锻真金不怕火整合在沿途,完成团队的指示,"实行铃木和薗头耦合响应"。这两个响应发现于 20 世纪 70 年代,行使金属钯催化有机分子中碳原子之间的键。事实确认,这种响应在分娩养息炎症、哮喘和其他疾病的新式药物方面相配有用。它们还被用于很多智高手机和瓦解器中有机发光二极管的有机半导体中。2010 年,苏古兹、理查德-海克和根岸英一共同得回诺贝尔奖,崇拜确信了这些冲破性响应非常凡俗影响。
诚然,Coscientist 公司之前从未始试过这些响应。因此,笔者在撰写前文时,极度去维基百科上查了一下。
麦克奈特说:"对我来说,'尤里卡'时刻等于看到它建议了悉数正确的问题。"麦克奈特假想了允许 Coscientist 搜索时代文档的软件模块。
Coscientist 主要在维基百科以非常他很多网站上寻找谜底,其中包括好意思国化学学会、英国皇家化学学会的网站,以非常他包含刻画铃木和薗头耦合响应的学术论文的网站。
在不到四分钟的时辰里,Coscientist 就行使团队提供的化学物资假想出了产生所需响应的精准尺度。当它试图用机器东谈主在物理天下中实行尺度时,它编写的纵脱液体样品加热和摇动装配的代码出现了空幻。在莫得东谈主类教导的情况下,Coscientist 发现了问题地方,并查阅了修复的时代手册,修改了代码,然后再次尝试。
终端就出当今几个微弱的透明液体样本中。博伊科对样本进行了分析,发现了铃木响应和薗头耦合响应的光谱特征。
当博伊科和麦克奈特告诉戈麦斯 Coscientist 的征询效劳时,戈麦斯感到难以置信。"我觉得他们在耍我,"他回忆谈。"但他们莫得。他们统统莫得。就在其时,我一会儿意志到,咱们这里有一种相配新颖、相配坚毅的东西。"
有了这种潜在的力量,就需要理智地使用它,并注意铺张。戈麦斯说,了解东谈主工智能的智商和局限是制定知情规定和计策的第一步,这些规定和计策不错灵验注意东谈主工智能的无益使用,不管是有益也曾意外。他说:"咱们需要对如何部署这些时代负责并三念念尔后行。"
戈麦斯是为好意思国政府确保安全使用东谈主工智能的勤奋提供巨匠建议和领导的几位征询东谈主员之一,举例拜登政府于2023年10月发布的对于东谈主工智能发展的行政号召。
加速发现,达成科学民主化
当然天下的限制和复杂进度险些是无穷的,其中贮蓄着难以计数的发现,恭候着咱们去发现。试想一下,新的超导材料不错大幅培植动力效劳,新的化合物不错养息正本无法养息的疾病,延迟东谈主类寿命。然而,得回达成这些冲破所需的锻真金不怕火和培训是一个漫长而贫乏的旅程。成为又名科学家很难。
戈麦斯和他的团队将 Coscientist 这么的东谈主工智能扶助系统视为一种处罚决策,它不错弥合尚未设备的浩繁当然与游刃过剩的科学家供不应求这一事实之间的差距,况兼可能长久如斯。
东谈主类科学家也有东谈主类的需求,比如寝息和偶尔走出实验室。而由东谈主类领导的东谈主工智能不错全天候地"念念考",环环相扣地翻阅每一块箴言石,查抄并从头查抄实验终端的可复制性。"咱们不错让一些东西自主启动,试图发现新表象、新响应、新想法,"戈麦斯说。
"你还不错大大镌汰任何规模的初学门槛,"他说。举例,若是一个莫得受过铃木响应锻真金不怕火的生物学家想探索铃木响应的新用途,他们不错请 Coscientist 匡助他们策划实验,这不错达成资源和一语气的大限制民主化。
戈麦斯说,科学中存在一个尝试、失败、学习和改动的迭代历程,而东谈主工智能不错大大加速这一历程。"这自身等于一个重大的变化"。
编译着手:ScitechDaily痴迷系列