猜测、尝试、纠错,再猜测、再尝试……过去150多年里,传统的化学研究范式深度依赖“试错法”,其局限性使得物质创制的周期长、成本高,难以实现高效、节能。

AI会重新定义化学的未来吗?这是《科学》杂志发布的125个全世界最受关注的科学问题之一。那么,理想的化学研究应该是什么样?

在中科院精准智能化学重点实验室主任李震宇看来,就是把东西放进去,想让它转化成什么,就能百分百转化成什么,同时这个过程中不会产生其他不想要的东西。“这就要求整个化学研究做到精准的设计,中间所有过程是透明的,机理是清楚的,过程是可控制的。”


(资料图片仅供参考)

改变已经发生——在中国科学技术大学,一台名叫“小来”的机器人,正在代替人类化学家做实验,它能将传统历时约1400年的工作量缩短到5周。

这是以中国科学技术大学李震宇、姚宏斌、江俊等为代表的科研人员,深耕精准智能化学领域,推动科研范式变革取得的成果之一。

1400年变5周,化学品创制周期极大缩短

“本来只是想创制一个化学品,但过程中可能又释放出不想要的副产物,造成了环境污染。这也是为什么老百姓对化学存在刻板印象,认为其不环保、不经济、不安全。”李震宇表示,很长一段时间以来,科学研究要靠观察、做实验,层层总结经验形成理论。

随着大数据人工智能的兴起,一种新的研究范式逐步清晰——数据智能驱动的精准化学,这成为社会环境、经济发展和化学学科发展的迫切要求。

今年1月,以中国科学技术大学为依托单位的精准智能化学重点实验室获中科院批准建设。据李震宇介绍,实验室正在发展先进的理论计算方法,通过理论计算模拟得到大量精准的计算数据,同时通过实验精准表征,得到大量精准的实验数据。在此基础上学习这些数据,实现“从精准到智能”。在化学智能的助力下,实现对反应路径与材料物性的精准调控,完成“从智能到精准”的闭环,大幅提升化学研究的效率。

“如果有很多的数据,计算机自己就可以找出其中的关联,不需要由人先总结一个规律,再由实验或者计算加以验证,使研究速度大幅提高。”李震宇打了个比方,这是从步行到坐火箭的速度提升,将使以前的很多“不可能”变成“可能”。

这个平台有多强大?

以潜力巨大的高熵化合物催化剂为例:获得最优配方需要测试极其庞大的化学配比组合,如果依赖传统研究范式,这一过程可能需要1400年,而“机器化学家”发挥数据驱动和智能优化的优势,从55万种可能的金属配比中找出最优的高熵催化剂,仅需要5周时间。

“但现在也存在一些难点,最大的问题就是数据不统一。”中国科大化学与材料科学学院教授江俊表示,机器人能够阅读海量论文来获取数据,但由于实验室条件不同,测量标准也不一样,数据经常出现冲突。这可能导致机器人在阅读学习的过程中出现“误解”。

对此,江俊团队想出了一个新思路——用理论模拟大数据产生预训练模型,再依托应用实践小数据做校准,建立面向复杂体系的“理实交融”模型。“我们能够把化学知识、物理知识等底层知识数据化、代码化、迁移化,就有可能形成智能化的新研究范式。”

它是具备科学思维的“机器化学家”

在中国科大机器化学家实验室的大屏幕上,一个复杂实验的流程已经被设定好,液体进样站、磁力搅拌站、烘干工作站等工作站被一一连接起来。名为“小来”的机器化学家依次到各工作站进行操作,机械臂抓试管、称量、搅拌、离心、烘干……每做完一次实验,数据结果都会自动归档,累积到一定程度后进行自动分析。

“这个实验的任务是进行芬顿催化剂配方的优化。”其实,借助机器人完成化学实验,已有先例。2020年,利物浦大学研制出世界首个机器人化学实验员,一周之内可以研究1000种催化剂配方,相当于一个博士生4年的工作量。

那这两款化学机器人有何不同?

“对方团队的AI化学家没有物理模型,没有预见性,不能提出任何科学假设,差别在于‘小来’拥有了‘大脑’。”在江俊看来,这种方式能让机器人真正用智能决策去做实验,跳出了经验主义的陷阱,越来越多地从“人”的视角去思考,实现全流程智能化的闭环。

“它首先‘能学’,即模型漫无目的地学习化学知识,阅读海量文献;同时‘能想’,即调用底层的物理模型,结合大数据与人工智能技术进行思考和模拟计算;最终‘能做’,即自主完成实验验证,实现科学方法的闭环。”江俊说。

英国利物浦大学安德鲁·库珀就曾为“小来”点赞,称它是具备科学思维的“机器化学家”。

如今,“小来”已经大显身手了。中国科大邹纲团队筛选光学活性薄膜材料时,为找到目标材料,需要混合多种分子并且控制薄膜厚度、应力、灰度等工艺条件,其可能性有上百万种。团队努力了10年,终于将不对称因子提高到了1.2,但离理论极限2.0还有非常大的差距。借助“小来”,他们在2个月内找到了不对称因子1.95所需的工艺条件,高度逼近理论极限。

一个好的工具会带来很多可能性

日前,中国科大姚宏斌课题组、李震宇课题组的研究成果发表在《自然》上,他们通过材料结构和界面精准设计,开发出镧系金属卤化物基固态电解质新家族。

“这项工作的理论计算模拟部分使用了密度泛函理论、分子动力学模拟和键价位能等方法。”据中国科大在读硕士罗锦达介绍,分子动力学模拟在研究中起到了很关键的作用,能够从原子尺度理解锂离子的扩散行为,这对后续的实验合成有很大的指导作用。

其实,机器化学家只是开始。

“我们的目标是建成机器化学家大科学装置,在一整栋大楼里,布置上百个机器人、上千个智能化学工作站,真正解放化学家的双手,加快新化学品和新材料的研发创制。”江俊说。

“人类肉眼只能看到大致宏观的现象,通过光谱的精细测量,机器人可以把微观信息理解清楚,预测很多金属材料的催化活性。”谈及下一步计划,江俊表示,将为机器人安装红外探头和拉曼探头,使其既有红外视觉又有可见光视觉,可以像真正的化学家一样,闻到化学品的气味,看到化学品的颜色,感知温度、湿度和压力。

“第四次科技革命的驱动力,必然是机器智能,其途径将是AI for Science。”江俊说,中国科大的AI for Science不仅赋予了机器人科学思维,还可以将其大范围迁移应用。

这也是机器化学家与人类化学家的最大不同——人类化学家的培养需要经过阅读学习、掌握理论、实践操作、思考推演等漫长的科学训练,难以从一个人迁移到另一个人;而“机器化学家”可以进行海量阅读、多维思考、精准操作、快速迭代,仅需代码复制就能完成迁移,方便“科学家”的批量生产。

“有人质疑我说,人家是做颠覆性技术,你是颠覆同事。其实不是这样的。”江俊说,一个好的工具会带来很多可能性,科研人员会借此发现更多理论。

(光明日报全媒体记者崔兴毅 常河)

推荐内容