
《科创板日报》9月21日讯(记者 黄心怡)随着生成式AI和大模型技术的迅猛发展,人工智能在材料科学中的应用,为材料的发现、设计、优化及性能预测开辟了全新的路径。
在由中国科学院上海硅酸盐所承办的2025浦江创新论坛之“AI For Material Science“专题论坛上,多名专家学者分享了AI驱动材料科学的思考和研究进展。
▍大数据驱动新材料研发
中国工程院院士谢建新在《新材料大数据中心建设思考》的主旨演讲表示,当前,伴随着大规模高效计算、颠覆性实验技术、大数据/大模型发展,数据驱动已成为新材料研发新范式的核心。有助于新材料发现,助力材料成分设计、工艺优化、性能/质量提升,加速新材料、新工艺的研发和应用。
随着全球加快推进材料数据资源整合和基础设施建设,材料数据库发展迅速。据统计,全球知名数据库已从2010年的16个发展至今天的近50个。
我国也在加快材料数据库的建设。2024年10月16日,工业和信息化部、财政部、国家数据局联合印发《新材料大数据中心总体建设方案》,全面部署新材料大数据中心建设,其目标是要通过建设公益性、权威性、国际化、可持续的新材料领域的可信数据空间。以解决当前材料数据存在的“孤岛化”现象,以及数据流转共享不通畅、开发利用不深入、潜值释放不充分等问题。
谢建新介绍,新材料大数据中心构建“1个主平台+N个数据资源节点”的架构。主平台打造可信数据空间,把数据提供方、应用方、服务方和可信数据运用方四方给有机联系起来,通过数据可信管控和资源互联互通,促进数据价值的实现。
谈及新材料可信数据空间的构建所面临的挑战,谢建新表示,一个是关键技术层面,包括材料数据自动采集处理技术,多源异构材料数据关联、融合和集成技术,基于语言大模型的材料数据管理和应用服务技术等都有待进一步探索;另一个是生态层面,包括材料大数据应用与赋能生态、供给与共享生态、市场与交易生态都有待持续完善。
▍让大模型激发科研潜力
今年7月,中国科学院自动化研究所副所长曾大军发布了由中国科学院联合团队研发的“磐石·科学基础大模型”。
据曾大军介绍,“磐石·科学基础大模型”是采用专业科学知识和数据进行训练、服务于科学任务的智能底座。该模型实现了对波、谱、场等多种科学模态数据的深入理解,具备科学文献萃取融合、科学知识表征推理和科学工具编排规划等核心能力,是“AI+科学”的“操作系统”。
在核心架构设计方面,“磐石·科学基础大模型”采用异构混合专家架构。在国产开源大模型基础上,面向科学领域进行深度定制,集成了自主研发的一系列面向共性科学数据模态的专用模型,并融合了AlphaFold、MatterGen等领域专业模型的能力。在化学合成实验效率提升、分子结构预测准确性改善、天文观测智能化资源调度与分析等方面发挥着重要作用。
曾大军介绍,通过使用磐石大模型,自动化所中一个对于材料科学没有太多涉足的团队,在上海硅酸盐所合作者指导下,成功地完成了高熵合金(HEA)催化剂的设计工作。曾大军称,如更多专业的材料科学家能够使用该工具,或将会激发出这一模型更多更大的潜力。
▍AI赋能材料设计
上海交通大学教授曾小勤表示,AI赋能材料设计,可以分为三个阶段,分别是数据驱动、大模型驱动,再走向智能体驱动。目前,大模型广泛应用于材料科学研究,包括辅助预测材料性能,结构化数据提取,高通量智能化实验,以及材料智能体构建等。
曾小勤透露,目前已开发了基于主动学习的不锈镁合金高通量设计技术,实现不锈镁合金的快速筛选,研制周期减少五分之四。设计了一种生成式可解释双模态耐腐蚀合金预测框架,性能优于传统纯数值预测模型,并具有强模型可解释性。此外,基于通义大模型等建立多层级智能体和自动化实验室的材料研发框架,解决合金数据量小数据复杂问题。
西安交通大学教授薛德祯也分享了生成式AI在合金设计中的应用。他表示,建立预测模型来生成所有可能的合金“池”,并对其进行排序。当池子小的时候是有效的,但池子比较大的时候,就不确定性很高。而生成式AI能够更好地解决合金设计所存在的挑战。比如,通过强化学习优化材料性能。
而南方科技大学教授张文清正尝试通过数学方面来让AI理解材料。 “我们把材料的物性变成一个数学场,以此所有的表达,都可以拥有在神经网络中的对应设计。”张文清介绍道。
张文清认为,面向材料科学的人工智能,需要理解材料的数学结构。目前材料特性场(MPF)的概念已经成熟,并且MPF确实融入了一些材料数学,特别是全局普适尺度化属性。MPF实现了自下而上的设计,包括材料特定的原子间势能、人工神经网络和特性公式,所有这些都具有通用缩放、超小参数化和超线性特性。SUS2-MLIP和PC-AGNN展现出卓越的物理可扩展性和效率,能够支持数百万原子数的模拟,所有这些都具有通用缩放、超小参数化和超线性特性。
不过,张文清也指出,材料科学与AI的融合发展,同样面临算力和数据的挑战。
