材料软件被海外巨头垄断,本土如何实现自主可控?

狮门说科技 2024-07-19 15:06:55

资料源:五矿证券;作者:孙亮

材料软件分为材料发现软件和材料计算软件,前者对应“预测”,后者对应“仿真”。材料研发流程是“预测-验证”。在预测阶段,材料发现软件通过大数据和机器学习,找到材料成分、结构和性能参数之间关系的规律,由期望的性能参数,得到材料的预测列表。在验证阶段,材料计算软件通过初始材料和环境的数据计算出最终的性能参数,实现“模拟实验”。

材料软件能降本增效。传统的材料研发是“试错法”,费时费力,新材料从研发到产业化应用大约需要 10-20 年。根据美国材料基因组计划的报告,若应用先进的 ICME 研发模式和材料软件,能节省一半传统研发时间。

材料软件开发难度大。材料发现软件的核心是大数据和机器学习技术,有限的数据、昂贵的算力和算法的局限性是其发展的限制。材料计算软件发展较为成熟,核心是将不同场景的计算方法转化为代码,形成不同计算模块,发展的难点在于多尺度计算的融合。

全球:材料软件发展成熟,市场天花板不高。材料发现软件多创新企业,

Citrine 是领先者;材料计算软件市场基本被传统工业软件巨头公司垄断,如达索的 Material Studio、新思的 QuantumATK,“小而美”的公司在细分领域有一定地位。同时,国外材料软件的商业价值不高:Material Studio 的母公司 Accelry,2014 年被达索收购的金额约为 7.5 亿美元,商誉为 4.5 亿美元;2023 年材料发现软件公司 Citrine Informatics 估值约仅不到 1 亿美元。

国内材料软件公司与国际存在差距。我国企业材料研发数字化程度低,尚未开始使用材料发现软件,材料计算软件渗透率低,市占率最高的是 Material Studio。国内产品在计算场景、计算方法和数据库的丰富程度上和国外仍有差距。目前 Material Studio 对我国军方禁用,对我国新材料产业的自主可控产生了不利影响。

材料软件作为新材料产业必不可少的效率工具,如何实现自主可控?材料软件的开发难度大,材料软件的商业价值不高,很难完全依靠市场化的方式实现材料软件的自主可控,可能需要非市场化的方式推动国产材料软件的发展。

一、什么是材料软件?

材料软件是能帮助材料研发的软件,分为在预测环节起作用的材料发现软件,和在验 证环节起作用的材料计算软件。

(一)传统研发方式依赖人来试错,数字化研发方式极大提高了效率

材料研发流程是“预测-验证”的过程。首先构建材料结构的预测池,然后通过实验或者计算机模拟的验证对应的性能,进而筛选、修改最初的预测。

材料传统的研发方式是“试错法”,费时费力。传统研发方式在预测环节中依赖总结文献、专家经验,用类似“炼金术”的方式,列出多种材料组合,在验证环节制造出样本,进 行人工实验验证,再根据结果修改预测池或者重新设计材料结构,循环往复,如“大海捞针 ”,消耗时间巨大,并且有些实验条件苛刻,难以实施。比如为了满足高强度、耐高温等特性 ,需要找到 A 金属在 B 基金属中最佳比例(0-10%),那么需要以 0.5%为间隔,烧制 0-10% 含量的20 个样品,进行测试对比,缩小比例范围,细化间隔,如以 0.1%为间隔制作 5%-7%的 20个样本, 再进行测试对比。如果是多元合金的制造,那么时间和成本将会成倍增加,十分费时费力费钱。

利用数字化的研发方式,可以降本增效。进入数字化时代后,模拟阶段的材料计算软件逐渐得到普及,随着大数据和机器学习的发展,材料发现软件涌现。根据美国材料基因组计划(MG I)报告,按照传统的研发方式,新材料从发现到工业化应用大约需要 10-20 年的时间, 而先进材料则需要 20 年甚至更长的时间,结合先进的集成材料计算工程(ICME)的研发 方法,可以节省约一半的时间。比如在上一段的例子中,可以通过材料计算软件模拟得出 A 金 属不同比例下、B 基金属的性质,接着只需要在最佳范围 5%-7%内进行验证,省去了一半的 时间和成本。

在预测阶段,利用材料发现软件辅助总结经验。在构建预测池的过程中,材料发现软件通过

AI 总结出材料结构和性能参数之间的关系,由期望的性能参数得出可能的结构列表。根据材料发现公司 Citirine 官网,材料公司 HRL 使用 Citrine 软件平台将开发时间从数年缩短到数天。在满足某个热性能的化合物发现案例中,在 5 个月的时间完成了超过了 2500 种 新型聚合物的热性能预测,并且筛选出最可能的 10 种,省去了制造其余 2490 种聚合物的制 造和验证环节。

在验证环节,利用材料计算软件 “模拟实验”。在验证环节中,材料计算软件对初始条件进行建模(设置环境和材料结果的参数),通过计算机程序求解一系列物理方程或本构 模型,进而得到预测的性能参数。材料计算软件能通过“虚拟筛选”,最大限度地减少物理实验的数 量。

比如在设计某种高强度汽车外壳的时候,如果完全依赖于传统的实验方法,需要将每 个预测的材料都制造出样本再进行碰撞实验,如果能用材料计算软件筛选出最理性的列表 , 减少“实际制造样品-实验”的流程,就能大大降低成本和时间。

(二)发现阶段:AI+材料大大提高效率,但目前局限明显

在材料发现阶段,材料发现软件利用大数据和机器学习找到材料微观成分、结构和宏 观性能之间的关系,进而构建预测池,可以提高人工构建预测池效率,降低成本。材料发现 软件的难点在于有限的数据、高昂的算力和算法的局限性。

1、大数据和机器学习是材料发现软件的核心

材料发现软件的基础是大数据和机器学习。材料发现软件的原理是:通过大数据和机器学习技术,分析材料微观结构和宏观性能之间的关系,找到规律,来预测最符合目标要求的 材料。

AI+材料可助力材料发现。如:美国加州大学圣地亚哥分校工程学院的纳米工程师开发 的 AI算法 M3GNet,可几乎即时地预测任何材料(无论是现有材料还是新材料)的结构和 动态特性。Google DeepMind 推出的材料发现工具 GNoME 将材料发现的效率提升了一个数量 级,其材料团队发现了 220 万颗新晶体,相当于近 800 年的知识。

配方型材料发现有望先行一步。设计材料,最基本的是设计成分和结构。成分数量和最佳比例可以用“遍历罗列”的形式来找到,计算机更能胜任这种重复性的试验工作。结构 千变万化,一个分子中两个原子的相对位置、结合方式,一个分子团中分子的数量、构成方 式等等众多三维要素都能够改变材料的性质,因此相对结构设计来说,成分设计更加机械。 配方型材料在海外很成熟,在中国也是一个很重要的方向,很多化工材料是标准的复合材 料过 程,对配方的依赖性非常强。如果有效的去对单一公司的配方数据、反应流程、性质等进行 收集,并在这个基础上不停的进行预测和优化,对企业研发大量的新配方会起到非常重要 的作 用。比如巴斯夫、陶氏化学等公司早已有之。

2、有限的数据、昂贵的算力和算法的局限性,是材料发现阶段的限制

数据是材料发现软件发展中最大的掣肘,算力、算法也限制了性能推导结构的过程。

① 数据库:数据的可获得性,真实性以及精准性问题制约材料数据库发展

机器学习首先依赖的是海量、真实、精准的数据。材料发现软件本质是利用机器学习,找到数据库中材料结构和性能数据之间对应的关系,由想要的“性能”,构建“预测池”, 因此数据的质量和数量是关键。

打破企业间数据隔阂,建立大容量数据库较为困难。出于商业的考虑,新材料公司数据的保密性都是极高级别的,尽管能通过政策驱动、商业合作、购买等方式缓解数据鸿沟 的问 题,但难以完全消除不同企业间数据的隔阂。

真实数据的问题:公开数据的真实性有待考究。有些学术论文中的数据并不真实可靠,学术论文是公开数据的重要组成部分,但学术论文的数据中,部分偏差较大,因此很多情 况下企业对此类数据并不信任,而是自行重复收集,降低了研发的效率。主流商业化材料软 件受到广泛的认同的重要原因也是其可靠的数据库。

精准数据的问题:不同企业,研究机构之间的数据精确度差异较大。微观层次的实验数据对于实验设备的要求非常高,价格昂贵,如一台真空紫外光谱仪价格高达百万元以上, 极低温高磁场扫描隧道显微镜价格可高达 700 万元以上。普通的材料企业难以承受其如此高 昂的成本,不同企业,研究机构之间数据的精确度参差不齐。

② 算力:昂贵算力制约

材料结构所消耗计算资源要远高于工艺设计领域。同样大小的区域,微观尺度需要计算相当大数量的分子、原子,计算难度要远远超过宏观尺度的有限元计算,所消耗的计算资源 更多,材料元素每增加 1 个,成分组合增加 10 倍,远超宏观尺度计算的复杂度。

解决效率问题的有效手段是高通量计算,成本高昂。高通量计算是高性能计算(HPC)的一种,传统的高性能计算着重于提高单个计算单元的运行速度,而高通量计算着重于 “并 行”和“不规则运算”。在微观尺度的计算中,需要数不胜数的分子、原子、电子的计算同时 进行,同时这些计算的数据不是规则的,一般工作流程是先由机器学习生成大量的候选空间 ,然后利用高通量计算进行筛选。高通量计算机价格昂贵,制约材料发展软件的应用。

③ 算法:机器不会形而上,仍需人脑辅助

机器学习本身的“黑匣子性”限制了材料发现的效率。材料学的机器学习算法相较于其他领域(比如文本)要简单许多,机器学习本质是找到材料微观结构和宏观性能之间相关 性的规律,再根据规律去设计新材料,机器学习如何找到规律的背后原因是个“黑匣子”,即 无法说明二者之间的因果关系。但有时候因果关系的准确性、可靠性以及效率要强于简单的 相关关系,因此目前人在材料发现中的作用难以完全被替代。

(三)验证阶段:材料计算软件可以计算多尺度问题,难点在于融合

在材料验证阶段,材料计算软件利用微观结构参数模拟出性能参数,目前主流的商业 化材料计算软件都能集成多尺度研究。材料计算软件已实现不同的尺度算法模块化,针对不 同应用场景,选择搭载的尺度模块。

1、材料计算软件偏向微观和介观尺度的仿真

材料的研究尺度分为微观、介观、宏观,材料计算软件侧重于微观和介观尺度的仿真 ,多使用在功能性材料研究中,比如研究化学反应、电子隧穿效应等;而传统的工业软件 CA E 侧重于宏观尺度的仿真,多使用在结构新材料研究中,比如复合材料、力学材料。

材料的仿真过程是“建模-计算-结果输出”。“建模”可以理解为材料中的 CAD,设定材料的成分、结构和服役环境的参数,“计算”是计算机根据初始设定的条件计算出性能参数的过 程。

从宏观到微观尺度,研究的对象越小,计算越精确,所耗费的时间与计算资源越大。低一级空间尺度的计算结果一般可以作为高一级计算过程的输入,以减少对初始实验数据 的依 赖,理论上这种方法得到的结果会更精确。

(1)微观尺度:这个空间尺度研究的是大小在纳米级别的原子和电子,他们状态和行为通常遵循的运行规律是量子力学,呈现出波粒二象性。微观层次重点关注电子和原子的性质、排布及之间的相互作用等,可以用于研究化学反应路径、电磁性能、材料的稳定性和变形机制等。

(2)介观尺度:这是介于宏观和微观之间的一种状态,研究的是大小在纳米到毫米级别的粒子,如分子,这个级别的物体具有宏观大小。宏观尺度的物体性质可以近似为连续的,在介观尺度大小的物体,性质可能不再连续连续,呈现出许多微观尺度的性质。介观尺度的研究关注材料内部的微观结构和缺陷,比如晶界、相界等。

常见的材料计算软件集成平台都提供微观和介观尺度的计算模块,如 QuantumATK、Material Studio。

(3)宏观尺度:宏观尺度研究的是可见物体的规律,遵循的是牛顿力学的运行规律,关注的是材料或结构的整体行为,如应力、变形和疲劳寿命。研究宏观尺度的基本假设方法是将物体切割为足够小的均质模型,进而“累加”得到整体的性质。需要借助较多的经验数据,所需的计算资源少,精度不高,目前工业工程设计上的仿真问题大多是用的是此类方法。在宏观尺度上的概念中,狭义的材料计算软件和传统的工业软件的界限已经不明晰了。常用的有 ANSYS、ABAQUS、COMSOL 等传统的工业 CAE 软件。

典型的仿真过程有:宏观尺度上,用有限元仿真去模拟汽车碰撞试验、模拟电池枝晶 生长的一些宏观现象。介观尺度、微观尺度上,用分子动力学通常能解决在实验中能观察到的 现象,比如计算得出在某温度下水分子在某溶液中的有序排布。量子力学通常计算的是原子 和电子的性质,比如相互作用力、电子能带等。

2、多尺度计算平台是大势所趋,但进展有限

材料计算软件侧重于微观、介观,传统工业软件侧重于宏观,但二者并不割裂。

研究微观、介观尺度的结构是为了更好地理解并设计宏观的性能。例如,研究编织形态的碳纤维材料,碳纤维粒子的大小、结构,碳纤维的走向和编织方法(单向编织/交叉编织 )等都会影响最终形成的碳纤维布的特性。

多尺度方法的出现是为了解决单一尺度方法的局限性,比如精度不足、忽略微观结构对宏观性能的影响、数据有限等。多尺度的材料问题呈现的是:宏观尺度下,局部不再符合 宏观规律,必须使用更低维度的介观、微观尺度方法来解决。比如,当前居于主导地位的混 凝土模型不能够有效的反映微观结构对其宏观性能的影响,混凝土的微观结构对宏观性能(强度、尺寸稳定性以及耐久性等)有着重要的影响。精度不足的典型例子是相图计算中加入第一 性原理计算结果,来替代一些难以获取的实验数据。在研究纳米压痕过程中,在压头穿透的前 半段,形变较小,适用原子尺度的模拟方法,在压头穿透的后半段,形变较大,则适用宏观 尺度的有限元方法。

但现实情况是,人们对材料的微观结构、性能与状态对宏观性能影响机制尚不清楚。 目前有两种方式尝试解决这个问题,一是递阶,即将低尺度的计算结果输入高尺度模型,二是 并发,即将区域分成不同部分,各自使用不同尺度的方法,在交界处连接。多尺度方法自身理论体系缺乏系统性和完整性,这也成为了材料设计中的重难点。落实到产品上,体现的是不同尺度的软件,或者同一软件不同计算模块之间存在数据接口,难以有多尺度融合为一体 的产品出现。

传统材料计算软件是相对独立的单一尺度、单一计算方式的程序,比如 VASP、LAMMPS。随着工业时代的发展,材料的宏观设计不能满足需求,深入到微观结构或成为突破口 ,微工业器件的制造尺度越来越小,材料更多的呈现出介观、甚至微观尺度的规律,比如半 导体的先进制程中遇到的量子隧穿效应。

商业化的材料计算软件目前逐步集成多尺度的计算方法。越来越多的传统 CAE 软件巨头收购了微观、介观的计算软件,材料计算软件也加入了尺度更大的计算方法,多尺度集成的材料计算软件成为趋势。比如 EDA 软件巨头 Synopsys 收购了微观尺度建模的 QuantumATK,完善其半导体设计软件解决方案。传统分子动力学软程序 LAMMPS 加入了介观建模的接 口。Material Studio 也在原有的微观尺度基础上,2008 年加入了介观计算模块 Mesocite。

3、材料计算软件产品成熟,将不同场景的计算模块化是核心

材料计算软件发展较为成熟,核心是将不同场景的计算方法转化为代码。体现在产品上,是主流的材料计算软件搭载了针对各类场景、可视化建模-计算一体化的平台。

传统的材料计算软件基本上是一段程序,可视化建模和结果输出均需要借用其他软件 。比如传统分子动力学计算软件 LAMMPS 只能使用代码,前期材料微观结构的建模和结果 的可视化均需要借助其他软件。

目前业界使用最多的材料计算软件是 Material Studio,QuantumATK 在电子领域的地 位也非常稳固。其产品形式大多将“可视化建模-模拟-输出结果可视化”的模拟环节基本无缝 整合进软件平台,针对不同场景建立不同的计算模块。比如 Material Studio 可视化建模模块是Visualizer,计算吸附能模块是 Absorption Locator。

二、全球材料软件发展成熟,市场天花板不高

(一)材料发现软件多创新企业,材料计算软件多使用国外工业软件巨头的产品

国外的材料发现软件以创新企业为主,一类是软件工具库,另一类提供数据库在内的解决方案。大数据和机器学习已经在国外得到了普遍接受,目前国外无论是学术界还是业界对 于 AI for science 的新型研发模式都进入了深入的探索。材料发现软件有两种类型:一是开 源的软件库,一般由学术机构主导,如 Matminer 是美国伯克利大学的一款开源 Python 库;二是商业化的机构,提供一套包含数据库在内的解决方案,易用性好,具备可视化的界面,如 CitrineInformatics 和 MPDS(Materials Platform for Data Science)。

国外市占率最高的商业化材料计算软件是 Material Studio,QuantumATK 也有一定的地位。

国外除了这两款软件之外,还有一些“小而美”的软件,一些是商业化机构主导,一 些是学术机构开发的,比如 COMSOL,QE(Quantum ESPRESSO)等。也有免费的产品,如 分子动力学产品 LAMMPS。(图表放在段落与段落之间,不要把一段话分割开)

Material Studio 和 QuantumATK 均被国外传统工业软件巨头收购。Material Studio 是Accelry 公司旗下一款专注于材料研发平台的软件,2014 年达索收购 Accelry,后将 其业务整合进BIOVIA 品牌。EDA 巨头新思 2017年收购纳米材料与电子器件模拟平台 QuantumATK ,助力芯片工艺开发者解决下一代器件研发,让制程更快向前推进。

(二)国外材料软件市场价值低,难以通过自身形成极具商业利润的公司

材料软件前期开发成本高,需要有大产值的领域“喂养”。成本端,材料软件首先要大量的人力财力将材料学知识转化为程序实现,同时需要大量的数据和时间去验证有效性,前 期投入的成本大、时间长。收入端,需要有足够大产值的领域,如半导体、医药,后期收入 才能足够大。

国外商业化材料软件估值不高。典型的是材料计算软件 Material Studio,2014 年达索收购Accelry,收购金额约为 7.5 亿美元,折合人民币约为 46.8 亿,商誉为 4.5 亿美元,折合人民币约为 28.1 亿,而 Material Studio 仅为 Accelry 的一款产品。2023 年材料发现软件公司Citrine Informatics C 轮估值约仅 1 亿美元不到。

传统工业软件估值更高,因此也导致了国外材料计算软件领先者的出路是:要么被传统工业软件巨头所收购,要么做细分领域的“小而美”。相较于工艺环节,研发环节整体支出少、研发人员少,导致材料软件的市场规模不大,话语权弱,因此国外巨头无一例外是在某 一下游产值巨大的工业软件领域中站稳脚跟,收购不同细分应用的公司,再不断扩张到其他 研发设计环节,形成协同效应。比如 Material Studio 被达索收购,QuantumADK 被新思收购 ,第一性原理软件 VASP、相图计算软件 Thermocalc 在细分领域仍然是领先者,未被收购 ,但也难以上市。

综上,材料软件市场规模小,前期投入高,难以通过自身形成极具商业利润的公司。

三、国内材料软件公司与国际存在差距

我国材料企业数字化程度低,基本不使用材料发现软件,材料计算软件渗透率低,国 外巨头市占率高,目前国内材料计算软件大多使用 Material Studio。此外国内逐渐涌现出材料软件的“四小龙”,其兼具材料发现和计算功能。

研发人员没有使用软件的习惯。目前我国材料研发模式存在着如下现状:①许多材料研发人员所受的教育,仍是传统的材料实验科学的研究方法,②大量中小企业研发过程数字 化程度低,还未建立数据库,没开始使用材料设计研发类软件,③我国大部分制造业企业还 处于“模仿创新”的阶段,对于材料发现及降本增效的需求不大。因此目前我国材料研发很少 利用材料软件。

目前国内有四家材料软件公司,分别是深势科技、迈高科技、龙讯旷腾、鸿之微,与国外公司存在差距。国外材料软件起步时间早,多个尺度的计算方法齐全,涉及领域、计 算场 景、数据库、接口丰富。国内公司材料软件公司聚焦于微观尺度,部分公司初步建立起自 己的数据库,在计算场景和计算方法上和国外产品仍有差距。国外材料计算和材料发现软件 的公司基本是独立的,而国内公司基本上将二者结合。

四、国内材料软件公司的发展需要用非市场化手段解决

材料软件是新材料产业发展中重要的效率工具。按照传统的材料研发方式,新材料从研发到产业化应用大约需要 10-20 年,应用材料软件后,可以节省约一半的时间,材料软件 能大大实现降本增效。

我国自主可控的材料软件必不可少。目前国内材料软件在计算场景、计算方法、数据库的发展上有所欠缺,尚不能与国外产品相抗衡。目前使用最广泛的国外材料计算软件 Material Studio 对我国军方禁用,严重影响了我国新材料产业的自主可控。因此,国内材料软件亟需发展,为新材料产业发展保驾护航。

但目前材料软件发展存在诸多难点。材料发现软件的核心是大数据和机器学习技术,有限的数据、昂贵的算力和算法的局限性是其发展的限制。材料计算软件发展较为成熟,经历了 长时间的积累,目前主流的材料软件已经搭载了多种场景的计算模块,发展的难点在于多尺 度计算的融合。

同时全球最大的材料软件公司商业天花板太低。2014 年材料计算软件 Material studio 母公

司 Accelry 估值 7.5 亿美元,2023 年材料发现软件公司 Citrine Informatics 估值约仅不到 1亿美元。

因此我国材料软件很难完全依靠市场化的方式实现材料软件的自主可控,可能需要非市场化的方式推动国产材料软件的发展。

附录 1、材料软件和传统工业软件的区别

如果用工业软件的视角来理解,广义上,如果将任何一种新型的工业品都看做一种材料,那么材料计算软件也属于工业软件的细分领域,存在 CAD、CAE。研发过程可以分为设计、工程分析、加工制造三大核心环节,材料计算软件横贯结构设计和实验模拟两大环节,既有 CAD,也有 CAE,也有设计和仿真结合的综合性软件。

广义上的 CAD,解决设计问题,即“建模”,通俗的理解是“画图”。“建模”指的是设定材料、产品的各种初始条件,商业化的软件会通过软件程序的运行,呈现出可视化的界 面,如原子之间的键角,分子中原子的数量、组成、结构,晶粒之间的位相差,材料平面的 弯曲程度等。

生产生活中,产品工艺流程中所需要“画图”步骤远比构建材料中的分子、晶界等小 区域要复杂得多,需要仿真的零部件众多,因此工程上有很多独立的 CAD、CAE 前处理软 件来辅助构建产品初始条件,如不同部位的长短、弯曲程度、角度、耦合方式等,后续计算 的过程则由众多独立的 CAE 软件完成。

广义上的 CAE,解决仿真分析问题,模拟材料/产品在某个环境下的性能和行为,即“ 计算”/“仿真”/“模拟”。具体到计算机程序上,是通过设计的材料、产品数据计算出最终的 性能。将“建模”和“计算”二者结合就能“模拟实验”。

和工艺流程相比,材料本身结构的建模过程较为简单,而计算更复杂,因此很多软件将建模和计算结合到一个程序中。以 Material Studio 为代表的商业化软件可视化做的很好,固定了相关变量,只要输入数值,或者通过直接拖拉即可实现原子、分子等结构的设计。以Lammps、VASP 为代表的传统学术软件,约等于开源的软件包,需要手动输入代码,或者利用 VES TA等可视化建模软件输出代码,才能设置初始变量,进行计算,后续的结果可视化需要借助 ovito等工具。

狭义上的工业软件也是生活中常用的概念,指的是工艺上的仿真,涉及的是宏观层面的建 模。

生活中常说的材料软件、材料计算软件、材料模拟/仿真软件其实都是一回事,都指的 是狭义的概念。本文探讨的材料计算软件也是指狭义的概念,即工业软件的细分领域——材料研 发。

附录 2、学术类材料软件多“小而美”

学术类软件不在本文的探讨范围内,但存在着众多具备收费能力的软件,缺乏大规模 铺开的潜质,主要因为学术界和业界常使用的软件产品侧重点不同,比如可视化界面、适用范围等,导致其商业化价值不同。

学术界常用的软件“小而美”,常常在某一个细分的算法领域做到领先。学术界的材料研发更加领先于业界,对于专业性和准确性要求更高,同一个领域的不同计算方法可能会形 成不同程序,往往不具备可视化建模和结果展示的功能,需要使用人员具备一定的代码能力 。在计算方法普适性广的领域,会形成通用性广的软件巨头,针对不同的应用场景,形成不 同计算模块,进而产生大规模推广的商业价值。比如 VASP 在第一性原理领域是当之无 愧第 一,thermocalc 在相图计算、冶金领域使用较广。

有的材料软件在发展过程中,为了商业推广,将“易用性”放在了首位,往往会将可 视化做的很好,牺牲一定的计算性能和选择余地,常常有“算不准”的现象。

附录 3、研发方式:从 MGI 到 ICME,“数据驱动”是基础,“全生命周期”“集成”是进步

在材料研发方法中,经常会看到三个概念“材料计算设计”、“材料基因组”(MGI)、“ 集成计算材料工程”(ICME)。从概念出现的时间顺序上看,递进关系是:材料基因组→计算 材料设计→ICME,概念的重点分别为:数据驱动→计算预测→全生命周期的数据驱动+集成计算工具。从材料研发的历史来看,这三个概念虽然出现有早晚,但各自的内涵不断发展, 组成了现代材料研发史。

从概念最开始发展的思想来看:

 材料基因组强调:材料数据是“材料的基因”,材料结构决定宏观性能,用“数据驱动”的方式开展材料设计。

 材料计算设计强调:通过计算去预测材料特性,进而辅助材料设计。

 作为多空间尺度研究需求下的工具,ICME 更强调:利用材料和产品全生命周期的数据,使用集成的计算工具,驱动材料设计。

 如今,三个概念的基本理念都包含“数据驱动”“高通量计算”,ICME 的概念在此基础上更强调“多尺度建模”“全生命周期”。

根据美国 NRC(National Research Council,国家研究理事会)在 2008 年发布的 ICME 报告中的定义:“ICME 是一种通过在多个尺度上连接材料模型来设计产品、构成产品的 材料及其相关材料加工方法的途径”,在某些情况下,投资回报率高达 3:1 到 9:1。

ICME 的框架是材料研发方法的一大进步,主要体现在打通材料和产品全生命周期上的数据、工具,进而真正实现材料研发的“数据驱动”,即各环节的数据、工具都能“为我所用”。通常材料工程与产品设计是独立的,在产品优化之前就有一个静态的材料选择列表,这 使得材料设计可能过于保守,不能利用材料的全部功能,因此,将材料的选择推迟到产品开 发的后期,是 ICME 框架下材料研发的一个巨大突破。

在 ICME 框架下,不难理解目前材料计算软件的趋势:多尺度的集成,也不难理解国 外工业软件巨头并购不同环节的软件的趋势,除了保护性收购的考虑,从材料研发到产品设 计、再到生产制造,集成整个链条上的工具,才能使得各个环节的数据都有“用武之地”。

附录 4、以史鉴今:“人”“数据”“工具”的互联互通是材料研发数字化进程中的关键

纵观美国材料研发政策项目的发展历史,可以发现科研机构是新兴概念和技术的摇篮 ,商业化是成果转化的驱动力,政策是产学研有机融合的强效催化剂。

(1)ICME:概念的发展推动研发范式的转变

21 世纪初,美国政府意图打通企业之间、材料和产品设计之间的鸿沟,以加强其先进材料及高端制造业实力。在合金、聚合物、陶瓷复合材料等先进材料研究趋势的驱动下,21 世纪初美国推出从 AIM 计划到加速技术转变计划,再到 ICME 的正式大范围推广,这些文件 或表述方式不同,但核心思想都是通过集成材料和产品的全生命周期工,结合多尺度模型, 整合和优化材料、部件设计和制造工艺,达到加速材料研发的目的,进而服务于美国的高端制 造业。

以下是一些重要的标志性事件、项目和文件,涵盖了自上而下由国家政府的框架式引 导,和自下而上学界、业界细化方法的推广,可以说是材料基因组计划的前奏,让业界感到了 ICME方法的可行性和变革性:

 AIM(2001)计划奠定了 ICME 的基础:20 世纪 90 年代,西北大学成功展示了基于热力学的基因组设计方法在金属、陶瓷、聚合物和复合材料领域的广泛适用性,为21 世纪初 DARPA-AIM 计划奠定了基础。2001 年,DARPA(Defense Advanced Research Projects Agency,美国国防部先进研究项目局)启动了 AIM(Accelerated Insertion of Materials,加速材料应用)项目,资助了通用电气(GE)、普惠(P&W)和波音(Boeing),要求其整合各种模型和数据来优化材料性能或加工过程,不论是基于理论、半经验还是纯经验的,还要求通过网络连接供应商的模型和数据用于整个优化过程,并鼓励建立材料设计人员和产品设计师之间的早期联系机制。这一倡议的目标是建立新的框架,用于集成工具,以快速、低成本地开发新材料和工艺,AIM 方法也是 ICME 的前身。

 Ford VAC(2003):业界应用 ICME 非常著名的例子之一是福特汽车公司的 VAC(虚拟铝铸件,Virtual Aluminum Castings)方法,将其用于生产汽车铝制汽缸盖。与传统静态材料属性设计不同,VAC 考虑了加工技术对材料属性的影响,在实际制造之前模拟了设计、铸造、热处理和耐久性测试,并将其整合到机械设计评估中,用于寿命预测,避免了大量返工和测试。VAC 应用多空间尺度建模,结合了多个结构、物理、机械模型,且进行了全面的验证,其成功在业界是一个里程碑。

 加速技术转变计划(2004):NMAB(美国国家材料和制造委员会,National Materials Advisory Board)于 2004 年推出的《加速技术转化:在国防系统中为材料和工艺过渡跨越“死亡谷”》倡议在方法技术、数据库和传播基础设施三个方面进行大力发展。

 ONR/DARPA D3D 计划(2005):DARPA 于 2005 年推出了 D3D 计划,侧重于建立下一代建模和表征工具,进一步扩展了 AIM 的 3D 工具。

 ICME(2008):美国的 NRC(National Research Council,国家研究理事会)在2008 年发表了《集成计算材料工程》(ICME)的报告,作为工业界、学术界和政府的一项联合倡议,旨在将建模和仿真与材料开发和产品改进相结合。在此之后,利弗莫尔软件(Livermore)技术公司、ESI 集团、海军水面作战中心(Naval Surface Warfare Center)、Knolls 原子力实验室(洛克希德-马丁公司)、丰田中央研发实验室、QuesTek 和波音公司等也都采用了 ICME 概念。

(2)材料基因组计划:建设材料研发的基础设施

相图计算方法的形成代表着材料基因组研究范式的开端。从以往的依赖实验的范式,发展到建模计算方法的形成,再到软件、数据库、研究社区的形成,相图计算引领着材料基 因组概念的发展,大致分为两个阶段:

第一阶段的标志是 1973 年 CALPHAD 国际性学术杂志的创建。随着热力学、统计力学和溶液理论与计算机技术的发展,1970 年代初左右,相图研究从以相平衡的实验测定为主 ,进入了热化学与相图计算机耦合研究的新阶段,并发展成为一门介于热化学、相平衡和溶 液理论与计算技术之间的交叉学科分支———CALPHAD(CALculation of PHAse Diagram )。

第二阶段的特征是软件基础设施和社区的形成和发展,众多的材料计算软件公司诞生,助力

开发出重要的先进材料。1980 年代左右,Thermo-Calc 软件(1981)、和 SGTE(Scientific Group Thermodata Europe)诞生,可以说此阶段的 CALPHAD 方法已经具备了 MG I 的基础设施。进入 1990 年代,CALPHAD 继续集成研究方法和研究尺度,一大批材料工 程师意识到计算材料科学已经达到了一个可作为强大的实用工具,1994 年 Thermo-Calc 加 入扩散模块 DICTRA。SGTE 是由西欧七个组织组成的联盟,致力于为无机和冶金系统编制 全面、自洽和权威的热化学数据库,为 Thermo-calc 提供了通用合金和纯物质数据库。进入 21 世纪,微尺度研究方法 DFT 逐渐被集成到材料计算框架之中。

美国材料基因组计划的正式发布,标志着材料基因组由学术界的概念推广至工业化应用。

 在 2002 年的美国国家自然科学基金会信息技术研究(ITR)计划资助的“为多组元材料设计服务的计算工具”研究项目中进一步强化了材料的基本组成模块这个概念。

 2011 年发布的材料基因组计划正式拉开了美国建设材料研发基础设施的帷幕。2011年 6 月 24 日,奥巴马总统宣布了“先进制造业伙伴关系”计划(Advanced Manufacturing Partnership,AMP),呼吁美国政府、高校及企业之间应加强合作,以强化美国在制造业的领先地位,而“材料基因组计划”(Materials Genome Initiative,MGI)作为 AMP 计划中的重要组成部分,投资超过 1 亿美元,以期保持在能源、电子、国防、医疗保健等领域的领先地位。

MGI 计划一共有三版,分别是 2011、2014 和 2021 版,随着时代和技术的发展,对于 MG I的目的和手段的认知越来越清晰,核心仍是集成统一的基础设施,需要在实验、计算 、理论三个重要环节上,通过“人、数据、工具”三个要素的互联互通,利用数据和计算工 具的力量来加速新材料的发现、设计、开发和部署。

 2011 年版的第一版 MGI 首次提出了创新基础设施的框架,指出其目标是使得材料研发时间减少一半以上,甚至通过集成已有的工业计算分析软件使得研发时间从 10-20 年减少至 2-3 年。

2014 年的第二版 MGI 指出计划成功的四大挑战,概括而言,是在实验、计算、理论的层面上,应当(1)加强产学研的合作,(2)整合工具技术,(3)数据共享,以及(4)培养人才。

2021 年的第三版 MGI 在 2011、2014 的基础之上,再次明确了 MGI 社区(community)的目标:(1)统一材料创新基础设施,(2)利用材料数据的力量,

(3)对材料研究开发人员进行教育、培训和连接。在此之上强调了国家材料数据网络(NMDN)的建立、将量子力学融入材料生命周期、AI 的创新驱动力。

此外,欧盟在美国启动 MGI(Materials Genome Initiative)之时,针对六大类高性能合 金(轻量、高温、高温超导、热电、磁性及热磁、相变记忆存储)的需求,于 2011 年启动了“加速冶金学”(Accelerated Metallurgy, AccMet)项目,随后在 2012 年提出了“冶金欧洲”(Metallurgy Europe)计划。AccMet 主要关注合金的设计和模拟,而“冶金欧洲”计 划则更加注重工业应用的推广。我国科技部在 2015 年也启动了“材料基因工程关键技术与 支撑平台”重点专项;2021 年 6 月,中科院北京市材料基因组研究平台的材料计算子平台 正式运行;2020 年 8 月上线了我国首个世界级的材料科学数据库 Atomly.net。

0 阅读:0

狮门说科技

简介:感谢大家的关注