APP下载

基于机器学习的无机磁性材料磁性基态分类与磁矩预测*

2022-03-30黎威龙连春刘静毅杨洋

物理学报 2022年6期
关键词:无机磁性分类

黎威 龙连春† 刘静毅 杨洋

1) (北京工业大学材料与制造学部,北京 100124)

2) (中国科学院物理研究所,北京 100190)

1 引言

磁性材料种类繁多、用途广泛,在磁记录、磁致伸缩、磁润滑、磁致冷和磁传感器等领域具有重要应用[1-4].按照磁性物理学的划分,材料的磁性基态可分为磁有序的铁磁基态、反铁磁基态、亚铁磁基态和磁无序的顺磁基态.其中,铁磁基态是未来高性能磁性材料的关键要求之一[5],根据铁磁基态产生的铁磁性材料在传感与控制、信息处理、信息存储等技术领域具有重要的应用价值[6-8].从宏观角度来说,长程有序排列的磁矩是材料铁磁性产生的原因[9],通过磁矩可以得到材料的磁化强度、磁滞回线,反映材料的磁化性能[10].因此,研究铁磁性材料的磁矩十分重要.

由于材料的实验测试既昂贵又耗时[11],材料科学家们在实验制备测试材料的同时,使用密度泛函理论(density functional theory,DFT)进行材料性能计算.然而,对于复杂的材料结构,精确的DFT 计算也会消耗大量时间.多年来,通过DFT计算产生了一些大型材料数据库,如无机晶体结构数据库[12]、开放量子材料数据库[13]和材料项目数据库[14]等.面对海量材料数据,如何通过数据技术手段从中提取知识,避免重复运算,浪费算力,成为关注的热点[15].近年来,许多研究者将机器学习(machine learning,ML)技术应用于材料研究,主要分为预测材料性能和发现新材料两个方面[16].在预测材料性能方面,Isayev 等[17]构建了一种材料特征计算工具,使用ML 中的梯度提升决策树算法预测了无机晶体材料的六种热机械性能;寇雯博等[18]提出了一种小波-ML 混合方法,可用于混杂复合材料等效热传导性能的预测.在发现新材料方面,杨自欣等[19]构建了用于预测铅基钙钛矿材料铁电居里温度的ML 模型,使用得到的模型筛选出了2 种目标钙钛矿铁电材料;Lu 等[20]采用DFT计算结合ML 预测的方式,从5158 个无铅杂化钙钛矿中筛选了3 个稳定的钙钛矿材料.这些研究展现了ML 在计算材料领域的可行性.

目前,使用ML 研究材料磁性基态主要关注铁磁和反铁磁基态的分类,多种磁性基态分类的ML 研究有待发展.例如,Long 等[5]从AtomWork数据库[21]中收集了1749 条铁磁基态和1056 条反铁磁基态的金属间化合物数据,使用ML 中的随机森林算法实现了金属间化合物的铁磁/反铁磁基态分类,最终的分类准确率为87%;Frey 等[22]针对材料项目数据库中的3153 种过渡金属氧化物训练了ML 模型,实现了过渡金属氧化物的铁磁/反铁磁基态分类,分类模型的精确率和召回率的调和平均数(F1 score)为85%.虽然已有研究者使用ML预测材料磁矩,但面向的是多种磁性基态材料,相关研究主要关注算法的准确性,并没有分析材料特征,缺少探讨单一磁性基态材料的磁矩.铁磁性材料作为一种重要的磁性材料,针对性的机器学习研究具有重要意义.如Yamamoto[23]使用晶体图神经网络模型对开放量子材料数据库和材料项目数据库中的材料数据进行研究,实现了非磁性材料/磁性材料的分类和磁矩的预测,最终集成分类模型的感受性曲线下方面积(AUC)为0.957,集成预测模型的平均绝对误差为0.119 µB/atom.

本研究以无机磁性材料的四种磁性基态和无机铁磁性材料的磁矩为研究对象,计算了材料的元素和结构特征,并通过两步法筛选材料特征,确定了磁性基态分类与磁矩预测的重要材料属性.基于筛选后的材料特征,训练了磁性基态分类和磁矩预测的ML 模型,使用多种评价指标对模型的10 折交叉验证结果进行定量评估,得到了性能最优的分类模型和预测模型.最后,将两个模型应用于测试集中材料的磁性基态分类和磁矩预测,验证了模型的精度和泛化能力.

2 方法

2.1 数据集建立

通过材料项目数据库的应用程序接口[24]获取了98888 条无机磁性材料数据,包含材料的化学式、CIF 文件、磁性基态和晶胞磁矩信息.针对本文的研究对象,对数据集中无机磁性材料的磁性基态和无机铁磁性材料的晶胞磁矩进行描述性统计,如图1 所示.图1(a)是四种磁性基态的数量分布,其中顺磁基态(PM)数据58068 条,铁磁基态(FM)数据32248 条,亚铁磁基态(FiM)数据5733 条,反铁磁基态(AFM)数据2839 条.图1(b)展示了无机铁磁性材料晶胞磁矩的密度分布,范围为0—280 µB,可以看到数据呈重尾分布,类似于指数数据.

图1 材料数据集的描述性统计 (a) 磁性基态分布直方图;(b) 晶胞磁矩频数分布图Fig.1.Descriptive statistics of material data set:(a) Distribution histogram of the magnetic ground state;(b) frequency distribution of the unit cell magnetic moment.

2.2 特征构建与特征选择

通过ML 技术建立材料属性与材料性能之间的映射,需要提取数字化的材料特征变量.利用材料信息平台Matminer[25]计算了数据集中材料的元素和结构特征,共产生了582 种材料特征.其中元素特征主要包括材料的组成、元素信息和电子排布;结构特征主要包括空间群数、晶胞体积和正弦库仑矩阵.

冗余特征会导致模型的低效或过度拟合,为了克服此缺陷,采用两步式特征选择方法去除冗余特征.第1 步使用交叉验证递归特征消除(RFECV)的方法,逐一评估特征的重要性,在保证模型精度基本不下降的前提下,去除冗余特征;第2 步采用ML 模型的特征排序,进一步精简并选择出对模型最重要的特征.通过两步式特征选择方法分别为磁性基态分类模型和磁矩预测模型选择了20 个特征,如表1 所列.表中展示了选择出的34 个重要特征,其中有6 个特征为两个模型共用特征,各个特征的物理意义见附录表A1 所列.

表1 基于两步式特征选择法获得的材料特征Table 1.Material features obtained by the two-step feature selection method.

2.3 机器学习模型构建

将选择出的材料特征数据与磁性性能数据组合为材料数据集,按照4∶1 的比例随机分为训练集和测试集.首先使用训练集中的材料数据进行ML 模型的训练,然后使用测试集中的材料数据检验ML 模型的精度和泛化能力.ML 模型的训练和检验过程均采用10 折交叉验证的方法进行定量评估.其中,分类模型的评估指标为:准确率(accuracy)、精确率(precision)、召回率(recall)和F1 分数(F1 score);预测模型的评估指标为:拟合优度(R2)和平均绝对误差(MAE).

为了捕获材料特征数据与材料磁性性能之间复杂的映射关系,采用随机森林(random forest,RF)[26]作为ML 模型.RF 不需要对材料特征进行缩放,能够直观地得出材料特征与材料性能之间的关系.ML 模型的超参数会影响模型的拟合能力,通过网格搜索的方式分别对随机森林分类(RFC)模型和随机森林回归(RFR)模型进行超参数优化,得到模型的超参数如表2 所列.本研究中ML 模型的训练、评估和超参数优化均通过python 库中的scikit-learn[27]实现,ML 模型的构建流程如图2.

图2 机器学习模型的构建流程Fig.2.Construction process of the machine learning model.

表2 本研究中机器学习模型的超参数Table 2.Hyperparameters of the machine learning model in this study.

3 结果与讨论

3.1 模型训练结果

3.1.1 分类模型训练

使用RF 中的随机森林分类(RFC)构建了磁性基态分类模型,完成了无机磁性材料铁磁、反铁磁、亚铁磁和顺磁基态的分类筛选.在磁性基态分类模型的两步式特征选择中,第1 步通过RFECV方法将材料特征减少到了82 个,模型的平均分类准确率为89.46%;第2 步通过RFC 的特征排序选择了排名靠前的20 个材料特征对模型进行训练,此时模型的平均分类准确率为87.67%,如图3(a)所示.考虑到特征相关性,第2 步被剔除的材料特征对磁性基态的分类仍有少量贡献,模型分类准确率的略微下降在可控且合理的范围内.图3(b)展示的是分类模型的材料特征排序结果,其中,材料原子磁矩、原子外围轨道未充满电子数等元素特征对磁性基态分类的贡献程度较大;结构特征中的正弦库仑矩阵、晶胞体积对磁性基态分类的贡献程度虽小,但是排名靠前,可见结构特征在四种磁性基态分类时起到了关键作用.

图3 磁性基态分类模型的训练结果 (a) 10 折交叉验证;(b) 材料特征排序Fig.3.Training results of the magnetic ground state classification model:(a) 10-fold cross-validation;(b) ranking of material features.

3.1.2 预测模型训练

基于获得的分类模型,使用RF 中的随机森林回归(RFR)对无机铁磁性材料的磁矩进行预测分析.为避免晶胞大小不同和晶胞中原子个数不同对结果产生影响,将磁矩值平均到晶胞中的每个原子.预测模型训练与分类模型训练相似,采用两步法去除了对磁矩预测无关或影响较小的冗余材料特征.第1 步通过RFECV 得到了45 个材料特征,模型的平均拟合优度为95.77%;第2 步通过RFR的特征排序得到了20 个材料特征,此时模型的平均拟合优度为94.68%,如图4(a)所示.图4(b)展示的是预测模型的材料特征排序,结构特征在经过两步式的特征选择后被移除,而化合价、电负性、f 轨道未充满电子数和材料原子磁矩等元素材料特征对无机铁磁性材料的磁矩预测提供了较大的贡献.

图4 磁矩预测模型的训练结果 (a) 10 折交叉验证;(b) 材料特征排序Fig.4.Training results of the magnetic moment prediction model:(a) 10-fold cross-validation;(b) ranking of material features.

3.2 模型检验结果

将材料数据集分为训练集和测试集,模型的训练和交叉验证均在训练集上完成,测试集数据在整个模型构建过程中没有参与,此时模型在训练集上的应用效果最能检验模型的精度和泛化能力.

3.2.1 分类检验

针对训练完成的磁性基态分类模型,使用测试集检验其对无机磁性材料四种磁性基态的分类能力.图5(a)是混淆矩阵,它反映了磁性基态分类模型在测试集上的精度.图5(a)中的数值表示行标签材料被预测为列标签材料的数目,可以看到96.5%的顺磁基态和84.8%的铁磁基态被正确分类,反铁磁和亚铁磁基态的分类效果较差,这可能是由于数据库中反铁磁基态和亚铁磁基态的材料数量较少,数据分布不平衡导致.从图5(b)的结果可以看出,4 种分类评价指标的10 折交叉验证结果都很平均,说明模型没有过拟合和偏向抽样,能够真实地反映磁性基态分类模型对四种磁性基态的分类效果.同时,将本研究的磁性基态分类模型与其他研究磁性基态分类的机器学习模型进行了对比,如表3 所列.这两个研究实现了铁磁和反铁磁基态的分类,属于二分类问题.本研究实现了铁磁、反铁磁、亚铁磁和顺磁基态的分类,属于四分类问题,而且进一步提升了分类效果.

图5 磁性基态分类模型的检验结果 (a) 混淆矩阵;(b) 10 折交叉验证Fig.5.Test results of the magnetic ground state classification model:(a) Confusion matrix;(b) 10-fold cross-validation.

表3 本研究磁性基态分类模型与其他研究者工作的定量评估对比Table 3.Quantitative evaluation of the magnetic ground state classification model in this study and in comparison with other works.

3.2.2 预测检验

为了检验磁矩预测模型对无机铁磁性材料磁矩的预测能力,使用测试集中的磁矩数据进行预测,观察预测值与真实值的拟合程度、误差范围.图6(a)展示了预测模型对磁矩的预测值和真实值对比,图中蓝色圆圈对应不同的无机铁磁性材料,其横坐标为获得的预测模型对某材料磁矩的预测值,纵坐标为该材料磁矩的真实值,红色虚线表示预测值与真实值完全吻合时的情况.从图6(a)可以看出,对于测试集中6450 条未参与训练的无机铁磁性材料,预测模型对其磁矩的预测值都落在了真实值附近.从图6(b)可以看出,2 种评价指标的10 折交叉验证结果都很平均,较训练集结果仅有略微下降,说明磁矩预测模型没有过拟合,对无机铁磁性材料的磁矩具有较好的预测能力.同时,也将本研究的磁矩预测模型与其他研究磁矩预测的机器学习模型进行了对比,如表4 所列,本研究的机器学习模型对磁矩的预测具有更低的平均绝对误差(MAE).

表4 本研究磁矩预测模型与其他研究者工作的定量评估对比Table 4.Quantitative evaluation of the magnetic moment prediction model in this study and in comparison with other works.

图6 磁矩预测模型的检验结果 (a) 预测值与真实值的拟合情况;(b) 10 折交叉验证Fig.6.Test results of the magnetic moment prediction model:(a) Fitting degree between predicted value and real value;(b) 10-fold cross validation.

4 结论

本研究针对材料项目数据库中无机磁性材料的四种磁性基态和无机铁磁性材料的磁矩,计算了统一的数字化材料特征,这些特征包含材料的元素属性和结构属性描述,使得构建的机器学习模型能够从中学习规律,以低廉的计算成本实现磁性基态的分类和磁矩的预测:

1) 通过两步式的特征选择方法,发现了对磁性基态分类和磁矩预测具有重要贡献的材料特征,包括材料元素特征中的电负性、原子磁矩和原子外围轨道未充满电子数,显示了材料的组成元素性质和电子排布与材料磁性性能之间的密切关系.

2) 基于随机森林算法,建立了磁性基态分类模型和铁磁性材料磁矩预测模型.在材料测试集的检验中,分类模型对四种磁性基态的平均分类准确率达85.23%,预测模型对磁矩预测的平均绝对误差仅为0.098 µB/atom,两个模型均展现了良好的精度和泛化能力.

附录

表A1 基于两步式特征选择法获得的材料特征及其物理含义Table A1.Material features and their physical meanings obtained by the two-step feature selection method.

猜你喜欢

无机磁性分类
无机材料在建筑节能工程中的应用
新型无机非金属建材在新农村建设中的应用浅析
无机化工流程题的解题策略
围棋棋子分离器
高考的“宠儿”——无机化工流程题
按需分类
教你一招:数的分类
说说分类那些事
自制磁性螺丝刀
方便磁性工具背心