基于材料组分信息的高居里温度铁磁材料预测.pdf
《基于材料组分信息的高居里温度铁磁材料预测.pdf》由会员分享,可在线阅读,更多相关《基于材料组分信息的高居里温度铁磁材料预测.pdf(7页珍藏版)》请在咨信网上搜索。
1、基于材料组分信息的高居里温度铁磁材料预测*孙敬淇吴绪才阙志雄张卫兵(长沙理工大学物理与电子科学学院,柔性电子材料基因工程湖南省重点实验室,长沙410004)(2023年 3月 12 日收到;2023年 6月 19 日收到修改稿)寻找具有高居里温度的铁磁材料是凝聚态物理的热点问题.本文建立了有效的基于材料组分信息的居里温度机器学习模型,并预测了多种高居里温度铁磁材料.基于收集到的 1568 个铁磁材料数据,并以铁磁材料的组分信息作为描述符,通过超参数优化和十折交叉验证,构建了支持向量回归、核岭回归、随机森林及极端随机树四种高效的机器学习模型.这其中,极端随机树模型具有最好的预测性能,其交叉验证
2、R2评分可达 81.48%.同时,还应用极端随机树模型对 MaterialsProject 数据库 36949 种铁磁材料进行了预测,发现了338 个居里温度大于 600K 的铁磁材料.本文提出的方法可以为获取具有高居里温度的铁磁材料提供有价值的帮助,加快铁磁材料设计的过程.关键词:机器学习,铁磁材料,材料组分,居里温度PACS:02.60.Pn,75.50.Ww,77.80.BDOI:10.7498/aps.72.202303821引言作为一种重要的智能材料,铁磁材料在现代科学技术中得到广泛的应用.居里温度(CurieTem-perature,Tc)高于室温是铁磁材料工业化应用的重要前提.遗
3、憾的是,目前 Tc高于室温的候选铁磁材料不多.为满足信息技术发展需要,近年来许多研究者通过不同的方法试图合成高 Tc的铁磁材料13.另一方面,密度泛函理论已成为模拟铁磁材料的典型理论方法,它结合海森伯哈密顿量,求解磁交换相互作用,并通过蒙特卡罗方法求解 Tc.这种方法计算量大、效率低,不适用于高通量材料计算和设计.在材料基因组计划的推动下,基于机器学习的材料设计414已成为当前材料研究的一个热点领域.机器学习方法缩短材料设计周期,也被广泛地应用于磁性材料的预测.Kabiraj 等6利用高通量自动化代码和数据驱动模型,遍历了二维(two-dimension,2D)材料数据库,并预测了大量具有高T
4、c的二维铁磁(ferromagneticmaterials,FM)材料.卢帅华等7通过将先进的机器学习技术与高通量密度泛函理论计算相结合,开发了一个自适应框架,以加速二维内秉铁磁材料的发现.Vishina 等12通过对 ICSD(inorganiccrystalstructuredatabase)中包含 3d 和 5d 元素的已知晶体结构进行数据挖掘,使用特定材料的筛选方法结合电子结构计算的高通量方法来寻找无稀土永磁体的可能候选材料.磁性是一种典型的量子效应,与材料组成、结构、化学键、电子结构等密切相关,发展简单高效的磁性如 Tc预测模型仍存在挑战.材料的化学组分是决定材料物性的基础.常用的永
5、磁材料包括铝镍钴系永磁合金、铁铬钴系永磁合金、永磁铁氧体、稀土永磁材料和复合永磁材料等.通过分析现有的永磁材料15及铁磁材料数据集1619,可以发现绝大多数磁性材料含有 Fe,Co,*国家自然科学基金(批准号:11874092)、霍英东教育基金会第十六届高等院校青年教师基金(批准号:161005)和湖南省杰出青年科学基金(批准号:2021JJ10039)资助的课题.通信作者.E-mail:2023中国物理学会ChinesePhysicalSocietyhttp:/物理学报ActaPhys.Sin.Vol.72,No.18(2023)180202180202-1Mn,Ni,O 以及稀土等元素.这
6、表明,材料的组分信息如元素和化学配比,对材料的磁性如 Tc起着至关重要的作用.本文力图基于材料的化学组成信息,建立铁磁材料 Tc预测模型,并发掘具有高 Tc的铁磁材料.本文构建和优化了具有较好的回归和泛化性能的多种机器学习模型.最后,还利用具有最佳性能的极端随机树模型,预测了多种 Tc超过室温的铁磁材料.2数据及方法2.1 数据集从参考文献 1619 中收集了 1568 个铁磁材料作为数据集,该数据集只包含铁磁材料的化学成分信息(元素、化学配比)和相应的 Tc.图 1 展示了铁磁材料的 Tc分布情况,可以看出数据集中铁磁材料的 Tc范围为 01400K,大多数数据样本分布在 600K 以下,而
7、高于 600K 的数据仅占总数据的 20%左右,这表明高 Tc的铁磁材料在数据集中相对较为稀缺.图 2 显示了数据集中 Tc分别大于 300 和 600K时的铁磁材料元素的分布情况,元素分布主要集中在 Fe,Co 和 O.通过分析数据集中大于 300K 的数据,发现 Fe,Co 和 O 元素分别占总元素的 34.3%,11.6%和 16.8%,而在 600K 时,Fe,Co 和 O 元素分别占总元素的 32.2%,25.8%和 15.8%,说明 Fe,Co和 O 是本数据集高 Tc铁磁材料的主要元素.Ni,Mn也是常见的磁性元素,在高 Tc的数据中相对 Fe,Co 元素占比较少,从图 2 可以
8、得知,Ni,Mn 的占比相对其他元素依旧拥有一定的数量,对模型的训练不会产生太大的影响.2.2 机器学习模型及超参数的优化本文采用 sklearn20平台上的支持向量机(supp-ortvectorregression,SVR)、核岭回归(kernelridgeregression,KRR)、随机森林(randomrorest,RF)以及极端随机森(extremelyrandomizedtrees,EXT)四个机器学习模型.针对 SVR 和 KRR 算法的超参数采用了遗传算法21进行优化.KRR 和 SVR选取了高斯核函数(rbf),对模型中的 alpha 参数进行了优化,其值设置为 0.00
9、567165.对于 SVR模型,其模型性能取决于参数 c 和 gamma.参数c 是一个常数,它决定了对估计误差的正则化惩罚,其设置为 181.8797945,gamma 是核系数的系数,其设置为 0.18646131.针对 RF 和 EXT 模型,主要由 3 个超参数决定模型的性能.通过在一定的超参数区间内,采用均匀网格搜索22的方式选取最Curie temperature/K020406080100Number0200400600800100012001400图11568 个铁磁材料数据集 Tc的分布情况Fig.1.Distribution of Tc in 1568ferromagnet
10、ic materialdatasets.Fe O CoMn Ni H Y Gd Cr Rh B Ge S NdCu05101520253035Chemical elementPercentage(a)05101520253035PercentageChemical element(b)Fe Co O Ni MnRhGd B SmCu Y Tb H Dy Al图2数据集中铁磁材料的元素分布情况(a)Tc大于 300K 时元素分布;(b)Tc大于 600K 时元素分布Fig.2.Elementdistributionofferromagneticmaterialsindataset:(a)Elem
11、entdistributionwhenTcisgreaterthan300K;(b)ele-mentdistributionwhenTcisgreaterthan600K.物理学报ActaPhys.Sin.Vol.72,No.18(2023)180202180202-2佳超参数(图 3 所示),“n_estimators”被设置为从100 到 300,步长为 10;“max_features”以 0.02 步,从 0.10 到 0.60;“min_samples_leaf”默认选择最小的 0.001.不同模型的优化结果见表 1.3结果及讨论3.1 特征选择特征选择可以降低过拟合的风险,更好地去
12、除与目标值无关的特征从而达到优化模型以及缩短训练时间的目的.本文总共生成了 397 个特征,其中使用 matminer 库生成了 362 个特征,参考文献 8,9,18,23 生成了 35 个特征.在这些特征中,根据化学配比的关系,采用了加权比例的方法来构建特征,如 Fe2O3,其原子序数特征被定义为:8(3/5)+26(2/5)=15.2.针对 397 个特征,我们发现前 20%的特征几乎占据了 95%以上对 Tc预测模型的贡献度,因此提取了前 20%的 80 个特征作为新一轮的候选特征.之后考虑到特征之间可能存在相似性高的情况,影响模型的预测结果,采用皮尔逊相关系数24,计算两个特征之间的
13、相似性且去除相似度大于 90%的特征,最终得到了表 2 中21 个化学参数作为铁磁材料的描述符.0.794(a)RF0.7920.79020.7880.7860.10.2max_featuresn_estimators0.30.40.50.61001502002503000.81(b)EXT0.800.7920.780.760.770.10.2max_features_estimators0.30.40.50.6100150200250300图3均匀网格搜索(a)随机森林参数优化图;(b)极端随机树参数优化图Fig.3.Uniformgridsearch:(a)Randomforestpara
14、meteroptimizationmap;(b)extremerandomtreeparameteroptimizationmap.表1本研究中四种机器学习模型的超参数Table1.Hyperparametersoffourmachinelearningmodelsinthisstudy.模型超参数KRRalpha=0.00567165,kernel=“rbf”SVRkernel=“rbf”,C=181.8797945,gamma=0.18646131RFn_estimators=170,max_features=0.30,min_samples_leaf=0.001EXTn_estimato
15、rs=180,max_features=0.58,min_samples_leaf=0.001表2基于特征筛选获得的化学参数描述符Table2.Chemicalparameterdescriptorsobtainedbasedonfeaturescreening.No.MeaningsFeatures1MeanatomicnumberMAN2MeanIonicRadiusMIR3MeanModulusofElasticityMME4MeanmeltingpointMMP5MeanGSmagmomMGSM6MeancovalentradiusMCR7MeanIonizationEnergyMIE
16、8MeanElectronAffinityMEA9MeanAtomicVolumeMAV10MeanMendeleevNumberMMN11CompositionofMnCMn12CompositionofFeCFe13CompositionofCoCCo14CompositionofNiCNi15rangeAtomicRadiusRAR16rangeElectronegativityREE17avgpvalenceelectronsApV18avgdvalenceelectronsAdV19fracfvalenceelectronsFfV20transitionmetalfractionTM
17、F212-norm2N物理学报ActaPhys.Sin.Vol.72,No.18(2023)180202180202-33.2 模型训练本研究采用 80%数据作为训练集,20%数据作为验证集,构建并比较了四个不同的机器学习模型.使用平均绝对误差(MAE),均方根误差(RMSE)和决定系数(R2)三项指标对四种机器学习模型的结果进行评估,评估结果见表 3(CSMAE,CSRMSE,CSR2分别表示十次交叉验证结果的平均绝对误差、平均均方根误差、平均决定系数).其中,KRR 模型的 CSMAE,CSRMSE 和 CSR2分别为 94.41,141.21 和 73.70%;SVR 模型的 CSMAE
18、,CSRMSE和CSR2分别为88.64,137.62 和74.92%;RF 模型的CSMAE,CSRMSE 和 CSR2分别为 81.18,124.13和 79.45%;EXT 模型的 CSMAE,CSRMSE 和CSR2分别为 74.04,117.98 和 81.48%.为了更好地展示不同机器学习模型的预测性能,图 4 给出了四种机器学习模型在实验值和预测值之间的二维散点图.经过比较,发现无论是模型本身还是交叉验证的结果,EXT 模型都拥有最低的 MAE 和 RMSE 以及最高的 R2评分.这表明相对于其他三种模型而言,EXT 模型具有更加优秀的性能,在铁磁材料 Tc的预测方面表现出色.图
19、 5 展示了 EXT 模型在训练过程中,描述符的重要性情况.在所有描述符中,“型在训练过GSmagmom”(原子的单元素固体磁矩的平均值)是最重要的特征,占特征重要性的 21.6%.其次,“CompositionofFe”和“CompositionofCo”分别占重要性的 11.0%和 15.1%.这表明在化合物中,Fe 和 Co 元素的含量对预测高 Tc铁磁材料具有很大的影响.3.3 预测还将建立的 EXT 模型用于预测已有数据库中化合物的 Tc.使用了 MaterialsProject 数据库25中所有的铁磁材料,经过去重复处理,得到了包含36949 个数据的预测数据集.如图 6 所示,我
20、们的预测模型发现在 2531 个 Tc大于 300K 的材料中,主要元素成分以 O,Fe 和 Co 为主,分别占据了 28.2%,表3本研究中四种机器学习模型的最终评估结果Table3.Final evaluation results of four machinelearningmodelsinthisstudy.KRRSVRRFEXTMAE89.4383.2176.5270.86RMSE125.50125.77114.71109.32R2/%80.7580.6783.9285.39CSMAE95.4188.6481.1874.04CSRMSE141.21137.62124.13117.98
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 材料 组分 信息 居里 温度 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。