![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于GPU加速的投影后变分壳模型计算.pdf
《基于GPU加速的投影后变分壳模型计算.pdf》由会员分享,可在线阅读,更多相关《基于GPU加速的投影后变分壳模型计算.pdf(7页珍藏版)》请在咨信网上搜索。
1、第58 卷第2 期2024年2 月原子能科学技术Atomic Energy Science and TechnologyVol.58,No.2Feb.2024基于GPU加速的投影后变分壳模型计算陆晓,连占江*,高早春(中国原子能科学研究院核物理研究所,北京10 2 413)摘要:为进一步拓展投影后变分(VAP)壳模型计算应用核区范围,需提升VAP的计算效率。为此,利用OpenACC并行编程指令,首次将VAP程序从传统的 CPU平台移植到了高性能GPU计算平台上。在角动量投影的每个积分格点上实现了数目庞大的各独立转动矩阵元的GPU并行化计算。经验证,采用GPU加速后的VAP程序计算得到的结果与原
2、来的OpenMP并行化程序计算得到的结果完全相同,而计算效率得到了数倍的提升。借助于GPU加速技术,首次计算了变形重核17 8 Hf的基带能谱,打开了VAP壳模型方法应用于变形稀土重核之门。关键词:壳模型;投影后变分;GPU;OpenACC中图分类号:TL11;O571.6doi:10.7538/yzk.2023.youxian.0311GPU Accelerated Variation after Projection CalculationLU Xiao,LIAN Zhanjiang,GAO Zaochun*(Department of Nuclear Physics,China Inst
3、itute of Atomic Energy,Beijing 102413,China)Abstract:The nuclear shell model has been very successful in describing various proper-ties of nuclei,especially in the neighborhood of the closed shells,where the configura-tion space is usually small but good enough for the construction of the nuclear wa
4、vefunction.However,in the heavy deformed nuclear region,the configuration space isextremely huge.This makes it almost impossible to perform full shell model calcula-tions.To avoid such difficulty,various approximated shell model methods have beendeveloped.Among them,the variation after projection(VA
5、P)method is an importantone,in which the nuclear wave functions with good quantum numbers are sufficientlyoptimized.However,when the VAP method is applied to heavy deformed nuclei,thecomputational burden is still quite heavy.This is because there are a large number ofmatrix elements involving the an
6、gular momentum projection.All these projected matrixelements should be calculated by integrating the corresponding rotational matrixelements over the three Euler angles.Hence,accelerating the VAP calculation is crucialin extending the VAP application to heavy deformed nuclei,which is the purpose of
7、thepresent paper.By analyzing the VAP code,it turns out that most of the computational文献标志码:A文章编号:10 0 0-6 9 31(2 0 2 4)0 2-0 2 7 2-0 7收稿日期:2 0 2 3-0 4-2 8;修回日期:2 0 2 3-0 6-2 1基金项目:国家自然科学基金(119 7 5314,1157 52 9 0);核数据重点实验室开放基金(JCKY2022201C158);国家财政部稳定支持研究经费(WDJC-2019-13,BJ20002501)*通信作者:连占江,高早春第2 期陆
8、晓等:基于GPU加速的投影后变分壳模型计算cost is spent on evaluating the projected matrix elements.When the configuration spaceis huge,such computational cost for the projected matrix elements becomes extremelyheavy.Fortunately,all the rotational matrix elements are independent of one another.This makes it very conveni
9、ent in parallelizing the calculation of these rotational matrixelements.In general,the VAP calculations were accelerated on the traditional CPUplatforms.But in recent years,with the rapid developments of the graphics processingunit(GPU),GPU becomes the first choice of modern high-performance computi
10、ng.Here,by adopting the OpenACC parallel programming directives,the VAP code fromthe traditional CPU platform to the high-performance GPU platform has been success-fully migrated.The calculations of a large amount of the independent rotation matrixelements at each mesh point in the integration of th
11、e angular momentum projection wereparallelized on a GPU card.It is confirmed that the results calculated by the migratedVAP code are exactly the same as the ones calculated by the original OpenMP parallel-ized VAP code.Most important of all,the speed of the GPU accelerated VAP code canbe several tim
12、es faster than that of the original OpenMP parallelized VAP code,whenthey run in the same machine.Using the GPU accelerated VAP code,spectrum of theground state band of the heavy nucleus 178 Hf have been calculated for the first time.This opens the door of the VAP application to the heavy deformed r
13、are-earth nuclei.Key words:shell model;variation after projection;GPU;OpenACC理论上,原子核多体波函数可通过求解薛定方程获得。传统壳模型就是在此基础上建立的。然而,由于模型空间的限制,传统壳模型计算仅限于质量数较轻或幻数附近的原子核。对于变形重核,需更大的价核子空间,相应的壳模型组态空间维度数会变得极其巨大,因而无法实现精确的壳模型计算。这是核多体问题中一直存在的难题,且在可见的未来难以被彻底解决。为回避巨大组态空间这一困难,人们发展了各种壳模型近似方法 1-13,以期进一步扩展壳模型应用核区范围。投影后变分(VAP)
14、方法就是一类较重要的壳模型近似方法 8-13。它将原子核试探波函数进行变分,从而得到尽可能好的壳模型近似结果。通常情况下,VAP波函数可由投影Hartree-Fock-Bogoliubov(HFB)真空态或投影 Hartree-Fock(HF)斯莱特行列式(SD)构成。其中采用HFB真空态完全投影得到具有好量子数(中子数、质子数、角动量和宇称)的波函数需要五重积分,计算非常耗时。而文献 8 的研究表明,在这几种投影中,角动量投影是最重要的。于是,在实际应用中,通常采用HFSD只进行角动量与宇称投影构建初始试探波函数。显然,273在相同数目的投影态下,用投影SD作为VAP波函数的近似不如投影HF
15、B真空态得到的结果好。但前者的近似性可通过添加更多的投影SD来改善。在某种意义上,采用投影SD进行投影后变分计算可减少计算消耗。因此,本文采用的VAP波函数全部基于投影SD构建。然而,随着VAP计算往中重核区推进,计算所需模型空间不断扩大,价核子数目不断增加,为保证计算的精度,就需更多的投影SD参与构建试探VAP波函数,这无疑会造成VAP计算负担的加重,甚至导致VAP迭代收敛非常缓慢。随着半导体和芯片技术的迅猛发展,可提供应用的高性能计算平台不断增加。特别是近年来计算性能飞速提升的图形处理器(graphics processing unit,G PU),其在人工智能、大数据等领域应用广泛,已逐
16、渐取代早期用于并行计算的CPU处理器,成为现代高性能计算的首选。因此,在原子核物理领域,GPU卓越的计算性能也有望进一步提升相关物理模型的计算效率。作为一个具体实例,本文拟将VAP壳模型计算程序从传统的CPU平台移植到GPU平台,以期进一步提升VAP 的计算速度。本文将从VAP的原理出发,介绍其在计274算当中遇到的数值问题,基于OpenACC并行化模型实现VAP在GPU平台上的计算,并通过实例展示采用GPU相对于 CPU在计算效率上的提升。1VAP的数值问题首先,采用投影SD构建的试探VAP波函数可写为如下形式 12:ViMa(K)=Zf/PAix/,)其中:l;为SD;n为SD的数;P派为
17、角动量投影算符PMk与宇称影算符P的乘积;K可取|K|J中的任意一个;用来区分具有相同J、元和M量子数的态;系数fl和相应的能量EJ可通过求解如下Hill-Wheeler(H W)方程得到:(H-ENt)f/=0-1其中:H=;N=(|Pkk|;系数 f/需满足归一化条件,使得 亚jxM(K)I亚JxMa(K)=1。采用n个SD构建VAP波函数,求解HW方程就会得到n个解。假设EEE。但在实际计算当中,通常只对最低的m 进行最优化。从式(1)可看出,亚J元M(K)是由|,决定的。于是,最优化亚J元M(K)实际上是通过对所有的,变分实现。欲对|,进行变分,首先对其进行参数化。此过程可通过如下Th
18、ouless 定理 141实现:(3)其中:N;为归一化常数,满足的粒子空穴算符;N和Z分别为价中子和价质子数;M和Mz分别为中子和质子模型空间的维度;d,为一反对称复数矩阵,其矩阵元di为变分参数。于是,给定一d;矩阵,就可唯一确定一|,)。值得注意的是,每个d;矩阵中,变分参数的数目DvAp与模型空间的大小以及价核子数目存在如下关系:DvAP=N(M-N)+Z(Mz-Z)(4)在VAP计算中,将变分参数取为复数的原子能科学技术第58 卷形式。于是,采用n个 SD构建的VAP波函数,其独立变分参数就有2 nDvAp个。可见,随着模型空间的增大、价核子数目的增多以及SD数目的增加,将会导致独立
19、变分参数迅速增加。接下来就是如何对|进行变分使得亚J元Ma(K)最优化。在给定哈密顿量H的情况下,VAP的能量可表示为如下形式:EJ=(1)=1(2)(5)i-1从上式可看出,能量也是变分参数的函数。前面提到,通常只对最低的个态感兴趣,于是最优的|J元Ma(K)就可通过最小化这m个态的能量之和S=ZE!得到9。而能量之-1和的最小化可通过信赖域牛顿算法 151实现。在最小化能量之和的过程中,为保证VAP计算的稳定性,在迭代过程中计算能量的梯度与Hessian矩阵 9。即计算了如下4类矩阵元:,IOPkkAu1,0/AOPkkATmld),进行投影计算。以角动量投影为例,其算符可表示为如下形式:
20、Piu=2+JdaDi(0)R(0)8元其中:DMk(Q)为 Wigner-D函数;R(2)为转动算符;为3个欧拉角、的简写,dQ=daddysin。从式(7)可看到,投影算符通常包含复杂的积分运算,而这些积分运算通常无法直接用代数方法求解,需借助数值方法实现。如对波函数做上述角动量投影需在3个欧拉角、方向上计算共3重积分。在实际积分过程中,为得到足够精确的积分结果,每个方向上所选取的积分格点的数目需达到一定要求。对于轻核,只需选取少量的积分格点便能得到很(6)(7)第2 期陆晓等:基于GPU加速的投影后变分壳模型计算好的近似结果。然而,随着模型空间的增大和价核子数目的增加,为得到较好的近似结
21、果,所需的积分格点数目也应相应上升。通过式(6)、(7)可看出,对于投影矩阵元的计算,需在每个积分格点处计算其相应的转动矩阵元,然后对不同积分格点处的转动矩阵元进行求和,从而得到投影矩阵元。可见,积分格点数目越多,计算量也就越大。此外,在VAP计算中,哈密顿量通常取为如下形式:H=Ztuctc,+1Zunctetcick(8)其中:t;和Uixt分别为单体和两体相互作用矩阵元;c+和c分别为粒子产生和灭算符;i、j、k、l分别表示不同的单粒子轨道。由式(8)可看出,在两体相互作用下,单个投影矩阵元在特定积分格点处的分量通常包含一个对单粒子轨道的4重求和。基于以上讨论可看到,在VAP计算中,投影
22、矩阵元的计算占据了大部分计算时间。并随着模型空间的增大,价核子数的增多,计算时间会迅速增加。为更直观体现这种计算耗时,以sd模型空间的2 4Mg与pf模型空间的56 Ni的基态为例,采用1个SD,即n=1,对2 4Mg基态到56Ni基态投影矩阵元计算量的增加做一定量估计。首先,对2 4Mg的基态,每个方向上只需选取8 个格点就足以得到好的积分结果。而计算56Ni的基态,每个方向上积分格点的数目通常需增加至18 个。因此,从2 4Mg到56 Ni,总的积分格点数目增加约了10 倍。因为做简单估算,将单个投影矩阵元在特定积分格点处每重求和的求和次数取为原子核所在模型空间的中子轨道数的一半。此时,2
23、 4Mg所处的sd壳包含12条中子轨道,对应的总求和次数为12 9 6,而56Ni所处的力厂模型空间则包含2 0 条中子轨道,其总求和次数为10 0 0 0,接近2 4Mg求和次数的8 倍。最后2 4Mg共有6 4个独立的变分参数,对应有6 4个梯度分量和2 0 8 0 个独立的Hessian矩阵元,56 Ni则共有19 2 个独立的变分参数,对应有19 2 个梯度分量和18 52 8 个独立的Hessian矩阵元,分别是2 4Mg数目的3倍和8.9倍。因此,从2 4Mg的基态到56 Ni的基态,总计算量增加了近7 8 0 倍,且这一数字随着模型275空间的增大和价核子数目的增加会进一步增大。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 GPU 加速 投影 后变分壳 模型 计算
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。