机器学习在地球物理勘探中铀矿资源勘查的应用研究进展.pdf
《机器学习在地球物理勘探中铀矿资源勘查的应用研究进展.pdf》由会员分享,可在线阅读,更多相关《机器学习在地球物理勘探中铀矿资源勘查的应用研究进展.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 40 卷 第 3 期2024年 5月Uranium Geology铀矿地质Vol.40 No.3May2024机器学习在地球物理勘探中铀矿资源勘查的应用研究进展韩世礼1,2,肖健1,2,柳位1,2(1南华大学 资源环境与安全工程学院,湖南 衡阳 421001;2湖南省稀有金属矿产开发与废物地质处置技术重点实验室,湖南 衡阳 421001)摘要 机器学习有自动性、高准确性、可扩展性等优势,适用于大数据处理和自适应任务。在地球物理勘探中运用,可大幅提高勘探效率和准确性,促进技术进步,实现地球物理向智能化解译的发展。文章首先介绍了机器学习在地球物理领域的常用先进方法,如深度学习、深度神经网络、B
2、P神经网络、支持向量机和随机森林的基本原理和分类特点。其次介绍了放射性勘探、地球物理测井、成矿预测和联合反演的基本原理,同时对前人在机器学习应用到这 4方面地球物理领域的实际应用进行综合分析,结果表明,机器学习在这 4个领域中的应用均取得了显著的效果。通过机器学习技术的应用,地球物理勘探能够取得更加全面、精准和高效的成果,同时也能推动这项技术的不断进步。关键词 机器学习;放射性勘探;地球物理测井;成矿预测;联合反演文章编号 1000-0658(2024)03-0555-10 中图分类号 P631;TP39 文献标志码 A2006 年,Hinton1等提出的深度置信网络开启了人工智能的机器学习时
3、代。此后,人工智能技术在各行业不断取得突破,如在自动驾驶、语音助手、语音识别和翻译、智能推荐、智能搜索和手写识别及医学等领域均取得了巨大进展。随着人工智能技术的快速发展,尤其是机器学习方法的广泛应用,极大地促进了智能化物探领域的发展。目前,机器学习 AI技术广泛应用于物探领域,为地球物理学的发展提供了坚实基础。运用机器学习对地球物理信号(重力场异常、磁场异常、时频电磁场、伽马射线光谱、地震波形的变化和地热梯度场等信号)的特征识别可以有效地提高地物信号的自动化处理效率。地球物理勘探领域有许多潜力巨大的人工智能应用。在断层识别2、速度分析3、地震反演4、生成测井曲线5、联合反演成像6、成矿预测7、
4、岩石物理8等方面取得了显著进展9。1 机器学习方法机器学习(Machine Learning)作为人工智能的一种分支,他利用计算机高效率的算法和超强的建立模型的能力,从获取的原始地球物理数据中自动学习这些数据的特征并自动分析和解释这些数据背后所包含的各种地质信息,识别物探数据中的模式和规律,并根据这些原始数据得出的规律对以后所采集到的数据做出预测或决策。机器学习是高效且快速的地球物理大数据地质解释的实用工具,同时也是物探数据解释和分析的前景未来10。机器学习的第一个主要核心思想是通过计算机的高速计算和自动化技术对“输入激励(变量原因域)输出响应(观测结果域)”映射关系的相近拟合11。从广义上讲
5、,机器学习算法是关于解决优化问题的过程。换句话说,用一种数学方法来学习输入的样本数据,并建立一个学习模型,通过不断改进模型DOI:10.3969/j.issn.1000-0658.2024.40.050基金项目 湖南省自然科学基金(编号:2023JJ30506)资助。收稿日期 2023-06-25 改回日期 2023-07-05第一作者 韩世礼(1979)男,讲师,博士,主要从事地球物理勘探和环境地质方面的研究。E-mail:韩世礼铀 矿 地 质第 40 卷参数来提高模型的通用性,避免过度拟合。机器学习的第二个核心思想是模型的训练和优化。当一个模型被训练时,此模型从数据中学习,直到达到最终满意
6、的结果。优化是改变模型参数以提高预测准确性的过程,交叉验证和正则化等方法被用来优化模型,以避免过拟合和欠拟合等问题。机器学习算法有 3种主要类型:监督式学习,从大量标记好的数据中学习,适用于分类和回归问题;无监督式学习,从未标记数据中学习,适用于聚类和关联规则数据挖掘等问题;半监督式学习结合了监督式学习和无监督式学习,利用少量标记数据和大量未标记数据进行学习。机器学习模型的种类有很多,如支持向量机(Support Vector Machines,SVM)、随机森林(Random Forest,RF)、人 工 神 经 网 络(Artificial Neural Networks,ANN)、决 策
7、 树(Decision Trees,DT)、逻辑回归(Logistic Regression,LR)、K 最近邻(k-Nearest Neighbors,KNN)以 及 贝 叶 斯 分 类 器(Bayes Classifier,BC)等,每种模型都有其自己的优劣势和适用范围。因此,在应用中,应根据具体问题选择最合适的机器学习模型以获得最佳解决方案。1.1 深度神经网络1.1.1 深度神经网络基本原理深度神经网络是一种具有多个隐藏层的神经网络,通过多层非线性变换来构建一个复杂的非线性模型,从而学习到更高级别的特征表示。深度神经网络是深度学习(Deep Learning,DL)的一种主要模型,深度
8、学习是一种机器学习技术,深度学习的核心思想是通过多层的神经网络模型自动学习数据中的特征和模式,而深度神经网络则是实现这个目标的一种具体的网络结构。深度学习作为机器学习的一个全新的研究领域,在智能语音助手、大数据可视化、计算机视觉等多个领域都有显著的成效12-13。深度学习是在人工神经网络的研究中提出,Hinton 等14在 深 度 置 信 网 络(Deep Belief Networks,DBN)的基础上提出了非监督贪心逐层训练算法,利用这个算法的逐层初始化可以处理与深度神经网络有关的最优化问题。深度学习最显著的好处在于具备更高级别、更自动化地探索数据结构的能力,其能够自主地发现最适配描述数据
9、集的各种信息,从而能够处理繁杂的非线性难题。王昊等15基于深度学习在大地电磁数据处理、航空电磁数据解释、地震探测定位等领域进行分析研究,总结得出深度学习在地球物理领域的应用将会更加广泛。基于深度学习的深度神经网络,由于含有大量的神经元,在网络训练过程中自动地、可根据数据自适应地对神经元之间的权重进行调整和修正,使得这些神经元形成强互连关系,就像每个人脑中的无数个神经元,并最终实现网络的各类高级功能(图 1)。因此,深度神经网络不仅完备了神经网络的多项特性,而且具备了更强的网络表达功能16,可以被称为深度神经网络(Deep Neural Networks,DNN)。DNN 通过建立一个类似人类大
10、脑的深层神经网络模型,对测得的数据进行深层次的自适应、非显式的数据开发。经过深度学习后,深层神经网络模型的解释变量可以得到最优解。深度神经网络可以对目标数据进行信息特征化和迭代提取并组合,最后生成更抽象的类别表征信息,从而实现对目标数据分类和预测的最佳效果17。DNN 网络结构比浅层学习方法更复杂,由多个层次组成。DNN 采用非线性连接方式,能够处理更复杂的数据表示问题。DNN 技术可以更清晰和分层次地进行潜力开发和表示高难度和繁杂的数据,最终获取核心数据信息和逼近任意复杂函数。赵明等18基于深度学习卷积神经网络法对汶川余震所采集到的数据集进行训练和检测,结果证明深度神经网络法进行实时地震检测
11、有巨大的潜力。王坤喜等19基于数据增广训练的深度神经网络法对一套崎岖海底模型地震物理模拟数据进行压制地震多次波,取得了良好的应用效果。图 1 深层神经网络结构图Fig.1 Deep neural network structure diagram1.1.2 深度神经网络分类深度神经网络是由多个层式单元堆叠叠加而成的20,每个单元包含一个编码器、一个解码器或两者兼备,这些单元可以直接反映网络架构中不同的层级深度及其数据再映射过程。编码器提供的 556韩世礼,等:机器学习在地球物理勘探中铀矿资源勘查的应用研究进展第 3期自底向上的映射将输入映射到隐含空间,解码器通过将隐含空间映射到输入空间来重建输
12、入,并尽可能地使其接近原始输入21。深度神经网络可细分为 3类:第一类是前馈深度网络(Feed-Forward Deep Networks,FFDN),由多个仅含有编码器层的单元堆叠构成,例如多层感知器(Multi-Layer Perceptrons,MLP)和 卷 积 神 经 网 络(Convolutional Neural Networks,CNN)22等;第 二 类 是 反 馈 深 度 网 络(Feed-Back Deep Networks,FBDN),由多个仅含有解 码 器 层 的 单 元 堆 叠 构 成,例 如 反 卷 积 网 络(Deconvolutional Networks,D
13、N)23和层次稀疏编码网络(Hierarchical Sparse Coding,HSC)24等;第三类是 双 向 深 度 网 络(Bi-Directional Deep Networks,BDDN),由多个同时包含编码器层和解码器层的单元堆叠构成,例如深度玻尔兹曼机(Deep Boltzmann Machines,DBM)、深 度 信 念 网 络(Deep Belief Networks,DBN)和 栈 式 自 编 码 器(Stacked Auto-Encoders,SAE)25等。1.2 BP神经网络1.2.1 BP神经网络基本原理1986 年,由 Rumelhart 等科学家提出的误差反
14、向传播人工神经网络模型,称为 BP 神经网络(Back Propagation Neural Network,BPNN)。该模型运用广泛,是现如今最常使用的神经网络模型之一。其具有 3 层结构:输入层、隐藏层和输出层,这 3 层的任何一层都包含了数量不限的神经元,BP神经网络的训练过程分为 3个阶段:1)信息正向传播:训练数据通过输入层加载到 3 层神经网络模型中,由隐藏层的神经元进行处理,然后从输出层提取;2)误差反向传播:比较实际输出和理想输出之间的误差,应用梯度下降法,按照误差函数下降最快的方向调整各层神经元的权重和阈值。3)循环迭代:重复前两项的过程,当预定值达到了特定的精度或者迭代次
15、数足够即可输出结果(图 2)。张瀚等26基于 BP 神经网络构建三维地质模型对第四系覆盖物厚度进行预测,结果此方法具有良好的可视化效果,解决了区域范围第四系覆盖物厚度的预测难题。王志豪等27通过 BP 神经网络构建新的非电性测井饱和度评价模型用于分析含水饱和度和岩心数据,结果可知含水饱和度与岩心数据之间具有更高的吻合度,为页岩气含水饱和度的评价开拓了新的思路。图 2 BP神经网络结构示意图Fig.2 Schematic diagram of BP neural network structurex1xixm训练数据;y1yjyn输出结果。1.2.2 BP神经网络的特点BP 神经网络是一种分布式
16、存储和处理信息的计算模型,信息通过神经元状态和他们之间的连接方式进行编码和传递;具有高度的容错性、适应性和鲁棒性,能够有效应对复杂的学习任务和实际需求;连接权重具有可调性,具备自学习和自适应性,可以自主学习和感知外界因素;信息存储和处理是紧密耦合的,以高度并行的方式进行大规模处理,比现代数字计算机更加优越。1.3 支持向量机1.3.1 支持向量机基本原理Vapnik28提出了支持向量机(SVM)方法,此方法基于结构风险最小原理和统计学习理论,借助非线性函数,将低维数据映射到高维空间,并在多维空间中运用二次规划来解决分类和回归问题,从而有效克服了数据维数的困难。最终,得到了分类决策函数或回归估计
17、函数。SVM 是一种基于 VC 维(Vapnik-Chervonenkis Dimension)理论的统计学模型,属于有监督学习中常用的分类和回归模型。他通过在高维空间中寻找最优超平面作为决策函数来加强机器学习的技术,在利用样本最少的情况下得到经验风险和置信范围的最小化以达到最佳分类效果。SVM 能够选择出具有代表性的样本点,并基于这些样本点计算出最优分类超平面,以实现对线性可分数据的最优分类(图 3)。支持向量机(SVM)是一种在数据样本极少的条件下实现学习精度与学习函数复杂度之间平衡的优秀方法。相比传统算法,他它有效地解决了过拟合问题,同时具有强大的泛化能力,适用于处理非线性的分类、回归等
18、问题。理论上,SVM 方法可以收敛到全局最优解,从而了躲开了 BP神经网络中的局部极值问题。SVM 在样本数据量很小的条件下,557铀 矿 地 质第 40 卷权衡学习精度和学习函数复杂性之间的折中关系,解决了过拟合问题,从而实现了不错的泛化效果。他适用于解决非线性分类、回归等问题,并在实际应用中得到广泛的应用和认可。理论情况下,使用SVM 能获得全过程的最优解,不必考虑 BP神经网络带来的局部极值影响。图 3 支持向量机结构示意图Fig.3 Schematic diagram of support vector machine structurex1、x2xn训练数据;k(x,x1)、k()x
19、,x2k(x,xn)核函数;y输出结果。李铁牛等29基于改进支持向量机的微震初至波到时自动拾取法对某矿井下微震监测数据进行分析,结果表明该方法对微震初至波到时的拾取准确精度高于常用的长短时窗能量比法。张涛等30基于自适应粒子群优化最小二乘支持向量机法构建岩性判别模型,对几种岩石的垂向分布进行预测,有效解决了深层基底变质岩储层精细描述中的岩性精准识别难题。1.3.2 支持向量机分类SVM 分类的基本思想是在几何间隔最大的分离超平面上正确划分数据集,从而实现对数据样本的分类。根据数据样本的特征,数据可以被分成线性可分和非线性可分两种情况。如果数据线性可分,则 SVM 会在初始特征空间中构建最大间隔
20、分离超平面,并用训练集构建分类器来对样本进行分类。如果训练数据是线性可分的,则有无数个线性分离超平面可以将数据正确划分,但最大间隔分离超平面却只有唯一的一个(图 4)。图 4中,四角星形和菱形表示不同的数据,3 条虚线表示划分这两种数据的超平面,绿色虚线是最优的超平面。当数据在原始空间中无法线性划分时,可以使用核函数将其映射到高维空间中进行分类。通过核函数的非线性变换,可以使得在低维度空间中难以区分的样本在高维度空间中被更好地分离。基于此,我们可以通过最优化分类超平面的方法将不同类别的样本有效地分离,从而实现更高准确率的分类(图 5)。图 5中,右侧的紫色平面代表超平面。图 4 支持向量超平面
21、Fig.4 Support vector hyperplane图 5 超平面分离线性不可分数据样本图Fig.5 Sample of inseparable data by hyperplane separated linearly1.4 随机森林1.4.1 随机森林基本原理随机森林算法是基于 Bagging 算法和集成学习思想的一种集成划分识别算法,由Breiman提出31。Bagging 算法采用自助抽样的集成方式,将原始训练集分为 k 个子集,在每个子集上构建一个分类器,得到 k 个全局相关的模型,在预测时综合这些模型的结果来获得最终的预测结果。随机森林是一种特别的 bagging,利用决
22、策树当作模型,通过自助法完成训练数据的随机抽样,建立k个决策树,形成森林。在分类中,每个模型都对样本负责投票,根据得票最多的类别来进行分类;在回归问题中,每个模型的预测值将被取均值来获得最终预测结果(图 6)。康乾坤32基于随机森林算法,建立铀矿异常判断和岩性区分模型,对已知矿化层的特征信息和随机森林的识别结果进行验证分析,并同传统的铀矿勘查方法比较取得了不错的效果,表明随机森林算法在铀矿异常识别中具有良好的地质前景。郭建宏等33利用斜率关联度法与随机森林算法相融合,对测区内的测井资料进行煤气层含量评估,计算得出的结果可信度高,对煤气层勘探开发具有指导意义。558韩世礼,等:机器学习在地球物理
23、勘探中铀矿资源勘查的应用研究进展第 3期图 6 随机森林算法工作流程图Fig.6 Workflow diagram of random forest algorithm1.4.2 随机森林的特点随机森林算法具有高性能和实用性,因为此算法集成了学习和“Bagging”算法的创新,大大提高了容错性和训练稳定性,避免了过拟合、欠拟合、局部小型化和不稳定等问题。随机森林算法借助多个学习器的集成和组合,具有出色的泛化能力,从而扩展了算法的性能和适用范围。这两个理念是随机森林算法优势的重要原因,目前仍然是基础研究的主要工具。2 机器学习在放射性物探领域的应用放射性物探技术是一种研究地质结构和岩石成分的无损
24、检测方法,其基本原理是利用地下放射性元素自发核衰变时的辐射释放情况,通过对其放射性衰变物质的粒子能量、方向和强度进行测量和分析,得出地下物质的特征参数,从而推断地下结构和岩石成分的分布情况,最终目的是对测区内的可利用矿产资源进行勘探。将机器学习和放射性物探相结合,充分利用机器学习的高性能算法和超快的计算能力,对所采集到的海量数据进行分析和处理,能够快速且准确地找到矿产资源的位置、形态、大小、厚度及含量等相关信息。下面介绍放射性物探法中常用的伽马测量和氡气测量这两种常用的方法。2.1 伽马测量伽马射线测量是借助仪器测量地质体中铀及其衰变产物所放出的 射线来进行矿物勘探。在大自然中,若铀镭含量达到
25、放射性平衡状态时,铀元素释放的 射线占全部含量的 2.1,而镭元素释放的 射线则占据 97.9的比例。所以伽马测量本质上是利用检测镭元素的 射线来得出结果的34。使用伽马测量时,通常挑选出岩石露头较多,浮土厚度低于 2 m,分散晕发育及地质条件有助于成矿富集的地区。胡浩行35研究并发展了一种基于多个维度的深度卷积神经网络模型,可用于提取核素能谱的特征。该模型可以针对一维波形能谱和二维能谱图像进行有效的属性选择和标记排序,再利用传统的特征提取方法进行类比,最终得出结论。这种核素能谱特征提取方法,未来在核素能谱测量领域中有着广泛的应用前景。2.2 氡气测量氡是一种放射性气体,可由镭衰变而来,且可在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 地球物理 勘探 铀矿 资源 勘查 应用 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。