地球物理测井反问题机器学习数据集的构建方法研究.pdf
《地球物理测井反问题机器学习数据集的构建方法研究.pdf》由会员分享,可在线阅读,更多相关《地球物理测井反问题机器学习数据集的构建方法研究.pdf(16页珍藏版)》请在咨信网上搜索。
1、第6 6 卷第7 期2023年7 月邵蓉波,史燕青,周军等.2 0 2 3.地球物理测井反问题机器学习数据集的构建方法研究地球物理学报,6 6(7):30 8 6-310 1,doi:10.6038/cjg2022P0936.Shao R B,Shi Y Q,Zhou J,et al.2023.Construction of machine learning data set for geophysical logging inversion.ChineseJ.Geophys.(in Chinese),66(7):3086-3101,doi:10.6038/cjg2022P0936.地球物理学
2、报CHINESE JOURNAL OF GEOPHYSICSVol.66,No.7Jul.,2023地球物理测井反问题机器学习数据集的构建方法研究邵蓉波,史燕青1-3,周军1.4,肖立志1.2.3*,廖广志1.2.3,侯圣峦51中国石油大学(北京)人工智能学院,北京10 2 2 492中国石油大学(北京)地球物理学院,北京10 2 2 493中国石油大学(北京)油气资源与探测国家重点实验室,北京10 2 2 494中国石油集团测井有限公司,西安7 10 0 7 55华为技术有限公司,北京10 0 0 9 5摘要基于数据驱动机器学习的智能地球物理测井有望显著提高测井资料处理与解释的效率,具有广阔
3、的应用前景.但是,数据驱动的测井反演如储层参数预测面临小样本、少标签和可解释性差等困难.通常,人工解释实测数据集是测井机器学习标签的主要来源.由于井下油气储层复杂多样,测井反演具有多解性,且地层具有非均质性,实测数据集构建的标签体系不仅量少,可靠性也存疑.本文提出基于地质领域知识和岩石物理机理模型,通过正演模拟构建测井反问题机器学习数据集的方法.从地质约束出发,综合考虑井眼环境、测井仪器、地层模型及流体分布等影响,由测井领域知识正演生成测井数据以弥补实测数据集的不足,以此实现机理模型与数据驱动的融合.数值实验结果表明,正演生成的测井数据集有效扩充了样本和标签数量,其参与储层参数预测及储层划分深
4、度神经网络训练,对发展数据驱动及数据与机理混合驱动的方法、提升测井储层评价参数预测模型效果,成效显著.关键词地球物理测井;反问题;机器学习;数据集;正演模拟;机理模型doi:10.6038/cjg2022P0936Construction of machine learning data set for geophysical logging inversionSHAO RongBo,SHI YanQingl*,ZHOU Jun-,XIAO LiZhi-2.3*,1 College of Artificial Intelligence,China University of Petroleum
5、,Beijing 102249,China2 College of Geoph ysics,China University of Petroleum,Beijing 102249,China3 State Key Laboratory of Petroleum Resources and Prospecting,China University of Petroleum,Beijing 1o2249,China4 China Petroleum Logging Co.,Ltd.,Xian 710075,China5 Huawei Cloud Computing Technologies Co
6、.,Ltd.,Beijing 100095,ChinaAbstract Intelligent logging interpretation based on data-driven machine learning has promisingprospects for significantly improving the efficiency of well logging data processing and interpretation.However,data-driven logging inversion,such as reservoir parameter predicti
7、on,faces challenges中图分类号P631LIAO GuangZhil.2.3,HOU ShengLuan收稿日期2 0 2 1-12-13,2 0 2 2-0 9-0 2 收修定稿基金项目国家自然科学基金项目(42 10 2 118),国家重点研发计划项目(2 0 19 YFA07083),中国石油天然气集团有限公司一中国石油大学(北京)战略合作科技专项(ZLZX2020-03)联合资助.第一作者简介邵蓉波,女,19 9 5年生,博士研究生,主要从事机器学习算法及其应用、油气人工智能等方面的研究工作,E-mail:*通讯作者肖立志,男,19 6 2 年生,教授,从事地球物理测井
8、和油气人工智能及其应用方面的研究工作.E-mail:x i a o li z h i c u p.e d u.c n7期such as small sample size,limited labels,and poor interpretability.Typically,manually interpretedmeasured logging dataset is the main source of machine learning labels.Due to the complexity ofsubsurface fluid resources,the multiple solution
9、s of logging inversion,and heterogeneity offormation,the reliability and quantity of labels constructed from measured data sets are questionable.This paper proposes a method for constructing machine learning datasets for logging inversionbased on geological domain knowledge and petrophysical mechani
10、sm models by forward simulation.Starting from geological constraints,this method comprehensively considers the influences ofborehole environment,logging instruments,formation models,and fluid distribution,loggingdata to generate logging dataset by forward simulation based on petrophysical domain kno
11、wledge.The model trained by generated dataset could achieve the fusion of mechanism model and data-driven approach.Numerical experiments show that the forward-synthesized well logging dataseteffectively increases the sample and label quantity.By participating in the training of deep neuralnetworks f
12、or the reservoir parameters prediction and reservoir fluid classification,it significantlyimproves the effectiveness of well logging reservoir parameter prediction models and promotes thedevelopment of data-driven and data-mechanism-driven methods of data and mechanism.Keywords Geophysical logging;I
13、nverse problem;Machine learning;Datasets;Forward modeling;0引言测井提供井下油气储层的第一手资料,其应用范围覆盖从油气田勘探开发初期对油气层位和储集参数的确定,储量的估算,到射孔、压裂等完井方案的制定,再到产能预测、套管检测及生产动态监测等各个环节,对油气层的发现、认识和改造具有重要价值.地球物理测井根据物理学的原理,使用测井仪器沿井孔剖面测量岩石物理性质,通过岩石物理反演得到地层参数,了解井下地层地质学信息及油气水等资源的状态.油田勘探中常使用井径、自然伽马、自然电位、密度、中子、声波时差、深中浅电阻率9种常规测井方法组合测量.测井仪
14、器采集的信息为井下地层的物理响应,无法直接反映地层信息,需要对其进行处理,转化为储层参数.解释专家根据地质条件、录井资料等信息选择合适的解释模型,依据岩石物理机理和自身经验对处理后的测井数据进行岩性识别,进而得到储层参数、流体类型等信息.正、反演问题是测井资料解释中最核心、最普遍的问题(金振武和肖立志,1989),正问题由因推果,反问题倒果求因(Atkinson,1985;T a r a n to la,19 8 7).反问题的引人极大地丰富了测井资料解释的理论内容,在地下储层信息不能直接探知的情况下,通过特定的物理手段,获取地层物理性质、受力状态或热流密度分布等信息,进而转化邵蓉波等:地球物
15、理测井反问题机器学习数据集的构建方法研究Mechanism model3087为数学上的反问题进行处理(姚姚,2 0 0 2;杨文采,2002).然而,测反问题具有不适定性、病态性、不确定性等特点(Tarantola,2 0 0 9;栾文贵,19 8 8),这是由反问题自身特性导致的,是测井资料解释中必须面对的难点.地球物理测井反问题原始求解思路可分为两类,一种是借助正问题表达式求解方程,即利用测井响应方程求解储层参数(肖立志和钟兴水,1990),一种是对比观测值和理论值直接求解储层参数,如最优化测井解释(肖立志,19 8 8,19 8 9 a,b,19 9 1).人工测井解释仅依靠岩石物理机
16、理和测井数据了解井下情况,而井下情况复杂多变,解释专家主观因素对解释结果影响较大,使用新的数据分析处理工具重新分析数据集可能会产生重大发现(Reichsteinet al.,2019).近些年兴起的机器学习技术为油气勘探带来新的技术变革,神经网络等数据驱动的机器学习算法从数据角度描述数据间映射关系,作为一种强大的数据处理与信息挖掘工具被广泛应用于固体地球物理中(Bergenetal.,2 0 19).目前,机器学习在复杂岩性岩相精细划分、流体识别、裂缝识别与分类、储层分类、测井曲线重构、储层参数预测、成像测井图像处理、储层微观孔隙结构测井智能表征等方面均有一定程度的进展(程超等,2 0 2 2
17、).在岩相分类任务中,Dubois等(2 0 0 7)对比分析了贝叶斯分类器、K近邻、BP神经网络等7 种机器学习方法在测井岩相分类方面的效果,实验结果表明BP神经网络具有3088强大的非线性映射能力,在岩相分类问题上表现突出.Jaikla等(2 0 19)提出了一个预测测井曲线中有地质意义岩相以及划分储层与非储层的FaciesNet模型,将卷积自编码器与双向递归神经网络结合,在提取地质信息的同时分析叠加模式的岩相与地质相关性.在其他方面,Gasior和Przelaskowska(2 0 14)以常规测井资料作为输人,将神经网络用于连续导热值系数的反演,结果表明神经网络得到的反演结果与实验数据
18、的一致性较好.Reolon等(2 0 2 0)将贝叶斯网络与基于图的多分辨率聚类方法引入固井质量评价任务,对井下水泥胶结相和水力间隔相分类,并输出分类概率.Meshalkin等(2 0 2 0)对比分析了7种机器学习算法反演测井资料中岩石热导率的效果,不需要依靠额外参数,机器学习算法可以直接对岩石热导率进行预测.廖广志等(2 0 2 0)的研究表明卷积神经网络可以用于预测储层微观孔隙结构,且效果优于单层神经网络模型.Gao等(2 0 2 2)使用基于多层感知器(MLP)的低电阻率低对比度(LRLC)储层识别方法,解决了LRLC储层中油水识别问题.Shao等(2 0 2 1a)利用基于相关性迁移
19、学习提升测井储层参数预测神经网络模型的效果,并分析测试不同迁移学习方法对储层参数预测模型效果的影响(邵蓉波等,2 0 2 2 a).T a n g 等(2 0 2 1)利用集成学习方法寻找砂岩储层中的甜点,比支持向量机方法取得了更好的效果.Luo等(2 0 2 2)发现字典学习方法在低场核磁数据降噪方面有良好表现.Shao等(2 0 2 1b)提出了“私有-共享”型多任务测井储层参数预测神经网络模型,相较于单任务模型,多任务模型的泛化性更强,并且分析不同结构的多任务学习模型对储层参数预测效果的影响,发现异架构多任务模型预测效果优于其他模型(邵蓉波等,2 0 2 2 b).罗刚等(2 0 2 2
20、)提出多级别流体识别方法,分等级预测储层流体类型,大幅度提升油层等小样本流体类型的预测精度.李贺男等(2 0 2 2)将卷积神经网络(CNN)与长短期记忆神经网络(LSTM)结合,基于变分自编码器(VAE)提出用于测井储层参数预测的CNN-LSTM-VAE混合模型,与单一模型相比混合模型具有更好的时空特征提取能力。以深度学习为代表的数据驱动机器学习算法在地质地球物理的数据处理、解释方面展现出强大能力,未来还将继续发挥重要作用.对于数据驱动的监督学习模型而言,数据集的质量与数量直接决定模型的质量,数据集的构建也是机器学习建模中最耗时的步骤(YuandMa,2 0 2 1).目前机器学习发展较好的
21、地球物理学报(Chinese J.Geophys.)66卷领域均有标准数据集,例如计算机视觉(ComputerVision)领域的ImageNet数据集,可用于图像识别任务(Deng etal.,2 0 0 9);自然语言处理(NaturalLanguage Processing,NLP)方面的斯坦福问答数据集(Stanford Question Answering Dataset,SQuAD),用于文本理解任务的模型训练(Rajpurkaretal.,2016);语音处理(Speech Processing,SP)中的 LibriSpeech数据集提供语音识别任务的训练数据(Panayoto
22、vetal.,2 0 15).标准数据集不仅可以为研究人员提供高质量、大批量数据,满足数据驱动机器学习的训练,还方便不同方法间比较性能,并对算法进行改进与提升.在人工智能地震研究中,斯坦福大学发布了符合标准数据集规范的地震信息数据集STanfordEArthquake Dataset(STEAD),包含实测的自然地震信号和人为诱发地震信号,总时长超19 0 0 0 h(约12 0 0万时间序列)(Mousavietal.,2 0 19).目前,众多地质学家或人工智能学家基于STEAD数据集开展人工智能地震信号处理与解释的研究(MousaviandBeroza,2020;Mousavi et a
23、l.,2020;Min et al.,2021;Zhang et al.,2022).然而在地球物理测井中,测井数据属于油田保密信息,不适合公开发表.而且,测井数据的标签大多通过解释人员处理得到,主观性较强,标签的真实性和有效性难以界定.现有地球物理测并公共数据集大多存在测井曲线缺失、标签值缺失、标签可靠性存疑、样本分布不均衡、样本量较少等问题.为提升数据集质量,Zhang等(2 0 18)提出了一种利用现有测井数据生成综合测井曲线的机器学习方法,可以根据井径、自然电位、自然伽马和电阻率生成声波时差与密度曲线.Garcia等(2 0 2 0)使用无监督人工神经网络补全缺省的光电截面指数,补全后
24、的数据可以有效提升岩相分类的效果.张浩等(2 0 2 1)提出一种基于卷积神经网络的电成像图像空白条带填充方法,具有处理速度快、干扰区域少、连通性强、相关性高的特点.周欣等(2 0 2 2)提出一种基于双向门控循环单元(BGRU)神经网络的声波测井曲线重构技术,使用电阻率、密度、补偿中子和井径对声波测井数据进行重构,获得较好的效果.以上方法大多从补全缺省数据的角度出发,提升真实测井数据的数据质量,没有解决标签可靠性及数据安全等问题,成为发展智能测井方法和提高应用效果的瓶颈.田志等(2 0 19)、田志(2 0 2 1)为研究核磁共振扩散耦合,基于矿物沉积建立了多种地层的微米尺度数字岩心模型,并
25、实现了多矿物、多相流的多维核磁7期共振响应的正演数值模拟.正演数值模拟方法不仅有利于深入研究地球物理机理,还能生成大量无噪数据.本文提出根据正问题表达式构建地球物理测井反问题机器学习数据集的方法,基于地质条件、仪器结构及测井响应方程等测井知识,生成代表性测井数据集和典型有效测井数据标签,作为实测数据集的有效补充.从储层类型、储层参数等标签数据获得测井响应值,保证数据标签的真实性和准确性;还可以根据需要定制地球物理测井数据,无限量生成具体应用场景的高质量测井数据集,解决数据不均衡等问题.本方法生成的测井数据可直接用于机器学习模型训练,且数据融合地质知识与地球物理机理模型.数据-机理联合驱动的机器
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地球物理 测井 问题 机器 学习 数据 构建 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。