新疆馆藏地质资料知识图谱构建.pdf
《新疆馆藏地质资料知识图谱构建.pdf》由会员分享,可在线阅读,更多相关《新疆馆藏地质资料知识图谱构建.pdf(6页珍藏版)》请在咨信网上搜索。
1、新疆地质XINJIANGGEOLOGY2024年3月Mar.2024第42卷 第1期Vol.42 No.1?新疆维吾尔自治区地质?能?务系统?目?日期?2023-09-21?日期?2024-01-02?(1998-),?,?人,2021?新疆?业大学计?技术专业?读?,研究方向为?E-mail:?(1978-),?,?,?,研究方向为?,人?能?E-mail:?地?资?1,2,3,?1,李?1,?2,3,?2,?4,?5(1.新疆?院,新疆 乌鲁木齐 830052;2.新疆维吾尔自治区自?中心(新疆维吾尔自治区自?)新疆 乌鲁木齐 830002;3.新疆?中心,新疆 乌鲁木齐 830002;4
2、.?院,?266061;5.新疆维吾尔自治区地质调查院,新疆 乌鲁木齐 830000)?为?新疆自?源?地质?信?成?,?目?查?阅?限?目录查?方?的?,?入?新疆?地质?行?管理。?3 108?地质?为数据源,?本体?定?体和关系?基?BIO?新疆?地质?数据?行人?BERT-BiLSTM-CRF?成?取,?选?数据库Neo4j?新疆?地质?,?成新疆?地质?的?。?果?明,BERT-BiLSTM-CRF?的?为98.177 7?、F1?为97.892 1?,能?出新疆?地质?中的地质?体。新疆?地质?的?为新疆自?源?的“数?”?及新疆地质?大数据?会?务?的?定基础。?地质?取?数据库
3、地质?是由地质部?收?、?理和?的各?地质?作业务成果的?录?1,2?,为地质?作者?有关地质?、矿产?源等方面的信?,?我国发?有?要的支?作?。随着科技的发?,地质?域也?入大数据时?,地质?数?大,数据?低?等?。?的?最?由Google公司?出?3?,是?世?中的?体及?体之?的关系?的形?行?的?库?4?。?地质学?域中,?入?能?为?源勘?、自?预?等方面?支持?5?。地质?域?的基础是?名?体?6?,即?理的地质?域文本中?定类?的专有名?体,?性直接?地质?域?自?理技术的?果。张?BiLSTM-CRF?学?的基础上?7?,?合?BERT预?,?地质文本?行?体?取,?名?体?
4、方面取?定成?。Qiu等人?从地质文?中?取地质?体的?8?,?出 Attention-BiLSTM-CRF?,?中?的?向LSTM能?的?取地质?体上?文的?征,?体的?低。上述研究者?学?的方法?中文地质?域?行?名?体?,?数?地质?关文?为数据源?行?体?取,目?新疆地质?技术的研究。本文?入新疆?地质?的信?管理中,选?取?BERT-BiLSTM-CRF及?数据库Neo4j?成新疆?地质?的?(?1)。1?地?资?本文从本体?、数据预?理、?取、?4?方面?成新疆?地质?的?,主要?:?新疆?地质?行?,?计?,?定?体和关系类?,?成本体?。?新疆自?源?的?务系统?取地质?数据?
5、行预?理,?取?BERT-BiLSTM-CRF?成,?选?数据库Neo4j?新疆?地质?,?成新疆?地质?的?。1.1?本体?主要?成?的?计,?关系?计和?体类?计(?1,2)。?关?域专家及专业文?,?定?11?体类?和20?关系类?,?体类?3,?关系类?1。据?体和关系类?计合?的?编?1000-8845(2024)01-152-06?F407.1?C65?A第42卷 第1期?等:新疆?地质?1 新疆?地质?Fig.1 Process of constructing knowledge map of geological collection in?in?iang?1?T a b l
6、e 1E n t i t y t y p e d e s i g no f k n o w l e d g e g r a p h?体名?卷号?作人?作方法?作?成矿?名?大地?名?矿?类?来源?编号?作人?查方法地质?作?的成矿?查区的大地?名?及的矿?类?来源?2 058、2 059?、?冯?、张?物?、?1/500 00、1/100 000中?生?成矿域?邻?尔齐?新疆?业?区?、?、?区?、?科学研究地勘单位自?、?政?费?2?T a b l e 2D e s i g no f k n o w l e d g e g r a p hr e l a t i o n s h i p?体关系
7、名?形成人汇交人编?者?目?责人电子?作人?收?卷人?部?接收人?单位?作单位?形成单位名?汇交单位名?作方法?作?卷id与大地?卷id的成矿?矿?来源?类?“3 089”形成人“?明”“3 834”汇交人“陈?”“3 834”编?者“?”“3 834”?目?责人“陈?”“3 834”电子?作人“张世?”“3 833”?收?卷人“?”“3 823”?部?接收人“?”“3 823”?单位“新疆维吾尔自治区地质矿产勘查开发局地球物理?学?矿大?”“?”?作单位“新疆?市?路119号物?大?”“3 823”?“新疆维吾尔自治区国?源?”“3 823”形成单位名?“新疆维吾尔自治区地质矿产勘查开发局地
8、球物理?学?矿大?”“3 823”汇交单位名?“新疆维吾尔自治区地质矿产勘查开发局地球物理?学?矿大?”“3 822”?作方法“地质?面?”“3 823”?作?“1/5?”“3 823”?卷id的大地?“?尔?部?尔?”“3 823”?卷id的成矿?“?库?、?尔?为主的?成矿?”“3 824”?“公开?”“3 823”?矿?“?”“3 823”?来源“地方?政”“3 825”?类?“区域物?查”153新疆地质2024年元?,可?地?地质?数据?行?,?续的?。1.2?新疆自?源?的部?地质?作为数据的主要来源,主要?数据和非?数据。为方?续?的?,?数据?行?选、?,?数据和?。?非?数据,
9、?BIO?法,?手?要?取的?体?为“B-X”、“I-X”?者“O”?(?2)。1.3?BERT-BiLSTM-CRF?是?名?体?中的?之?9?。?入的文本?BERT?为上?文?关的?向?,作为BiLSTM的?入?BiLSTM?行?向时?,?行?学?全文?征信?最?合CRF?法和BIO?的文本?征,?行?的?,?最?。1.3.1B E R T?BERT 预?(BidirectionalEncoder Representations from Transformer,BERT)?向 Transformer编码?,可?地?取上?文?信?,?中文?体元?中?入的?10?。?入的文本?(?1,?2,
10、?,?)?向 Transformer 编码?Trm?行?征?取,?出?有?定信?的?向?(?1,?2,?,?)(?4)。1.3.2B i L S T M?网?(Long Short-Term Memory,LSTM)可?理?有向?和向?性的数据?11?(?5),?常?文本数据?理?作中。?法?信?从?向?行编码。?向?网?BiLSTM?LSTM的基础上?向LSTM,?向?理?入?,?向?理?入?,从?到?向?征的?果。1.3.3C R F?件随?(Conditional Random Field,CRF)是?3 B?RT-BiLSTM-CRF?Fig.3 Structure diagram o
11、f B?RT-BiLSTM-CRF model?2 BIO?Fig.2 BIO annotation e?ample154第42卷 第1期?等:新疆?地质?入?计?出?出?的?12?。?(?1,?2,?,?)和?(?1,?2,?,?)?为?随?的?出?和?态?,?性?件随?定?:?(?,?1,?2,?,?-1,?1?,?)?(?,?-1,?1),?1,2,?,?(1)?CRF?中?入?,可?低?出?的?,?证最?出的预?果是有?的。计?公?:?(?,?)?1?,?1?,?1(2)?从BiLSTM?到的发?数?CRF?学?到的?,?第?预?为第?的?数?,?1?第?到第?1?的?数?。CRF?邻
12、?之?的关系?最?的预?,?:“B-大地?”?面?法接“B-成矿?”,?BiLSTM?能预?文本?与?的关系,?能预?与?之?关系的?。1.4?含?元?信?的CSV文件?Neo4j-import方法?入?数据库Neo4j中?行?,?成新疆?地质?。作为?开源?数据库之?的Neo4j?13?,?的形?体、关系和?性信?,?Cypher查?的?查?和?索?能,?合新疆?地质?的?。?选?数据库Neo4j?新疆?地质?行?。2?分?2.1?64位Windows?作系统上?行,?为 AMD Ry?en7 6 800?CPU、NVIDIA GeForce RTX 3 060(6G)GPU、16G内?,?
13、Python3.8和 PyTorch1.7?cu110 版本?法?行?。?评价?(Precision,P)、?(Recall,R)、F1?(F1 Score),公?:?100?(3)R?100?(4)?1?2?2?100?(5)?真?体?预?为真的?体数?体?预?为真的?体数?真?体?预?为?的?体数?体?预?为?的?体数?。2.2?中?的数据?为?手?件?行人?的?地质?。为?证BERT-BiLSTM-CRF?新疆?地质?名?体?的有?性,选?名?体?任务中的主流?的数据?上?行?:BERT-CRF、BERT-IDCNN-CRF、BERT-BiGRU-CRF。?BERT-CRF?是为?中有?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新疆 馆藏 地质 资料 知识 图谱 构建
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。