DDE-岩浆岩数据库初步构建与应用.pdf
《DDE-岩浆岩数据库初步构建与应用.pdf》由会员分享,可在线阅读,更多相关《DDE-岩浆岩数据库初步构建与应用.pdf(16页珍藏版)》请在咨信网上搜索。
1、书书书 ():岩石学报 :王涛,童英,丁毅等 岩浆岩数据库初步构建与应用 岩石学报,():,:岩浆岩数据库初步构建与应用王涛,童英,丁毅郭磊黄河,范润龙,王朝阳张颖慧曹光跃张建军 ,自然资源部深地科学与探测技术实验室,北京 北京离子探针中心,中国地质科学院地质研究所,北京 中国地质科学院地质研究所,北京 中国地质科学院,北京 (),收稿,改回 ,():,:,(),(),()(),(),(),:(),;(),(,);(),;(),;()(,),;本文受国家重点基础研究发展计划()、国家自然科学基金项目(、)、中国地质调查局项目(、)、国际地学计划项目 和深时数字地球()大科学计划联合资助第一作者
2、简介:王涛,男,年生,研究员,博士生导师,构造地质学专业,主要从事造山带、花岗岩与大地构造研究,:摘要 世纪是大数据的时代,数据、模型驱动下的科学研究新范式与知识发现成为当今科学领域的新态势。本文介绍了在“深时数字地球”(,)国际大科学计划框架下构建的 岩浆岩数据库。该数据库以“数据 编图 研究”三位一体的建库思路,基于岩浆岩知识体系,构建了岩浆岩数据库,包括后台服务(云端)、网站(端)和科研工作平台(桌面端)。数据主要来源于公开发表的文献、研究团队测试、实验室测试数据等,涉及全球重要造山带、克拉通及部分海洋(大洋钻探数据)等。此外,还设立了 个地域性、学科性专题数据库。数据类型为岩浆岩岩石类
3、型、产状、空间位置等基本信息,以及年代学、地球化学、()同位素及非传统(或新兴)同位素数据。与国际最常用的有关数据库相比,本数据库具有以下优势:()“数 图 文”三位一体的设计思路,拥有编图和研究平台;()以研究为导向,组织构建了 个专题数据库,更多一线专家参与数据库建设,在某些地域和领域(如中亚、非传统同位素等)形成优势;()对数据都尽可能挖掘和补充了年龄、经纬度等时空信息;()创建了学科专家可以依据新的发展和需求及时调整数据库结构的技术与功能,而不需要重新编程;()有强大的 平台支持,为与国际有关数据库互联互通提供了有利条件。最后,利用 岩浆岩数据库的核心数据(年代学、同位素等),对复杂大
4、陆拼合过程、地壳生长、地球深部物质组成架构与演化等重大地球科学问题进行了探索并取得了一些进展,说明该数据库将对推动数据驱动的岩浆岩研究具有重要意义。关键词岩浆岩;数据库;研究平台;“数 图 文”三位一体;中图法分类号 ;世纪是大数据的时代(,),大数据引发的第二次科学革命改变了传统的科学研究范式,“数据 模型”驱动下的科学研究新范式与知识发现正逐渐成为当今科学领域新的发展趋势(,;翟明国等,;,)。同时,地球科学也在经历向地球系统科学转变的重大转型,需要不同学科以数据为纽带的深入融合。在此背景下,中国科学家率先提出“深时数字地球”(,简称 )国际大科学计划,并由十几个国际组织与机构共同发起和参
5、与,经国际地球科学联合会()执委会投票通过,正式成为 第一项认可的国际大科学计划,并已于 年 月在北京正式启动。将聚焦于地球过去数十亿年的深时演化历史,通过整合百年人类工业革命所积累的海量地学数据,在大数据驱动下重建地球生命、地理、物质和气候的演化,识别全球矿产资源与能源的宏观分布规律,更有效地防止和控制可能突发的灾害对人类所造成的损害。这一计划将面向全球数百万研究人员和科技专业用户,为其提供一个跨越学科领域和国界的虚拟科研环境,使其能够存储、共享和复用科研数据(,)。地球科学基础学科数据库的建设是该大科学计划的核心内容和重要支柱。岩石(岩浆岩)是研究地球物质,特别是深部物质的基础学科。岩浆岩
6、来源于地球深部,提供了深部物质与动力学信息,承担着深时数字“深部”地球研究的重任(,)。岩石(岩浆岩)工作组,即 是首批启动(年)的 个 学科工作组之一,负责构建岩浆岩数据库,并探索构建科学研究平台和服务应用体系,搭建全球岩石学与其他学科专家合作交流的平台,开展相关科学研究,推动地球科学(岩浆岩)在大数据时代的创新发展,探索古板块格局重建、大陆聚散过程,地壳生长、地球深部物质组成与演化等重大地球科学问题。目前初步构建了数据库结构框架,入库了一批数据并公开上线,尝试开展应用研究。本文将以岩浆岩知识体系为基础,以数据(数)编图(图)研究(文)三位一体的建库思路,简要介绍数据库的基本结构、功能及初步
7、应用情况,展望未来的应用前景。该研究工作在推动数据驱动的岩浆岩研究方面将起到促进作用。期待更多地质学科工作者关注、参与、使用该数据库,并提出修改完善建议。国内外有关数据库概况随着地质学科特别是测试技术的不断发展,岩石(岩浆岩)测试数据(相关的岩石学、地球化学、年代学、同位素等数据等)呈爆发式增长。国内外多个国家机构都高度重视这些基础数据,各自建立了国家级或全球规模的数据库,包括一些专业的岩石数据库(张颖慧等,)。例如,美国的 数据库(岩石学、地球化学、年代学),其先后纳入了 、等专业岩石数据库;德国 大学的 化学研究所建立的 岩石地球化学数据库;加拿大自然资源部建立的 数据库(地质图、岩石地球
8、 化 学、年 代 学、文 章);英 国 地 质 调 查 局 建 立 的 数据库(地质图、地球物理、矿产、古生物、岩石薄片照片等);澳大利亚建立的 数据库(年代学、地球化学、古地磁、同位素、矿产等)。部分科学家也建立了一些地区性的数据库,并取得了很好的研究成果(,;,)。国内中国科学院、中国地质科学院等研究机构和学者也建立(过)一些岩浆岩相关的数据库,但目前除不断更新和完善的地质生物多样性数据库()之外,其他一些学科的数据库都已基本停止更新和运行。目前,国际上与岩石学、地球化学有关的、运行最好的是 和 数据库,下面对其进行简单介绍。数据库 (,岩石学报 ,():)数据库是目前最常用和最活跃的岩浆
9、岩数据库和数据检索源。其成立最初是通过建立统一的网络平台将 、和 三个主要的数据库连接起来。年,数据库开始建立自己的数据管理系统,将部分其他数据库的数据统一存放于自己的数据库中;同时,开始研究数据的可视化及数据分析工具。目前,数据库的主要功能包括:数据查询、下载、位置 导出、在线地图显示,并可对查询结果提供在线的 图解和 图解可视化分析工具。数据库运行一套数据系统,帮助地球科学家访问、共享和使用地球化学、岩石学和地质年代学数据,建立了固体地球的地球化学数据综合管理和信息系统,加强不同数据库间的协作,共享数据管理经验和管理工具(,)。数据库系统可确保提供开放和持久的数据,并为数据挖掘和数据分析提
10、供高级功能,从而服务于不同的科学研究,产生了很好的效果,很多高质量文章都引用了该数据库的数据。数据库 ()数据库是大陆和海洋岩石地球化学数据库,由德国 化学研究所的 博士研究小组负责建设和维护。包括板内洋岛火山岩以及汇聚板块边缘和大火成岩省的火山岩数据,年 月 日更新后数据库共包括样品 件,文献 篇,分析数据 条,单个的数据值 个。可支持按作者文献、地质环境、地理坐标(经纬度)、化学元素(包括主量、微量、稀土元素和放射性同位素)含量、岩石类型等多种查询方式。的特色服务在于预先按各种不同专题对数据进行了整编,形成 文件,可供直接下载,方便使用。目前,已经链接到 数据库中。其他数据库除上述 个数据
11、库之外,国内外还有一些其他有关的数据库。例如,美国地质调查局()数据库中含有岩浆岩地球 化 学 数 据 库(包 括 :),其目前共有 条样品记录,其中岩浆岩地球化学数据约占 。中国在二十世纪八、九十年代就开始了岩浆岩数据库建设(尚如相等,;徐伟昌等,;陆松年等,;尚如相,),也出现过研究机构和学者建立的一些岩浆岩数据库(王晓蕊,;张聪等,;钱莉莉等,),例如,中国地质科学院初步构建了中国及全球火成岩数据库和中国同位素地质年代基础数据、中国地质调查局“地质云”上的相关数据库和中国科学院数据云上的一些岩浆岩地球化学和年代学数据集(包括中国科学院广州地球化学研究所、青藏高原研究所等)等。但这些数据库
12、较分散,且为静态的数据集,缺乏系统的集成、持续的更新维护和交互接口,难以保证提供稳定的在线服务。有关数据库的详细情况见张颖慧等()。近年来,中国科学院也开始设立了公益学术平台。该平台首期集成了中国科学院的科技成果资源、科技出版资源和学术交流资源,目前通过平台可检索的科技文献资料约 亿篇。从国内外岩石地球化学相关数据库的现状来看,目前还存在一些主要问题:()多个数据库已不再更新,或近期少有更新,几乎为停止状态;()专业性不强,系统性不够,不少同位素数据仅仅是原始数据的汇总,信息不全,没有依据有关信息给出真正实用的参数;()共享和开放不够;()缺少数据互联、整合的平台(多用户协同的数字化科研平台)
13、;()缺乏研究平台,特别是缺少数据库 数字编图 综合研究一体化的科研平台,难以开展数据挖掘和深入集成分析。因此,在“深时数字地球”国际大科学计划的推动下,建立开放、共享、统一的岩浆岩数据库及研究平台,整合各学科基础数据开展全球协作,运用大数据分析和人工智能解决关键科学问题,极为必要。岩浆岩数据库数据来源、类型目前,岩浆岩数据库初步构建了数据库框架,入库了一批数据。数据来源构建数据库首先需要数据,高质量的数据是构建数据库的基石。岩浆岩数据库,数据主要来源有 种:()公开发表的文献;()本项目组研究团队获得的测试数据;()实验室测试共享数据;()一些国际组织(如大洋钻探计划)提供的数据和已有数据库
14、的数据,特别是“长尾”数据。此外,还设置有志愿者贡献数据平台,贡献者可以提供数据。文献数据公开发表的文献数据是目前 岩浆岩数据库的主要数据来源,其数据质量有保证,便于核查。数据获取方式主要是人工与 相结合。首先,利用所在单位购买的出版商数据库及 平台上的 收集岩浆岩文献及其相关信息。然后,采用 和自主开发的 表格数据提取软件,从文献表格和文字中获取数据,并应用 信息化团队和本团队开发的软件工具,进行数据及表格融合处理。借用信息化技术,搜集、整理、补全、校对和入库有关数据。本数据库关键的数据都提供相应的经纬度,但大量的年代学、地球化学数据并没有经纬度信息,需要到文章中去查找,或者从图件中读取。目
15、前采用的是项目组开发的地质图经纬度自动读取软件,且已经集成到 中,正在进行标注,通过机器学习后可以自动获取经纬度。后期将利用 平台地理信息相互校正,也期望原始文献作者能提供精确的信息。未来,对一些非结构化数据,将采用 王涛等:岩浆岩数据库初步构建与应用框架,并实现在线支持。基于“人在回路”思想,利用已有文献和上海交通大学建立的文献库,采用自然语言处理()与计算机视觉技术,依据知识体系和知识图谱,自动识别、抽提多模态地球科学文档中与岩浆知识节点相关的图片、表格和描述文字,并对提取后信息结构化数据进行补齐。团队实测数据岩浆岩数据库项目组参与团队包括国内有关高校和研究机构的众多专家和研究团队。该团队
16、长期从事岩浆岩方面的研究,有长期的积累和持续不断的新研究,产出了很多新的数据,除部分已发表数据外,存量数据及时入库,成为主要的新数据来源。此外,还有一些国外合作团队,他们的新数据也会及时入库。实验室测试数据在送样人员自愿的前提下,实验室测试数据将动态自动入库,实现了将实验室产生的测试数据和样品背景信息快速、准确地更新到特定数据库的功能,从源头保证了实验测试数据的完整性和权威性,避免了后续研究人员耗费大量时间精力搜集数据的工作;同时也提高了实验测试数据的利用率,加快了岩浆岩数据库的更新工作。有关零散数据(库)经过调研,发现网络上存在很多散落在各个领域和角落的数据。一类数据是存储于一些数据库中,而
17、这些数据库已经长期未更新,也鲜为人知和使用;另一类是一些个人网站上储存的数据,这些数据长期被人忽视,未能发挥作用,成为“长尾”数据。本数据库借用 ,开展全球数据巡航,明确了一些长尾数据。这些数据经过整理入库,并注明了数据来源,以便更多人引用与标注。此外,大洋钻探国际组织向 提供了 的原始文本等资料。本次花费大量人力,阅读报告等文献和钻探测试数据材料,摘录出岩浆岩方面的数据,并通过重新标定位置,给每个航次和钻孔赋予了经纬度信息。目前,从这些材料中,补充完善了航次、钻探中的 条数据。志愿者贡献数据本数据库设置有志愿者贡献数据的途径。有 种途径贡献数据:一是,志愿者在设置的数据“收发室”,录入数据。
18、数据管理人员进行核验后,合格数据录入相应的数据库。数据库收发室将自动标注数据来源和贡献者信息,记录贡献的数据量,并给予积分,数据库将给予不同类型的奖励(包括物质奖励);二是,使用者将自己的数据,入库到研究平台,形成个性化专题库;同时调用数据库有关数据,在平台上分析处理。其结果包括从数据库调用的数据都可以申请下载;同时,在使用者授权公开、共享这些数据时,数据将进入总库,以此实现数据库数据量滚雪球式的增长。用户越多,数据越多。数据类型与数据量目前,初步构建的 岩浆岩数据库数据类型主要包括:()岩浆岩岩石(样品)基本属性,包括类型、产状、构造、空间信息(经纬度、地理位置)、地质背景等;()测试数据,
19、例如锆石 年代学、元素地球化学、全岩 同位素、非传统同位素、矿物 、低温热年代学等。数据量约 万多条,涉及全球重要造山带、克拉通以及部分海洋(大洋钻探样品岩浆岩数据)等。今后,还将不断补充完善数据类型和数据量。此外,为了发挥各地区、各领域专家的作用和优势,依据已有的工作基础,已设立了 个专题数据库。包括两大类:一类是地域性的,如阿巴拉契亚、阿拉伯地盾、中亚(北疆)、特提斯(青藏高原)、华北克拉通、华南等;另一类是学科领域性,如非传统同位素、火山岩(中国)、蛇绿岩、碱性岩、岩浆岩锆石微量、岩浆捕获锆石、实验模拟、岩浆岩低温热年代学、大洋(钻探)岩浆岩、实验测试、锆石微量元素、同位素、岩浆有关关键
20、金属矿产。数据库设计思路、结构与功能 “数 图 文”三位一体的设计思路本数据库建设基于岩浆岩知识体系,以样品为核心,应用“数 图 文”三位一体的科研理念,采用“云 端”的模式进行构建。()建立岩浆岩知识体系。知识体系可以理解为有上下逻辑(归属)关系的岩浆岩地质科学大词典。建立的岩浆岩知识体系由 多个节点(岩浆岩词汇)构成,涵盖了绝大多数岩浆岩术语,特别是岩石类型的术语。岩石类型的分类采用了国际地球科学联合会推荐的分类系统,并参考了最新的教科书,补充了新的术语。()基于知识体系及其岩石分类,以样品为核心,设计数据库结构。岩浆岩大量的数据基本都是岩石学(样品)描述和样品的测试数据。因此,数据库建设
21、以样品为核心,便于以此为依据查询数据,应用数据。()构建数字化编图平台和科学研究平台。岩浆岩数据库的建设目标,除为使用者提供数据服务外,最重要的目的是进行科学研究。因此,本数据库构建了研究平台,并突出岩浆岩时空演化的研究特点,构建了数字化编图平台,形成“数 图 文”三位一体的数据库与研究平台,即增加基于数据的数字化编图和数据分析研究的平台。这是本数据库的特点,也是有别于目前的 、等数据库之处。数据库网站(:)也充分体现了“数 图 文”三位一体的特色和设计思路(图)。除数据库一般的基本要素外(如介绍、数据、图件和出版物等栏目),在主页左侧栏,展示主要数据类型,包括主库及 个专题数据库。在右侧栏,
22、提供各类岩浆岩图件,包括数字化的亚洲岩浆岩图、全球岩浆岩图等一系列图件。在下方,提供各类软件,包括桌面研究平台系统。中间展示的是数据点及基于 岩石学报 ,():图 岩浆岩数据库主页页面(:)(:)时代的岩浆岩分布图。此外,还提供二次开发接口,面向国内外涉及岩浆岩的数据库,实现和各类已有数据库的相互调用,进行跨库检索和数据共享,实现岩浆岩数据的增长、融合与应用。数据库结构与系统数据库利用“云 端”的混合云模式搭建,充分利用“开源软件 自研”构建了具有自主知识产权的岩浆岩数据库系统()。以样品为核心,设置了 多个字段,给出其关联属性(图 )。本数据库结构构建创新之处是,采用“”技术构建,科研人员可
23、依据需求,自行设计数据结构,即增加栏目,不影响已有结构与数据,从而降低学科专家建库的门槛。利用桌面端软件,学科专家可以通过自主编辑知识树来自行建库,并自动具备以知识树为核心的数据与知识一体化管理、模板生成、入库查重、投图与编图研究等功能,而不用自己编制代码,可以极大地提高学科专家建库的效率,只需要关注本学科研究即可。本数据库构建采用“”技术,存储全部过程中的结构化和非结构化数据;采用 开发服务端 ,通过 搭建服务集群提供云端访问服务;通过 、等技术构建 端和桌面端科研工作平台。其中,利用 技术构建的机构知识库子系统用来存储和管理科技文献和科研成果;用来存储非结构化数据,通过知识树编辑提供一站式
24、建库功能,实现知识与数据的一体化存储与访问;用来存储提取的空间数据。三者有机结合,实现每一条数据的可查询、可追溯和可视化功能。此外,发挥云平台高可扩展性、高可用性和资源分发等特点,消除人员、硬件、软件的重复配置,增加传统数据库的存储能力,借鉴实时 时空数据模型,实现对岩浆岩时空大数据模型的动态管理。数据库技术架构主要包括四部分(云 端):()后台服务(云端):知识体系、数据与知识一体化管理、服务等。通过微服务实现服务聚合与管理,为岩浆岩数据库提供图件发布、数据查询、专业投图等功能的后台服务。()网站(端):对外宣传展示门户网站,网址为 :用来提供数据访问和科研工具软件(数据投图、分析等)访问入
25、口。()科研工作平台(桌面端):端桌面程序,可用于数据处理、高性能计算和科学研究。首次操作,可通过主页进行下载,后续可在程序内自动更新。基于本地的特点,其内容比 端功能更加丰富。()移动端 (移动端):基于位置服务的“库 图 文”三位一体化推送,便于野外开展研究。目前正在 统一规划下建设中。编图平台在岩浆岩数据库的基础上,利用大数据技术,依据研究目的,提取关键属性;依据相关制(编)图规范,编制基于属性驱动的数字化图件,开展属性分类的数字化编图与综合研究。该平台目前有 个功能。服务功能提供了不同比例尺造山带、全球及地区的系列岩浆岩图(图 )。这些图件包括全球岩浆岩图、亚洲岩浆岩图、中国侵入岩图、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DDE 岩浆岩 数据库 初步 构建 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。