数字文化遗产资源语义服务的发展路径——以映射手稿迁移项目为例.pdf
《数字文化遗产资源语义服务的发展路径——以映射手稿迁移项目为例.pdf》由会员分享,可在线阅读,更多相关《数字文化遗产资源语义服务的发展路径——以映射手稿迁移项目为例.pdf(10页珍藏版)》请在咨信网上搜索。
1、数字人文数字文化遗产资源语义服务的发展路径以映射手稿迁移项目为例程结晶,王璞钰,王心雨摘要文章探讨数字文化遗产项目映射手稿迁移(MMM),为我国数字文化遗产资源的语义服务研究和实践提供借鉴。采用案例分析方法,对MMM进行描述与语义服务特征分析,构建MMM语义服务运营机制。研究表明:MMM的语义服务机制框架涵盖MMM所涉手稿资源创建、格式转换、数据关联、用户服务直至共享的各个层级。我国应构建数字文化遗产语义服务的发展路径,包括:设计开放式国家数字文化遗产基础设施、实现数字文化遗产语义分析与挖掘的多维可视化表达、建设面向不同用户群体的数字文化遗产语义服务模式和制定科学规范的数字文化遗产资源开放、共
2、享与传播规则。关键词语义网数字文化遗产信息资源语义服务MMM引用本文格式程结晶,王璞钰,王心雨.数字文化遗产资源语义服务的发展路径以映射手稿迁移项目为例J.图书馆论坛,2023,43(9):132-141.Semantic Service of Digital Cultural Heritage ResourcesA Case Study of Mapping Manuscript Migrations(MMM)ProjectCHEN Jiejing,WANG Puyu&WANG XinyuAbstractThis paper explores Mapping Manuscript Migra
3、tions(MMM),a digital cultural heritage project,inorder to shed light on the research and practice of domestic semantic service in the area of digital cultural heritageresource.By means of case analysis,the authors give an account of MMM project and analyzes the characteristicsof its semantic service
4、s.Based on this,an operating mechanism of MMM semantic service is proposed.The studysuggests that the mechanism framework covers the creation of manuscript resource,format conversion,dataassociation,user services and data sharing involved in MMM;and the paths of development for the semanticservice o
5、f digital Chinese cultural heritage need to be devised,including building national open-infrastructure,visualizing semantic analysis and mining in many dimensions,developing semantic service modes for different usergroups,and establishing scientific and standardized rules for keeping digital cultura
6、l heritage resources open,shared and disseminated.KeywordsSemantic Web;digital cultural heritage;information resources;semantic service;MMM0引言文化遗产是一种在社会历史活动中产生的,具有历史、艺术、文学、科学等价值的文化资源。随着信息时代到来,文化遗产逐渐在传承、保护、研究与利用的过程中积累了海量的数字资源,即数字文化遗产资源,包括文化遗产本身及其相关数字活动中所形成的各种媒介和形式载体的资源集合,以数字化的文字、图像、音频为主要呈现方式。为深入挖掘其隐含
7、价值,实现资源1322023年第9期数字人文深度利用,以计算机技术和网络技术为代表的信息技术被运用到数字文化遗产资源的各个领域,包括资源采集、组织、传播、服务与共享。相较于其他信息技术,语义网(Semantic Web)较能适应Web 3.0智能网络时代下对于数字资源无障碍查询、共享与利用的要求1-2。数字文化遗产具有实时保存、可复用、随时鉴赏、确权的功能,在本质上是文化遗产与数字技术的融合,也是保护好、传承好、利用好文化遗产的最好选项之一,即将成为Web 3.0时代下促进传统文化高质量发展的前瞻性话题。为进一步完善数字文化遗产创新驱动的发展形态,我国各研究机构一方面规范数字文化遗产资源标准,
8、明确资源的权利归属;另一方面结合数字化战略,充分释放数字文化遗产创新活力与隐性潜力,从而实现Web 3.0时代下数字文化遗产资源自身价值的再现3-5。进一步说,数字文化遗产资源自身价值的再现,便是借助语义网技术,实现资源的无障碍查询、共享和利用,如国际数字文化遗产资源语义服务的典型案例“映射手稿迁移项目(MappingManuscript Migrations,MMM)”,就是通过对数字文化遗产“中世纪手稿资源”的语义化再组织,实现其价值,即数字文化遗产“中世纪手稿资源”的语义服务,其可根据相关资源特点,以其内在逻辑方式,实现数字文化遗产的有序化、规律化及系统化操作,包括对数字文化遗产资源组织
9、的结构化与非结构化转化、语义关联、关系抽取、本体构建以及深层次语义分析等。MMM作为国际数字文化遗产资源语义服务的先进案例,其技术力、资源内容和服务成效均较为突出。通过分析该案例的特征与运行机制,探讨我国开展数字文化遗产语义服务的路径。鉴于此,本文根据MMM的语义特征描述与分析,构建MMM语义服务机制,并探讨我国开展类似数字文化遗产资源语义服务项目的发展路径,从而有力地推动我国文化体系的完善,迎合国家文化数字化战略的发展大趋势。1研究现状近年随着数字技术发展与国家对文化遗产开发事业的重视,学者开展数字文化遗产资源语义服务研究,可分为三类:一是数字文化遗产语义服务理论研究,内容包括数字文化遗产资
10、源的语义组织框架设计、本体模型构建、语义模型分析等,重视实例论证。比如,谈国新等6以非遗多媒体资源为研究对象,探讨语义组织与整合思路;崔旭等7以非遗传承人自媒体数字资源为研究对象,提出资源语义整合框架。二是数字文化遗产资源空间或机构服务,本质上是数字文化遗产语义服务的应用实践,所产生的一系列成果包括上海交通大学的李政道数字资源中心8、上海图书馆开放数据平台9等。三是数字文化遗产资源库建设,如中国历代人物传记资料库10(ChinaBiographical Database,CBDB)、岩画遗产档案数据库11。国外关于数字文化遗产资源语义服务的理论研究与应用实践均开展较早,技术方法模式比较成熟。在
11、理论研究方面,ONeill等12探讨了语义网环境下数字文化遗产的标准元数据编码与传输标准(The Metadata Encoding andTransmission Standard)的可互操作性价值;Pattuelli13构建了数字文化遗产领域的本体模型;Nishanbaev等14探讨了地理空间语义网的概念,提出一种可实现数据转换与处理操作的RDF数据格式。在应用实践方面,欧盟是国际数字文化遗产资源语义服务实践的主力军,莱比锡开放碎片文本序列项目(Leipzig Open FragmentaryTexts Series)采用语义标注、语义关联等组织方式,实现古典文学中碎片文本的元数据标引与深
12、度整合,并进行资源发布15;MMM采用语义网与关联开放数据(Linked Open Data,LOD)框架,实现跨域、跨库的中世纪手稿资源聚合与重构,并提供开放的语义服务16;Koho等17系统性地描述了MMM的开发宗旨、流程和技术使用。综上,我国数字文化遗产资源语义服务的研究与实践已取得一定成果,但停留在对项目的表133数字人文面分析上,缺少适用性强、可操作性高的方案成果。相较于欧美开展的Europeana、MMM等高水平项目,我国因基础设施较为薄弱、可视化技术单一、知识开放规则不健全等,在数字文化遗产的语义服务形式、服务内容以及资源开放等方面有待提高。而在国外诸多语义服务实践中,MMM开展
13、成效突出、资源类型丰富、规模大、资源整合程度深,提供的数字文化遗产语义服务也呈现多样化、多层级化的特征,为本研究的设计提供了案例基础。因此,MMM能较好体现国外学界与业界的最新发展动态。2研究设计(1)研究方法与样本选取。本研究采用案例分析法,基于国内外相关文献资料的梳理,将选取的典型样本作为分析对象,对其语义服务实践体系进行深度剖析,以探究其本质。为遵循研究中样本选择的代表性与典型性原则,以学界与业界话语权和影响力为选择基准,兼顾其新颖性、完善性和系统性,选取 MMM 为研究样本。MMM作为一项由多个国际知名学术机构参与的跨国合作项目,对我国数字文化遗产资源的建设具有示范作用,且MMM发布后
14、经历多次完善,如添加开放的MMM关联数据词汇表链接,证明项目的可持续发展性。总的来说,MMM的建设经验与服务体系,在各国开展的数字文化遗产资源语义服务实践中具有代表性。(2)设计思路。MMM分析由MMM描述、MMM语义服务特征和MMM运行机制等3个部分组成。MMM描述交代项目发起的主要原因、参与机构和主旨,MMM语义服务特征则基于文献资料分析,归纳总结MMM语义服务的关键特征,MMM运行机制则结合部分实例,从MMM数据层、关联层、服务层、用户层等4个层级揭示MMM服务的运行机制。最后在MMM分析的基础上提出面向我国数字文化遗产语义服务的发展路径。(3)资料来源。为遵循全面性、完整性和准确性的资
15、料收集原则,以MMM官方网站为主要来源,结合国外相关研究成果,系统性地收集MMM相关新闻报道、服务手册、技术文档和调查报告等各类文献资料,并将资料收集完毕后进行系统地梳理,便于研究的有序进行。3MMM描述与语义服务特征3.1MMM描述欧洲中世纪与文艺复兴时期所遗留的手稿是该时期欧洲文化、经济与政治生活的重要见证,兼具文学、古文字学、历史、美学等价值。由于历史变迁与人口流动,中世纪与文艺复兴时期的手稿散布在世界各地的图书馆、博物馆、档案馆和画廊,呈碎片化分布态势。21世纪以来,关于这些手稿的数字资源呈爆发性的增长,包括手稿书目数据库、专业数据库、数字图像数据集以及其他零散的网络资源。MMM作为跨
16、国际性合作项目,由牛津大学(University of Oxford)、宾夕法尼亚大学(UniversityofPennsylvania)、巴黎历史与文献研究院(The Institut de recherche et dhistoriedestextesinParis)和芬兰语义计算研究小组(the Semantic Computing Research Group inFinland)共同发起,在2020年美国弗吉尼亚州亚历山大市举行的“数据挖掘计划”第4轮会议上,项目组发布MMM门户网站服务。MMM旨在语义网环境下,采用LOD框架,将原本分散于世界各地文化遗产机构中的中世纪与文艺复兴时期
17、的手稿数据汇聚在一起,以便于用户的统一服务利用,并通过聚合、重构与再组等操作,将手稿数据转换为RDF数据格式,以实现手稿数据的语义化,从而深入挖掘其内在价值。MMM最终目的是基于关联数据开放原则,向全球提供以MMM语义门户网站为主要服务模式,以数字化的中世纪与文艺复兴时期手稿为资源对象的开放式语义服务16。3.2MMM语义服务特征3.2.1聚焦LOD框架的关键性MMM开发的LOD框架增强了手稿数据的聚合性与语义组织度,该框架的实际意义在于将原本分散于4个数据库的手稿源数据进行格式转换、资源聚合及内容重构等操作,并基于MMM1342023年第9期数字人文本体的概念及关系属性的清晰定义,实现手稿数
18、据的语义关联,从而以数据正本与备份副本的形式,分别存储于芬兰关联数据(Linked DataFinland,LDF)平台与Zenodo数据库17-18。具体而言,手稿源数据内部不仅存储格式不同,标注层级与内容表示更存在较大差异,处理利用起来较为不便,一旦缺失LOD框架,无论是手稿数据的资源质量,还是数据复用、更新及维护的效率,都会大打折扣。进一步讲,手稿资源的语义检索、浏览、语义信息可视化、数据重用、数据参考、底层手稿数据分析与视图呈现等服务,都离不开LOD框架的支持。由此可见,LOD框架在MMM语义服务过程中发挥着关键性作用。3.2.2关注语义服务的多视角性MMM开发的语义服务系统,在用户进
19、行访问时,为其提供多个访问视角,用户可根据自身的实践与研究需要,选择适合的访问视角。在实际使用中,MMM的语义门户在其主页与菜单栏板块,通过资源类型的划分,从手稿、作品、事件、角色和地点等五个视角,向用户提供多样资源的浏览与检索。此外,MMM也非常关注语义服务的多视角性,即用户完成手稿资源检索后,可根据实际需求,在左侧导航栏以创建地点、手稿高宽、手稿收藏人、创建时间等手稿属性进行视角划分,来获得用户所需的手稿知识资源。3.2.3注重知识服务平台的层级性知识查询与检索、语义分析、SPARQL端点访问、底层数据API、移动应用程序是目前数字文化遗产信息资源服务的主要形式,而如何将这些服务整合至统一
20、的MMM知识服务平台,构建层级化的服务体系,是实现个性化、精确化用户服务的支撑。MMM设计了基于语义网与Web技术的知识服务平台,通过不同的板块,以程序化的方式对手稿资源进行再组织,以提供不同层级的MMM知识服务。用户既可选择知识分类、导航服务等基础性服务,也可根据自身需求,选择对于人文与信息素养均具有一定要求的底层数据查询与分析等服务。此外,为便于用户进行手稿数据分析与深层次研究,MMM开发组设计了Saha 工具与 Yasgui 浏览器,并将其内置于MMM服务平台中,以进一步提升用户的服务体验。通过设计包括知识查询、语义检索与浏览、数据挖掘与分析等在内的MMM知识服务平台,满足了不同知识水平
21、与技能素养的用户人群的使用需求,从而推动了MMM影响力的进一步扩大。3.2.4语义服务开放性与收敛性并重为促进MMM的规范性开放与共享,实现手稿资源的科学化使用,在语义服务方面,MMM实行开放性与收敛性并重的原则。在开放性方面,MMM项目组开放的资源包括手稿数据、关联词表、MMM本体、LDF服务平台及相关应用程序等,实现开放资源的全方面覆盖。在确保MMM语义服务的开放性的同时,MMM也重视服务的收敛性,即如何最大限度地合理使用MMM开放的各类资源19。为此,MMM通过署名-非商业性使用协议4.0国际标准(Attribution-NonCommercial 4.0 International,C
22、C BY-NC 4.0),制定各类资源的使用标准与原则,规定MMM资源不得用于商业目的。同时,MMM资源使用时需通知MMM资源所有方,并提供个人信用。此外,MMM知识资源修改或复用时需附上创作者署名。通过实现开放性与收敛性并重的原则,促进了MMM语义服务的有序化开放,从而最大限度地提升了MMM语义服务的价值。4MMM语义服务运行机制经过多次的修改与完善,MMM已形成一套较为系统的语义服务运行机制,并通过多层级的动态运作,向社会大众提供多样性的数字文化遗产资源语义服务。笔者基于上文的MMM特征分析与描述,结合国外相关文献资料,提出MMM语义服务运行机制,并将其设置为自下而上的4个层级,其涵盖MM
23、M数据的创建、关联、服务、共享等各项活动,各层级的组成如图1所示。4.1数据层数据层的主要职能在于提供MMM数据的创建、关联、服务等各项活动所需的关联数据基础设施。该层作为LOD框架的重要组成部分,涵135数字人文盖了多种关键性硬软件设施,具体包括数字化的服务平台如LDF,以 Bibale 为 代 表 的MMM 手 稿 数 据 库,支 持MMM数据活动的MMM语义门户以及其他数字化的手稿资源。中 央 存 储 器(CentralStorage Unit)则作为存放与汇聚不同数据库中大量手稿数据的虚拟仓库。LOD 服务器则主要负责具体的 MMM 资源关联、服务与共享工作。4 个 手 稿 数 据 库
24、 即 Bibale、Medium、SDBM 与 MMOL,在存储形式、标注内容与元数据类型方面均存在一定的差异,利用较为困难,其具体情况如表1所示。因此,在跨大西洋人文社会科学平台(Trans-Atlantic Platform for SocialSciencesandHumanities)的支持下,MMM收集了超过450,000条数据记录,并将其汇聚到统一的数据池中,为后续MMM数据的关联、服务与共享等活动提供可靠的基础支撑。该层为MMM语义服务机制框架内各项操作的进行提供了重要的数据基础设施支撑,对MMM数据的语义化具有极其重要的作用,极大地加快了MMM的开发进程。4.2关联层关联层的主
25、要工作是通过MMM本体模型,实现手稿数据的资源转换、映射和聚合等操作,进而推动手稿数据的语义关联,并为后续进一步的数据服务与共享等操作夯实基础。该层作为LOD框架的关键组成,促进了异构多源的手稿数据间的聚合、关联及利用。MMM本体模型作为一个协调性的数据模型,复用了文化遗产信息本体(CIDOC CRM)、FRBRoo本体等数据模型,并添加了一些自建的MMM元素,如mmms:entry、mmms:manuscript_author、mmms:manu-script_record,以支持MMM基于事件的建模,MMM本体模型中不同元素的来源及数量如表2所示。在关联层中,手稿数据将被统一转换为RDF数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 文化遗产 资源 语义 服务 发展 路径 映射 手稿 迁移 项目
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。