基于知识图谱的高校数字档案资源数据知识化分析.pdf
《基于知识图谱的高校数字档案资源数据知识化分析.pdf》由会员分享,可在线阅读,更多相关《基于知识图谱的高校数字档案资源数据知识化分析.pdf(3页珍藏版)》请在咨信网上搜索。
1、数字与缩微影像DIGIITAL&MICROGRAPHIC IMAGING应用技术研究4数字与缩微影像 2023.4摘 要:本文从理论角度对知识图谱进行了介绍,从高校数字档案资源的知识架构、技术成熟度两方面阐述了该技术的可行性,从知识抽取层、图谱构建层、图谱更新层、图谱应用层分析了高校数字档案资源知识化的具体模式,从数据资源平台、数据挖掘源平台、可视化操作平台三个层面对平台建构的路径进行了总结,并针对如何运用知识图谱来促进高校数字档案资源数据库知识化进程的方法进行了分析。关键词:知识图谱;高校;档案资源;数字化 a课题基金:安徽省高校档案工作协会基金项目资助(项目编号:2023YB013)的阶段
2、性成果0 引言档案是事实的记录,是一切治理经验的总结与未来治理行为的依据。档案资源是一个单位发展的软基础,在全面完善现代大学制度的宏观环境下,高校数字档案资源的高效利用已经成为这个时代高校档案工作必须要重点研究的课题。在 20 世纪 90 年代之前,我国高校档案管理工作基本上就是简单的“实体化保存”,主要是基于对高校建设与发展过程中相关纸质资料的存档与保存,档案资源的利用效率偏低,档案资源的价值发挥受到严重桎梏。自 20 世纪 90 年代起,信息技术蔓延至各个产业,资源的数字化加工和利用,有效地提升了档案资源的价值,促进了高校的发展,数字化档案资源逐渐成为了主流。近年来,随着大数据、云计算、人
3、工智能等现代化信息技术的逐步成熟与发展,数字资源的利用逐渐朝自动化、智能化方向发展,数字化档案资源的利用升级迫在眉睫。知识图谱是近年来人工智能技术发展的产物,能够基于开放的互联网与指定的数据库对特定的信息主题进行语义处理,这种智能化工具的应用场景广泛,功能强大。知识图谱在档案管理中的应用,能有效推动档案资源的知识化进程,数字化档案资源将成为高校治理的智慧力量,同时高校教学、科研、教研等活动的动态反馈也得以有效实现,从而为高校的领导、教育主管部门规范高校管理与及时调整发展策略提供必要的参考。1 知识图谱及其应用的相关研究知识图谱是人工智能领域的一个表现形式,其主要功能在于描绘实体之间的关系,需要
4、基于特定的知识库才能发挥其功能。目前国际上应用较为广泛的知识库 有 Freebase、Wikidata、YAGO等,国内则以复旦大学所开发的CN-Probase 为 主 流。然 而,这些知识库大多属于通用型的知识库,在专业领域的应用依然存在着一定的局限性。基于特定的专业领域构建知识图谱已经成为业界共识,也有许多学者、企业已经开展了基于元数据的知识图谱构建【1】。目前,针对知识图谱应用的研究大多还停留在数字档案服务层面,如档案服务模式与服务内容地构建等,而知识图谱在数字档案资源服务中的实际应用还处于起步阶段。无论是公共的档案馆、高校的档案管理部门还是图书馆,都未能强化知识图谱在档案资源服务中的应
5、用,智能化数字档案资源利用模式也未能在实际中得以成型。就目前高校档案管理的实践情况来看,数字档案资源的系统性管理与智能化应用程度都相对较低。目前,我国的智慧化档案技术发展以及网络语义相关技术的发展,已经赋予了档案智慧化管理进一步发展的能力,高校逐渐意识到基于语义技术构建知识图谱来提升档案管理与利用的重要性。武汉大学、复旦大学等高校已经开始尝试基于知识图谱来解决高校数字档案零散化等问题,并可通过系统集成等方式来为用户提供更加全面且有针对性的档案 服务【2】。2 基于知识图谱提升高校数字化档案资源知识化程度的技术可行性分析实际上,知识图谱是基于大数据而衍生出来的概念,而松散性是大数据的一个基本特征
6、。为了从海量版的数据中找到我们所需要的数据,就必须对数据对象进行描述。知识图谱是基于三元组结构来对信息展开基础性的描述,其基本模基于知识图谱的高校数字档案资源数据知识化分析赵正敏安徽医科大学安徽合肥230022数字与缩微影像DIGIITAL&MICROGRAPHIC IMAGING应用技术研究52023.4 数字与缩微影像型如图1 所示【3】。通过这种模型,数据分析实现了“实体关系实体”的关系转换。2.1 知识图谱能够优化高校数字档案资源的知识架构数字化档案处理、加工与存储技术的发展,赋予了高校档案资源进一步丰富的能力,然而高校事物的繁杂性导致了数字化档案资源的多元化,再加之缺乏统一的数据格式
7、,文档、图谱、视频等不同格式的资源相互交织,穿插于不同类型的档案之中。此外,学校内部的教务系统、办公系统等不同系统也并没有采用完全统计的技术架构,通过不同系统所获得的数字化档案资源的内容、格式与价值也存在着明显的差别,这些都给数字化档案资源的高效利用带来了新的挑战。知识图谱在数字档案资源中的应用能突破数据结构的束缚,通过构建一个网络化的语义知识网络来对所有的数字档案资源进行整理与处理,构建一个基于特定目标词的知识架构,极大地提升了数字档案资源的利用效率【4】。2.2 知识图谱的应用技术已经基本成熟从技术层面上来看,尽管针对高校数字档案资源的知识图谱应用技术尚处于起步阶段,但知识图谱在特定知识库
8、中的应用已经较为频繁,二者的技术原理基本相同。由此可见,高校数字档案资源管理引入知识图谱的技术条件已经基本成熟。2010 年,谷歌公司以 Freebase 为基础构建了谷歌知识图谱,短短 4 年时间就有 7000 万个知识实体被引入到知识图谱之中,谷歌知识图谱还建立了超过 10 亿条关系与 25 亿条三元组。清华大学为满足校内师生对于科研、论文等数字档案资源的需求,研发了 AMiner 知识服务平台。该平台是基于大数据分析、科研专家档案、智能搜索等多种不同类型的信息技术而建立的,除了能够直接进行特定主体的科研数据搜索之外,还能基于科研学者展开二次搜索。由此可见,基于知识图谱开展高校数字档案资源
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 知识 图谱 高校 数字 档案 资源 数据 知识化 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。