文献检索精华.pptx
《文献检索精华.pptx》由会员分享,可在线阅读,更多相关《文献检索精华.pptx(163页珍藏版)》请在咨信网上搜索。
1、1网络信息资源组织和检索人民邮电出版社2第1章 网络信息资源组织 近年来,随着Internet技术的迅速发展和普及应用,网络信息资源组织正越来越受到人们的关注。那么什么是网络信息资源组织?其原理如何?当前网络信息资源组织的现状及存在的问题有哪些?标准有哪些?以及发展趋势如何?在实际工作中的运用如何?下面将给大家进行介绍。31.1 信息组织概述 1.1.1 信息 1.信息的定义信息的定义 2.信息的分类信息的分类 3.信息的特性信息的特性 41.信息的定义信息的定义有代表性的定义:信息是事物运动的状态与方式,是物质的一种属性;信息是负熵;信息是与控制论系统相联系的一种功能现象;信息是用以消除随机
2、不确定性的东西;信息是一种可供开发和利用的并具有其自身价值的一种资源。5 我们认为,信息的概念可以这样来定义:信息是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。信息是通过一定的物质载体形式反映出来的,是事物存在的状态、运动形式、运动规律及其相互联系、相互作用的表象。6信息的定义 另外,对于信息概念的认识,我们还可以从以下几个方面来理解。(1)信息是使人们对事物不确定性的减少或消除的东西;(2)信息是与外界相互交换的内容;(3)信息是事物变化和差异的表现;(4)信息是系统的组织程度和有序程度的结合。72、信息的分类、信息的分类按信息内容:按信息内容:人类信息;非人类信息。按按信
3、信息息产产生生的的先先后后和和加加工工深深度度:一次信息;二次信息;三次信息。按信息的存在形式:按信息的存在形式:内储信息;外化信息。按按信信息息的的流流通通方方式式和和传传递递范范围围:公开信息;半公开信息;非公开信息。按信息载体形式:按信息载体形式:感官载体形式;语言载体形式;文字载体形式;电磁波载体形式;缩微载体形式;光波载体形式;声像载体形式;计算机载体形式。83、信息的特性、信息的特性普遍性存储性传递性共享性开发性价值的不定性 91.1.2 信息组织信息组织1.信息组织的定义信息组织的定义 2信息组织的理论基础信息组织的理论基础 3信息组织的方法基础信息组织的方法基础 101.信息组
4、织的定义信息组织的定义 信息组织就是将收集的信息予以结构化,也就是指采用一定的方式,将某一方面大量的、分散的、杂乱的信息经过加工、整理、提炼、优化后形成一个便于有效利用系统的过程。112信息组织的理论基础信息组织的理论基础关于知识组织的理论 系统科学理论 耗散结构理论 协同论 突变理论 信息自组织理论 12(1)关于知识组织的理论知识组织是在图书馆学、情报学的分类系统和叙词表研究的基础上发展起来的。与传统的文献组织以文献加工为本位,揭示文献所载的知识内容不同,知识组织是以知识单元为加工本位,它不仅揭示文献的学科、主题内容,而且更注重揭示文献所载的知识单元。知识组织将文献和信息中所包含的知识内容
5、用语词和概念表达,采用知识工程中的知识表达方法OAV三元组法进行知识标引和组织,能更有效地对网络信息进行组织和检索。关于知识组织的理论基础还包括整序、概念学、数学方法、系统科学、知识工程、心理学等。13(2)系统科学理论系统科学的思想是20世纪20年代由奥地利学者贝塔朗菲提出来的,他把系统定义为“相互作用的诸要素的复合体,认为系统的定义可以确定为处于一定的相互关系中并与环境发生关系的各组成部分的总体。14(3)耗散结构理论该理论是由比利时布鲁塞尔学派领导人普里高津教授于1969年在理论物理与生物学国际会议上首次提出来的,这一理论着重从“非平衡”和“开放系统”两个方面,论证了那些存在进化发展的系
6、统有序性增加的原因。所谓耗散结构是指一个远离平衡态的开放系统,通过不断地与外界交换物质、能量,在外界条件的变化达到一定的阈值时,从原来的无序状态转变为在时间上、空间上或功能上的有序状态,这种在远离平衡情况下所形成的新的有序结构,就称为耗散结构。15(4)协同论是由前西德科学家哈肯于1970年提出来的,是一门专门研究系统进化普遍规律的科学,它研究由许多子系统构成的系统(如电子、原子、分子、细胞、器官、生物、社会等)是如何通过协作从无序到有序演化的规律,在对系统进化规律研究的具体或普遍程度上,协同学比耗散结构理论更进了一步。而信息系统正是由许多子系统构成的,如何建立各子系统之间的协同作用机制,使信
7、息系统由无序向有序转化是信息组织研究中的一个重要课题,因此协同学也是信息组织的理论基础之一。16(5)突变理论 是现代数学的一门新兴分支学科,是20世纪70年代由法国数学家勒内托姆首先提出来的,它用形象而精确的数学模型来揭示和预测事物的连续性中断的质变过程。突变理论指出系统的熵可以增加也可以减少,这种熵增、熵减可以在宏观无限小的时间内突然发生。突变熵减少产生的有序性,可以抵消、战胜自然界某些自发熵增趋势,有可能造成有序性的发展,由此得出突变理论的一个重要观点“突变是产生有序性的重要源泉”。因此突变理论为信息组织理论的发展与完善提供了理论基础。17(6)信息自组织理论w是信息组织方法的拓展,是信
8、息组织理论研究中的一项新课题。凡是能够不再借助于外部控制而能实现从无序到有序的转变,并维持稳定有序状态的系统,就称为自组织系统。信信息息自自组组织织是是指指作作为为信信息息系系统统组组成成要要素素的的信信息息,由由于于人人与与人人之之间间、人人与与系系统统其其他他要要素素之之间间存存在在的的相相关关性性、协协同同性性或或默默契契性性而而形形成成特特定定结结构构与与功功能能的的过过程程,也也就就是是信信息息系系统统无无须须外外界界指指令令而而能能自自行行组组织织信信息息,自自我我走走向向有有序序化和优化的过程。化和优化的过程。183信息组织的方法基础信息组织的方法基础语言学 逻辑学 知识分类 1
9、9(1)语言学要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统。有了这种符号系统,信息系统的有序特征才能体现,信息单元的个体特征才能被揭示出来,各种信息单元才能对号入座,被纳入到这种符号系统的框架之中,形成一个便于检索的序化信息集合。尽管各种信息组织符号系统的形式不同,但都和自然语言一样,有着共同特征:即有语词、有词汇、有语法。这就是信息组织的语言学基础。20(2)逻辑学形式逻辑是关于思维规律的科学。信息组织其实就是人脑思维活动的一种外化,它既然是一种思维活动,就必须遵循科学的思维方法。也就是说,进行信息组织工作必然用到形式逻辑的一些方法,信息组织的行为只有符合逻辑思维规律,才能保证
10、信息组织的优化,序化质量。21(3)知识分类分类是人们认识事物的一种最为基本的方法。知识分类是一门研究知识体系结构的学问。信息的主体是知识,信息组织活动必须建立在人们对知识体系认识的基础之上。221.1.3 网络环境下信息组织的内涵 1任意层次的信息内容元素、信息单元和信息集合体系正逐步以计算机可识别和理解的方式被定义、描述、指向、链接、传递和动态组织;2信息资源、信息组织工具、信息系统日益聚合在同一数字介质层面,它们间的动态链接、转换、互操作和集成等正逐步实现;3信息资源系统、信息服务系统和用户及其信息系统,日益连接在同一网络空间,它们之间的链接、交换、互操作和协作也日益成为可能;4各种基于
11、网络、基于知识、基于协作的信息组织工具和系统机制也日益成熟,并可按照开放的、计算机可识别处理的方式进行描述、交换和互操作。231.2 知识组织概述 1.2.1 知识的含义 1.2.2 知识组织的定义 1.2.3 知识组织的方法 1.2.4 知识组织的体系 241.2.1 知识的含义1知识的定义知识的定义 2知识的分类知识的分类 3知识的特性知识的特性 251知识的定义知识的定义国外专家学者的观点:国内专家学者的观点:知识是经过人的思维整理过的信息、数据、形象、意向、价值标准以及社会的其他符号化产物,不仅包括科学技术知识,还包括人文社会科学的知识、商业活动、日常生活以及工作中的经验和知识、人们获
12、取并运用和创造知识的知识,以及面临问题作出判断和提出解决方法的知识。262知识的分类知识的分类1)按按领领域域:哲哲学学知知识识、社社会会科科学学知知识识和和自然科学知识;自然科学知识;2)按按用用途途:科科学学知知识识、技技术术知知识识、文文化化知识;知识;3)按按水水平平:低低级级知知识识、中中级级知知识识和和高高级级知识;知识;4)按性质,普通知识、专业知识;按性质,普通知识、专业知识;5)按载体:隐性知识、显性知识。按载体:隐性知识、显性知识。27 另外,1996年,世界经济合作与发展组织在题为“以知识为基础的经济”报告中,将对经济有重要作用的知识分为四种类型:知事类知识(know-w
13、hat)、知因类知识(know-why)、知能类知识(know-how)、知人类知识(know-who)。也有学者扩充了知识的类型,增加了知时类知识(know-when)、知地类知识(know-where)和知数类知识(know-quantity)。这就是所谓的具有中中国国特特色色的的知知识识分分类类,可以用公式记为K=6W+Q。283知识的特性知识的特性智慧性客观性依附性不磨损性非遗传性增值性共享性 291.2.2 知识组织的定义 知识组织是指为促进或实现主观知识客观化和客观知识主观化而对知识客体所进行的诸如整理、加工、引导、揭示、控制等一系列组织化过程及其方法 301.2.3 知识组织的方
14、法知识组织方法归纳起来主要有:1知识表示2知识聚类3知识分类4知识重组5知识编辑6知识获取7知识存检8知识布局9知识监控311.2.4 知识组织的体系 知识组织体系(Knowledge Organization Systems),是对知识内容概念及其相互关系进行描述和组织的机制,并对各信息对象按照知识结构进行描述、连接和组织,根据自己的知识需要和一定的知识体系来发现、确认、检索和组合相关的信息内容,从而方便地构成新的应用知识系统。32知识组织体系可分为四个层次 1说明性描述2定义性描述3主题图描述4概念集描述331.3 网络信息资源组织 1.3.1 网络信息资源组织的环境 1.3.2 网络信息
15、资源组织的模式 341.3.1 网络信息资源组织的环境 网络信息资源组织的环境与传统文献管理环境的不同主要表现在:信息组织工作的对象有了很大的变化。用户需求发生了很大的改变。信息组织的技术环境有了很大的变化.网络信息资源 351.3.2 网络信息资源组织的模式1Archie系统系统 2Gopher系统系统 3搜索引擎的信息组织方法搜索引擎的信息组织方法 4元数据元数据 5其他信息组织方法其他信息组织方法 361Archie系统系统 Archie组织网络信息资源原理:Archie服务器(全世界设有30多个)自动定期访问因特网上各个匿名FTP服务器,将服务器上的文件随时索引编辑成一个可检索的数据库
16、。当用户要求Archie服务器检索文件信息时,Archie服务器自动搜索自己的数据库,查找与用户提问相匹配的所有文件并将所有文件的FTP地址及目录反馈给客户。这样用户便可使用匿名FTP按地址及目录获取所需文件。目前Archie服务已扩展到提供多种其他的联机目录和信息资源清单,并提供使用Archie的多种途径,包括通过Telnet、通过WS Archie客户程序、通过Web浏览器和通过E-mail使用Archie。http:/archie.icm.edu.pl/archie_eng.html372Gopher系统系统 Gopher是基于菜单驱动的分布式文件检索系统,它可将用户的请求自动转换成FT
17、P或Telnet命令。它是一个浏览索引数据库的非常有效的工具,软件协议遵循客户机/服务器(Client/Server)模式,允许用户在不同的计算机系统下浏览和检索来自不同服务器上的文件。它的人机界面是菜单形式的,在一级一级的菜单的导引下,用户通过选取自己感兴趣的信息资源,就可以对Internet网上的远程机信息系统进行实时访问。383940Archie 和Gopher比较w相似:组织和整理网络资源的方式相似w不同:Archie系统只能提供单一词的检索,而Gopher系统可同时提供两个以上的词检索,并可搭配布尔逻辑运算符的组配功能;Gopher系统以较长的字符串来描述文献,同时配合不同层次的文件
18、目次显示网络资源而Archie系统则无法达到在Archie系统中无法立即查看文献内容,而Gopher系统却可以做到,这是二者间的最大差别413搜索引擎的信息组织方法搜索引擎的信息组织方法(1)目录式分类搜索引擎(2)全文搜索引擎(3)分类全文搜索引擎(4)索引式搜索引擎(5)元搜索引擎(6)智能搜索引擎 42(1)目录式分类搜索引擎搜索引擎是一种专门为组织与检索网络信息资源使用的检索工具,它所起的作用与传统的二次文献相同。目录式分类搜索引擎是将信息系统加以归类,利用传统的信息分类方式组织信息,用户按类查找,如著名的Yahoo。网络分类目录所使用的分类法有主题分类法、学科分类法、分面组配分类法和
19、体系分类法。目录式分类搜索引擎由于网络目录中的网页是由专家精选的,所以网页内容丰富,有较高的查准率,但查全率较低,搜索范围较窄。43(2)全文搜索引擎全文搜索引擎是将网站的每个主页上的所有文字进行组织,建立索引数据库,索引信息包括文档的WWW地址,每个文档 中 单 字 出 现 的 频 率、位 置 等,如AltaVista。全文搜索引擎具有较高的检全率,搜索范围较广,但检准率较低,缺乏清晰的层次结构,查询结果中重复链接较多。44(3)分类全文搜索引擎分类全文搜索引擎是将目录式分类搜索引擎和全文搜索引擎组织信息的方法结合起来,通常是在分类的基础上再进一步进行全文检索,这就克服了目录式分类搜索引擎和
20、全文搜索引擎各自的缺点,可提高检全率和检准率。现在大多数的搜索引擎都是分类全文搜索引擎。45(4)索引式搜索引擎索引式搜索引擎主要是依靠一种被称之为“蜘蛛”、“机器人”等的计算机程序有规律地遍历整个网络空间,根据网络协议和程序自身的有关约定,记录网上的信息,并对其进行加工、整理,将信息加入到索引数据库。根据一定的规则,及时地对数据库进行补充与修改。46(5)元搜索引擎元搜索引擎又称集合式搜索引擎,它将多个搜索引擎集成在一起,并提供一个统一的检索界面。这样省去了用户记忆多个搜索引擎的不便,使用户的检索要求能同时通过多个搜索引擎来实现,从而获得全面的检索效果。元搜索引擎又可分为并行式元搜索引擎和串
21、行式元搜索引擎。http:/ 引 擎 有 FSA、Eloise、FAQFinder、ulika、Askjevves,FSA和Eloise是专门用于搜索美国证券交易委员会的商业数据库,这两个系统中均内嵌了特定领域中的商业知识,并使用推理证明式的自然语言识别技术。智能搜索引擎具有较高的检全率与检准率。484元数据元数据 元数据是关于数据的数据,是用于提供某种资源的相关信息的结构化数据,是对数据进行组织和处理的基础,是传统的书目方法在网络信息组织与管理中的发展。这个术语通过不断地发展逐渐成为用于帮助识别、描述和定位网络电子资源的任意数据。49元数据的特点元数据的特点 元数据是用来描述信息资源的标准,
22、由多个按照规定的编码语言和编码方式来揭示信息资源的属性和特征描述;元数据由多层次的结构组成,通常有内容结构、句法结构和语义结构;元数据的结构和完整性与对信息资源的属性描述和使用环境有关;在不同的资源对象、不同的领域中会存在多个元数据标准,这就引起了元数据的互操作、元数据格式的释读、元数据格式的转换等。50元数据的作用元数据的作用 定位(location):提供有关所需资源的储存位置和信息;探索(discovery):提供有关如何找到所需资源的信息;文件记录(documentation):描述并记录文件的性质与内涵;评估(evaluation):协助使用者判断资源对其之价值;选择(selecti
23、on):帮助使用者决定是否取用该资源。51元数据在因特网上的信息检索中的作用元数据在因特网上的信息检索中的作用 管理大量低网络带宽的数据。支持有效的网络信息资源的发现和检索。分享和集成异构的信息资源。控制限定检索的信息。52元数据存在的问题元数据存在的问题 元数据编制时对元数据格式定义、语义定义、应用规范、内容编码规则等规范机制应有明确的规定;元数据编制工具应能生成开放格式的数据记录,支持元数据传递和转换。元数据编制工具应能嵌入智能化语义分析和格式分析机制,应能与元数据转换和挖掘模块有机融合;元数据编制系统应与公共数据登记系统有效链接,从而支持元数据格式、语义、应用规范等的开放解析;53元数据
24、存在的问题元数据存在的问题由于元数据所描述的资源对象往往是分布于异地的数字对象,因此元数据编制系统应容纳元数据维护机制,包括对由于资源本身变化而引起的元数据变化的检验,以及在资源因保存迁移而变化时对某些参数的重新描述机制;各种元数据与MARC编目数据之间存在相互兼容的问题。54元数据的规范和发展对策元数据的规范和发展对策 建立支持开放搜寻和灵活检索的元数据系统,明确定义元数据检索界面格式,充分利用开放语言;明确定义元数据传递格式,用基于XML的开放机制,可选用已有的标准,例如:METS、SOAP等;明确所采用的元数据格式、应用规范、内容编码规则、元数据编制程序以及其它相关的规则;利用XML N
25、amespace技术,正式建立与这些格式、内容编码规则等的开放链接,保障它们的公共可查询和可获取;55元数据的规范和发展对策元数据的规范和发展对策改良HTML,建立能描述书目信息和其他信息本质和内容的元数据格式和规范;将将之纳入HTML技术体系中;制定可靠的范例记录,通过范例记录及其说明揭示元数据格式及相应编制方法。制定可靠的版本管理制度,有效跟踪所依据的标准或规则的版本变化,及时反映本系统所采用的规则版本;将格式、标准说明和链接形成规范文件提交公共元数据登记系统,保证它们的可检索和可解析。加快元数据体系的规范化和标准化工作,加强对元数据工具功能的完善,及早建立通用的元数据体系。565其他信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 精华
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。