信息资源检索概述.pptx
《信息资源检索概述.pptx》由会员分享,可在线阅读,更多相关《信息资源检索概述.pptx(88页珍藏版)》请在咨信网上搜索。
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2011,年,8,月,第一章_信息资源检索概述,#,信息资源检索与利用,西安石油大学图书馆,连宇江,2011.8,2011,年,8,月,第一章_信息资源检索概述,2,课程主要内容,第一章 信息资源检索概述,第二章 参考数据库资源检索,第三章 全文数据库资源检索,第四章 数据与事实信息资源检索,第五章 网上其它信息资源检索,第六章 信息资源检索的综合利用,2011,年,8,月,第一章_信息资源检索概述,3,第一章 信息资源检索概述,一、信息资源的分类,二、信息资源的检索,三、信息资源的检索方法和技术,四、信息资源检索的效果评价,2011,年,8,月,第一章_信息资源检索概述,4,第一节 信息资源分类,1.1,信息,信息一词最早出自拉丁语,意思是通知、报道和消息。同时,也多见于我国古代的诗词中,其所说的信息,指“音信”、“消息”意思,与今天人们对信息的认识没有本质的区别。,梦断美人沉信息,目穿长路倚楼台。,(唐)李中,暮春怀故人,不乞隋珠与和璧,只乞乡关新信息。,(宋)李清照,上枢密韩肖胄诗,2011,年,8,月,第一章_信息资源检索概述,5,信息作为一个科学术语,最早出现于通信领域,,20,世纪中叶后被引入哲学、信息论、系统论、控制论、情报学、经济学、管理学、计算机等领域。信息的广泛应用,导致们对信息的认识和定义上的差别。,哲学家认为:信息是认识世界的一种依据。信息是被其他事物感知的、表征该事物特征的信号内容,即该事物向其他事物传递的信号。,信息论的创始人申农(,C.E.Shannon,)认为,信息是用来减少随机不确定的东西,即信息是一种不定度。他是从通信系统理论的角度上讲的。,数学家认为信息是一种概念。即信息熵这个概念,它是衡量对某种事物认识的不确定度,即信息的有序度。,控制论专家,N,维纳对信息的定义是“信息就是我们适合外部世界进行交换的内容的名称”。,新闻界普通认为,信息是对事物运动状态的陈述,是物与物、物与人、人与人之间的特征传输。,心理学家认为,信息是存在于意识之外,它存在于自然界、印刷品、硬盘以及空气之中。,经济学家认为,信息是与物质、能量相并列的客观世界的三大要素之一,(,信息、物质和能源,),,是为管理和决策提供依据的有效数据。,2011,年,8,月,第一章_信息资源检索概述,6,情报领域比较认同的看法是:,信息是事物存在的方式和运动状态的表征,信息并非事物本身,而是事物发出的体现它存在和运动状态的信号和消息。因此我们说:信息是客观事物的存在方式与运动规律以及人们对这一切的看法与表述。,信息的功能主要表现在:,一是可深化人们对于世界的科学认识,有助于人们不断地揭示客观世界;,二是可以消除人们在认识上的某种不定性。人类认识世界,就是不断地从外界获取信息和加工信息的过程。,三是信息可向人们不断提供知识和情报。它和物质、能量一样是一种社会的基本资源。随着人类社会的发展,信息在社会中发挥的作用越来越重要。,2011,年,8,月,第一章_信息资源检索概述,7,1.2,信息资源,信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才可称为信息资源。“信息资源”的概念是随着现代信息技术,特别是计算机技术和信息资源管理理论的发展和普及而为人们所接受的。,孟广均等人在,信息资源管理导论,中阐述“信息源不等于信息资源,信息资源是可利用的信息的集合,是高质量、高纯度的信息源。”,卢泰宏和孟广均曾在,1992,年编译的,信息资源管理专集,中将美国学者对“信息资源”的理解概述为:信息资源,=,文献信息;信息资源,=,数据;信息资源,=,多种媒介和形式的信息(包括文字、图像、声音、印刷品、电子信息、数据库);信息资源,=,信息活动中各种要素的总称(包括信息、设备、技术和人等)。,2011,年,8,月,第一章_信息资源检索概述,8,由此可以看出信息资源还是一个发展中的概念,是一个具有丰富内涵的术语。,1998,年,篓策群、桂学文二人在其主编的,信息经济学通论,一书中指出,从信息资源所描述的对象来看,信息资源由自然信息资源、机器信息资源、社会信息资源、实物型信息资源组成;从载体和存储方式来看,信息资源由天然型信息资源、智力型信息资源、实物型信息资源和文献型信息资源构成;从信息资源的内容来看,信息资源由政治、法律、军事、经济、管理、科技等信息资源组成;从信息资源的反映面来看,信息资源由宏观信息资源和微观信息资源组成;从信息资源的开发程度来看,信息来源由未开发的信息资源(信息原料)和已开发的信息资源(信息产品)组成。,2011,年,8,月,第一章_信息资源检索概述,9,可以说,信息时代更强调信息的,收集、整理、加工和使用,。信息通过文字符号、声音或图像等形式存储在各种载体上集合在一起就成了信息资源。物资和能源都是不可再生的资源,而信息资源是一种可再生、可反复使用的资源,信息资源是经过人类选取、组织、序化的有用信息的集合。但是同样的信息资源会因使用者的不同而发掘出不同的信息。人们越来越清楚地意识到信息资源日益显著的作用,人类所从事的一切社会活动必须从利用信息资源入手,在未来社会竞争环境中,那些拥有较多信息资源的个人、机构、国家将具有更大的竞争优势。信息资源地位的上升,促进了以计算机和网络为核心的信息技术的进步,先进的信息技术反过来又把信息资源的开发作为重要的应用方面,例如使用现代信息技术可以为人们提供更多、更及时的有用信息。,2011,年,8,月,第一章_信息资源检索概述,10,1.3,信息资源的分类,对事物进行分类,是人们认识事物的一种基本方法,人们要开发利用信息资源,就必须首先了解信息资源的类型,信息资源的分类标准是多种多样的,首先,按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。潜在的信息资源是指个人在学习、认识和实践过程中存储在大脑中的信息资源。显然,现实信息资源是我们当前研究、开发、利用的重点。现实的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。,2011,年,8,月,第一章_信息资源检索概述,11,1.3.1,体载信息资源,体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等。,2011,年,8,月,第一章_信息资源检索概述,12,1.3.2,文献信息资源,文献信息资源是以文献为载体的信息资源。它又可按文献信息资源的载体形式进行划分、按信息资源出版类型进行划分和按信息资源的内容加工层次进行划分。,(1),按文献信息资源载体形式进行划分,印刷型信息资源。,印刷型信息资源是一种传统的、常见的信息资源,指通过油印、铅印、胶印等各种印刷手段将信息记录在纸张上的信息资源。其特点是使用方便,易于携带和阅读,但体积大,不易整理和保存。,缩微型信息资源。,缩微型信息资源包括缩微胶卷和缩微平片,是指通过利用光学技术将信息记录在感光材料上的信息资源。其特点是体积小、易保存、存储密度高,但是它的使用需要专门的设备和环境。,2011,年,8,月,第一章_信息资源检索概述,13,声像型信息资源。,声像型信息资源包括唱片、录音带、录像带、电影和幻灯片等,是指通过专门的设备,使用声、光、磁、电技术将信息以声音、图像等形式记录下来的信息资源。其特点是直观形象,但需要专门的设备。,电子型信息资源。,电子型信息资源是指通过编码技术将信息转换为计算机可识别的语言,并将信息记录在磁带、磁盘、光盘上的信息资源。它需要用计算机才能读取信息,具有存储容量大、存取速度快、体积小、可共享的特点,但是它的价格较高,保存条件较高。电子型信息资源主要是指电子图书、电子期刊、电子会议录等,如果这些电子型信息资源能够在因特网或局域网内检索,那么它们就被视做网络信息资源。,2011,年,8,月,第一章_信息资源检索概述,14,(,2,)按信息资源出版类型划分,科技图书。,科技图书是对已有的科学技术成果和实践经验比较全面系统地概括和论述。科技图书内容比较成熟,形式相对固定,是积累和传递科学知识的一种传统的文献方式。国家标准对图书的定义是“以印刷方式单本刊行的出版物”。一般把少于,50,页的图书称为小册子。按其性质可分为阅读性图书,(reading book),和参考工具书,(reference book),。阅读性图书包括专著、教科书、论文集、科普读物、技术图书等,它所提供的是系统、完整、总结性的知识信息。参考工具书包括百科全书、词典、年鉴、手册、指南、图册等,它所提供的是各种经过验证和浓缩的、离散性的信息。,图书的特征:国际标准书号,ISBN(International Standard Book Number),,,13,位数,分为,5,段:国际商标码,-,地域号,-,出版社,-,书号码,-,计算机效验码,如:,978-7-8110-153-9,。,2011,年,8,月,第一章_信息资源检索概述,15,科技期刊。,科技期刊是指学科范畴属自然科学和技术科学的定期或不定期的连续出版物。期刊,(Periodicals),也称杂志,(Journal,,,Magazine),,有固定统一的名称、出版形式和规律,每期发表多个著者的新作。科技期刊可分为学术性期刊、技术性期刊、科普性期刊、政策性期刊及检索性期刊。学术性期刊以发表科研方面的论文为主,具有较强的学术性,是科技期刊的主体;检索性期刊是提供科技文献线索的主要工具性刊物。,期刊的特征:国际标准刊号,ISSN(International Series Standard Number),,共,8,位数,分为两段,前,7,位数字为刊名代号,最后一位为计算机校验码。例如:,大学图书馆学报,1002-1027,西安石油大学学报,1001-5361,2011,年,8,月,第一章_信息资源检索概述,16,科技报告。,科技报告是科学研究工作中最终研究成果报告或阶段性研究成果报告。其内容大多涉及某学科前沿技术或高新科技领域的最新研究课题,内容详尽系统,一般包括研究过程的原始记录、事实数据、研究方案的选择比较以及成功的经验或失败的原因分析等。每份报告自成一册,发表及时,有较为规范的陈述格式和统一编号以及来源机构名称等。由于技术保密,使其发行范围和数量受到一定的限制。,国际上著名的科技报告是美国政府的四大报告,即政府部门的,PB,报告、军事系统的,AD,报告、国家航空与宇航局的,NASA,报告和能源部的,DOE,报告。,我国的科技报告是国家科技部出版的,科学技术研究成果报告,,分为“内部”、“秘密”、“绝密”,3,个保密级别,代表了我国科学技术发展的最高水平。,2011,年,8,月,第一章_信息资源检索概述,17,会议文献。,会议文献指在国际、国内学术性或专业性会议上发表的论文和报告。众多学科的新理论、新技术,大多利用科技会议论文形式首次公布。它往往代表某一领域最新研究成果,学术性较强,能反映世界科技发展水平和趋势。,会议文献分为会前文献和会后文献。会前文献包括会议日程预告、会议论文预印本和论文文摘等,会后文献包括会议论文集、会议专刊等。会议文献的著录有其自身特点,如会议名称、会议时间、会议地点、主办单位等。,2011,年,8,月,第一章_信息资源检索概述,18,专利文献。,专利文献源于专利制度,是指各国专利局及国际性专利组织的正式出版物,如专利申请说明书、专利说明书、专利公报、专利分类表以及专利文献检索工具等。专利文献是公开通报新发明创造、促进技术发明迅速传播的媒介。它记录了人类的发明创造,是对技术发明进行科学审查和实施法律保护的依据。据估计,世界上,90-95%,的新技术发明成果首次在专利文献中公布,而在其它类型文献中首次公布的只有,5-10%,。因此,专利文献对应用型科学研究工作者来说是非常重要的信息源。,2011,年,8,月,第一章_信息资源检索概述,19,学位论文。,学位论文是为取得博士、硕士、学士学位而撰写的学术性研究论文。学位论文大体分为两种类型,一是调研综述性论文,著者根据大量的信息和数据进行科学分析研究,对某一问题作出有见解的概括性总结;二是理论研究和探讨性论文,著者在原有论点的基础上根据自己研究的结果,提出新论点和对新问题的探讨。学位论文的质量差别很大,但一般都具有一定的深度和独特的见解。,2011,年,8,月,第一章_信息资源检索概述,20,标准文献。,标准文献是经过公认的权威机构批准的标准化工作成果,是对产品和工程项目的质量、工艺规范、测试计量方法等方面的技术规定,具有法律约束作用。标准文献反映社会与技术进步以及人类对自然界控制的水平。它是了解各国技术经济政策、技术发展和管理水平的重要参考资料,所包含的技术信息适于直接应用。,政府出版物。,政府出版物是指各国政府部门及所属专门机构发表和出版的文件。它集中反映了政府各部门对有关工作的观点、法令、方针政策等,通常分为行政性文件和科技文献两大类。政府出版物对了解一个国家科学技术和经济政策及其演变情况,具有一定的参考价值。,2011,年,8,月,第一章_信息资源检索概述,21,产品样本。,产品样本是企业为推销产品而印发的商业性技术宣传品。它包括产品说明书、产品目录、厂商企业介绍、贸易刊物、产品数据手册等。这类文献内容大多以介绍产品的性能规格、构造原理、用途、使用方法及规程为主体。其特点是技术成熟可靠、出版迅速、图文并茂、直观性强。由于产品的更新换代,使产品样本有效期变短;由于商业宣传成分增多,使其科技信息含量下降。尽管如此,它仍然是工程技术人员的主要参考资料,也是引进国外技术和产品的重要依据。,2011,年,8,月,第一章_信息资源检索概述,22,技术档案。,技术档案是企事业单位在科研生产活动中形成并经过特殊整理而转化的具有保存价值的技术文件。它是科研生产工作中积累经验、提高质量的重要依据,具有重要的信息价值。,以上十种类型的出版物,是科技人员获取信息的主要来源,我们称为十大信息源。除此之外,还有报纸、新闻稿件、科技译文、手稿、地图、科教影片等等,它们都有一些特殊的信息价值。,2011,年,8,月,第一章_信息资源检索概述,23,(,3,)按加工层次划分,一次信息资源。,一次信息的载体形式称为一次信息资源,也称原始文献。它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。,个人专著(某某著书,而某某编的书不是一次文献而是三次文献)。,2011,年,8,月,第一章_信息资源检索概述,24,二次信息资源。,浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。它是将分散的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。二次信息资源具有浓缩性、汇集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。,例如:书目、题录、文摘、索引等。(图书馆检索室),marc,数据,2011,年,8,月,第一章_信息资源检索概述,25,三次信息资源。,三次信息的载体形式称为三次信息资源,它是指对一次信息资源进行综合分析、研究和评述而编写出来的成果。如手册、百科全书、年鉴以及其他综述和评论性文章等。三次信息资源源于一次信息资源,又高于一次信息,是一种再创性文献。,它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等,2011,年,8,月,第一章_信息资源检索概述,26,零次信息资源。,零次信息的载体形式称为零次信息资源。它是指未经正式出版发行的最原始的记录,如书信、手稿、笔记、实验记录等。其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。如书信、手稿、笔记、记录等。也有人认为是科技人员口头交谈及直接作用于人的感觉器官的非文献知识,如操作技能、诊疗经验等。也可以说,零次文献是以文献所有者本身为载体的未公布于世的科技知识。,2011,年,8,月,第一章_信息资源检索概述,27,以上四级信息资源的关系是,:,零次信息资源是一次信息资源的素材;,一次信息资源是二次、三次信息资源的来源和基础;,二次、三次信息资源是对一次信息资源进行组织、加工、综合后形成的,它们编写的目的明确,专指性强。,2011,年,8,月,第一章_信息资源检索概述,28,(,4,)实物信息资源,实物信息资源是指以实物为载体的信息资源。依据实物的人工与天然特性又可将实物信息资源分为以自然物质为载体的天然实物信息资源和以人工实物为载体的人工实物信息资源(如产品、样品、样机、模型、雕塑等)。,2011,年,8,月,第一章_信息资源检索概述,29,(,5,)网络信息资源,网络信息资源是指从计算机、通信技术、多媒体技术相互融合而形成的网络上可查找到的资源。网上可利用的信息资源是多种多样的,从网络信息管理和利用的角度出发,人们对已存在于网络中的信息资源进行了类型化和系统化研究,不同的角度有不同的分类形式,一般有以下几种:,按信息表现形式分有电子出版物和非电子出版物信息资源。,按信息的媒体形式分本为文本信息资源、超文本信息资源、多媒体信息资源和超媒体信息资源。,2011,年,8,月,第一章_信息资源检索概述,30,文本信息资源。,普通的文本信息资源的知识单元按线性排列。,超文本信息资源。,超文本信息资源是按知识单元及其关系建立的知识结构网络。它的本质和基本特征就是在文档内部和文档之间建立联系,这种关系给了文本以非线性的组织。简言之,超文本是由存放信息的结点和描述信息之间关系的链组成的。结点是超文本系统中的自然数据单元,结点可大可小,规模不同,类型不同。链是超文本系统中表现信息之间关系的实体,它陷藏在信息背后。用户通过链接浏览信息内容时,往往意识不到是在分布式的计算机上从一个结点跳到另外一个结点。只有链的存在,才能在信息单元之间建立联系,才有了非线性的信息组织方式。,2011,年,8,月,第一章_信息资源检索概述,31,多媒体信息资源。,多媒体是包括文体、图像和声音在内的各种信息表达和传播形式的总称。由于计算机软、硬件的技术限制,相当长时间以来,计算机信息检索系统只限于存储和检索书目、文摘等二次文献型文献,多媒体技术的出现和使用使得人们接受信息资源的范围扩大到事实型数据库,如图谱、切片、三维结构等。,超媒体信息资源。,超媒体是超文本与多媒体两种技术的结合。一般说来,当超文本结点中的信息是多媒体信息时,就称为超媒体,它是超级媒体的简称。意即在主页中包含大量多媒体的超级链接,除了图像、动画、声音外,还可以包括表格、表单等形式。近年来,超媒体技术发展迅速,在网络上,超媒体应用系统不断涌现。在超媒体信息系统中,不同类型的媒体信息能高度综合和集成,空间上图文并茂,时间上媒体信息同步实现有超文本和多媒体两种信息资源的特点,具有高度的交互性。例如,流媒体就是这种超媒体信息资源的一种切实有效的传递方式。,2011,年,8,月,第一章_信息资源检索概述,32,按网络信息资源加工层次,可以分为网络资源指南和搜索引擎,联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其它动态信息。,按照用户采用的不同的网络协议来划分,可以分为基于超文本传输协议(,HTTP,)的信息资源、基于文件传输协议(,FTP,)的信息资源、基于远程登录(,TELNET,)的信息资源、新闻组(,Usenet/Newsgroups,)资源和电子邮件(,E-mail,)信息资源。,此外随着,web2.0,的发展信息资源也便及整个,web2.0,中,如博客,百科,维基,播客等等。,2011,年,8,月,第一章_信息资源检索概述,33,第二节 信息资源的检索,2.1,信息资源检索,信息资源检索是从信息资源集合中找出所需信息内容的过程。,从广义上讲,信息资源检索包括两个过程,一是信息资源的存储(,Information Storage,),所谓存储是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程;二是信息资源的检索(,Information Retrieval,),所谓检索是根据检索提问制定检索策略,利用信息数据库查找信息资源的过程。,从狭义上讲,信息资源检索仅指后一部分。信息资源的检索本质是一个匹配的过程,即信息用户的需求和一定的信息集合的比较和选择的过程。换言之,也就是用户根据自己的需求提出的主题概念或提问表达式与一定的信息资源系统的检索语言相适应的过程,如果两者相匹配,则所需信息就被检中,否则检索失败。,2011,年,8,月,第一章_信息资源检索概述,34,2.2,信息资源检索的类型,2.2.1,按信息资源检索结果的内容划分,(,1,)信息检索。信息检索按照其信息系统、内容及结果可分为以下两种类型:,信息线索检索。,利用书目、文摘和书目型数据库等检索系统,检索的结果只是提供,了信息线索。,信息的全文检索。,这种检索以查找到信息全文为目的,检索的结果是找到全文信息。,(,2,)数据检索。数据检索是指从检索系统存储的数据中查出用户所需数据的检索,如科技数据、金融数据、人口统计数据等。,(,3,)事实检索。事实检索是指对特定的事件或事实的检索,包括事物的性质、定义、原理及发生的地点、时间、前因后果等。,2011,年,8,月,第一章_信息资源检索概述,35,2.2.2,按信息资源检索技术划分,(,1,)全文文本检索。,全文文本检索也称全文数据库检索,它通过计算机将文件的全貌,包括文字、图形和图像等信息转换成计算机可读形式,直接采用自然语言来设置检索入口,检索时以文中任意信息单元作为检索点,计算机自动进行高速比照,完成检索过程。,(,2,)多媒体检索。,多媒体检索是指能够支持两种以上媒体的数据库检索。多媒体数据库存储以及数据库检索技术对同时存在文字、图形、图像、动画、声音等媒体的数据进行统一的存取与管理成为可能,检索时不仅能够浏览对象的文字描述,而且能够做到听其声、观其形。,(,3,)超文本检索。,超文本检索是指超文本(,hypertext,)的内容排列是非线性的,它按知识(信息)单元及其关系建立起知识结构网络,如具有图形的信息又称超媒体(,hypermedia,),超文本(媒体)的检索是通过超文本(媒体)链接(,hyperlink,)来实现的。其形式有的在网页的文字处有下画线,或以图标方式标志,用户点击这些标志便能进入与此信息相关的下一页,在该页面上通过超文本链接进入再一个页面,超文本起信息导向作用。这样,用户在从一个页面转向另一个页面的过程中就可以获取自己所需要的信息了。,2011,年,8,月,第一章_信息资源检索概述,36,(,4,)网络信息资源检索。,网络信息资源检索是一种集合各种新型检索技术于一体,能够对各种类型、各种媒体的信息进行跨时间、跨地理检索的大系统。网络信息资源的组织管理需要诸多的信息技术支持,其中以,WWW,(,World Wide Web,)全球浏览技术最具优越性和可用性,它使用,WWW,浏览器在,Windows,界面下交互作业,能给用户揭示到一篇篇文章的信息,具有很强的直观性。,Web,文献数据库检索系统是在大量采用超文本的基础上将命令检索、选单检索方式融入其中,交互使用,集所有的检索机制为一体,许多大型国际联机检索系统都在因特网上有自己的站点,为用户提供方便的检索服务。,WWW,是一种集超文本技术,多媒体技术和网络技术于一体的新型检索工具。与传统信息检索方式相比较,它具有深入、实时、快速、跨时空共享和多媒体应用等优点。,2011,年,8,月,第一章_信息资源检索概述,37,2.3,信息资源检索系统及数据库,2.3.1,信息资源检索系统,检索系统是用于报道、存储与查找信息的工具。计算机检索系统中往往包含有若干数据库,每个库对应一种工具,它们相当于若干个可用于独立检索的工具。检索系统应包括以下两个主要的方面:,(,1,)信息标引和存储过程。对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程。,(,2,)信息的需求分析和检索过程。分析用户的信息需求,利用已组织好的检索系统所提供的方法与途径检索有关信息,即检索系统的应用过程。,2011,年,8,月,第一章_信息资源检索概述,38,检索系统的实质是将描述特定用户所需信息的提问特征与信息存储的检索标识进行异同比较,从中找出与提问特征一致或基本一致的信息。提问特征是对信息的需求进行分析,从中选择出能代表信息需求的主题词、分类号或其他符号。信息资源检索系统如图所示。,一个计算机检索系统由数据库及所有支持检索实施所需的软、硬件构成,数据库是检索系统的核心部分。,2011,年,8,月,第一章_信息资源检索概述,39,2.3.2,数据库,(,1,)数据库的定义,根据,ISO/DIS 5127,号标准,数据库(,Database,)的定义为:至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。数据库是计算机技术与情报检索技术相结合的产物,是重要的信息资源管理工具。,2011,年,8,月,第一章_信息资源检索概述,40,(,2,)数据库类型,按照国际上通用的分类方法,数据库通常可分为两类:,参考数据库(,Reference Database,)。参考数据库是指用户在这些数据库中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。,书目数据库,(,Bibliographic Database,):它是存储某个学科领域二次信息资源的数据库,其显著特征是向用户提供信息线索,只能检索出信息的标题、出处、著者、主题等。例如,,EI Village 2,、,美国化学文摘数据库,、,中文科技期刊篇名数据库,等。,指南数据库,(,Directory Database,):它是存储能够提供用户参考、给予用户指南的各类信息,如商业、企业等机构的名称、地址、电话,人物,出版物,项目,程序,活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,公司名录数据库、人物传记数据库、技术标准数据库等均属此类。,2011,年,8,月,第一章_信息资源检索概述,41,源数据库(,Source Database,)。此类数据库在欧洲也称数据银行(,Data Bank,)。它是能够直接为用户提供原始资料或具体数据的一类数据库,主要有以下几种。,数值型数据库,(,Numeric Database,):是指专门提供以数值方式表示的一种源数据库。例如,各种统计数据库、财务数据库等。,文本,数值数据库,(,Textual-numeric Database,):是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。,全文数据库,(,Full-text Database,):是指存储文献全文或其中主要部分的一种源数据库,简称全文库。例如,,中国学术期刊数据库,、,法律法规全文数据库,等。,2011,年,8,月,第一章_信息资源检索概述,42,术语数据库,(,Terminological Database,):是指专门存储和检索名词术语、词语信息等的一种源数据库。例如,名词术语信息库、各种电子化辞书等。,图像数据库,(,Graphics Database,):是指用来存储和检索各种图像或图形信息及有关文字说明资料的一种源数据库。例如,用于各种建筑、产品、广告设计、图片或照片等资料类型的计算机存储与检索。,新闻数据库,(,News Database,):是指用来存储大量新闻消息的一种源数据库,其特点是收录的新闻内容范围十分广泛,时间性强,更新迅速。例如,,纽约时报,、,人民日报全文数据库,等。,除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分为磁媒体数据库、光盘数据库和多媒体数据库等。,2011,年,8,月,第一章_信息资源检索概述,43,第三节 信息资源的检索方法和技术,3.1,信息资源的检索方法,直接检索:指通过直接浏览或阅读原始文献获取所需信息的方法。通过它可以直接查找一次信息资源和三次信息资源。,间接检索:指借助检索工具或检索系统查得文献线索再获取原始文献的方法称为间接检索。它是文献检索常用的检索方法,可分为:追溯法、常规法和综合法三种,下面重点对间接检索的几种方法进行介绍。,3.1.1,追溯法:,又称引文法,是利用已知信息文献后所附的参考文献追溯查找相关信息文献的方法。包括三种情况:,(,1,)利用原始文献所附的参考文献进行追溯。一般利用与研究课题相关的综述或专著,因为其后所附的参考文献实际上相当于一个专题索引,以此为起点进行追溯,可以得到不少针对性较强的文献。,2011,年,8,月,第一章_信息资源检索概述,44,其优点:,1,)弥补检索工具的不足;,2,)寻求新的检索点;,缺 点:得到的文献比现有文献老。,2011,年,8,月,第一章_信息资源检索概述,45,(,2,)利用引文检索工具进行追溯。利用引文索引进行追溯,先知道一篇有关文献的作者姓名,利用引文索引可以查到一批引用者的姓名和引用文献来源,再以此为起点进行循环追溯,可以查到许多相互引用的作者和文献。,其优点:,1,)追查出的文献越来越新;,2,)可检索出交叉学科、边缘学科的文献,缺点:由于引文的随意性、模糊性,降低了引文索引的使用价值。另外轮排主题索引因直接采用未经规范的关键词轮流排列而成,影响了检索的准确性。,2011,年,8,月,第一章_信息资源检索概述,46,C,文献,(先发表),NEW,文献,(最近发表),参考文献:,B,D,B,文献,(在,A,后发表),参考文献:,A,C,A,文献,(先发表),D,文献,(在,A,后发表),参考文献:,A,G,追查出的文献越来越新,2011,年,8,月,第一章_信息资源检索概述,47,2011,年,8,月,第一章_信息资源检索概述,48,(,3,)利用各种中外文检索工具相互追溯。在检索文献的过程中时常会遇中文库相关文献很多而外文库几乎没有,或是外文库中有很多(甚至有我国科技工作者)而中文库中相关文献为零的现象,这时我们不能简装地判定这项技术的发明与应用只限与检出文献的地域。而要根据文献进一步分析各种可能出现的情况,更全面地寻找相关文献。,2011,年,8,月,第一章_信息资源检索概述,49,例,1,:用中外文献检索工具检索同一项目。,项 目 名 称:储层地质统计分析系统,GASOR,检索策略:,(,随机游走*建模*储层,(随机建模,+,随机模型)*储层,检索策略:,Reservoir?*random(w)walk?,外文检索工具检索结果:,2011,年,8,月,第一章_信息资源检索概述,50,馆 藏 号,:TE-39,篇 名,:Random walk simulation and analysis of configuration,作 者,:Wang Ziting,作者单位,:University of Petroleum Department of Applied Mathematics Dongying 257062,China,刊名拼音,:,外文刊名,:,ISSN:*CN Code:*CODEN:,卷 期,:V.21(6),页 码,:99-103,分类号,:O21,关键词,:Random Walk;Asphericity;Fractal,出 版 地,:,出 版 者,:,出版日期,:19971220,文 摘,:The geometrical characteristics of RANDOM WALK configuration on lattice and perorations is.,2011,年,8,月,第一章_信息资源检索概述,51,【,文献题名,】,随机游动模拟和几何特征研究,【,文摘号,】98050475,【,文献类型,】,刊,【,期刊名,】,石油大学学报(自然科学版),【,年卷期,】1997,21(6),【,页码,】99101,【,作者,】,王子亭,【,作者单位,】,石油大学,华东,【,原文出版年,】1997,【,主题词,】;*,数值模拟,;,数学分析,;*,统计分析,;,随机变量,;,分形学,;,粒子速度,;,【,图表参,】,图,1,表 参,3,附,【,文摘,】,应用数值模拟和幂律分析相结合的方式,.,2011,年,8,月,第一章_信息资源检索概述,52,3.1.2,常规法,又称常用法或工具法,是指利用检索工具来查找文献的方法。这是一种常用的科学检索方法。根据不同的课题要求,不同的环境,(,设备,),条件,可以选择最适当的方案来实施检索,其内容包括检索课题的分析、检索策略的制定、检索技术的应用等方面。根据检索入手的时间不同,常规法可分为:,(,1,)顺查法:,从远至今逐年查找。写综述、述评、专著时,了解一项技术、方法等的产生、演变、发展情况时采用。(不易漏检、得到的文献系统,但工作量较大。),(,2,)倒查法,:,从新推远逐年查找。确定新课题或解决某些关键性技术问题时多采用。(目的性强,工作量相对较小。),(,3,)抽查法:,抓住学科发展迅速、文献发表较多的年代,抽出一段时间(几年或几十年)逐年集中检索。(目的性强,工作量相对较小,但对使用者要求较高。),2011,年,8,月,第一章_信息资源检索概述,53,一般来说,科技查新,回溯年限一般,10,年;新方法、新技术回溯年限可适当缩短;成熟技术回溯期可延长、但一般不会超过,20,年。例:油田污水处理:,1992,年后相关研究文献逐渐减少,我们应适当加长回溯期,检索,1992,年以前的文献。,检索某些新方法、新技术文献时从近及远一直到文献渐少渐无为止;解决某个关键性问题,一直到问题解决为止;为了解最近一段时间该课题所达到的水平及研究和动向。,熟悉学科发展特点;熟悉学科文献集中分布登载的时间、范围时才能得到最隹效果;常阅鉴文献的学科专业人员使用的方法,常规法主要是在使用手工式检索工具时总结的方法,这种总结在手工时,为检索者起到了指导作用。现如今检索系统每个数据库都有较强的检索功能,一次性可检索出数十年的资料,我们机检时可先选一个综合性数据库检索,了解文献分布的年代,文献较集中刊载的期刊、会议,文献的类型(专利?标准?,),语种等。然后选择合适的方法进一步完成检索。,2011,年,8,月,第一章_信息资源检索概述,54,3.1.3,综合法,又称循环法或交替法,是把常规法和追溯法结合起来检索文献的方法。首先利用检索工具查找出一批质量较高的有用文献,然后利用文献后所附参考文献追溯查找相关文献。使用这种方法可以弥补因检索工具不全而造成的遗漏。,2011,年,8,月,第一章_信息资源检索概述,55,3.2,检索策略,广义地说,检索策略(,Retrieval Strategy,)是为实现检索目标而制定的全盘计划或方案,包括课题分析、检索系统选择、确定检索词及其相互间的逻辑关系、检索式的制定、调整检索方案等。狭义地说,检索策略是指填写的“检索提问单”。在计算机检索中,策略问题是明确提出来的,必须慎重考虑的,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的交互、对话中实现的。手检的策略考虑较少,因为比较简单,方案研究的余地不多。,2011,年,8,月,第一章_信息资源检索概述,56,3.3,检索步骤,分析研究课题(明确检索目的和要求),选择检索工具和检索方法,选择检索途径和检索标志,查找文献线索,整理检索结果,索取原文。,2011,年,8,月,第一章_信息资源检索概述,57,检索课题,主题分析,词表,选择数据库,确定检索词(点),用户,分析,选择检索系统,制定检索式,计算机处理,数据库,编辑出版,结果检验,印刷型,缩微型,电- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息资源 检索 概述
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文