第二章-信息检索方法.ppt
《第二章-信息检索方法.ppt》由会员分享,可在线阅读,更多相关《第二章-信息检索方法.ppt(107页珍藏版)》请在咨信网上搜索。
第二章信息检索方法1 2.1 2.1 检索的概念及原理检索的概念及原理2.2 2.2 检索工具概述检索工具概述2.3 2.3 检索方法及检索途径检索方法及检索途径2.4 2.4 检索式的拟订检索式的拟订2.5 2.5 检索步骤检索步骤2 2.1 2.1 信息检索的概念信息检索的概念一、信息检索的基本概念一、信息检索的基本概念狭义:是指依据一定的方法,从已经组织好的大量狭义:是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献有关文献信息集合中,查找并获取特定的相关文献信息的过程。信息的过程。广义:将信息按照一定的方式组织和存储起来,并广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。根据用户的需求找出有关信息的过程。3 信息检索的类型信息检索的类型信息检索的类型信息检索的类型(根据不同的检索对象):(根据不同的检索对象):一、数据检索:一、数据检索:检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等数据图表等(手册手册),某地方某地方GDP增长情况增长情况(年鉴年鉴)二、事实检索:二、事实检索:检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的第一颗人造卫星是什么时候升空的(年鉴年鉴)三、文献检索:三、文献检索:检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找信息检索方面的相关文献系统地查找信息检索方面的相关文献(论文论文)文献检索是信息检索的一种最基本的、最主要的形式。文献检索是信息检索的一种最基本的、最主要的形式。4 检索工具是人们用来存储、报道和查找各类信息的工具。一、检索工具的定义及类型2.2 2.2 检索工具概述检索工具概述5数据库的类型数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分按信息处理层次划分期刊论文数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分按收录的文献类型划分图像数据库 文本数据库数值数据库 声音数据库 视频数据库多媒体数据库按按媒媒体体信信息息划划分分综合性数据库专业性数据库按收录文献信按收录文献信息的范围划分息的范围划分单机数据库联机数据库网络数据库按按服务模式服务模式划分划分6索引数据库(一)按著录信息的特征划分 著录是指编制检索工具时对文献的内容和形式特征进行分析、选择和记录的过程。索引型检索工具目录型检索工具 文摘型检索工具全文型检索工具 71 1、索引型检索工具、索引型检索工具 索引一般是附在专著或年鉴、百科全书等工具书索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,按其内容可分名、地名、事件、概念等内容要项编排,按其内容可分为主题索引、分类索引、关键词索引、引文索引。为主题索引、分类索引、关键词索引、引文索引。图图2-2 中国大百科全书中国大百科全书的一例索引的一例索引8目录能反映一定历史时期科学文化发展的概貌目录能反映一定历史时期科学文化发展的概貌作用:作用:了解本学科的研究历史和研究现状。了解本学科的研究历史和研究现状。通过各类书目,可查寻与研究课题密切相关的通过各类书目,可查寻与研究课题密切相关的事实和资料。事实和资料。按收录的范围可分为:馆藏目录、出版社目录、国家按收录的范围可分为:馆藏目录、出版社目录、国家书目、联合目录。书目、联合目录。2 2、目录型检索工具、目录型检索工具9v各时期有代表性书目:各时期有代表性书目:TheWholeEarthCatalog、四库四库全书总目提要全书总目提要、民国时期总书目民国时期总书目、中国国家书目中国国家书目、全国总书目全国总书目、全全国新书目国新书目。联合目录主要有:联合目录主要有:CALISCALIS联合目录和联合目录和OCLCOCLC联联机目录。机目录。vCALISCALIS(中国高等教育文献保障系统)提供以中国(中国高等教育文献保障系统)提供以中国高等教育数字图书馆为核心的中国高校图书馆联高等教育数字图书馆为核心的中国高校图书馆联合目录。合目录。vOCLCOCLC(联机计算机图书馆中心)是世界上最大的(联机计算机图书馆中心)是世界上最大的提供网络文献信息服务和研究的机构。提供网络文献信息服务和研究的机构。103 3、文摘型检索工具、文摘型检索工具 特点:具有摘要,提供文献的外表特特点:具有摘要,提供文献的外表特征和内容特征。如:征和内容特征。如:中国生物学文摘中国生物学文摘、美国美国化学文摘化学文摘 作用:作用:帮助读者快速判断文献内容,节省阅读时帮助读者快速判断文献内容,节省阅读时间间替代原文替代原文11图图2-3 EI的一例文摘的一例文摘12特点特点:提供全文下载提供全文下载4 4、全文型检索工具、全文型检索工具13elsevierelsevierwileywiley(二)按所收信息的学科内容划分(二)按所收信息的学科内容划分:综合性检索工具综合性检索工具 涉及多学科,收录范围广。涉及多学科,收录范围广。专科性检索工具专科性检索工具 能够比较集中、迅速准确和全面地反映某学科能够比较集中、迅速准确和全面地反映某学科领域的最新发展状况和最前沿的科研水平。详细完领域的最新发展状况和最前沿的科研水平。详细完整的专业信息极具针对性。整的专业信息极具针对性。14二二 、检索工具的选择检索工具的选择v考虑学科范围、信息类型和数据量考虑学科范围、信息类型和数据量【例题例题】用用_检索检索-呋喃甲醇羧酸酯的合成、含有碳和氢元素呋喃甲醇羧酸酯的合成、含有碳和氢元素的化合物的英文综合学术性文献。的化合物的英文综合学术性文献。A.A.外文外文ElsevierElsevier数据库数据库 B.B.外文农业类外文农业类CABCAB文摘数据库文摘数据库 C.C.外文农业类外文农业类AGRICOLAAGRICOLA数据库数据库 D.D.外文食品科技文摘数据库外文食品科技文摘数据库FSTAFSTA15v了解收录的文献类型了解收录的文献类型 【例题例题】已知参考文献:王涛已知参考文献:王涛.土木工程土木工程CAD.CAD.中国水利水电出版社中国水利水电出版社 .2012.2012.要找原文,使用要找原文,使用_检索检索土木工程土木工程CADCAD。A.A.中文科技期刊数据库中文科技期刊数据库 B.B.中国人民大学报刊全文数据库中国人民大学报刊全文数据库 C.C.国务院发展研究中心国务院发展研究中心信息网信息网 D.D.图书馆的馆藏查询图书馆的馆藏查询 16【例题例题】使用使用检索检索CN200920135079.3CN200920135079.3一种土木连一种土木连锁建筑结构。锁建筑结构。A.A.维普中文科技期刊数据库维普中文科技期刊数据库 B.B.图书馆馆藏查询图书馆馆藏查询C.C.中国人民大学报刊全文数据库中国人民大学报刊全文数据库D.D.中国国家知识产权局专利数据库中国国家知识产权局专利数据库E.E.中国国家科技图书文献中心中国国家科技图书文献中心(NSTL)(NSTL)17【例题例题】用用检索编号是检索编号是GB/T17302.2-1998GB/T17302.2-1998的文献的文献A.A.中国国家知识产权局专利数据库中国国家知识产权局专利数据库 B.B.中国国家科技图书文献中心中国国家科技图书文献中心(NSTL)(NSTL)C.C.国务院发展研究中心信息网国务院发展研究中心信息网 D.D.中国标准信息服务网中国标准信息服务网18v考虑信息的时间范围考虑信息的时间范围 同一个数据库版本不同,时效性也不一定相同。同一个数据库版本不同,时效性也不一定相同。例如图书馆收藏的例如图书馆收藏的工程索引工程索引(EIEI)各种载体及馆)各种载体及馆藏的简况比较:藏的简况比较:印刷版(印刷版(EIEI)月刊,年度更新,收录文献源)月刊,年度更新,收录文献源26002600种,种,馆藏年限馆藏年限1968-19961968-1996。光盘版(光盘版(Ei CompendexEi Compendex)季度更新,收录文献源)季度更新,收录文献源26002600种,馆藏年限种,馆藏年限1970197019971997年。年。网络版(网络版(Ei CompendexWebEi CompendexWeb)包括光盘版()包括光盘版(Ei Ei CompendexCompendex)和)和Ei PageOneEi PageOne两部分,半月更新,收录文献两部分,半月更新,收录文献源源50005000种,馆藏年限种,馆藏年限19701970至今。至今。因此网络版(因此网络版(Ei CompendexWebEi CompendexWeb)信息更新最快,量最大。)信息更新最快,量最大。192.3 2.3 检索方法及检索途径检索方法及检索途径v检索方法检索方法:1 1常规法:常规法:所谓常规法就是利用常规检索工具查找有关所谓常规法就是利用常规检索工具查找有关文献的方法文献的方法 顺查法、倒查法、抽查法顺查法、倒查法、抽查法 2 2引文法引文法 就是查找参考文献或引用文献的方法。由远就是查找参考文献或引用文献的方法。由远及近地搜寻及近地搜寻 ;由近及远地追溯由近及远地追溯 3 3综合法综合法 引文法和常规法结合引文法和常规法结合20v思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?21标引检索输出存储过程一次信息信息特征信息特征标识检索过程检索课题检索提问检索提问标识分析分析标引输入图图2-4 信息检索原理图信息检索原理图 检检 索索 结结 果果信息检索语言检索系统存储信息与检索信息所依据的规则不一致22 检索语言是应文献信息的加工、存储和检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。概念及其相互关系的一种概念标识系统。23v按照其结构原理来划分,信息检索语言主要有按照其结构原理来划分,信息检索语言主要有:信信息息检检索索语语言言 分分类类语语言言 名称语言名称语言 主主题题语语言言 代码语言代码语言 引文语言引文语言 等级体系分类语言等级体系分类语言 分面组配分类语言分面组配分类语言 标题词语言标题词语言 元词语言元词语言 叙词语言叙词语言:自行车、脚踏车、单车自行车 关键词语言关键词语言24v检索途径检索途径25 常用字段缩写:常用字段缩写:TITITitle Title 文章题目文章题目ABABAbstract Abstract 文章摘要文章摘要KWKWKey Word Key Word 关键词关键词AUAUAuthor Author 作者作者AFAFAffiliation Affiliation 作者单位作者单位SOSOSource Source 文章来源(刊名信息等)文章来源(刊名信息等)ISSN(ISBN)ISSN(ISBN)International standard Serial(book)Number International standard Serial(book)Number PYPYPublication year Publication year 出版年出版年LALALanguage Language 语种语种261 1、主题途径主题途径2 2、分类途径分类途径3 3、责任者责任者/刊名途径刊名途径4 4、号码途径号码途径v检索途径检索途径27 主题途径是采用反映文献主题概念的主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径检索词作为检索入口的一种检索途径,也也是最常用、最重要的检索途径。是最常用、最重要的检索途径。主题主题“是一组具有共性事物的总称,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和用以表达文献所论述和研究的具体对象和问题问题”,即文献的,即文献的“中心内容中心内容”。每种文献都包含着若干主题,研究或每种文献都包含着若干主题,研究或阐述一个或多个问题。阐述一个或多个问题。1 1、主题途径、主题途径28 主题途径的优缺点主题途径的优缺点 通常适合特性检索,查准率高;不适合通常适合特性检索,查准率高;不适合族性检索,查全率低族性检索,查全率低【实例实例】主题词主题词“C C语言语言程序设计程序设计”就比分就比分类号类号TP312TP312表达得更准表达得更准 希望专指度高时采用主题途径。希望专指度高时采用主题途径。29【获取主题词的技巧获取主题词的技巧】在图书的版权页可以找在图书的版权页可以找到在版编目里面的主题词和分类号码。或者到在版编目里面的主题词和分类号码。或者在图书馆的馆藏数据找到主题词。在图书馆的馆藏数据找到主题词。【实例实例】版权页版权页样例如右图所样例如右图所示示302 2、分类途径、分类途径(1 1)图书期刊分类法)图书期刊分类法 (2 2)专利分类法)专利分类法 (3 3)标准文献分类法)标准文献分类法(4 4)分类途径的优缺点)分类途径的优缺点31(1 1)图书期刊分类法)图书期刊分类法 世界三大图书分类法:世界三大图书分类法:杜威十进分类法杜威十进分类法(DDC)(DDC)(Dewey decimal ClassificationDewey decimal Classification)国际十进分类法国际十进分类法(UDC)(UDC)(Universal Decimal Universal Decimal Classification)Classification)国会图书馆图书分类法国会图书馆图书分类法(LCC)(LCC)(Library congress Library congress classification)classification)中国图书分类法:中国图书分类法:中国图书馆分类法中国图书馆分类法(中图法)(中图法)中国科学院图书馆分类法中国科学院图书馆分类法(科图法)(科图法)中国人民大学图书馆分类法中国人民大学图书馆分类法(人大法)(人大法)32中图法中图法介绍介绍中图法中图法中国图书馆分类法中国图书馆分类法,以学科来组织知,以学科来组织知识,将全部知识领域划分为识,将全部知识领域划分为5 5个基本部类,个基本部类,2222大类。大类。五大部类分别为:五大部类分别为:马列主义、毛泽东思想;马列主义、毛泽东思想;哲学;哲学;社会科学;社会科学;自然科学;自然科学;综合性图书。综合性图书。33A 马克思主义、列宁主义 毛泽东思想、邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育 H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、安全科学Z 综合性图书U1 综合运输U2 铁路运输U4 公路运输U6 水路运输U8 航空运输U41 道路工程U44 桥涵工程U45 隧道工程U46 汽车工程U48 其他道路 运输工具U49 交通工程与公路 运输技术管理U441 结构原理、结构力学U442 勘测、设计与计算U443 桥梁构造U444 桥梁建筑材料U445 桥梁施工U446 桥梁试验观测与检定U447 桥梁安全与事故U448 各种桥型U449 涵洞工程图图 2-42-4 中图法中图法结构示意图结构示意图简表简表马列哲学社会科学自然科学综合基本大类基本大类详表详表34T T类又可分为以下几类类又可分为以下几类 TB TB 一般工业技术 TD TD 矿业技术 TETE 石油、天然气工业 TFTF 冶金工业 TG TG 金属学、金属工艺 THTH 机械、仪表工艺 TJ TJ 武器工业 TK TK 动力工程 TLTL 原子能技术 TMTM 电工技术 TNTN 无线电电子学,电信技术 TPTP 自动化技术,计算机技术 TQ TQ 化学工业 TS TS 轻工业、手工业 TUTU 建筑科学 TVTV 水利工程35 中图法中图法从大类到小类,层层展开,不断细分,从大类到小类,层层展开,不断细分,形成完整的知识体系。形成完整的知识体系。例如:例如:关于红楼梦研究资料的分类为关于红楼梦研究资料的分类为 I207.411I207.411 I I 文学文学 I2 I2 中国文学中国文学 I207 I207 文学评论和研究文学评论和研究 I207.4 I207.4 小说研究小说研究 I207.41 I207.41 古代小说研究古代小说研究 I207.411 I207.411 红楼梦红楼梦研究与评论研究与评论36【例题例题】哲学辞典哲学辞典类号为:类号为:B-61【例题例题】法国的货币与银行法国的货币与银行 的类号为:的类号为:F825.6537【例题例题】v在图书馆公共查询系统中检索游记小说:I267.438(2 2)专利分类法)专利分类法 专利分类法是根据专利的功能(效果)或专利分类法是根据专利的功能(效果)或其用途所属的行业部分来分类,目前,世界上其用途所属的行业部分来分类,目前,世界上大部分国家采用国际专利分类法(大部分国家采用国际专利分类法(Interna-Interna-tional Patent Classificationtional Patent Classification,简称,简称IPCIPC)国际专利分类法国际专利分类法(简称简称IPC)IPC),IPCIPC是世界上应用是世界上应用最广泛的专利分类体系最广泛的专利分类体系,覆盖了世界所有,覆盖了世界所有专专利利文献的文献的95%95%。IPCIPC适用于发明和实用新型专利的分类。适用于发明和实用新型专利的分类。我国于我国于19971997年正式加入年正式加入IPCIPC联盟。联盟。39部部号号部名部名分部名分部名部号部号部名部名分部名分部名A人类生活必需农业E固定建筑物建筑食品;烟草钻进;采矿个人或家用物品保健;娱乐B作业;运输分离;混合F机械工程;照明;采暖;武器;爆破发动机和泵成型一般工程印刷照明;加热交通运输武器;爆破C化学;冶金化学G物理仪器冶金核子学D纺织;造纸纺织或未列入其他类的柔性材料H电学 造纸IPC分类简表 第第 2 2 讲讲信息检索基信息检索基础础 404142(3 3)标准文献分类法标准文献分类法 世界各国的标准分类法同文献资料分类法类似,或以数字为标记、世界各国的标准分类法同文献资料分类法类似,或以数字为标记、或以字母为标记、或以字母和数字混合为标记。或以字母为标记、或以字母和数字混合为标记。我国的标准分类法采用混合标记,一级类目以专业划分,用字母表我国的标准分类法采用混合标记,一级类目以专业划分,用字母表示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照字母顺序,大类相同再按双位数字顺序排列。中国标准分类法字母顺序,大类相同再按双位数字顺序排列。中国标准分类法(Chinese Classification for Standards,简称,简称CCS)【部分分类部分分类】A 综合0009 标准化管理与一般规定1019 经济、文化2039 基础标准4049 基础学科5064 计量6574 标准物质7579 测绘B 农业林业0009 农业、林业综合1014 土壤与肥料1519 植物保护2029 粮食与饲料作物3039 经济作物4049 畜牧5059 水产、渔业43(4 4)分类途径的特点)分类途径的特点1 1)通常适合族性检索,查全率高;不适合特)通常适合族性检索,查全率高;不适合特性检索,查准率低性检索,查准率低2 2)不能适应学科发展中的变化,难以反映新)不能适应学科发展中的变化,难以反映新学科和新名词术语学科和新名词术语 44【实例实例】食品风险分析是保证食品安全的一种食品风险分析是保证食品安全的一种新模式,同时也是一门正在发展中的新兴学新模式,同时也是一门正在发展中的新兴学科。风险分析的目标在于保护消费者的健康科。风险分析的目标在于保护消费者的健康和促进公平的食品贸易。目前的文章在分类和促进公平的食品贸易。目前的文章在分类上暂时归入上暂时归入 R155.5 R155.5 食品卫生与检验和食品卫生与检验和 TS201.6 TS201.6 食品安全与卫生。没有一个专门食品安全与卫生。没有一个专门的的“食品风险分析食品风险分析”分类号。分类号。45英文版著者索引中人名规则英文版著者索引中人名规则 按姓、名次序排列:一般为原文中所使用的名字,按姓、名次序排列:一般为原文中所使用的名字,姓在前,接着是逗号,然后是名。姓在前,接着是逗号,然后是名。例如:例如:ArrowB.Smith著录为:著录为:Smith,ArrowB.3 3、责任者、责任者/刊名途径刊名途径46作者无疑是最佳检索途径之一。欧美人的姓名大量使用简称,作者无疑是最佳检索途径之一。欧美人的姓名大量使用简称,姓氏一般用全称,而名则以简写居多。例如姓氏一般用全称,而名则以简写居多。例如:v以著名物理学家史蒂芬以著名物理学家史蒂芬威廉威廉霍金霍金(Stephen William(Stephen William Hawking)Hawking)为例,在为例,在Google ScholarGoogle Scholar中检索输入中检索输入“SW HawkingSW Hawking”较较“Stephen William HawkingStephen William Hawking”检索效果更为理想。检索效果更为理想。v若无法确定作者准确姓名,可仅输入作者的姓氏。如若无法确定作者准确姓名,可仅输入作者的姓氏。如20072007年年诺贝尔经济学奖获奖者之一莱昂尼德诺贝尔经济学奖获奖者之一莱昂尼德赫维奇赫维奇(Leonid(Leonid Hurwicz)Hurwicz)。在。在Google ScholarGoogle Scholar中仅输入中仅输入“HurwiczHurwicz”,也能满,也能满足检索需求。足检索需求。47 翻译为英文的中国机构、著者姓名翻译为英文的中国机构、著者姓名(1 1)翻译的规则)翻译的规则 分为音译和意译。中国著者姓名和团体机构名称的音译,分为音译和意译。中国著者姓名和团体机构名称的音译,一般用汉语拼音。一般用汉语拼音。【实例实例】原西南师范大学在欧洲专利数据库就有四种写法:原西南师范大学在欧洲专利数据库就有四种写法:Southwest China Normal University Southwest China Normal University Southwest Normal University Southwest Normal University Xinan Teacher Xinan Teachers Universitys University Xinan Normal University Xinan Normal University有的数据库例如有的数据库例如工程索引工程索引常将常将UniversityUniversity缩写成缩写成UnivUniv。48中国人名翻译成英文名字基本上是用汉语拼音。中国人名翻译成英文名字基本上是用汉语拼音。v以杨振宁为例,可输入以杨振宁为例,可输入“Yang ZhenningYang Zhenning”或或输入输入“Zhen Ning YangZhen Ning Yang”,还可以输入,还可以输入“CN CN YangYang”。v同样,要查询李政道的文献,可分别输入同样,要查询李政道的文献,可分别输入“TD LeeTD Lee”、“Tsung Dao LeeTsung Dao Lee”、“li li zhengdaozhengdao”。49v刊名也是有效的检索途径之一,除全称外还刊名也是有效的检索途径之一,除全称外还可使用缩略语。可使用缩略语。以以”IEEE TRANSACTIONS ON SYSTEMS MAN AND IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICSCYBERNETICS”为例,除输入其全称外,在有些为例,除输入其全称外,在有些检索界面还可以输入检索界面还可以输入“IEEE T Syst Man cybIEEE T Syst Man cyb”。“Knowledge and Information Systems Knowledge and Information Systems”除输除输入全称外,还可输入入全称外,还可输入“knowlknowl infinf systsyst ”。50(2 2)拼写形式)拼写形式【例题例题】在英文数据库检索作者在英文数据库检索作者“金长青金长青”的论文,作者名除的论文,作者名除了了“Jin,ChangQingJin,ChangQing”还有其他拼写形式?还有其他拼写形式?【题解题解】Jin,ChangQing Jin,ChangQing Jin,Chang Qing Jin,Chang Qing ChangQing Jin ChangQing Jin Chang Qing Jin Chang Qing Jin Jin CQ Jin CQ CQ CQ,JinJin Jin,C.Q Jin,C.Q Jin,C.Q.Jin,C.Q.5152例:检索清华大学经济管理学院例:检索清华大学经济管理学院李稻葵李稻葵在在sci上发表的文章。上发表的文章。4 4、号码途径号码途径 常见的号码索引:常见的号码索引:ISBNISBN号、索书号、号、索书号、ISSNISSN号、专利号、入藏号、报告号、标准编号号、专利号、入藏号、报告号、标准编号常见的专用符号代码索引:常见的专用符号代码索引:元素符号、分子式、结构式等元素符号、分子式、结构式等常见的专用名词术语索引常见的专用名词术语索引地名、机构名、商品名、生物属名等地名、机构名、商品名、生物属名等 532.4 2.4 检索式的拟订检索式的拟订2.4.12.4.1布尔逻辑检索算符布尔逻辑检索算符 2.4.22.4.2位置检索算符位置检索算符2.4.32.4.3截词检索算符截词检索算符2.4.42.4.4字段揭示及限制算符字段揭示及限制算符2.4.52.4.5其它符号其它符号2.4.62.4.6注意事项注意事项54精确与模糊检索精确与模糊检索 基本技术基本技术词间位置检索词间位置检索 加权检索加权检索 布尔逻辑检布尔逻辑检索索 限定字段检索限定字段检索 限定范围检索限定范围检索 截词检索截词检索 55 1.1.逻辑逻辑 “与与”(AND)(AND),表示为,表示为 A and B A and B 或或 A*A*B B 2.2.逻辑逻辑 “或或”(OR)(OR),表示为,表示为 A or B A or B 或或 A+B A+B 3.3.逻辑逻辑 “非非”(NOT)(NOT),表示为,表示为 A not B A not B 或或 A-BA-B 2.4.1 2.4.1 布尔逻辑检索算符布尔逻辑检索算符56 逻辑逻辑“与与”用“and”、“*”或者空格表示。在网络搜索引擎中习惯用空格代替“and”。表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。ABA and B例:检索例:检索“太阳能太阳能”文献文献太阳太阳能源能源57 逻辑逻辑“或或”用“or”、“”或逗号表示。在网络搜索引擎中习惯用逗号代替“OR”。表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。ABA or B例:检索例:检索“光盘和磁盘光盘和磁盘”文献文献光盘光盘磁盘磁盘58 逻辑逻辑“非非”(NOT)(NOT)表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。ABA not B例:检索例:检索“除核能以外有关能源除核能以外有关能源”文献文献能源能源核能核能59【实例实例】输入:输入:automobile not carautomobile not car,就,就要求查询的结果中包含要求查询的结果中包含automobileautomobile(汽车)(汽车),但同时不能包含,但同时不能包含carcar(小汽车)。(小汽车)。【实例实例】在搜索引擎中输入:电视台在搜索引擎中输入:电视台-中央中央电视台,查询结果不包含电视台,查询结果不包含“中央电视台中央电视台”。60 也叫也叫“邻接检索邻接检索”,表示两个或多个检索词之间的关表示两个或多个检索词之间的关系检索方式,常用的位置算符有系检索方式,常用的位置算符有:1.w(with)1.w(with)表示两个检索词前后次序固定,二者之间只能间隔连字表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。符、空格或者是逗号。【实例实例】在在OCLCOCLC中输入中输入communication w satellitecommunication w satellite;2 2.wNwN(with N)(with N)表示两个检索词前后次序固定,二者之间最多间隔表示两个检索词前后次序固定,二者之间最多间隔N N个个字符。字符。【实例实例】在在EBSCOEBSCO中输入中输入communication w3 satellitecommunication w3 satellite;2.4.2 2.4.2 位置检索算符位置检索算符61 3.n(Near)3.n(Near)表示两个检索词可以互换顺序,表示两个检索词可以互换顺序,二者之间只能间隔连字符、空格或者是逗二者之间只能间隔连字符、空格或者是逗号。号。【实例实例】在在OCLCOCLC中输入中输入communication n communication n satellitesatellite;4.nN(Near N)4.nN(Near N)表示两个检索词可以互换表示两个检索词可以互换顺序,二者之间最多间隔顺序,二者之间最多间隔N N个字符。个字符。【实例实例】在在EBSCOEBSCO中输入中输入communication n3 communication n3 satellite;satellite;比较:在比较:在EBSCOEBSCO中输入中输入source and lawsource and law、source w2 lawsource w2 law622.4.2.4.3 3 短语检索短语检索又称精确检索又称精确检索 1.1.机构名称机构名称 如:如:The World Intellectual Property OrganizationThe World Intellectual Property Organization 2.2.人名人名 如:如:George W.WashingtonGeorge W.Washington 3.3.地名地名 如:如:San FranciscoSan Francisco 4.4.专用名称专用名称 如:如:i information retrievalnformation retrieval 中文数据库选择:精确检索中文数据库选择:精确检索 外文数据库采用:双引号外文数据库采用:双引号632.4.2.4.4 4 截词检索算符截词检索算符v检索检索colorcolorv检索检索computercomputer、microcomputermicrocomputer、minicomputerminicomputerv英语词根英语词根ologyology 截词符(通配符)截词符(通配符)提高查全率,防止提高查全率,防止漏检的有力手段,也可以简化输入,包括有限漏检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:截词和无限截词,常用的截词符有:*,?,?,#,!#,!,$64 有限截词有限截词一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用“?”(英文半角问号)代表(英文半角问号)代表0-10-1个字符。个字符。比如比如:chip?:chip?可检索出:可检索出:chipschips(右截断)(右截断)无限截词无限截词一个符号表示任意多个字符,标准符号是一个符号表示任意多个字符,标准符号是“*”,代表,代表0-n0-n个字符,也称为通配符。个字符,也称为通配符。比如比如:comput*:comput*可检出:可检出:compute,Computer,compute,Computer,computers,computing,Computerizecomputers,computing,Computerize等等.注:不同的数据库所用的截词符不一样,使用应先查一注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认下各数据库的帮助加以确认2.4.2.4.4 4 截词检索算符截词检索算符65后截断无限截断无限截断如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截断有限截断中文数据库里面中文数据库里面中文数据库里面中文数据库里面习惯称为习惯称为习惯称为习惯称为“前方前方前方前方一致一致一致一致”66中截断中截断前截断前截断如:如:如:如:m?nmanmen如:如:如:如:*computercomputercomputercomputerminicomputerminicomputercomputercomputermicrocomputermicrocomputer中文数据库里面中文数据库里面中文数据库里面中文数据库里面习惯称为习惯称为习惯称为习惯称为“后方后方后方后方一致一致一致一致”67Onelook(在线词典)例如:查找后缀为:ology686970vti=computervPy=2008vLa=englishv限定网站:site:v限定文件类型:filetype:ppt 信息检索 v限定网页:inurl:mv 怒放的生命v限定网页题名:intitle:福建泥石流2.4.2.4.5 5 字段限制检索字段限制检索71722.4.2.4.6 6 其它符号其它符号1 1括号括号 括在其中的操作符先起作用。括在其中的操作符先起作用。三聚氰胺三聚氰胺*(农产品农产品 +鸡蛋鸡蛋+牛奶牛奶 +大米大米)2 2个别数据库使用的特殊符号个别数据库使用的特殊符号 某些搜索引擎使用加号(某些搜索引擎使用加号(+)表示该单词必须出现。)表示该单词必须出现。在某些搜索引擎中输入在某些搜索引擎中输入“+电脑电脑+电话电话+传真传真”就表示要查找的内容必就表示要查找的内容必须要同时包含须要同时包含“电脑、电话、传真电脑、电话、传真”这三个关键词。这三个关键词。个别数据库例如个别数据库例如“国研网国研网”、山东标准网使用、山东标准网使用“&”代替代替“andand”;欧;欧洲专利局光盘数据库的洲专利局光盘数据库的“withoutwithout”、美国专利商标局数据库的、美国专利商标局数据库的“andnotandnot”就是通用的就是通用的“notnot”。7374思考:比较3个检索式检索结果的不同v“Information retrieval”/Ti vInformation AND retrieval/Ti vInformation n retrieval/Tiv不仅要求在题名字段中不仅要求在- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 信息 检索 方法
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文