网络信息资源检索.ppt
《网络信息资源检索.ppt》由会员分享,可在线阅读,更多相关《网络信息资源检索.ppt(105页珍藏版)》请在咨信网上搜索。
1、第三章第三章 网络信息资源检索网络信息资源检索1可编辑版网络社会网络社会 在现在的网络信息环境下,网络信息资源是我们学习、在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是源的利用是终身学习终身学习终身学习终身学习的需要,也是个人信息素养中的重要的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其用,其对人的影响更为深远对人的影响更为深远对人的影响更为深远对人的影响更为深远。所以在章中不仅仅介绍网络信息
2、资源及其利用,还对所以在章中不仅仅介绍网络信息资源及其利用,还对网络融入生活、网络融入学习等方面的内容做了介绍。网络融入生活、网络融入学习等方面的内容做了介绍。2可编辑版本本章章内内容容3.1 网络信息资源概述网络信息资源概述3.2 搜索引擎搜索引擎3.3 网络开放存取资源网络开放存取资源3可编辑版3.1 网络信息资源概述3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点3.1.2 3.1.2 网络信息资源的类型网络信息资源的类型3.1.3 3.1.3 网络信息检索的一般方法网络信息检索的一般方法4可编辑版3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点1.1.概念:概念
3、:网络信息资源网络信息资源网络信息资源网络信息资源是指信息资源以电子数据的形式是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和在计算机等终端上再现的信息的总和。5可编辑版3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点 2.2.特点:特点:(1 1)内容角度:数据海量)内容角度:数据海量 类型多样类型多样 更新高频化更新高频化 (2 2)形式角度:数字化存储、传递)形式角度:数字化存储、传递 动态性动态性 开放性开放性 (3 3)效用角度:共享性)效用角度:共享性 时效性时效性 交互
4、性交互性6可编辑版3.1.2 3.1.2 网络信息资源的类型网络信息资源的类型(1 1)按照信息交流的方式划分:)按照信息交流的方式划分:正式出版正式出版 半正式出版半正式出版 非正式出版非正式出版(2 2)按照信息格式划分:)按照信息格式划分:网络文献格式有网络文献格式有HTMLHTML、TXTTXT、DOCDOC、PDFPDF、RMRM、MP3MP3等等。等等。7可编辑版(3 3)按)按信息内容的表现形式和内容划分信息内容的表现形式和内容划分可分为可分为全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的
5、各类教材,政府出版物,标准全文型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;等;事实型信息:天气预报,节目预告,火车车次,飞机航班,城市事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、或景点介绍,工程实况、IPIP地址等;地址等;实时型信息资源:各类投资行情和分析、娱乐、聊天、网络新闻实时型信息资源:各类投资行情和分析、娱乐、聊天、网络新闻组讨论、组讨论、BBSBBS、网上购物等。、网上购物等。数值型信息:主要是指各种统计数据;数值型信息:主要是指各种统计数据;其它型信息资源是指图片、动画、音乐、影视、广告等。其它型信息资源是指图片、动画、音乐、影视
6、、广告等。3.1.2 网络信息资源的类型网络信息资源的类型8可编辑版(4 4)按所采用的网络传输协议可分为按所采用的网络传输协议可分为WWWWWW网络资源:因特网信息资源的主流,它使用网络资源:因特网信息资源的主流,它使用httphttp协议,使协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。处的文字、图象、声音和多媒体超文本信息。FTPFTP信息资源:它使用信息资源:它使用ftpftp协议,该协议主要用于连网计算机之协议,该协议主要用于连网计算机之间传输文件。间传输文件。FTPFTP相当于
7、在网络上两个主机之间复制文件。目相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。前仍是发布、传递软件和长文件的主要方法。TELNETTELNET信息资源:信息资源:telnettelnet是远程登陆协议。是远程登陆协议。telnettelnet信息资源包信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。统等。用户服务组资源:包括新闻组,电子邮件组等。这些电子通信用户服务组资源:包括新闻组,电子
8、邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。放性的资源。4.1.2 网络信息资源的类型网络信息资源的类型9可编辑版建院FTP10可编辑版11可编辑版http:/ 3.1.3 网络信息检索的一般方法网络信息检索的一般方法1.1.漫游法(浏览式检索)漫游法(浏览式检索)所见即所得,通过网页链接,顺着链接浏览。包括所见即所得,通过网页链接,顺着链接浏览。包括偶然发现、顺偶然发现、顺“链链”而行、网址查询。而行、网址查询。2.2.网络资源指南法网络资源指南法 指通过网络资源指南来查找信息网络资源目录式搜指通过
9、网络资源指南来查找信息网络资源目录式搜索引擎,或网络资源目录。索引擎,或网络资源目录。3.3.搜索引擎法搜索引擎法 通过搜索引擎进行文献查询,是最常用的信息查询通过搜索引擎进行文献查询,是最常用的信息查询的方法,通过输入一定的关键词进行关联检索。的方法,通过输入一定的关键词进行关联检索。18可编辑版浏览式检索浏览式检索19可编辑版网络地址法网络地址法此处输入网址此处输入网址如:如:20可编辑版搜索引擎法搜索引擎法21可编辑版3.2 3.2 搜索引擎搜索引擎3.2.1 3.2.1 搜索引擎概述搜索引擎概述3.2.2 3.2.2 搜索引擎的使用技巧搜索引擎的使用技巧3.2.3 3.2.3 综合性搜
10、索引擎综合性搜索引擎3.2.4 3.2.4 专业性搜索引擎专业性搜索引擎22可编辑版1.搜索引擎的发展搜索引擎的发展搜索引擎搜索引擎 是指根据一定的策略、运用特定的计算是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。和处理后,为用户提供检索服务的系统。从使用者的角度看,搜索引擎提供一个包含搜索从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的给搜索引擎后,搜索引擎就会返回跟
11、用户输入的内容相关的信息列表。内容相关的信息列表。3.2.1 3.2.1 搜索引擎概述搜索引擎概述23可编辑版【搜索引擎的起源】19901990年,加拿大麦吉尔大学计算机学院的师生开发出年,加拿大麦吉尔大学计算机学院的师生开发出ArchieArchie。当时,万维网还没有出现,人们通过。当时,万维网还没有出现,人们通过FTPFTP来共享来共享交流资源。交流资源。ArchieArchie能定期搜集并分析能定期搜集并分析FTPFTP服务器上的文件服务器上的文件名信息,提供查找分别在各个名信息,提供查找分别在各个FTPFTP主机中的文件。用户必主机中的文件。用户必须输入精确的文件名进行搜索,须输入精
12、确的文件名进行搜索,ArchieArchie告诉用户哪个告诉用户哪个FTPFTP服务器能下载该文件。虽然服务器能下载该文件。虽然ArchieArchie搜集的信息资源不是网搜集的信息资源不是网页(页(HTMLHTML文件),但和搜索引擎的基本工作方式是一样文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,的:自动搜集信息资源、建立索引、提供检索服务。所以,ArchieArchie被公认为现代搜索引擎的鼻祖。被公认为现代搜索引擎的鼻祖。24可编辑版2.2.搜索引擎的分类搜索引擎的分类按信息搜集方法和服务提供方式按信息搜集方法和服务提供方式目录搜索引擎(如
13、雅虎、搜狐)目录搜索引擎(如雅虎、搜狐)全文搜索引擎(如全文搜索引擎(如GoogleGoogle、百度)、百度)元搜索引擎(如搜魅网)元搜索引擎(如搜魅网)25可编辑版(1 1)目录索引引擎)目录索引引擎以人工方式或半自动方式搜索信息,由编辑员查看信息后,以人工方式或半自动方式搜索信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中,人工形成信息摘要,并将信息置于事先确定的分类框架中,提供按目录分类的网站链接列表。提供按目录分类的网站链接列表。优点:信息准确、导航质量高。优点:信息准确、导航质量高。缺点:人工介入、维护量大、信息更新不及时。缺点:人工介入、维护量大、信息
14、更新不及时。目录索引虽然有搜索功能,但严格意义目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,可以按照分类目录找到所需要的信息,不依靠关键词(不依靠关键词(KeywordsKeywords)进行查询。)进行查询。目录索引中最具代表性的莫过于大名鼎目录索引中最具代表性的莫过于大名鼎鼎的鼎的YahooYahoo、新浪分类目录搜索。、新浪分类目录搜索。26可编辑版雅虎的分类目录雅虎的分类目录27可编辑版新浪分类目录28可编辑版 (2 2)全文搜索
15、引擎)全文搜索引擎通过从互联网上提取各个网站的信息,建立数据库,从中通过从互联网上提取各个网站的信息,建立数据库,从中检索与用户查询条件匹配的相关记录,然后按一定的排列检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。顺序将结果返回给用户。优点:信息量大、更新及时。优点:信息量大、更新及时。缺点:返回信息过多,有很多无关信息,必须从结果中进缺点:返回信息过多,有很多无关信息,必须从结果中进行筛选行筛选。29可编辑版 全文搜索引擎是名副其实的搜索引擎,国外代表有全文搜索引擎是名副其实的搜索引擎,国外代表有GoogleGoogle,国内则有著名的百度。它们从互联网提取各,国内
16、则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,俗称两类,一类拥有自己的检索程序,俗称“蜘蛛蜘蛛”程序程序或或“机器人机器人”程序,能自建网页数据库,搜索结果直程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的接从自身的数据库中调用,上面提到的GoogleGoogl
17、e和百度和百度就属于此类;另一类则是租用其他搜索引擎的数据库,就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如并按自定的格式排列搜索结果,如LycosLycos搜索引擎。搜索引擎。30可编辑版(3 3)元搜索引擎)元搜索引擎元搜索引擎(元搜索引擎(matesearchmatesearch)又称集合型搜索引擎,将多个单)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。有的索提问一次搜索多个搜索引擎,并将结果返回给用户。有的直接按来源引擎
18、排列搜索结果,如直接按来源引擎排列搜索结果,如DogpileDogpile,有的则按自定,有的则按自定的规则将结果重新排列组合。的规则将结果重新排列组合。优点:能同时搜索多个搜索引擎,能在一定程度上提高查询优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。的广度。缺点:因为有时候并不能对一个搜索引擎全部查完,有时后缺点:因为有时候并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。也会漏掉一些重要信息。31可编辑版搜魅网搜魅网http:/ 最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,
19、而且让搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。用户需要不停的两边拖拉才能看到完整的结果。“百谷虎百谷虎”-”-由于某家新闻媒体的报道,最近声名大振,高举着由于某家新闻媒体的报道,最近声名大振,高举着“山寨山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。实际使用价值。36可编辑版37可编辑版搜索引擎为什么没有收录我的网站?搜索引擎为什么没有收录我的网站?网站没有被收录主要有几方面
20、的原因:网站没有被收录主要有几方面的原因:1 1、网站的设计上存在问题;、网站的设计上存在问题;2 2、上线时间较短,搜索引擎还没有来的及收录;、上线时间较短,搜索引擎还没有来的及收录;3 3、网站因某种原因被搜索引擎惩罚。、网站因某种原因被搜索引擎惩罚。38可编辑版3.2.23.2.2搜索引擎的使用技巧搜索引擎的使用技巧1.选择合适的搜索引擎选择合适的搜索引擎2.选用准确的关键词选用准确的关键词3.使用高级搜索使用高级搜索4.检索结果的处理检索结果的处理 (只阅读搜索结果的前几条信息、缩小搜索范围、搜只阅读搜索结果的前几条信息、缩小搜索范围、搜索不到网页时要检查拼,查看关键词是否矛盾等、仍索
21、不到网页时要检查拼,查看关键词是否矛盾等、仍找不到可以链接相近的网页。找不到可以链接相近的网页。)39可编辑版搜索引擎高级检索功能搜索引擎高级检索功能高级检索命令:高级检索命令:(1 1)将搜索范围限定在网页标题中)将搜索范围限定在网页标题中 intitle:intitle:(2 2)将搜索范围限定在特定站点中)将搜索范围限定在特定站点中 site:site:(3 3)将搜索范围限定在)将搜索范围限定在URLURL链接中链接中 inurl:inurl:(4 4)将搜索范围限定在网页部分中)将搜索范围限定在网页部分中 intext:intext:(5 5)限定搜索的文献类型)限定搜索的文献类型
22、filetype:filetype:40可编辑版intitle:intitle:举例举例相关结果约相关结果约5,550,000 相关结果约相关结果约152,000个个 41可编辑版site:site:举例举例仅一条仅一条相关结果约相关结果约2,500,000个个 相关结果约相关结果约23,500,000 42可编辑版Inurl:Inurl:举例举例URLURL统一资源定位符统一资源定位符也被称为网页地址。也被称为网页地址。URLURL由三部分组成:协议由三部分组成:协议类型,主机名和路径及类型,主机名和路径及文件名。文件名。43可编辑版filetype:filetype:举例举例44可编辑版3
23、.2.3 3.2.3 综合性搜索引擎综合性搜索引擎 http:/ Google46可编辑版谷歌谷歌 Google GoogleGoogle成立的第一步始于成立的第一步始于 Google 创始人创始人 Larry Page 和和 Sergey Brin 在斯坦福大学的学生宿舍内共在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。的信息搜索者。Google 目前被公认为全球规模最大的目前被公认为全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到相关的搜
24、索结果。在瞬间得到相关的搜索结果。47可编辑版谷歌谷歌 GoogleGoogleGoogle公司选用公司选用“Google”“Google”一词用来代表在互联网上可以获一词用来代表在互联网上可以获得的海量的资源。得的海量的资源。“Google”“Google”一词源于单词一词源于单词“Googol”“Googol”,据说是因拼错而产生的。据说是因拼错而产生的。“Googol“Googol 指的是指的是1010的的100100次幂,次幂,写出的形式为数字写出的形式为数字1 1后跟后跟100100个零。个零。GoogleGoogle公司采用这个词显公司采用这个词显示了公司想征服网上无穷无尽资料的雄
25、心。示了公司想征服网上无穷无尽资料的雄心。GoogleGoogle公司没有公司没有采用采用GoogolGoogol可能是因为版权的问题,而且当他们注册可能是因为版权的问题,而且当他们注册GG的时候,的时候,GG已经被注册。已经被注册。Google Google词义词义的另一种解释:的另一种解释:G G意义为手,意义为手,OOOO为多个范围,为多个范围,L L意为长,意为长,E E意意为出,把它们合一起,意义为:我们为出,把它们合一起,意义为:我们GOOGLEGOOGLE无论在哪里都能无论在哪里都能为您找出很长的一大堆您想要的。为您找出很长的一大堆您想要的。48可编辑版谷歌谷歌 Google(高
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息资源 检索
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。