信管专业信息计量学考试复习整理资料.doc
《信管专业信息计量学考试复习整理资料.doc》由会员分享,可在线阅读,更多相关《信管专业信息计量学考试复习整理资料.doc(9页珍藏版)》请在咨信网上搜索。
1、第一章1、什么是信息计量学(Informetrics)?P17采用定量方法来描述和研究信息的现象、过程、规律的一门学科。它是数学和统计学与情报学广泛结合而形成的情报学的一个新兴的定量性分支学科。广义:主要研究以广义信息论为基础的广义信息的计量问题,其内容非常广泛。狭义:主要研究情报信息(或文献信息)的计量问题。其主要内容是应用数学、统计学等定量的方法来分析和处理信息过程中的种种矛盾;从定量的角度来分析和研究信息的动态特征并找出其内在规律。2、信息计量学的研究内容P19其内容体系一般由理论、方法和应用三个部分构成,具体来说,其内容体系主要包括以下七个方面:(1)信息计量学若干基本问题的探讨,包括
2、信息概念的数学描述,学科研究的对象、内容、范围与相关学科的关系以及学科的形成与发展。(2)信息的基本测度,建立“信息量”等一整套测度指标,确定信息计量的准绳;关于比特、知识单元、信息场、信息势等计量概念的讨论。(3)几个基本定律的研究,包括布拉德夫定律、齐普夫定律、洛特卡定律等。(4)信息流模型的研究,如文献增长、老化、离散、引文分析等模型的建立与评价。(5)信息计量化方法的探讨,如等级排序方法、对数透视原理及方法以及模糊数学、信息论、集合论等的应用,情报利用和效益的定量评价等。(6)信息计量方法和工具的自动化实现方面的研究,如聚类,相关分析,引文数据库,计量信息管理系统以及词频统计等的计算机
3、实现问题。(7)在图书情报工作、信息资源管理、信息检索、信息分析与预测、科学学与科学评价等领域的应用。3、信息计量的方法P26信息计量的方法体系主要由统计分析法、数学模型分析法、引文分析法、词频分析法、共现分析法、聚类分析法和计算机辅助信息计量分析法等方法组成。具体介绍如下:1) 统计分析法:统计分析法是利用统计、概率的原理对关系中各属性进行统计分析, 从而找出它们之间关系和规律的一种方法。2) 数学模型分析法:数学模型是用某种数学语言描述系统的结构和行为而构造出来的,它除了从宏观的角度模拟出系统的结构和运动规律外,主要是从微观上、从量的方面描述出系统的结构,联系以及运动规律。3) 引文分析法
4、:利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法。4) 计算机辅助信息计量分析方法:计算机辅助信息计量研究在理论分析的基础上,着重进行了计算机辅助计量软件的设计与开发工作,实现了套录资料重组建库以及多种资料统计分析功能。4、信息计量学与文献计量学的关系P31【论述】科学学的研究表明:科学具有统一性。按照科学学的统一性原则,科学领域里德每一个学科都或多或少、或远或近的与其他学科相关联。从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此交叉渗透,既有着许多共同的
5、研究内容,又有着不尽相同的地方。(1)计量对象的差异。信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为计量对象(有时也涉及文献情报)。(2)研究范围的差异。信息计量学较之文献计量学来说,其研究范围更广泛一些。因为除了文献信息之外,还存在着其他形式的信息,如在情报领域出现的“零次信息”概念,即是指无载体的或处于非正式交流过程中的信息。毫无疑问,文献信息是整个科学情报的主体,因此,文献计量学研究的进展,也是对信息计量学的贡献和促进。(3)任务和方法的差异。信息计量学研究的任务更为艰巨,更难找到恰当的定量方法及途径。因为信息这种社会现象,具有明显的主观性、模糊性,必须
6、找到适合信息特征的新的计量化方法和途径。5、信息计量学和科学计量学的关系P32【论述】 两者既有联系又有区别。联系:(1)从研究目的来看,科学计量学主要是从定量的角度来探讨科学发展的内在规律,最终促进科学技术的进步。而信息计量学得研究目的也在于:探明科学文献本身的规律,以提高信息管理的科学性通过信息规律的探讨,进而揭示科学技术的规律性。可见,二者都把科学发展的特性和规律作为自己研究的基本任务之一。 (2)从研究对象和方法来看,两者极为相似。科学计量学研究的科学文献及其数量,也是信息计量学的研究对象之一。在方法上,两者都要运用数学和统计学的定量方法,对科学文献信息进行定量的分析研究。在研究内容上
7、,二者在一个相当大的范围内是彼此交叉的。区别:(1)信息计量学的范围要比科学计量学的范围广很多。科学计量学仍然局限在科学文献及其数量和非正式科学交流的消息等,而“狭义信息计量学”除了科学计量学的内容外还包括正式交流的事物信息,至于“广义信息计量学”则还包括作为过程的信息和作为知识的信息。(2)研究目的不同。信息计量学研究的目的是“研究并验证科学的产生、传播和利用的量的规律性”,目的较科学计量学来说更加广泛。(3)应用领域有所不同。信息计量学在文献、人才、学科、单位、数据评价方面发挥了很大的作用,涉及面非常广泛;而科学计量学在科学机制和科技政策的制定方面发挥了非常重要和独特的作用。6、信息计量学
8、主要进展P9每年发表的文献量增长较快,并逐步形成了本学科的核心情报源;确立并提高了学科的地位;主要分支领域的研究取得重要成果;文献计量工具和手段的现代化取得重要进展;专业教育起步快,发展迅速;形成了一支骨干队伍(核心研究队伍已基本形成);国际交流与合作发展势头良好。第二章 文献信息增长规律1、什么是文献信息流?P36文献所含信息的汇流。文献信息流是具有一系列主体特征的科学文献的集合,所以有时将文献信息流简称为文献流。2、文献信息流的特征。P36静态特征:在一定时间内科学文献在空间的分布性质,如集中-离散分布、文献按著者分布、引文分布、主题相关分布等的规律性。动态特征:科学文献随时间的延续而增长
9、和老化的性质。科学文献既增长又老化,在增长之中不断老化,在老化之中不断增长。增长是文献信息流的主要趋势。第三章 文献信息老化规律1、什么是文献老化?P69一般来说,“老化”问题包括文献老化和情报老化。科学文献老化指科学文献随其“年龄的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。它既是一种客观的社会现象,又是一个复杂的动态过程。2、老化的度量指标P71(1)半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期)。这与该学科一半文献失效所经历的时间(历时半衰期)大体相当。半衰期越短,文献老化速度越快。半衰期适用性:共时半衰
10、期通常是评价某一学科领域或专业文献的老化趋势,而不是指个别文献;而历时半衰期,可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇文献老化的半衰期。(2)普赖斯指数:就是在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当做指数,用以量度文献的老化速度和程度。普赖斯指数越大,文献老化速度越快。其计算公式为:Pr(普赖斯指数)= (出版年限不超过5年的被引文献数量 / 被引文献总量)*100%第四章 文献信息集中与离散分布规律布拉德福定律1、布拉德福定律的基本内容区域描述:如果将科学期刊按其登在某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的
11、核心区和包含着与核心区同等数量论文的几个区。这时,核心期刊与相继各区的期刊数量成1:a:a2的关系。图像描述(P107分散曲线)如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数R(n)为纵坐标进行图像描述,便可得到一条曲线。叫做布拉德福分散曲线。2、格鲁斯下垂布拉德福曲线在进入直线部分后,并非无休止的直伸下去,后来总要弯曲下垂,因而使得布拉德福的图形变为明显的三个部分:上升的曲线部分直线部分弯曲下垂部分。因为期刊数和文献量统计不足,未能代表全部文献。3、布氏分布理论基本内容是研究科学论文在其看中的分布规律及其应用,主要包括:一个定律、十来个经验公式、四个数学模型。核心内
12、容:布拉德福分散定律。两要点:等级排列,形成主体来源(期刊)的有序目录确定相关论文在主体来源中的分布规律。方法:区域分析法 图像分析法经验公式:布鲁克斯提出的直线分布公式和由两部分组成的数学表达式;肯德尔的“布拉德福-齐普夫定律”的一般公式;莱姆库勒的所谓规范化公式;斯马里科夫的统一方程等。模型:西蒙的随机模型、布鲁克斯的混合泊松分布模型、纳兰南的序性流模型、阿拉麦斯库的科学势扩散模型。第五章文献信息词频分布规律齐普夫定律1、理论基础:最省力法则。每一个人在日常生活中都必定要在他所处的环境里进行一定程度的运动,不管属于哪种类型,都是在一定的道路上进行的,而且都将受一个简单的基本法则的制约,千方
13、百计地选择一条最省力的途径。2、基本内容P139(1)文字描述:在任何一篇文章中,词的出现频率都服从如下规律:如果把一篇较长文章(约5000字)中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,频次最小的词等级为D。若用Fr表示频次,r表示等级序号,则有: Fr*r = C ,称为齐普夫定律的绝对频数表示法或频次表示法式中C为常数。但这里的常数并不是绝对不变的恒量,而是围绕一个中心数值上下波动。齐普夫定律不仅可以用词的绝对频数(频次)表示,而且也可以用此的相对频数(频率)表示:令N为文章所包含的词汇
14、总数(词容量),fr为第r级词的相对频率,则有fr = cr-1 ,称为齐普夫定律的相对频数表示法或频率表示法。其中,c仍为常量,且c=C/N,而fr=Fr/N。齐普夫运用其“最省力法则”解释了这个定律。认为,在任何语言中,凡是使用频率高的词,功能总是不会太大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就不大,所以,词的出现频率与等级序号的乘积基本上稳定于一个常数。(2)图像描述P140齐普夫分布曲线:根据文献中出现的词频与等级序号的统计数据,建立Fr与r的直角坐标系,用横坐标表示词的等级序号r,纵坐标表示相应的频次Fr,就可以得到一条双曲线,齐普夫分布对数曲线:如果等级序号r
15、与频次Fr都取对数坐标,则图像就变成一条直线了,即齐普夫分布对数曲线。第六章 文献信息作者分布规律洛特卡定律1、基本内容文字描述:写n篇文章的作者数是生产1篇文章作者数的1/n2;且生产1篇文章的作者数的全体作者的60%左右。可表述为:y(x) = y(1)/x2 y(1)为写1篇文章的作者数,y(x)为写x篇文章的作者数。图像描述:P1682、科学生产率:个体科研人员在一定时期内所撰写的论文数量。通过这一概念的引入来测量科研人员撰写科学文献的能力。第八章 文献信息统计分析法1、文献信息统计的原则要求(1)针对性 对不同的具体统计项目应有不同的要求(2)准确性 数据和结果的准确性是文献信息统计
16、的核心要求(3)代表性 抽样统计的代表性较强的样本(4)可比性 分析数据常用比较方法,设置文献指标和统计数据时,注意数据的可比性(5)累积性 在文献信息统计研究中,利用文献的累积数来说明问题2、基本步骤P266 看具体的例子(1)统计调查 统计搜集研究对象的原始数据和第一手资料。 a.确定具体方法 b.选准统计工具 c.明确指标项目 d.统计原始数据(2)统计整理,亦称统计汇总,即对原始数据资料进行分门别类的加工整理。 a.计算 b.排序c.表示(3)统计分析 关键步骤,包括统计数据的结论分析和误差分析。 a.理论指导下的分析 b.数值分析 c.图像分析第十章 引文分析法1、什么是引文分析?利
17、用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。2、引文分析基本步骤:选取统计对象:根据所要研究的学科的具体情况,选择该学科中有代表性的较权威的杂志,确定若干期或若干篇相关论文作为统计的对象。统计引文数据:在所选的若干篇论文中,分项统计每篇论文后面引文的数量,引文的出版年代,语种,类型,论文作者的自引量等。引文分析:在获取的引文数据的基础上,根据研究的目的,从引文的各种指标或其他不同的角度进行分析。作出结论:根据引文分析原理和其他一般原则进行判断和预测,从而作出相应的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 专业 信息 计量学 考试 复习 整理 资料
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。