基于基金项目的学科交叉热点主题识别与分类研究——以美国农业与食品领域为例.pdf
《基于基金项目的学科交叉热点主题识别与分类研究——以美国农业与食品领域为例.pdf》由会员分享,可在线阅读,更多相关《基于基金项目的学科交叉热点主题识别与分类研究——以美国农业与食品领域为例.pdf(11页珍藏版)》请在咨信网上搜索。
1、情报分析基于基金项目的学科交叉热点主题识别与分类研究*以美国农业与食品领域为例齐世杰12 赵静娟郑建华2 串丽敏(1.北京市农林科学院数据科学与农业经济研究所,北京10 0 0 9 7;2.中国农业科学院农业信息研究所国家新闻出版署农业融合出版知识挖掘与知识服务重点实验室,北京10 0 0 8 1摘要:学科交叉是原始创新成果之源,科学基金是引导原始创新的重要途径。准确识别由基金资助的学科交叉热点方向,把握交叉主题的研究趋势,为我国重大科技创新、前瞻部署提供参考。基于基金项目数据,利用Salton指数和共现分析,识别基金项目中的学科交叉热点主题,通过切分时间窗口构建“支持趋势一交又趋势”战略坐标
2、图,将学科/主题定位为前沿型、潜力型、衰退型和热点型,以美国农业与食品领域为例验证方法的有效性。结果显示:美国农业基金项目的学科交叉趋势日益显著,学科和主题均以前沿型和潜力型居多,涉及基因组学和遗传学、土壤改良与治理、综合虫害管理、动植物育种等方面,以食品加工技术、食物保护、动物营养利用等为代表的研究主题的交叉融合表现活跃。未来,应提高交叉突破创新意识,借助战略坐标图定位,分类布局面向国家需求的重点领域关键技术创新方向。关键词:农业与食品;美国;学科交叉;主题识别;趋势战略坐标中图分类号:G353.1DOI:10.3772/j.issn.1673-2286.2023.10.004引文格式:齐世
3、杰,赵静娟,郑建华,等基于基金项目的学科交叉热点主题识别与分类研究:以美国农业与食品领域为例 J.数字图书馆论坛,2 0 2 3(10):2 9-39.近年来,国内外科学界一直倡导学科交又研究(In-terdisciplinaryResearch,I D R),促进新兴交叉学科发展。学科交叉研究,也称跨学科研究,是一种新的科学研究范式,是交叉关联与渗透融合多学科领域的研究。学科交叉研究是知识创新的重要方法,不仅能够催生重大科学成果产生,也是解决当今社会发展中复杂问题的重要途径 2-3。世界各国已将资助学科交叉研究提升到国家科技战略层面,如美国国家科学基金会的“发展融合研究计划”、欧盟的“未来新
4、兴技术计划”,以及英国设立的面向农业/粮食安全等全球挑战的重大基金收稿日期:2 0 2 3-0 7-12*本研究得到北京市农林科学院创新专项“智库型农业情报研究与服务能力提升”(编号:KJCX20230208)“基于多源数据融合的农业热点前沿主题识别与实证研究”(编号:KJCX20200403)、“面向科研管理的情报研究与服务能力提升”(编号:KJCX20230210)和国家新闻出版署农业融合出版知识挖掘与知识服务项目“基于学科交叉的新兴主题识别方法与实证研究”(编号:2 0 2 2 KMKS02)资助。2023年第19 卷第10 期项目,均将跨学科研究视为重要支持对象 4。据统计,2006一
5、2 0 13年美国国家科学基金会共投入了6 亿美元来资助合成生物学学科交又研究。2 0 2 0 年,我国国家自然科学基金委设立交叉科学部,以促进对复杂科学技术问题的协同攻关,寻求科技突破口。2 0 2 1年习总书记提出推动“新农科”建设,这是面向科技创新、产业升级需求的学科融合发展理念。在新时代发展要求下,交又融合研究势必成为科技创新的重要驱动力量。学科交叉主题识别是学科交叉研究的重要内容,学者大多基于论文或专利数据识别学科交叉主题,而29数孚图书馆论坛DigitalLibraryFor针对基金项目的研究较少。政府基金是基础科学研究的重要支撑,世界领先创新型国家重要科研基金资助项目具有前瞻性、
6、先导性和战略性,相较于论文和专利,基金项目能够更早地反映特定领域函待解决的科学问题和新技术 5-7 。基于基金项目的科学大数据,准确识别研究领域的学科交叉热点主题,有助于掌握研究领域的交又前沿与态势,对我国科技战略预先部署和提速发展具有客观参考意义 8 。因此,基于基金项目的学科交又主题识别无论是对于科技领域还是情报领域,均具有重要的探索价值。农业是立国之本,强国之基。党的十八大以来,从深入实施藏粮于地、藏粮于技战略,到大力推进种源等农业关键核心技术攻关,农业科技创新带动农业高质量发展 9 。党的二十大提出建设农业强国,纵观全球,农业强国必是农业科技创新强国。因此,提升农业科技创新能力,加强对
7、前沿热点、关键环节和卡点瓶颈的科技攻关势在必行。本文以美国农业与食品领域的基金项目为例,对基金项目学科和重点研究主题进行计量分析,基于学科交又测度和共现分析,识别学科交叉热点主题,通过构建“支持趋势-交又趋势”战略坐标图,判别基金项目中学科和研究主题的分类和研究趋势,以期为相关领域的研究者提供参考与借鉴,1相关研究通过学科交叉主题识别可发现学科交叉向多样化、深层次发展过程中形成的交叉与汇聚点,能够分析研究领域在哪些研究方向上产生了交叉现象。关于学科交叉主题识别已有大量研究,交又主题识别过程大致包括3个部分:对文献或主题进行学科交又特征测度,根据数据的共词特征、引文特征或网络结构特征提取表征交叉
8、主题的词汇,通过设置阈值识别交又主题 10 。其中,提取主题词是主题识别的关键步骤,主题词的准确性和可靠性能够直接影响主题识别的效果。根据提取方法和原理,学科交又主题识别方法大致分为以下几种。基于共现分析的方法,其原理是基于共同出现的词语进行主题识别,是反映文本学科主题的最直接、便捷的方法。例如,隗玲等 基于弱共现关系理论和突发词监测,将论文中具有弱共现关系的高频词作为主题词,识别情报领域的高交又性主题。Dong等 12 1以图情学论文为对象,综合利用共现网络、突发词监测等方法,将高频关键词聚类,对学科交叉302023年第19 卷第10 期主题进行分析与识别。基于社会网络的识别方法,通常以关键
9、词为分析单元,结合聚类分析、多维尺度分析等展开研究。例如,李长玲等 13-14 基于论文关键词,通过重叠社区发现方法构建知识聚类和重叠社群网络,识别情报学和计算机学科的交叉主题。基于主题模型的识别方法,该方法综合考虑了文本语法、语义信息,能够在大规模语料中抽取主题词并获取主题词出现的概率,但算法需要人工设置阈值,可解释性欠佳,有学者对此进行改进。例如,陈琼等 15 以医学信息领域论文的题目、摘要和关键词为语料,结合LDA(La t e n tDirichletAllocation)主题模型与Div指标对学科交叉主题进行识别和划分。阮光册等 16 通过构建关键词共现网络,结合聚类分析和LDA主题
10、模型,识别情报学和教育学两个学科的交叉主题。张振青等 17 针对农业领域论文,利用改进的Phrase LDA主题模型从抽取的频繁短语中挖掘重要短语作为主题词,提高了语义的丰富性和主题的一致性,且模型不需要设置绝对阈值。基于引文分析的识别方法,利用文献的引用关系或引用内容来识别交又主题,往往具有一定时滞性,应用较少。例如,Chi等 18 对文献共被引网络进行聚类,抽取学科交又集群中高被引文献的主题词作为学科交又主题。可以看出,目前的学科交又主题识别方法多以论文或专利文本中的题目、摘要或关键词表征主题词,主题词来源较为单一。综上,已有研究大多以论文或专利数据为研究对象,论文或专利数据与基金数据相比
11、具有一定的时滞性,前瞻性较弱;从方法上看,主题词的提取方法较为丰富,学者通过算法从原始文档中提取能够表征交又主题的词汇,提取方法对算法依赖性强,且需要人工设置阈值,标准和规则具有主观性,所得词汇准确性和合理性不易评判,解释性不强。此外,大多数研究止于对学科交又主题的提取,缺乏后续进一步的研究,如交又主题的发展趋势、领域中交叉主题的分类定位研究等。本文以美国食品与农业研究院(NationalInstituteof Food andAgriculture,NI FA)基金项目为对象,先利用共现分析和Salton指数定量测度学科交又组合,再基于基金项目自带主题类别字段识别学科交叉领域的热点主题,进一
12、步构建“支持趋势-交又趋势”战略坐标图,将学科主题归为前沿型、潜力型、衰退型、热点型4类,从而定量刻画NIFA项目中学科主题的交叉趋势,多维度展示交叉主题在领域中的“生态位”,为基于基金项目的学科交又主题识别和多维度分析提供新思路。该方齐世杰,赵静娟,郑建华,等基于基金项目的学科交叉热点主题识别与分类研究一以美国农业与食品领域为例法可拓展至其他学科领域,所得结果也可为我国农业项目规划、科研管理、科技创新提供一定的参考。2研究方法2.1学科共现分析共现分析的基本思想是共同出现的特征项间存在着某种关联,关联程度可用共现频次测度 19 。通常情况下基金项目标注2 个及以上的学科类别,反映了这些学科之
13、间存在一定的关联性。刘扬等 2 0 针对国家自然科学基金申请代码,采用语义相似度和共现分析,计算出一级学科之间的交叉程度并可视化展示。通过对基金项目进行学科共现分析,能够量化不同学科间的关联强度,分析学科之间的交又融合状态,通过可视化则可以直观、清晰展示数据之间的关系和状态。采取以下步骤:首先提取基金项目的学科类别,统计共现关系的强度,即共现频次,通过设定阈值(设为2),生成共现矩阵,其次根据共现矩阵绘制共现网络,最后调用Python程序包进行学科共现可视化,更直观地展示学科交又融合关系,便于读者理解与深入分析。2.2学科交叉度测算测算学科交叉度是量化学科交叉程度的重要手段,是识别学科交又主题
14、的基础。先通过学科交又度测算筛选高交又性学科组,再根据项目信息的映射发现交又热点主题。对于学科交叉度已有较多成熟的测算指标,测算维度主要包括学科多样性、学科平衡性和学科差异性。国内外学者相继提出了跨领域引用指数(COC)21、布里渊指数 2 2 、Salton指数 2 3、信息熵指数 2 4、学科集成化指数 2 5 、Rao-Stirling指标 2 、Div指标和TrueDiversity指标 2 7 等测算指标,也有学者围绕学科多样性、学科平衡性、学科差异性等维度构建了学科交又测度框架 2 8 ,不同指标各有优劣。根据基金数据特性,研究领域中各个资助项目的学科多样性和学科平衡性区分度较小,
15、而Salton指数在表征多样性和差异性方面比较灵敏 2 9 ,更适用于NIFA基金数据测度。Hamers等 30 在研究中验证了Salton指数在测度学科差异性方面的有效性,因此借鉴Salton指数测算基金项目的学科交又程度,识别与量化高交又性学科组,并作为下一步识别学科交又热点主题的数据基础。Salton指数的取值范围是0 l,越接近1表示交又度越高,其表达式如式(1)所示。(1)式中:SAB表示Salton指数;N表示学科A的项目数;NB表示学科B的项目数;NAB表示学科A、B的共有项目数。2.3“支持趋势-交叉趋势”战略坐标图1988年Law等 31 提出战略坐标图,通过坐标中不同象限和
16、位置展示研究主题在学科领域中的地位及成熟度,为科研人员发现学科领域的热点研究主题及研究前沿提供了有效途径。闵超等 32 采用战略坐标分析法,探究了图书情报与新闻传播两个学科的学科交又热点主题划分和演化过程。袁毅等 33 利用战略坐标对人工智能领域的学科群外部结构进行分析。范丽鹏等 8 针对基金项目,提出了立项强度和研发投入力度两个指标,利用战略坐标图对技术主题前沿程度进行判定。将学科交叉度引入战略坐标图,提出支持度和交又度指标,利用指标在2 0 16 一2 0 18 年、2 0 19 一2 0 2 1年两个时间窗口中的差值进行趋势分析,构建“支持趋势-交又趋势”战略坐标图,展示研究领域中学科、
17、研究主题的交叉趋势和发展态势,从而实现对学科和研究主题的类型进行细粒度研判和准确定位,为发现领域交又热点主题提供有效途径,有助于多维度刻画和比较领域内学科和研究主题的发展趋势。(1)支持趋势。首先将包含该学科/主题的项目与总项目的比例定义为支持度,以支持度在两个时间窗口内的差值代表支持趋势:值越大代表该学科/主题的关注度和研究热度越高,该学科/主题往往蕴含着该时期待解决的重大问题。支持趋势公式如式(2)所示。-()(2)n(n式中:N,代表包含第i个学科/主题的项目数;n代表总项目数;t代表不同时刻。(2)交叉趋势。将项目中与某一学科/主题共同出现的学科/主题的数量定义为交叉度P,以交又度在两
18、个时间窗口内的差值表征交又叉趋势,值大于0 表示呈上升趋势,值越大代表研究领域中与该学科/主题关联的31NAB-(兴)2023年第19 卷第10 期数季窗书馆论坛DigitalLibraryForu学科交又研究越多。交叉趋势公式如式(3)所示。式中:P代表项目中与第i个学科/主题共同出现的学科/主题的数量。(3)战略坐标图。以支持趋势为横轴、交叉趋势为纵轴,建立战略坐标图,如图1所示。根据发展趋势刻画了4种类型的学科/主题:第一象限的节点具有“双高”特点,为前沿型学科/主题;第二象限中交又趋势增强,支持趋势减弱,学科/主题未来有一定交叉融合的发展潜力,判归为潜力型学科/主题;第三象限的支持趋势
19、和交叉趋势均呈减弱状态,判归为衰退型学科/主题;第四象限中支持趋势增强,交又趋势减弱,为热点型学科/主题。交叉趋势潜力型前沿型衰退型热点型图1“支持趋势-交叉趋势”战略坐标图3实验结果与分析3.1 数据来源NIFA是重要的科研机构,致力于农业、环境、人类健康、福利等方面研究,在美国农业领域具有一定的影响力。本文基金数据来自NIFA官网,包括2 0 16 一2 0 2 2年NIFA资助的基金项目,每个项目的属性信息包括项目名称、项目编号、申报单位、申请人、非技术摘要、关键词、学科分类、知识分类、立项年份、执行时间、资助金额等2 0 多个字段。检索时间为2 0 2 2 年12 月1日,对数据进行去
20、重、合并和清洗。3.2学学科主题计量分析3.2.1 重点学科布局统计整理NIFA项目数据发现,2 0 16 一2 0 2 2 年322023年第19 卷第10 期NIFA资助项目数量为10 310 项。NIFA资助项目共涉及Y,=Pi,-Pi.(3)支持趋势48个学科,可分为生物科学类、物理科学类、社会与行为科学类:以生物科学类居多,社会与行为科学类次之,物理科学类最少。2 0 16 一2 0 2 2 年NIFA项目Top15学科资助情况(见表1)显示,资助频次位于Top3的学科是教育学、工程学和生物学。教育学涉及农业人才培育计划、青年创业计划以及农场主、农业企业家等农业生产经营主体扶持等。工
21、程学涉及堆垛机器人、无人机、收获臂、智能农机等农用智能装置、软硬件设备的研发,以及光谱分析、超声波、纳米技术、机器学习等先进技术在农业中的应用等。生物学涉及农业生物技术、微生物组和代谢组的相互作用关系、种植业和养殖业的高效生产与环境保护等。资助金额位于Top3的学科分别是工程学、经济学和生物学,每个学科的平均资助金额达40 0 0 万美元,是NIFA重点支持的学科方向。大多数学科的资助频次与金额成正比。表12 0 16 2 0 2 2 年NIFA资助的重点学科资助频资助金额/序号学科1教育学2工程学3生物学4生态学5营养与代谢6经济学7遗传学8分子生物学9生理学10昆虫学与粉螨学37311细菌
22、学12化学13管理学14信息和通信15病理学3.2.2重点研究主题根据NIFA基金项目数据中的知识分类字段,统计排名Top20的重点研究主题,见表2。“土壤、植物、水、养分关系”涉及利用微生物、植物对土壤进行改良并研究其作用机制,提高粮食、经济作物产量和生产效率,提高农业生产水资源利用率等方面。“交流、教育和信息传递”涉及农业人才培育,农业新技术、新方学科类别次/次万美元9633.4647244 0716703.9056503.50462931025574.0654942.5464772.3203822 17119003632154312134827415862492.2382381844社会
23、与行为科学类物理科学类生物科学类生物科学类生物科学类社会与行为科学类生物科学类生物科学类生物科学类生物科学类生物科学类物理科学类社会与行为科学类社会与行为科学类生物科学类齐世杰,赵静娟,郑建华,等基于基金项目的学科交叉热点主题识别与分类研究以美国农业与食品领域为例法,生产经营能力提升,培训计划等方面。“植物基因组、遗传学和遗传机制”涉及粮食、水果、蔬菜等植物新品种的开发与选育,用转录组学等技术方法鉴定水果、蔬菜等植物发育过程的关键调控因子,基因编辑、基因标记等技术应用及遗传机制研究等方面。资助频资助金额/序号研究主题1土壤、植物、水、养分关系2交流、教育和信息传递3植物基因组、遗传学和遗传机制
24、4动物疾病保护食品免受病原微生5物、寄生虫的毒素污染昆虫、螨和其他影响6植物的节肢动物7影响植物的病原体和线虫8农业生产和农场管理经济学9工厂管理系统10虫害综合管理系统NIFA资助10 0 0 万美元以上的5 个重点方向是:工厂管理系统;土壤、植物、水、养分关系;动物疾病;交流、教育和信息传递;虫害综合管理系统。其中,“土壤、植物、水、养分关系”和“交流、教育和信息传递”是资助频次和资助金额“双高”的重点方向。表2 2 0 16 2 0 2 2 年NIFA资助的重点主题资助金额/序号研究主题次/次万美元58315475741 166406276380131731883531435931233
25、831033229318262861078资助频次/次11工程系统和设备12基础植物生物学13营养教育与行为14青年发展15动物管理系统16人口中的营养和饥饿17节约和有效利用水18动物的繁殖性能新的和改进的食19品加工技术森林资源的管理20万美元25019621541520713820056619461717313017049165143155152152301和可持续性3.3学科交叉热点主题识别学科交又点往往就是新的学科增长点,也是最可能产生重大科学突破和变革性创新的研究前沿 9 。利用Python语言程序对项目进行学科共现分析与可视化,绘制学科共现图谱,见图2。节点代表学科,节点越大中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 基金项目 学科 交叉 热点 主题 识别 分类 研究 美国 农业 食品 领域
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。