FI分类号在智能检索系统中的应用.pdf
《FI分类号在智能检索系统中的应用.pdf》由会员分享,可在线阅读,更多相关《FI分类号在智能检索系统中的应用.pdf(4页珍藏版)》请在咨信网上搜索。
1、中国科技信息 2023 年第 19 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2023-36-专利分析关键词进行扩展结合的块检索模式构建检索式,则可能会出现关键词不好扩展或扩展后噪声很多的问题,同时还会涉及中英日三种语言之间的翻译问题。为此,本文介绍了在智能检索系统中使用 FI 分类号的检索方式,分析了如何充分结合智能检索中的相关功能提高利用 FI 分类号进行检索的效能,并通过实际案例以对检索实践进行指导。智能检索系统的检索方式智能检索系统在保留原 S 系统布尔检索命令的基础新增了语义检索相关的检索命令,语义检索基于大数据统计和机器学习模型,对
2、检索内容进行分析,提取检索信息,并用数学方法,将数据库每篇文献进行语义分词处理,提取关键词信息,智能算法将关键词信息向量化,向量值之间的余弦夹角表示两两文献之间的相似度,进行信息匹配,以寻求文本语义最相关文献。具体的,其可以采用案件申请号或者任何中英文的词句、段落作为语义基准进行检索,并且根据语义相关度对获取的文献进行排序。智能检索系统目前可以实现纯布尔、纯语义、先布尔后语义,先语义后布尔 4 种检索方式,但是纯布尔正如以前的S 系统的检索方式,需要精准的分类号和关键词,检索要求很高且容易漏检;纯语义,由于不同主体和案件对于相关信息的描述方式可能有较大差别,导致文献量和噪音非常大,信息匹配误差
3、较大时,也容易导致目标文献排序不在最大浏览量之内而漏检;先语义后布尔的方式融合了上述两种检索方式,理论上更符合纯语义的检索逻辑,在检索实践中更适宜与纯语义检索联合运用;而先布尔后语义的方式,融合了人工智慧和机器检索二者各自的优势,能够突破检索结果数量限制,先用简单的布尔检索大致锁定目标文献所在的范围,获得检索结果集,通过适当的“圈”,划定包含目标文献的范围,再通过合适的语义基准对检索结果集内的文献进行排序,使目标文献排序更靠前,从而很快锁定目标文献,更好地实现查全、查准,查快。FI分类号在智能检索系统中的应用本文以两个实际案例为分析对象,对 FI 分类号在智能检索系统中不同的检索方式所带来的影
4、响展开结论分析,验证在智能检索系统中推荐的检索方式。案例一 一种出风组件FI 分类号在智能检索系统中的应用庄 利 褚吉平 刘 帅庄 利 褚吉平(等同第一作者)刘 帅国家知识产权局专利局专利审查协作四川中心庄利(1991),山东济宁,硕士,助理研究员,研究方向:暖通空调领域专利审查;褚吉平(1985),甘肃山丹,硕士,助理研究员,研究方向:制冷领域专利审查;刘帅(1989),四川德阳,硕士,助理研究员,研究方向:锁具领域专利审查。IPC 分类侧重于对单一的技术主题进行分类,且技术分类相对粗糙,随着科学技术的迅速发展,技术复杂程度不断增加,各种技术之间的融合度不断提高,技术的细分领域研究也越来越精
5、细,当专利审查中涉及的专利文献量日益增加,若仅仅采用 IPC 分类体系,需要检索的专利文献可以达到几百甚至上千篇,检索效率低下,且检索结果准确度相对较低。为了方便归类文献和检索,日本特许厅专门建立了日本 FI/FT 专利分类体系。由于该分类体系是日本特许厅建立的,因此仅适用于日文专利文献的分类与检索。FI(File Index)分类体系是日本特许厅将 IPC 细分和扩展得到的,用于扩展 IPC 在某些技术领域的功能,其是以IPC 分类号为基础编制的。FI 分类号采用了类似 IPC 分类号的层次递降的等级结构原理对技术整体进行分割,使得在某一小组下的上千或上万的文献在细分/扩展之后,其文献数量限
6、制在几百或者几十篇文献之内,从而提高了检索效率。智能检索系统是在原S系统建设经验的基础上,按照“平台+模块”的总体建设思路,充分利用智能化技术,包括云计算、大数据分析、自然语言处理等前沿技术,搭建形成全新的基础架构平台,沿着检索资源集约化、检索功能智能化以及检索流程标准化的设计思路,建成的智能化的检索系统,其在功能上实现了语义检索、布尔检索多种检索功能的融合,支持中英文数据库的智能检索、智能检索基础上的布尔筛选以及布尔检索基础上的语义排序功能。目前,在智能检索系统中利用 FI 分类号进行检索时,由于要获取的目标文献是日文文献,如果依旧按照对分类号和-37-CHINA SCIENCE AND T
7、ECHNOLOGY INFORMATION Oct.2023中国科技信息 2023 年第 19 期专利分析待检索的权利要求 1:一种出风组件,具有第一出风状态和第二出风状态,包括框架(1)和多个导风板(2),多个导风板(2)的两端分别转动地固定在框架(1)上,处于框架(1)同侧的多个导风板(2)的端部分别与传动结构相连,通过对其中一个导风板(2)施加与出风口平面垂直的作用力,使出风组件在第一出风状态和第二出风状态之间切换。经分析可知,本案的发明构思是通过切换其中一个导风板在固定架内的位置,使得其他平行的导风板切换其在固定架的弧形孔内的位置,从而切换不同的出风状态。初审员给出的分类号为 F24F
8、13/15(有平行的可同时摆动的薄片的可动风门),在FI 分类表中可以查找到细分F24F13/15&B(带有多个水平配置的控制元件的风门),采用该分类号结合案件的申请日在 VCN 数据库中进行检索,具体检索式及检索结果如下:1 VCN 1931 f24f13/15&b/fi and pd20190907 在原 S 系统中,上述检索式获取的文献量太大,需要结合其他的检索要素将文献量缩限至合理范围内,再进行浏览筛选;但是在智能检索系统中,可以无需对其进行缩限,通过其默认的申请号作为语义排序基准,利用其提供的语义排序功能,按照与本案相似度由高到低的顺序对文献进行排序后显示,在概览的第 1 页第 2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FI 分类 智能 检索系统 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。