基于专利主题演化的颠覆性技...研究——以类脑智能领域为例_邢晓昭.pdf
《基于专利主题演化的颠覆性技...研究——以类脑智能领域为例_邢晓昭.pdf》由会员分享,可在线阅读,更多相关《基于专利主题演化的颠覆性技...研究——以类脑智能领域为例_邢晓昭.pdf(8页珍藏版)》请在咨信网上搜索。
1、基于专利主题演化的颠覆性技术识别研究以类脑智能领域为例邢晓昭,任亮,雷孝平,刘雨农(中国科学技术信息研究所,北京 100083)摘要:【目的/意义】颠覆性技术具有隐蔽性和突变性,而技术主题在演化过程中会释放颠覆性趋势产生的早期信号,本文提出一种基于专利主题演化的颠覆性技术识别方法。【方法/过程】首先,基于S曲线法判断技术生命周期;其次,综合运用文本挖掘和社会网络分析方法识别技术主题的演化事件;最后,定义新主题出现、原主题趋热和多主题融合三类突变情况,用于识别具有颠覆性潜力的技术主题。【结果/结论】通过类脑智能领域专利实证,发现六个新出现主题、四个趋热型主题和六个融合型主题,通过专家判读,证明了
2、所提方法的有效性,同时筛选出五项主题作为最终预测结果。【创新/局限】本文基于动态社区发现算法对技术主题的演化特征进行分析,进而基于主题突变性筛选颠覆性技术,但数据来源较为单一,将在未来研究中加以扩充。关键词:颠覆性技术识别;主题演化;动态社区发现;社会网络分析;专利文本挖掘中图分类号:G250.2DOI:10.13833/j.issn.1007-7634.2023.03.010收稿日期:2022-05-18基金项目:国家社科基金青年项目“基于多源知识网络的颠覆性技术分类识别方法研究”(21CTQ039)。作者简介:邢晓昭(1988-),女,北京人,副研究馆员,硕士,主要从事颠覆性技术识别研究;
3、任亮(1993-),男,河北保定人,博士,馆员,主要从事信息资源管理研究;雷孝平(1979-),女,山东济南人,研究员,博士,主要从事专利分析研究;刘雨农(1991-),男,甘肃兰州人,助理研究员,博士,主要从事产业情报研究。“颠覆性技术”一词最早由哈佛大学教授Christensen提出,他将技术分为持续性技术和颠覆性技术。持续性技术是指对现有技术进行增量式改进的技术;而颠覆性技术则是指以意想不到的方式取代现有主流技术的技术【1】。当前,许多国家为支撑颠覆性创新成立了专门的研究部门,如美国国防高级研究计划局(DARPA)和俄罗斯先期研究基金会(FPI)等。颠覆性技术的战略意义不言而喻,但由于颠
4、覆性技术的发展具有过程复杂、高度不确定性的特征,目前尚未形成统一的衡量标准。20世纪末以来,网络科学复兴并迅速成为解决复杂问题的重要手段。网络分析的思维和方法充分考虑技术节点之间的关联关系以及网络整体结构,避免了技术识别的孤立性和局部性,为颠覆性技术识别提出了新的思路。专利文献完整记录了技术活动,是世界上反映技术发展最迅速、最全面、最规范的信息资源。本文以专利关键词作为基本知识单元,基于网络的社区结构性识别更具有解释意义的主题类团,通过对主题类团演化特征的考察发现颠覆性趋势。1 相关研究现有颠覆性技术识别方法主要是基于技术管理与应用角度的主观分析方法。以专利、论文等作为数据来源的客观分析方法也
5、在逐渐增多,主要包括以下几个方面:(1)基于文献属性计量的识别方法。专利(论文)数量、被引用特征、专利科学引文数量和专利IPC分布是常用的颠覆性潜力计量属性【2-5】。如Barbieri等人提出专利的范围、原创性、重组新颖性和激进型等指标,用于对颠覆性技术进行事前识别【6】。于光辉等人基于专利后向引用相似度对颠覆性技术的技术特征进行识别【7】。(2)基于知识网络分析的识别方法。属性计量一般将一个知识单元看作一项独立的技术,且计量维度较为单一。网络分析从系统视角出发,能够从技术本身和技术之间的关联角度共同揭示技术节点的所处位置,为颠覆性技术的早期、精准识别提出了新的可能性。R.J.Funk通过网
6、络分析方法挖掘新技术对以往技术以及整个技术轨道的影响【8】。Mariani考虑引文网络拓扑结构和时间信息,提出一种年龄标准化的专利中心性度量指标修正PageRank,以便尽早识别突变性技术(2019)【9】。王燕鹏等人通过文档聚类形成热点技术,并以热点技术为节点构建复杂网络,基于链路预测方法对潜在新兴技术进行识别分析【10】。(3)基于文本内容挖掘的识别方法。文献属性计量方法缺少对科技文本内容的理解,因此有学者开始从计量分析视角转向语义分析,基于内容的文本挖掘方法使分析结果更加深入、直观,提高了技术主题识别的准确性。黄鲁城等人通过AO模型提取关键词,结合系统聚类和多维尺度分析划分主题类团,对技
7、术的市场颠覆潜力进行识别【11】。Xu Shuo等情报科学20232023年第年第3 3期期(第第4141卷卷)业务研究-81人基于N-Grams模型来提取文本主题,并提出快速增长性、激进新颖性和显著影响性三个指标,用于衡量主题的前沿特性【12】。综上所述,文本内容挖掘和知识网络分析是颠覆性技术识别的新方法,且两种方法联合使用会产生更好的识别效果,是未来发展趋势。现有研究的不足之处在于:主要采用静态指标来识别颠覆性技术,对动态趋势的捕捉有待加强。颠覆性技术的发展存在一个从边缘走向主流,并替代现有技术的突变过程。本文将通过文本挖掘技术得到若干专利主题类团,基于动态社区发现算法追踪主题类团的变化情
8、况,以期发现具有颠覆性潜力的技术主题。2 基于主题演化的颠覆性技术识别模型构建本文基于专利技术主题演化的突变性来识别颠覆性技术。首先,采用S曲线法判别技术发展阶段,并据此划分时间窗口;其次,采用两阶段的动态社区识别算法进行主题演化分析。第一阶段,通过对专利关键词网络的主题聚类得到各时间窗静态主题;第二阶段,采用基于相似度的成对比较考察每个主题类团可能经历的“事件”,进而识别出动态主题;最后,基于动态主题的演化特性分三种突变情况筛选出具有颠覆性潜力的候选主题。本文构建的模型框架如图1所示。图1 模型框架图Figure 1 Research framework2 2.1 1 基于基于S S曲线法的
9、技术发展阶段判断曲线法的技术发展阶段判断技术生命周期发展遵循S曲线,每一阶段发展速度和发展特征具有差异性。萌芽期新技术概念被提出,并对其进行科学论证,专利数量较少且一般为原理性、基础性专利,不是进行颠覆性技术识别的最佳时期;成熟期和衰退期,主流技术已然形成,此阶段主要进行外观美化和功能完善,技术的创新程度降低,产生颠覆性技术的概率偏低;成长期是技术发展最为迅速的时期,主要聚焦技术实现路径,是技术方法大量涌现和更迭的时期,因此这一时期最适宜开展颠覆性技术识别。本文基于logistic曲线判断技术发展阶段,采用Loglet Lab作为软件工具。根据技术发展阶段的判断结果,将专利数据划分为若干个时间
10、窗口。2 2.2 2 基于动态社区发现算法的主题演化分析基于动态社区发现算法的主题演化分析主题演化分析是根据文献特征项之间的关联发现主题,再通过分析不同阶段主题内容的变化情况,识别技术领域的热点和未来发展趋势。动态社区发现算法能够跟踪复杂网络中节点和边的增加和减少,在社区级别上定义社区的变化行为,称为“事件”【13】。动态社区发现算法通常包含两个阶段【14】。第一阶段是时间窗内的静态主题识别,第二阶段是通过跨时间窗主题之间的关联来识别动态主题。本文基于这一思路开展主题演化分析。2.2.1 静态主题识别(1)关键词抽取。首先,采用c-value方法构建整个文档集的术语库,并据此抽取每篇专利的候选
11、术语及其频次;其次,采用Tf-Idf方法计算术语权重,并选择高权重术语作为关键词;此外,将专利的重要发明人作为团队标签添加到关键词中。本文假设团队领导者和技术骨干的专利申请量高于其他成员,因而将团队中申请量较高的发明人添加为关键词。这样一方面可以将同一团队的研究主题汇聚在一起,弥补术语同义不同型带来的识别误差,另一方面可以捕捉同一团队在不同阶段研究内容的关联性和变化性。在此基础上,构建关键词共现网络,用于开展主题分析。(2)主题聚类。静态社区识别算法包括重叠和非重叠两类。其中非重叠算法包括:Infomap【15】、谱聚类【16】、louvain算法【17】等,重叠算法包括:CPM【18】、种子
12、扩散【19】、边聚类【20】等。本文选用非重叠算法中的louvain算识别时间窗内的主题类团。louvain算法是 Blondel等人于 2008年提出一种基于模块度最大化的启发式社区发现算法,相比于传统算法其时间复杂度较低,且划分效果更好,是目前最主流的社区发现算法之一。本文基于Python语言的Community库来实现该聚类 算 法。从 第 t 个 时 间 窗 识 别 出 的 nt个 主 题 用Ct=C1t,C2t,C2t,Cntt表示。2.2.2 动态主题识别(1)相似性度量。本文采用修正的Jaccard系数来度量主题相似度。即当相邻时间窗中两个主题的共享关键词数量与此二者平均规模的比
13、值大于时,判定这两个主题相似(如公式1所示),这里将设为0.1。Sim(Cit,Cjt+1)=|CitCjt+1avg(|Cit,|Cjt+1),(1)在此,需要区分主题与动态主题,主题是指在某特定时间窗中紧密相连的关键词集合,即上文中提到Ci中的元素。而动态主题是属于不同时间窗的一组相似主题,代表了其组成主题随时间的演化,动态主题在此用D表示。设Di(Di D)在上一时间窗t-1的观察值为其前截面,用Fi表示;而由当前Information ScienceInformation ScienceVol.41,No.3 2023-82时间窗网络图Gt划分而得的主题集合Ct中的任意一个主题表示为N
14、j,相似度比较发生在所有的Fi与Nj之间。(2)演化事件定义。有多项研究定义了在网络演化过程中出现的相关事件【21-23】,这些事件主要包括:创建、终止、扩张、收缩、合并、分解、保持、恢复等。由于本算法用于识别颠覆性技术,因而在扩张、收缩和保持三类延续性事件中更加关注主题的扩张,在合并和收缩两类中断性事件中更加关注主题的合并。基于以上考虑,本文将收缩和保持两类事件统称为保持;当一个主题同时遇到分解和合并事件(即多对多匹配)时,判定其为合并;此外,添加缺失事件,删去恢复事件,并根据涉及主题的规模变化,将其归入扩张和保持两类事件之一。最终定义7类事件:创建:一个不同于现有Di D的新动态主题Dn的
15、诞生。终止:一个动态主题的消失。保持:动态主题中包含的关键词数量保持稳定或减少。扩张:动态主题中包含的关键词数量显著增加。合并:几个动态主题合并为一个新的动态主题。分解:某个动态主题分裂为几个新的动态主题。缺失:在当前时间窗中暂未观察到动态主题Di。(3)动态识别算法。本文基于迭代相似性进行动态主题识别,即对当前时间窗口中,现存动态主题的前截面Fi与新发现的所有静态主题Nj进行两两比较,再依次遍历各个时间窗,具体识别算法如图2。图2 主题动态识别算法Figure 2 Dynamic recognition algorithm of themes2 2.3 3 基于主题突变的颠覆性技术识别基于主
16、题突变的颠覆性技术识别突变性是颠覆性技术的重要特征之一。白光祖等人【24】认为,可以基于专利引用的科学知识主题的时序变化特征,从突变程度较高的主题中发现具有颠覆性潜力的候选技术,并提出三种突变情形:新主题出现;原主题趋热;多主题融合。本研究认为这种知识的突变同样会出现在专利自身所代表的技术主题中,且同样预示颠覆性趋势,对三种突变情形做出如下定义:2.3.1 新主题出现如果某个新技术主题在近两个时间窗内连续出现,那么该技术主题可能代表一项趋于稳定的新兴技术或全新产品,具有较高的颠覆性潜力。即:如果技术主题在近两个时间窗经历“创建”-“保持”事件,或“创建”-“扩张”事件,则将该主题作为候选技术主
17、题。2.3.2 原主题趋热如果某个传统主题的热度在近两个时间窗内出现剧烈波动,那么可能是主题内部某项关键技术产生突破性进展,或某项功能突然吸引主流用户,具有较高的颠覆性潜力。包括两种情况:保持并扩张。如果技术主题经历“创建”-“保持”-“扩张”“创建”-“扩张”-“保持”,或者“创建”-“扩张”-“扩张”,则将该主题作为候选技术主题。中断并恢复。如果技术主题经历“创建”-“缺失”-“保持”,或“创建”-“缺失”-“扩张”,则将该主题作为候选技术主题。2.3.3多主题融合如果某一新技术主题由领域内多个技术主题组合而成,则该主题的融合发展将有可能形成突破性进展。即:如果技术主题在第三阶段经历“融合
18、后创建”,将该主题及其成分主题作为候选技术主题。基于上述方法识别出颠覆性技术的候选主题后,邀请领域专家对这些主题进行分析判读,以检验本研究所提方法的有效性,同时以修正后的结果最为最终颠覆性技术主题。3 实证研究以类脑智能领域为例类脑智能是受大脑神经运行机制和认知行为机制启发,以计算建模为手段,通过软硬件协同实现的机器智能【25】。它借鉴人脑的信息处理方式,突破传统冯 诺依曼架构,在实时处理非结构化信息、自主学习等方面展现强大能力,同时具有超低功耗、超低延时,高鲁棒性等特点,因而引起广泛关注。本研究选择类脑智能领域开展实证研究,以期为该领域技术与产业发展提供参考。在Innography专利数据库
19、中检索类脑智能相关专利,检索时间范围为最早收录时间至2021年截止,数据清洗后,共得到简单专利家族2607个。3 3.1 1 生命周期判断与时间窗口划分生命周期判断与时间窗口划分根据检索结果,类脑智能领域从1988年开始出现专利申请,由于专利从申请到公开具有一定时滞(一般为 18个邢晓昭,任亮,雷孝平,等.基于专利主题演化的颠覆性技术识别研究以类脑智能领域为例J.情报科学,2023,41(3):81-88.-83月),数据库对于2020和2021年的专利数据收录不全。因此,本研究基于1988-2019年的专利数量来测算技术生命周期。测算结果(见表1和图3)显示,类脑智能领域从2014至今一直处
20、于成长期,呈现加速发展状态,适于开展颠覆性技术预测。表1 类脑智能技术生命周期阶段划分Table 1Life cycle Stage of brain-inspired intelligence technology萌芽期1988成长期2014成熟期2023衰退期2031目前阶段成长期图3 类脑智能专利数量发展趋势Figure 3The development trend of the brain-inspired intelligence patents其中2014-2018年属于成长前期,主要机构相继发布自主研发的类脑芯片,如高通的Zeroth NPU、IBM的True North和英特尔
21、的Loihi都发布于这一阶段。2019至今属于成长后期,研发重点逐渐从技术实现转向商业化应用,英特尔发布了基于Loihi的神经形态系统【26】,同时埃森哲、通用电气和日立等各行业的龙头企业相继加入由英特尔发起的神经形态研究社区(INRC),类脑智能的影响力逐渐扩大。本研究将专利数据划分为 1988-2013、2014-2018 和 2019-2021 三个时间窗口,并据此开展主题演化分析。3 3.2 2 类脑智能领域主题演化情况类脑智能领域主题演化情况关键词由两部分组成,其中术语关键词从标题和摘要中抽取,基于 c-value 和 Tf-Idf 算法得到专利-术语权重矩阵后,选取权值高于0.2,
22、且在每件专利中排名前五的术语作为关键词。团队关键词来自发明人字段,首先对发明人进行重名处理,其次选择专利数量大于2,且在每件专利中排名前三的发明人作为团队关键词。排除关键词数量小于2的专利,剩余2583件专利中,最少包含2个关键词,最多13个,平均值为5.6个。类脑智能领域时间窗网络图和主题识别情况如图4和表2所示。可以发现,关键词网络的密度和平均路径长度均较低,而聚类系数较高,证明这三个网络均属于小世界网络。小世界网络与真实世界网络特征相似,即大多数节点不直接相连,却具有共同的邻居,且主题类团之间可以通过很少步数彼此连接,此类网络具有社区结构性和不均衡性,适于开展颠覆性技术分析【27】。通过
23、对时间窗内网络的主题聚类,共得到静态主题236个,主题的平均规模为32。表2 各时间窗网络指标及静态主题识别情况Table 2 Network indicators and static topic recognition for each time window节点数量网络密度平均路径长度聚类系数主题数量主题平均规模1988-201315730.0054.250.8156524.22014-201830080.0034.160.81690332019-202132090.0034.140.8238140将相似度阈值设置为0.1,共识别出动态主题210个。每个时间窗中大约有69%的静态主题为新
24、创建主题,而剩余31%能与原有动态主题匹配上(第一个时间窗除外)。原图4 类脑智能时间窗内网络结构图Figure 4 Network structure of brain-inspired intelligence for each time windowXING Xiaozhao,REN Liang,LEI Xiaoping,et al.The Identification of Disruptive Technology Basedon Patent Theme Evolution:Taking the Field of Brain-Inspired Intelligence as an
25、ExampleJ.Information Science,2023,41(3):81-88.-84主题重复出现的概率约为 14%,分解或合并的概率为12%。图5展示部分主题的演化过程。其中,动态主题83“异构融合类脑芯片计算架构”创建于 2014-2018 时间窗,在2019-2021时间窗中,网络中节点数由88个增加到102个,引入脉冲神经网络、脑机接口等概念,主题扩张;动态主题27“新存储技术在类脑智能中的应用”在三个时间窗连续出现,节点数分别为:15、18和53,主题呈现扩张趋势。研究范畴围绕存储技术展开,但研究重点逐渐由单个忆阻器制备,向忆阻器阵列和类脑芯片等方向转移;动态主题156“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 专利 主题 演化 颠覆性 研究 智能 领域 邢晓昭
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。