大数据背景下个人信息研究领域知识图谱分析.pdf
《大数据背景下个人信息研究领域知识图谱分析.pdf》由会员分享,可在线阅读,更多相关《大数据背景下个人信息研究领域知识图谱分析.pdf(9页珍藏版)》请在咨信网上搜索。
1、SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.18 探 索 与 争 鸣科技资讯SCIENCE&TECHNOLOGY INFORMATION大数据背景下个人信息研究领域知识图谱分析南冰冰(浙江警察学院 浙江杭州 310051)摘要:为厘清大数据背景下个人信息安全研究领域的发展现状,推进个人信息安全的保护,以Web of Science和CNKI数据库中近10年(20122022年)大数据背景下个人信息研究领域的论文作为数据来源,利用CiteSpace和VOSviewer进行文献计量分析。对发文量、作者、国家、关键词等进行可视化分析,探究研究现状、研究热点以
2、及阶段性研究前沿,并进行比较。研究发现:大数据背景下个人信息研究受到广泛关注,发文量逐年增长,澳大利亚的Deborah Lupton发文量与被引次数均最高;美国在大数据背景下个人信息研究领域占据重要地位;中国学者独立性较强,在该领域的研究中需要加强不同机构与国际上的合作。热点研究包括“大数据”“信息”“保护”“隐私”等。该研究有利于了解该领域的研究现状,为该领域相关研究的深入发展提供良好基础。关键词:CiteSpace VOSviewer 个人信息 文献计量分中图分类号:G203文献标识码:A 文章编号:1672-3791(2023)18-0231-09Analysis of the Know
3、ledge Graph in the Research Field of Personal Information under the Background of Big DataNAN Bingbing(Zhejiang Police College,Hangzhou,Zhejiang Province,310051 China)Abstract:In order to clarify the development status of the research field of personal information security under the background of bi
4、g data and promote the protection of personal information security,this paper takes papers in the research field of personal information under the background of big data in the past 10 years(20122022)in Web of Science and CNKI databases as data sources,uses CiteSpace and VOSviewer for bibliometric a
5、nalysis,visually analyzes the number of published papers,authors,countries,keywords,etc.,explores the research status,research hotspots and phased research frontiers,and compares them.It is found that research on personal information under the background of big data has attracted wide attention,the
6、number of published papers has increased year by year,Lupton and Deborah from Australia have the highest number of published papers and cited times,the United States occupies an important position in the research field of personal information under the background of big data,and that Chinese scholar
7、s have strong independence and need to strengthen the cooperation with different institutions and international organizations in their research on this field.Hot research includes big data,information,protection,privacy,etc.The research is helpful to understand the research status of this field and
8、provide a good foundation for the further development of related research in this field.Key Words:CiteSpace;VOSviewer;Personal information;Bibliometric analysis个人信息是指与特定个人相关联的、反映个体特征的具有可识别性的符号系统,包括个人身份、工作、家庭、财产、健康等各方面的信息1。自2017年6月1日起实施的 网络安全法 中的第七十六条里,也明确DOI:10.16661/ki.1672-3791.2303-5042-6248作者简介:
9、南冰冰(2003),女,本科在读,研究方向为数据分析及其可视化。231SCIENCE&TECHNOLOGY INFORMATION科技资讯探 索 与 争 鸣 2023 NO.18 SCIENCE&TECHNOLOGY INFORMATION科技资讯界定了个人信息的概念。个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人身份的各种信息,这是以法律的形式明确对于个人信息的一种保护,也是我国法律法规中第一次明确界定了个人信息。当今社会正处于大数据时代中,海量的数据每天都在被产生、记录、使用,个人信息成为大数据时代最为重要的资源2,但随之而来的个人信息泄露事件也频频发生,如何在开
10、发信息价值的同时保障个人信息的合理利用3成为了一大难题。目前,随着互联网与大数据技术的发展,个人信息被收集、处理(使用、存储、加工、传输、提供、公开等)已经成为不可逆转的趋势4。数据挖掘、数据预测以及更全面的监控,造就更具可能性的数据5,为个人信息保护问题带来了巨大的风险。虽然大数据带来了新的安全问题,它自身却也是解决问题的重要手段6。国内外已有相当一部分学者从技术层面对个人信息进行研究,然而目前在个人信息保护方面技术仍未起到其应有的作用,技术发展的步伐仍然滞后7。现阶段,我国保护个人信息的立法虽多,但相关规定是零散的、不系统的8,欧盟在个人信息领域采用“统一立法”,美国则通过“分散立法”和“
11、行业立法”两种方式9,但仅凭立法无法对个人信息起到有效保护,还需要技术、法律法规等的结合。同时,随着社会的发展,个人信息也将起到越来越重要的作用。做好大数据背景下个人信息的保护,有利于实现私权的全面保护,有利于助推公权的有效实施10。因此,加强大数据背景下个人信息相关研究有其必要性与重要性。而个人信息相关研究虽已受到学术界与社会的广泛关注,但对于大数据背景下个人信息保护研究的整体认识,以及如何更好地推进个人信息保护缺乏深入认识。基于此,本文借助文献计量法,基于 CNKI 和Web of Science数据库,对其中的相关文献分别进行计量分析,以期探究出该领域国内与国际的研究概况、研究热点。1
12、研究方法和数据来源文献计量分析是利用文献计量学原理对相关文献进行分析的一种文献分析方法,通过采用数学、统计学等计量方法,研究文献的分布结构、数量关系、变化规律11。绘制科学知识图谱即可视化图形,更加直观地反映各项数据间的复杂关系,便于分析不同领域的研究热点、发展动态等。当前,一些绘制科学知识图谱以用于文献计量分析的软件已被研发出来,如CiteSpace、VOSviewer、Pajeck、bibexcel等,本文主要采用CiteSpace和VOSviewer等软件进行文献计量分析。CiteSpace是由美国德雷克赛尔大学(Drexel University)信息科学与技术学院的陈超美教授开发研制
13、的科学文献计量自动化软件12,可以提供共线分析、类分析、突变词检测等功能。VOSviewer 是由荷兰莱顿大学的 Nees Jan van Eck和Ludo Waltman共同开发的13,可用于绘制密度视图等图像。本文利用文献计量法,对大数据背景下个人信息领域的研究进行分析,制定基本框架。以不同数据库集的文献数据为研究对象,按照文献计量学的分析逻辑和方法,对文献中蕴含的信息进行挖掘和量化分析,进而通过数学和统计分析的角度,考察文献之间的外部特征和相互关系14,揭示该领域的研究概况、研究热点,并分析其发展方向。本文选取CNKI和Web of Science数据库作为数据来源。对CNKI数据库进行
14、高级检索,以“大数据”和“个人信息”为主题,设定发表时间为2012年1月1日到2022年1月1日,成功检索6 520篇文献,剔除不相关文献(会议、新闻等),最终检索文献5 946篇;在Web of Science核心合集(WoS)数据库中以“Big Data”“Personal Information”为主题,发布时间为2012年1月1日至2022年1月1日,图1 CNKI中20122022年大数据背景下个人信息安全研究领域发文量232SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.18 探 索 与 争 鸣科技资讯SCIENCE&TECHNOLOGY IN
15、FORMATION最终检索文献308篇。2 大数据背景下个人信息保护研究的文献计量分析2.1 基于CNKI的分析2.1.1 发文量大数据背景下个人信息相关问题逐年受到重视,发文量呈上升趋势,本文对中国知网数据库检索出的文献进行统计,结果见图1。可明显看出:发文量于2018年出现大幅增长,2018年前后,增长均较为稳定。图1中2022年为预测发文量,因2021年 民法典 的实施以及 数据安全法 和 个人信息保护法 的出台,社会对于个人信息有了进一步关注,故相较于2021年,2022年的发文量有一个较大的增幅,也说明了近年来,个人信息相关问题越来越被国家与社会所重视,该领域的相关研究也受到学术界越
16、来越多的关注。2.1.2 作者本文统计了该研究领域的发文情况(如表 1 所示),约有7 450名作者,发文量位居前5位的是陈兵(南开大学,10篇)、张涛(清华大学,10篇)、王利明(中国人民大学,7篇)、李仪(重庆理工大学,7篇)、张建文(西南政法大学,7篇)。为进一步分析作者之间的合作关系,本文制作了作者之间的合作关系网络图,发文量最高的9个作者聚类团合作网络图谱如图2所示。网络谱图中,每个研究团体分布都较为分散,多为36人的小团体。且经进一步分析发现同一类团中的成员多为同一机构的,如宋慈团队中的5人均为中国矿业大学的,相丽玲团队中的3人均为山西大学的。现阶段,国内学者在该领域的研究多局限于
17、同机构内的合作,且合作对象以及小组内人数较为固定,即组内联系较为紧密。但是从全局来看,普遍缺乏组间合作。2.1.3 关键词关键词可以很好地体现论文主题,一个关键词出现的频次等于附有该关键词的学术论文的总数,关键词出现的频次越高,说明相关的研究成果数越多,研究内容的集中性就越强15。首先,利用VOSviewer进行分析,发现有效关键词13 650个,表2中为出现次数最多的关键词。绘制关键词密度视图(见图3),颜色由深至浅表示关键词共现的频次越来越高,即相关热度较高,由此可以看出,大表1 CNKI中大数据背景下个人信息研究领域作者发文量排名前6的作者排序113336作者陈兵张涛王利明张建文李仪王肃
18、之机构南开大学清华大学法学院中国人民大学西南政法大学重庆理工大学最高人民法院发文量10107776图2 CNKI中该研究领域作者间合作网络图谱图3 CNKI中大数据背景下个人信息研究领域关键词密度视图233SCIENCE&TECHNOLOGY INFORMATION科技资讯探 索 与 争 鸣 2023 NO.18 SCIENCE&TECHNOLOGY INFORMATION科技资讯数据背景下个人信息研究领域的研究热点主要集中在个人信息、大数据、个人信息保护隐私权、被遗忘权、大数据时代、信息安全等方面上。随着大数据背景下个人信息研究领域的热度不断提升,“大数据”“个人信息”逐渐成为研究热点。个人
19、信息的保护则又涉及多项权利,如隐私权、个人信息权、被遗忘权等,在当今大数据时代里,如何合理有效保护个人信息也是我国大多数学者所探讨研究的问题,其中,法律相关的保护是研究中呼声最高也是讨论热度最高的。其次,利用CiteSpace对关键词进行聚类,根据网络结构和聚类的清晰度,提供模块值(Q值)和平均轮廓值(S值)两个指标,它可以作为评判图谱绘制效果的一个依据。一般而言,Q0.3就意味着划分出来的社团结构是显著的;当S值在0.7时,聚类是高效率令人信服的;若在0.5以上,聚类一般认为是合理的16。绘制聚类图谱,如图4所示。该聚类图的模块值为0.891 40.3,平均轮廓值为0.966 10.7,说明
20、该网络聚类结构合理,效果较为显著。对聚类信息进行整理(见表3),容量代表了节点个数,剪影度即为紧密程度,代表了节点之间的联系程度。由表3可知,此聚类内部紧密程度均在0.7以上,且有22个超过了0.9,说明聚类效果较好。从聚类结果来看,该领域的研究主要包括了对于大数据与个人信息理论的探讨,由个人信息涉及的隐私与人格权等问题、法律保护、个人信息泄漏原因、疫情防控中的权利让渡、保护原则等方面。继续进行进一步分类,可分为三大类,与大数据背景、信息相关、保护措施相关。为了研究关键词之间的相互关系,本文运用VOSviewer对关键词进行了共现分析,并利用CiteSpace对关键词的中心度进行计算,中心度排
21、名前8位的见表4。“云计算”“大数据”“个人信息”3个关键词的中心度排名为前三,其中心度分别为0.41、0.39、0.34。这些词是较为关键的枢纽节点,在该领域的研究中也多次起到中介的作用。“个人信息”“大数据”等核心关键词之间联系较为紧密,在网络中占据核心地位。关键词共现图谱见图5。为更清晰地了解该领域不同阶段的研究趋势,利用CiteSpace寻找其突变词。突现性关键词也称突现词,一定程度上可以反映一段时间内影响力较大的研究领域,即学界在一段时间内高度关注的研究主题17。表2 大数据背景下个人信息安全领域频次排名前15位的关键词排序1234567891011121314关键词大数据个人信息隐
22、私权信息安全被遗忘权隐私保护个人数据法律保护数据安全法律规制人工智能隐私个人隐私保护频次1 6581 177367291293223190185174147133112106101图 4 CNKI中大数据背景下个人信息研究领域关键词聚类图谱234SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.18 探 索 与 争 鸣科技资讯SCIENCE&TECHNOLOGY INFORMATION随时间的发展,不同阶段研究的关键词是在不断变化的,关键词突现度则可以反映出一段时间内影响力较大的研究领域。图6为20个突变词列表。由图6可知:算法、隐私保护、云计算等关键词在2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 背景 个人信息 研究 领域 知识 图谱 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。