情感视域下突发公共事件网络舆情情感分析与主题演化研究.pdf
《情感视域下突发公共事件网络舆情情感分析与主题演化研究.pdf》由会员分享,可在线阅读,更多相关《情感视域下突发公共事件网络舆情情感分析与主题演化研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、收稿日期:本文系国家社科基金一般项目“价值链双重嵌入框架下中国中亚西亚能源经济圈的构建与协同机制研究”(项目编号:)陕西省社会科学基金项目“陕西高端装备制造业供应链韧性的形成机理、测度及提升策略研究”(项目编号:)的研究成果作者简介:马晶晶()女 级硕士研究生主要研究方向为统计分析肖萌()男 级硕士研究生主要研究方向为大数据统计分析陈树广()男硕士生导师教授主要研究方向为大数据分析和应急管理情感视域下突发公共事件网络舆情情感分析与主题演化研究马晶晶 肖 萌 陈树广(.西安财经大学管理学院 陕西西安)(.西安财经大学统计学院 陕西西安)摘 要:目的/意义情感是舆情演化的重要引导因素挖掘民众情感倾
2、向和舆情演化规律为网络舆情治理提供科学决策支持 方法/过程明确界定生命周期理论起始、爆发、波动和平息四阶段划分依据以社会安全事件为例划分舆情的四个阶段运用、模型以及 模型从时空、正负两个维度挖掘隐含主题和情感变化规律 结果/结论构建的突发公共事件网络舆情情感分析和主题演化分析研究框架可以揭示突发公共事件网络舆情各阶段热点话题和情感趋势民众对舆情的敏感程度存在显著的区域差异各阶段情感变化具有明显的涟漪效果关键词:突发公共事件网络舆情情感分析主题演化中图分类号:.文献标识码:./.(.)(.):/./:.:./.:引言舆情通常与突发公共事件息息相关情感是舆情演化的重要引导因素 舆情的演化关系到舆论
3、的走向与社会的稳定突发公共事件舆情的产生与演化更是社会尖锐问题内在情感症结的集中体现 在复杂多元的网络信息中辨析舆情的主题演化以及民众的情感倾向有助于加强社会有效治理健全应急管理体系 年 月.情报探索 第 期(总 期).(.)当前社交媒体与自媒体应用服务成为突发公共事件舆情的产生和演化的新载体 以微博、抖音等为主要代表的媒体平台成为民众自由发表言论、表达情感和态度的重要渠道 尤其 年底新冠肺炎疫情爆发以来我国突发公共事件在发生频率和影响范围方面均有增大的趋势这对经济发展及社会和谐带来严重威胁 突发公共事件的发生易产生一系列连锁效应引发诸多社会问题若不及时响应并采取有效控制措施经常造成更大危害
4、因此探索舆情的民众情感特征以及主题演化过程有助于相关管理部门全面掌握舆论趋势及时把控舆论导向精准研判舆情态势制定应急方案实现科学决策 研究综述当前许多学者将生命周期理论运用到突发公共事件网络舆情的演化模式中从不同视角把突发公共事件生命周期分为三阶段至六阶段以期挖掘网络舆情演化趋势 多阶段划分舆情有助于识别舆情演化特征但不同阶段划分具有不同的效果 三阶段虽然能表达网络舆情的传播过程但会忽略网络舆情的某些特征四阶段结合网络舆情传播特性比三阶段更能清楚挖掘舆情演化特征但在空间划分逻辑层面需要深入研究五阶段模型将蔓延期分为两个阶段虽然能揭示舆情是如何从发生到衰竭但对如何界定划分阈值有了更高要求六阶段相
5、比前几个阶段能够准确描述网络舆情演化过程但都以具体案例特性进行划分普适性有待考证 综合来看四阶段划分较为合理但对于划分阈值如何界定鲜少有学者明确提出划分依据微博等社交媒体内容影响着社会秩序其话题发现和主题演化研究受到学者们的密切关注 模型广泛应用于话题发现研究学者们根据舆情特性挖掘舆情隐含热点话题和民众情感特征 钱莉等对于话题演化研究进行了总结并证明 模型在不同领域研究话题热点挖掘、话题强度演变、话题趋势预测等方面具有可观成效在网络舆情情感分析方面学者们借助情感词典和 多视角探究网民情感变化特征 邓春林等基于文本情感内涵出发多维度分析网民情感动态变化特征林国英运用情感词典分析网民微博评论情感倾
6、向张琛等采用 识别新冠疫情网民情感倾向演化趋势黄仕靖等以新冠疫情为例运用 模型发现各阶段网民情感的群体特征时空演化过程存在差异姜金贵等采用情感词典和情绪分析技术分析舆情并利用 工具包和 模型识别“红黄蓝虐童事件”的主题特征深入挖掘该事件微博舆情演化过程曹树金以生命周期理论为基础利用 和 模型识别隐藏主题信息 从时间维度挖掘舆情演化规律杨嘉韵强调借助大数据来研究舆情有助于政府及时了解民众关注的焦点和富有的情感并将情感因素融入 主题模型进一步探究民众在疫情期间情感变化情况并挖掘舆论热点前人从不同视角研究突发公共事件网络舆情为本研究奠定了理论基础但大多数基于特定事件进行分析尚未形成标准化舆情分析框架
7、 在生命周期划分方面存在各阶段划分准则界定不清的问题在话题发现方面主要以单一模型识别主题缺乏模型对比分析在舆情分析方面仅从时间层面分析缺少空间维度的分析 本文基于情感视域下构建突发公共事件网络舆情情感分析与主题演化框架明确指出划分舆情四阶段生命周期的准则通过 模型和 主题模型对比分析来揭示网民情绪价值空间分布特性提出有助于相关管理部门有效管控突发公共事件舆论动态策略 研究方法.生命周期界定准则梳理以往研究成果发现学术界对于如何界定生命周期划分依据还未给出明确的准则 为了更加准确反映突发公共事件网络舆情演化规律本文以曹树金和夏雨研究成果为基础将突发公共事件网络舆情传播的生命周期划分为起始、爆发、
8、波动和平息四个阶段(见图)并给出如下界定准则:起始阶段:是指从事发开始至舆情飞速传播的阶段该阶段舆情信息缓慢增长公共事件舆情的发文数量、转发量、评论量较少爆发阶段:是指舆情信息传播速度呈指数型增长文本信息、转发评论量达到峰值引起民众广泛关注和相关部门高度重视波动阶段:是指舆情信息量从峰值开始逐渐减少信息量在某一数值小范围波动多元化信息的不可控因素导致此阶段极易引发次生话题舆论热点表现为持续震荡的特性平息阶段:是指舆情信息经过长期波动后信息量减少的阶段情感因素的多维性决定民众不同的情感诉求此阶段较少公众关注舆情信息 年 月情报探索第 期(总 期)图 舆情四阶段演化特征.舆情情感分析文本信息蕴含着
9、大量公众情绪和态度舆情情感分析研究主要集中于情感的极性研究主要是根据情感值来表现正负 类情感或正中负 类情感来分析民众的情感强度和态度 本文采用 中的 进行网络舆情情感演化分析结合生命周期理论动态挖掘公众对于突发公共事件的情感特性 通 过 词 云 图 可 视 化 展 示 公 众 情 感 演 化 将情感分为积极和消极两极返回的数值代表情绪的概率其情感取值范围为情感值越接近 代表越积极而越接近 代表越消极.舆情主题演化词频逆文本频率()是一种文本特征加权的特征词提取方法反映了词在语料库中的重要程度具有很强的实用性和鲁棒性 词频 统计了词语在语料库中出现的频次逆文本频率 考察了词在多条评论中的贡献度
10、 计算方法见公式()、()、()()()().()().()().()其中 表示文章的总词数表示词 在文章中出现的次数 表示语料库中文本总数表示语料库中包含词 的文本总数隐含的狄利克雷分布模型()是以“词主题文档”为基础的三层贝叶斯“词袋”模型(见图)具有优异的文本降维能力和雄厚的理论基础该模型中每篇文档主题通过与所有文档相关联的 先验生成实现模型的彻底“概率化”图 模型图其中 分布是多项式的共轭先验概率分布文档 主题分布 ()主题 词分布 ()生成过程为:从 ()分布中抽取一个主题 使得 ()基于主题 从 ()分布中抽取一个词 使得 ()重复 次该过程生成一篇文档 重复、过程 生成一个文档集
11、 每个词在文档中出现的概率以及主题模型的联合概率计算过程见公式()、()(/)(/)(/).()(/)(/)(/)(/).()困惑度一般用于评估概率语言模型的优劣性能够降低模型主题识辨度不高的问题困惑度数值越小代表模型的主题生成能力较强 为了提高 主题模型精度本文按照公式()困惑度计算方法确定模型最优主题数 ().()其中 表示语料库中测试集文档数表示每篇文档 中单词数表示文档 中的词()即文档中词 产生的概率 年 月马晶晶等:情感视域下突发公共事件网络舆情情感分析与主题演化研究第 期(总 期).舆情分析研究框架立足“以人为本”的中心理念管控舆情掌握充足的舆情信息了解民众情感倾向关系着突发公共
12、事件舆情高质量治理 本文基于上述方法提出如图 所示的舆情分析研究框架辅助舆论生态治理图 舆情分析研究框架 实证分析.数据采集与预处理以“唐山烧烤店打人”事件微博评论为实例运用舆情分析研究框架结合 爬虫技术利用高级搜索功能获取 年 月 日至 年 月 日时间段内的热门微博及评论数据初步得到数据 条为了增强数据的可靠性进行去重、删除无效数据及不相关数据处理等操作最终获得 条有效评论数据构建实验语料库深度挖掘公众对此事件的情感特征及隐含主题演化过程.微博舆情生命周期划分本文采用百度指数辅助验证生命周期界定准则的正确性 由图、图 可知微博评论量和百度指数变化趋势基本一致话题热度不断波动呈现出峰值分布特征
13、且微博评论量存在多峰现象但最终二者均趋于平稳符合前面提出的生命周期界定准则的特征 因此本文将“唐山烧烤店打人”舆情事件分为起始阶段(年 月 日)、爆发阶段(年 月 日至 年 月 日)、波动阶段(年 月 日至 年 月 日)、平息阶段(年 月 日至 年 月 日)四个阶段图 微博评论量趋势图 百度指数趋势.微博舆情情感特征分析在“唐山烧烤店打人事件”的案例中积极情感占.消 极 情 感 占.中 性 情 感 占.网民对于该事件的正负情感的比例相差甚少造成网络舆论的两极分化 为深度探究潜在情绪特征以 情绪值划分正负情感并运用 年 月情报探索第 期(总 期)分词和 模型提取四阶段的热点词多角度探索民众情绪价
14、值由图 可知正面情感以同情、希望等情绪为热点负面情感则以害怕、担忧等情绪为主 其中“希望、社会、保护、受害者”等热点词为正向情感的核心话题网民情绪价值趋于同情受害者、保护女性以及清除恶势力等情感督促执法部门尽快调查事件加强肃清恶势力团伙给予受害者公正弘扬社会正能量“唐山、正常、保护伞、问题”等热点词说明类似事件存在于其他地方公民碍于“恶势力”不敢声张网民整体倾向于恐慌、担忧等消极情绪图 微博舆情正负情感热点词 由图 可知“唐山、女性、保护伞”等话题贯穿舆情生命周期四个阶段重点突出民众关注焦点随着事件的发展网民的情感变化过程为“愤怒担忧希望平缓”的特征 其中:起始阶段该事件的视频瞬时扩散于网络中
15、引起网民极大的重视和关注“搭讪、性骚扰、冲突、女性、打人”等热点词本就属于敏感性词汇网民极易产生愤怒、担忧的情绪网民在爆发阶段的情感发生极大的转变舆情热度达到最高值其热点词演化为“唐山、保护伞、社会、问题、女性”等富含强烈主观色彩的词汇这些热点词说明网民从该事件本身的关注上升至社会治安、执政人员的公信度以及女性的安全上经过长期的信息量累积网民在波动阶段的关注点随事件调查的进展不断演化关注重点转移到“发声、受害者、老实人、女孩”等次生话题情感走向由担忧情绪趋向于诸如“希望、发声”等正面情感网民的情感倾向于希望相关部门尽快查明事实真相给予受害者温暖关怀加强社会和谐治安 月 日河北省公安厅发布关于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 情感 视域 突发 公共 事件 网络 舆情 分析 主题 演化 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。