基于音频的罪犯自杀危险性评估.pdf
《基于音频的罪犯自杀危险性评估.pdf》由会员分享,可在线阅读,更多相关《基于音频的罪犯自杀危险性评估.pdf(7页珍藏版)》请在咨信网上搜索。
1、2023年11月第6 0 卷第6 期四川大学学报(自然科学版)Journal of Sichuan University(Natural Science Edition)Nov.2023Vol.60No.6基于音频的罪犯自杀危险性评估郑子强,何得淮,廖潇楠,兰(1.四川大学华西医院生物医学大数据中心,成都6 10 0 44;2.四川省监狱管理局教育改造处,成都6 10 0 16)琳,蒋静文1,张伟1摘要:现较为主流的罪犯自我伤害风险评估主要通过量表实现,但存在耗时长、虚报率高的问题,缺乏客观有效的识别方法.音频数据不受个体语言限制,有采集方便、信息丰富等特征,目前基于音频数据构建的自我伤害风险
2、识别模型取得了不错的效果.通过访谈获取罪犯音频数据,对音频进行预处理后提取音频关键特征,采用4种机器学习算法构建分类模型.实验结果表明,罪犯音频能有效区分罪犯是否具有自我伤害、自杀倾向,平均F1分数为8 6.8 8%.关键词:罪犯评估;自伤自杀;音频;机器学习中图分类号:TP18;T P391;D 917Audio based suicide risk assessment of criminalsZHENG Zi-Qiang,HE De-Huai,LIAO Xiao-Nan,LANLin?,JIANG Jing-Wen,ZHANG Weil(1.West China Biomedical B
3、ig Data Center,West China Hospital,Sichuan University,Chengdu 610044,China;2.Education and Correction Department,Sichuan Provincial Administration of Prisons,Chengdu 610016,China)Abstract:The mainstream suicide risk assessment of criminals is achieved through scales,but there aresome problems such a
4、s long time consuming,high false reporting rate and lack of objective and effectiveidentification.Since audio data is convenient and informative while not restricted by individual language,previous studies have achieved good results in audio-based modeling of criminal suicide.In this study,the audio
5、 data of criminals were obtained through interviews.After pre-processing,the key audio fea-tures were extracted for machine learning modeling,and four classifiers were used to build the classifica-tion model.The experimental results show that the audio of criminals can effectively distinguish whethe
6、rcriminals have suicidal tendencies with the average F1 score of 86.88%.Keywords:Assessment of criminal;Self-harm and suicide;Audio;Machine learning1 引 言自杀是全球监狱中罪犯的主要死因之一,罪犯自杀率是普通人群的三倍以上.自杀死亡的罪犯中有一半以上曾有过自伤事件记录2.据统计,监狱中男性罪犯自伤事件发生率在5%6%,女性罪犯自伤事件发生率在2 0%2 4%31,自伤罪犯文献标识码:A在狱中自杀的风险是其他罪犯的6 8 倍4.国内学者的研究表明,
7、我国的服刑人员也是自杀风险较高的人群之一,但在有效及时的管控措施下,自杀死亡率远低于国外比例5,罪犯自伤自残尤其是自杀等非正常死亡事件常会引起媒体和社会的关注,对监狱内工作人员、其他罪犯以及监狱系统造成严重影响,对自伤自杀罪犯的治疗与监管还会进一步DOI:10.19907/j.0490-6756.2023.063005收稿日期:2 0 2 3-0 4-0 5基金项目:罪犯综合评估系统研发项目(HX20220768);四川省科技计划(2 0 2 0 YFS0575)作者简介:郑子强(1994一),男,研究实习员,硕士,研究方向为自然语言处理与语音信号处理。E-mail:z h e n g z i
8、 q i a n g w c h s c u.c n通讯作者:张伟.E-mail:z h a n g w e i w c h s c u.c n063005-1第6 0 卷增加成本.2 0 0 7 年世界卫生组织将减少监狱自杀人数列为国际优先事务6,许多国家都制定了预防罪犯自伤自杀的标准和指南7,但如何有效评估罪犯自杀风险成为了各国监狱的研究重点,预防罪犯自杀,首先需要了解该类事件的产生因素.Duth等8 研究了法国男性囚犯的监禁特征与自杀风险之间的联系,结果显示自杀与罪名、年龄相关,多发生于住院期间和惩戒室内,亲属探视可有效降低自杀率.2 0 14年,柳叶刀发布了一项关于英格兰和威尔士监狱罪
9、犯自伤的研究报告9,表明自伤人群主要为年轻人和白人,与监狱类型、刑期、罪名相关,同时自伤事件的后续一个月以内是自杀高风险期.此项工作已经对英格兰和威尔士监狱管理局对危险犯的管理方式产生了影响.目前国内外对于罪犯自伤自杀的相关危险因素研究较多,也得到了基本共识,与罪犯自伤自杀最相关的因素有罪犯的自杀意念、自杀自残史、精神疾病和单独监禁10,11.尽管目前已经有如此多的研究确定了罪犯自伤自杀行为的广泛风险因素,但并没有确定哪些罪犯最有可能在监禁期间对他们的自杀意念采取行动,大多数有自杀意念的人没有自杀行为12,这意味着自杀意念并不是一个充分的原因.Favril等131从比利时15个监狱中随机抽取了
10、12 0 3名男性罪犯,以自我报告的形式来了解他们的自杀意念,约三分之一的参与者存在自杀念头,其中2 6%的人在狱中企图自杀,占所有参与者的9%.该研究显示,对于存在自杀意念的罪犯,需要关注是否有吸毒、暴力犯罪、非自杀性自残史,这些因素是该群体高自杀风险的标志.既往的研究主要聚焦于实证研究,宏观地考察了自杀罪犯与环境、生理、心理等因素之间的关系,而犯人作为个体的声音则一直被排除在研究的内容之外。目前对于自伤自杀言语特征的研究较少,相关文献不多,而且基本上都是与抑郁症相关联.实际上,重度抑郁症和双相情感障碍这两种情绪障碍在自杀死亡中占很大比例14,新出现的证据进一步支持了情绪障碍严重程度与自杀风
11、险之间存在强有力的表型关系15,从听感上,早期研究者形容自杀倾向者说话时音调单一16.有研究发现,声带抖动和声门频谱参数对近期自杀患者、抑郁患者、非抑郁对照组有良好的识别能力,支持了语音与自杀风险之间的联系17.18.对抑郁患者和高自杀风险者的语音特征进行分析,结果表明梅尔倒谱四川大学学报(自然科学版)系数(Mel Frequency Cepstrum Coefficient,MF-CC)和声门谱斜率参数在重度抑郁相对应的声带指标上略高,组间分离表现较好19。国内外暂未查见基于音频的罪犯自杀评估研究,还处于话语分析、解释归因形成评估量表的阶段.相较于传统的量表筛查方法,机器学习和深度学习方法可
12、以为自杀筛查和评估提供更精确客观的指标2 0,主要应用于问卷调查2 1、语音学2 2、电子健康记录2 3、fMRI24等,均取得了不错的效果。受限于场景和成本,文章仅围绕罪犯音频开展研究,为现代化监狱的罪犯自杀危险性评估奠定语音研究基础。2相关工作语音信号形简意丰,由语言和音频构成,语言是语音的内容,用于表达语义,音频是语音信号的载体,体现的是语音的声学特征。通常情况下,语音分析是结合语言特征和音频特征共同分析,但对于小语种或方言,人工理解尚有困难,计算机对于这些资源稀缺语言的识别性能更差,若人工转录成本又过高,因此研究者们尝试仅通过自杀患者的声学特征来学习自杀意念和自杀行为的检测方法,并已证
13、明了声学特征与自杀倾向之间的关系17,18.2.1自杀音频声学特征自杀音频声学特征主要分为韵律特征、声源特征、共振峰特征和频谱特征。(1)韵律特征(Prosodic Feature).韵律特征主要体现说话人的语速、节奏、能量、基频(也称为FO)等特征,其中能量和基频能够直接反映声音的响度和音高,因此是最常用的特征。自杀倾向者存在声能降低、音高变化少等特点2 5,并且语音信号的衰减速度更加缓慢(2)声源特征(SourceFeature).声源特征测量的是发声过程中的声音质量,表现从肺部通过声门时的气流变化.自杀倾向者的喉部控制会受到影响,出现刺耳、呼吸音、尖锐音,这一变化可以反映在声源特征上2
14、6.自杀音频分析中广泛使用的声源特征包括基频微扰(Jitter)、振幅微扰(Shim-mer)、谐波噪声比,这些声源特征与声带振动直接相关,已被证明与自杀倾向相关17.2 7。(3)共振峰特征(FormantFeature).共振峰特征是测量鼻腔和声道共振的物理特征,因此喉咙肌肉张力、唾液分泌的变化,均可以通过共振峰特征捕捉.许多研究已经证明共振峰特征变化与自杀状063005-2第6 期第6 期态之间的关系,例如,France 等2 8 研究发现,自杀倾向者的共振峰频率增加和带宽减少.Stasak等2 9研究表明共振峰特征有助于识别自杀患者。(4)频谱特征(Spectral Features)
15、.频谱特征表示在给定时间内语音信号的频率分布.自杀音频分析中常用的频谱特征有梅尔倒谱系数(Mel Fre-quency Cepstral Cofficients,M FCC)和功率谱密度(Power Spectral Density,PSD).多项研究表明,将 MFCC和其他声学特征相结合,能够有效提升非抑郁患者、近期自杀患者和抑郁症患者的识别准确率19 30-32 ,2.2基于音频的自杀检测方法目前基于音频的自杀检测方法主要分为两类,一类是统计分析法,另一类是机器学习分类法.统计分析法是将音频特征作为观测变量,应用统计学方法挖掘相关特征及特征维度之间的关系,用于描述自杀者与健康者音频之间的独
16、特性17,2 8,31.机器学习分类法是对具有相似音频特征的人群进行分类,以期望将自杀者和健康者区分开来.目前使用最多的机器学习分类方法是支持向量机(SupportVector Machines,SVM)18.34,也有结合Ada-BoostM135、K 近 邻(K-Nearest Neighbor,KNN)29等算法对自杀者和非自杀者的音频特征进行二分类学习.除此之外,还有研究用高斯混合模型对自杀者的音频特征分布进行建模32.36 1.尽管深度学习模型已经在抑郁症检测37、阿尔兹海默症检测38 等任务上取得了不错的效果,但很少应用于基于音频的自杀倾向检测.3研究方法研究方法主要包括四个步骤:
17、(1)获取罪犯音频数据;(2)对音频数据进行数据处理;(3)音频特征提取,并选择关键特征;(4)训练分类模型,并在测试音频上进行有/无自杀倾向的人群分类实验.文章提出的方法整体流程如图1所示.3.1音频数据获取研究数据来源于对监狱罪犯的访谈访谈室为监区内独立办公室,环境设置参考了其他访谈数据集的环境,同时结合了心理医生访谈环境和监狱心理咨询民警的意见.室内摆放一张圆桌和两张座椅,访谈员和罪犯呈桌角式落座,可以让双方有自由的目光接触,给罪犯带来轻松自在的心理感受.罪犯由民警带人访谈室,然后民警在访谈室外等待访谈结束后,进人访谈室将罪犯带离.为了能够让郑子强,等:基于音频的罪犯自杀危险性评估数据获
18、取无自杀倾向有自杀倾向图1研究方法流程概要Fig.1Overview of methodology3.2音频数据处理录制下来的音频为完整的访谈音频,包含访者和罪犯两人,因此需要对音频进行剪辑处理.音频剪辑流程如图2 所示,基于python工具包实现.音频数据音频剪辑音频校正完成图2 音频剪辑流程Fig.2Flowof audioclips剪辑完成后得到采样率为16 kHz,采样位宽为16 bit,单声道的wav文件.3.3音频特征提取文章采用openSMILE提取音频特征,选用2016年ComParE_2016特征集,包含了MFCC、基频、响度等6 5个低水平特征,基于这些低水平特征计算得到高
19、级统计量共6 37 3维特征.该特征集的音频特征十分全面,但是过多的特征会降低模型的可解释性,因此采用特征选择从特征集合中选择出相关特征子集。063005-3第6 0 卷罪犯畅所欲言,访谈室内仅罪犯和访者两人,无第三者在场.访者在访谈开始时声明本次谈话仅作为学术之用,对罪犯在狱内的表现、加扣分、刑期等均无影响,尽可能让罪犯保持自然状态.在访谈过程中进行音视频的同步记录,禁止人员进出、室外交谈走动,以减少噪音干扰,保证数据质量。数据处理特征提取人群分类模型训练一音频降噪,话说人识别一音频分割,提取罪犯音频-格式转换(pcmtowav)-降采样(48 kHzto16kHz)一罪犯音频存储并重命名)
20、openSMILE第6 0 卷特征选择算法分为过滤式、包装式和嵌人式三种,其中嵌人式结合了过滤式和包装式的优点,将特征选择嵌入到模型构建的过程中,常用方法有Lasso 和树模型.3.4分类模型训练选用 KNN、SVM、随机森林(Random Forest,RF)和逻辑回归(Logistic Regression,LR)等四种监督学习算法对人群进行分类模型训练.(1)K NN:每个样本都可以用它最接近的k个邻居来预测它的类别;(2)SVM:在特征空间中找到一个使正负例间隔最大的超平面;(3)RF:由多个决策树组成,个别决策树选择的众数决定输出类别;(4)LR:通过logistic回归分析,得到自
21、变量的权重,根据该权重来预测类别.4实验与分析4.1实验数据2022年7 月,项目组联合四川省监狱管理局和四川大学华西医院组织访谈员对某监狱内服刑人员进行访谈调查,本次访谈共41人,其中有12人曾实施过自伤自杀或具有不同程度的自伤自杀倾向,作为有自杀倾向的实验组,其余2 9人作为无自杀倾向的对照组.完整访谈数据时间长达12.43h,平均每段访谈时长18.2 min,经过数据处理后,罪犯音频平均时长为9.7 min.本研究及其程序得到了华西医院生物医学伦理委员会的批准,所有的方法都按照相关的准则和规定进行,整个实验遵循赫尔辛基宣言。4.2评估指标在评估指标的选取方面,文章使用了四种性能度量:精度
22、(Precision,Pr e)、召回率(Recall)、F1分数(F1)、RO C曲线下面积(Area Under Curve,AUC).各指标的解释如下:(1)Pr e:正确预测为有自杀倾向样本的数量与所有预测为有自杀倾向样本的数量之比;(2)Re c a ll:所有实际有自杀倾向样本中被预测正确的比例;(3)F1:精度和召回率的调和平均值;(4)A U C:用于比较多个模型的分类效果,值越大说明分类效果越好。4.3实验结果与分析4.3.1特征选择实验采用随机森林对转换后的6373维特征进行特征选择,并按重要性进行排序,选定排名前40 的特征,重要性排名前十的特征如表1所示.在选定的40
23、个特征中,有39 个特征是四川大学学报(自然科学版)基于梅尔频谱和梅尔倒谱系数计算得到,还有一个特征为最终基频候选的发声概率,与前文所述语音信号衰减速度相关.表1特征重要性排名前十Tab.1Top 10 most label-dependent features排名123456789104.3.2人群分类实验为了说明特征选择实验的有效性,将原始特征集表示为DA,筛选后的特征集表示为Ds.由于实验数据样本量较少,在实验过程中,使用十折交叉验证对数据集进行划分,并进行10次,最后计算各指标均值用于模型评估,得到的最佳平均性能如表2 所示.表2 人群分类的实验结果Tab.2Results of po
24、pulation classification模型Pre/%IRecall/%KNN43.69SVM15.35DARFLRKNNSVMDsRFLR由表2 可知,特征选择使整体分类效果都得到了大幅提升,其中RF取得了最好的分类效果,平均F1值达到了8 6.8 8%.由于自杀检测常与抑郁症检测进行对照,并且存在方法上的相似性,因此本文与目前基于音频的自杀检测方法和抑郁症检测方法进行了对比,结果如表3所示.其中深度学习方法为多模态融合方法,在本实验中仅采用了音频模型部分参与对比,实验结果说明了本文的方法在判别罪犯是否具有自伤自杀倾向具有更好的识别效果.063005-4第6 期特征重要性索引mfcc_
25、sma_de13_skewness0.6113609audSpec_Rfilt_sma20_amean0.281mfc_sma_de14_percentile99.00.1943.637mfc_sma_de14_pctlrange0-10.1863638audSpec_Rfilt_sma_de12_pctlra0.1792.336mfcc_sma_de14_iqr2-30.1653634audSpec_Rfilt_sma_de21_percen0.146audSpec_Rfilt_sma8_kurtosis0.146audSpec_Rfilt_sma20_rqmean0.1444.685mfc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 音频 罪犯 自杀 危险性 评估
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。