当AI学习共情:心理学视角下共情计算的主题、场景与优化.pdf
《当AI学习共情:心理学视角下共情计算的主题、场景与优化.pdf》由会员分享,可在线阅读,更多相关《当AI学习共情:心理学视角下共情计算的主题、场景与优化.pdf(14页珍藏版)》请在咨信网上搜索。
1、心理科学进展 2024,Vol.32,No.5,845858 2024 中国科学院心理研究所 Advances in Psychological Science https:/doi.org/10.3724/SP.J.1042.2024.00845 845 当 AI 学习共情:心理学视角下共情计算的 主题、场景与优化*侯悍超 倪士光 林书亚 王蒲生(清华大学深圳国际研究生院,深圳 518055)摘 要 共情计算是指使用人工智能和大数据技术来预测、识别、模拟和生成人类的共情,是传统心理学共情研究与计算机科学交叉的新兴研究领域。本研究构建了一个数据层、模型层与任务层的普适性研究框架,总结了一个包括
2、个体共情测评、共情内容分类、共情回应系统和共情对话生成的 4 个新主题分析框架,建立了面向心理健康、教育学习、商业服务和公共管理等心理应用的场景创新。未来研究有必要建构高整合的共情计算理论模型、建设高可信的共情心理行为特征数据集,并通过以人为中心的评价体系验证并改进共情计算的研究效度。共情计算有益于将当前人际共情研究扩展到智能社会新型人AI 关系研究中。心理学家在该领域承担引领、评估和改进等角色,并与计算机科学家紧密合作,共同推动共情计算理论基础更坚实,效果检验更可靠,应用创新更贴近实际需求。关键词 共情,共情计算,计算心理学,人工智能,人机交互 分类号 B849 共情(empathy)是指感
3、受和理解他人情绪,并做出合理回应的心理和行为过程,也指个体完成这一过程的能力或特质(Bonjakovi&Radionov,2018;Hall&Schwartz,2019;Preston&de Waal,2002)。共情在个体的社会生活中扮演重要角色,与亲社会行为(de Waal,2008)、良好的人际关系(Morelli et al.,2017)及幸福感(Grhn et al.,2008)密切相关。作为心理学的一个重要研究主题,共情在人格与社会心理学、发展心理学、咨询心理学 等 领 域 都 积 累 了 许 多 的 研 究 成 果(Hall&收稿日期:2023-03-29*全 国 教 育 科 学
4、“十 四 五”规 划 2021 年 度 课 题(BBA210042)。通信作者:倪士光,E-mail: 1 这里以及后文中提及计算机和 AI 所具备的“能力”,是指计 算 系 统 执 行 特 定 任 务 或 功 能 的 能 力,英 文 译 作capability。具体而言,文中计算机的“共情能力”,指计算机通过模拟人类语言和行为,输出与人类相似的共情特征的能力(capability)。尽管同样使用了“能力”一词,但其内涵与人类具有的共情能力(ability)并不等同。Schwartz,2019)。2022 年末,ChatGPT(OpenAI et al.,2023)的推出标志着人工智能(art
5、ificial intelligence,AI)开始进入普通人的日常生活。与过去冷冰冰的机器形象不同,最新研究表明,基于大语言模型的 AI已经表现出一定的共情能力(capability)1,可以在情绪识别任务中达到普通人的平均水平(Kosinski,2023;Wang et al.,2023)。共情计算(empathy computing)是在 AI 技术飞速发展背景下兴起的心理学与计算机科学交叉研究领域,旨在运用计算的方法自动化分析和模拟共情。计算机科学的进步使得大规模收集和自动化分析心理和行为数据更加高效和便捷,从而为共情计算研究提供了条件。研究者通过机器学习等方法,分析过去通过人工编码无
6、法处理的大量文本和音频等数据,在更大尺度上验证和改进传统的共情研究(Xiao,Imel,Georgiou,et al.,2015)。另一方面,人工智能技术的应用正在扩展到科研、医疗、教育、服务和社会治理等领域(Zhu et al.,2023),使得人与 AI的互动更为普遍;表现出共情能力的人机交互系统提升人对机器的信任、投入感、减少互动中的846 心 理 科 学 进 展 第 32 卷 挫败感并提升互动的时长(Pelau et al.,2021;Yaln&DiPaola,2020),可见对 AI 共情能力的需求也催生了共情计算的研究。近年来,共情计算越来越受到关注。2023 年初自然机器智能发表
7、了一项由计算机和心理学 领 域 的 研 究 者 共 同 完 成 的 共 情 计 算 研 究(Sharma et al.,2023)。研究者开发了一个共情计算系统,该系统评估助人者回复的共情程度,并提供改写建议,协助朋辈助人者提供更有“人情味”的回复(图 1)。结果表明,与助人者独立完成的对话相比,AI 和人配合的回复表现出更高的共情水平。尽管已经有一些心理学研究者开始参与共情计算研究,目前多数研究仍来自于计算机领域。通过本文的介绍,希望引起更多心理学研究者对共情计算的兴趣和关注,并促进共情计算的基础研究和应用。1 共情计算的理论背景 1.1 传统共情研究 共情计算是一个新兴领域,其发展建立在传
8、统共情研究的基础之上。传统研究在共情的概念、测量、神经基础、个体差异以及在心理咨询等领 域的应用等方面有丰富成果。研究者普遍接受共 情包含了情感和认知成分,也有一部分研究者认为行为成分也包含在内(Cuff et al.,2014;Stosic et al.,2022)。情感成分是指直接感受和分享他人情绪的过程,认知成分是指个体间接地想象和设身处地理解他人情绪的过程,行为成分是指互动时让对方感到温暖、被理解和支持的行为(Stosic et al.,2022)。多数研究采用自我报告法,从情感和认知两方面测量共情(Hall&Schwartz,2019)。以经典的人际反应指针量表(Interperso
9、nal Reactivity Index,IRI;Davis,1983)为例,它包括 4 个分量表:共情关注(empathic concern)和个人苦恼(personal distress)维度分别测量个体的情感共情能力,而想象(fantasy)和观点采择(perspective taking)两个分量表用来测量认知共情能力。近年新开发的测量工具,基本共情量表(Basic Empathy Scale,BES;Jolliffe&Farrington,2006),认知和情感共情量表(Questionnaire of Cognitive and Affective Empathy,QCAE;Ren
10、iers et al.,2011),珀斯共情量表(Perth Empathy Scale,PES;Brett et al.,2023)等也是在这一基础上改进而成的。神经科学研究表明,情感共情主要与镜像神经系统有关,包括额下回、顶下小叶、后顶叶皮质和颞上沟等脑区,而认知共情则与心理理论神经系统有关,如内侧前额叶、图 1 共情计算研究范例(改编自:Sharma et al.,2020,2021,2023)第 5 期 侯悍超 等:当 AI 学习共情:心理学视角下共情计算的主题、场景与优化 847 颞上沟、颞顶联合区和颞极等(岳童,黄希庭,2016)。情感共情和认知共情并非完全独立,两者间存在一个共同
11、激活过程(Schurz et al.,2021)。人的 整 体 共 情 能 力 和 特 质 共 情 存 在 个 体 差 异(Mooradian et al.,2011);共情被广泛应用于心理咨询,对咨询效果有中等强度的正向预测作用(Elliott et al.,2011)。这些传统研究成果为共情计算的发展奠定基础并提供启示。共情概念和成分的研究为共情计算提供了理论框架,明确研究范畴。传统自评量表作为校标,可以评估共情计算的准确性和可靠性。人类共情的神经机制研究可能为设计脑机交互提供启发(Roshdy et al.,2021)。以往的应用研究也为共情计算潜在应用场景指明方向。1.2 共情计算的概
12、念 共情计算尚未形成统一的定义。本文结合作者的自身认知以及现有文献中的描述,将共情计算定义为:使用计算系统收集并处理文字、声音、图像、生理信号等多模态数据,用以预测、识别、模拟和生成人与人、人与机器间共情心理和行为的研究领域(Preston&de Waal,2002;Xiao et al.,2016;Yaln&DiPaola,2020)。其中计算系统包括计算机、传感器等硬件设备以及支持其完成自动化运算的软件。共情计算研究不仅仅指运用计算方法分析各种生理、心理、行为信号来测量共情,也包括通过模拟这些信号使人工智能或机器人表现出共情能力。由于侧重点不同,研究者对于该领域有一些不同称呼,如共情性计算
13、(empathetic computing;Cai,2006),计算共情(computational empathy;Yaln&DiPaola,2020)或人工共情(artificial empathy;Asada,2015;Cao et al.,2021)等。鉴于研究手段以及目标的相似性,我们认为这些都是共情计算相关的研究领域。1.3 共情计算的研究框架 为了展现共情计算领域的全貌,本文建构了共情计算的研究框架,如图 2 所示。心理学研究为共情计算收集和标注数据、建构模型提供理论依据,并贡献研究主题。计算机科学方面则支持共情计算收集多模态的数据、设计算法以及编写所需的程序。共情计算又反过来促
14、进心理学和计算机科学的研究。共情计算主要由数据、模型和任务三个层面组成。在数据层,通过各种数据源头收集与共情有关的生理、心理和行为多模态数据,如语言、面部表情、语音语调等。这些数据来自问卷调查、临床或实验等传统心理学研究方法,如心理咨询的视频录像;也可能来自智能手机、智能手表、虚拟现实(Virtual Reality,VR)眼镜等数字设备的使用过程,如社交媒体中表达出对新闻当事人共情的留言。在模型层,研究者建立共情的计算模型,使计算机可以通过算法“学习”共情。一般做法是基于共情的心理学理论(例如 Sharma et al.,2020)或采用数据驱动的方式(例如 Rashkin et al.,2
15、019)抽取数据中有关共情的特征(如表达共情的 图 2 共情计算的研究框架 848 心 理 科 学 进 展 第 32 卷 词汇、缓和的语调等),随后用这些特征训练计算模型,训练后的模型可用于预测新数据或生成新内容。深度学习是近几年共情计算研究中常用的方法,属于机器学习的一种,是指通过神经网络模拟大脑中的神经元,从而进行模式识别和特征提取,对复杂数据的学习和处理。常用的深度学习模型有递归神经网络(Recurrent Neural Networks,RNN)、卷积神经网络(Convolution Neural Networks,CNN)、长短时记忆(Long Short Term Memory,L
16、STM)和 Transformers(Vaswani et al.,2017)等。在任务层,现有的研究主要分为 4 个主题:个体共情测量、文本共情内容分类、共情回应系统和共情对话生成。2 共情计算的研究主题 作为一个新兴领域,共情计算的研究内容在不断发展变化中。当前主要研究,可以根据目的和手段不同分为 4 个主题。一方面,共情计算的首要任务是计算机分析和理解共情,分为(1)个体共情测量和(2)共情内容分类,前者侧重于分析个体的共情特质,后者聚焦于分析文本中的共情特征,而非真实的人。另一方面,这一研究领域致力于使计算机模拟和表现共情,包括(3)设计共情性回应系统和(4)开发生成式共情对话系统,前
17、者设计有限的回应方式并根据规则给用户反馈以表现共情,后者则利用 AI 自动生成共情性的对话。这些主题相对独立但互补,随着研究的深入,也会产生新的主题。2.1 个体共情测评 个体共情测评是共情计算较早发展的领域,起初是为了评估心理咨询师,如通过文字和语音评价心理咨询师的共情能力(Xiao,Imel,Georgiou,et al.,2015),随后扩展到其他情景,如通过社交媒体信息识别可能损害用户健康的致病性共情(pathogenic empathy)(Abdul-Mageed et al.,2017)。这类研究的做法是研究者基于理论,或者通过数据驱动的方法提取可能与共情有关的行为特征(如具有代表
18、性的词语、语调、或表情等),通过机器学习等方法建立行为特征与自我报告或专家评分之间的关系模型,随后再使用建立好的模型对新的数据集进行评分(Xiao et al.,2016)。目前的研究已经探索了对话文本(Chakravarthula et al.,2015;Gibson et al.,2016;Gibson et al.,2015;Litvak et al.,2016)、语调(Imel et al.,2014;Xiao et al.,2014)、语速(Xiao,Imel,Atkins,et al.,2015)、面部表情(Kumano et al.,2011;Mathur et al.,2021
19、)、目光(Ishii et al.,2018)等多种行为特征与共情的关系。如 Litvak 等(2016)研究发现社交媒体上的语言风格和特质共情有关,代词的使用数量和 IRI 量表中的观点采择子维度有较高的相关性。Xiao 等(2014)发现高音调与心理咨询师的低共情有关。通过计算的方法测量个体的共情特质,为自动化、大规模评估和研究共情提供了有效的工具。共情计算的方法已经对个体的共情水平做出较准确的测量,与专家评分达到了较高的相关(r=0.65)(Xiao,Imel,Georgiou,et al.,2015)。此外,这些研究也为设计能够展现共情能力的 AI 或机器人提供参考,如训练机器人在对话
20、、语调、语速等方面表现得更接近高共情特质的人。不过,某项行为特征在预测共情时是否具有跨语言、文化、情景适用性还需要更多研究。在美国样本中预测共情的语调同步性在法语咨询中并未得到验证(Gaume et al.,2019)。此外,人类评估者倾向于整合言语和非言语的行为对个体的共情能力做出整体判断(Xiao et al.,2012),未来研究需要探索怎样整合文本、音频、视频等多模态数据(Ma et al.,2022),以更自然地评估共情水平与共情内容。2.2 共情内容分类 共情计算的另一个重要主题是识别文本中表现出共情的关键词或句子,或依据所表现出的共情强度将文本分类。由于绝大多数网络本文数据无法追
21、溯内容发布者以获取心理测量数据,这类研究以文本本身作为研究对象,而非测量文本所反映的个体共情特质。研究者开发了面向具体场景中共情信息的识别模型,如识别线上癌症社区中的共情留言(Khanpour et al.,2017),评估在线朋辈写作互评中的共情程度(Wambsganss et al.,2022),和评估读者所写的新闻读后感中所表现出的共情程度(Buechel et al.,2018;Zhou et al.,2021)等。这类研究首先建立标注过的共情内容数据集,随后用标注过的数据集训练模型,最后得到识别文本中共情信息的位置,或者为内容的共情程度评分的共情计算模型(Sharma et al.,
22、2020)。聚焦于文本内容的共情计算研究不依赖个体心理测量数据,便于更大范围收集数据,补充并第 5 期 侯悍超 等:当 AI 学习共情:心理学视角下共情计算的主题、场景与优化 849 扩展了前文中个体共情特质的计算,为分析社交网络对话中的共情提供工具,也为生成共情对话提供参考。共情内容识别和评估已达到较高准确率,如在判定一段留言是否共情时 Khanpour 等(2017)报告了 78.61%的准确率,并具备一定程度的跨场景迁移能力,如基于新闻评论开发的模型也可以用于评估论坛跟帖和电影脚本的共情(Zhou et al.,2021),因此有广泛的应用前景。然而,当前研究局限在于从第三人视角评估文本
23、内容,未能真实反应内容作者和读者的个人体验。为了弥补这一局限,研究者正致力于收集真实对话情境中发言者和听众的第一人视角的共情体验数据,以更全面地分析文本中的共情内容(Barriere et al.,2022;Omitaomu et al.,2022)。未来研究需要整合不同视角的数据,继续提高算法准确性,并进一步验证和拓展模型的跨场景适用性。2.3 共情回应系统 在人工智能技术尚未成熟的阶段,为实现更加人性化的人机交互,使计算机不仅能执行人类交给的任务,而且能回应人类的情绪,研究者早期采用基于规则的方法,设计了根据不同情绪做出相应回应的计算系统。这类系统通过计算方法将用户的情绪归类,然后提供预先
24、设计好的共情性反馈。如 Terzis 等(2012)根据计算机自动面部识别和人工识别相结合的方法,识别了学生的 6 种基本情绪(开心、生气、伤心、惊讶、害怕、厌恶),并根据情绪给出相应的鼓励或安抚,是这一领域最早的尝试。也有些研究并不识别用户的情绪,而是根据用户在任务中的表现推测用户可能需要的反馈。Leite 等(2013)的研究中,棋手走位接近计算机判断的最优解,系统会予以鼓励,如果走位不好则鼓励其思考更优方案。也有研究同时结合情绪识别和任务表现提供相应的共情性反馈(Dmello&Graesser,2013)。基于规则的共情系统设计在早期推动了共情计算领域的发展,也在实际应用中取得了较好的效
25、果,如提升答题正确率(Guo&Goh,2016),缓冲消极情绪对于创造力的影响(Groh et al.,2022)等。这类研究技术门槛相对较低,反馈逻辑清晰,便于理解,因而至今仍被研究者采用。然而,其预先设计的回应内容,难以应对复杂和细微的情绪的变化,使得它们更适用于任务边界清晰的场景,而在可迁移性方面存在一定局限。此外,当前许多研究缺乏共情性回应的定义和标准。以 Guo 和Goh(2016)的研究为例,研究中所设计的共情回应是学生作答错误时展现鼓励性的微笑,并提示“不要气馁,仔细阅读一遍问题”。然而根据心理咨询中的情感反映(reflection)技术(Hill,2009),回应“这道题答错了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 学习 心理学 视角 下共情 计算 主题 场景 优化
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。