分销赏收藏举报申诉 / 14

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 当AI学习共情：心理学视角下共情计算的主题、场景与优化.pdf

当AI学习共情：心理学视角下共情计算的主题、场景与优化.pdf

上传人：自信****多点

文档编号：2561933

上传时间：2024-05-31

格式：PDF

页数：14

大小：1.28MB

《当AI学习共情：心理学视角下共情计算的主题、场景与优化.pdf》由会员分享，可在线阅读，更多相关《当AI学习共情：心理学视角下共情计算的主题、场景与优化.pdf（14页珍藏版）》请在咨信网上搜索。

1、心理科学进展 2024,Vol.32,No.5,845858 2024 中国科学院心理研究所 Advances in Psychological Science https:/doi.org/10.3724/SP.J.1042.2024.00845 845 当 AI 学习共情：心理学视角下共情计算的主题、场景与优化*侯悍超倪士光林书亚王蒲生(清华大学深圳国际研究生院,深圳 518055)摘要共情计算是指使用人工智能和大数据技术来预测、识别、模拟和生成人类的共情,是传统心理学共情研究与计算机科学交叉的新兴研究领域。本研究构建了一个数据层、模型层与任务层的普适性研究框架,总结了一个包括

2、个体共情测评、共情内容分类、共情回应系统和共情对话生成的 4 个新主题分析框架,建立了面向心理健康、教育学习、商业服务和公共管理等心理应用的场景创新。未来研究有必要建构高整合的共情计算理论模型、建设高可信的共情心理行为特征数据集,并通过以人为中心的评价体系验证并改进共情计算的研究效度。共情计算有益于将当前人际共情研究扩展到智能社会新型人AI 关系研究中。心理学家在该领域承担引领、评估和改进等角色,并与计算机科学家紧密合作,共同推动共情计算理论基础更坚实,效果检验更可靠,应用创新更贴近实际需求。关键词共情,共情计算,计算心理学,人工智能,人机交互分类号 B849 共情(empathy)是指感

3、受和理解他人情绪,并做出合理回应的心理和行为过程,也指个体完成这一过程的能力或特质(Bonjakovi&Radionov,2018;Hall&Schwartz,2019;Preston&de Waal,2002)。共情在个体的社会生活中扮演重要角色,与亲社会行为(de Waal,2008)、良好的人际关系(Morelli et al.,2017)及幸福感(Grhn et al.,2008)密切相关。作为心理学的一个重要研究主题,共情在人格与社会心理学、发展心理学、咨询心理学等领域都积累了许多的研究成果(Hall&收稿日期:2023-03-29*全国教育科学

4、“十四五”规划 2021 年度课题(BBA210042)。通信作者:倪士光,E-mail: 1 这里以及后文中提及计算机和 AI 所具备的“能力”,是指计算系统执行特定任务或功能的能力,英文译作capability。具体而言,文中计算机的“共情能力”,指计算机通过模拟人类语言和行为,输出与人类相似的共情特征的能力(capability)。尽管同样使用了“能力”一词,但其内涵与人类具有的共情能力(ability)并不等同。Schwartz,2019)。2022 年末,ChatGPT(OpenAI et al.,2023)的推出标志着人工智能(art

5、ificial intelligence,AI)开始进入普通人的日常生活。与过去冷冰冰的机器形象不同,最新研究表明,基于大语言模型的 AI已经表现出一定的共情能力(capability)1,可以在情绪识别任务中达到普通人的平均水平(Kosinski,2023;Wang et al.,2023)。共情计算(empathy computing)是在 AI 技术飞速发展背景下兴起的心理学与计算机科学交叉研究领域,旨在运用计算的方法自动化分析和模拟共情。计算机科学的进步使得大规模收集和自动化分析心理和行为数据更加高效和便捷,从而为共情计算研究提供了条件。研究者通过机器学习等方法,分析过去通过人工编码无

6、法处理的大量文本和音频等数据,在更大尺度上验证和改进传统的共情研究(Xiao,Imel,Georgiou,et al.,2015)。另一方面,人工智能技术的应用正在扩展到科研、医疗、教育、服务和社会治理等领域(Zhu et al.,2023),使得人与 AI的互动更为普遍;表现出共情能力的人机交互系统提升人对机器的信任、投入感、减少互动中的846 心理科学进展第 32 卷挫败感并提升互动的时长(Pelau et al.,2021;Yaln&DiPaola,2020),可见对 AI 共情能力的需求也催生了共情计算的研究。近年来,共情计算越来越受到关注。2023 年初自然机器智能发表

7、了一项由计算机和心理学领域的研究者共同完成的共情计算研究(Sharma et al.,2023)。研究者开发了一个共情计算系统,该系统评估助人者回复的共情程度,并提供改写建议,协助朋辈助人者提供更有“人情味”的回复(图 1)。结果表明,与助人者独立完成的对话相比,AI 和人配合的回复表现出更高的共情水平。尽管已经有一些心理学研究者开始参与共情计算研究,目前多数研究仍来自于计算机领域。通过本文的介绍,希望引起更多心理学研究者对共情计算的兴趣和关注,并促进共情计算的基础研究和应用。1 共情计算的理论背景 1.1 传统共情研究共情计算是一个新兴领域,其发展建立在传

8、统共情研究的基础之上。传统研究在共情的概念、测量、神经基础、个体差异以及在心理咨询等领域的应用等方面有丰富成果。研究者普遍接受共情包含了情感和认知成分,也有一部分研究者认为行为成分也包含在内(Cuff et al.,2014;Stosic et al.,2022)。情感成分是指直接感受和分享他人情绪的过程,认知成分是指个体间接地想象和设身处地理解他人情绪的过程,行为成分是指互动时让对方感到温暖、被理解和支持的行为(Stosic et al.,2022)。多数研究采用自我报告法,从情感和认知两方面测量共情(Hall&Schwartz,2019)。以经典的人际反应指针量表(Interperso

9、nal Reactivity Index,IRI;Davis,1983)为例,它包括 4 个分量表：共情关注(empathic concern)和个人苦恼(personal distress)维度分别测量个体的情感共情能力,而想象(fantasy)和观点采择(perspective taking)两个分量表用来测量认知共情能力。近年新开发的测量工具,基本共情量表(Basic Empathy Scale,BES;Jolliffe&Farrington,2006),认知和情感共情量表(Questionnaire of Cognitive and Affective Empathy,QCAE;Ren

10、iers et al.,2011),珀斯共情量表(Perth Empathy Scale,PES;Brett et al.,2023)等也是在这一基础上改进而成的。神经科学研究表明,情感共情主要与镜像神经系统有关,包括额下回、顶下小叶、后顶叶皮质和颞上沟等脑区,而认知共情则与心理理论神经系统有关,如内侧前额叶、图 1 共情计算研究范例(改编自：Sharma et al.,2020,2021,2023)第 5 期侯悍超等:当 AI 学习共情：心理学视角下共情计算的主题、场景与优化 847 颞上沟、颞顶联合区和颞极等(岳童,黄希庭,2016)。情感共情和认知共情并非完全独立,两者间存在一个共同

11、激活过程(Schurz et al.,2021)。人的整体共情能力和特质共情存在个体差异(Mooradian et al.,2011);共情被广泛应用于心理咨询,对咨询效果有中等强度的正向预测作用(Elliott et al.,2011)。这些传统研究成果为共情计算的发展奠定基础并提供启示。共情概念和成分的研究为共情计算提供了理论框架,明确研究范畴。传统自评量表作为校标,可以评估共情计算的准确性和可靠性。人类共情的神经机制研究可能为设计脑机交互提供启发(Roshdy et al.,2021)。以往的应用研究也为共情计算潜在应用场景指明方向。1.2 共情计算的概

12、念共情计算尚未形成统一的定义。本文结合作者的自身认知以及现有文献中的描述,将共情计算定义为：使用计算系统收集并处理文字、声音、图像、生理信号等多模态数据,用以预测、识别、模拟和生成人与人、人与机器间共情心理和行为的研究领域(Preston&de Waal,2002;Xiao et al.,2016;Yaln&DiPaola,2020)。其中计算系统包括计算机、传感器等硬件设备以及支持其完成自动化运算的软件。共情计算研究不仅仅指运用计算方法分析各种生理、心理、行为信号来测量共情,也包括通过模拟这些信号使人工智能或机器人表现出共情能力。由于侧重点不同,研究者对于该领域有一些不同称呼,如共情性计算

13、(empathetic computing;Cai,2006),计算共情(computational empathy;Yaln&DiPaola,2020)或人工共情(artificial empathy;Asada,2015;Cao et al.,2021)等。鉴于研究手段以及目标的相似性,我们认为这些都是共情计算相关的研究领域。1.3 共情计算的研究框架为了展现共情计算领域的全貌,本文建构了共情计算的研究框架,如图 2 所示。心理学研究为共情计算收集和标注数据、建构模型提供理论依据,并贡献研究主题。计算机科学方面则支持共情计算收集多模态的数据、设计算法以及编写所需的程序。共情计算又反过来促

14、进心理学和计算机科学的研究。共情计算主要由数据、模型和任务三个层面组成。在数据层,通过各种数据源头收集与共情有关的生理、心理和行为多模态数据,如语言、面部表情、语音语调等。这些数据来自问卷调查、临床或实验等传统心理学研究方法,如心理咨询的视频录像;也可能来自智能手机、智能手表、虚拟现实(Virtual Reality,VR)眼镜等数字设备的使用过程,如社交媒体中表达出对新闻当事人共情的留言。在模型层,研究者建立共情的计算模型,使计算机可以通过算法“学习”共情。一般做法是基于共情的心理学理论(例如 Sharma et al.,2020)或采用数据驱动的方式(例如 Rashkin et al.,2

15、019)抽取数据中有关共情的特征(如表达共情的图 2 共情计算的研究框架 848 心理科学进展第 32 卷词汇、缓和的语调等),随后用这些特征训练计算模型,训练后的模型可用于预测新数据或生成新内容。深度学习是近几年共情计算研究中常用的方法,属于机器学习的一种,是指通过神经网络模拟大脑中的神经元,从而进行模式识别和特征提取,对复杂数据的学习和处理。常用的深度学习模型有递归神经网络(Recurrent Neural Networks,RNN)、卷积神经网络(Convolution Neural Networks,CNN)、长短时记忆(Long Short Term Memory,L

16、STM)和 Transformers(Vaswani et al.,2017)等。在任务层,现有的研究主要分为 4 个主题：个体共情测量、文本共情内容分类、共情回应系统和共情对话生成。2 共情计算的研究主题作为一个新兴领域,共情计算的研究内容在不断发展变化中。当前主要研究,可以根据目的和手段不同分为 4 个主题。一方面,共情计算的首要任务是计算机分析和理解共情,分为(1)个体共情测量和(2)共情内容分类,前者侧重于分析个体的共情特质,后者聚焦于分析文本中的共情特征,而非真实的人。另一方面,这一研究领域致力于使计算机模拟和表现共情,包括(3)设计共情性回应系统和(4)开发生成式共情对话系统,前

17、者设计有限的回应方式并根据规则给用户反馈以表现共情,后者则利用 AI 自动生成共情性的对话。这些主题相对独立但互补,随着研究的深入,也会产生新的主题。2.1 个体共情测评个体共情测评是共情计算较早发展的领域,起初是为了评估心理咨询师,如通过文字和语音评价心理咨询师的共情能力(Xiao,Imel,Georgiou,et al.,2015),随后扩展到其他情景,如通过社交媒体信息识别可能损害用户健康的致病性共情(pathogenic empathy)(Abdul-Mageed et al.,2017)。这类研究的做法是研究者基于理论,或者通过数据驱动的方法提取可能与共情有关的行为特征(如具有代表

18、性的词语、语调、或表情等),通过机器学习等方法建立行为特征与自我报告或专家评分之间的关系模型,随后再使用建立好的模型对新的数据集进行评分(Xiao et al.,2016)。目前的研究已经探索了对话文本(Chakravarthula et al.,2015;Gibson et al.,2016;Gibson et al.,2015;Litvak et al.,2016)、语调(Imel et al.,2014;Xiao et al.,2014)、语速(Xiao,Imel,Atkins,et al.,2015)、面部表情(Kumano et al.,2011;Mathur et al.,2021

19、)、目光(Ishii et al.,2018)等多种行为特征与共情的关系。如 Litvak 等(2016)研究发现社交媒体上的语言风格和特质共情有关,代词的使用数量和 IRI 量表中的观点采择子维度有较高的相关性。Xiao 等(2014)发现高音调与心理咨询师的低共情有关。通过计算的方法测量个体的共情特质,为自动化、大规模评估和研究共情提供了有效的工具。共情计算的方法已经对个体的共情水平做出较准确的测量,与专家评分达到了较高的相关(r=0.65)(Xiao,Imel,Georgiou,et al.,2015)。此外,这些研究也为设计能够展现共情能力的 AI 或机器人提供参考,如训练机器人在对话

20、、语调、语速等方面表现得更接近高共情特质的人。不过,某项行为特征在预测共情时是否具有跨语言、文化、情景适用性还需要更多研究。在美国样本中预测共情的语调同步性在法语咨询中并未得到验证(Gaume et al.,2019)。此外,人类评估者倾向于整合言语和非言语的行为对个体的共情能力做出整体判断(Xiao et al.,2012),未来研究需要探索怎样整合文本、音频、视频等多模态数据(Ma et al.,2022),以更自然地评估共情水平与共情内容。2.2 共情内容分类共情计算的另一个重要主题是识别文本中表现出共情的关键词或句子,或依据所表现出的共情强度将文本分类。由于绝大多数网络本文数据无法追

21、溯内容发布者以获取心理测量数据,这类研究以文本本身作为研究对象,而非测量文本所反映的个体共情特质。研究者开发了面向具体场景中共情信息的识别模型,如识别线上癌症社区中的共情留言(Khanpour et al.,2017),评估在线朋辈写作互评中的共情程度(Wambsganss et al.,2022),和评估读者所写的新闻读后感中所表现出的共情程度(Buechel et al.,2018;Zhou et al.,2021)等。这类研究首先建立标注过的共情内容数据集,随后用标注过的数据集训练模型,最后得到识别文本中共情信息的位置,或者为内容的共情程度评分的共情计算模型(Sharma et al.,

22、2020)。聚焦于文本内容的共情计算研究不依赖个体心理测量数据,便于更大范围收集数据,补充并第 5 期侯悍超等:当 AI 学习共情：心理学视角下共情计算的主题、场景与优化 849 扩展了前文中个体共情特质的计算,为分析社交网络对话中的共情提供工具,也为生成共情对话提供参考。共情内容识别和评估已达到较高准确率,如在判定一段留言是否共情时 Khanpour 等(2017)报告了 78.61%的准确率,并具备一定程度的跨场景迁移能力,如基于新闻评论开发的模型也可以用于评估论坛跟帖和电影脚本的共情(Zhou et al.,2021),因此有广泛的应用前景。然而,当前研究局限在于从第三人视角评估文本

23、内容,未能真实反应内容作者和读者的个人体验。为了弥补这一局限,研究者正致力于收集真实对话情境中发言者和听众的第一人视角的共情体验数据,以更全面地分析文本中的共情内容(Barriere et al.,2022;Omitaomu et al.,2022)。未来研究需要整合不同视角的数据,继续提高算法准确性,并进一步验证和拓展模型的跨场景适用性。2.3 共情回应系统在人工智能技术尚未成熟的阶段,为实现更加人性化的人机交互,使计算机不仅能执行人类交给的任务,而且能回应人类的情绪,研究者早期采用基于规则的方法,设计了根据不同情绪做出相应回应的计算系统。这类系统通过计算方法将用户的情绪归类,然后提供预先

24、设计好的共情性反馈。如 Terzis 等(2012)根据计算机自动面部识别和人工识别相结合的方法,识别了学生的 6 种基本情绪(开心、生气、伤心、惊讶、害怕、厌恶),并根据情绪给出相应的鼓励或安抚,是这一领域最早的尝试。也有些研究并不识别用户的情绪,而是根据用户在任务中的表现推测用户可能需要的反馈。Leite 等(2013)的研究中,棋手走位接近计算机判断的最优解,系统会予以鼓励,如果走位不好则鼓励其思考更优方案。也有研究同时结合情绪识别和任务表现提供相应的共情性反馈(Dmello&Graesser,2013)。基于规则的共情系统设计在早期推动了共情计算领域的发展,也在实际应用中取得了较好的效

25、果,如提升答题正确率(Guo&Goh,2016),缓冲消极情绪对于创造力的影响(Groh et al.,2022)等。这类研究技术门槛相对较低,反馈逻辑清晰,便于理解,因而至今仍被研究者采用。然而,其预先设计的回应内容,难以应对复杂和细微的情绪的变化,使得它们更适用于任务边界清晰的场景,而在可迁移性方面存在一定局限。此外,当前许多研究缺乏共情性回应的定义和标准。以 Guo 和Goh(2016)的研究为例,研究中所设计的共情回应是学生作答错误时展现鼓励性的微笑,并提示“不要气馁,仔细阅读一遍问题”。然而根据心理咨询中的情感反映(reflection)技术(Hill,2009),回应“这道题答错了

26、,可能会有一些气馁”,相较于研究中的“不要气馁”,或许更能体现共情。未来研究需要结合心理学理论,制定更明确、合理的共情回应标准,并通过实证研究检验回应的有效性。2.4 共情对话生成共情对话生成是利用计算机自动生成让人感到自己的情绪被理解和支持的对话。随着生成式AI 的突破性发展作为技术保障,这类研究主题正迅速成为热点,研究者正探索不同策略以实现计算机自动生成共情对话的目标。一种策略是先识别沟通对象的情绪,再根据上下文生成对于沟通对象意图、需要、影响、和愿望的常识判断,整合后生成完整的共情性对话内容(Lin et al.,2019;Majumder et al.,2020;Sabour et

27、al.,2022)。这样的做法符合共情包含情绪和认知双重过程的理论。另一类策略则无需事先分辨沟通对象的情绪类型,而是直接生成共情对话。这类模型往往是在预训练大语言模型基础上,用共情对话数据进行微调(fine-tune)后得到(Rashkin et al.,2019;Sharma et al.,2021)。如 Rashkin 等(2019)建立了一个包含约25000 对共情对话的数据集(EmpatheticDialogues),并利用这个数据集微调预先用 17 亿条论坛日常对话训练的模型,结果表明微调模型生成的对话比预训练模型更具共情性。这个数据集成为此后众多研究的基准。此外,也有研究结合多种策

28、略以得到更好的共情回复,如 Qian 等(2023)认为首先生成一个语意高相关的回复,再用改写技术增加语句的共情性,能得到更佳的效果。共情对话生成研究正在蓬勃发展,这些研究为人机交互提供更加人性化的体验,也为其他应用场景奠定了基础,如改写网络回复内容以增加共情等。以 ChatGPT 为代表的大语言模型的突破性进展,使得生成共情内容越来越简单,进一步加速了该领域的发展。尽管如此,当前研究主要集中于单轮或较短的对话,这与现实任务中所需的复杂多轮对话相比,仍存在明显差距。未来的研究应关注将共情对话有机融入各种对话场景,以满足实际任务需求。例如,如何在共情和任务850 心理科学进展第 32

29、卷目标之间灵活切换并维持平衡,确保在支持用户情感表达的同时,避免偏离对话的主要目标。此外,如何将共情对话与声音、表情、动作生成结合,建立人形对话代理(embodied conversational agent)也是未来的研究方向(Loveys et al.,2022)。上述不同主题的共情计算研究相互借鉴、彼此促进,共同推动着这个领域的发展。如 Sharma等在开发共情内容生成的系统时(Sharma et al.,2021),使用了之前开发的文本共情分类系统(Sharma et al.,2020)来评估新生成的内容,经过多轮生成评估的强化学习过程,筛选出最适合的共情文本。此外,一些新兴的研究

30、也正在涌现,如通过混合现实(Mixed Reality,MR)促进人与人之间的共情(Jing et al.,2022),以及脑机接口提升计算机共情表现(Roshdy et al.,2021)等方面的初步探索。尽管尚未形成体系,这些研究为共情计算的发展开辟了新的可能性。综上,共情计算的研究前景广阔,也伴随诸多挑战,未来需要继续提升准确性和跨场景适用性。3 应用场景尽管尚处于起步阶段,但现有研究已经展现出共情计算具有广泛的应用前景,特别是在心理健康、教育学习、商业服务和公共管理等领域积累了较多相关研究。这些领域涉及大量人际互动,在人工智能日益普及的背景下,也将成为人机交互最频繁的领域,因而是共情

31、计算的主要应用场景。由于都涉及通过共情计算,提升人与人、人与机器互动过程中对情感的理解和回应能力,这些领域并非完全独立,而是相互关联却各有侧重的。随着技术的进步,未来还可能出现新的应用场景,如将共情计算应用于游戏提升娱乐体验等。3.1 心理健康目前,对于共情计算在心理咨询场景中的研究最为充分。高共情水平的咨询师与来访者有更好的治疗关系,也能降低他们的脱落率(Moyers&Miller,2013)。然而,过去的测评依赖于自我报告或者视频编码,不客观也不容易大规模推广。共情计算的方法通过文本、声音、视频等自动化评估咨询师的共情。这样可应用于在更大范围内研究咨询过程与效果的关系,也可应用于选拔咨询

32、师,或者在培养咨询师过程中反馈并提升其共情能力(Xiao,Imel,Georgiou,et al.,2015)。另一方面,共情计算也可以辅助线上心理健康服务。例如,朋辈心理互助平台借助共情计算所生成的内容辅助心理支持的工作(Sharma et al.,2023)。Liu 等(2021)也尝试将共情对话系统与心理咨询中的助人技术结合,设计更有效帮助人们应对压力和挑战的对话系统。研究者认为,增加数字干预系统表现出的共情水平,有助于促进形成数字治疗联盟(digital therapeutic alliance),进而提升干预效果(Tong et al.,2022)。不过当前研究只是初步验证了用计算机

33、自动生成共情性对话的可行性,鉴于心理咨询中可能涉及自杀自伤等风险因素,目前的研究距离完成整个心理咨询过程并产生治疗效果仍存在差距。3.2 教育学习随着计算机和手机等智能终端的普及,越来越多的人开始关注通过数字游戏、机器人等方法辅助教学。在教育领域中,共情计算帮助我们设计出能够更好地理解和应对学生情绪和需求的教育机器人。学习不仅仅是认知过程,情绪在其中同样扮演重要角色(Camacho-Morles et al.,2021)。教师的共情与学生的学习动机、投入程度、满意度和学业表现均呈现正向关系(Cornelius-White,2007;Roorda et al.,2011)。于是很早就有研究表明

34、计算机的共情反馈提升学习效果,不过限于当时的技术条件,还需要由学生自主报告情绪(Chen et al.,2012)。共情计算使得自动化识别情绪变为可能。研究表明,具有一定共情能力的计算系统缓冲愤怒情绪给学习者带来的不利影响,提升学生的认知能力和创造性(Groh et al.,2022)。当学生从数字助教那里感受到更多的共情反馈时,其在数学问题上的正确率更高(Oker et al.,2020)。不过还需要更多研究探索这些影响的条件、内部机制等。比如在实验情景中,共情机器人促进小组学习和讨论,但是在真实教育环境的长期研究并未发现明显的效果(Alves-Oliveira et al.,2019)。系

35、统性综述的研究也表明,情感代理能够有效提升学习者的积极情绪和内部动机,但对学习效果的促进作用不如情绪提升的效果明显(王燕青等,2022)。除了直接帮助学习者,共情计算也可以通过实时反馈等方式,为老师或家长提供辅助,帮助他们在面对学生、子女教育时表现得更共情(Ge et al.,2021;Meyers et al.,2019)。总之,共情计算在教育领域展现了应用潜力,不过仍需要更多研第 5 期侯悍超等:当 AI 学习共情：心理学视角下共情计算的主题、场景与优化 851 究验证其在真实场景中的效果。3.3 商业服务人工智能客服和服务机器人正在越来越多被用于商业领域,共情计算在服务过程中发挥

36、了辅助效果。传统人工智能客服主要关注为客户提供信息支持,但研究发现,在一个社交媒体平台上40%的用户提问并不是寻求具体信息,而是需要情感支持,例如抱怨(Xu et al.,2017)。尽管设计者尽力提升人工智能服务的准确性,在现有技术条件下,计算机在服务中还是不可避免地会出现失误。这会引发客户的挫折感和不信任,从而降低客户对人工智能服务的接受程度。共情计算的应用一定程度上缓解这种问题。研究发现,当 AI 服务失败时,共情性回应增加继续使用 AI 服务的意向(Lv et al.,2022)。另一项针对服务机器人的研究表明,当服务机器人无法完全满足客户需求时,表现出共情能力的机器人被认为更有帮助,

37、用户体验也更好(Tojib et al.,2023)。未来还会有越来越多的机器人出现在工业或商业领域。人们面对这样的情景可能会产生挫败和敌意。共情计算的应用会让人类觉得机器人更像人类、更友好,以缓解对机器人的抵触。3.4 公共管理共情计算也可以应用于公共管理领域,如网络空间的治理。网络已成为人们生活密不可分的部分,线上生活影响着线下的健康(Zhang&Centola,2019)。然而网上的攻击性言论、网络暴力等也成为了需要治理的问题。一项干预研究表明,共情性反驳信息减少仇恨言论(Hangartner et al.,2021)。通过共情计算系统自动识别不良言论并生成共情性反驳信息,可能有效减少

38、来自网络空间的暴力。此外,共情也是把双刃剑。有些个体会由于过度共情社交媒体上的负面信息,而给自己带来不适。共情计算监控有这种致病性共情风险的人并给与提示或干预,有利于健康的社会心态(Abdul-Mageed et al.,2017)。最后,共情计算也用于评估和修改公共管理部门的政务回复信息,或在社交媒体上公布的信息,提升共情程度,帮助公共部门与民众增进信任,减少负面舆论。公共管理事务有广泛的责任范围和显著的社会影响,因此不能完全依赖计算机自动完成,不过共情计算作为其中一个环节,可以辅助提升管理效率和质量。以上 4 个场景展现出共情计算的广泛应用潜力。然而,如同自动驾驶技术一样,由于牵涉安全性和

39、伦理等问题,目前并不能完全依赖计算机执行共情任务,而需要人机紧密协作。因此,除了完善技术外,未来应更加注重以人为中心,面向特定应用场景,探索如何更有效实现共情计算。4 研究不足尽管共情计算已经有许多有益的研究进展,但作为一个新兴研究领域仍存在许多不足。未来研究通过引入心理学理论和研究方法予以改善。4.1 整体性的共情概念模型当前共情计算研究主要由计算机领域研究者推动,这些研究有些缺乏对共情的明确定义,有些则基于算法准确性考虑,仅选取一个具体的行为特征来代表整体的共情。这样的做法导致不同研究之间难以进行有效比较和整合,阻碍了研究者对共情计算整体性的理解和应用。心理与行为科学、神经科学等在共情

40、的基础概念研究方面积累了丰富成果,对共情的层次和类别有详细分析,例如从神经心理过程分为认知过程、情感过程以及认知情感共同激活的中间过程(Schurz et al.,2021),从情绪对象角度分为对消极情绪的共情和对积极情绪的共情等(Brett et al.,2023)。未来的研究应重视利用这些研究成果,更准确地操作性定义共情,并在此基础上,逐渐发展出更整合的共情计算模型。Yaln 和 DiPaola(2020)初步提出了一个整合的模型,指出计算机需要从沟通能力、情绪调控和认知机制三个层级模拟共情。不过该模型还只是一个概念模型,仍需足够的实证研究支持。此外,新时代产生了许多新的共情现象,比如在线

41、聊天时用表情包表达共情等。整体性的共情计算模型也应重视将这些新形式的共情纳入考虑。4.2 高质量的共情数据集共情计算需要大量数据的支持,数据集的质量对模型精度至关重要。但目前公开的用于共情研究的数据集比较缺乏,而且标注质量也有待提高。如最常被引用的共情对话数据集 Empathetic Dialogues 并非基于真实场景中的对话,而是要求参与者根据研究者事先提供情绪标签,想象感受到这种情绪的场景,并完成对话(Rashkin et al.,2019)。这样收集的数据生态效度较差。在中文研究领域,更是缺乏相关数据集。已有的心理数据852 心理科学进展第 32 卷集 PsyQA(Su

42、n et al.,2021)和心理咨询问答语料库(Wang et al.,2020)缺乏共情相关的标注。由于缺少中文数据集,中文领域共情计算的研究数量也相对较少,这让现有研究很难涉及到文化差异有关问题。因此,未来的研究应借鉴心理学研究方法,通过问卷调查、半结构化访谈、情景模拟、临床数据转录等方法收集多维度、多层次的数据(做法可参考 Omitaomu et al.,2022)。数据标注方面,计算机领域研究多使用众包方法(彭凯平等,2018)。这种方法的参与者往往仅经过简单的培训,并不具备相关领域的专业知识。专业的心理学研究人员对数据进行筛选、加工和标注将提升数据集可信度。4.3 以人为中心的评

43、价标准现有的共情计算研究的评价更多是围绕任务表现展开,预测数据集标注的准确率或者生成的共情对话是否比基线模型更好。如 Sabour 等(2022)的研究中,仅招募 3 人比较了 100 组不同系统生成的共情对话内容,以此对比哪个系统更好。这种评价方式很难保证结果的稳定性和解决实际问题中的有效性。未来研究需要在任务表现评价基础上,提升至以人为中心的评价标准。以心理与行为科学为指导,通过访谈、问卷、实验等研究方法考察共情计算系统对于使用者的有效性(effectiveness)、高效性(efficiency)与效能性(efficacy),并提出改进建议。Sharma 等(2023)的最新

44、研究中开始使用随机对照实验对比人类和人类+人工智能两种系统回复中的共情。不过作者也承认,该研究中所使用的评价标准仍只是第三方视角下对话内容所展现出的共情,而非寻求帮助者本人真实感受到的共情。这反映出共情计算研究发展到现阶段开始重视改进评价标准,正亟需心理学提供支持。5 展望和讨论 5.1 共情计算为心理学带来新的洞见共情计算不仅为心理学研究提供新工具,更在理论层面深化和拓展对共情的理解。通过计算机自动分析和模拟共情互动的数据,研究者可以在更大的数据尺度上验证和迭代先前通过传统方法(观察、问卷和实验等)获得的研究成果,也可以识别尚未发现的模式,如有研究使用共情计算来发掘对话中的潜在共情意图(C

45、hen et al.,2022)。这有助于加深对共情影响因素和内在机制的理解。另一方面,共情计算也拓展共情研究的理论视角。先前的研究表明,共情普遍存在于人类甚至动物中(de Waal,2012),是从亲密关系到大规模合作等一切社会互动基础(Zaki,2014)。然而,在未来的智能社会中,人们的面对面互动正逐渐演化为面向网络和人工智能的新型互动,以至于人们有时不能直接看到对方的表情和肢体动作,不能直观地感受沟通对象的情绪。在这样的情景下,共情是否仍有普遍性,会发生哪些演变,以及如何促进人机交互中的共情等,都是亟待深入研究的问题(如图 3 所示)。共情计算将为我们理解智能社会互动过程中的共情现象提

46、供基础,为建立包括人人关系、人机关系等在内的整体性、普适性的共情理论提供启示。在这些理论创新的基础上,比照以往研究中促进人类共情的方式,开发模拟人类共情和社交互动的虚拟代理(virtual agent)和社交机器人也为心理学应用提供新的方向。通过开发具备共情能力的虚拟代理和社交机器人,可以为心理健康和教育等领域提供更智能、个性化的支持,推动心理学理论和应用的双向促进发展。5.2 心理学家在共情计算研究中的角色心理学家在共情计算领域发挥不可或缺的作用。编程等技术门槛曾是许多心理学研究者参与这一领域的阻碍,不过越来越多介绍计算方法的文章(苏悦等,2022)正在消除这一障碍。大语言模型进一步降低

47、了研究过程对编程技术的依赖,使得研究者可以通过 AI 辅助编程、提示词工程等方法开展研究。这种背景下,心理学家在共情领域积累的丰富理论和研究方法的重要性正在上升。心理学家的首要任务是提出问题。早期个体共情测量研究起源于改善咨询师共情水平的需求,未来心理学家需要持续关注共情计算的创新研究问题。其次,心理学家为设计和提升共情计算提供理论支撑,如心理治疗理论已被用于共情内容改写算法的开发(Lin et al.,2023),未来心理学理论也可用于优化提示词工程(Li et al.,2023),提升大语言模型在共情任务中的表现。最后,随着 AI的行为和心理表现越来越接近人类,研究者开始依据心理测量原理,

48、制定科学有效的评估方法,以测量机器的共情水平(Kosinski,2023;Wang et al.,2023)。总之,心理学家在共情计算研究和应第 5 期侯悍超等:当 AI 学习共情：心理学视角下共情计算的主题、场景与优化 853 图 3 从传统共情研究到智能社会共情计算的变化示意图用过程中承担引领、评估和改进等角色,将与计算机科学家一起,使共情计算的理论基础更坚实,效果检验更可靠,应用创新更贴近实际需求。5.3 共情计算系统的接纳度及其伦理风险共情计算研究和应用所涉及的法律和伦理风险也应被充分讨论,并尽量通过政策机制在系统层面加以避免。AI 的飞速发展一方面为生活带来了便利,另一方面

49、也引发了与 AI 相关的信任问题和道德困境(Awad et al.,2018)。研究表明,人们感受到的机器人的共情作为中介变量增加对 AI 的信任(Pelau et al.,2021)。鉴于此,共情计算的研究进步可能也成为双刃剑。一方面提升 AI 系统的共情能力,能够提升用户信任和体验;另一方面,这种信任也可能被滥用,例如在营销和广告中使用共情计算技术来影响人们的决策。此外,人类如何对待具备共情能力的人工智能系统？是否要像对待其他人类一样考虑 AI 的感受和幸福(Lomas,2023)？这些议题都是在今后的研究中需要探讨的。以 ChatGPT 等大语言模型为代表的超级人工智能技术的发展为共情研

50、究带来了新机遇和新挑战。共情计算的交叉研究不仅是用一种新技术(如机器学习或自然语言处理)测量一个心理概念(Li et al.,2019),而是持续为人类探索未知生产了新知识、新方法和新应用。这一广阔前景的交叉领域,不仅拓展和加深对于共情心理机制的理解,也可以将研究成果运用于智能社会的发展,提升个人和社会幸福,值得心理学研究者关注并做出独特的贡献。参考文献彭凯平,刘世群,倪士光.(2018).移动互联网时代的社会科学研究工具:众包的争议与发展.西北师大学报(社会科学版),55(3),113123.https:/doi.org/10.16783/ki.nwnus.2018.03.015 苏悦,刘

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: AI 学习心理学视角下共情计算主题场景优化

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。