基于声誉的条件惩罚对合作演化的影响——考虑种群效应.pdf
《基于声誉的条件惩罚对合作演化的影响——考虑种群效应.pdf》由会员分享,可在线阅读,更多相关《基于声誉的条件惩罚对合作演化的影响——考虑种群效应.pdf(11页珍藏版)》请在咨信网上搜索。
1、Statistics and Application 统计学与应用统计学与应用,2023,12(4),1009-1019 Published Online August 2023 in Hans.https:/www.hanspub.org/journal/sa https:/doi.org/10.12677/sa.2023.124104 文章引用文章引用:杨啊莲.基于声誉的条件惩罚对合作演化的影响J.统计学与应用,2023,12(4):1009-1019.DOI:10.12677/sa.2023.124104 基于声誉的条件惩罚对合作演化的影响基于声誉的条件惩罚对合作演化的影响 考虑种群效应
2、考虑种群效应 杨啊莲杨啊莲 云南财经大学统计与数学学院,云南 昆明 收稿日期:2023年7月19日;录用日期:2023年8月9日;发布日期:2023年8月22日 摘摘 要要 达尔文主义的自然选择学说认为适者生存是生物演化的基本准则,即个体之间存在着竞争关系,适应度达尔文主义的自然选择学说认为适者生存是生物演化的基本准则,即个体之间存在着竞争关系,适应度高的个体能够在竞争中存活并繁衍,但是如今自然界和人类社会的现象表明在如此激烈的环境中物种之高的个体能够在竞争中存活并繁衍,但是如今自然界和人类社会的现象表明在如此激烈的环境中物种之间却存在着普遍合作的现象。然而,现有基于演化博弈论对合作现象的出现
3、及维持的研究,还不能系统间却存在着普遍合作的现象。然而,现有基于演化博弈论对合作现象的出现及维持的研究,还不能系统全面地解释在复杂博弈过程中的演化动力学过程,因此需进一步讨论合作是如何演化的。基于此,我们全面地解释在复杂博弈过程中的演化动力学过程,因此需进一步讨论合作是如何演化的。基于此,我们对基于声誉的条件惩罚行为进行建模,在本模型中,个体是否会受到惩罚主要是以自己的声誉与邻居平对基于声誉的条件惩罚行为进行建模,在本模型中,个体是否会受到惩罚主要是以自己的声誉与邻居平均声誉作比较来进行判定,从而探究考虑种群效应在内的合作行为的演均声誉作比较来进行判定,从而探究考虑种群效应在内的合作行为的演化
4、。结果表明,当个体声誉与邻化。结果表明,当个体声誉与邻居平均声誉相较而言更高时,越有利于促进和维护合作。此外,我们还发现增加惩罚强度可以有效地促居平均声誉相较而言更高时,越有利于促进和维护合作。此外,我们还发现增加惩罚强度可以有效地促进合作行为的发生。进合作行为的发生。关键词关键词 合作,声誉,条件惩罚合作,声誉,条件惩罚 The Impact of Reputation Based Conditional Punishment on Cooperative Evolution Considering Population Effects Alian Yang School of Statis
5、tics and Mathematics,Yunnan University of Finance and Economics,Kunming Yunnan Received:Jul.19th,2023;accepted:Aug.9th,2023;published:Aug.22nd,2023 杨啊莲 DOI:10.12677/sa.2023.124104 1010 统计学与应用 Abstract Darwinisms Natural selection theory believes that Survival of the fittest is the basic principle of
6、 biological evolution,that is,a competitive relationship between individuals,individuals with high adaptability can survive and reproduce in the competition.Todays various phenomena in nature and human society show that there is universal cooperation between species in such a fierce en-vironment.How
7、ever,the existing research on the emergence and maintenance of cooperation based on evolutionary Game theory cannot systematically and comprehensively explain the evo-lutionary dynamic process in the complex game process,so it is necessary to further discuss how cooperation evolves.Based on this,we
8、model reputation-based conditional punishment behavior.In this model,whether an individual will be punished is mainly determined by comparing their own reputation with the average reputation of their neighbors,in order to explore the evolution of cooperative behavior considering population effects.T
9、he results indicate that when the individual reputation is higher compared to the average reputation of neighbors,it is more conducive to promoting and maintaining cooperation.In addition,we also found that increasing the intensity of punishment can effectively promote the occurrence of cooperative
10、behavior.Keywords Cooperation,Reputation,Conditional Punishment Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.研究背景及国内外发展趋势研究背景及国内外发展趋势 在当下全球化的国际社会中,无论是个人之间还是
11、国家之间,合作共赢已成为国际共识,这都说明了合作行为在人类社会进步、文明发展历程中的重要性。自然界中合作现象是普遍存在的。例如鳄鱼千鸟互惠互利、榕树榕小蜂互惠互利、狼群的捕猎合作现象、海葵小丑鱼互惠互利以及鰕虎鱼枪虾互惠互利1 2,合作行为可以简单理解为:一个个体可以牺牲自己的一部分利益为其他人带来利益3。相比之下适者生存准则所表现的是个体追求自身最大化的利益及一种自私行为,如此普遍存在的合作行为与达尔文的自然学说相矛盾,引起了社会学、经济学以及生物学等多个领域的关注。合作现象对于现在来说虽然极其普遍,但是基于理性人的角度,反社会行为才是利益最大化的决策,因此研究合作是如何演化的是十分重要的。
12、演化博弈论作为一个框架,揭示了为什么以及如何在有缺陷的环境中合作盛行。为了探究自私种群中合作行为是如何出现并维持的,基于演化博弈论这个强有力的研究框架,Nowak 总结了促进合作演化的五种机制:亲缘选择、直接互惠、间接互惠、网络互惠和群体选择4 5。基于 Nowak 等学者的研究结果,一些经济学家和社会学家将运用演化博弈论来解决社会困境的问题6,其中社会困境可归纳于个人对于个人利益最大化与集体利益最大化之间的选择矛盾,取得了丰硕的成果。在上述社会困境问题中存在一种被称为搭便车的行为。相较于亲社会性的合作者,搭便车者往往只关注自身利益而对于集体利益没有贡献,这会极大影响社会中的产出,如何解决这种
13、搭便车行为是我们研究的核心问题。一些研究表明,解决搭便车行为可以通过惩罚行为来对其进行约束7 8。惩罚意味着Open AccessOpen Access杨啊莲 DOI:10.12677/sa.2023.124104 1011 统计学与应用 惩罚者愿意付出一定的成本使得被惩罚者损失一部分的收益,往往被惩罚者损失的收益大于惩罚者的成本,因此惩罚可以认为是解释社会合作行为的有效机制。但在使用惩罚时惩罚者会付出代价高昂的成本,这最终会导致自己总收益的减少,因此先前已经有大量研究证明代价高昂的惩罚并不能总是促进合作的演化9 10。为了解决惩罚成本高昂的问题,不少研究已经提出了基于条件惩罚的机制,条件惩罚
14、区别于直接惩罚,而是在达到一定条件之后再对个体进行惩罚,这样既可以解决种群中的搭便车问题,又可以增加自己的收益,实现“双赢”的局面。例如,对个体惩罚的力度与叛逃者的人数成比例11、与其他成员对该个体的处罚决策成比例等都是条件惩罚的例子12 13。这种条件惩罚是我们关注的重点,其在现实中极为普遍。另外,最近的理论研究表明,惩罚是在声誉博弈的背景下发展起来的14 15。简单来说,可以用声誉来区分惩罚者和非惩罚者,惩罚者通过利他主义惩罚积累自己的声誉,从而更有可能在未来的互动中获得帮助。同样地,如果个体与种群中与其他成员博弈时选择叛逃的策略,那么我们就可以减掉其拥有的声誉分,如此一来,声誉分值越低,
15、表明个体在与其他成员互动时叛逃的次数越多,那么惩罚者在选择惩罚力度时就可以根据叛逃者的声誉分来决定,声誉分值越低,则惩罚力度越强,可以在一定程度上解决传统惩罚代价高昂的问题。总的来说,声誉在种群合作中起着十分关键的作用。因此,在本文的模型中,我们将基于个体声誉和组平均声誉的机制上考虑条件惩罚对合作演化的影响。2.模型模型 2.1.空间公共物品博弈空间公共物品博弈 在本文的模型中考虑了空间公共物品博弈(SPGG),该博弈发生在一个 L*L 的具有周期边界的格子网络上。在该网格上,每个节点表示一个玩家 i,并有四条连接的边,代表中心玩家 i 的四个邻居。在结构化种群中,由玩家 i 和四个邻居组成的
16、五个玩家被视为一个玩公共物品博弈的群体。因此,每个玩家在每个时间步长总共参与五轮公共物品博弈。在该博弈中,有合作者(简称 C)、叛逃者(简称 D)和惩罚者(惩罚合作者,简称 PC)三种策略,并在模拟初始化时给玩家随机分配这三种策略。2.2.基于声誉的条件惩罚机制基于声誉的条件惩罚机制 本模型假定叛逃个体 i 受到惩罚的概率主要取决于他的声誉水平以及他邻居的平均声誉。具体如下,我们引入个体 i 邻居的平均声誉乘上折扣因子fai作为动态声誉阈值,该阈值将玩家分为两种不同的类型:对于声誉高于阈值fai的叛逃个体 i 而言可以认为是“好”玩家,因此不用受到惩罚者的惩罚;而对于声誉低于阈值fai的叛逃个
17、体 i 而言则被认为是“坏”玩家,因此依据其具体声誉有一定概率会受到惩罚,且受到惩罚的概率与他的声誉水平呈负相关。基于此,叛逃个体 i 受到惩罚的概率可以写成等式(1),其中用iP来表示惩罚概率:if0ifbifaifaiPfai 1),然后平均分配给所有玩家。除玩家收到的公共池的收益之外,D 玩家还因受到 PC 玩家的惩罚而付出罚金,同样地,PC 玩家也会因此付出惩罚成本。因此,玩家每进行一次公共物品博弈的具体收益计算公式(3)如下:()()()15515iiCPCiCiiCPCiDiiiCPCiPCir nnr nnr nn+=+=+=(3)在上式中,i代表叛逃玩家 i 在一次公共物品博弈
18、中受到的惩罚次数,代表叛逃玩家每次受到惩罚时需付出的罚金。i代表惩罚玩家 i 在一次公共物品博弈中要惩罚的次数,代表惩罚者惩罚一次叛逃者所付出的惩罚成本。对于玩家 i 而言,累积收益i来自他自己和他的四个邻居组织的五轮博弈收益的总和。2.5.策略更新机制策略更新机制 本文假设玩家使用费米规则异步更新他们的策略。具体如公式(4):()11expjijiP SSK=+(4)该费米更新规则意味着当随机选择的玩家 i 的邻居 j 的收益比玩家 i 高时,那么玩家 i 模仿玩家 j 策略的概率就越高。其中 K 表示选择强度,当 K 趋于 0 时,玩家 i 更倾向于选择收益更高的策略,当 K 趋于时,玩家
19、 i 策略更新是完全随机的。综合考虑,该模型选择 K=0.5。2.6.合作率合作率 本文引入了等式(5)的合作水平来描述种群的进化状态,其中CN和PCN分别代表种群中合作者和惩罚者的数量 CPCC PCNNN+=(5)3.模型结果及分析模型结果及分析 首先,我们研究了在声誉阈值的不同设定值下,增强因子 r 如何影响合作的演变。从图 1 中可以看杨啊莲 DOI:10.12677/sa.2023.124104 1013 统计学与应用 出,对于任何给定的 fai 值,随着 r 从 0 增加到 5.6,合作水平C PC+都呈增加趋势。也就是说,r 的值越大,越有利于促进合作,这一观察结果意味着,合作行
20、为回报的增加会导致采取合作行动的意愿增加。此外,如图 1 所示,在不同的 fai 值下,合作的演变是显著不同的。具体而言,对于极端值 fai=1,当 r从 0 增加到 5.6 时,合作水平显著增加,然后达到完全合作。但是对于 fai=0.9、fai=0.8、fai=0.6、fai=0.3、fai=0.1,相较于 fai=1,在 r=2.4 及以上合作才会出现,并且达到完全合作较晚。该分析结果在Rmax=80 和 Rmax=100 的相图中都是相似的。综合考虑将在其他结果中都使用 Rmax=100。综上所述,图 1 的结果表明,对于任何给定的 r 值,fai 值越高,越有利于合作的出现和促进。从
21、以上结果可以看出,fai 值越高,种群进入 ESS 的速度就越快。事实上,fai 的值越高,意味着结构化人群中有更多的玩家被认为是坏玩家,如果他们采用 D 策略,他们更有可能受到惩罚。这是因为在进化过程中,较高的 fai 值有利于合作,而不是叛逃的行为。Figure 1.For six different reputation thresholds,cooperation rate CPC+as a function of the enhancement factor r.(a)Rmax=80;(b)Rmax=100.Other parameters are =0.1,b=0,=1.0,L=1
22、00,with a time step of 104 图图 1.对于六个不同的声誉阈值,合作率CPC+作为增强因子 r 的函数。(a)Rmax=80;(b)Rmax=100。其他参数为 =0.1、b=0、=1.0,L=100,时间步长为 104 Figure 2.For six different reputation thresholds,the process of cooperation rate CPC+evolving over time.(a)r=3.0;(b)r=3.8.Other parameters are =0.1,b=0,=1.0,Rmax=100,L=100,with
23、a time step of 104 图图 2.对于六个不同的声誉阈值,合作率CPC+随时间演化的过程。(a)r=3.0;(b)r=3.8。其他参数为 =0.1、b=0、杨啊莲 DOI:10.12677/sa.2023.124104 1014 统计学与应用 =1.0,Rmax=100,L=100,时间步长为 104 在图 2 中,我们进一步研究了合作水平C PC+是如何随着时间步长 t 演变的。图 2(a)显示了C PC+在r=3 的不同声誉阈值 fai 下的演变动力学。图中的结果 2(a)表明,虽然不同的 fai 值在时间前期演化趋势相同,合作率都从 t=1 显著下降到 t=80,但是从 t
24、=80 到 t=100 的演化趋势显著不同,当 fai=1 时合作率最终达到 1 的稳定状态,当 fai=0.6、fai=0.3、fai=0.1 时合作率最后降为 0,当 fai=0.8、fai=0.9时合作率呈震荡的趋势。此外,在图 2(b)我们研究了 r=3.8 时的合作动力学。如图所示,对于任何给定的 fai 值,在进化稳定状态下,合作的性能更好。这些结果进一步验证了我们在图 1 中观察到的情况。Figure 3.A strategy spatial distribution map of four representative time steps with different rep
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 声誉 条件 惩罚 合作 演化 影响 考虑 种群 效应
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。