博弈复习题及参考答案.doc
《博弈复习题及参考答案.doc》由会员分享,可在线阅读,更多相关《博弈复习题及参考答案.doc(24页珍藏版)》请在咨信网上搜索。
1、(完整版)博弈复习题及参考答案第一章复习题2,4,5,6,7第一章参考答案2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等.如果设定博弈模型时不专门设定后两个方面,就是隐含假
2、定是完全、完美信息和完全理性的非合作博弈。4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。现实中“囚徒的困境类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式.5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类.其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是
3、进化博弈.第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。第五是根据得益的特征分为零和博弈、常和博弈和变和博弈.第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。9、(a)根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下:自 然赚(35%)亏(65)3000100100 开我不开自然亏(65%)赚(35%)(
4、300) (100) (0) (100)不开开不开开我(b)如果我是风险中性的,那么根据开的期望收益与不开收益的比较:0。35300+0。650=105100肯定会选择开。(c)如果成功的概率降低到0。3,那么因为这时候开的期望收益与不开的收益比较:0。30300+0。700=90100因此会选择不开,策略肯定会变化。(d)如果我是风险规避的,开的期望收益为:0。9(0.35300+0。650)=0.9105=94.5100因此也会选择不开。(e)如果我是风险偏好的,那么因为开的期望收益为:1.2(0。35300+0。650)=1.2105=126100因此这时候肯定会选择开。10、首先需要注
5、意的是,在该博弈方的得益单位不同,逃犯得到的是增加或者减少的刑期(年),而看守得到的则是奖金(元),因此除非先利用效用概念折算成相同的单位,否则两博弈方的得益相互之间不能比较和加减。直接采用单位不同的得益,该博弈的得益矩阵如下:看 守 路线一 路线二-10,100010,010,0-10,1000逃 路线一犯 路线二该博弈的扩展形表示如下:看守路线二路线二路线一路线一逃犯路线二路线一(-10,1000)(10,0) (10,0)(-10,1000)根据上述得益矩阵和扩展形不难清楚,该博弈中两博弈方的利益是对立的。虽然由于两博弈方得益的单位不同,相互之间得益无法相加,因此无法判断是否为零和博弈,
6、但两博弈方关系的性质与猜硬币等博弈相同,也是对立的。因此,该博弈同样没有两博弈方都愿意接受的具有稳定性的策略组合,两博弈方最合理的策略都是以相同的概率随机的选择路线。补充习题:1. 判断下列叙述是否正确,并作简单分析。a) 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。b) 合作博弈就是博弈方采取互相合作态度的博弈。参考答案:a) 错误。结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间长短。此外,我们已开始就假设两囚徒都是理性经济人,而理性经济人都是以自身的(
7、绝对)利益,而不是相对利益为决策目标。b) 不正确。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。2. 博弈与游戏有什么关系?参考答案:现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择,特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生活中的下棋打牌、赌胜博彩,以及田径、球类等各种体育比赛.因此博弈和游戏之间当然是有明显区别的。但博弈和游戏之间其实也有重要的联系,因为博弈与许多游戏之间在本质特征方面有相同的特征:(1)都有一定的规则;(2)都有能用正或负的数值表示,或能按照一定的
8、规则折算成数值的结果;(3)策略至关重要;(4)策略和利益又相互依存性。正是因为存在这些共同的本质特征,因此从研究游戏规律得出的结论可用来指导经济政治等活动中的决策问题,或者把这些决策问题当作游戏问题研究.因此博弈在一定程度上可以理解成就是游戏。其实“博弈”的英文名称“Game”的基本意义就是游戏。3. 一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒是老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况使双方都知道的。请
9、问a) 如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博弈并作简单分析。b) 如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示并简单分析。参考答案:工人老板老板偷懒不偷懒克扣克扣不克扣不克扣(40,40)(100,-20)(-10,110)(50,50)a) 由于老板在决定是否克扣工资欠可以完全清楚工人是否偷懒,因此这是一个动态博弈,而且是一个完全信息的动态博弈。此外,由于双方都有关于得益的充分信息,因此只是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下:根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是有利的,
10、因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果应该是工人偷懒和老板克扣。b) 由于老板在决定是否克扣工资欠无法清楚工人是否偷懒,因此该博弈可以看作静态博弈。由于双方仍然都有关于得益的充分信息,因此是一个完全信息的静态博弈。该博弈用得益矩阵表示如下:老板克扣不克扣工人偷懒40,40100,20不偷懒10,11050,50其实,根据该得益矩阵不难得到与上述动态博弈相同的结论,仍然是工人会选择偷懒和老板会选择克扣.这个博弈实际上与囚徒的困境是相似的。第二章复习题4,5,7,9,11,12第二章参考答案4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各个博弈方有一
11、致的预测,而是指每个博弈方自己的策略选择与自己的预测一致。对博弈分析主要的不利影响是,当博弈存在多重纳什均衡,而且相互之间没有明确的优劣之分时,会造成预测分析的困难,影响以纳什均衡为核心的博弈分析的预测能力。存在帕累托上策均衡、风险上策均衡、聚点均衡或相关均衡的可能性,并且博弈方相互之间有足够的默契和理解时,多重纳什均衡造成的不利影响会较小。5、 博弈方2 L C R2,01,14,23,41,22,31,30,23,0博 T弈 M方 B1首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策,因此可以把该策略从博弈方1的策略空间中消去。把博弈方1的B策略消去后
12、又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去。在下面的得益矩阵中相应策略和得益处划水平线和垂直线表示消去了这些策略.博弈方2 L C R2,01,14,23,41,22,31,30,23,0博 T弈 M方 B1两个博弈方各消去一个策略后的博弈是如下的两人22博弈,已经不存在任何严格下策。再运用划线或箭头法,很容易发现这个22博弈有两个纯策略纳什均衡(M,L)和(T,R)。博弈方2 L R2,04,23,42,3博 T弈 M方 1由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,双方利益有不一致性,因此如果没有其他进一步的信息或者决策机制,一次性静态博弈的结果不能肯
13、定。由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个。7、我们用反应函数法来分析这个博弈.先讨论博弈方1的选择。根据问题的假设,如果博弈方2选择金额s2(0s210000),则博弈方1选择s1的利益为:当S110000 s2当S110000 s2u(s1)= 因此博弈方1采用s1=1000s2时,能实现自己的最大利益u(s1)= s1=1000-s2。因此s1=1000s2就是博弈方1的反应函数。博弈方2与博弈方1的利益函数和策略选择是完全相似的,因此对博弈方1所选择的任意金额s1,博弈方2的最优反应策略,也就是反应函数是s2=1000- s1。显然,
14、上述博弈方1的反应函数与博弈方2的反应函数是完全重合的,因此本博弈有无穷多个纳什均衡,所有满足该反应函数,也就是s1+ s2=10000的数组(s1 ,s2)都是本博弈的纯策略纳什均衡.如果我是两个博弈方中的一个,那么我会要求得到5000元。理由是在该博弈的无穷多个纯策略纳什均衡中,(5000,5000)既是比较公平和容易被双方接受的,也是容易被双方同时想到的一个,因此是一个聚点均衡。9、(1)第i个厂商的利润函数为:i=pqiciqi=(a-qi-qj)qi-ciqi将利润函数对产量求导并令其为0得:=aqjci2qi=0解得两个厂商的反应函数为:qj=(a- qjci)/2或具体写成:q1
15、=(a-q2-c1)/2q2=(aq1c2)/2(2)当0cia/2时,我们根据上述两个厂商的反应函数,直接求出两个厂商的纳什均衡产量分别为:q1=q2=(3)当c1c2a,但2c2a+ c1时,根据反应函数求出来的厂商2产量q20。这意味着厂商2不会生产,这时厂商1成了垄断厂商,厂商1的了优产量选择是利润最大化的垄断产量q1=q = 因此这种情况下的纳什均衡为(a c1)/2, 0.11、(1)两个候选人竞争时,纯策略纳什均衡为(0。5,0.5),即两个假选人都宣布自己是中间立场。我们用直接分析法加以证明:首先,如果一个候选人的立场是0.5而另一个候选人的立场不是0。5,那么不难证明有者将获
16、胜而后者必然失败,因为根据投票原则前者得票比例将大于0。5,那么双方都有一半机会获胜。因此对任意一个候选人来说,都是不管对方选择的立场是否为0.5,0.5都是自己的正确选择,也就是说0.5都是上策。因此(0。5,0。5)是本博弈的一个上策均衡,当然也是纳什均衡。事实上,即使两个假选人开始时没有立即找到最佳立场0.5,他也会通过边竞争边学习很快调整到该纳什均衡策略。因为当两个候选人的立场都不在0。5时,谁更靠近0.5谁选票就多,观察到这一点,两个候选人必然都会向0。5靠拢,直到最后都取0.5的立场。当两个候选人都选择0.5时,各自都能得到一半选民的支持,谁能够取胜往往取决于双方竞选立场以外的东西
17、,例如候选人的个人魅力和演说才能等。(2)三个候选人时问题比较复杂。因为当三个候选人的立场都处于中点附近位置时,立场夹在其他两个候选人之间的候选人只能获得很少的选票,从而他(或她)有转变成比“左”倾者更“左”倾,或比右倾者更右倾立场的动机。这时候三个候选人在中点附近处于一种不稳定的平衡。(0。5,0.5,0.5),其中,和是小正数。如果考虑到现实中竞选者的立场不可能由一维数学坐标精确描述,选民对候选立场差别的分辨能力也不可能很精细,那么当候选人的立场堵接近中点时,选民很难识别究竟哪个候选人偏右倾或“左倾一些,因此三个候选人的立场都接近中点时可理解为是相同的.这样,三个候选人与两个候选人竞选的纳
18、什均衡策略可以看成是相同的,即都选择(0.5,0。5,0.5)。三个候选人时在数学上还可能求出其他纯策略纳什均衡。如策略组合(0。4,0.6,0.8)就是其中一个。因为当三个候选人分别选择这些立场时,每项悠悠民选人没有改变自己立场的动机,因为该策略组合的结果是他取胜,而第二和第三个候选人则单独改变自己的立场并不能改善自己的命运,无论只是稍微改变自己的立场,还是与其他候选人的相对立场发生逆转,都没有限胜的机会。因此根据纳什均衡的定义,这是一个纯策略的纳什均衡.类似的熏略组合还有许多。不过,虽然在数学上这些纳什均衡完全符合纳什均衡的定义,但是它们在现实选举问题中的意义却并不大,因为这种纳什均衡本身
19、只是弱均衡(部分博弈方改变策略不损害自己的利益),而且部分博弈方(第二、第三个候选人)属于典型的“破坏者,他们的策略改变不影响自己的利益,但却会对其他博弈方的利益产生决定性的影响,因此这些纳什均衡其实是不稳定的,不会是现实中的均衡结果。上述博弈模型不仅在政治选举问题中有意义,在分析经济经营活动中的选址和产品定位等问题方面也非常有用。读者可以自行找一些例子进行分析.12、在纳什均衡分析的基础上,再进一步考虑运用其他均衡概念或分析方法,如风险上策均衡等进行分析.首先,很容易根据划线法等找出本博弈的两个纯策略纳什均衡(U,R)和(D,L)。本博奕还有一个混合策略纳什均衡,即两博弈方各自以2/3、1/
20、3的概率在自己的两个策略U、D和L、R中随机选择。但本博弈的两个纯策略纳什均衡中没有帕累托上策均衡,两个博弈方各偏好其中一个,而且另一个策略组合(U,L)从整体利益角度优于这两个纯策略纳什均衡,因此博弈方很难在两个纯策略纳什均衡的选择上达成共识。混合策略纳什均衡的效率也不是很高,因为有一定概率会出现(D,R)的结果。根据风险上策均衡的思想进行分析,当两个博弈方各自的两种策略都有一半可能性被选到时,本博弈的两个纯略纳什均衡都不是风险上策均衡,而策略组合(U,L)却是风险上策均衡。因为此时博弈方1选择U的期望得益是4,选择D的期望是益是3。5,博奕方2选择L的期望得益是4,选择R的期望得益是3.5
21、.因此当两个博弈方考虑到上述风险因素时,他们的选择将是(U,L),结果反而比较理想。如果博弈问题的基本背景支持,对本博弈还可以用相关均衡的思想进行分析。读者可自己作一些讨论。补充习题:1. 判断下列表述是否正确,并作简单分析:a) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。b) 如果以博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。c) 上策均衡一定是帕累托最优的均衡吗?并说明哪一个均衡更稳定些。参考答案:a) 错误。只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了.单独改变策略只能得到更小得益的策略组合是严格纳什均衡,是比纳什均衡更强的均衡概念。b)
22、 正确。这是纳什均衡的基本性质之一-奇数性所保证的.c) 不正确。囚徒的困境博弈中的(坦白,坦白)就是上策均衡(同时也是纳什均衡),但该均衡显然不是帕累托最优的,否则就不会称其为囚徒的困境了。2. 下面的得益矩阵表示一个两人静态博弈。问当a、b、c、d、e、f、g和h满足什么条件时,该博弈:a) 存在严格上策均衡;b) 可以用严格下策反复消去法简化或找出博弈的均衡;c) 存在纯策略纳什均衡。博弈方2LR博弈方1Ua,bc,dDe,fg,h参考答案:a) 严格上策均衡是由各个博弈方的严格上策组成的策略组合。对于博弈方1,如果ae且cg,则U是相对于D的严格上策;如果ae且ch,则L是相对于R的严
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 复习题 参考答案
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。