博弈论与信息经济学课程论文.doc
《博弈论与信息经济学课程论文.doc》由会员分享,可在线阅读,更多相关《博弈论与信息经济学课程论文.doc(10页珍藏版)》请在咨信网上搜索。
《博弈论与信息经济学》课程论文 2014-2015(1) 学 院: 生命科学学院 专 业: 生态学 年 级: 2011级 学 号: 1107040029 学生姓名: 李贵阳 任课教师: 胡鸣 2014年12月 论博弈论中的策略思维 李贵阳 贵州大学生命科学学院(550025) 内容摘要: 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。本文从合作、模仿、创新、拍卖 、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的。 关键词 :博弈论 策略思维 博弈论源于历史上一些颇为有趣的游戏, 但同时也是一门学问艰深的理论 。那么博弈论为什么能在经济学领域产生如此巨大的影响呢 ? 又何以在经济分析中独辟蹊径,形成了能与 (随机 )一般均衡理论相对立的另一种经济学研究范式? 这恐怕还得益于博弈论的起源和其中蕴含的策略思维 。博弈论从本质上讲是一种游戏理论, 在给定游戏的特定规则 (信息结构 )下, 游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣摩, 并据此决定和调整自己的行为 ,这就是制定策略或对策的过程。为此, “博弈论 ”一般也称为 “对策论 ”或“游戏理论 ”。加之博弈论的游戏情节一般也源于人们的真实生活, 是生活环境的抽象和概念化, 因此, 博弈的结果不仅仅是游戏胜败的表现, 而且更是生活哲理的凝结 ,它为人们深刻理解和准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现实的指导意义。 一 、 “囚徒困境 ”:合作还是不合作 考虑这样一种情形,小偷甲和乙联手作案 ,私入民宅被警方逮住, 但未获证据。警方将两人分别置于两所房间分开审讯 。若一人招供但另一人不招, 则招供者立即释放, 不招供者判入狱 10年;若二人都招供则各判刑 8年 ;若两人都不招供则因未获证据但私入民宅而各拘留 1年 (见表 1)。试问甲和乙应该如何抉择自己的行为 ? 理性行为人的想法是这样的:对甲来说, 无论乙是选择“招”还是“不招”,选择 “招”都会比选择 “不招”来得更好 。因此 , “不招”是相对于 “招 ”的严格劣策略, 所以, 甲会选择 “招”。同理 ,根据对称性 ,乙也会选择“招 ”,于是纳什均衡解便是甲乙两人都招供, 各判 8年。这个例子表明 ,运用“剔除严格劣策略 ”的方法可以找到问题的均衡解。虽然甲乙两人都选择“不招”是集体最优的, 但是这个结果不会出现 ,或者说, 甲乙双方都存在偏离这一结果的激励,个体理性与集体理性之间存在着冲突。假设从两人都不招供出发 ,只要其中一人变卦,他就能谋取更多的利益。为此 ,即便甲乙两人都有不招供的约定在先,这样的约定也只能是 “不可置信的承诺 ”而已 ,故而纳什均衡解具有内在稳定性 。 表 1 囚徒困境博弈支付矩阵 招 供 不招供 招 供 -8, -8 0, -10 不招供 -10, 0 -1, -1 在囚徒困境的重复博弈中,有两种著名的策略,一种叫 “冷酷 ”策略(grimstrategy),另一种叫“针锋相对”策略 (tic-for-tacstrategy)。所谓 “冷酷 ”策略是指对于事先两人均不招供的攻守同盟,一旦有人招供,则对方在以后的任一阶段博弈中,都将选择招供,以示对对方违约的惩罚, 对方也将丧失改正错误的机会 ;而“针锋相对 ”策略是指行为人在本阶段选择对方前一阶段的行为选择, 相对于“冷酷”策略 , “针锋相对 ”策略允许行为人存在违约的激励 ,因而它不会是精炼均衡 。模型表明合作潜在地具有“囚徒困境”的逻辑结构 ,因而我们可借此分析日常生活中的许多合作与不合作现象。政府提供公共品便是极好的一例 。设想有两户相邻的住户,需要一条好路从居住地通往公路。修一条路的成本为 4,每个住户能从修好的路上获利为 3。如果两家住户共同出资联合修路 ,并平均分摊修路成本 ,则每家住户获得净利为 1;当只有一家住户单独出资修路时 ,修路者获利为 -1,“搭便车 ”者 ,即不出资但仍可以使用修好的路的另一住户获利为3(不考虑产权问题 )(表 2)。 表 2 修路博弈支付矩阵 修 不修 修 1, 1 -1, 3 不修 3, -1 0, 0 通过“剔除严格劣策略 ”方法, 可以得到 ,两家住户都不会出资修路。为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位, 然后投入 4单位资金修路 ,并使两家住户都得到 1单位的利益。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因 。同样的道理 ,国防 、教育、社会保障,环境卫生等都由政府承担资金投入, 而私人投资的积极性一般都不高 。“囚徒困境”重复博弈还能用来解释企业 (或者银行和企业 )之间的合作问题。当一次性违约的收益大于失信所必须付出的代价时 ,企业就存在偏离合同规定行事的激励 。这种内生的激励表明 , “损人利己”也是行为人的理性选择。如果企业之间致力于长期合作 ,就应当设法改变合作机制 ,降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是采取 “冷酷 ”策略,以提高失信成本 。 二 、 智猪博弈 :创新还是模仿 “囚徒困境”中参与人地位是对等的 ,如果参与人地位不对等 ,又会发生怎样的情况的呢? 假设猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮, 每按一下 ,位于猪圈另一端的食槽中就会有 10单位的猪食进槽, 但按一下按钮会耗去相当于 2单位猪食的成本。如果大猪按钮取食 ,小猪在一旁等待, 则大猪能吃到9单位食物而小猪仅能吃到 1单位食物;如果两猪同时按钮取食 ,则大猪吃7单位, 小猪吃3单位食物;如果小猪按钮取食 ,大猪在一旁等待, 则大猪吃6单位而小猪吃4单位食物 (见表 3)。这个博弈没有“剔除劣策略均衡”,因为大猪没有劣策略 。但是,小猪的劣策略是 “按”,因为无论大猪作何选择, 小猪选择 “等待 ”是比选择 “按 ”更好一些的策略。所以 ,小猪会剔除“按”, 而选择“等待 ”;大猪知道小猪会选择 “等待”,从而自己的最优选择是 “按 ”,所以纳什均衡解就是 (按, 等待 )。 表 3 智猪博弈支付矩阵 小猪 大猪 按 等待 按 5, 1 4, 4 等待 9, -1 0, 0 在现实经济生活中,有许多 “智猪博弈”的例子 ,它反映的是一种参与人地位不对等的博弈结构 ,这种不对等可以是参与人拥有的信息和支付函数,也可以是参与人所采取的策略和行动。比如在股票市场上,大户是大猪 ,他们进行技术分析 ,收集信息、预测股价走势,而大量散户就是小猪 ,他们几乎不花成本去进行技术分析, 而是跟着大户(基金)的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象 。在股份公司中 ,大股东是大猪, 他们收集信息、监督经理 ,拥有决定经理任免的投票权, 而小股东是小猪 ,他们不直接花精力去监督经理, 投票权重也往往无足轻重, 但他们却可以从大股东的监督中受益。技术创新市场上, 大企业是大猪, 它们投入大量资金进行技术创新 ,开发新产品, 而中小企业是小猪 ,它们不会进行大规模的技术创新, 而是采取 “跟随策略 ”,等待大企业的新产品形成新的市场后 ,仿制大企业的新产品展开销售。 三 、 拍卖机制 :不对称信息下的买与卖 在 “囚徒困境 ”和 “智猪博弈 ”中, 参与人的信息是公开且对称的 ,或者说参与人之间不存在不对称信息,但是在更多的情形下 ,参与人之间的信息不是公开的,市场上的尔虞我诈往往无法避免。 以拍卖市场为例 ,考虑一件古董需要拍卖 ,有许多人参加竞争性拍卖。这件古董在每个买主心中有一个估价。但是 ,卖主不知道买主的估价, 买主当然也不会老老实实地将其对古董的估价告诉卖主 ,不同买主之间也不知道互相之间的估价。因此 ,有关标的和竞标的信息都是不对称的 。假定采用 “英式拍卖 ”,买主们轮流出价 ,直到开出最高价的买主拿走古董并支付这个价格。但遗憾的是,如果按这种拍卖方法 ,古董并不能按买主心中的最高的估价卖出。比如, 当买主中的最高估价为10万元 , 第二高估价为 8万元时 , 当估价最高的买主开出 9万元时 , 便可买走其估价为 10万元的古董而只支付 9万元。由于这是公开竞价 ,所以会出现围标问题, 即买主们合谋压价。为了避免围标 ,一种常用的方法是 “一级密封价格拍卖法”,买主每人将其开出的价格写入一个信封, 密封后交给卖主 。卖主拆开所有信封,将古董卖给信封中出价最高的人, 并要求支付这个价格 。但是 “一级密封价格拍卖法 ”却不能诱使买主按照其真实估价进行出价, 这是因为, 买主总可以报一个略低于其真实估价的价格获得标的物 ,从而赚取其中差价 。经济学家维克瑞发明的“二级密封价格拍卖法 ”,既可避免围标 ,又可诱使买主们报出真实估价 。 他的方法是这样的,先要求每个买主将出价写入一个信封, 密封后交给卖主 ,卖主拆开信封后宣布将古董卖给出价最高的人 ,但只需支付开出的第二高的价格。譬如 ,出价最高的为 10万元 ,第二高的为 8万元 ,古董就卖给开出 10万元的人 ,但他只需支付给卖主 8万元 。对每个买主来说 ,他不知道其他买主的估价,但给定其他买主的估价,他一旦获胜 ,支付的第二高的价格是固定的,不会随他开出的价格而改变;但他开出的价格愈高 ,获胜的可能就愈大 ;但是 ,他不能开出比他的价值估价更高的价格。因为一旦存在别的人开出的价格比他的价值估价还要高,当他获胜时 ,就必须以高出他的价值估价的价格购买古董,对他来说是得不偿失的。所以, 每个人都会如实地按心中的估价开出价格。如果所有人的估价是一样的, 古董就以真实的最高价值卖出。维克瑞拍卖法可以诱使买主说出真话,因而这种方法也被成为维克瑞机制 。 上世纪七十年代美国联邦政府运用维克瑞招标法进行公共工程招标,为联邦政府节省了大笔开支。到目前为止 ,经济学家对拍卖机制的研究获得了丰硕而卓越的成果, 不仅形成了以 “英式拍卖 ”、“荷兰式拍卖 ”、 “一级密封价格拍卖法”和“二级密封价格拍卖法 ”等四种拍卖方式为核心的基础理论,并围绕不同的拍卖方式探讨和比较投标者及卖主的收益 ,而且还在投标者风险厌恶、投标者之间具有共同信息 、非对称估价分布, 以及存在由非对称估价分布导致的二级交易市场(resale)的情况下探讨和比较上述问题 ,从而颠覆了基础理论的前提假设 ,特别是对二级交易市场的研究 ,对解释我国经济转轨过程中国有企业的资产流失现象具有重要的启示意义。 四 、 战争与冲突 :为世界和平破题 奥曼和谢林两位学者的工作进一步发展了博弈理论, 并开始涉及社会学领域中的一些主要问题 。他们认为使用博弈论有望重塑关于人类交互作用的分析范式, 从社会交互作用剖析和理解战争和冲突的本质 ,以及可能采取的通往和平的策略 。谢林 1960年的著作 《冲突的策略 》从经济学的角度将博弈论作为统一的分析框架应用于社会科学问题 。 他认为 :一个政党可以通过公开恶化自身的选择权来巩固自己的地位 ;报复能力远比抵抗进攻能力来的有用 ;不确定性的报复比确定条件下的报复更有效率 、更加可靠 。这些解决冲突、避免战争的中肯创见已被事实证明, 一个经典应用是在国际关系领域 。谢林在 《冲突的策略》中运用博弈论分析了国家之间的讨价还价行为。他指出 :“偶然事件不会引发战争 ,只有决定才会导致战争的爆发。”如果一国认为另一国会突然发动袭击 , 那么一场双方都不情愿的战争就有可能爆发。突然袭击的优势和动机在于对方缺乏反击的能力 ,因此 ,防止突然袭击的首要目标是军事安全而不是人员安全 。进一步说 ,防止突然袭击需要可信的二次还击能力 。 与谢林叙事性风格完全不同的是 ,奥曼则从数学的角度出发 ,在其诸多贡献之中, 关于长期合作的研究,无疑具有最深刻的冲击和影响 。他认为长期合作关系的维系远比一次简单的际遇来得容易, 为此, 他提出了完整详尽的无限期重复博弈理论 ,并严格论证了何种结果能够在长时期的关系中得到维持。无限期重复博弈理论阐明了众多机构存在的理由, 比如商业协会、组织犯罪 、工资谈判以及国际贸易协议等 。奥曼所提出的一些真知灼见也有助于解释价格战或贸易战等经济冲突 ,以及为什么一些团体组织能够非常成功地管理公共资源等。除了长期合作领域内的建树外。 长期以来, 博弈论研究者对这一基本问题始终保持沉默 ,经济学家在进行均衡分析时对此也没作过多考虑。奥曼在 1976年的论文“同意分歧”中 ,将李维斯 (LewisD.)于 1969年提出的共同知识的概念引入博弈论 , 圆满地回答了这一问题 , 同时还促进了 “交互认识论 ”的发展。关于完全竞争的经济模型 , 奥曼认为 :只要仅存在有限参与者 , 个别参与者对经济的影响在数学上就不能被忽视 。奥曼把参与人闭连续集的概念引入到这一经济模型中, 指出适合于完全竞争的数学模型必须包括无限多个参与者, 从而拓宽了微观经济理论的解释能力。 五 、 演化博弈论 :尘埃是如何落定的 作为经济学和生物学交叉融合的产物 ,演化博弈修正了传统博弈论中对理性经济人似乎超人般无所不能的超理性假设 ,强调习惯 、习俗、规则、遗忘、冲动 、热情 、非理性预期和犯错误的概率等被传统博弈论所忽视的内容 、这在一定程度上动摇了传统博弈论的理论基石 。它的合理性在于 ,指出经济人并非超理性的, 而是基于个人习惯、习俗和惯例等一些生活常规、社会秩序和非正式约束下的 “异质低度理性 ”,在多数时间里 ,他们在所掌握的信息基础上相当理智地行动,也就是说, 当适应性过程有足够时间展开的话 ,是演化力量而不是个人理性在社会制度变迁中起着关键性的决定作用。这实际上继承并发展了由演化经济学所极力倡导的与新古典经济学相对的时间与历史在经济演化中的重要地位, 强调制度变迁在均衡形成过程的重要作用 。 因此,演化博弈论对均衡概念的理解也与传统博弈论有本质的区别, 打个比方来说, 如果说传统博弈论描述的是一旦尘埃落定世界看上去会是怎样的, 那么演化博弈论则对尘埃是如何落定的更感兴趣,并把这一过程视为随机力量产生的持续冲击,所以当把随机过程引入博弈论之后 ,许多结论都可能发生变化 。如果把传统博弈论看作是抽象掉了过程的演化博弈论, 或者干脆就是演化博弈论的一种特例,那么以探讨和研究 “进化稳定策略”形成机制的演化博弈论可以研究的内容更加广泛 ,演化博弈论对正统博弈论基本假设的突破 ,扩展和丰富了博弈论的解释范围和解释能力,并使之成为潜在的诺奖研究领域 。 六 、 结 语 博弈论来源于生活,却又如此的完美和不平凡 ,她的完美不在于拥有华丽而复杂的数学表达,而在于凝炼深邃而透彻的策略思维, 伴随着人类智慧的最佳发挥。其实 ,博弈论的理论模型一般都可以在现实生活中找到它们的原型, 而生活中的一些经验法则、习俗和习惯又都可以在博弈论中找到相似的元素,人类智慧的结晶实际上是博弈论在具体生活实例中的体现, 而学术研究前沿恰恰又能在具体的生活法则中得到最好的验证。 当然,博弈论自身也面临着许多问题 ,一个极端苛求的质疑来自对传统博弈论 (不包含演化博弈论)完全理性假设的不信任, 但无论如何我们都必须承认 ,正是在这个极端苛求的质疑下, 博弈论解释了从生活到战争,从合作到纷争的种种人类活动 ,而且学科自身发展的完善同时也要求博弈论能够朝着更富有解释力的方向演进 。可以相信, 在结合了生物学 、脑科学以及计算科学在内的演化博弈论的出现 ,必将在一定程度上推动博弈论理论研究的不断深入, 其解释力和预判能力也必将超越传统博弈论而上升为一种新的研究工具和认识范畴. 参考文献: 【1】张维迎 , 博弈论和信息经济学 [ M] .上海 , 三联书店 , 1996. 【2】何德旭、王朝阳、应寅锋 .博弈论下的冲突与合作[ J] .理论前沿.2005, 【3】郭鹏、杨晓琴,“博弈论与纳什均衡”,《哈尔滨师范大学自然科学学报》,2006年第4 期第22卷,第25页。 【4】王金炳,“博弈论的发展历史和基本内容”,《时代经贸》,2007年6月第5卷第70期, 第1页 【5】张建英,“博弈论的发展及其在现实中的应用”,《理论探索》,2005年第2期(总第152 期),第36页- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 信息 经济学 课程 论文
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Fis****915】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Fis****915】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Fis****915】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Fis****915】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文