首页 > 论文发表知识库 > 博弈论文献综述参考文献

博弈论文献综述参考文献

发布时间:

博弈论文献综述参考文献

博弈论论文的写作格式、流程与写作技巧 广义来说,凡属论述科学技术内容的作品,都称作科学著述,如原始论著(论文)、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要,但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验,是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目,不能“无题”。论文题目一般20字左右。题目大小应与内容符合,尽量不设副题,不用第1报、第2报之类。论文题目都用直叙口气,不用惊叹号或问号,也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人,应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上,那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者,也可以一般致谢。行政领导人一般不署名。(三)论文——引言 是论文引人入胜之言,很重要,要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法 按规定如实写出实验对象、器材、动物和试剂及其规格,写出实验方法、指标、判断标准等,写出实验设计、分组、统计方法等。这些按杂志 对论文投稿规定办即可。(五)论文——实验结果 应高度归纳,精心分析,合乎逻辑地铺述。应该去粗取精,去伪存真,但不能因不符合自己的意图而主观取舍,更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因,不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃,不能只废弃不合己意者。实验结果的整理应紧扣主题,删繁就简,有些数据不一定适合于这一篇论文,可留作它用,不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图,可以不用图表的最好不要用图表,以免多占篇幅,增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代,不要随意丢弃。(六)论文——讨论 是论文中比较重要,也是比较难写的一部分。应统观全局,抓住主要的有争议问题,从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理,而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论,表明自己的观点,尤其不应回避相对立的观点。 论文的讨论中可以提出假设,提出本题的发展设想,但分寸应该恰当,不能写成“科幻”或“畅想”。(七)论文——结语或结论 论文的结语应写出明确可靠的结果,写出确凿的结论。论文的文字应简洁,可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献 这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉,便于查找,同时也是尊重前人劳动,对自己的工作有准确的定位。因此这里既有技术问题,也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法;在结果中有时要引上与文献对比的资料;在讨论中更应引上与 论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意,不查文献;故意不引,自鸣创新;贬低别人,抬高自己;避重就轻,故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的,这应该看成是利研工作者的大忌。其中,不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽,如将该引在引言中的,把它引到讨论中。这就将原本是你论文的基础或先导,放到和你论文平起平坐的位置。又如 科研工作总是逐渐深人发展的,你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是,某年某人对本题做出了什么结果,某年某人在这基础上又做出了什么结果,现在我在他们基础上完成了这一研究。这是实事求是的态度,这样表述丝毫无损于你的贡献。有些论文作者却不这样表述,而是说,某年某人做过本题没有做成,某年某人又做过本题仍没有做成,现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人,但只需内行人一戳,纸老虎就破,结果弄巧成拙,丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢 论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的,不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意,不能拉大旗作虎皮。(十)论文——摘要或提要:以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写,有吸引力。要让读者看了论文摘要就像看到了论文的缩影,或者看了论文摘要就想继续看论文的有关部分。此外,还应给出几个关键词,关键词应写出真正关键的学术词汇,不要硬凑一般性用词。 推荐一些比较好的论文网站。论文之家 优秀论文杂志 论文资料网 法律图书馆 法学论文资料库 中国总经理网论文集 mba职业经理人论坛 财经学位论文下载中心 公开发表论文_深圳证券交易所 中国路桥资讯网论文资料中心 论文商务中心 法律帝国: 学术论文 论文统计 北京大学学位论文样本收藏 学位论文 (清华大学) 中国科技论文在线 论文中国 : 新浪论文网分类: 中国论文联盟: 大学生论文库 论文资料网:

博弈论(Game Theory)是 研究具有斗争或竞争性质现象的数学理论和方法,二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的[1] 。 1928年,著名科学家、计算机之父冯·诺依曼证明了博弈论定理。 1950年,普林斯顿数学系教授约翰·纳什,通过不动点原理证明了均衡点的存在,并且提出了著名的纳什均衡理论,将博弈论引入到了除数学以外的其它领域内。1994年,约翰·纳什与约翰·海萨尼、莱茵哈德·泽尔滕,处于表彰他们对博弈论做出的贡献,授予三位当年的诺贝尔经济学奖,从此博弈论被推上了学术界高峰地位。2001年一部以约翰·纳什为传记改编的电影《美丽心灵》,诠释了纳什的传奇人生。2001年,乔治·阿科尔洛夫、斯宾塞和约瑟夫·斯蒂格利茨,利用博弈论分析了市场的信息不对称问题,为现代信息经济学奠定了基础。 2005年,托马斯·克罗姆比·谢林和罗伯特·约翰·奥曼通过博弈论分析了冲突和合作的理解。 2007年,罗杰·迈尔森和埃里克·马斯金、里奥尼德·赫维茨,通过博弈论的研究推动了机制设计理论的发展。 2012年,罗斯与沙普利根据博弈论创建了稳定分配理论。 2014年,梯若尔在产业组织理论以及串谋问题上,采用了博弈论的思想,让理论和问题得以解决,并且在规制理论上也有创新。 纳什均衡是指在一组组合策略之中,对于每个参与者来说,只要其他人不改变自己的策略,那么他就无法改善自己的状况。简单来说在一种稳定的状态下任何人单独改变策略都得不到好处。 举个例子:我和我的朋友去酒吧去找对象,对面吧台前面有许多美女,一群是金色头发(blonde),还有一群是褐色头发(brunette),此时如果我们要上前搭讪,那么会有这么几种可能性: ①如果我和我的朋友同时找所有的金发女郎搭讪,那么我们找到合适对象的机会是0,因为我们无法深入了解所有人。(0,0) ②如果我的朋友去找所有的金发女郎搭讪,而我去找一位褐发女郎搭讪,那么我成功的概率远大于我的朋友,因为我可以通过足够深入的聊天去了解彼此。(2,5) ③如果我的朋友去找一位褐发女郎搭讪,而我去找所有的金发女郎搭讪,相同的道理我朋友成功的概率会远高于我。(5,2) ④如果我和我的朋友都分别去找一位褐发女郎搭讪,那么我们成功的概率相差无几。(2,2) 在这组找对象的策略组合中,第四种策略即属于纳什均衡策略。也就是说双方可以达到共赢的状态,任何一方变动策略都会是的局面失去平衡。 (1)博弈树 博弈树:又称扩展式博弈模型,由节点、主干、枝干构成的策略组合模型。 如图所示:节点:①、②;主干:U、D;枝干:U‘、D‘ 起点①为初始决策点,竞争者:“我” 主干U为“进入”决策的条件:“找所有的金发女郎搭讪” 主干D为“不进入”决策的条件:“找一位褐发女郎搭讪”决策 中间决策点②,竞争者:“我的朋友” 枝干有两个策略:一个是“去找所有金发女郎”,另一个是“去找一位褐发女郎“ 决策终止点:决策结果分别为(0,0)和(2,5)(2)博弈表(1)囚徒困境话说甲乙两名囚犯因抢劫罪被捕入狱,警察需要录口供判定二者的罪行: 如果甲乙都招供罪行,那么各判2年; 如果囚犯乙招供所有罪行都是甲做的,甲保持沉默,那么甲判刑10年,乙当庭释放; 如果囚犯乙保持沉默,甲招供所有罪行都是乙做的,那么甲当庭释放,乙判10年; 如果两个人都保持沉默,什么都不肯说,那么警察找不到确切证据判刑,只能各判半年。 1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·帕克以囚徒方式阐述,并命名为“囚徒困境”[2]。 该博弈案例反应的是个人的最优策略并非是集体的最优策略,从案例中可以推出,从最优的策略角度来看,二者都保持沉默不招供,各自只会判半年,然而从人的本性选择来看,却都倾向于招供罪行,因为每个人都怕自己万一保持沉默,对方把罪行全推到自己头上,判10年的罪行。这是人性的弱点所导致的非理性博弈。 (2)智猪博弈猪圈里有一只大猪和一只小猪,猪圈一边放着一个由绳索钩挂的猪槽,另一边是连接伸缩的踏板,如果它们想吃到食物必须踩一下这一边的踏板,另一边会有10份食物从猪槽里掉下来。无论谁踩踏板,都会消耗2份食物的能量,下面有这几种情况:两只猪一起踩踏板,大猪比小猪吃得快,大猪吃了8份,小猪才吃了2份。(6,0) 大猪踩踏板,小猪守在槽边,由于小猪没有出力,只能吃4份食物,大猪可以吃6份。(6,6) 小猪踩踏板,大猪守在槽边,大猪吃得比小猪快,小猪跑过来时,10份全被大猪吃完了。(10,-2) 两只猪都不踩踏板,全部没食物吃。(0,0) 在企业中,大企业就好比大猪,中小企业就好比是小猪。控制按钮可以比作技术创新,可以给企业带来收益。大企业资金雄厚,生产力大,有更多的能力进行技术创新,推出新产品后可以迅速占领市场获得高额利润。而小企业的最优选择就是等待,等大企业技术创新后,跟在大企业后,抢占市场份额,从这种创新中获得利益[3] 。 (1) 零和博弈:表示所有博弈方的利益之和为零或一个常数,即一方有所得,其他方必有所失[4] 。生活中的俗语:“不是你死就是我亡”、“非黑即白”。 (2)非零和博弈:是与零和博弈相对的概念,一方有所得,另一方也可能有所得,最终是一个双赢或者双输的局面。生活中的俗语:“合作共赢”、“同归于尽”。 参考文献: [1]360百科:博弈论 [2]Wikpadia:囚徒困境 [3]MBA智库:智猪博弈 [4]Wikpadia:零和博弈 本文首发于微信公众号“认知与新思维”。

equilibria in all-optical networksDiscrete Mathematics, Volume 309, Issue 13, 6 July 2009, Pages 4332-4342George F. Georgakopoulos, Dimitris J. Kavvadias, Leonidas G. determinacy of Nash equilibrium in network-formation gamesGames and Economic Behavior, Volume 66, Issue 2, July 2009, Pages 920-927Carlos the complexity of constrained Nash equilibria in graphical gamesTheoretical Computer Science, In Press, Accepted Manuscript, Available online 2 June 2009Gianluigi Greco, Francesco of the existence of a pure-strategy Nash equilibriumApplied Mathematics Letters, Volume 22, Issue 5, May 2009, Pages 689-692Ji-Cheng Nash equilibriumJournal of Economic Theory, Volume 144, Issue 2, March 2009, Pages 722-743Kin Chung Lo6.

博弈论文献综述论文范文

写论文你得有内容输入,你可以看下相关的书或者课程

博弈论(Game Theory),又称为对策论,或者赛局理论,应用数学的一个分支,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。目前在生物学,经济学,国际关系,计算机科学,政治学,军事战略和其他很多学科都有广泛的应用。博弈论也应用于数学的其他分支,如概率,统计和线性规划,生物学家使用博弈理论来理解和预测进化(论)的某些结果。博弈论主要研究公式化了的激励结构(游戏或者博弈)间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。在这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象。此外,博弈论以不同的所持信息又可以分为完美博弈、完全博弈和不完全博弈(贝叶斯博弈);以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。博弈论在国际贸易中的运用如:任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。 当代博弈论的主要理论家有:约翰·福布斯·纳什(John Forbes Nash Jr)、约翰·C·海萨尼、莱因哈德·泽尔腾,他们3人因对博弈论的突出贡献而同时获得1994年的瑞典银行经济学奖);罗伯特·奥曼(Robert J. Aumann)、美国人托马斯·谢林(Thomas C. Schelling)他们2人获得2005年诺贝尔经济学奖;以及肯·宾摩尔、戴维·克瑞普斯,阿里尔·鲁宾斯坦等。

可以采用博弈论中的一个模型(例如智猪博弈,囚徒问题等),对应生活中的经济问题,比如商品促销、公司技术升级等等,具体问题具体分析,这是一个思路,希望能帮到你。

博弈论论文可参考文献

近代对于博弈论的研究,开始于策墨洛,波雷尔及冯·诺伊曼约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。2007年的诺贝尔经济学奖,就是由两位研究博弈论的学者共享,他们是美国人托马斯·谢林和拥有以色列和美国双重国籍的罗伯特·奥曼

博弈论论文的写作格式、流程与写作技巧 广义来说,凡属论述科学技术内容的作品,都称作科学著述,如原始论著(论文)、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要,但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验,是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目,不能“无题”。论文题目一般20字左右。题目大小应与内容符合,尽量不设副题,不用第1报、第2报之类。论文题目都用直叙口气,不用惊叹号或问号,也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人,应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上,那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者,也可以一般致谢。行政领导人一般不署名。(三)论文——引言 是论文引人入胜之言,很重要,要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法 按规定如实写出实验对象、器材、动物和试剂及其规格,写出实验方法、指标、判断标准等,写出实验设计、分组、统计方法等。这些按杂志 对论文投稿规定办即可。(五)论文——实验结果 应高度归纳,精心分析,合乎逻辑地铺述。应该去粗取精,去伪存真,但不能因不符合自己的意图而主观取舍,更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因,不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃,不能只废弃不合己意者。实验结果的整理应紧扣主题,删繁就简,有些数据不一定适合于这一篇论文,可留作它用,不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图,可以不用图表的最好不要用图表,以免多占篇幅,增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代,不要随意丢弃。(六)论文——讨论 是论文中比较重要,也是比较难写的一部分。应统观全局,抓住主要的有争议问题,从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理,而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论,表明自己的观点,尤其不应回避相对立的观点。 论文的讨论中可以提出假设,提出本题的发展设想,但分寸应该恰当,不能写成“科幻”或“畅想”。(七)论文——结语或结论 论文的结语应写出明确可靠的结果,写出确凿的结论。论文的文字应简洁,可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献 这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉,便于查找,同时也是尊重前人劳动,对自己的工作有准确的定位。因此这里既有技术问题,也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法;在结果中有时要引上与文献对比的资料;在讨论中更应引上与 论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意,不查文献;故意不引,自鸣创新;贬低别人,抬高自己;避重就轻,故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的,这应该看成是利研工作者的大忌。其中,不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽,如将该引在引言中的,把它引到讨论中。这就将原本是你论文的基础或先导,放到和你论文平起平坐的位置。又如 科研工作总是逐渐深人发展的,你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是,某年某人对本题做出了什么结果,某年某人在这基础上又做出了什么结果,现在我在他们基础上完成了这一研究。这是实事求是的态度,这样表述丝毫无损于你的贡献。有些论文作者却不这样表述,而是说,某年某人做过本题没有做成,某年某人又做过本题仍没有做成,现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人,但只需内行人一戳,纸老虎就破,结果弄巧成拙,丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢 论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的,不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意,不能拉大旗作虎皮。(十)论文——摘要或提要:以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写,有吸引力。要让读者看了论文摘要就像看到了论文的缩影,或者看了论文摘要就想继续看论文的有关部分。此外,还应给出几个关键词,关键词应写出真正关键的学术词汇,不要硬凑一般性用词。 推荐一些比较好的论文网站。论文之家 优秀论文杂志 论文资料网 法律图书馆 法学论文资料库 中国总经理网论文集 mba职业经理人论坛 财经学位论文下载中心 公开发表论文_深圳证券交易所 中国路桥资讯网论文资料中心 论文商务中心 法律帝国: 学术论文 论文统计 北京大学学位论文样本收藏 学位论文 (清华大学) 中国科技论文在线 论文中国 : 新浪论文网分类: 中国论文联盟: 大学生论文库 论文资料网:

equilibria in all-optical networksDiscrete Mathematics, Volume 309, Issue 13, 6 July 2009, Pages 4332-4342George F. Georgakopoulos, Dimitris J. Kavvadias, Leonidas G. determinacy of Nash equilibrium in network-formation gamesGames and Economic Behavior, Volume 66, Issue 2, July 2009, Pages 920-927Carlos the complexity of constrained Nash equilibria in graphical gamesTheoretical Computer Science, In Press, Accepted Manuscript, Available online 2 June 2009Gianluigi Greco, Francesco of the existence of a pure-strategy Nash equilibriumApplied Mathematics Letters, Volume 22, Issue 5, May 2009, Pages 689-692Ji-Cheng Nash equilibriumJournal of Economic Theory, Volume 144, Issue 2, March 2009, Pages 722-743Kin Chung Lo6.

近年博弈论文参考文献

请看此帖:(我国建国后历代国际象棋书籍目录),一共三百多本国象类书籍。 希望我的回答能帮到你^_^

以前没发现,但在学习了 博弈论基础的知识后,很容易的发现,博弈如同空气般,围绕在我们身边,无处不在。生活中的大小事怎么个博弈法,下面的内容将娓娓道来。       无论在日常生活中还是在工作中,“博弈”都是一个高频的词汇,生活中的博弈和经济学中的博弈有怎样的关系,精通“博弈”的人会不会特别擅长“套路”,“博弈论”到底是怎样的一种思维?下面我们来从以下方面谈论一下。 一、博弈论的定义       博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。 博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。 二、博弈论的发展        博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。近代对博弈论的研究,开始于策 梅洛、波莱尔、冯·诺依曼。       1928年, 冯·诺依曼 证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年, 冯·诺依曼 和 摩根斯坦 共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。         1950~1951年, 约翰·福布斯·纳什 利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外, 莱因哈德·泽尔腾、约翰·海萨尼 的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 三、博弈论的例子         “博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。 一囚徒困境         囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的个体的理性要求。         囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。       前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。二智猪博弈         猪圈里面有两只猪, 一只大,一只小。猪圈很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只 猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。所以呢小猪为了能吃饭东西,最好的策论就是大大猪的“便车”。这种情况在现实中比比皆是。         比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。         “智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。 三那什均衡       纳什均衡最核心的其实就是互利的思想。有个小故事就可以体现。街上相邻的地方有两家小店,一家卖稀饭豆浆,一家卖油条馒头,一般客人都是买上馒头油条去和稀饭豆浆,所以开始两家的生意都很红火。后来卖豆浆的觉得卖油条的抢了生意,双方产生了矛盾,卖油条的走了,结果连带自己的生意也不行了。        其实我们生活中有很多与博弈相关的例子。而在这样一个复杂的博弈战场上,我们怎么能使得自己在博弈场上获得最大的利益就是一门很大的学问了。所以,博弈论是一门很有用的学科。通过读书学习让我又懂得了一问学问。

[1] 袁艺, 李宗卉. 博弈论的新发展:行为博弈论[J]. 生产力研究, 2009, (02) :7-9,13[2] 安毅, 杨忠直. 博弈决策规则与认知闭合需要[J]. 软科学, 2009, (02) :115-118,129[3] 包国宪,管理学:理论与方法[M].兰州:兰州大学出版社,1998

博弈论论文的研究综述

《博弈圣经》中《人类未知的蓝色档案》一文给出了博弈论的定义:“我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。”博弈圣经著作人说;博弈论是青年人的毒品,是无知者的兴奋剂,是沉默者的摇头丸。博弈论 就是张冠李戴 捕风捉影 以讹传讹《博弈圣经》【典故】讽刺博弈论的最高博弈水平有人问博弈圣经著作人,什么是博弈论。他回答说;博弈论就是,一问、二答、三无知。也就是说;问者无知、回答者无知、听者更无知。有人追问,到目前为止,那么多博弈论图书,那么多作者,他们的最高博弈水平是什么?博弈圣经著作人一听就笑了;目前他们的最高博弈水平,就是想卖给你一本书,赢你一本书钱。博弈圣经著作人通俗的谈;菜鸟与金鸟,一个人想变得伟大,从一个菜鸟变成一个金鸟,就要利用国家实体特性造个金鸟笼。日后,就可以在媒体的报道中、绘声绘色地描述那个金鸟笼;他是某某大学院校、某某著名教授、某某首席科学家、某某诺贝尔奖得主、甚至某某政府官员,他就自然地钻进了金鸟笼。博弈论理论,它是太过于急躁、太过于草率的理论。由于博弈论新奇、古怪、原始,一个“囚徒困境”的三维谜团像似神话,人们又错误地认为博弈论能够取胜,因此受到了人们盲目的吹捧和疯狂的参与。人们把博弈取胜的欲望作为动力,一个人有了欲望,就要有实现欲望的对象和背景,加上自己行为的结果,才能取得想要的东西。博弈竞争的欲望在远古就出现了。欲望的天性就是进行交往,建立行为二特性对局,就是博弈的合作。 但明眼的人都能看得出,他抄来的无效理论编成的一本本博弈论,就是张冠李戴、捕风捉影、“以讹传讹”,不管他从外国哪个地方抄来的,不管他抄了多少、编了多少本书、多少篇文章,究其低劣的学术品质,他仍然是一个菜鸟。假如博弈论大师,走出那个金鸟笼,再靠讲课赚大钱,靠卖书赚小钱,靠博弈取胜策略赚不到一毛钱,他就是,也许是一个罪犯。更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。

博弈逻辑(game logic)是随着博弈论的迅速发展而形成的一个新的学科,它是一行动逻辑。博弈逻辑研究的是理性的人在互动行动中即博弈中的推理问题。在博弈行为中存在演绎推理和归纳推理。正如在传统逻辑中存在逻辑悖论一样,博弈逻辑中同样存在悖论或者“问题”。博弈参与人运用演绎推理时存在逆向归纳法悖论,而运用归纳推理时存在归纳是否有效的问题。1一种新的逻辑:博弈逻辑博弈论研究人类活动中的互动行为,在经济学中得到广泛的运用。在博弈论中,人类的所有活动,只要是互动行为,均可以看成是博弈行动。在此基础上,一种新的逻辑“博弈逻辑”(game logic)得以兴起,它是一种特殊的行动逻辑(action logic)。博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人,在经济活动中理性的人即是使经济目标最大化的人——经济人。理性人如何使得自己的“得益”最大?关键是“推理”。2博弈逻辑中的演绎推理与归纳推理博弈论有两个假定:第一,博弈参与人是理性的;第二,博弈参与人的得益不仅取决于自己的行动,同时取决于其他人的行动。每个理性的参与人在策略选取,使自己得益最大时,要充分考虑局中其他人的策略选取。同时,每个参与人知道其他参与人与他有同样的想法。在博弈中,“每个人是理性的”是公共知识(common knowledge),它是每个参与人进行策略选择或者推理的前提。在1994年《美国经济评论》的题为《归纳论证和有界理性》一文中阿瑟提出了“酒吧问题”博弈,后来在1999年的著名的《科学》杂志上题为《复杂性和经济》一文又阐述了这个博弈。酒吧问题是指这样一个博弈:有一群人,比如总共有100人,每个周末均要决定,是去附近的一个酒吧活动还是呆在家里。该酒吧的容量是有限的,比如空间是有限的,或者座位是有限的。我们假定酒吧的容量是60人,或者说座位是60个。如果去酒吧的人数少于60,并且他也去了,他的决定就是正确的;或者,如果去酒吧的人超过60人,而他没有去——当然这只有事后才知道,他的决定也是正确的。否则,其决定是错误的。这里,我们假定他们之间不存在信息交流。我们看到,每个人根据对总的去酒吧人数的预测,而决定去酒吧与否。如果他预测去酒吧的人数超过60人,他将做出“不去酒吧”的决定,如果其预测不超过60人,他将做出“去酒吧”的决定。他们是如何做出预测呢?5结语逆向归纳法悖论只是博弈论中一个悖论而已,归纳的合理性也只是多主体互动时理性人进行归纳推理的一个问题。博弈论涉及许多关于推理的逻辑“问题”。本人希望我国有更多的逻辑研究人员参与到博弈逻辑的研究中来,逻辑学家参与到博弈论的研究定能够结出丰硕的研究成果。

近代对于博弈论的研究,开始于策墨洛,波雷尔及冯·诺伊曼约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。2007年的诺贝尔经济学奖,就是由两位研究博弈论的学者共享,他们是美国人托马斯·谢林和拥有以色列和美国双重国籍的罗伯特·奥曼

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。 2.在经济学中,“智*博弈”(Pigs’payoffs)是一个著名博弈论例子。 这个例子讲的是:*圈里有两头*,一头大*,一头小*。*圈的一边有个踏板,每踩一下踏板,在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板,另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时,大*会在小*跑到食槽之前刚好吃光所有的食物;若是大*踩动了踏板,则还有机会在小*吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只*各会采取什么策略?答案是:小*将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小*踩踏板将一无所获,不踩踏板反而能吃上食物。对小*而言,无论大*是否踩动踏板,不踩踏板总是好的选择。反观大*,已明知小*是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,*圈里还会出现同样的“小*躺着大*跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩,大*将会把食物吃完;大*去踩,小*将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让*们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让*们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小*和大*都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智*博弈”故事给了竞争中的弱者(小*)以等待为最佳策略的启发。但是对于社会而言,因为小*未能参与竞争,小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智*博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小*”也有),一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。 许多人并未读过“智*博弈”的故事,但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智*博弈”指标改变的个中道理。 3.背景知识:纳什博弈论的原理与应用 2002年03月21日17:44 北京晚报1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已 站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。 纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。 1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。 1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。 纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。 囚犯的两难处境 大理论中的小故事 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。 价格战博弈: 现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。 污染博弈: 假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。 谢谢采纳

  • 索引序列
  • 博弈论文献综述参考文献
  • 博弈论文献综述论文范文
  • 博弈论论文可参考文献
  • 近年博弈论文参考文献
  • 博弈论论文的研究综述
  • 返回顶部