黎明前的静谧
博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
现代数学中有博弈论,亦名“对策论”、“赛局理论”,属应用数学的一个分支, 表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。
在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
词语出处:
《论语·阳货》:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。” 朱熹集注:“博,局戏;弈,围棋也。”《汉书·游侠传·陈遵》:“祖父 遂 ,字 长子 , 宣帝 微时与有故,相随博弈,数负进。” 颜师古注:“博,六博;弈,围碁也。”
唐 韩愈《郑公神道碑文》:“公与宾客朋游,饮酒必极醉,投壶博弈,穷日夜,若乐而不厌者。” 明 胡应麟《少室山房笔丛·九流绪论上》:“艺主书计射御,而博弈绘画诸工附之。”
宋苏轼《策别》十七:“出为盗贼,聚为博弈,群饮於市肆,而叫号於郊野。” 清戴名世《财神问对》:“聚为博弈,出为盗贼。”
郑振铎《埃娥》五:“好像博弈负了一场似的,他耸耸肩走了。”
以上内容参考:百度百科—博弈 (汉语词语)
Angelcat930
博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈
按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯均衡(perfect Bayesian equilibrium)。
博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。
摆脱拖延症
饿狮博弈假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设A吃掉绵羊后就会打盹,这时比A稍弱的B就会趁机吃掉A,接着B也会打盹,然后比B稍弱的C就会吃掉B,以此类推。问:狮子A敢不敢吃绵羊?该题须采用逆向分析法,从最弱的F开始分析,依次前推。假设E睡着了,F肯定会吃掉E,因为在F的后面已没有其它狮子了,不用担心自己被吃掉。继续前推,既然E知道自己睡着会被F吃掉,那么E必然不敢吃睡着了的D。既然E不敢吃掉D,那么D则可以放心去吃睡着的C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,如下图。这次的答案变成了狮子A敢吃掉绵羊。对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性:当总数为奇数时,A敢吃;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
沈阳王小圈儿
博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支, 也是运筹学的一个重要学科。 博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》 就不仅是一部军事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中的胜负问题, 人们对博弈局势的把握只停留在经验上,没有向理论化发展, 正式发展成一门学科则是在20世纪初。1928年冯· 诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。 1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《 博弈论与经济行为》 将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域, 从而奠定了这一学科的基础和理论体系。 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《 n人博弈的均衡点》(1950),《非合作博弈》(1951) 等等,给出了纳什均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。 今天博弈论已发展成一门较完善的的学科。 博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中, 每一个有决策权的参与者成为一个局中人。 只有两个局中人的博弈现象称为“两人博弈”, 而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中, 每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案, 一个局中人的一个可行的自始至终全局筹划的一个行动方案, 称为这个局中人的一个策略。 如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈” ,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。 每个局中人在一局博弈结束时的得失, 不仅与该局中人自身所选择的策略有关, 而且与全局中人所取定的一组策略有关。所以, 一局博弈结束时每个局中人的“得失” 是全体局中人所取定的一组策略的函数,通常称为支付( payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中, 均衡意即相关量处于稳定值。在供求关系中, 某一商品市场如果在某一价格下, 想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡, 它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中, 所有的参与者面临这样一种情况,当其他人不改变策略时, 他此时的策略是最好的。也就是说, 此时如果他改变策略他的支付将会降低。在纳什均衡点上, 每一个理性的参与者都不会有单独改变策略的冲动。 纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“ 均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*, 局中人B也采取其最优策略b*,如果局中人仍采取b*, 而局中人A却采取另一种策略a, 那么局中人A的支付不会超过他采取原来的策略a*的支付。 这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称之为均衡偶,对任一策略a( 属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称为非零和博弈的均衡偶, 对任一策略a(属于策略集A)和策略b(属于策略集B),总有: 对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对( a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。 这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论, 不动点理论是经济均衡研究的主要工具。通俗地说, 寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段, 使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略, 而忽视了其他局中人改变策略的可能性,因此,在很多情况下, 纳什均衡点的结论缺乏说服力,研究者们形象地称之为“ 天真可爱的纳什均衡点”。 塞尔顿(R·Selten) 在多个均衡中剔除一些按照一定规则不合理的均衡点, 从而形成了两个均衡的精炼概念: 子博弈完全均衡和颤抖的手完美均衡。 博弈的类型 (1)合作博弈——研究人们达成合作时如何分配合作得到的收益, 即收益分配问题。 (2)非合作博弈—— 研究人们在利益相互影响的局势中如何选决策使自己的收益最大, 即策略选择问题。 (3)完全信息不完全信息博弈: 参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完 全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序, 但后行动者不知道先行动者的策略。 动态博弈: 指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。 财产分配问题和夏普里值(Shapley value) 考虑这样一个合作博弈:a、b、c、投票决定如何分配100万, 他们分别拥有50%、40%、10%的权力,规则规定, 当超过50%的票认可了某种方案时才能通过。 那么如何分配才是合理的呢?按票力分配,a50万、b40万、 c10万c向a提出:a70万、b0、c30万b向a提出: a80万、b20万、c0…… 权力指数: 每个决策者在决策时的权力体现在他在形成的获胜联盟中的“ 关键加入者”的个数,这个“关键加入者” 的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下, 参与者对联盟的边际贡献之和除以各种可能的联盟组合。 次序abc acb bac bca cab cba 关键加入者 a c a c a b 由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/6,1/6。 博弈论的意义 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一 样,都是从复杂的现象中抽象出基本的元素, 对这些元素构成的数学模型进行分析, 而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、 扩展型和特征函数型利用这三种表述形式, 可以研究形形色色的问题。因此,它被称为“社会科学的数学” 从理论上讲,博弈论是研究理性的行动者相互作用的形式理论, 而实际上正深入到经济学、政治学、社会学等等, 被各门社会科学所应用。 博弈论是指某个个人或是组织,面对一定的环境条件, 在一定的规则约束下,依靠所掌握的信息, 从各自选择的行为或是策略进行选择并加以实施, 并从各自取得相应结果或收益的过程, 在经济学上博弈论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手, 其每一个行为如同在一张看不见的棋盘上布一个子, 精明慎重的棋手们相互揣摩、相互牵制,人人争赢, 下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。 换句话说, 就是研究个体如何在错综复杂的相互影响中得出最合理的策略。 事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。 数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、 体系研究其规律及变化。这可不是件容易的事情, 以最简单的二人对弈为例,稍想一下便知此中大有玄妙: 若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法, 而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法, 乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题, 怎样对作为现实归纳的抽象数学问题求出最优解、 从而为在理论上指导实践提供可能性呢? 现代博弈理论由匈牙利大数学家冯· 诺伊曼于20世纪20年代开始创立, 1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《 博弈论与经济行为》,标志着现代系统博弈理论的初步形成。 对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈-- 好比两个人下棋、或是打乒乓球, 一个人赢一着则另一个人必输一着,净获利为零。 在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则, 即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度 地失利,并据此最优化自己的对策,诺伊曼从数学上证明, 通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“ 最小最大解” 。通过一定的线性运算, 竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤, 就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于, 这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说, 这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
yangdandan
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
案例一:囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。
单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的决策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。
而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,想更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。
案例二:智猪博弈
一、经济学中的“智猪博弈”(Pigs’payoffs) 这个例子讲的是:
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是6∶4;同时到槽边,大小猪收益比是7∶3;小猪先到槽边,大小猪收益比是9∶1。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
"智猪博弈"由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:
从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗?
案例三:美女的硬币
一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗?
假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)。这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。
同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)。解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元
如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。
总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。
资料来源:博弈论百度百科
案例四:普通范式博弈
GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。
上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people's shoes。
现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。
最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。随着次数(博弈性质)的变化,纳什均衡点也并非唯一。
案例五:饿狮博弈
题设为A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。细心的人也许会发现,假如增加或减少狮子的总数,博弈的结果会完全不同。
我们在狮子F的后面增加了一只狮子G,总数变成7只。用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
通过上述案例的多轮博弈,初学者应该能够隐约发现纳什均衡的轮廓。当博弈次数不止一次地进行着时,博弈结果将重复定格在某个状态,那个状态即是纳什均衡点。公理解释是如果博弈在某情况下无任一参与者可以通过独自行动而增加收益,则此时的策略组合被称为纳什均衡。
简单的博弈案例看上去似乎有趣,但博弈论始终是一门深奥复杂的学问,它的复杂之处就在于博弈分析所用的理想化模型与现实永远存在差异。比如博弈论要求各方参与者必须是经济学意义上的“理性人”,而事实上完全的“理性人”并不存在。现实世界存在着太多超出博弈论的变数,这为追求精确预测的博弈模型构建工作带来难度。
尽管如此,博弈论仍然改变了世界,成为人类理性认识世界的一个重要工具。而纳什均衡的提出无疑丰富了博弈论的理论体系,它是人类文明的一片砖瓦。可以肯定的是,百年之后,人们依然不会忘记约翰•纳什的名字,亦不会忘记那个神奇的纳什均衡。资料来源:两个经典例子,揭开博弈论以及纳什均衡的神秘面纱,本文系作者 水哥
博弈论(Game Theory),又称为对策论,或者赛局理论,应用数学的一个分支,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。目前在生物学,经济学
发了sci怎么发朋友圈?可以有效帮助我们发表SCI论文。这里我们先总结几点:1)如果不认识很多学科内的人,可以寻找导师资源。因为导师会有自己的朋友圈,这个是很重
近日,打开各大媒体,深圳的一位“名师”火了,她是广东省青年岗位能手,深圳市“道德模范”,2016阅读改变中国“年度十大点灯人”……无数光环集于一身,但是盛名之下
在官网的检索栏进行作者文献检索,检索自己的姓名即可查询自己已经发表的文章。 中国期刊网提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多
目前国内受普遍认可的核心无外乎:中文核心期刊(北大核心)、cssci(南大核心,其中又分来源刊和拓展版)、cscd(中国科学引文库期刊)、sci期刊、ei检索期