百科问答小站 logo
百科问答小站 font logo



如何对高微 mas collel(MWG) game theory 进行一个逻辑上的总结? 第1页

  

user avatar   liu-tong-ping 网友的相关建议: 
      

经济学新手强答一个,如有谬误,还请指摘。


第7章在内容上充当了一个引导作用,按顺序包括1.博弈(game)的基本概念;2.展开形表示法(extensive form representation);3.引入博弈论中的一个核心概念:策略(strategy)。在此基础上提供了一种新的表示法,即标准形(或策略形)表示法(normal (or strategic) form representation);4.混合策略(mixed strategy)。


首先出现的展开形表示法,也就是常见的博弈树,看起来较为直观,尤其在刻画完美信息博弈(可通俗地理解成存在先后顺序、对手之前的行动可被观察到的博弈)。但是在刻画不完美信息博弈(对手做了什么你并不知道,比如同时博弈)时,尽管我们引入了信息集(information set)这一概念,但这种展开形表示法的确没有那么直观了。


因此我们有了一种新的表示法,即标准形表示法(normal form)。在介绍这一方法前我们首先得区分行动(action)和策略的区别,初学者在理解策略时,经常无法抛弃这样一个念头:无法实现的行动怎么可以是策略呢?


上图这个使用拓展形表示的完美信息博弈,讲的是家长带孩子出门游玩,孩子吵闹,因此家长威胁孩子说要掉头回去。四种可能结果的收益已经给出,前一个是孩子的收益,后一个是家长的收益。较为明显的是,孩子因为先行动,因此只存在两种策略,即要么安静,要么继续吵闹。问题在于此时的家长,他的策略是什么?我们说有四种:{x2=回家,x3=回家},{x2=回家,x3=游玩},{x2=游玩,x3=回家},{x2=游玩,x3=游玩}。策略和行动最大的不同是它是一套完整的行动方案,全名叫完整的相机行动方案(contingent plan)。这套行动方案无关乎孩子如何选择,无论如何家长都有相应的策略去应对(正如策略这个名字一样,比行动要更为宏观),尽管在行动落实上,例如孩子如果先选择了安静,那么x3时家长的行动方案自然就作废了。


标准形用如下方式表示:


以上例子属于完美信息博弈,家长在行动前是已经知道自己是在x2还是x3的,因此在行动上排除了某些可能性。但是如果现在有一个非完美信息博弈,例如同时博弈,那么一套完整的策略作用就体现出来了。从直观感受上说,展开形更适用于表示存在先后顺序的完美信息博弈,标准形更适用于表示同时行动的非完美信息博弈(这也是为什么第八章采用的都是标准形),尽管两者仍然可以互相表示、互相转化。


第七章的最后介绍了混合策略这一概念。这一问题在数学上解释起来较为容易,但理解的难点在于难以想象一个玩家会遵循一个概率开展自己的行动。在这里我们可以以Sun-Rain game为例:明天是晴天(或雨天)并不是一个确定的事件,因此我们可以把它理解成是上帝会遵循一个概率让明天是晴天(或雨天)。这也为我们在思考这类问题时提供了一种思路,上帝(Player 2)混合策略的出发点或许并不是在描述上帝的行为,而是我们(Player 1)对上帝可能开展行动的一个信念(belief)。

另外,对于这一问题可以参看一下第六章 Choice Under Uncertainty,对于理解不确定性选择确实会有帮助。


第8章名为同时行动博弈(Simultaneous-Move Games)首先,在只考虑纯策略这一条件背景下,我们定义了优势策略(dominant strategy)、严格优势策略(strictly dominant strategy)、弱优势策略(weakly dominant strategy)、劣势策略(dominated strategy)、严格劣势策略(strictly dominated strategy)和弱劣势策略(weakly dominated strategy)。在有了这些定义的背景下,我们接下来进行的所有研究都是围绕着博弈论的“解概念”。因为我们的目的并不是仅仅描述一个博弈,更重要的是预测这个博弈的最终结果。我们知道如果选手拥有严格优势策略,那毋庸置疑会选择它,但往往严格优势策略并不存在。那么,我们可以通过删除严格劣势策略,因为我们可以预期对手无论如何都不会选择这一策略。但是一次删除并不能得到唯一的结果,在共同知识的情况下,我们想进一步研究问题的方法是:重复删除严格策略。值得注意的是,我们并无法根据理性原理排除弱劣势策略。

现在考虑允许混合策略的情况,我们是可以把严格优势策略和严格劣势策略的基本定义直接推广到包含混合策略的情形。在可混合策略的条件下,如何判断一个纯策略是否是劣势的,我们在原来纯策略方法的基础之上有必要考虑是否任何混合策略都比那个劣势的纯策略要好。事实上有了这一条件,我们能够删除更多的严格劣势策略,因为某个其他纯策略的随机组合很可能就比你那个劣势的纯策略要好。

讲到这里,可能上述方法并不能让我们满意,那么是否有一种适用范围广,得到的结果好,至少能涵盖上面我们能想到的所有理性化行为的博弈问题求解方法?这就是博弈论中使用最为广泛的“解概念”——纳什均衡(Nash equilibrium)。需要明确的是,纳什均衡并无法保证得到的解是“完全正确”的,但它是一个必要条件。而后面章节的内容基本是围绕纳什均衡解做进一步的“精炼”,以求排除更多在某些情境下“不切实际”的纳什均衡。在还未涉及到动态博弈问题的情况下,本章中剩余部分所介绍的贝叶斯纳什均衡(Bayesian Nash equilibrium)便是基于不完全信息博弈(贝叶斯博弈)情况下,对纳什均衡的一个精炼。而本章的最后一个部分,颤抖的手完美纳什均衡(trembling-hand perfect Nash equilibrium)则是基于存在小概率犯错的可能性下,对纳什均衡概念的一种精炼。而第9章的内容便是围绕动态博弈情境下,对纳什均衡进行进一步的精炼。




  

相关话题

  大清第一首辅是谁? 
  如何简单地解释「超模(Supermodular)博弈」? 
  日本和印度哪个在综合国力和影响力上更能够成为中国的威胁? 
  为什么有些北上广深的人越推崇甚至神化北上广深?有些不在北上广深的人越抵制甚至逃离北上广深? 
  两个有核国家交恶,一方怎样判断来自对方的导弹是否装载了核弹头?怎样判断是否需要在导弹落地前进行核反击? 
  从博弈论角度而言,合作项目是否应该按每人的工作量结算报酬? 
  电影《教父》中有哪些经济学道理? 
  为什么中国的咖啡这么贵? 
  为什么牛奶卖不完宁可倒掉也不免费送人? 
  左轮手枪装有一颗子弹,对着自己头开一枪奖励10万元,两枪1亿,三枪2亿,四枪4亿,5枪16亿,值得吗? 

前一个讨论
为什么知乎大神都很高冷,邀请了都不回应?
下一个讨论
2016 年你在科研上有哪些值得分享的进展和感悟?





© 2024-12-26 - tinynew.org. All Rights Reserved.
© 2024-12-26 - tinynew.org. 保留所有权利