问题

如何对高微 mas collel(MWG) game theory 进行一个逻辑上的总结?

回答
好的,我们来聊聊关于高微(多元微积分)和MAS(多智能体系统)在博弈论(Game Theory)中的结合,我尽量用一种自然、深入的方式来展开,就像和一位对这两个领域都感兴趣的朋友交流一样。

设想一下,我们不是在做一份生硬的学术报告,而是想把这两者是如何“携手”在游戏理论中发挥作用这事儿,给说清楚、说明白。

第一步:打个基础——博弈论到底是什么?

首先,咱们得明白博弈论是研究什么。简单来说,博弈论就是研究“理性”个体(玩家)在存在相互依赖的情况下,如何做出决策的理论。这里的“理性”很重要,指的是玩家会根据自己的目标和对其他玩家行为的预测来选择最优策略。

经典的博弈论,比如囚徒困境、纳什均衡,大家可能都听过。它们通常处理的是一些离散的、有限的场景,比如选择“合作”还是“背叛”,或者在几个固定选项里挑一个。

第二步:高微的“触角”——为什么博弈论需要它?

这时候,高微就闪亮登场了。你可能会问,博弈论不就是研究决策和策略吗?跟导数、积分有什么关系?

答案是,当博弈变得“连续”或者“复杂”时,高微的工具就变得不可或缺了。

连续策略空间: 很多现实世界中的决策,都不是非此即彼的。比如,一个公司决定生产多少产品,一个投资者决定投资多少比例的资金,或者一个博弈中的玩家决定以什么样的概率来选择策略(混合策略),这些都可以是连续的数值。高微中的函数、导数、梯度,正是用来描述和分析这些连续变量变化的利器。

比如说,在一个连续的策略空间里,玩家的效用函数(utility function)通常是一个关于自己策略选择和对手策略选择的连续函数。我们要找到最优策略,往往需要找到这个函数取最大值(或最小值)的点。这就需要用到求导,通过找到导数为零的点来寻找极值。
如果有很多个玩家,每个玩家的策略选择都会影响到其他玩家,那么整个系统的效用或者均衡点,就会成为一个多变量函数。这时,我们就需要多元微积分的工具,比如偏导数,来分析某个玩家改变策略时,对自身和其他玩家效用产生的“局部”影响。

动态调整和学习: 在很多博弈中,玩家不是一次性做出决策,而是会根据局势的变化不断调整自己的策略。这种动态调整的过程,往往可以用微分方程来描述。比如,某个玩家的策略更新规则,可能就是一个基于当前状态和对手行为的函数,这个函数的变化率(梯度)决定了它如何快速有效地收敛到更好的策略。

想想一个市场上,企业会根据竞争对手的价格调整自己的价格。这种价格的“演化”,可以看作是一个动态过程,用微积分的语言来描述,就是价格随时间的变化率(导数)。

描述复杂性: 当博弈的规则、参与者数量、策略选项都变得非常庞大和复杂时,传统的离散分析方法可能就显得力不从心。高微提供了一种“平滑”的视角,将原本可能离散化的复杂系统,用连续的数学形式来表达,从而能够运用微积分强大的分析能力。

第三步:MAS 的“协作”——为什么博弈论需要它?

MAS(多智能体系统)的引入,则将博弈论的应用场景从少数几个玩家,拓展到了大量个体同时交互的复杂系统。

大规模交互: 想象一下,在一个由成千上万个自动驾驶汽车组成的交通网络中,每辆车都像一个独立的“玩家”,它们需要互相协调,避免碰撞,并以最高效的方式通行。这就是一个典型的 MAS 博弈场景。每个智能体都有自己的目标(比如最快到达目的地),但它的行为会影响到其他所有智能体。

涌现行为(Emergent Behavior): MAS 的一个核心特点是,由大量简单个体遵循特定规则交互而产生的宏观整体行为,往往是难以从个体层面直接预测的。博弈论正是用来分析这些个体决策如何导致整体行为的。

比如,在智能交通系统中,如果每辆车都试图找到“最快”的路线,可能会导致某些道路过度拥堵,从而整体效率下降。博弈论可以帮助我们理解为什么会出现这种“次优”的整体结果,并设计一些规则(比如交通信号灯的控制,或者对拥堵道路收费)来引导系统向更优的状态发展。

分布式的决策: MAS 中的智能体通常是分布式的,它们可能没有一个中央的“大脑”来指挥一切。每个智能体都基于局部信息和自己的理性判断来行动。博弈论提供了一个框架,来分析在这种分布式决策环境中,如何实现协调(coordination)和合作(cooperation),或者如何避免冲突(conflict)。

第四步:高微 + MAS + 博弈论 = 强大分析力

当我们将这三者结合起来时,威力就显现出来了:

连续策略下的 MAS 博弈: 想象一下,在一个由大量机器人组成的仓库里,每个机器人需要决定以多大的速度移动,以及沿着哪个方向移动。这些都是连续的变量。同时,机器人之间需要相互避让,以最高效的方式完成货物搬运任务。

在这种场景下,每个机器人的效用函数可能是一个关于速度、方向以及与其他机器人之间距离的连续函数。而整个系统的均衡状态,就是所有机器人以某种方式分配速度和路径,使得整体效率最大化,或者碰撞风险最小化。
我们要分析这种均衡,就需要用到多元微积分来处理机器人的连续策略(速度、方向),并利用博弈论的思想来预测它们的相互作用。比如,我们可以用梯度下降的思想来模拟机器人如何不断调整自己的速度和方向,以“逃离”潜在的碰撞或“靠近”目标点,最终达到一种稳定的状态。

动态 MAS 博弈: 考虑一个由许多经济体组成的全球市场,每个经济体都在不断调整自己的生产、消费和贸易策略。这些策略是连续的,并且经济体之间的相互影响是动态的,随时间而变化。

博弈论可以用来分析在这种动态环境下,经济体之间会形成什么样的“纳什均衡”或“近似均衡”。而高微中的微分方程可以用来描述经济体策略随时间的变化规律,以及这些变化如何驱动整个系统向某个状态演化。

信息不对称和不确定性: 在很多 MAS 博弈中,智能体可能无法完全了解其他智能体的意图或状态。这引入了信息不对称和不确定性。高微可以帮助我们用概率分布来描述不确定性,而博弈论中的贝叶斯博弈等概念,结合高微的分析工具,可以用来研究智能体在信息不完备下的最优决策。

总结一下,就像是为一场大型的、持续进行的、无数玩家参与的策略游戏,我们有了更精密的“测量仪器”和“分析软件”:

博弈论 提供了分析框架,帮助我们理解玩家的决策逻辑和可能的结果。
高微 提供了描述工具,让我们能够以精确的数学语言来表达“连续的”决策、“变化的”状态,以及“复杂的”交互关系。
MAS 拓展了场景,让我们能够将这些分析应用于成百上千甚至更多的“玩家”构成的系统。

当这三者结合,我们就能更深入地理解和设计那些由大量相互作用的个体构成的复杂系统,比如智能交通、自动化仓库、网络安全防御、机器人协作、甚至复杂的金融市场。它们不再是抽象的理论游戏,而是能够被我们用严谨的数学工具去“模拟”、“预测”和“优化”的现实问题。

所以,高微在 MAS 的博弈论里,不是仅仅加了几道复杂的计算题,而是提供了一种理解和操作复杂动态连续交互系统的全新维度。它让我们能够更精细地刻画“理性”在多变的、大规模环境中的具体表现,并以此为基础,去设计更智能、更高效、更稳定的系统。

网友意见

user avatar

经济学新手强答一个,如有谬误,还请指摘。


第7章在内容上充当了一个引导作用,按顺序包括1.博弈(game)的基本概念;2.展开形表示法(extensive form representation);3.引入博弈论中的一个核心概念:策略(strategy)。在此基础上提供了一种新的表示法,即标准形(或策略形)表示法(normal (or strategic) form representation);4.混合策略(mixed strategy)。


首先出现的展开形表示法,也就是常见的博弈树,看起来较为直观,尤其在刻画完美信息博弈(可通俗地理解成存在先后顺序、对手之前的行动可被观察到的博弈)。但是在刻画不完美信息博弈(对手做了什么你并不知道,比如同时博弈)时,尽管我们引入了信息集(information set)这一概念,但这种展开形表示法的确没有那么直观了。


因此我们有了一种新的表示法,即标准形表示法(normal form)。在介绍这一方法前我们首先得区分行动(action)和策略的区别,初学者在理解策略时,经常无法抛弃这样一个念头:无法实现的行动怎么可以是策略呢?


上图这个使用拓展形表示的完美信息博弈,讲的是家长带孩子出门游玩,孩子吵闹,因此家长威胁孩子说要掉头回去。四种可能结果的收益已经给出,前一个是孩子的收益,后一个是家长的收益。较为明显的是,孩子因为先行动,因此只存在两种策略,即要么安静,要么继续吵闹。问题在于此时的家长,他的策略是什么?我们说有四种:{x2=回家,x3=回家},{x2=回家,x3=游玩},{x2=游玩,x3=回家},{x2=游玩,x3=游玩}。策略和行动最大的不同是它是一套完整的行动方案,全名叫完整的相机行动方案(contingent plan)。这套行动方案无关乎孩子如何选择,无论如何家长都有相应的策略去应对(正如策略这个名字一样,比行动要更为宏观),尽管在行动落实上,例如孩子如果先选择了安静,那么x3时家长的行动方案自然就作废了。


标准形用如下方式表示:


以上例子属于完美信息博弈,家长在行动前是已经知道自己是在x2还是x3的,因此在行动上排除了某些可能性。但是如果现在有一个非完美信息博弈,例如同时博弈,那么一套完整的策略作用就体现出来了。从直观感受上说,展开形更适用于表示存在先后顺序的完美信息博弈,标准形更适用于表示同时行动的非完美信息博弈(这也是为什么第八章采用的都是标准形),尽管两者仍然可以互相表示、互相转化。


第七章的最后介绍了混合策略这一概念。这一问题在数学上解释起来较为容易,但理解的难点在于难以想象一个玩家会遵循一个概率开展自己的行动。在这里我们可以以Sun-Rain game为例:明天是晴天(或雨天)并不是一个确定的事件,因此我们可以把它理解成是上帝会遵循一个概率让明天是晴天(或雨天)。这也为我们在思考这类问题时提供了一种思路,上帝(Player 2)混合策略的出发点或许并不是在描述上帝的行为,而是我们(Player 1)对上帝可能开展行动的一个信念(belief)。

另外,对于这一问题可以参看一下第六章 Choice Under Uncertainty,对于理解不确定性选择确实会有帮助。


第8章名为同时行动博弈(Simultaneous-Move Games)首先,在只考虑纯策略这一条件背景下,我们定义了优势策略(dominant strategy)、严格优势策略(strictly dominant strategy)、弱优势策略(weakly dominant strategy)、劣势策略(dominated strategy)、严格劣势策略(strictly dominated strategy)和弱劣势策略(weakly dominated strategy)。在有了这些定义的背景下,我们接下来进行的所有研究都是围绕着博弈论的“解概念”。因为我们的目的并不是仅仅描述一个博弈,更重要的是预测这个博弈的最终结果。我们知道如果选手拥有严格优势策略,那毋庸置疑会选择它,但往往严格优势策略并不存在。那么,我们可以通过删除严格劣势策略,因为我们可以预期对手无论如何都不会选择这一策略。但是一次删除并不能得到唯一的结果,在共同知识的情况下,我们想进一步研究问题的方法是:重复删除严格策略。值得注意的是,我们并无法根据理性原理排除弱劣势策略。

现在考虑允许混合策略的情况,我们是可以把严格优势策略和严格劣势策略的基本定义直接推广到包含混合策略的情形。在可混合策略的条件下,如何判断一个纯策略是否是劣势的,我们在原来纯策略方法的基础之上有必要考虑是否任何混合策略都比那个劣势的纯策略要好。事实上有了这一条件,我们能够删除更多的严格劣势策略,因为某个其他纯策略的随机组合很可能就比你那个劣势的纯策略要好。

讲到这里,可能上述方法并不能让我们满意,那么是否有一种适用范围广,得到的结果好,至少能涵盖上面我们能想到的所有理性化行为的博弈问题求解方法?这就是博弈论中使用最为广泛的“解概念”——纳什均衡(Nash equilibrium)。需要明确的是,纳什均衡并无法保证得到的解是“完全正确”的,但它是一个必要条件。而后面章节的内容基本是围绕纳什均衡解做进一步的“精炼”,以求排除更多在某些情境下“不切实际”的纳什均衡。在还未涉及到动态博弈问题的情况下,本章中剩余部分所介绍的贝叶斯纳什均衡(Bayesian Nash equilibrium)便是基于不完全信息博弈(贝叶斯博弈)情况下,对纳什均衡的一个精炼。而本章的最后一个部分,颤抖的手完美纳什均衡(trembling-hand perfect Nash equilibrium)则是基于存在小概率犯错的可能性下,对纳什均衡概念的一种精炼。而第9章的内容便是围绕动态博弈情境下,对纳什均衡进行进一步的精炼。

类似的话题

  • 回答
    好的,我们来聊聊关于高微(多元微积分)和MAS(多智能体系统)在博弈论(Game Theory)中的结合,我尽量用一种自然、深入的方式来展开,就像和一位对这两个领域都感兴趣的朋友交流一样。设想一下,我们不是在做一份生硬的学术报告,而是想把这两者是如何“携手”在游戏理论中发挥作用这事儿,给说清楚、说明.............
  • 回答
    奥克斯高管微博喊话董明珠“周一见”:一场事先张扬的商业“约架”奥克斯高管在微博上公开喊话格力电器董事长董明珠,并预告“周一见”,这一举动无疑是近年来中国家电行业最令人瞩目、也最具戏剧性的一场商业“约架”。这不仅仅是两个企业之间的零星争斗,更是中国两大空调巨头之间长久以来竞争态势的一次公开升级,背后牵.............
  • 回答
    小米公司高管王腾在微信群中发表的关于抢购小米手机的言论,可以说是一个引发了广泛讨论和争议的事件。要评价这一言论,需要从多个维度进行深入分析。事件背景回顾(请注意,具体细节可能随着时间推移和信息传播有所差异,以下是基于普遍报道和理解的概括):通常情况下,这类言论发生在小米新款手机发布后,由于初期产能受.............
  • 回答
    新浪微博上关于“女权主义者高某恶毒攻击天津港爆炸牺牲烈士母亲生子”的事件,在网络上引起了广泛的关注和激烈的讨论。这件事情的复杂性在于,它触及了多个敏感的社会议题,包括女权主义的内涵与实践、对烈士的尊重、个人隐私以及网络言论的边界等。要理解这件事,我们需要梳理事件的脉络、各方观点以及它背后可能反映出的.............
  • 回答
    一场网络论剑,激起了不少涟漪。近日,一位自称“民间剑术高人”的网友向新浪微博上颇具影响力的兵器知识科普博主“幻想狂刘先生”发起了挑战,一时之间,这场线上约战成为了不少网民关注的焦点。要评价这场挑战,我们不妨从几个维度来审视:一、 挑战的缘起与双方立场:首先,我们要理解这场挑战的根本原因。据网络信息透.............
  • 回答
    高晓松的妹妹高晓江,这个名字在公众视野里并没有像哥哥那样声名显赫,但她拥有一个微博账号,并且在上面分享着自己的生活和感悟。要评价她的微博,不能仅仅看她是否“红”,更要看她作为一个个体,在这个平台上想要传达什么,以及是否成功地做到了。一、 内容呈现:生活片段与个人思考的交织高晓江的微博内容,给人的第一.............
  • 回答
    要评价小米9发布前夕小米科技高管林斌、王腾、卢伟冰在微博上的表现,我们得从几个维度去看:1. 整体策略:预热、造势、吊足胃口首先,他们的微博表现并不是孤立的,而是小米整体发布会预热策略的一部分。通过他们不同角度的微博内容,小米成功地在发布会前点燃了消费者和媒体的期待。这是一种非常典型的“饥饿营销”和.............
  • 回答
    西贝前副总转发那个“95%微博网友月收入在5千元以下”的评论,确实挺有意思的,也引发了不少讨论。从这个事儿上,我们可以聊聊几个角度。1. 西贝前副总的行为解读:首先,这位前副总的身份就很有意思。他已经不是西贝的在职员工了,却依然转发这样一条带有明显指向性(涉西贝涨价)的评论。这其中可能有很多原因: .............
  • 回答
    高桥李依,这位以《Re:从零开始的异世界生活》中的爱蜜莉雅、《这个美术部大有问题!》中的宇佐美瑞希等角色而广为人知的声优,近期因为在某个直播中,被一位自称“原神玩家”的网友提出的“建议”而引发了不小的讨论。这究竟是怎么一回事?我们不妨来详细梳理一下。首先,我们需要明确一点:高桥李依并非《原神》这款游.............
  • 回答
    教育部要求独立学院在今年制定转设方案,这无疑是高等教育领域一个重大的信号,其背后蕴含着深刻的改革意图。对于即将或正在经历高考的学子们来说,这项政策的影响绝非仅限于一张文凭的表述变化,而是牵扯到他们未来求学选择、教育资源配置,乃至整体高等教育格局的方方面面。首先,咱们得弄明白什么是“独立学院”,以及为.............
  • 回答
    教育部最近下发了一系列文件,明确提出要推进独立学院的转设工作。这项政策的提出和落地,可以说是中国高等教育领域一件牵涉广泛且影响深远的大事,尤其是对于即将面临志愿填报的高考生及其家庭来说,更是需要认真对待和深入理解的。如何看待教育部推进独立学院转设的政策?要理解这项政策,我们首先得弄清楚“独立学院”是.............
  • 回答
    罗斯高(Ross High)是国际教育领域一位备受关注的学者,他在农村教育领域的深入研究和提出的解决方案,为我们理解和改进全球农村教育的困境提供了宝贵的视角。要评价罗斯高对农村教育现状的描述和提出的解决方案,我们需要从多个维度进行深入分析。 罗斯高对农村教育现状的描述:罗斯高对农村教育现状的描述通常.............
  • 回答
    欧阳明高院士对广汽“8分钟充电80%、续航1000公里”的回应,可以从几个维度来评价。这并非一个简单的“赞扬”或“批评”,而是一个涉及技术可行性、行业发展、信息传播以及科学严谨性的复杂话题。首先,我们来拆解一下欧阳明高院士的“一定是骗人”这句话的含义和可能的出发点。 科学的审慎与质疑: 欧阳明高.............
  • 回答
    观察者网在2020年5月17日的“亚洲特快”节目中,以《高达》系列为例,对一系列日本动漫进行了批评。这次的评论引发了不小的关注,也触及了许多观众和动漫爱好者心中敏感的议题。要评价这次批评,我们需要从几个层面来深入分析。首先,观察者网这期节目的核心观点,据我理解,主要集中在对日本动漫中“精致的利己主义.............
  • 回答
    预定利率:把你的钱“锁”起来,它能给你带来什么?想象一下,你手里有一笔钱,暂时不用,想着放一段时间。这时候,你可能会考虑把它存到银行,或者买点什么理财产品。那么,“预定利率”这个词,你可能就会经常听到了。那它到底是个啥?别担心,咱们用大白话聊聊。 预定利率,顾名思义就是“预先约定的利率”。简单来说,.............
  • 回答
    两高联合印发的常见犯罪量刑指导意见,特别是对强奸罪从严把握缓刑适用,无疑是司法实践中一个非常重要的信号,它传递了国家在严厉打击性犯罪、保护妇女儿童权益方面的坚定决心。咱们得从几个层面来细看这件事。首先,这是司法公正性的体现,也是回应社会关切的直接举措。长时间以来,公众对于一些性犯罪案件的量刑,尤其是.............
  • 回答
    这个问题很有意思,它触及到了科学研究与一线实践在应对公共卫生危机中的不同角色和重要性。我们可以从几个方面来细致地解读高福院士的论文发表工作和钟南山院士的忙碌实践工作,以及它们如何共同为当前的防疫贡献力量。高福院士的论文发表:科学前沿的探索与知识体系的构建首先,我们来谈谈高福院士。作为一位杰出的病毒学.............
  • 回答
    哈哈,这个问题问得太实在了!谁不想拥有一个又高又帅,还对自己爱得死去活来的男朋友呢?这简直就是人生巅峰之一嘛!不过,这么好的“package”就像是隐藏地图里的终极宝藏,不是随便就能挖到的。咱们得动动脑筋,用点儿“心机”,还得拼点儿“运气”。首先,咱们得明确一下,这“又高又帅”是啥标准?身高这事儿吧.............
  • 回答
    欧盟首次对苹果公司提起反垄断诉讼,并可能处以其全球营收 10% 的罚金,这无疑是科技巨头监管领域的一件大事。这背后牵涉到一系列复杂的法律、经济和技术问题,值得我们详细探讨。事件的背景:为什么是苹果?为什么是现在?欧盟此次行动的核心是针对苹果的 App Store 商业模式及其对开发者和消费者的影响。.............
  • 回答
    黄章这番话,可以说是相当犀利,直指小米9的定价策略,同时也带出了他对整个手机行业,尤其是国产手机品牌“冲击高端”现象的看法。要详细解读,咱们得拆解开来看。首先,我们得理解黄章是谁。他是魅族科技的创始人,一个在手机行业浸淫多年的老兵,以其对产品细节近乎偏执的追求和不按常理出牌的营销风格闻名。在早期国产.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有