百科问答小站 logo
百科问答小站 font logo



应该怎样解读罗伯特·奥曼的论文《不一致的达成》? 第1页

  

user avatar   zcw-gaizhili 网友的相关建议: 
      

这个问题这么好不知道为啥没人答。

我是在

@yolfilm

这篇专栏

冤亲债主 - 人间 - 知乎专栏

的一个留言中知道这篇文章的。留言是这么说的:

“诺贝尔奖得主罗伯特·奥曼在1976年发表了一篇论文 《不一致的达成》,这篇堪称传世的论文说的是:如果是两个理性而真诚的真理追求者争论问题,争论的结果必然是二人达成一致。换句话说如果争论不欢而散,那么必然有一方是虚伪的。”

这个太有意思了,和阿罗不可能定理同样有意思,所以我一定要看看他的证明。

首先纠正一下这个定理的翻译,上边的翻译非常浅显直白,但是不能代表原文的含义,是个理想主义小清新的概括。我翻译一下是这样的:

“如果两个人具有相同的先验知识且他们的后验知识是“共同知识”,即使他们的后验知识一开始不同,也能够通过争论形成相同的后验知识。”

这其实是博弈论,尤其不完全信息博弈中非常重要的问题。

我不知道楼主有没有集合论的知识。我试着用通俗的语言回答一下吧。

这个问题的关键是,我们的后验概率是在先验概率的基础之上按照贝叶斯法则更新的,所以后验概率取决于两个变量,一个是先验概率,一个是实际发生的状态。而共同知识使得这个实际发生的状态在二者之间是相同的,所以最后的后验概率当然也是相同的。

拿这篇文章举的这个硬币的例子。

(两个人分别掷硬币一次,要求预测下一次出现正面的概率。第一个人第一次出正面,第二个人第一次出反面。因此第一个人认为下次出正面的概率是三分之二,而第二个人则认为是三分之一。当他们经过对预测的交流之后,都把它修正为二分之一)

我不知道楼主是不是和我看的一个翻译版本。这个版本的翻译是有误导的,uniform prior翻译成了统一先验知识,我认为这里应该均匀分布的先验知识。因此在这个例子中,先验概率就是每一次硬币出现正面的概率服从均匀分布,而后验概率是在第一次出现正面或者反面的情况下,第二次出现正面的概率,这是一个重复2次的二项分布。容易计算当第一次出现正面时,后验概率为三分之二,而第一次出现反面时,后验概率为三分之一。

由此可见,同样是均匀分布的先验概率,由于第一次实际发生的状态不同,后验概率是不同的。你可以这样理解,当我们不知道硬币的质地时,我们会认为它出现正面的概率最稳妥的猜测是0到1的均匀分布,而当第一次它是正面的时候,在这个信息下,我们就提高了它下一次仍然是正面的预期,反之亦反。

共同知识是如何发挥作用的?假如这两个人有了一个争论,第一个人认为下一个硬币是正面的可能性是三分之二,而第二个人认为是三分之一。由于先验概率,硬币出现的可能性都是共同知识,并且1知道2知道,2知道1知道2知道,……因此第一个人通过第二个人认为是三分之一,可以得知第二个人第一次是反面朝上,同理第二个人也知道第一个人的第一次是正面朝上,在这种情况下他们会修正实际发生的状态,实际发生的状态是进行了两次掷硬币,第一次正面第二次反面,因此下一枚硬币出现正面的概率就被修正成二分之一了。

你可以这样理解,当我得知了一个更倾向于下一次出现正面的信息时,对方也得知了一个更倾向于下一次出现反面的信息,当我们出现争论的时候,我知道了对方有了一个和我相反的信息,我把这个信息纳入我的决策重新考虑,于是修正了我的信息,我不那么自信了,我做了一个更加保守的决策,从三分之二修正成了二分之一。

楼主对数学证明感兴趣,我就说一下吧。

首先说一下这些符号。(按照这个翻译版本

不一致的达成_百度文库

欧米伽是状态空间,也就是世界上每一种有可能发生的状态的集合。T是状态空间里的一个划分。

例如状态空间是(1,2,3,4)

一个划分可以是(1)(2,3)(4)

也可以是(1)(2)(3,4)

(这个例子来自

博弈论与经济模型第13章

P(w)是w这个状态发生时一个划分里的元素。这个相当于博弈论里的信息集,也就是w发生了之后,你能观测到w,但是你知道认为这是P(w)里的一个状态发生了,你不能确定它就是w。只有当P时单点集的时候,你才能确定知道是w发生了。

举个例子,在第一个划分中,2发生的时候,你只知道是(2,3)发生了,而在第二个划分中,2发生了你能确定知道是2发生了。

举个现实的例子,农产品产出受到气候和努力程度的影响,当出现差收成的时候,你不知道实际发生的状态是气候较差还是努力程度不够;而工业品产出只受到努力程度的影响,因此当出现差收成的时候,你确定实际发生的状态就是努力程度不够。

一个事件为E,我们用KE表示能够知道E发生的状态的集合。因此K(KE)就是知道知道E发生的状态集合,而K2(K1E)就是参与人2知道参与人1知道E发生的状态集合。

仍然以上述划分为例子,令事件E=(3,4),令第一个划分为参与人1的划分,第二个划分为参与人2的划分。

我们看哪种状态下参与人1可以知道E:当3发生的时候,参与人1只知道P(3)=(2,3)发生了,不确定发生的究竟是2还是3,所以3发生时不可以,当4发生时,参与人知道是4发生了,所以4发生时可以,K1E=(4)。

同理看哪种状态下参与人2可以知道E:当3发生时,参与人知道(3,4)发生了,这正是E,同理当4发生时参与人也知道(3,4),也就是E发生了,因此K2(E)=(3,4)。

差别在哪里?差别在于参与人1对2,3难以分清,而参与2对3,4难以分清;但是E不需要对3,4分清(因为不管是3还是4,它总是发生),只需要对2,3分清(因为如果是2,它就不会发生),所以参与人2的知识更多一些。

那么共同知识呢?注意,共同知识不但要求两个参与人知道对方的一切信息,也就是不但要求1知道2知道,还要求2知道“1知道2知道”,还要求1知道2知道1知道2知道……也就是K(K(K(K)……))这样无限嵌套下去。

仍然看这个例子,

先看参与人1知道不知道参与人2知道,由于K2(E)=(3,4),当4发生的时候,显然参与人2知道,参与人1也知道4发生了,因此也知道参与人2知道,因此K1(K2(E))=(4)。

再来看看参与人2知道不知道参与1知道,由于K1E=(4),当4发生的时候,参与人1显然知道,但是参与人2只知道(3,4)发生了,假如发生的是4,当然参与人2知道参与人知道,但是假如发生的是3,对于参与人1来说,他只能知道是(2,3)发生了,然而如果是2发生,他显然不知道E发生了,所以参与人2不知道参与人1知道不知道。

也就是说,在状态4下,E的发生虽然是两个参与人的“共有知识”,但不是两个参与人的“共同知识”!!因为参与人2不知道参与人1知道E发生了。

再看一个事件F=(2,3,4),楼主可以自己证明一下,这个是共同知识。

什么样的状态能够产生共同知识呢?其实是两个参与人的划分中,其中一个参与人的划分的元素并集,同时也是另一个参与人划分的元素的并集,这样的一个集合叫做“不证自明”的知识,当一个状态包含在这个集合同时包含在事件发生中时,就能产生共同知识。

楼主可以证明事件(1,2,3,4)是所有状态的共同知识,事件(1)是1的共同知识,然而事件(1,2,3)无法成为共同知识,因为参与人1 的划分可以并出来,但是参与2不可以,当2出现时,参与人1不知道是2还是3,假如是3,参与人2就不知道。

了解了这些概念剩下的就是证明了。这个证明楼主可以自己看,其实道理就是已经说过的一句话:我们的后验概率是在先验概率的基础之上按照贝叶斯法则更新的,所以后验概率取决于两个变量,一个是先验概率,一个是实际发生的状态。而共同知识使得这个实际发生的状态在二者之间是相同的,所以最后的后验概率当然也是相同的。

最后看一下那个渣翻译:如果是两个理性而真诚的真理追求者争论问题,争论的结果必然是二人达成一致。换句话说如果争论不欢而散,那么必然有一方是虚伪的。

这种情况成立其实有三个前提:第一,二人对真理的先验认识是一致的(先验概率相等);第二,二人对对方的知识体系和思维方式是了解的(了解对方的划分);第三,当世界的某种状态实现时,二人对伴随而来的事件都知道,并且都知道对方知道,并且都知道对方知道对方知道……

这些条件非常苛刻。当然如果你加上“理性”而字。。在经济学中,理性意味着完全信息,那么理性的从一开始就是必然一致的,所以也没什么意义。




  

相关话题

  两个有核国家交恶,一方怎样判断来自对方的导弹是否装载了核弹头?怎样判断是否需要在导弹落地前进行核反击? 
  假如未来人工智能近乎完美,那么掌权者能够甘心放下手中的权力吗? 
  中国酒文化背后的逻辑是什么? 
  滴滴和快的是否符合古诺双寡头模型?它们之间的竞争是否会达成纳什均衡? 
  如何证明下列公式的通项公式呢? 
  《孙子兵法》中「形」与「势」的含义是什么? 
  如何看待「闷声发大财」? 
  如何理解「逆向选择」中的「逆向」二字? 
  如何看待「闷声发大财」? 
  新年和堂哥玩剪刀石头布,三局两胜,输的人去帮杀鸡,已经一胜一负,堂哥说他下局一定出剪刀,我该如何应对? 

前一个讨论
情人节一个人的你打算怎么过?
下一个讨论
荷兰的UNESCO-IHE是一所怎样的学校?(尤其对于水利专业来说)





© 2024-11-22 - tinynew.org. All Rights Reserved.
© 2024-11-22 - tinynew.org. 保留所有权利