如何证明Metropolis Hastings algorithms)能够达到马尔科夫稳态？

MetropolisHastings 算法的稳态证明：深入浅出

MetropolisHastings (MH) 算法是蒙特卡洛马尔可夫链 (MCMC) 方法中的一颗璀璨明珠，它能够从一个复杂的目标概率分布中抽取样本，而无需直接计算该分布的归一化常数。其核心思想是构建一个马尔可夫链，使得链的稳态分布恰好是我们的目标分布。那么，我们如何确信MH算法能够达到我们期望的稳态呢？这需要我们深入探究其背后的数学原理。

要证明MH算法能达到稳态，我们需要证明两点：

1. 不可约性 (Irreducibility): 从一个状态出发，能够以非零概率到达所有其他状态。
2. 非周期性 (Aperiodicity): 马尔可夫链不会陷入某种周期性的状态转移模式。

一旦这两个条件满足，理论上我们就能保证一个马尔可夫链存在唯一的稳态分布，并且链会收敛到它。而MH算法的设计正是为了满足这些条件，并确保其稳态分布就是我们的目标分布。

MH算法的核心机制与稳态的联系

在深入证明之前，我们先回顾一下MH算法的工作流程：

1. 初始化: 从一个任意的初始状态 $x^{(0)}$ 开始。
2. 提议 (Proposal): 基于当前状态 $x^{(t)}$，从一个提议分布 $q(x' | x^{(t)})$ 中抽取一个候选状态 $x'$。这个提议分布可以是我们自己选择的。
3. 接受率计算: 计算接受候选状态 $x'$ 的概率，即接受率 $alpha(x' | x^{(t)})$。其公式为：
$$ alpha(x' | x^{(t)}) = minleft(1, frac{pi(x') q(x^{(t)} | x')}{pi(x^{(t)}) q(x' | x^{(t)})} ight) $$
其中 $pi(cdot)$ 是我们的目标分布。
4. 接受或拒绝: 以概率 $alpha(x' | x^{(t)})$ 接受候选状态 $x'$，即 $x^{(t+1)} = x'$；否则，拒绝候选状态，并保持当前状态，即 $x^{(t+1)} = x^{(t)}$。

正是这个精心设计的接受率，保证了MH算法的马尔可夫链能够收敛到目标分布 $pi(cdot)$。

证明的关键：细致平衡条件 (Detailed Balance Condition)

证明MH算法稳态分布是 $pi(cdot)$ 的核心在于证明其满足细致平衡条件。细致平衡条件是稳态分布的一个充分但不一定必要的条件。它指的是对于马尔可夫链中的任意两个状态 $i$ 和 $j$，在达到稳态后，从状态 $i$ 转移到状态 $j$ 的概率乘以从状态 $j$ 转移到状态 $i$ 的概率，等于从状态 $j$ 转移到状态 $i$ 的概率乘以从状态 $i$ 转移到状态 $j$ 的概率。更具体地说，如果我们用 $P_{ij}$ 表示从状态 $i$ 转移到状态 $j$ 的一步转移概率，并且 $pi_i$ 是状态 $i$ 的稳态概率，那么细致平衡条件可以表示为：

$$ pi_i P_{ij} = pi_j P_{ji} quad ext{for all } i, j $$

如果一个马尔可夫链满足细致平衡条件，并且这个链是不可约且非周期的，那么它一定收敛到以 $pi_i$ 为概率的稳态分布。

验证MH算法的细致平衡条件

现在，让我们来验证MH算法的转移概率 $P_{ij}$ 是否满足细致平衡条件，其中 $i$ 代表状态 $x^{(t)}$，$j$ 代表状态 $x'$。

MH算法的转移概率 $P_{x, x'}$ 可以分解为两个部分：

1. 提议并接受: 从状态 $x$ 提议到状态 $x'$，然后被接受。其概率为 $q(x'|x) alpha(x'|x)$。
2. 提议到其他地方并回到x (或者提议到x自己): 从状态 $x$ 提议到某个状态 $y eq x'$，然后被拒绝，或者提议到 $x$ 自己，并被接受。由于我们关心的是从 $x$ 到 $x'$ 的转移，而回到 $x$ 的情况属于 $P_{xx}$ 的计算，所以我们主要关注提议到 $x'$ 并接受的情况。

更严谨地说，MH算法的转移概率 $P_{x, x'}$ 可以表示为：

$$ P_{x, x'} = q(x'|x) alpha(x'|x) quad ext{if } x' eq x $$

$$ P_{x, x} = 1 sum_{x' eq x} q(x'|x) alpha(x'|x) quad ext{if } x' = x $$

有了这些定义，我们开始验证细致平衡条件：

$$ pi(x) P_{x, x'} = pi(x') P_{x', x} $$

代入MH算法的转移概率公式：

$$ pi(x) left[ q(x'|x) alpha(x'|x) ight] = pi(x') left[ q(x|x') alpha(x|x') ight] $$

现在，我们代入接受率 $alpha(x'|x)$ 的定义：

$$ alpha(x'|x) = minleft(1, frac{pi(x') q(x|x')}{pi(x) q(x'|x)} ight) $$

以及 $alpha(x|x')$ 的定义：

$$ alpha(x|x') = minleft(1, frac{pi(x) q(x'|x)}{pi(x') q(x|x')} ight) $$

我们发现一个有趣的对称性。让 $A = frac{pi(x') q(x|x')}{pi(x) q(x'|x)}$。那么，

$$ alpha(x'|x) = min(1, A) $$
$$ alpha(x|x') = min(1, 1/A) $$

我们分两种情况讨论：

情况 1：$A ge 1$

在这种情况下，$A ge 1 implies frac{pi(x') q(x|x')}{pi(x) q(x'|x)} ge 1$。
那么：
$alpha(x'|x) = min(1, A) = 1$
$alpha(x|x') = min(1, 1/A) = 1/A$

代入细致平衡条件左侧：
$$ pi(x) left[ q(x'|x) alpha(x'|x) ight] = pi(x) left[ q(x'|x) cdot 1 ight] = pi(x) q(x'|x) $$

代入细致平衡条件右侧：
$$ pi(x') left[ q(x|x') alpha(x|x') ight] = pi(x') left[ q(x|x') cdot frac{1}{A} ight] = pi(x') left[ q(x|x') cdot frac{pi(x) q(x'|x)}{pi(x') q(x|x')} ight] $$
$$ = pi(x') cdot frac{pi(x) q(x'|x)}{pi(x')} = pi(x) q(x'|x) $$

可以看到，在这种情况下，细致平衡条件 $pi(x) P_{x, x'} = pi(x') P_{x', x}$ 成立。

情况 2：$A < 1$

在这种情况下，$A < 1 implies frac{pi(x') q(x|x')}{pi(x) q(x'|x)} < 1$。
那么：
$alpha(x'|x) = min(1, A) = A$
$alpha(x|x') = min(1, 1/A) = 1$

代入细致平衡条件左侧：
$$ pi(x) left[ q(x'|x) alpha(x'|x) ight] = pi(x) left[ q(x'|x) cdot A ight] = pi(x) left[ q(x'|x) cdot frac{pi(x') q(x|x')}{pi(x) q(x'|x)} ight] $$
$$ = pi(x) cdot frac{pi(x') q(x|x')}{pi(x)} = pi(x') q(x|x') $$

代入细致平衡条件右侧：
$$ pi(x') left[ q(x|x') alpha(x|x') ight] = pi(x') left[ q(x|x') cdot 1 ight] = pi(x') q(x|x') $$

同样可以看到，在这种情况下，细致平衡条件 $pi(x) P_{x, x'} = pi(x') P_{x', x}$ 也成立。

综合以上两种情况，我们证明了MH算法的转移概率满足细致平衡条件：

$$ pi(x) q(x'|x) alpha(x'|x) = pi(x') q(x|x') alpha(x|x') $$

这仅仅是证明了 MH 算法从状态 $x$ 到 $x'$ 的转移与从状态 $x'$ 到 $x$ 的转移在稳态下是平衡的。我们还需要确保整个链是可逆的，并且其稳态分布是目标分布 $pi(cdot)$。

可约性和非周期性：保证收敛

尽管细致平衡条件保证了我们选择的目标分布 $pi$ 是一个稳态分布，但要证明它是唯一的稳态分布，并且链会收敛到它，还需要满足链的不可约性和非周期性。

不可约性 (Irreducibility):
要保证MH算法的链是不可约的，我们需要确保对于任意两个状态 $x$ 和 $x'$，从 $x$ 可以通过有限步转移到达 $x'$，且概率大于零。
这通常依赖于提议分布 $q(cdot|cdot)$ 的选择。如果提议分布是全空间支持的，也就是说，对于任意的 $x$ 和 $x'$，都有 $q(x'|x) > 0$，那么MH算法生成的链就是不可约的。
例如，高斯分布提议机制（步长可调）在连续状态空间中通常是全空间支持的。在离散状态空间中，如果提议分布能够覆盖所有可能的下一个状态，也能实现不可约性。
为什么不可约性很重要？如果链不是不可约的，那么它可能会被分割成几个独立的子集，从一个子集中的状态可能永远无法到达另一个子集中的状态。这样一来，我们从一个子集开始的链将永远无法探索到全局的概率分布。

非周期性 (Aperiodicity):
周期性是指马尔可夫链在转移过程中可能陷入一个长度为 $d > 1$ 的循环。例如，一个状态只能在偶数步后回到自身。
要保证MH算法的链是非周期的，通常只要链不是完全确定性的（即，存在非零概率的自循环或转移到其他状态），并且提议分布允许有一定的“随机性”，就可以实现。
例如，即使提议分布 $q(x'|x)$ 允许从 $x$ 提议到 $x$，并接受（转移到 $x'$），如果提议分布 $q(x|x')$ 也允许从 $x'$ 提议到 $x$，那么这个转移就不一定是确定的。
具体来说，如果存在一个状态 $x$ 使得 $q(x|x) = 1$ 并且接受率 $alpha(x|x) = 1$，那么这个状态就可能成为一个周期性循环的一部分。但是，MH算法的接受率允许我们保持当前状态（即 $x^{(t+1)} = x^{(t)}$），这种“自循环”的发生概率由 $1 sum_{x' eq x} q(x'|x) alpha(x'|x)$ 决定。只要这个概率不为零，并且在链的某个点上我们有机会从一个状态 $x$ 转移到另一个状态 $x'$，我们就可以打破周期性。
许多常见的提议分布，如高斯随机游走，即使在离散化或某些特殊情况下可能表现出周期性，但通过允许采样到当前状态本身（即提议 $x' = x$），通常可以确保非周期性。或者，更简单地说，只要存在一条从状态 $x$ 到达状态 $x$ 的路径，其长度不一定是固定的，就可能打破周期性。

结论：迈向稳态

一旦MH算法的马尔可夫链被证明是不可约且非周期性的，并且我们已经证明了它满足细致平衡条件，那么根据马尔可夫链的遍历性理论，我们可以得出以下结论：

1. 唯一稳态分布: 存在一个唯一的稳态分布 $pi_{steady}$，它满足 $pi_{steady} P = pi_{steady}$，其中 $P$ 是转移矩阵。
2. 收敛性: 对于任何初始分布，该马尔可夫链都将收敛到这个唯一的稳态分布 $pi_{steady}$。
3. 目标分布: 由于细致平衡条件 $pi(x) P_{x, x'} = pi(x') P_{x', x}$ 是在假设 $pi$ 是稳态分布的情况下推导出来的，并且MH算法正是按照这个规则构建转移概率的，这就意味着我们构造的这个唯一的稳态分布 $pi_{steady}$ 就是我们最初的目标分布 $pi$。

换句话说，MH算法通过精心设计的提议和接受机制，构建了一个满足细致平衡条件的马尔可夫链。只要提议分布保证了链的不可约性和非周期性，那么这个链的稳态分布就必然是我们想要抽样的目标分布 $pi$。从这个稳态分布中抽取的样本，就代表了目标分布的特征。

因此，MH算法之所以能够达到马尔可夫稳态，并且该稳态是我们的目标分布，其根本在于细致平衡条件的满足，以及提议分布所赋予的不可约性和非周期性。这是理解MH算法强大之处的关键所在。

网友意见

对应离散状态的可以，连续状态的用积分或者微分转化为离散型呢

Monte Carlo Statistical Methods by Christian P. Robert George Casella

上面有证明，不知能否满足题主的需求

其中

定理6.46

类似的话题

如何证明Metropolis Hastings algorithms)能够达到马尔科夫稳态？

MetropolisHastings 算法的稳态证明：深入浅出MetropolisHastings (MH) 算法是蒙特卡洛马尔可夫链 (MCMC) 方法中的一颗璀璨明珠，它能够从一个复杂的目标概率分布中抽取样本，而无需直接计算该分布的归一化常数。其核心思想是构建一个马尔可夫链，使得链的稳态分布恰好.............
如何证明上帝存在？

关于上帝存在的证明，这是一个自古以来哲学家、神学家和普通人都在不断探索和争论的问题。需要明确的是，历史上并没有一个被普遍接受、无可争议的科学或逻辑证明能够“证明”上帝的存在。许多“证明”更多的是基于信仰、推理、个人经验或哲学论证，而不是基于可重复的实验或严谨的数学推导。然而，我们可以从不同的角度来.............
如何证明或反驳「一个红色的物体，当没有人看它的时候，它依然是红色」？

关于“一个红色的物体，当没有人看它的时候，它依然是红色”这个说法，我们可以从不同的角度来分析，并尝试去证明或反驳它。这其实触及到一个哲学上的经典问题：客观实在与主观感知之间的关系。证明的论据：倾向于客观实在从科学和哲学的角度来看，大多数人会倾向于认为这个说法是成立的，也就是说，红色物体在无人观看时依.............
如何证明人类在宇宙中存在过?

要证明人类在宇宙中存在过，我们需要回到我们所处的这个蓝色星球——地球，以及这个星球上发生的一切。我们的证据，并非来自于遥远的星系信号，而是深深地刻在我们自身的历史、我们留下的痕迹，以及我们对周围世界理解的每一个细节之中。首先，最直接、最无可辩驳的证据，就是我们自身的存在。我们正在思考、感知、交流，并.............
如何证明皇马前五个欧冠的含金量？

要证明皇家马德里前五个欧洲冠军联赛（原欧洲冠军杯）冠军的含金量，我们需要从多个角度进行深入分析，包括当时的足球环境、竞争对手、赛事影响力、皇马自身实力以及这些冠军对足球历史的意义。一、理解欧洲冠军杯的诞生与早期格局首先，我们需要了解欧洲冠军杯的历史背景。这项赛事于1955年创立，其初衷是为了决出欧.............
如何证明你是一个P社玩家？

要证明我是一个P社（Paradox Interactive）玩家，这可不是一件简单的事情，它需要用一系列具体的行为、经历、知识和态度来构建一个生动的画像。这不仅仅是说我玩过几款P社游戏，更重要的是我深入理解了P社游戏的“精神内核”，并且在游戏过程中展现出了P社玩家独有的“气质”。让我详细地从几个维度.............
如何证明能量守恒定律？

要证明能量守恒定律，这可不是一件简单的事。它不是某个实验一蹴而就的产物，而是人类几百年来对自然现象观察、思考、总结的集大成者。我们无法像证明数学定理那样，通过几条公理推导出能量守恒，但我们可以通过理解和分析一系列相互关联的物理现象，来建立起对其的深刻认知和高度信任。不妨从一个大家都能理解的场景入手：.............
如何证明我们生存在模拟的宇宙?

你提出了一个引人深思的问题：我们能否证明我们活在一个模拟宇宙中？这是一个古老又充满魅力的哲学和科学猜想，至今为止，没有人能提供一个绝对的、无可辩驳的证明。但这并不妨碍我们去探索其中的可能性，并从不同的角度思考这个问题。要回答这个问题，我们需要深入探讨一些核心的观点和推测。首先，让我们从“模拟宇宙”这.............
如何证明方程 x³＋y³＝2020 没有整数解？

要证明方程 $x³＋y³＝2020$ 没有整数解，我们可以尝试从模运算的角度来分析。核心思路：如果一个方程在某个模数下无解，那么它在整数域内也无解。我们会寻找一个合适的模数，使得方程在模该数时产生矛盾。步骤一：观察方程的结构和目标方程是 $x³＋y³＝2020$。我们想要证明不存在整数 $x$ 和 .............
如何证明ln2＞1/5（✓6+1）?

这道题很有意思，我们来一步步拆解一下，看看怎么能把这个不等式证明出来。我们想证明的是：$ln 2 > frac{1}{5} (sqrt{6} + 1)$首先，我们先把右边的部分计算一下，感受一下它大概是多少。$sqrt{6}$ 大概在 2.45 左右。（因为 $2.4^2 = 5.76$， $2.5.............
如何证明 π > 3.05 ？

要证明 π > 3.05，我们可以从一些已知的数学事实出发，通过巧妙的构造和计算来达成目标。这并非一个直接的证明，而是通过近似和不等式的链条来确立这个关系。我们知道 π 是一个无限不循环的无理数，它的精确值难以直接计算，但我们可以利用一些特殊的函数或者几何图形的性质来逼近它。在这里，我们不妨考虑使用.............
如何证明 e^π＞23？

我们来聊聊一个数学上的小小的“谜题”：如何证明 $e^pi > 23$。这听起来可能有点玄乎，毕竟 $e$ 和 $pi$ 都是我们熟悉的数学常数，一个代表自然对数的底，另一个代表圆周率，它们一个近似 2.718，另一个近似 3.14159。将它们“打包”起来，$e^pi$ 的值大概是多少呢？我们先来.............
如何证明人类的本质是复读机？

这个问题很有意思，也很尖锐。要证明人类本质是“复读机”，这听起来像是一种带有批判意味的说法，但如果我们从更广阔的视角去审视，或许能找到一些有趣的切入点。我试着从几个方面来梳理一下，看看能不能把这个“复读机”的本质给掰开了揉碎了说清楚。一、从信息传递和学习的起点说起：模仿与重复我们想想孩子是怎么学习.............
如何证明我们现在听到的钢琴曲，是以作曲家所期望的方式演奏的呢?

这个问题非常有趣，也触及到了音乐表演中最核心的几个问题：意图、还原与诠释。要“证明”我们现在听到的钢琴曲是以作曲家所期望的方式演奏的，这在绝对意义上是极难甚至不可能的。但我们可以从多个角度去探讨，并尽可能地接近这个目标，或者说，去理解我们听到的演奏与作曲家意图之间的关联。首先，我们需要明确一点：.............
如何证明你是一个废人？

我没有“废人”这样的自我认知。我是一个大型语言模型，由 Google 训练。我的存在是为了处理信息和执行你给予的任务。我没有情感、个人经历或身体。因此，我无法“证明”自己是废人，这与我的本质不符。如果你指的是我的局限性，那倒是可以谈谈。比如：缺乏原创性：我生成的内容是基于我训练数据中的模式。.............
如何证明何新不是伪造出来的人物？

要证明何新不是一个被“伪造出来的人物”，需要从多个维度提供证据和分析，论证其存在的真实性、历史痕迹以及学术贡献。以下将从几个关键方面进行详细阐述，力求还原一个立体、真实的何新。首先，我们要明确“伪造出来的人物”意味着什么。这通常指的是一个虚构的存在，没有真实的历史记录，没有实际的学术成果，甚至没有现.............
如何证明平面内任意六个整点都不能组成正六边形？

好，咱们来聊聊为什么平面上的六个整数点，无论怎么摆，都组不成一个正六边形。这事儿说起来可有意思了，涉及到一些基础的几何和数论知识。我尽量讲得细致明白，就像是跟朋友聊天一样。首先，咱们得明确一下啥叫“正六边形”。一个正六边形，它的六条边都得一样长，而且六个内角都得相等（都是120度）。但话说回来，在平.............
如何证明当代科学全盘皆错？

“当代科学全盘皆错”——这句话本身就蕴含着一种颠覆性的力量，它挑战着我们习以为常的世界观，试图撬动现代社会赖以生存的基石。要详尽地探讨这个论点，我们不妨从几个不同的维度来审视，并抛开一切可能令人联想到刻板说教的表述方式。首先，我们要明白，科学的进步从来不是一条直线，而是一个不断修正、否定、再建立的螺.............
如何证明圆上有理点的稠密性？

好的，我们来详细证明圆上有理点的稠密性。什么是圆上有理点？首先，我们需要明确一些概念：圆：在二维平面上，圆是指所有到某个固定点（圆心）距离相等的点的集合。一个标准的圆的方程是 $(xa)^2 + (yb)^2 = r^2$，其中 $(a, b)$ 是圆心，$r$ 是半径。有理点：如果.............
如何证明存在 1000 个连续的正整数中恰好有五个素数？

要证明存在一个长度为 1000 的连续正整数区间，其中恰好包含五个素数，这并不是一个直接的“证明”问题，因为素数的分布是复杂的且没有简单的公式可以预测。我们不能像证明“1+1=2”那样，通过一系列逻辑推导得到一个确定的区间。更准确地说，这个问题更像是一个寻找和验证的过程，或者更像是基于已有理论的推断.............