问题

为什么时间序列分析在ar(p)模型之外,还需要ma(q)模型和arma模型?

回答
时间序列分析中,AR(p) 模型、MA(q) 模型和 ARMA(p,q) 模型是三种基础且重要的模型,它们各自独立地描述了时间序列的特定行为模式。然而,现实世界中的时间序列往往比 AR(p) 模型所能捕捉到的更加复杂,它可能同时受到过去观测值和过去预测误差(也称为“冲击”或“扰动”)的影响。因此,为了更全面、更准确地刻画时间序列的动态特性,我们需要 MA(q) 模型来处理由过去冲击引起的影响,并在此基础上引入 ARMA(p,q) 模型来融合 AR 和 MA 的特性。

下面我将详细解释为什么需要 MA(q) 和 ARMA 模型,以及它们与 AR(p) 模型之间的关系和优越性。

1. AR(p) 模型及其局限性

AR(p) 模型 (Autoregressive Model of Order p)

AR(p) 模型认为,当前时间序列的观测值 $Y_t$ 可以表示为过去 p 个观测值的线性组合,加上一个当前时刻的随机误差项 $epsilon_t$。

其数学表达式为:

$Y_t = c + phi_1 Y_{t1} + phi_2 Y_{t2} + dots + phi_p Y_{tp} + epsilon_t$

其中:
$Y_t$ 是时间序列在时间 t 的观测值。
$c$ 是一个常数项(截距)。
$phi_1, phi_2, dots, phi_p$ 是模型的自回归系数,它们衡量了过去观测值对当前观测值的影响程度。
$Y_{t1}, Y_{t2}, dots, Y_{tp}$ 是过去 p 个时间点上的观测值。
$epsilon_t$ 是在时间 t 的白噪声(随机误差项),它假设具有零均值、恒定方差,并且不随时间相关。

AR(p) 模型描述的模式:
AR(p) 模型主要捕捉了时间序列的“惯性”或“自相关性”。它表明,如果过去的值很高,那么当前的值很可能也高,反之亦然。想象一下一个股票价格:如果今天的价格上涨了,明天可能还会继续上涨(由于惯性)。

AR(p) 模型的局限性:
AR(p) 模型只考虑了过去观测值的影响,而忽略了过去随机冲击(误差)对当前值的影响。在许多现实场景中,除了历史数据本身的惯性,还有一些突发性的、不可预测的事件(例如,新闻发布、政策变化、天气突变等)会直接影响时间序列,并可能在后续的时间段内持续产生影响。AR(p) 模型无法直接解释和建模这种由“冲击”引起的序列行为。

例如,假设一项突发政策导致了股票价格的突然上涨。AR(p) 模型只能通过追溯之前的价格来尝试解释现在的价格,但它无法直接捕获政策这一“冲击”本身对今天和未来几天价格的直接影响。

2. 为什么需要 MA(q) 模型?

MA(q) 模型 (Moving Average Model of Order q)

MA(q) 模型认为,当前时间序列的观测值 $Y_t$ 可以表示为过去 q 个预测误差(白噪声项)的线性组合,再加上一个当前时刻的白噪声项 $epsilon_t$。

其数学表达式为:

$Y_t = mu + epsilon_t + heta_1 epsilon_{t1} + heta_2 epsilon_{t2} + dots + heta_q epsilon_{tq}$

其中:
$Y_t$ 是时间序列在时间 t 的观测值。
$mu$ 是序列的长期平均值。
$epsilon_t, epsilon_{t1}, dots, epsilon_{tq}$ 是在不同时间点的白噪声项。
$ heta_1, heta_2, dots, heta_q$ 是模型的移动平均系数,它们衡量了过去预测误差对当前观测值的影响程度。

MA(q) 模型描述的模式:
MA(q) 模型主要捕捉了时间序列的“冲击响应”。它表明,当前观测值不仅受当前冲击 $epsilon_t$ 的影响,还受到过去 q 个时间点上发生的随机事件(即过去的预测误差 $epsilon_{t1}, dots, epsilon_{tq}$)的累积影响。换句话说,一个随机的“扰动”会在接下来的 q 个时间步长中,以不同的权重影响序列的值。

例如,假设在某个时间点发生了一次自然灾害,导致了商品价格的突然上涨。MA(q) 模型可以描述这种“冲击”如何在接下来的几天或几周内,通过不同的效应释放出来,影响商品价格的波动。即,今天的价格不仅受今天突发事件影响,也受昨天、前天发生的未被模型解释的随机事件的影响。

为什么需要 MA(q) 模型?
正如前面提到的,AR(p) 模型忽略了过去冲击的影响。MA(q) 模型恰好弥补了这一不足。现实世界中的时间序列往往会受到各种突发事件的驱动,这些事件产生的“冲击”会以一种“滞后”的方式在序列中传播。MA(q) 模型正是为了捕捉这种由历史“扰动”引起的序列行为而设计的。

处理突发事件的影响: MA 模型能直接模拟由未预料的事件(如政策变动、经济冲击、自然灾害等)对序列产生的短期或中长期影响。
平滑随机波动: MA 模型通过对过去误差的加权平均,可以在一定程度上平滑掉序列中的一些短期随机波动。

3. 为什么需要 ARMA(p,q) 模型?

ARMA(p,q) 模型 (Autoregressive Moving Average Model of Order (p,q))

ARMA(p,q) 模型结合了 AR(p) 和 MA(q) 模型的特性。它认为,当前时间序列的观测值 $Y_t$ 是过去 p 个观测值和过去 q 个预测误差的线性组合,再加上当前时刻的白噪声项 $epsilon_t$。

其数学表达式为:

$Y_t = c + phi_1 Y_{t1} + dots + phi_p Y_{tp} + epsilon_t + heta_1 epsilon_{t1} + dots + heta_q epsilon_{tq}$

或者,使用滞后算子 $L$(其中 $L^k Y_t = Y_{tk}$):

$(1 phi_1 L dots phi_p L^p) Y_t = c + (1 + heta_1 L + dots + heta_q L^q) epsilon_t$

ARMA(p,q) 模型描述的模式:
ARMA 模型能够同时捕捉时间序列的“惯性”(由过去的观测值引起)和“冲击响应”(由过去的预测误差引起)。这使得它能够更全面、更精确地描述许多现实世界中复杂的时间序列行为。

为什么需要 ARMA(p,q) 模型?
大多数真实世界的时间序列都同时表现出 AR 和 MA 的特征。

更强的表达能力: 单独的 AR(p) 模型或 MA(q) 模型可能不足以充分描述序列的动态。例如,一个序列可能因为过去的观测值而具有惯性(AR 特征),但同时也会受到突发性事件的影响,这些影响会以一种滞后方式传播(MA 特征)。只有将两者结合,才能更准确地建模。
更简洁的模型: 许多看起来复杂的序列,可能可以用一个较低阶的 ARMA 模型来表示。例如,一个具有复杂动态的序列,如果用纯 AR(p) 模型来拟合,p 可能需要很大;如果用纯 MA(q) 模型,q 也可能需要很大。但如果序列同时具有 AR 和 MA 特征,一个较低阶的 ARMA(p',q') 模型可能就能以更少的参数更有效地捕捉到这些动态。这符合统计建模的“奥卡姆剃刀”原则,即在解释力相似的情况下,选择参数更少的模型。
向 ARIMA 模型的过渡: ARMA 模型是更广泛的 ARIMA (Autoregressive Integrated Moving Average) 模型的基础。ARIMA 模型通过引入“差分”操作,可以处理非平稳时间序列。而 ARMA 模型是对平稳时间序列的建模。理解和掌握 ARMA 模型是理解 ARIMA 模型及其应用的关键一步。

举例说明 ARMA 的优势:

想象一个经济指标,例如失业率。
AR 部分: 如果失业率在上个月很高,这个月也很可能依然很高(惯性)。
MA 部分: 如果上个月经济中发生了一个负面冲击(比如某个大型工厂倒闭),即使这个冲击本身的影响可能在当月就基本释放,但其后续影响可能在接下来几个月内仍然以一种衰减的方式影响失业率。比如,企业会谨慎招聘,导致招聘流程变慢,这可以被看作是“过去冲击”的残余效应。

单独的 AR(p) 模型可能无法完全捕捉失业率受到的这种滞后冲击影响。单独的 MA(q) 模型则无法直接利用历史失业率本身的信息来预测未来。而 ARMA(p,q) 模型则可以同时考虑失业率的“惯性”和由经济冲击带来的“滞后影响”,从而提供一个更精准的预测和分析模型。

总结

AR(p) 模型: 关注过去观测值对当前值的影响(惯性)。
MA(q) 模型: 关注过去预测误差(冲击)对当前值的影响(冲击响应)。
ARMA(p,q) 模型: 结合了 AR 和 MA 的能力,能够同时捕捉过去观测值和过去预测误差的影响,从而更全面、更灵活地建模具有复杂动态的时间序列。

因此,在时间序列分析中,除了 AR(p) 模型,我们还需要 MA(q) 模型来处理由“冲击”引起的序列行为,并且更重要的是需要 ARMA(p,q) 模型来融合这两种机制,以期获得对现实世界中更广泛、更复杂的时间序列现象更准确的建模和预测能力。

网友意见

user avatar

准确的说,AR(p)和ARMA(p,q)其实就是一种MA(∞)

MA(q)不能写成一般的AR形式,我们不妨拿AR(1)举个例子迭代一下:

yt=b+b1yt-1+et

=b+bb1+b1^2yt-2+b1et-1+et

=b+bb1+bb1^2+b1^3yt-3+b1^2et-2+b1et-1+et

=···

=b/(1-b1)+et+b1et-1+b1^2et-2+b1^3et-3+···

可见最简单的AR(1)其实都等价于MA(∞),所以有限q阶滞后项的MA(q)其实不能写成简单的AR形式,所以这和伊普西隆的白噪声假定其实没有关系。

至于如果AR(p)已经等价于MA(∞)了,那么为什么还需要AR,那是因为数据是有限的,跑回归的时候不可能跑无穷多项,所以MA(∞)只是理论上存在,实际上还是得靠AR(p)求参数。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有