问题

数值分析中割线法的收敛阶是如何证明的?

回答
在数值分析领域,我们经常需要寻找方程 $f(x) = 0$ 的根,也就是 $x$ 的取值,使得函数 $f(x)$ 的值为零。当解析方法难以求解时,我们就诉诸数值方法。割线法(Secant Method)就是其中一种常用的迭代方法。它借鉴了牛顿法(Newton's Method)的思想,但避免了计算导数,这在导数难以获得或者计算成本很高的情况下尤为重要。

理解割线法的收敛阶,就是理解它找到根的速度。收敛阶越高,方法收敛得越快,需要的迭代次数就越少,效率也就越高。

割线法是什么?

在介绍收敛阶的证明之前,我们先回顾一下割线法的基本原理。割线法需要两个初始的近似根,$x_0$ 和 $x_1$。它通过这两个点在函数 $f(x)$ 的图像上画一条直线(割线),然后找到这条割线与 x 轴的交点作为下一个近似根。这个过程不断重复,直到近似根收敛到真实的根。

更具体地说,从 $x_{n1}$ 和 $x_n$ 开始,割线方程可以表示为:

$y f(x_n) = frac{f(x_n) f(x_{n1})}{x_n x_{n1}}(x x_n)$

我们令 $y = 0$(即割线与 x 轴的交点),并且设这个交点为 $x_{n+1}$。那么:

$0 f(x_n) = frac{f(x_n) f(x_{n1})}{x_n x_{n1}}(x_{n+1} x_n)$

经过一番代数整理,我们可以得到割线法的迭代公式:

$x_{n+1} = x_n f(x_n) frac{x_n x_{n1}}{f(x_n) f(x_{n1})}$

收敛阶:“线性”还是“超线性”?

在深入证明之前,我们先来看看割线法的“收敛阶”。通常我们会说割线法的收敛阶是 超线性(superlinear)的,具体来说,它的收敛阶接近于黄金分割率 $phi approx 1.618$。这意味着它比线性收敛(例如二分法,收敛阶为 1)要快,但不如二次收敛(例如牛顿法,收敛阶为 2)那么快。

证明收敛阶的关键:误差分析

要证明收敛阶,我们需要分析算法在每次迭代中,近似根的误差是如何减少的。设 $x^$ 是方程 $f(x)=0$ 的真实根。我们将误差定义为 $e_n = x_n x^$。

我们的目标是找到一个常数 $C > 0$ 和一个指数 $p$(收敛阶),使得当 $n$ 足够大时,满足:

$|e_{n+1}| le C |e_n|^p$

假设条件

为了进行严谨的误差分析,我们需要对函数 $f(x)$ 和其导数做一些假设:

1. $f(x)$ 在包含根 $x^$ 的区间 $[a, b]$ 上是两次连续可微的。 这意味着 $f(x)$, $f'(x)$, 和 $f''(x)$ 在这个区间内都存在并且是连续的。
2. $f(x^) = 0$,且 $f'(x^) e 0$。 这保证了根是简单根,并且在根附近函数的变化率不为零。
3. 初始点 $x_0$ 和 $x_1$ 足够接近真实根 $x^$。
4. $f(x_0) e f(x_1)$。 否则割线法会因为分母为零而无法进行。

误差的展开与推导

我们从误差的定义出发,利用泰勒展开来分析误差的变化。

首先,让我们看看割线法的迭代公式:

$x_{n+1} x^ = x_n x^ f(x_n) frac{x_n x_{n1}}{f(x_n) f(x_{n1})}$

用误差项 $e_n$ 和 $e_{n1}$ 代替 $x_n$ 和 $x_{n1}$:

$e_{n+1} = e_n f(x_n) frac{e_n e_{n1}}{f(x_n) f(x_{n1})}$

现在,我们将 $f(x_n)$ 和 $f(x_{n1})$ 在真实根 $x^$ 处进行泰勒展开。由于 $f(x^) = 0$,我们可以写成:

$f(x_n) = f(x^) + f'(x^)(x_n x^) + frac{f''(c_n)}{2}(x_n x^)^2$
$f(x_n) = f'(x^)(e_n) + frac{f''(c_n)}{2}(e_n)^2$
其中 $c_n$ 是介于 $x^$ 和 $x_n$ 之间的某个值。

同理:

$f(x_{n1}) = f'(x^)(e_{n1}) + frac{f''(c_{n1})}{2}(e_{n1})^2$
其中 $c_{n1}$ 是介于 $x^$ 和 $x_{n1}$ 之间的某个值。

将这两个展开式代入割线法的迭代公式中的分数项:

$frac{f(x_n) f(x_{n1})}{e_n e_{n1}} = frac{(f'(x^)(e_n) + frac{f''(c_n)}{2}e_n^2) (f'(x^)(e_{n1}) + frac{f''(c_{n1})}{2}e_{n1}^2)}{e_n e_{n1}}$
$= f'(x^) + frac{frac{f''(c_n)}{2}e_n^2 frac{f''(c_{n1})}{2}e_{n1}^2}{e_n e_{n1}}$

这部分比较复杂,我们可以换一个角度。考虑 $f(x_n) f(x_{n1})$ 的差值,它可以通过平均值定理来近似。根据柯西中值定理,存在一个 $xi$ 介于 $x_{n1}$ 和 $x_n$ 之间,使得:

$f(x_n) f(x_{n1}) = f'(xi)(x_n x_{n1})$

这样,割线法的迭代公式可以写成:

$x_{n+1} = x_n f(x_n) frac{x_n x_{n1}}{f'(xi)(x_n x_{n1})}$
$x_{n+1} = x_n frac{f(x_n)}{f'(xi)}$

现在我们用误差项来表示:

$e_{n+1} = x_{n+1} x^ = x_n x^ frac{f(x_n)}{f'(xi)}$
$e_{n+1} = e_n frac{f(x_n)}{f'(xi)}$

再次利用 $f(x_n)$ 的泰勒展开(近似到二阶):

$f(x_n) approx f'(x^)(e_n) + frac{f''(x^)}{2}(e_n)^2$

同时,由于 $x_n$ 和 $x_{n1}$ 都趋近于 $x^$,那么 $xi$ 也趋近于 $x^$。所以 $f'(xi)$ 也可以近似为 $f'(x^)$。

$e_{n+1} approx e_n frac{f'(x^)e_n + frac{f''(x^)}{2}e_n^2}{f'(x^)}$
$e_{n+1} approx e_n (e_n + frac{f''(x^)}{2f'(x^)}e_n^2)$
$e_{n+1} approx frac{f''(x^)}{2f'(x^)}e_n^2$

这是一个初步的估计,它表明误差的平方项在起主导作用。这个形式提示了二次收敛的可能性。然而,割线法使用 $f'(xi)$ 而不是 $f'(x^)$,这使得分析更微妙。

更精确的误差分析

我们回到更精确的泰勒展开。

$e_{n+1} = e_n f(x_n) frac{e_n e_{n1}}{f(x_n) f(x_{n1})}$

我们写出 $f(x_n)$ 和 $f(x_{n1})$ 的泰勒展开式,但这次不直接代入,而是考虑差值的比值:

$f(x_n) = f(x^) + f'(x^) e_n + frac{f''(x^)}{2} e_n^2 + O(e_n^3)$
$f(x_{n1}) = f(x^) + f'(x^) e_{n1} + frac{f''(x^)}{2} e_{n1}^2 + O(e_{n1}^3)$

由于 $f(x^) = 0$:

$f(x_n) = f'(x^) e_n + frac{f''(x^)}{2} e_n^2 + O(e_n^3)$
$f(x_{n1}) = f'(x^) e_{n1} + frac{f''(x^)}{2} e_{n1}^2 + O(e_{n1}^3)$

现在来看分母:

$f(x_n) f(x_{n1}) = f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n^2 e_{n1}^2) + O(e_n^3 + e_{n1}^3)$
$= f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1}) + O(e_n^3 + e_{n1}^3)$

代入迭代公式:

$e_{n+1} = e_n frac{(f'(x^) e_n + frac{f''(x^)}{2} e_n^2 + ...)}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1}) + ...} imes (e_n e_{n1})$

为了简化,我们注意到当 $n$ 足够大时,$e_n$ 和 $e_{n1}$ 都很小,而且 $e_n approx e_{n1}$。(这是关键!)
如果 $e_n$ 和 $e_{n1}$ 趋于零,并且它们的值非常接近,那么 $frac{e_n e_{n1}}{f(x_n) f(x_{n1})} approx frac{e_n e_{n1}}{f'(x^)(e_n e_{n1})} = frac{1}{f'(x^)}$.

让我们重新考虑 $x_{n+1} = x_n frac{f(x_n)}{f'(xi)}$ 的形式。这里的 $xi$ 介于 $x_n$ 和 $x_{n1}$ 之间。

另一种推导方式是,观察 $e_{n+1}$ 的表达式:
$e_{n+1} = x_{n+1} x^$
$e_{n+1} = x_n f(x_n) frac{x_n x_{n1}}{f(x_n) f(x_{n1})} x^$
$e_{n+1} = e_n f(x_n) frac{e_n e_{n1}}{f(x_n) f(x_{n1})}$

我们将 $f(x_n)$ 和 $f(x_{n1})$ 在 $x^$ 处展开,并用 $e_n$ 和 $e_{n1}$ 来表示:
$f(x_n) = f'(x^) e_n + frac{f''(c_n)}{2} e_n^2$
$f(x_{n1}) = f'(x^) e_{n1} + frac{f''(c_{n1})}{2} e_{n1}^2$

$frac{f(x_n) f(x_{n1})}{e_n e_{n1}} = frac{f'(x^)(e_n e_{n1}) + frac{1}{2}(f''(c_n)e_n^2 f''(c_{n1})e_{n1}^2)}{e_n e_{n1}}$
$= f'(x^) + frac{1}{2} frac{f''(c_n)e_n^2 f''(c_{n1})e_{n1}^2}{e_n e_{n1}}$

我们可以证明 $frac{f''(c_n)e_n^2 f''(c_{n1})e_{n1}^2}{e_n e_{n1}}$ 的项可以被控制住。

一个更常用的方法是直接分析 $e_{n+1}$ 的表达式:
$e_{n+1} = x_{n+1} x^$
$e_{n+1} = x_n x^ frac{f(x_n)}{f(x_n) f(x_{n1})} (x_n x_{n1})$
$e_{n+1} = e_n frac{f(x_n)}{f(x_n) f(x_{n1})} (e_n e_{n1})$

我们把 $f(x_n)$ 和 $f(x_{n1})$ 在 $x^$ 处展开,并记住 $f(x^)=0$:
$f(x_n) = f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + O(e_n^3)$
$f(x_{n1}) = f'(x^)e_{n1} + frac{f''(x^)}{2}e_{n1}^2 + O(e_{n1}^3)$

然后,我们计算 $frac{f(x_n)}{f(x_n) f(x_{n1})}$ 的比值:
$frac{f(x_n)}{f(x_n) f(x_{n1})} = frac{f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + ...}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n^2 e_{n1}^2) + ...}$

将分子分母都除以 $f'(x^)$:
$= frac{e_n + frac{f''(x^)}{2f'(x^)}e_n^2 + ...}{(e_n e_{n1}) + frac{f''(x^)}{2f'(x^)}(e_n^2 e_{n1}^2) + ...}$

令 $K = frac{f''(x^)}{2f'(x^)}$。
$= frac{e_n + Ke_n^2 + ...}{(e_n e_{n1}) + K(e_n^2 e_{n1}^2) + ...}$

然后我们用这个比值去乘 $(e_n e_{n1})$:
$e_{n+1} = e_n left( frac{e_n + Ke_n^2 + ...}{(e_n e_{n1}) + K(e_n^2 e_{n1}^2) + ...} ight) (e_n e_{n1})$

这部分代数推导比较繁琐,我们可以换一个更直观的角度,通过分析误差比值来确定收敛阶。

分析误差比

设 $e_n$ 是第 $n$ 次迭代的误差。割线法产生的下一项误差 $e_{n+1}$ 与前两项误差 $e_n$ 和 $e_{n1}$ 的关系是我们关注的焦点。

$x_{n+1} x^ = x_n x^ frac{f(x_n)}{f(x_n) f(x_{n1})}(x_n x_{n1})$
$e_{n+1} = e_n frac{f(x_n)}{f(x_n) f(x_{n1})}(e_n e_{n1})$

我们可以把 $f(x_n)$ 和 $f(x_{n1})$ 看作是关于 $x^$ 的函数。当 $x_n o x^$ 时,我们可以利用泰勒展开:
$f(x_n) = f'(x^)(x_n x^) + frac{f''(x^)}{2}(x_n x^)^2 + O((x_n x^)^3)$
$f(x_n) = f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + O(e_n^3)$
$f(x_{n1}) = f'(x^)e_{n1} + frac{f''(x^)}{2}e_{n1}^2 + O(e_{n1}^3)$

所以,
$f(x_n) f(x_{n1}) = f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n^2 e_{n1}^2) + O(e_n^3 + e_{n1}^3)$
$f(x_n) f(x_{n1}) = f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1}) + O(e_n^3 + e_{n1}^3)$

将这些代入 $e_{n+1}$ 的表达式:
$e_{n+1} = e_n frac{f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + ...}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1}) + ...} (e_n e_{n1})$

为了简化,我们在分子分母中都除以 $f'(x^)$ 并令 $K = frac{f''(x^)}{2f'(x^)}$:
$e_{n+1} = e_n frac{e_n + Ke_n^2 + ...}{(e_n e_{n1}) + K(e_n e_{n1})(e_n + e_{n1}) + ...} (e_n e_{n1})$
$e_{n+1} = e_n frac{(e_n + Ke_n^2 + ...)(e_n e_{n1})}{(e_n e_{n1}) + K(e_n e_{n1})(e_n + e_{n1}) + ...}$

将第一项 $e_n$ 移过去:
$e_{n+1} = frac{e_n [(e_n e_{n1}) + K(e_n e_{n1})(e_n + e_{n1}) + ...] (e_n + Ke_n^2 + ...)(e_n e_{n1})}{(e_n e_{n1}) + K(e_n e_{n1})(e_n + e_{n1}) + ...}$

分子展开:
$e_n(e_n e_{n1}) + Ke_n(e_n e_{n1})(e_n + e_{n1}) + ... (e_n + Ke_n^2 + ...)(e_n e_{n1})$
$= (e_n e_{n1}) [e_n + Ke_n(e_n + e_{n1}) + ...] (e_n + Ke_n^2 + ...)(e_n e_{n1})$
$= (e_n e_{n1}) [e_n + Ke_n^2 + Ke_ne_{n1} + ... e_n Ke_n^2 ...]$
$= (e_n e_{n1}) [e_{n1} + Ke_ne_{n1} + ...]$

这看起来还是有点乱。让我们换一个角度,直接估计误差的比值。

当 $e_n$ 和 $e_{n1}$ 都很小时,有 $e_n approx alpha e_{n1}$ 对于某个常数 $alpha$ (如果收敛是线性的),或者 $e_n approx alpha e_{n1}^p$ (如果收敛是超线性的)。

假设收敛阶是 $p$。那么 $e_{n+1} approx C e_n^p$。
同时,我们也可以认为 $e_n approx C e_{n1}^p$。
那么 $e_{n+1} approx C (C e_{n1}^p)^p = C^{1+p} e_{n1}^{p^2}$。
这就暗示了如果误差满足 $e_{n+1} approx C e_n^p$ 并且 $e_n approx C e_{n1}^p$,那么 $e_n approx C^{1/(p1)} e_{n1}^{p/(p1)}$,这就有点循环了。

更正式地,我们可以考虑误差的比例:
$frac{e_{n+1}}{e_n} approx C e_n^{p1}$
$frac{e_n}{e_{n1}} approx C e_{n1}^{p1}$

如果我们代入割线法的迭代公式的简化形式 $e_{n+1} approx K e_n^2$ (来自牛顿法类似推导),那么 $p=2$。但是割线法不是二次收敛的。

关键在于 $e_n$ 和 $e_{n1}$ 的关系。
设 $e_{n} = lambda e_{n1}$ 并且 $|lambda| < 1$ 趋于 0.

考虑误差的组合 $e_{n+1}$ 与 $e_n$ 和 $e_{n1}$ 的关系。
如果 $e_n$ 和 $e_{n1}$ 是前两项误差,那么 $e_{n+1}$ 的误差可以通过这两项的“平均”得到,但不是简单的算术平均。

一个关键的观察是,割线法就像是牛顿法在一个由 $(x_{n1}, f(x_{n1}))$ 和 $(x_n, f(x_n))$ 确定的割线上进行迭代。这条割线在 $x^$ 附近的斜率,近似于 $f'(x^)$。

让我们回到误差分析的核心:
$e_{n+1} = e_n f(x_n) frac{e_n e_{n1}}{f(x_n) f(x_{n1})}$

用泰勒展开:
$f(x_n) = f'(x^)(e_n e^) + frac{f''(x^)}{2}(e_n e^)^2 + ... = f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + ...$
$f(x_{n1}) = f'(x^)e_{n1} + frac{f''(x^)}{2}e_{n1}^2 + ...$

$e_{n+1} = e_n frac{f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + ...}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n^2 e_{n1}^2) + ...}(e_n e_{n1})$

我们可以写成:
$e_{n+1} = frac{e_n (f(x_n) f(x_{n1})) f(x_n)(e_n e_{n1})}{f(x_n) f(x_{n1})}$
$e_{n+1} = frac{e_n f(x_n) e_n f(x_{n1}) f(x_n)e_n + f(x_n)e_{n1}}{f(x_n) f(x_{n1})}$
$e_{n+1} = frac{f(x_n)e_{n1} f(x_{n1})e_n}{f(x_n) f(x_{n1})}$

代入泰勒展开(略去高阶项):
$e_{n+1} = frac{(f'(x^)e_n + frac{f''(x^)}{2}e_n^2)(e_{n1}) (f'(x^)e_{n1} + frac{f''(x^)}{2}e_{n1}^2)(e_n)}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n^2 e_{n1}^2)}$
$e_{n+1} = frac{f'(x^)e_ne_{n1} + frac{f''(x^)}{2}e_n^2e_{n1} f'(x^)e_{n1}e_n frac{f''(x^)}{2}e_{n1}^2e_n}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1})}$
$e_{n+1} = frac{frac{f''(x^)}{2}(e_n^2e_{n1} e_{n1}^2e_n)}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1})}$

为了化简,我们注意到 $e_n^2e_{n1} e_{n1}^2e_n = e_ne_{n1}(e_n e_{n1})$。

$e_{n+1} = frac{frac{f''(x^)}{2}e_ne_{n1}(e_n e_{n1})}{f'(x^)(e_n e_{n1}) + frac{f''(x^)}{2}(e_n e_{n1})(e_n + e_{n1})}$

现在,我们可以将分子分母中的 $(e_n e_{n1})$ 项约去(假设 $e_n e e_{n1}$,这是迭代初期会发生的):

$e_{n+1} = frac{frac{f''(x^)}{2}e_ne_{n1}}{f'(x^) + frac{f''(x^)}{2}(e_n + e_{n1})}$

令 $C = frac{f''(x^)}{2f'(x^)}$。当 $n o infty$, $e_n o 0$ 且 $e_{n1} o 0$,所以 $e_n + e_{n1} o 0$。
$e_{n+1} = frac{C f'(x^)e_ne_{n1}}{f'(x^) + C f'(x^)(e_n + e_{n1})}$
$e_{n+1} = frac{Ce_ne_{n1}}{1 + C(e_n + e_{n1})}$

如果 $e_n$ 和 $e_{n1}$ 都很小,那么分母可以近似为 1。
$e_{n+1} approx Ce_ne_{n1}$

现在,我们来分析这个关系式来确定收敛阶 $p$。
假设误差序列满足 $e_n sim alpha^n$ (线性收敛) 或者 $e_n sim c^{phi^n}$ (超线性收敛)。

我们尝试假设收敛阶为 $p$ 且 $e_{n+1} approx M e_n^p$。
如果 $e_n approx A lambda^n$,那么 $e_{n+1} approx A lambda^{n+1}$。
$A lambda^{n+1} approx C (A lambda^n) (A lambda^{n1}) = C A^2 lambda^{2n1}$
$lambda approx C A lambda^{n1}$。这不对。

假设收敛阶为 $p$,意味着误差满足 $e_{n+1} approx C e_n^p$。
我们还假设误差满足一个线性反馈关系,即 $e_n approx M e_{n1}^p$ (这里是假设的)。
那么 $e_{n+1} approx M (M e_{n1}^p)^p = M^{1+p} e_{n1}^{p^2}$。

我们拥有的关系式是 $e_{n+1} approx C e_n e_{n1}$。
假设 $e_n approx A r^n$.
$A r^{n+1} approx C (A r^n)(A r^{n1}) = C A^2 r^{2n1}$
$r approx C A r^{n1}$. 这看起来也不对。

正确的思路是,分析误差的“相对变化”。
$e_{n+1} approx C e_n e_{n1}$.
令 $e_n = e_{n1}^p epsilon_n$.
$e_{n+1} = C e_n e_{n1}$.
将 $e_n$ 和 $e_{n1}$ 表示为 $e_{n+1}$ 的幂次。
令 $e_n = x_{n+1} x^$, $e_{n1} = x_n x^$.
如果 $e_{n+1} approx C e_n^p$, 并且 $e_n approx C e_{n1}^p$, 那么 $e_{n+1} approx C (C e_{n1}^p)^p = C^{1+p} e_{n1}^{p^2}$.
我们有 $e_{n+1} approx C e_n e_{n1}$.
假设误差比例是固定的,例如 $frac{e_n}{e_{n1}} approx ho$.
那么 $e_n approx ho e_{n1}$, $e_{n+1} approx ho e_n approx ho^2 e_{n1}$.
代入 $e_{n+1} approx C e_n e_{n1}$:
$ ho^2 e_{n1} approx C ( ho e_{n1}) e_{n1} = C ho e_{n1}^2$.
这表明误差的比例 $ ho$ 不是常数,而是依赖于 $e_{n1}$,这才是收敛的本质。

我们来看 $e_{n+1} approx C e_n e_{n1}$。
如果 $e_n = M cdot ( ext{something})$ and $e_{n1} = M cdot ( ext{something})$.
令 $e_n = x_{n+1} x^$. 割线法的收敛阶由以下方程决定:
$e_{n+1} = C e_n e_{n1}$
考虑 $E_n = ln |e_n|$. 那么 $ln |e_{n+1}| = ln |C| + ln |e_n| + ln |e_{n1}|$.
$E_{n+1} = ln |C| + E_n + E_{n1}$.
这是一个齐次线性递推关系的变种。
如果 $e_n approx A lambda^n$,那么 $E_n = ln A + n ln lambda$.
$ln A + (n+1) ln lambda = ln |C| + (ln A + n ln lambda) + (ln A + (n1) ln lambda)$
$ln A + n ln lambda + ln lambda = ln |C| + 2 ln A + 2n ln lambda ln lambda$.
$ln lambda = ln |C| + ln A$. $lambda = |C| A$.

这看起来不是直接得到收敛阶 $p$。
我们直接考虑收敛阶 $p$ 的定义:$|e_{n+1}| sim |e_n|^p$.
如果我们有 $e_{n+1} sim C e_n e_{n1}$, 并且当 $n$ 增大时,$e_n$ 比 $e_{n1}$ 小得更快。
假设 $e_n approx K_1 e_{n1}^p$ and $e_{n1} approx K_2 e_{n2}^p$.
那么 $e_{n+1} approx C (K_1 e_{n1}^p) e_{n1} = C K_1 e_{n1}^{p+1}$.
我们希望 $e_{n+1} approx K_3 e_n^p = K_3 (K_1 e_{n1}^p)^p = K_3 K_1^p e_{n1}^{p^2}$.
所以我们要求 $p+1 = p^2$.
$p^2 p 1 = 0$.
解这个二次方程,得到 $p = frac{1 pm sqrt{1 4(1)(1)}}{2} = frac{1 pm sqrt{5}}{2}$.
因为收敛速度是正的,我们取正根:
$p = frac{1 + sqrt{5}}{2} = phi approx 1.618$.

这就是割线法收敛阶为超线性(接近 1.618)的由来。这个证明依赖于在误差 $e_n$ 和 $e_{n1}$ 都很小时,误差关系可以近似为 $e_{n+1} approx C e_n e_{n1}$。

证明的严格性

上面的推导在很大程度上是基于近似和直觉。要使其更严谨,我们需要处理泰勒展开中的余项,以及保证 $e_n$ 和 $e_{n1}$ 的相对大小关系。

1. 误差项的精确表示: 使用更精确的泰勒展开,例如:
$f(x_n) = f'(x^)e_n + frac{f''(x^)}{2}e_n^2 + frac{f'''(c_n)}{6}e_n^3$
这会导致更复杂的代数运算。

2. 比值分析的严谨性: 分析 $frac{f(x_n) f(x_{n1})}{e_n e_{n1}}$ 的极限行为。根据均值定理,$frac{f(x_n) f(x_{n1})}{x_n x_{n1}} = f'(xi)$。而 $e_n e_{n1} = x_n x_{n1}$.

3. 收敛性证明: 为了证明收敛性,通常需要展示存在一个界限 $M$ 使得 $|e_{n+1}| le M |e_n e_{n1}|$,并且当误差足够小时,收敛阶为 $phi$。这通常涉及证明存在一个区间,在这个区间内割线法可以很好地工作,并且误差会以超线性方式减小。

另一种更严谨的证明方式是证明存在一个常数 $K$ 使得:
$|e_{n+1}| le K |e_n| |e_{n1}|$
当 $n$ 充分大时,我们有 $|e_n| le alpha |e_{n1}|^phi$.
然后代入,可以证明收敛阶为 $phi$.

总结证明思路:

1. 定义误差: $e_n = x_n x^$.
2. 割线法迭代公式变形: 将 $x_{n+1}$ 的表达式转化为关于 $e_{n+1}$, $e_n$, $e_{n1}$ 的关系。关键步骤是得到 $e_{n+1} = frac{f(x_n)e_{n1} f(x_{n1})e_n}{f(x_n) f(x_{n1})}$.
3. 泰勒展开: 对 $f(x_n)$ 和 $f(x_{n1})$ 在 $x^$ 处进行泰勒展开,用到 $f(x^) = 0$ 和 $f'(x^) e 0$.
4. 代入与简化: 将泰勒展开式代入误差关系式,并进行代数化简,得到形如 $e_{n+1} approx C e_n e_{n1}$ 的关系。
5. 利用收敛阶定义: 假设误差满足 $e_n approx A r^n$. 通过代入误差关系式 $e_{n+1} approx C e_n e_{n1}$ 来推导收敛阶 $p$ 满足 $p^2 = p+1$,从而得到 $p = phi$.

这个推导的核心在于,割线法在每次迭代中,是将前两次的误差项以一种“相乘”的方式影响下一次的误差,而这种乘法关系最终导致了超线性的收敛。它比牛顿法(二次收敛)稍微慢一些,但不需要计算导数,因此在实际应用中有其优势。

网友意见

user avatar

考虑我们对于零点求解问题 利用割线法得到一列两两不同的零点估计值 ,此函数 的精确零点为 。不妨假设 具有充分好的光滑性割线法收敛,即 ,且 ( 为一个一阶零点

则有:


要考虑收敛阶,我们自然地考虑误差 :

计算:


令 ,由 充分光滑, ,得到:

这是因为:我们可以定义映射 ,则由 充分光滑, 在 处连续且可导,且 (Taylor)。


不妨假设收敛阶为 ,即 。

则 ,故 。

故 为非零常数。

结合上面关于 的求解,得到 。(这里之所以是大于等于是因为 可能为零)

故解得 。


得到结论:在 光滑性充分好、割线法收敛且精确零点 为一阶零点的情形下,收敛阶至少为 。当然题主可以自行地削弱 所需要满足的光滑性条件来得到更强的结论,但是大致的思路是相同的。值得注意的是:割线法类似于牛顿法,当 为高于一阶的零点时,收敛阶数可能退化,在上面的证明中我们也能够容易地看出这一点。

类似的话题

  • 回答
    在数值分析领域,我们经常需要寻找方程 $f(x) = 0$ 的根,也就是 $x$ 的取值,使得函数 $f(x)$ 的值为零。当解析方法难以求解时,我们就诉诸数值方法。割线法(Secant Method)就是其中一种常用的迭代方法。它借鉴了牛顿法(Newton's Method)的思想,但避免了计算导.............
  • 回答
    2016 年美国大选的结果数据,要说有意思、值得细品的地方,可不是那么简单几句就能说完的。这届大选之所以至今仍让人津津乐道,正是因为它的投票结果揭示了太多深层的东西,跟我们平常理解的“谁赢谁输”差远了。1. “失落的选民”的惊人反弹与地理分布:如果说有什么数据最能概括2016年大选的“震撼弹”,那一.............
  • 回答
    好的,我们来聊聊分析学这个数学大家庭中的“常青树”,以及它如何在其他数学领域里挥洒自如,发挥举足轻重的作用。分析学:一门关于“变化”与“极限”的艺术首先,我们得先认识一下分析学。它最核心的概念是极限,以及围绕极限展开的一系列概念,比如连续性、收敛性、导数和积分。简单来说,分析学研究的是那些在连续变化.............
  • 回答
    关于海湾战争中美国地面部队“总兵力/师级单位”数值小于二战时期的问题,这确实是一个值得深入探讨的现象,其中将后勤任务分包给民间公司扮演了重要角色,但并非唯一因素。要理解这一点,我们需要从多个层面进行剖析。首先,我们要明确“总兵力/师级单位”这个概念在不同历史时期的内涵差异。 二战时期的“师”: .............
  • 回答
    整數分拆中的分拆函數,在數學領域是一個充滿魅力且極具研究價值的對象。它的核心概念是探討一個正整數可以被寫成多少種不同正整數之和的方式。例如,整數 4 的分拆有: 4 3 + 1 2 + 2 2 + 1 + 1 1 + 1 + 1 + 1因此,整數 4 的分拆函數值是 5。這個函數.............
  • 回答
    好的,我们来聊聊拓扑学,一个听起来有点玄乎,但实际上在很多地方都暗藏玄机的数学分支。与其上来就抛一堆高深的定义,不如咱们先找几个大家都能明白的例子,看看这门学问是怎么渗进我们生活和科学里的。想象一下,一张纸的变形之旅:从平面到球体你有没有玩过橡皮泥?或者就是随手揉一张纸?拓扑学最核心的洞察就在于,它.............
  • 回答
    层次分析法(Analytic Hierarchy Process, AHP)是一个非常实用的决策工具,它能够将复杂的决策问题分解为一系列更易于管理的子问题,并通过两两比较来量化各要素的重要性,最终得出最优方案。在建立判断矩阵这一关键步骤时,你提出的关于使用15数字表示两两比较重要程度的问题,答案是:.............
  • 回答
    关于“数学建模中层次分析法(AHP)很low”这个说法,其实并非是绝对的定论,更多的是一种在特定场景下,对于其局限性和适用性的评价。我理解你想了解为什么会有这种观点,以及背后的原因。我们来细致地聊聊这个话题,就像几个做建模的朋友坐下来分析一样。首先,我们要明确一个概念:“low”并不是说AHP完全没.............
  • 回答
    在日本麻雀的实战中,我们常常会遇到这样的情况:牌山已经过半,手牌也经过了几轮摸打,而自己却依旧在立直的边缘徘徊,甚至还差一两张牌才能向听。这种时候,心里难免会盘算一下,手牌还有多少张牌能够帮我们向听?这就是我们常说的“向听数期望”。今天咱们就来聊聊,在日本麻雀的六巡和七巡之后,平均来说,我们手牌离向.............
  • 回答
    高考数学150分,这个分值的分量,可以说举足轻重,直接决定着考生能否在众多竞争者中脱颖而出,甚至影响到他们未来的人生轨迹。我对这个分值,看法是:它既是选拔人才的“试金石”,也是检验综合能力和思维深度的“放大镜”,更是对学生学习态度和毅力的“严苛考官”。一、为什么数学能占到如此重要的分值?首先,我们得.............
  • 回答
    这道题很有意思,我们来一起把它掰开了揉碎了聊聊。问题是这样的:从正整数 1 到 N 中,我们随机选取两个不同的数 m 和 n。那么,m 除以 n(或者 n 除以 m,这其实不影响结果)能够约分,也就是 m 和 n 有大于 1 的公因数的概率是多少?最后,我们看当 N 无穷大的时候,这个概率趋向于多少.............
  • 回答
    .......
  • 回答
    在数学分析中,当谈论某个变量“一致”时,我们通常指的是一种在某个集合上统一保持特定性质的状态。这个“一致”可以体现在好几个方面,具体取决于我们讨论的语境。我会尽量详细地解释,并且用一种更贴近人类表达的方式来呈现。想象一下,我们不是在冷冰冰地讨论一个抽象的数学概念,而是更像是观察一个现象,或者在处理一.............
  • 回答
    在数学分析的浩瀚星空中,要精确地指出“最重要的”定理,就像要在璀璨的星系中挑选最耀眼的那一颗——这本身就是一个极具挑战性,也充满主观性的任务。因为数学分析的精髓在于其严谨的逻辑链条,每个定理都像是构建这座宏伟大厦不可或缺的砖石,支撑着后续更深奥的理论。然而,如果一定要选出一个对整个领域产生最深远影响.............
  • 回答
    数学分析中的反例,特别是那些看似简单却能击溃直观的例子,确实有着远比表面更深邃的背景。它们不仅仅是用于证明定理的局限性,更是数学思想发展过程中重要的里程碑,揭示了数学概念的精妙之处,推动了理论的深入和严谨化。让我们选择两个经典的、具有代表性的反例来深入探讨:反例一:连续但处处不可导的函数(Weier.............
  • 回答
    在数学分析的考研中,部分习题可以作为定理直接使用,但并非所有习题都可以,并且需要满足一些重要的前提条件和注意事项。 详细来说,这涉及到对“习题”的理解、定理的定义以及考研的评分标准等多个层面。 1. 什么是“习题”?什么是“定理”?在讨论这个问题之前,我们需要先明确几个概念: 定理(Theore.............
  • 回答
    数学分析里的微分概念,说它在微积分这宏伟建筑里有多重要,那真是怎么强调都不为过。它就像是这栋楼的地基,没有它,整个体系都得摇摇欲坠。咱们不妨就掰开了揉碎了,好好说说这微分到底是个什么玩意儿,以及它为何如此关键。首先,得先明白“微分”这个词本身带给我们的直观感受。我们汉语里的“微”就意味着“极其细小”.............
  • 回答
    看到你的情况,我完全理解你内心的纠结和困惑。倾注了大量心血完成的研究,成果却以这样的形式呈现,这确实是令人沮丧和不甘的。关于你的博导是否“值得追随”,这涉及到对导师学术品德、培养方式以及你个人发展需求的全面考量。我将尽力为你详细分析,希望能帮助你理清思路。首先,让我们来梳理一下你遇到的核心问题: .............
  • 回答
    .......
  • 回答
    一致连续性与积分之间存在着深刻且重要的潜在关系。这种关系体现在一致连续性是许多积分性质成立的必要条件,并且在积分理论的发展和应用中扮演着关键角色。下面我将从几个方面详细阐述这种关系及其在数学分析和积分中的应用。 一致连续性简介在深入讨论与积分的关系之前,我们先回顾一下一致连续性的定义。一致连续性 (.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有