在泰勒公式展开到任意阶时,我们确实会忽略后面的高阶无穷小项。但这并非因为我们“不用管”它们,而是因为这些被忽略的项在数学上有明确的定义和意义,并且在实际应用中,它们能够被量化和控制。
让我们来详细解释一下:
泰勒公式的本质
泰勒公式的目的是用一个多项式来近似一个任意的、足够光滑(即可以无限次求导)的函数。这个多项式被称为函数的泰勒展开式或泰勒级数(如果展开到无穷阶)。
假设我们要展开函数 $f(x)$ 在点 $a$ 附近的泰勒公式,展开到 $n$ 阶,其形式如下:
$f(x) = f(a) + f'(a)(xa) + frac{f''(a)}{2!}(xa)^2 + frac{f'''(a)}{3!}(xa)^3 + dots + frac{f^{(n)}(a)}{n!}(xa)^n + R_n(x)$
其中:
$f(a), f'(a), f''(a), dots, f^{(n)}(a)$ 是函数 $f(x)$ 在点 $a$ 的零阶、一阶、二阶...$n$ 阶导数。
$(xa)^k$ 是 $(xa)$ 的 $k$ 次幂。
$k!$ 是 $k$ 的阶乘。
$R_n(x)$ 是余项 (remainder term)。
余项 $R_n(x)$ 的重要性
泰勒公式展开到有限阶 ($n$ 阶) 时,原始函数 $f(x)$ 与这个多项式之间存在一个误差,这个误差就是余项 $R_n(x)$。这个余项项才是我们通常所说的“后面的高阶无穷小项”。
为什么我们可以忽略它们?
1. 余项的性质:高阶无穷小
余项 $R_n(x)$ 的核心性质是,当 $x$ 趋近于 $a$ 时, $R_n(x)$ 是关于 $(xa)$ 的 高阶无穷小。更精确地说,当 $x o a$ 时, $R_n(x)$ 的阶数会高于 $(xa)^n$。
最常见的余项形式是 皮亚诺余项 (Peano Remainder):
$R_n(x) = o((xa)^n)$ 作为 $x o a$
这意味着 $lim_{x o a} frac{R_n(x)}{(xa)^n} = 0$。
这个定义意味着:当 $x$ 非常接近 $a$ 时, $R_n(x)$ 比 $(xa)^n$ 变得更快地趋近于零。换句话说, $R_n(x)$ 相对于 $(xa)^n$ 是一个“更小”的量。
2. 近似的精度:控制误差
泰勒公式的核心目的是用一个多项式 近似 函数。当我们选择展开到 $n$ 阶时,我们实际上是在说,我们关心的是在点 $a$ 附近,函数的行为可以用一个 $n$ 次多项式来近似。
低阶项的重要性: 低阶项($f(a), f'(a)(xa), dots$)对函数在 $a$ 点附近的行为起着决定性的作用。它们捕捉了函数的值、斜率、曲率等关键信息。
高阶项的作用: 余项 $R_n(x)$ 包含了所有被忽略的更高阶导数的信息,以及它们与 $(xa)$ 的高次幂的组合。虽然我们忽略了它们在具体公式中的形式(如拉格朗日余项、柯西余项等),但我们知道它们是存在的,并且具有高阶无穷小的性质。
3. 为什么可以“忽略”但不是真的“消失”?
忽略是为了简化: 在很多应用中,我们只需要一个近似值,而不是精确值。多项式是比超越函数(如 $sin x, e^x$)更容易处理和计算的。通过保留前几项,我们得到了一个实用的近似。
忽略是相对的: 当 $x$ 趋近于 $a$ 时, $(xa)^n$ 本身就趋近于零。而 $R_n(x)$ 比它趋近于零的速度更快。所以,对于非常接近 $a$ 的 $x$, $(xa)^n$ 本身就足够小了,而 $R_n(x)$ 的贡献就更加微不足道。我们可以说,$R_n(x)$ 对整个近似的相对误差或绝对误差的影响随着 $n$ 的增加而减小。
不是“不用管”,而是“量化了其小”: 我们不是完全不考虑余项,而是明确地知道它的性质是“高阶无穷小”。这个性质告诉我们,在什么条件下($x$ 足够接近 $a$),这个误差是可以忽略的,或者其影响可以被控制。
举个例子: $f(x) = e^x$ 在 $a=0$ 处的泰勒展开
$f(x) = e^x Rightarrow f(0) = 1$
$f'(x) = e^x Rightarrow f'(0) = 1$
$f''(x) = e^x Rightarrow f''(0) = 1$
$f'''(x) = e^x Rightarrow f'''(0) = 1$
...
$f^{(n)}(x) = e^x Rightarrow f^{(n)}(0) = 1$
泰勒展开到 $n$ 阶是:
$e^x = 1 + x + frac{x^2}{2!} + frac{x^3}{3!} + dots + frac{x^n}{n!} + R_n(x)$
使用皮亚诺余项,我们知道:
$R_n(x) = o(x^n)$ 当 $x o 0$。
这意味着:
$e^x = 1 + x + frac{x^2}{2!} + dots + frac{x^n}{n!} + frac{x^{n+1}}{(n+1)!}e^c$ (拉格朗日余项,其中 $c$ 在 $0$ 和 $x$ 之间)
当我们考虑 $e^x approx 1 + x + frac{x^2}{2!}$ 时,我们忽略了 $frac{x^3}{3!} + frac{x^4}{4!} + dots$ 以及它们后面的项。我们说余项是 $R_2(x) = frac{x^3}{3!} + frac{x^4}{4!} + dots = o(x^2)$。
当 $x$ 很小时,比如 $x = 0.1$:
$e^{0.1} approx 1 + 0.1 + frac{(0.1)^2}{2} = 1 + 0.1 + 0.005 = 1.105$
实际值是 $e^{0.1} approx 1.1051709$
误差是 $R_2(0.1) approx 0.0001709$
根据皮亚诺余项的定义,我们知道 $R_2(x) = o(x^2)$。当 $x=0.1$ 时,$x^2 = 0.01$。而误差 $0.0001709$ 确实比 $0.01$ 小得多,且随着 $x$ 趋近于 $0$,这个误差会比 $x^2$ 变得更小。
如果我们展开到 $3$ 阶:
$e^x approx 1 + x + frac{x^2}{2!} + frac{x^3}{3!} = 1 + 0.1 + 0.005 + frac{(0.1)^3}{6} = 1.105 + 0.0001666... = 1.1051666...$
误差是 $R_3(0.1) approx 1.1051709 1.1051666... approx 0.0000043$
此时我们忽略了 $R_3(x) = o(x^3)$。 $x^3 = 0.001$。 误差 $0.0000043$ 比 $0.001$ 小得多。
总结
在泰勒公式展开到任意阶时,我们忽略后面的高阶无穷小项,并不是真的不管它们,而是:
1. 理解它们的性质: 我们知道这些被忽略的项构成了一个余项 $R_n(x)$,并且其性质是“高阶无穷小”,即当 $x$ 趋近于展开点 $a$ 时,其量级比 $(xa)^n$ 更小。
2. 追求近似的精度: 忽略高阶项是为了得到一个多项式近似,以简化计算和分析。我们通过增加展开的阶数 ($n$) 来提高近似的精度,因为随着 $n$ 的增加, $(xa)^n$ 的量级会更小,余项的量级就更更小。
3. 控制误差: “忽略”的前提是这些项的贡献足够小,在实际应用中可以接受其带来的误差。这种“小”是可以被数学精确描述和控制的。
因此,我们在使用泰勒展开式时,虽然公式中不再显式写出余项,但其存在的意义和高阶无穷小的性质是我们能够有效利用泰勒公式的关键。我们是利用了它们足够小这个事实,而不是真的让它们凭空消失。