你这个问题问得非常到位,而且触及到了数学定义严谨性的核心。我们来好好聊聊为什么不能“简单地”把集合E的上确界定义为它所有上界组成的集合的最小元。这听起来似乎非常直观,但一旦我们深入思考其背后的逻辑和可能出现的问题,就会发现这个“简单”的定义其实存在一些关键的缺陷,会导致它在某些情况下失效,或者说不够普适和精确。
首先,我们先复习一下几个关键概念:
上界 (Upper Bound): 对于一个集合 E,如果存在一个数 M,使得 E 中的每一个元素 x 都满足 $x le M$,那么 M 就是 E 的一个上界。
上确界 (Supremum, sup E): 如果一个集合 E 有上界,那么它的所有上界组成一个集合。上确界是这个“所有上界组成的集合”中的最小的那个数。
那么,问题出在哪里呢?主要有以下几个方面:
1. “所有上界组成的集合”不一定存在
这是最根本的问题。数学定义必须保证其对象的存在性。我们定义上确界为“由E的所有上界组成之集的最小元”,这个定义的前提是:
集合 E 必须有上界。 如果集合 E 没有上界(比如实数集 $mathbb{R}$),那么“所有上界组成的集合”就是一个空集。空集是没有最小元的。
“所有上界组成的集合”本身是“有良好性质”的集合。 在实数系中,我们知道任何非空的有上界的实数集合,其上界集合也是非空且有下界的(因为 E 的任何一个元素都是 E 的上界集合的下界),并且这个上界集合的下确界(也就是 E 的上确界)是存在的。
举个例子,考虑一个在整数集 $mathbb{Z}$ 上的集合:
$E = {x in mathbb{Z} mid x < 5}$
这个集合是 ${ dots, 2, 3, 4 }$。
E 的上界集合是 ${5, 6, 7, 8, dots }$。
这个集合在整数集 $mathbb{Z}$ 中的最小元是 5。
但如果我们考虑另一个集合,还是在整数集 $mathbb{Z}$ 上:
$F = {x in mathbb{Z} mid x le 4}$
这个集合是 ${ dots, 2, 3, 4 }$。
F 的上界集合也是 ${5, 6, 7, 8, dots }$。
同样,这个集合在整数集 $mathbb{Z}$ 中的最小元是 5。
现在来看问题:上确界(supremum)这个概念,它的核心作用是“抓住”那个“最紧”的上界。对于上面两个集合 E 和 F,它们的上确界都是 5。
但是,如果我们尝试用“上界集合的最小元”来定义它,就会发现一个微妙的问题:
对于集合 E,它的上界集合是 ${5, 6, 7, dots}$,这个集合在 $mathbb{Z}$ 中有最小元 5。
对于集合 F,它的上界集合是 ${5, 6, 7, dots}$,这个集合在 $mathbb{Z}$ 中也有最小元 5。
看起来没问题,对吧?然而,我们通常定义上确界是为了在一个更普遍的序结构中找到那个“最紧”的上界。实数系之所以强大,就是因为它满足“戴德金完备性”(Dedekind Completeness)或“上确界原理”(Supremum Property)。这个原理说明:任何非空的有上界的实数子集,其上确界在实数集 $mathbb{R}$ 中是存在的。
如果我们将定义局限于“上界组成的集合的最小元”,我们就依赖于那个“上界集合”本身在某个特定集合(比如整数集)中具有最小元。但并非所有的有上界的集合,其上界集合都在其所在的那个母集合中拥有最小元。
2. 失去“紧密性”的本质捕捉
“上确界”的真正价值在于它不仅是一个上界,而且是“最紧”的那个上界。这意味着:
它比任何其他的上界都要小(或者等于)。
或者换个角度,任何比它小的数,都不是这个集合的上界。
让我们来看一下标准定义:
集合 E 的上确界 $sup E = s$ 当且仅当满足以下两个条件:
1. $s$ 是 E 的一个上界(即 $forall x in E, x le s$)。
2. 对于任意的 $epsilon > 0$,存在 E 中的一个元素 $x_0$,使得 $x_0 > s epsilon$。
这个第二条定义,才是上确界最核心的“抓手”。它确保了 $s$ 是那个“最接近”集合 E 的上界。
现在回到你的提问:“为什么不能简单将集合E的上确界定义成由E的所有上界组成之集的最小元?”
如果 E 的上界集合是 $U = {M mid forall x in E, x le M}$。
如果 $U$ 非空且在某个集合(比如实数集 $mathbb{R}$)中有最小元 $m$。
那么,$m$ 是 $U$ 的最小元,意味着 $m in U$ 且 $forall M' in U, m le M'$。
由于 $m in U$,根据上界定义, $m$ 必须是 E 的一个上界。所以条件 1 满足了。
我们还需要证明条件 2:对于任意的 $epsilon > 0$,存在 E 中的一个元素 $x_0$,使得 $x_0 > m epsilon$。
这里就开始出现问题了。如果我们将 $m$ 定义为上界集合的最小元,我们知道 $m$ 本身是 E 的一个上界。那么,对于任意 $epsilon > 0$,我们怎么保证 $m epsilon$ 不是 E 的一个上界呢?
如果 $m epsilon$ 不是 E 的一个上界,那么根据上界的定义,一定存在 E 中的某个元素 $x_0$,使得 $x_0 > m epsilon$。这不就恰好满足了上确界定义中的第二条了吗?
所以,如果“上界组成的集合”在相应的数域中有最小元,那么这个最小元确实就是我们所说的上确界。
问题在于:并非所有我们想要定义上确界的环境下,“上界集合”都一定有最小元。
例如,考虑数学的根基——集合论中的序数(ordinal numbers)。序数有一个非常庞大的集合论结构。在某些序数集合中,你可能可以定义一个集合 E,它有上界,但是它所有上界的集合,在该序数集合的框架下,却不具备最小元。
举一个更贴近数学实际的例子(虽然有点抽象,但能说明问题):
假设我们在一个非完备的序集合中工作。一个序集合如果不是完备的,就意味着存在某些非空的有上界的子集,而它在上确界原理的意义下,它的上确界并不在这个集合内部,或者说不存在一个“最紧”的界。
标准定义上确界,就是为了在数学分析中建立起实数系的完备性,确保我们讨论的“上确界”总是在实数域内找得到。这个定义不依赖于“上界集合”是否自身在某个特定集合(如整数集)里有最小元。它通过 $epsilon$ 的“逼近”来刻画了“最紧”的性质。
3. 普适性和一般性
数学定义力求普适。上确界的概念不仅在实数集中有用,在更抽象的数学结构中,比如格(lattices)、偏序集(partially ordered sets)中,也需要类似“上确界”的概念。
在这些更一般的结构中,“上界集合的最小元”这个概念可能就不那么好定义,或者说没有一个统一的、在任何情况下都适用的方式来确定。而“最紧的上界”这个性质,可以通过更一般的“可达性”或“逼近性”来定义,使其能够应用于更广泛的数学对象。
总结一下:
将上确界定义为“由E的所有上界组成之集的最小元”:
风险1: 依赖于“上界集合”本身在该特定集合域内存在最小元,而这一点并非总成立。如果上界集合是空集,或者它在所在的集合域中没有最小元,这个定义就失效了。
风险2: 无法完美捕捉“最紧”的精髓。标准定义中的 $epsilon$ 逼近,能够精确地描述那个“刚好比集合里的所有元素都大一点点”的界限。而“最小的上界”这个说法,虽然直观,但在形式化和普适性上不如 $epsilon$ 定义那样坚固。
因此,数学家们采用了 $epsilon$ 的定义方式,它更加严谨,保证了在实数系(以及其他满足类似完备性原理的数学结构)中,上确界的存在性和唯一性,并且能够普适地刻画出“最紧的上界”这个核心性质。它不是一个“简单地”从字面意思推导出来的定义,而是经过深思熟虑,为了数学大厦的稳固和拓展而建立的基石。