贴上我在另一个问题下面的解释,所谓的 确实是有含义以及对应的计算法则的
=======================================================================
以下是原回答
=======================================================================
看不下去别的答案胡乱解释。虽然下面要说的这套东西几乎没什么地方会讲,因为整体的构造和lebesgue的完全类似。昨天刚刚考完analysis,我也照搬那套东西给你搞一个Riemann的结论,我想你最关心的是为什么可以应用微分的定义以及链式法则,就好像 有具体含义,恰好考试还考了Radon-Nikodym的链式法则,我也原样给你个Riemann的版本(微分形式)。简单来说,就是我的原答案:
d后面的那个东西是给你算stieltjes积分时算区间长度的,按lebesgue意义就是测度了。换元相当于应用了radon nikodym定理,在测度上就是radon nikodym导数
我们先从定积分(Riemann)的讲起。最早牛顿研究运动和力的关系发现了导数(derivates): ,那自然有个问题,给定了初始状态,如何求解最终状态。这个直观的理解就是把时间分成很小的段,然后在这些小段上面把 或者 看作是不变的,然后一段段算出变化量再加起来就行,当小段越来越小,那误差就几乎没有,因此牛顿就给出了这样的公式: 。当然那个年代还没有所谓 语言,因此在现代数学里面,我们给了如下的定义:
注: 一般不会特别严格地使用上述符号,例如 也可能单独指一个划分, 指其中的划分 的长度。
注2: 加细构成了一个偏序(partial order)关系
给定 是一个有界函数
或者等价地 , ,
上述定义一般难以使用,所以我们会引入下述等价表述
考察 ,当 的时候,对于某个 , ,总能取细分到 ,且保持引入的点是原来的值则,对于划分后的小区间而言本来下确界 是取在更长的区间上的,现在值少了(直观理解可以考察一下图像,加细会导致下确界增大),当然也就变大了,即 变大了,因此 ,因此我们可以得到下积分就是当小区间长趋向 时Darboux下和的极限(注意确界意味着有界和收敛数列,这里单调当然就是极限了)。上积分同理。即
从这里不难发现,函数可积当且仅当上下积分相同。上下积分利用确界定义,相较极限而言总是存在的,这给了我们一个判断函数可积的方法。
以上是通常大多数高等数学(calculus)或者数学分析(mathematical analysis)课本上定义的定积分,这中间总是强调 只是一个记号,但是所有人都知道它可以当微分来理解,这个理解是由于Radon-Nikodym定理造成的,我接下来通过Stieltjes积分来说明一下
一样,先介绍背景(motivation),这次考察的是概率(Probability)和期望(Expectation)。对于抛硬币而言,连续出现 次正面的概率是 ,所以连续出现 次正面构成了一个概率空间(可测空间),当然,也可以考察这个次数的“平均值”(即期望) 。类似的,考虑如何算过马路等红灯的平均时间,假设我们红灯时间 ,绿灯时间 ,考虑一个红绿灯周期 ,先红灯再绿灯,为了计算平均等候红绿灯的时间,类似牛顿的做法,将整个区间分成 小份,每个小份上面的到达的概率都一样( ),并且等候的时间都差不多一样,于是我们让这个小份足够小,就得到了大概要等多少时间。考虑函数
反映了在 时刻到了路口等红灯的时间,则这样的一个函数就反映了“随机变量”,并且,按照上述刻画,
在这个过程中我很自然地假设我们到达路口的时间是均匀(等概率)的,但是在一般情形下,这个可能性不是均匀的。例如很多人熟悉的指数分布等。因此,我们需要刻画Riemann和中 的“可能性”大小。
设 是一函数,定义Riemann和
由此类似Riemann积分诱导出的积分称为Stieltjes积分(对应有可积),记作
在概率论里,假设 是一个分布函数(单调、非负、负无穷出极限0,正无穷出极限1), 是一随机变量(可测函数),则期望就是我们熟知的
另一个常见解释则是计算面积的时候,更改了计算长度的方法,例如沿着斜线积分,本来沿着 的长度被拉伸到斜线的线段长,因此就导致了你直觉理解时候的换元。
这里只做一个简单的类比:若 则
特别的,我们把这个关系记作 。 仿照Lebesgue的故事,对于任意 ,定义特征函数(characteristic function)
显然Dirichlet函数 是一个Riemann不可积函数 但是对于一般的区间 而言, 是可积的,并且积分 ,其中 是区间长度。注意,为方便处理, 。
现在暂时忘了上述关于积分的定义,我将给定如下的Riemann积分的等价定义
定义阶梯函数(step function)如下: 假设 是有限个区间上特征函数的线性组合,则称s是一个阶梯函数,通过集合操作,我们总能将 转化成 个不相交区间上特征函数的线性组合,因此我们总假定 是两两无交的。同时,为使技术上方便处理,要求 的支集(support): 是有界的。所以阶梯函数又经常被等价地表述为
紧接着定义s的(定)积分是
如果是关于 的Stieljtes积分( 相当于 ),则定义
按定义,阶梯函数上的积分具有线性和单调性。
对于在闭区间 上的有界函数 ,我们当然可以取 使得支集在其上,后续不在讨论这样的技术操作,定义上下积分为
称可积指 ,且定义
注: f是有界的,所以两个inf和sup均是有限的,在Lebesgue的构造里是允许在全空间上做操作的,有兴趣可以自己阅读Royden。 注2: 因此我们经常把上面的积分记为 来指定闭区间上的Riemann-Stieljes意义积分。
按照现在的这个定义方式,可以很容易证明积分是单调、线性的。类似的可以证明单调收敛定理(MCT, Monotone Convergence Theorem),(Arzela)控制收敛定理(DCT, Dominated Convergence Theorem)和Fatou引理(Fatou's lemma)(Riemann形式的表现不是很一样,见参考7)
两种定义的联系: 由现在的定义,我们不难发现 可积当且仅当
对于Darboux和 而言,取阶梯函数 即可证明两个定义是等价的。
推论: (相对于 )可积当且仅当 是阶梯函数, ,
若上式成立,显然又有
(事实上可以推得一个更强的结论: 几乎是一个单调(适当调整)阶梯函数列的点态极限(almost everywhere with respect to lebesgue measure)) 因此我们对原来积分的一切性质均成立。
现在我们来考察换元积分的问题(闭区间 上),最简单的情况,若 ,则
利用牛顿莱布尼茨公式(注意 已经是导数,即有原函数(antiderivative)所以不需要连续性条件就可以使用该公式),对于阶梯函数
则
现在假设 是任意可积函数(with respect to ),假设 是积分逼近 的一串阶梯函数 ,则有
注意 ,对任何 都可以取合适的细分使得它包括了 的划分。并且由于 因此我们发现
同理有
因此
以上即是Radon-Nikodym定理的一个类比(analogy),即当 可导(对应绝对连续, absolutely continuous),则 integrable使得 对任意 均成立。唯一性是因为如果另外有一个 满足条件,则 。因此我们只要说明 但是这件事一般来讲较难说明,因为你只改动 的可列多(countable)的点,它仍然是可积的,并且积分不变,因此我只能给出Lebesgue意义下的相等: ,即 ,但可以认为这个相等的意义就是所有涉及积分时,用 和用 的效果是相同的,这件事已经说明了。
应用链式法则需要使用唯一性。牛顿莱布尼茨的另一形式是要求 连续,因此可以加上一个限制条件 连续,那么由导数的唯一性知连续的 是唯一的。在绝大多数求积分的情况下(包括下面的这种),这个函数都是连续的,所以即使不懂Lebesgue的那套东西,通过附加连续条件,你也可以求得链式法则里面有一个唯一的连续函数使得它成立。不附加的时候,由于带入导数的不同最终的积分还是一样的(我暂时未想到只用Riemann的定义就可以做出来的方法,这个结论在Lebesgue构造下就是显然的了),所以应用换元法也没有问题,计算出来的值都是准确的。
现在考虑两个Stieltjes积分,对应函数 ,导数的定义中,我们用函数值的变化量比上自变量的变化量,现在自变量的变化量由 来刻画,所以不难想象,我们可以定义“导数”如下(见引用12,其中有一个回答给出了一个反例,但是和我们这里没什么关联所以我不打算讨论):
上述的积分换元仅用到了牛顿莱布尼茨公式,所以我们只需要找到我们的类似定理就行(counterpart): 假设
存在,则
我们仅讨论一个特殊的情形,即 且 连续,则当 时(注意某一类换元的可逆要求),应用L'Hopital法则
我们已经证明
则
此时应用类似上面的证明可以得到
如果把 写成
可以就形式上记为 ,注意,此表示唯一的意义就是
并由此诱导
不难发现这个结果恰好就是换元的情况下如何求微分。
本来我想讨论一下关于一般情形下的情况,但是没有Lebesgue测度的情况下我发现实在难以处理(我不知道对不对,毕竟我不是很擅长分析)。毕竟这些内容到了实分析的时候就以测度做讨论了,所以就不过多讨论了,实际使用的时候,这个换元已经够了。 另外我可以给出下面这个事实: 若
则
因此我们总能把它写成 ,如果你认可唯一性(a.e. [m]),那么就可以直接把这个 定义成 。此时你可以认为是换元之后,导数存在(见参考4反函数导数的内容)。我给出了 存在的一个充分条件,一般情形下的情况太特殊了,并且也超出我的理解了,这个就不多讨论了。
我们可以对微分形式 做如下理解(总考虑定义在区间 上):
并且我们也可以推得
这个就是对 的正确解释,也是换元法的最终解释。 按此定义
结合牛顿莱布尼茨公式,可以得到不定积分的换元原理,也知道了不定积分中微分的含义。
我们甚至可以引入 ( )的含义为
例如 可导的时候
因此
若令 ,即
(注意vdu和udv的含义已定义),则
因此,按照先前讨论的 存在,则
最后讨论一下链式法则。假设 存在 则
因此在利用之前的结果 存在,且由唯一性 恰好对应导数的链式法则。这个关系被记作 ,称为微分形式不变性。 总的来说,这个关系在牛顿莱布尼茨的时代可能只是简单地用这些原则,在定义完微分等形式之后,可以进行严格证明来说明这些做法是对的,但是我们并没有给出微分形式运算的明确含义(或者说如何和积分建立起联系的),在此之前都只能说这种记法是某种定理的表示(例如换元积分、链式法则什么的),并且是对的。在建立来Stieltjes积分的意义之后这一切都迎刃而解了。这个可不仅仅是巧合,只是一般大学课程完全不教授这个运算的含义。不过类似的, 也是一套如此的形式化运算,只是那个比较好说明,Stieltjes积分相比Lebesgue积分和Radon-Nikodym导数而言已经太过时了,所以可能课程上都不提罢了。
注意,在整个过程当中,微分是由积分诱导出来的。它的意义也非常清楚,给定了一个值域上的小区间(borel set),它的原像(preimage)对应了一个小区间(measureable set)导数反映了他们俩大小的比例,因此微分是这个关系的局部线性近似,或者说导数给了一个分布。那么这个分布的累计就是积分,这也是牛顿莱布尼茨定理的内容。
对于某个数学形式,我们可以赋予它某种“哲学”解释(Boolean Algebra, Heyting Algebra, Model Theory),但是无论怎么解释,这种“形式”总是“对的”,这就要求我们对所有“哲学”进行验证,验证其中某些诸如“微元法”“宏观微观”并不足以对“所有”哲学进行验证,因此这个理解并没有揭示出真正可以这样做的那个“哲学”。正确的理解方法只能建立在上述中牛顿莱布尼茨定理,也正是这个定理把微分学(不定积分)和积分学(Riemann积分)联系起来了。而这个定理的本质是定义导数和积分的“形式”,这部分才产生了真正可以对这件事的认知。
上述的内容主要建立在一个Berkeley的Riemann积分的讲义(见5)上,其中所用的定义都是类似Lebesgue的构造方法。我没有引用一些教材或者论文中的定理而是简单在google上搜了一些,是因为这部分知识对于大多数数学家而言是“知道正确但是没(lan)必(de)要证明”,资料一方面很少,另外我也不想在知乎写成教科书那个样子面面俱到的,如果感兴趣的话题主可以读一下royden。大家不研究这个是因为有更好用的工具Lebesgue积分,这部分证明是非常严格的(我们现在也不用原始的Lebesgue的定义了,而是使用了Carathéodory的改造)。这个过程可能有不严谨的地方,但是我相信大部分结论至少在Lebesgue意义下是对的,并且这个给出了足够的motivation来说明为什么使用 当作记号。如果有错误请私信。