百科问答小站 logo
百科问答小站 font logo



不定积分中dx和定积分的含义是什么? 第1页

  

user avatar   fduxiao 网友的相关建议: 
      

贴上我在另一个问题下面的解释,所谓的 确实是有含义以及对应的计算法则的

=======================================================================

以下是原回答

=======================================================================

看不下去别的答案胡乱解释。虽然下面要说的这套东西几乎没什么地方会讲,因为整体的构造和lebesgue的完全类似。昨天刚刚考完analysis,我也照搬那套东西给你搞一个Riemann的结论,我想你最关心的是为什么可以应用微分的定义以及链式法则,就好像 有具体含义,恰好考试还考了Radon-Nikodym的链式法则,我也原样给你个Riemann的版本(微分形式)。简单来说,就是我的原答案:

d后面的那个东西是给你算stieltjes积分时算区间长度的,按lebesgue意义就是测度了。换元相当于应用了radon nikodym定理,在测度上就是radon nikodym导数

Riemann积分

我们先从定积分(Riemann)的讲起。最早牛顿研究运动和力的关系发现了导数(derivates): ,那自然有个问题,给定了初始状态,如何求解最终状态。这个直观的理解就是把时间分成很小的段,然后在这些小段上面把 或者 看作是不变的,然后一段段算出变化量再加起来就行,当小段越来越小,那误差就几乎没有,因此牛顿就给出了这样的公式: 。当然那个年代还没有所谓 语言,因此在现代数学里面,我们给了如下的定义:

  1. 对于区间 ,一个划分(partition)指一串数
  2. 对于 的给定划分 ,定义其长度(meshnorm)
  3. 对于 的给定划分 ,定义其取样划分(tagged partition) ,其中(where) 满足
  4. 对于取样划分 和 ,称 为 的加细(refinement)指 ( 比 划分得更细)且 (取值也对应在保持原有的基础上增加)

注: 一般不会特别严格地使用上述符号,例如 也可能单独指一个划分, 指其中的划分 的长度。
注2: 加细构成了一个偏序(partial order)关系

给定 是一个有界函数

  1. 对于 定义Riemann和
  2. 若下列极限(对于上述偏序中任意子线序(linear order)存在,则称 Riemann可积(integrable)

或者等价地 , ,

  1. 定义f的积分(integral)

上述定义一般难以使用,所以我们会引入下述等价表述

  1. 定义Darboux上下和(lower and upper Darboux sums)

  1. 定义Darboux上下积分

考察 ,当 的时候,对于某个 , ,总能取细分到 ,且保持引入的点是原来的值则,对于划分后的小区间而言本来下确界 是取在更长的区间上的,现在值少了(直观理解可以考察一下图像,加细会导致下确界增大),当然也就变大了,即 变大了,因此 ,因此我们可以得到下积分就是当小区间长趋向 时Darboux下和的极限(注意确界意味着有界和收敛数列,这里单调当然就是极限了)。上积分同理。即

从这里不难发现,函数可积当且仅当上下积分相同。上下积分利用确界定义,相较极限而言总是存在的,这给了我们一个判断函数可积的方法。

以上是通常大多数高等数学(calculus)或者数学分析(mathematical analysis)课本上定义的定积分,这中间总是强调 只是一个记号,但是所有人都知道它可以当微分来理解,这个理解是由于Radon-Nikodym定理造成的,我接下来通过Stieltjes积分来说明一下

Stieltjes积分

一样,先介绍背景(motivation),这次考察的是概率(Probability)和期望(Expectation)。对于抛硬币而言,连续出现 次正面的概率是 ,所以连续出现 次正面构成了一个概率空间(可测空间),当然,也可以考察这个次数的“平均值”(即期望) 。类似的,考虑如何算过马路等红灯的平均时间,假设我们红灯时间 ,绿灯时间 ,考虑一个红绿灯周期 ,先红灯再绿灯,为了计算平均等候红绿灯的时间,类似牛顿的做法,将整个区间分成 小份,每个小份上面的到达的概率都一样( ),并且等候的时间都差不多一样,于是我们让这个小份足够小,就得到了大概要等多少时间。考虑函数

反映了在 时刻到了路口等红灯的时间,则这样的一个函数就反映了“随机变量”,并且,按照上述刻画,

在这个过程中我很自然地假设我们到达路口的时间是均匀(等概率)的,但是在一般情形下,这个可能性不是均匀的。例如很多人熟悉的指数分布等。因此,我们需要刻画Riemann和中 的“可能性”大小。

设 是一函数,定义Riemann和

由此类似Riemann积分诱导出的积分称为Stieltjes积分(对应有可积),记作

在概率论里,假设 是一个分布函数(单调、非负、负无穷出极限0,正无穷出极限1), 是一随机变量(可测函数),则期望就是我们熟知的

另一个常见解释则是计算面积的时候,更改了计算长度的方法,例如沿着斜线积分,本来沿着 的长度被拉伸到斜线的线段长,因此就导致了你直觉理解时候的换元。

Radon-Nikodym定理

这里只做一个简单的类比:若 则

特别的,我们把这个关系记作 。 仿照Lebesgue的故事,对于任意 ,定义特征函数(characteristic function)

显然Dirichlet函数 是一个Riemann不可积函数 但是对于一般的区间 而言, 是可积的,并且积分 ,其中 是区间长度。注意,为方便处理, 。

现在暂时忘了上述关于积分的定义,我将给定如下的Riemann积分的等价定义

定义阶梯函数(step function)如下: 假设 是有限个区间上特征函数的线性组合,则称s是一个阶梯函数,通过集合操作,我们总能将 转化成 个不相交区间上特征函数的线性组合,因此我们总假定 是两两无交的。同时,为使技术上方便处理,要求 的支集(support): 是有界的。所以阶梯函数又经常被等价地表述为

紧接着定义s的(定)积分是

如果是关于 的Stieljtes积分( 相当于 ),则定义

按定义,阶梯函数上的积分具有线性和单调性。

对于在闭区间 上的有界函数 ,我们当然可以取 使得支集在其上,后续不在讨论这样的技术操作,定义上下积分为

称可积指 ,且定义

注: f是有界的,所以两个inf和sup均是有限的,在Lebesgue的构造里是允许在全空间上做操作的,有兴趣可以自己阅读Royden注2: 因此我们经常把上面的积分记为 来指定闭区间上的Riemann-Stieljes意义积分。

按照现在的这个定义方式,可以很容易证明积分是单调、线性的。类似的可以证明单调收敛定理(MCT, Monotone Convergence Theorem),(Arzela)控制收敛定理(DCT, Dominated Convergence Theorem)和Fatou引理(Fatou's lemma)(Riemann形式的表现不是很一样,见参考7)

两种定义的联系: 由现在的定义,我们不难发现 可积当且仅当

对于Darboux和 而言,取阶梯函数 即可证明两个定义是等价的。

推论: (相对于 )可积当且仅当 是阶梯函数, ,

若上式成立,显然又有

(事实上可以推得一个更强的结论: 几乎是一个单调(适当调整)阶梯函数列的点态极限(almost everywhere with respect to lebesgue measure)) 因此我们对原来积分的一切性质均成立。

现在我们来考察换元积分的问题(闭区间 上),最简单的情况,若 ,则

利用牛顿莱布尼茨公式(注意 已经是导数,即有原函数(antiderivative)所以不需要连续性条件就可以使用该公式),对于阶梯函数

现在假设 是任意可积函数(with respect to ),假设 是积分逼近 的一串阶梯函数 ,则有

注意 ,对任何 都可以取合适的细分使得它包括了 的划分。并且由于 因此我们发现

同理有

因此

以上即是Radon-Nikodym定理的一个类比(analogy),即当 可导(对应绝对连续, absolutely continuous),则 integrable使得 对任意 均成立。唯一性是因为如果另外有一个 满足条件,则 。因此我们只要说明 但是这件事一般来讲较难说明,因为你只改动 的可列多(countable)的点,它仍然是可积的,并且积分不变,因此我只能给出Lebesgue意义下的相等: ,即 ,但可以认为这个相等的意义就是所有涉及积分时,用 和用 的效果是相同的,这件事已经说明了。

应用链式法则需要使用唯一性。牛顿莱布尼茨的另一形式是要求 连续,因此可以加上一个限制条件 连续,那么由导数的唯一性知连续的 是唯一的。在绝大多数求积分的情况下(包括下面的这种),这个函数都是连续的,所以即使不懂Lebesgue的那套东西,通过附加连续条件,你也可以求得链式法则里面有一个唯一的连续函数使得它成立。不附加的时候,由于带入导数的不同最终的积分还是一样的(我暂时未想到只用Riemann的定义就可以做出来的方法,这个结论在Lebesgue构造下就是显然的了),所以应用换元法也没有问题,计算出来的值都是准确的。

现在考虑两个Stieltjes积分,对应函数 ,导数的定义中,我们用函数值的变化量比上自变量的变化量,现在自变量的变化量由 来刻画,所以不难想象,我们可以定义“导数”如下(见引用12,其中有一个回答给出了一个反例,但是和我们这里没什么关联所以我不打算讨论):

上述的积分换元仅用到了牛顿莱布尼茨公式,所以我们只需要找到我们的类似定理就行(counterpart): 假设

存在,则

我们仅讨论一个特殊的情形,即 且 连续,则当 时(注意某一类换元的可逆要求),应用L'Hopital法则

我们已经证明

此时应用类似上面的证明可以得到

如果把 写成

可以就形式上记为 ,注意,此表示唯一的意义就是

并由此诱导

不难发现这个结果恰好就是换元的情况下如何求微分。

本来我想讨论一下关于一般情形下的情况,但是没有Lebesgue测度的情况下我发现实在难以处理(我不知道对不对,毕竟我不是很擅长分析)。毕竟这些内容到了实分析的时候就以测度做讨论了,所以就不过多讨论了,实际使用的时候,这个换元已经够了。 另外我可以给出下面这个事实: 若

因此我们总能把它写成 ,如果你认可唯一性(a.e. [m]),那么就可以直接把这个 定义成 。此时你可以认为是换元之后,导数存在(见参考4反函数导数的内容)。我给出了 存在的一个充分条件,一般情形下的情况太特殊了,并且也超出我的理解了,这个就不多讨论了。

总结

我们可以对微分形式 做如下理解(总考虑定义在区间 上):

并且我们也可以推得

这个就是对 的正确解释,也是换元法的最终解释。 按此定义

结合牛顿莱布尼茨公式,可以得到不定积分的换元原理,也知道了不定积分中微分的含义。

我们甚至可以引入 ( )的含义为

例如 可导的时候

因此

若令 ,即

(注意vdu和udv的含义已定义),则

因此,按照先前讨论的 存在,则

最后讨论一下链式法则。假设 存在 则

因此在利用之前的结果 存在,且由唯一性 恰好对应导数的链式法则。这个关系被记作 ,称为微分形式不变性。 总的来说,这个关系在牛顿莱布尼茨的时代可能只是简单地用这些原则,在定义完微分等形式之后,可以进行严格证明来说明这些做法是对的,但是我们并没有给出微分形式运算的明确含义(或者说如何和积分建立起联系的),在此之前都只能说这种记法是某种定理的表示(例如换元积分、链式法则什么的),并且是对的。在建立来Stieltjes积分的意义之后这一切都迎刃而解了。这个可不仅仅是巧合,只是一般大学课程完全不教授这个运算的含义。不过类似的, 也是一套如此的形式化运算,只是那个比较好说明,Stieltjes积分相比Lebesgue积分和Radon-Nikodym导数而言已经太过时了,所以可能课程上都不提罢了。

注意,在整个过程当中,微分是由积分诱导出来的。它的意义也非常清楚,给定了一个值域上的小区间(borel set),它的原像(preimage)对应了一个小区间(measureable set)导数反映了他们俩大小的比例,因此微分是这个关系的局部线性近似,或者说导数给了一个分布。那么这个分布的累计就是积分,这也是牛顿莱布尼茨定理的内容。

后记

对于某个数学形式,我们可以赋予它某种“哲学”解释(Boolean Algebra, Heyting Algebra, Model Theory),但是无论怎么解释,这种“形式”总是“对的”,这就要求我们对所有“哲学”进行验证,验证其中某些诸如“微元法”“宏观微观”并不足以对“所有”哲学进行验证,因此这个理解并没有揭示出真正可以这样做的那个“哲学”。正确的理解方法只能建立在上述中牛顿莱布尼茨定理,也正是这个定理把微分学(不定积分)和积分学(Riemann积分)联系起来了。而这个定理的本质是定义导数和积分的“形式”,这部分才产生了真正可以对这件事的认知。

参考资料

上述的内容主要建立在一个Berkeley的Riemann积分的讲义(见5)上,其中所用的定义都是类似Lebesgue的构造方法。我没有引用一些教材或者论文中的定理而是简单在google上搜了一些,是因为这部分知识对于大多数数学家而言是“知道正确但是没(lan)必(de)要证明”,资料一方面很少,另外我也不想在知乎写成教科书那个样子面面俱到的,如果感兴趣的话题主可以读一下royden。大家不研究这个是因为有更好用的工具Lebesgue积分,这部分证明是非常严格的(我们现在也不用原始的Lebesgue的定义了,而是使用了Carathéodory的改造)。这个过程可能有不严谨的地方,但是我相信大部分结论至少在Lebesgue意义下是对的,并且这个给出了足够的motivation来说明为什么使用 当作记号。如果有错误请私信。

  1. tex.stackexchange.com/q
  2. Riemann积分
  3. Stieltjes积分
  4. 数学分析 陈纪修,於崇华,金路 (陈爷爷最后一节课是我这一届学生上的)
  5. math.berkeley.edu/~ilio
  6. Real and Complex Analysis Rudin
  7. Real Analysis Royden
  8. sites.math.washington.edu
  9. math.stackexchange.com/
  10. researchgate.net/public
  11. math.stackexchange.com/
  12. mathoverflow.net/questi
  13. en.wikipedia.org/wiki/T



  

相关话题

  Γ(x+1)在x=0处如何泰勒展开? 
  三角函数存在的意义是什么? 
  一个空间中勾股定理不存在,而变成了 c^4=a^4+b^4,甚至有更高的指数,那么这是一种什么空间? 
  为什么会对微积分有种「这个思路不是严格推导出来的,而有一点人为规定的成分」的感觉? 
  为什么没有开区间上的 R 正常定积分的定义;开区间勒贝格可积,再加什么特殊条件,可得到开区间黎曼可积? 
  为什么要引入弧度制? 
  这两个积分怎么做? 
  (lnx)'=1/x,为什么 (ln3)'≠1/3? 
  标记 n 维空间中任意一个点/向量一定要用 n 个坐标吗? 
  如何用多种方法(几何解释除外)来证明此不等式? 

前一个讨论
为什么有理数是不完备的?
下一个讨论
有没有一种行之有效的方法可以将一种函数展开成另外一种函数的级数?





© 2024-11-22 - tinynew.org. All Rights Reserved.
© 2024-11-22 - tinynew.org. 保留所有权利