百科问答小站 logo
百科问答小站 font logo



有哪些数学教材是你深恶痛绝、绝不推荐的? 第1页

  

user avatar   zhang-xiao-yu-66-10 网友的相关建议: 
      

作为学渣,我是工作好久以后才把微积分和线代真正整明白的。

按照我的想法,工科数学入门书,就应该把微积分和线代一块写了。上来先讲清楚矩阵的几何意义,指明矩阵每一列都是变换过的基向量。再从导数定义出发,阐明导数不仅是斜率,而且还是是线性变换。这样把偏微分当基向量,利用矩阵的几何直观,直接写出雅克比矩阵。

然后回过头讲行列式几何上是空间缩放倍率,再用雅克比行列式推导微分变换和微元缩放之类。这样才算真正搞清楚微分,之后积分就很简单,就是举例子,什么曲线曲面标量场向量场都来一遍。接着趁热打铁,讲场的梯度散度旋度,完了顺手列出电磁场方程,然后开始讲微分方程。

直接点出微分算子也是线性变换,再阐明矩阵的特征向量和特征值的几何意义:“旋转轴”和轴上的缩放。从而揭示解微分方程的几何意义,再对微分方程做适度展开,推导出电磁场方程的解。

然后再接再厉,借着微分算子是线性变换的概念,把函数就是向量这一点讲讲,从而引入希尔伯特空间。接着先讲施密特正交化从三维到n维的推广,然后讲定义内积就是定义空间,最后利用正交化构造各种各样的正交基函数,比如傅里叶啊勒让德啊,以这些工科数学工具收尾。

这样用线性变换一条线就穿起工科数学了,而且全程强调了几何意义。数学书为啥不能这么写,哎。


这么个小众问题下居然还有几百赞。看来我等工科生苦数学久矣。我打算写写雅克比矩阵的几何直观,能力非常有限保证不了严密性,就是走马观花、到此一游的性质。不知道有没有人看?

1 特征向量和行列式的直观

既然是走马观花,首先要骑个马吧。这马就是矩阵的直观。熟悉的同学可以跳过。

当有人说:“一个矩阵 把向量 变换成向量 ”,他到底在说什么?

最简单的解释就是线性组合,即用a缩放列向量 ,用b缩放另一个列向量 ,然后加起来:

然而,想真正“直观的”理解这个做法,其实还要绕个弯,因为这里隐含了一些预设信息。

首先,矩阵M之所以能被写出来,是因为M的列向量 和 都具有“意义”——它俩都是定义在某个“绝对空间”或说“父空间”里的实实在在的向量。

这里提到的“绝对空间”“相对空间”很不科学,只是方便指称。

能把矩阵写出来这件事本身就隐含着,存在某个 的“绝对空间”。那么很自然的,此“绝对空间”也有两个基向量。但这俩基向量具体是什么我们故意不去关心,只记为 。

矩阵是个“操作”,这里说的“隐含的绝对空间”其实就是矩阵要操作的对象。正是因为不关心隐含的绝对空间到底是什么,矩阵才成为一种通用的操作。类似于, 是具体计算,但从中可以抽象一个称为 的通用操作,它并不关心到底对谁x2。再规定被操作的对象写在右边,这样就有 ,或者 。而且多个操作还能合并运算,例如: 。相比之下,矩阵作为操作的特点在于不同的合并顺序结果不同。

然后,在向量 张成的“绝对空间”里,数字对 通过线性组合肯定可以确定一个向量 : 。

而在向量 和 张成的“矩阵空间”里,同样的数字对 通过线性组合肯定可以确定另一个向量: 。

注意上面的 有两种表示,这其实意味着两个事实。

第一个事实, 和 是存在于同一个“绝对空间”的,完全不同的两个向量。这当然是对的,两者都是对基 的线性组合,这也是 具有“意义”的基础。这时候矩阵就是所谓线性变换,把向量 “线性”的变成了向量 。

第二个事实, 还生活在向量 和 张成的“矩阵空间”或说“相对空间”里。在这个空间里, 的表示是 。这也是对的,而且这也是线性组合的精髓所在(即,不太关心基到底是啥)。这时候矩阵就是所谓基变换。基变换相当于问,如果在“矩阵空间”里有个向量 ,那么它在“绝对空间”的表示是什么?

从这两个事实出发,由于 是任意取值的,可以代表空间里所有的点,因而直观上不难认同:矩阵M是个映射,它把某个“绝对空间”里的每个向量 ,都映射成另一个“矩阵空间”里的向量 。

考虑到矩阵M只是由几个基向量(坐标轴)组成的,上面这句话其实是个很强大的结论:只要找到了两个空间的“坐标轴”或说“标架”的关系,就相当于找到了两个空间中一切向量的关系。

而两个空间的“标架的关系”到底是什么?其实就是矩阵自己:矩阵的每个列向量,都是矩阵所张成的“相对空间”标架的基向量在绝对空间的表示。

也就是说,把“相对空间”标架的每个基向量并排写出,就是矩阵了。

只要理解了这一点,二维平面空间的旋转:

其矩阵就可以直接写出来: 。第一列就是标架{1}的基向量 逆时针转过 的样子,第二列就是标架{1}的另一个基向量 逆时针转过 的样子。如果假设黄色向量 在标架{2}的坐标是 ,那么 在标架{1}的坐标自然就是 对标架{2}的基的线性组合:

另一种解读是,标架{1}中存在一个(未画出的) ,被矩阵旋转成了同个标架下的

同样的道理,三维空间中,绕z轴旋转 角度的旋转矩阵也可以直接写出来:

这是因为x轴和y轴的旋转跟二维情况是一样的,而z轴作为旋转轴本身不变。

对于这个旋转矩阵,考虑和旋转轴z轴重合的任一向量 ,可以发现一个很平凡的现象:

也就是和z轴(旋转轴)重合的所有向量 都满足 。

说人话就是,z轴方向的一切向量被矩阵施加了“绕z轴旋转的操作”以后方向不变。这几乎是废话,但也给出了关于“旋转轴”的直观理解:如果空间里存在某个方向能够在矩阵操作下保持不变,那这个方向就可称为矩阵的旋转轴。

矩阵的特征向量 和特征值 的定义就是:满足等式 的向量 和标量 。

说人话就是,在矩阵 对空间进行了旋转、缩放操作后,有可能存在一个或多个方向保持不变的旋转轴(特征向量) 。另外,由于矩阵的基是可以“随便写”的,矩阵完全可以产生各种不规则的缩放,这导致旋转轴上的向量虽然能够保持方向不变,但大小却会缩放,这个缩放的倍率就是特征值。

对于“特征向量/特征值”里的“特征”的理解:随便写个矩阵 ,那么它就应该有个特征向量 (旋转轴),除非它没有……

因为随手写的矩阵,似乎不一定会有“旋转轴”,具体判断方法我不懂。但是就算有,找起来也挺麻烦的。

关于找“旋转轴”的难度可以举个例子。我们已经写出了绕z轴旋转某个角度的矩阵 。同样的道理,可以写出绕x轴旋转某个角度的矩阵 ,绕y轴旋转的矩阵 。那么如果耐心的话,三个矩阵合体后的矩阵 也能写出来。问题来了,这个合体矩阵 的旋转轴存在吗,是啥?
这其实是个转换四元数的问题,超纲了,不展开。

下面会看到,微分算符 可以看成是从函数 映射到(导)函数 的“矩阵”,这就是微分方程的通用形式:

和矩阵的特征向量形式:

长得一模一样的原因——对微分方程 寻找解 的过程,就是找微分算符的“旋转轴”。

为啥微分方程不好解呢,因为旋转轴不好找……

除了特征向量之外,矩阵的第二个“固有特性”也很直观:矩阵的所有基向量(列向量)张成的那个几何体的“泛体积”。只有2个基的矩阵张成的就是平行四边形的面积,多于3个基的矩阵张成的就是高维“超体积”。

这里的“体积”和日常谈论的体积有个细微但关键的差别——“单位”。当我们说一个集装箱的容量是若干个立方米时,隐含约定是:三个维度上的“测量单位”或者说三个基的长度都是1m。但线性组合的精髓是:对基的要求非常宽容。甚至不要求基有真正可测量的长度。而且就算基有长度,各个基的“长度”也不一定相等。所以这里的“体积”准确说,是对各个基向量的“缩放倍率”构成的“倍率几何体”的体积。

当矩阵是方阵时,各个基向量张成的几何体的“体积”就称为行列式(把determinant翻成这样也是人才)。

如果把3x3矩阵 写为 ,其行列式的计算公式等价于 。这个式子先叉积就是求底面积,再点积就是乘以高,此处不展开了,总之这就是在计算基向量 所张成的平行四面体的体积。

例如前面提到的绕z轴旋转的矩阵:

因为 ,所以它前两个列向量的长度都是1,第三个列向量长度也是1,而且三个列向量彼此正交(点积为0),那么此矩阵的3个基向量就构成了一个边长为1的立方体,体积或说行列式就是1。

有了行列式的几何直观,这个 是可以直接看出来的,都不用算。

而且不光是绕z轴旋转的 ,把任意个旋转操作叠加起来,得到的还是旋转操作,典型代表是:

贴一张wiki的图吧:

所有这样靠旋转得到的矩阵,它们的“体积”或说行列式肯定都是1,都不用算。这样的全部矩阵的集合就被称为:3维特殊正交群Special Orthogonal Group(3),简称SO(3)。所谓特殊,其实就是说这类矩阵不改变体积。

而在改变体积的矩阵里,有一类直接把体积变成0,这样的矩阵虽然“生活”在n维里,却张不成n维体积。所谓行列式为0的矩阵不可逆,其实就是说这些张不出n维体积的虚假的n维矩阵,会把n维空间降为小于n维的空间。被这样的矩阵操作的向量至少会失去一个维度的信息,于是这个向量就不回去了。具体失去几个维度还可以分类,比如可以把立方体拍扁成面,也可以直接浓缩成线……

另外,行列式虽然要求矩阵必须是方阵,并不意味着非方矩阵的基向量就不配张成几何体了。而是说行列式这个概念它比较高冷,它只关心矩阵所生存的那个空间的最高维度N的体积,即N维体积。非方阵如果能张成N-m维的“泛面积”,那么这些面积也会有点用处的。

例如,当矩阵为非方阵时,考虑3x2矩阵 ,由 (就是a、b是三维向量的意思)组成 。 显然是张不出来 体积的,因而没有行列式。但 可以在三维空间里张成一个二维的平行四边形,它有面积,不至于完全没用。如果观察这个矩阵的效果: ,它把二维向量变成了三维向量,似乎是“升维”的。虽然升完以后还是在三维空间里的二维平面上。

另一方面,给这个3x2矩阵补上一列0向量, ,这三列还是张不出体积,行列式依然为0,于是它似乎又变成“降维”的了:把三位向量投影到二维平面上。

根本原因还在于 描述了三维空间里的一组二维平面。

好的,准备过程到此结束。矩阵的特征向量和行列式就好比人的身高和体重,一旦直观上认识了这两个特性,应该就能“走马观花”了。

下面终于进入正题,多元函数的微分到底怎么理解。

(待续...

2 多元函数的雅克比矩阵

考虑最简单的多元函数 ,忽略连续可微这些细节。

在 点处,沿着x方向的偏导数可以通过固定 求得,

记作:

相当于用 点的x-z平面: 去“切片” ,平面上留下的就是 ,从而可求 在 处的切线斜率,就是 。这属于基础知识不展开了。

现在问题是,如果站在 点,向x方向走一个单位长度,即 ,那么x-z平面的这条切线上升了多少?

由于切线斜率就是 ,那么如果x增加1,切线就上升 。

此时在切线上增加的这一段(注意并不是函数值增加,这时候完全不考虑函数值变化),用向量描述就是

之所以切线能用向量描述,是因为形如 这样的函数,也就是 的映射,总归能看成 的映射,只要给 的每个 值配上 和 ,差不多就变成 了。前者表示二维平面上的标量场,后者表示三维空间中的曲面,这两个其实就是一回事。 既然是三维空间里的曲面,那它的切线当然能用三维向量描述了。

收一收思路。上面的讨论说明,沿着x方向求偏导,其实给出了这样一个基向量到“切线上向量”的对应关系:

同样的,y方向的偏导也有:

根据前面讲的矩阵直观,这是什么?这不就是矩阵的两个基嘛!直接写出雅克比矩阵:

显然,如果站在函数定义域,也就是xy平面上的某个p点,向任意方向走个二维向量 ,那么 就给出了切平面上对应的向量。

实际上雅克比矩阵 本身就是切平面。更无畏的说, 就是多元函数真正的导数

有了雅克比矩阵,这时候就可以讨论微元变换了。

例如求曲面 在某个范围内的面积分。这里面的关键环节就是,在定义域xy平面里那个微元小方块 的面积,被雅克比矩阵变换到切平面后的缩放倍率 到底是啥?

毕竟有了 才能写出积分式

根据前面讨论过得矩阵的直观,这个问题就等价于求雅克比矩阵的各个基张成的那个几何体的“泛体积”(面积,体积,高维体积)。

当 是方阵时, 自然是行列式。

当不是方阵时,比如一直讨论的这个:

这个3x2矩阵的列向量张成的平行四边形的面积,就是缩放倍率 ,也就是 的两个列向量的叉乘(的大小)。

首先叉乘:

再计算叉乘结果的大小:

从而得到第一类曲面积分的通式:

类似的,所有涉及微元变换的都能这么干。比如曲线曲面积分,球坐标转换之类的,就不展开了。


额外提个问题,为什么一元函数导数的值是个数字,多元函数导数的值就是个矩阵了呢?其实是一元下把向量省略成数字了。仿照上面的思路,可以写出一元情况下雅克比矩阵: ,这就是切线向量。但是一元下不说 是导数,而说 的y分量 才是导数。而且给定x方向的微小变化 ,虽然直接引起了切线上的变化(微分): ,但一元下却规定这个变化的y方向的分量 才是微分。

这肯定有历史原因或其他考量,但这种规定在多元时的不协调就造成多元情况下的理解困难。特别是工科微积分普遍不讲雅克比矩阵的几何含义,就使得多元情况更加模糊。

如果我们私下里把一元的切线方向看成导数( 对应的把切线方向的一段变化的向量 看成微分),那么在二元下说切平面是导数,以及 是微分就很自然了。而且在更多元的情形下,虽然不好再说“切体”和“N维超切体”之类过于中二的词汇,但至少可以明确导数就是雅克比矩阵描述的那个N维的线性变换。


3 从雅克比矩阵导出梯度

回到雅克比矩阵本身。 的这个雅克比矩阵:

实际上把 点的定义域平面,也就是xy平面,线性映射到了 点对应的切平面上。

所谓“从平面线性映射到平面”,意思就是,站在 xy平面 的 点上朝着任意方向走一步,所得的那个二维向量 ,总是能在切平面上找到对应的三维切向量 。

这个切向量 的斜率,其实就是方向导数

那么从 点出发的所有向量里,一定有个特殊的二维向量 (称为梯度),它恰好能对应到切平面上斜率(方向导数)最大的那个三维切向量

的特殊性来自于方向,或说角度,因而可设为 ,则对应的 就是:

由向量的斜率 ,那么 的斜率就是:

把等号右边看成是向量点积:

显然只有在 和 重合时点积才最大,从而斜率最大。

既然如此,又考虑到 只在乎方向,可以直接取 ,就能使 的斜率最大。

前面说了,这个 就是梯度,记作 :

而且,一旦梯度这么简单粗暴的取值了, 就是 ,它的最大斜率就是:

这就是梯度方向最大的导数(斜率)的真正来源。这个斜率值只是“恰好”等于梯度向量的模长而已。或者说,是我们在最大斜率方向上挑选了模长恰好是斜率的向量,定义为梯度。

然而我看过的微积分书里,关于梯度的逻辑链条是很无语的。
先给出方向导数的极限定义,附带几个用极限定义求方向导数的例子。(先给定义,嗯,严谨!)
接着直接定义梯度!说梯度方向的导数最大,而且最大值是 !(开始懵了,为啥梯度这么定义,为啥梯度的模就是最大方向导数?)
最后说,方向导数的方向和梯度点积一下就是方向导数值,完了附送一堆例题。(上当了,原来极限定义就是逗我玩的?原来我只需要死记梯度定义,死记点积就行了么?果然工科生不配理解这些啊!)

好了收一收。现在从梯度里抽象出Nabla算子 :

所谓算子,简单理解就是函数的函数,吃掉一个函数,吐出另一个函数。

注意微分算子 是向量形式,事情开始复杂了。

注意标量和向量之间的三种运算:

  1. 标量(数乘)向量=向量,相当于把1维的标量“升维”到多维的向量。
  2. 向量(点乘)向量=标量,相当于把多维的向量“降维”到1维的标量。
  3. 向量(叉乘)向量=向量,相当于……勉强相当于计算法向量吧。

考虑到函数可分为标量场函数 和m维向量场函数

那么 算子作为“形式向量”,和这两类函数之间也存在三种运算:

  1. ,即 ,标量场函数 数乘m维算子
  2. ,即 ,m维向量场函数 点乘m维算子
  3. ,即 ,m维向量场函数 叉乘m维算子

微分算子的这三种运算得的分别就是梯度场函数,散度场函数,和旋度场函数。

再往下写应该也没人看了,打住。

wtf,公式显示抽风了……


user avatar    网友的相关建议: 
      

吉米多维奇

大一听系里讲座,某个曾在耶鲁大学CS读Ph.D老师[1]讲自己当年大一微积分第一次考试的故事,好像是自我感觉不错但是老师给了低分,然后把一套叫《吉米多维奇》的书刷了一遍,之后就考得不错,后来去耶鲁前又刷了一遍。听的我们面面相觑,因为大概是期中考试附近,这个题外话让人印象深刻。

讲座后我们宿舍四人各买了一套《吉米多维奇》,每人六本,在书架上整整齐齐的放着,像是一个收藏品。一直到微积分(上)(下)都学完了,也没人有空去刷……该90+的还是90+,该60+的还是60+,后来基本都送学弟或者放二手书店了。

我可能在某年寒假拉回家了,一直就在书柜上落灰……

所以这个配色真的看吐了,一想到一题没碰我就羞愧难当以及心疼买书的钱。

所以好好把课后作业做完就行了,对大部分人来说这书真的不用买。

参考

  1. ^Yitong Yin http://tcs.nju.edu.cn/yinyt/

user avatar   imathok 网友的相关建议: 
      

谢邀。

如果非得推荐一本,唐忠明的《抽象代数基础》。写得很薄,但没啥意思。

例子少,无趣味,深度也不行(虽然说了是基础)。被国外同行吊打。

或者他可以参考李尚志对于中学生的一些科普工作。哈哈。用他教材的学生学得不好,这本教材绝对有责任。




  

相关话题

  数学专业是不是真的又难又脱离实际找不到工作啊⊙_⊙? 
  高中数学和大学数学有什么差异? 
  为什么数学中“有且仅有”不可以说成“仅有”? 
  想问问数学大神们几个问题,学习数学的兴趣来源是什么?数学在生活中的具体应用? 
  高中数学和大学数学有什么差异? 
  学习数学真的需要天赋吗? 
  这个数学问题,大家可以指点一下吗? 
  数学是从什么时候开始反直觉的? 
  华威数学系在国内的认可度高么? 
  五年级孩子过于喜欢数学怎么办? 

前一个讨论
和一个真的很好的人分开你会后悔吗?
下一个讨论
想买两套桑蚕丝的四件套,如何辨别真假?





© 2024-12-18 - tinynew.org. All Rights Reserved.
© 2024-12-18 - tinynew.org. 保留所有权利