有哪些数学教材是你深恶痛绝、绝不推荐的？第1页

zhang-xiao-yu-66-10 网友的相关建议:

作为学渣，我是工作好久以后才把微积分和线代真正整明白的。

按照我的想法，工科数学入门书，就应该把微积分和线代一块写了。上来先讲清楚矩阵的几何意义，指明矩阵每一列都是变换过的基向量。再从导数定义出发，阐明导数不仅是斜率，而且还是是线性变换。这样把偏微分当基向量，利用矩阵的几何直观，直接写出雅克比矩阵。

然后回过头讲行列式几何上是空间缩放倍率，再用雅克比行列式推导微分变换和微元缩放之类。这样才算真正搞清楚微分，之后积分就很简单，就是举例子，什么曲线曲面标量场向量场都来一遍。接着趁热打铁，讲场的梯度散度旋度，完了顺手列出电磁场方程，然后开始讲微分方程。

直接点出微分算子也是线性变换，再阐明矩阵的特征向量和特征值的几何意义:“旋转轴”和轴上的缩放。从而揭示解微分方程的几何意义，再对微分方程做适度展开，推导出电磁场方程的解。

然后再接再厉，借着微分算子是线性变换的概念，把函数就是向量这一点讲讲，从而引入希尔伯特空间。接着先讲施密特正交化从三维到n维的推广，然后讲定义内积就是定义空间，最后利用正交化构造各种各样的正交基函数，比如傅里叶啊勒让德啊，以这些工科数学工具收尾。

这样用线性变换一条线就穿起工科数学了，而且全程强调了几何意义。数学书为啥不能这么写，哎。

这么个小众问题下居然还有几百赞。看来我等工科生苦数学久矣。我打算写写雅克比矩阵的几何直观，能力非常有限保证不了严密性，就是走马观花、到此一游的性质。不知道有没有人看？

1 特征向量和行列式的直观

既然是走马观花，首先要骑个马吧。这马就是矩阵的直观。熟悉的同学可以跳过。

当有人说：“一个矩阵把向量变换成向量 ”，他到底在说什么？

最简单的解释就是线性组合，即用a缩放列向量，用b缩放另一个列向量，然后加起来：

然而，想真正“直观的”理解这个做法，其实还要绕个弯，因为这里隐含了一些预设信息。

首先，矩阵M之所以能被写出来，是因为M的列向量和都具有“意义”——它俩都是定义在某个“绝对空间”或说“父空间”里的实实在在的向量。

这里提到的“绝对空间”“相对空间”很不科学，只是方便指称。

能把矩阵写出来这件事本身就隐含着，存在某个的“绝对空间”。那么很自然的，此“绝对空间”也有两个基向量。但这俩基向量具体是什么我们故意不去关心，只记为。

矩阵是个“操作”，这里说的“隐含的绝对空间”其实就是矩阵要操作的对象。正是因为不关心隐含的绝对空间到底是什么，矩阵才成为一种通用的操作。类似于，是具体计算，但从中可以抽象一个称为的通用操作，它并不关心到底对谁x2。再规定被操作的对象写在右边，这样就有，或者。而且多个操作还能合并运算，例如：。相比之下，矩阵作为操作的特点在于不同的合并顺序结果不同。

然后，在向量张成的“绝对空间”里，数字对通过线性组合肯定可以确定一个向量 : 。

而在向量和张成的“矩阵空间”里，同样的数字对通过线性组合肯定可以确定另一个向量：。

注意上面的有两种表示，这其实意味着两个事实。

第一个事实，和是存在于同一个“绝对空间”的，完全不同的两个向量。这当然是对的，两者都是对基的线性组合，这也是具有“意义”的基础。这时候矩阵就是所谓线性变换，把向量 “线性”的变成了向量。

第二个事实，还生活在向量和张成的“矩阵空间”或说“相对空间”里。在这个空间里，的表示是。这也是对的，而且这也是线性组合的精髓所在（即，不太关心基到底是啥）。这时候矩阵就是所谓基变换。基变换相当于问，如果在“矩阵空间”里有个向量，那么它在“绝对空间”的表示是什么？

从这两个事实出发，由于是任意取值的，可以代表空间里所有的点，因而直观上不难认同：矩阵M是个映射，它把某个“绝对空间”里的每个向量，都映射成另一个“矩阵空间”里的向量。

考虑到矩阵M只是由几个基向量(坐标轴)组成的，上面这句话其实是个很强大的结论：只要找到了两个空间的“坐标轴”或说“标架”的关系，就相当于找到了两个空间中一切向量的关系。

而两个空间的“标架的关系”到底是什么？其实就是矩阵自己：矩阵的每个列向量，都是矩阵所张成的“相对空间”标架的基向量在绝对空间的表示。

也就是说，把“相对空间”标架的每个基向量并排写出，就是矩阵了。

只要理解了这一点，二维平面空间的旋转：

其矩阵就可以直接写出来：。第一列就是标架{1}的基向量逆时针转过的样子，第二列就是标架{1}的另一个基向量逆时针转过的样子。如果假设黄色向量在标架{2}的坐标是，那么在标架{1}的坐标自然就是对标架{2}的基的线性组合：

另一种解读是，标架{1}中存在一个(未画出的) ，被矩阵旋转成了同个标架下的

同样的道理，三维空间中，绕z轴旋转角度的旋转矩阵也可以直接写出来：

这是因为x轴和y轴的旋转跟二维情况是一样的，而z轴作为旋转轴本身不变。

对于这个旋转矩阵，考虑和旋转轴z轴重合的任一向量，可以发现一个很平凡的现象：

也就是和z轴(旋转轴)重合的所有向量都满足。

说人话就是，z轴方向的一切向量被矩阵施加了“绕z轴旋转的操作”以后方向不变。这几乎是废话，但也给出了关于“旋转轴”的直观理解：如果空间里存在某个方向能够在矩阵操作下保持不变，那这个方向就可称为矩阵的旋转轴。

矩阵的特征向量 和特征值 的定义就是：满足等式的向量和标量。

说人话就是，在矩阵对空间进行了旋转、缩放操作后，有可能存在一个或多个方向保持不变的旋转轴(特征向量) 。另外，由于矩阵的基是可以“随便写”的，矩阵完全可以产生各种不规则的缩放，这导致旋转轴上的向量虽然能够保持方向不变，但大小却会缩放，这个缩放的倍率就是特征值。

对于“特征向量/特征值”里的“特征”的理解：随便写个矩阵，那么它就应该有个特征向量 (旋转轴)，除非它没有……

因为随手写的矩阵，似乎不一定会有“旋转轴”，具体判断方法我不懂。但是就算有，找起来也挺麻烦的。

关于找“旋转轴”的难度可以举个例子。我们已经写出了绕z轴旋转某个角度的矩阵。同样的道理，可以写出绕x轴旋转某个角度的矩阵，绕y轴旋转的矩阵。那么如果耐心的话，三个矩阵合体后的矩阵也能写出来。问题来了，这个合体矩阵的旋转轴存在吗，是啥？
这其实是个转换四元数的问题，超纲了，不展开。

下面会看到，微分算符可以看成是从函数映射到(导)函数的“矩阵”，这就是微分方程的通用形式：

和矩阵的特征向量形式：

长得一模一样的原因——对微分方程寻找解的过程，就是找微分算符的“旋转轴”。

为啥微分方程不好解呢，因为旋转轴不好找……

除了特征向量之外，矩阵的第二个“固有特性”也很直观：矩阵的所有基向量(列向量)张成的那个几何体的“泛体积”。只有2个基的矩阵张成的就是平行四边形的面积，多于3个基的矩阵张成的就是高维“超体积”。

这里的“体积”和日常谈论的体积有个细微但关键的差别——“单位”。当我们说一个集装箱的容量是若干个立方米时，隐含约定是：三个维度上的“测量单位”或者说三个基的长度都是1m。但线性组合的精髓是：对基的要求非常宽容。甚至不要求基有真正可测量的长度。而且就算基有长度，各个基的“长度”也不一定相等。所以这里的“体积”准确说，是对各个基向量的“缩放倍率”构成的“倍率几何体”的体积。

当矩阵是方阵时，各个基向量张成的几何体的“体积”就称为行列式(把determinant翻成这样也是人才)。

如果把3x3矩阵写为，其行列式的计算公式等价于。这个式子先叉积就是求底面积，再点积就是乘以高，此处不展开了，总之这就是在计算基向量所张成的平行四面体的体积。

例如前面提到的绕z轴旋转的矩阵：

因为，所以它前两个列向量的长度都是1，第三个列向量长度也是1，而且三个列向量彼此正交(点积为0)，那么此矩阵的3个基向量就构成了一个边长为1的立方体，体积或说行列式就是1。

有了行列式的几何直观，这个是可以直接看出来的，都不用算。

而且不光是绕z轴旋转的，把任意个旋转操作叠加起来，得到的还是旋转操作，典型代表是：

贴一张wiki的图吧：

所有这样靠旋转得到的矩阵，它们的“体积”或说行列式肯定都是1，都不用算。这样的全部矩阵的集合就被称为：3维特殊正交群Special Orthogonal Group(3)，简称SO(3)。所谓特殊，其实就是说这类矩阵不改变体积。

而在改变体积的矩阵里，有一类直接把体积变成0，这样的矩阵虽然“生活”在n维里，却张不成n维体积。所谓行列式为0的矩阵不可逆，其实就是说这些张不出n维体积的虚假的n维矩阵，会把n维空间降为小于n维的空间。被这样的矩阵操作的向量至少会失去一个维度的信息，于是这个向量就不回去了。具体失去几个维度还可以分类，比如可以把立方体拍扁成面，也可以直接浓缩成线……

另外，行列式虽然要求矩阵必须是方阵，并不意味着非方矩阵的基向量就不配张成几何体了。而是说行列式这个概念它比较高冷，它只关心矩阵所生存的那个空间的最高维度N的体积，即N维体积。非方阵如果能张成N-m维的“泛面积”，那么这些面积也会有点用处的。

例如，当矩阵为非方阵时，考虑3x2矩阵，由 (就是a、b是三维向量的意思)组成。显然是张不出来体积的，因而没有行列式。但可以在三维空间里张成一个二维的平行四边形，它有面积，不至于完全没用。如果观察这个矩阵的效果：，它把二维向量变成了三维向量，似乎是“升维”的。虽然升完以后还是在三维空间里的二维平面上。

另一方面，给这个3x2矩阵补上一列0向量，，这三列还是张不出体积，行列式依然为0，于是它似乎又变成“降维”的了：把三位向量投影到二维平面上。

根本原因还在于描述了三维空间里的一组二维平面。

好的，准备过程到此结束。矩阵的特征向量和行列式就好比人的身高和体重，一旦直观上认识了这两个特性，应该就能“走马观花”了。

下面终于进入正题，多元函数的微分到底怎么理解。

（待续...

2 多元函数的雅克比矩阵

考虑最简单的多元函数，忽略连续可微这些细节。

在点处，沿着x方向的偏导数可以通过固定求得，

记作：

相当于用点的x-z平面: 去“切片” ，平面上留下的就是，从而可求在处的切线斜率，就是。这属于基础知识不展开了。

现在问题是，如果站在点，向x方向走一个单位长度，即，那么x-z平面的这条切线上升了多少？

由于切线斜率就是，那么如果x增加1，切线就上升。

此时在切线上增加的这一段(注意并不是函数值增加，这时候完全不考虑函数值变化)，用向量描述就是

之所以切线能用向量描述，是因为形如这样的函数，也就是的映射，总归能看成的映射，只要给的每个值配上和，差不多就变成了。前者表示二维平面上的标量场，后者表示三维空间中的曲面，这两个其实就是一回事。既然是三维空间里的曲面，那它的切线当然能用三维向量描述了。

收一收思路。上面的讨论说明，沿着x方向求偏导，其实给出了这样一个基向量到“切线上向量”的对应关系：

同样的，y方向的偏导也有：

根据前面讲的矩阵直观，这是什么？这不就是矩阵的两个基嘛！直接写出雅克比矩阵：

显然，如果站在函数定义域，也就是xy平面上的某个p点，向任意方向走个二维向量，那么就给出了切平面上对应的向量。

实际上雅克比矩阵本身就是切平面。更无畏的说，就是多元函数真正的导数。

有了雅克比矩阵，这时候就可以讨论微元变换了。

例如求曲面在某个范围内的面积分。这里面的关键环节就是，在定义域xy平面里那个微元小方块的面积，被雅克比矩阵变换到切平面后的缩放倍率 到底是啥？

毕竟有了才能写出积分式

根据前面讨论过得矩阵的直观，这个问题就等价于求雅克比矩阵的各个基张成的那个几何体的“泛体积”(面积，体积，高维体积)。

当是方阵时，自然是行列式。

当不是方阵时，比如一直讨论的这个：

这个3x2矩阵的列向量张成的平行四边形的面积，就是缩放倍率，也就是的两个列向量的叉乘(的大小)。

首先叉乘：

再计算叉乘结果的大小：

从而得到第一类曲面积分的通式：

类似的，所有涉及微元变换的都能这么干。比如曲线曲面积分，球坐标转换之类的，就不展开了。

额外提个问题，为什么一元函数导数的值是个数字，多元函数导数的值就是个矩阵了呢？其实是一元下把向量省略成数字了。仿照上面的思路，可以写出一元情况下雅克比矩阵：，这就是切线向量。但是一元下不说是导数，而说的y分量才是导数。而且给定x方向的微小变化，虽然直接引起了切线上的变化(微分)：，但一元下却规定这个变化的y方向的分量才是微分。

这肯定有历史原因或其他考量，但这种规定在多元时的不协调就造成多元情况下的理解困难。特别是工科微积分普遍不讲雅克比矩阵的几何含义，就使得多元情况更加模糊。

如果我们私下里把一元的切线方向看成导数( 对应的把切线方向的一段变化的向量看成微分)，那么在二元下说切平面是导数，以及是微分就很自然了。而且在更多元的情形下，虽然不好再说“切体”和“N维超切体”之类过于中二的词汇，但至少可以明确导数就是雅克比矩阵描述的那个N维的线性变换。

3 从雅克比矩阵导出梯度

回到雅克比矩阵本身。的这个雅克比矩阵：

实际上把点的定义域平面，也就是xy平面，线性映射到了点对应的切平面上。

所谓“从平面线性映射到平面”，意思就是，站在 xy平面的点上朝着任意方向走一步，所得的那个二维向量，总是能在切平面上找到对应的三维切向量。

这个切向量的斜率，其实就是方向导数。

那么从点出发的所有向量里，一定有个特殊的二维向量 (称为梯度)，它恰好能对应到切平面上斜率(方向导数)最大的那个三维切向量。

的特殊性来自于方向，或说角度，因而可设为，则对应的就是：

由向量的斜率，那么的斜率就是：

把等号右边看成是向量点积：

显然只有在和重合时点积才最大，从而斜率最大。

既然如此，又考虑到只在乎方向，可以直接取，就能使的斜率最大。

前面说了，这个就是梯度，记作：

而且，一旦梯度这么简单粗暴的取值了，就是，它的最大斜率就是：

这就是梯度方向最大的导数(斜率)的真正来源。这个斜率值只是“恰好”等于梯度向量的模长而已。或者说，是我们在最大斜率方向上挑选了模长恰好是斜率的向量，定义为梯度。

然而我看过的微积分书里，关于梯度的逻辑链条是很无语的。
先给出方向导数的极限定义，附带几个用极限定义求方向导数的例子。(先给定义，嗯，严谨！)
接着直接定义梯度！说梯度方向的导数最大，而且最大值是！(开始懵了，为啥梯度这么定义，为啥梯度的模就是最大方向导数？)
最后说，方向导数的方向和梯度点积一下就是方向导数值，完了附送一堆例题。(上当了，原来极限定义就是逗我玩的？原来我只需要死记梯度定义，死记点积就行了么？果然工科生不配理解这些啊！)

好了收一收。现在从梯度里抽象出Nabla算子：

所谓算子，简单理解就是函数的函数，吃掉一个函数，吐出另一个函数。

注意微分算子是向量形式，事情开始复杂了。

注意标量和向量之间的三种运算：

标量(数乘)向量=向量，相当于把1维的标量“升维”到多维的向量。
向量(点乘)向量=标量，相当于把多维的向量“降维”到1维的标量。
向量(叉乘)向量=向量，相当于……勉强相当于计算法向量吧。

考虑到函数可分为标量场函数 和m维向量场函数

那么算子作为“形式向量”，和这两类函数之间也存在三种运算：

，即，标量场函数数乘m维算子
，即，m维向量场函数点乘m维算子
，即，m维向量场函数叉乘m维算子

微分算子的这三种运算得的分别就是梯度场函数，散度场函数，和旋度场函数。

再往下写应该也没人看了，打住。

wtf，公式显示抽风了……

网友的相关建议:

吉米多维奇

大一听系里讲座，某个曾在耶鲁大学CS读Ph.D老师^[1]讲自己当年大一微积分第一次考试的故事，好像是自我感觉不错但是老师给了低分，然后把一套叫《吉米多维奇》的书刷了一遍，之后就考得不错，后来去耶鲁前又刷了一遍。听的我们面面相觑，因为大概是期中考试附近，这个题外话让人印象深刻。

讲座后我们宿舍四人各买了一套《吉米多维奇》，每人六本，在书架上整整齐齐的放着，像是一个收藏品。一直到微积分（上）（下）都学完了，也没人有空去刷……该90+的还是90+，该60+的还是60+，后来基本都送学弟或者放二手书店了。

我可能在某年寒假拉回家了，一直就在书柜上落灰……

所以这个配色真的看吐了，一想到一题没碰我就羞愧难当以及心疼买书的钱。

所以好好把课后作业做完就行了，对大部分人来说这书真的不用买。

参考

^Yitong Yin http://tcs.nju.edu.cn/yinyt/

imathok 网友的相关建议:

谢邀。

如果非得推荐一本，唐忠明的《抽象代数基础》。写得很薄，但没啥意思。

例子少，无趣味，深度也不行(虽然说了是基础)。被国外同行吊打。

或者他可以参考李尚志对于中学生的一些科普工作。哈哈。用他教材的学生学得不好，这本教材绝对有责任。

有哪些数学教材是你深恶痛绝、绝不推荐的？的其他答案点击这里

有哪些数学教材是你深恶痛绝、绝不推荐的？第1页

1 特征向量和行列式的直观

2 多元函数的雅克比矩阵

3 从雅克比矩阵导出梯度

吉米多维奇

参考

相关话题

前一个讨论

下一个讨论

相关的话题

有哪些数学教材是你深恶痛绝、绝不推荐的？ 第1页

1 特征向量和行列式的直观

2 多元函数的雅克比矩阵

3 从雅克比矩阵导出梯度

吉米多维奇

参考

相关话题

前一个讨论

下一个讨论

相关的话题

有哪些数学教材是你深恶痛绝、绝不推荐的？第1页