这是离散与连续的差别
化用一下 @葉恭介 的回答:
我看不出在物理学中使用“加速度”的任何必要性,直接使用数学中的“导数”概念不行吗,含义远远比边际明确。
正如在物理学中用“加速度”而不用“速度的导数”,或者用“速度”而不用“位移的导数”一样,在经济学中使用“边际XX”是因为我们不仅关心其数学表达式,更关心其经济学意义。
这里面有几层含义:
首先,必须认识到经济学不等于应用数学,因而一件事的经济学意义不等同于其数学意义。“导数为零”是一个数学上的描述,而“边际XX为零”,或者“边际XX等于边际XX”等等则是一个经济学上的描述,两者所隐含的意义是不同的,人们对其的理解也是不同的。诺奖得主Roger Myerson教授认为:
给出一个想法的证明固然比较复杂,但不是最困难的,最困难的是如何选择一个正确的名字,来把这个想法传递给其它学者并让他们理解并掌握。
(Richard Xu:连载:No one is sacred (23))
其次,有时候我们关心数学表达式背后的经济学意义甚于表达式本身,因为表达式本身依赖于模型的设计,而模型的设计又不可避免地会对现实进行简化。这意味着,尽管有时在把数学表达式“翻译为”经济学描述后会变得更笼统、更模糊,但是后者却在某种意义上比前者“更准确”。随便举个例子,比如说,在模型中我们计算出,没有A政策时企业应该设置2家分店,有A政策时企业应该设置10家分店,这时候我们是应该建议“实行A政策后企业应该由2家分店扩张到10家分店”呢?还是应该建议“实行A政策后企业应该增加分店数量”呢?
最后,并不是所有的“边际”都是某个东西的导数。再举个最简单的例子,一个卖家卖商品给一群买家(买家的总数记为1),买家对商品的估值v服从分布F(v),卖家生产商品没有成本且只能设定一个价格,求卖家利润最大化的最优价格。可以很容易写出卖家的利润为
W(p)=p[1-F(p)]
其一阶条件是
1-F(p)-pf(p)=0
这个式子的左侧是“利润的导数”,或者说“边际利润”,这是没问题的。但是我们也可以把它变形为
1-F(p)=pf(p)
这时候,式子左侧是提高价格的“边际收入”:由于现在有1-F(p)这么多的买家在购买商品,当卖家试图提高一点点价格的时候,可以从每一个买家那里多收一些钱,使得收入增加1-F(p)这么多;而式子右侧则是提高价格的“边际成本”:当卖家提高一点点价格的时候,有f(p)这么多的买家决定不再购买商品,卖家从这部分买家那里损失了pf(p)这么多。
但是,并不存在1-F(p)的原函数作为“收入”函数,也不存在pf(p)的原函数作为“成本”函数,此时的“边际收入”和“边际成本”是在我们试图解释这个式子的经济学含义时独立出现的,并不是作为“收入”或“成本”的“导数”而存在的。
能问出这个问题,基本反映出经济思想体系的教育有多本末倒置。
很多读经济的人陷入了数学精微的分析框架中不能自拔,以至误把精巧的数理模型替代了经济思想本身。然而,后者才是经济学中最富创造力的部分。至于前者,甚至可能只是“精确的错误”。
如今如果说起“边际分析”,你脑海里可能想起来的是:
要不然就是
第一个翻译成中文是“商品边际效用与价格之比相等时,个人总效用最大化”的原理。第二个是“厂商边际成本等于边际收益时,总利润最大化”的原理。
不管你能想起的是哪个,我觉得你基础还是不错的。但如果你脑子里接下来就是如何推导 maxmization,如何设置 constraint,如何求 partial derivatives,我觉得你学的可能“过于”扎实了。
这些公式和推导有一种物理学中第一第二牛顿定律一样的优美和简洁对吧?然而回到150年前边际学派发端的那个年代,你看到的叙事框架绝对不会是这个精巧的公式。
不妨看看 1870 年代“边际革命”的先驱门格尔(Menger)和杰文斯(Jevons)的表格:
表格看起来很粗糙。杰文斯使用这个表格试图说明的是著名的钻石-水悖论:钻石对人的生存没有任何价值,水却是人生存所必须的,但为什么现实中钻石总是比水贵?
经济学家,从早期的亚当斯密到1850年代的马克思,没少为这个问题争论。对此我们不过多展开,只说下杰文斯对表格的解释:
杰文斯的论点在于:钻石比水贵,只是因为人对水的消费量更大而使得它给人的边际效用小于钻石。比如已经消费了 8 单位水,它对应的是 2 单位的边际效用,而对钻石的消费量基本是从无到有,其边际效用可能是 3。这样,新增单位的边际效用 2 小于钻石的 3,所以水会比钻石更便宜。
你熟悉的“边际效用”“边际效用递减”“总效用”这些词我全加粗了。不过,有图吗?没有。有漂亮的曲线吗?没有。有 这种数学上的形式吗?也没有。然而,杰文斯用这个简陋的表格解释了经济学中最重要、也是让早期经济学家最为困惑的问题。
这不是全部。我想说的是,如果你有更强的批判性思维的话,会发现和微积分中关于导数的假设相比,这个表格还有两个特别重大的差别:
关于基数、序数,可能有部分读者不是很熟悉。我在评论里有所补充,也可略窥经济分析的思路:这里的举例,第 8 杯水的边际效用为 2 小于第 1 颗钻石的边际效用3,也仅仅表示 3 > 2(序数),也即第1颗钻石的边际效用“高于”第8杯水的边际效用。它没有引申到后者的效用是前者的 1.5 倍(基数)。更没有说前面8杯水的总效用是 10 + 9 + 8 + ... + 2(基数,可加性)。我们设想一下,如果确实(基于基数假设地)去这么计算,那显然八杯水的总效用大于 1 颗钻石的总效用 3。我想这未必符合现实的答案。
仔细体会这两点差异,摸着良心说,杰文斯的这种描述框架显然是更符合经济直觉的。但这不符合数学直觉,甚至可以说数学中的导数和微积分概念根本无力刻画。不连续、不可导,甚至都不可加的函数,请问怎么处理?唯一和我们现在所熟知的经济学框架相似的是,杰文斯假设了“边际效用递减”,不过这点并不是一个必须的强假设。
不过有趣的是杰文斯为什么没有用更复杂的框架或工具做一个更漂亮的解释?我个人认为是因为“足够”。即杰文斯的依赖“最小化但足够解释的假设”解释了一个曾经关键但困扰的问题。没有冗余,也没有反直觉的地方。也是我读过之后觉得高明而有趣的地方。
我个人绝不是无端反对数理化表达。实际上,如何在宽条件下得到求导形式和序数形式下一致的推论,都是已证明的。只提醒这些是后加的、做了部分并不普适的假设之后才能成立的。不要把这些假设和数学工具当做想当然的,甚或以为这些工具是分析的主体。而杰文斯,更是这方面的高手,不必多言。
总结来看,边际,也就是英文的 margin,这个概念是经济学的,不暗含任何连续性、可导性,也不必然意味着边际递减,也不必然要求效用函数之间的可加性等等过于“强”的数学假设。它在概念本身上是干净而纯粹的,即“增加一个单位的 x,某个量 y 会怎么变”,和导数没有必然的关系。(也和边际概率分布的 marginal distribution 的求积分没关系)把边际和导数直接挂钩起来,固然引入了更强有力的分析方法,但也不要忽视其引入并不普适的假设。
然而,因为意识到了“边际”这一理念和数学中“导数”的概念如此一致,边际学派也迅速引入了大量已经成熟的微积分工具来支撑自己的框架。尤其是从学数学出身的马歇尔(Alfred Marshall)开始,大面积铺开了微积分工具的应用。
不过,读下马歇尔晚年的一段文字,可能会让人特别有感触:
我现在已经不写那些可能对你有用的数理经济学,我对那些事情也记不太清楚了。我现在已经不读数学,甚至忘记应该怎么把许多东西联结起来。在最近几年的研究工作里我愈来愈感觉到,用好的数学定理来处理经济假说,不太可能会作出好的经济学。
我愈来愈依据下列的规则:
(1)把数学当作速记语言,而不是探讨的工具。
(2)用这个方法一直到把想法完全记下为止。
(3)把它们翻译成英文。
(4)举例说明为什么这些想法在真实生活里是重要的。
(5)把数学烧掉。
(6)如果你做不到(4),就把(3)烧掉。我经常做这最后一点。
这六点,曾长期刊印在某经济学期刊的投稿须知上。
再回到开头的观点:原问题经济学里面为什么不用“导数”而用“边际”一词,基本是本末倒置的,在我看来也基本是经济学中“数学帝国主义”的体现。一如整个社科领域弥漫着的“经济学帝国主义”气味。
我觉得可以用Alias来解释。
就是一个别名嘛,就比如我在知乎叫 @平凡 ,在商场叫帅哥,在学生面前叫老师,在有些人面前叫
有本质区别吗?我还是我,只不过不同的参考对象我就有了不同的名字。
跟计算机存储的内存地址很像,即使是两个叫不同名字的变量,但是最终是指向同一个地址。