初学经济学建模

因为是经济史的学生,原先对现代经济学的数学建模+统计验证的这一套不太熟。最近在重新看Japanese Subcontracting这个70、80年代热门的现实的经济问题,原先之前从historical imperative来看待这个系统的变化,包括Fujimoto的系统进化论,都是更偏向一种descriptive的逻辑构建,也就是历史叙述,而Dyers的transaction cost理论则是包含一致理论的(部分)动态解释,论证仍然是靠数据的点对点论证。

但是Asanuma的论文则是用Seiichi Kawasaki的一个prinicple-agent的理论模型(源自Holmstrom&Milgrom的一篇著名文章Aggregation and linearity in the provision of intertemporal incentives)来配合他从多年的field study中感知到的数据的代表性来做一个纯静态的微观数据(firm level)的验证。说实话其实是一个很简单的模型,变量少,参数少,结构简陋,但是却让我这个初学者感受到的数学自洽的美好。但是初次的感慨之后,不禁反过来推敲各种假设的靠谱性。

比如:1) optimal contract is linear in end-of-period accumulated production costs. 2) the principal cannot observe the realization of the random cost changing, thus cannot deduce the subcontractor’s effort from his observation of the total cost. 3) take the quantity ordered to be exogenous. 4) profit and cost are linearly related.

或许从Asanuma的实证经验来看这些assumption都是可以接受的,但是我的怀疑在阅读过程中如影随形无法散去。risk吸收的程度真的用利润和成本的各自variance比就可以表示了吗。最后的回归是risk吸收程度与成本的波动+risk aversion的指标+moral hazard的指标,仔细想想理论建模的架构给了一个统计相关的非经验架构,帮助限定逻辑的范围,但理论的极限也受制于此。更加,由于风险偏好和道德风险都是不得不用经验指标来填充,不由地使得原本非经验架构的模型有了苟且之处。另外,作为经济史的学生,不免会感觉到静态模型的不足,比如过分乐观地一般化,已经缺乏背景。

关于经济学数学建模这个问题,网上争论不少,这里引一个知乎上我个人比较赞同的答案:

“数学化的经济理论优势在于逻辑严密、减少内生性错误、有效利用数据、降低使用门槛,它使得人类认识经济活动、社会问题前所未有的深刻起来。同时,经济学数学化是一种必然的趋势,表现就是学者这个专业阶层会自发的学习、使用数学工具。认清楚所谓经济学帝国主义背后的机制也很有趣。

首先必须要定义什么是“数学化”?我觉得抓两组数据来线性回归那不叫数学化。线性统计模型是列举、比较统计数据的延伸(比较数据可以看做是一个简单的对dummy variable的回归),而即使是文科生把持一切的旧时代经济学里也是很常见到比较统计数据的。

数学化指的是:先建立理论数学模型,再由理论模型推导出合适的统计学模型,再由实际数据检验统计学模型所依赖的假设。所以起始的出发点是理论模型,而不是统计学模型。这种方法为什么流行起来?和旧时代“论理式”的逻辑推导经济学相比,它的优势在哪里?

要回答这两个问题,先要明确所谓“学术工作”的目的是什么。一个“学术工作”目的,除了帮助作者养家糊口外,最重要的是表达、论证作者的某种“想法”。作者必然关心怎样才能让人信服的论证某种“想法”。

论证某种想法,有三种模式。

1 提出想法,然后糊弄人一般的在逻辑上说明其自洽,并寻找例证证明这种想法。
2 提出想法,然后建立统计学模型,通过大量数据来验证这种想法。
3 提出想法,然后按照想法数学建模,再将数学模型转化为统计学模型进行研究。(这也就是我说的“数学化”)

方法1,我将其称作“政治宣传”。其扯淡之处在于,a) 言语的逻辑陷阱太多,被作者坑是必然的。左传读起来深刻入理,其实多是作者微言大义在作怪。b) 人类永远无法穷尽 例子。所以所谓的例子,只是一个很小的sample。c) 你并不知道例子背后的机制是什么,可能有更为复杂的原因。例子本质上只是随机过程的巧合,然后又巧合的被你观测到。d) 作者往往只会挑对自己有利的例子。

方法2略微靠谱一点,因为你至少有比方法1多得多的信息,而且还是量化的(可比较的)信息。但不幸的是,统计学模型很难帮助我们正确确立因果关系,而因果关系(或者说:机制)这才是你的”想法”中的核心内容。统计学的欺骗性,最常见的就是所谓“内生性”/“选择性”问题。这是说,你能观察到的现象是经过人们选择后的结果,你根本不知道在选择前的一些 物理上的 规律。

比如,我们社区有两家医院,医院A和医院B。怎么看两家医院哪家医院医术高呢?一个办法,统计两家医院的死亡率。A医院20%,B医院40%。B医院死亡概率更大,那么下次当地卫生部门应该给A医院发红包。

这个推导扯淡的地方在于,病人在进医院前是会”选择”的。也许,我们这儿人都知道B医院好医生多,快死的、有重症的病人都往这个医院里面拉,自然B医院死亡率更高。所以,你观察到的数据都是经过人类社会博弈后的二手结果。要搞清楚真正的因果关系,必须要直接猜测、解释背后的机制。通过建立机制,能让我们知道我们还需要什么样的数据。

真正能帮助我们减少(而不是克服)内生性问题的方法,是对机制进行数学建模。这种建模,就是经济学的理论模型,它本质上起得是约束统计学模型的作用。

综上可见,数学化跟旧时代方法相比,有巨大的优势。通过数学的精确、逻辑的完美,规避了言语论证的模糊和陷阱;约束统计模型、减少内生性错误;而随着现代统计事业的发展,统计数据越来越多,这种方法又能尽可能利用统计数据。

现在来说说数学化的弊端。

所谓让经济学成了“少数人”捣鼓数学工具骗广大无知文青的说法完全扯淡。且不说现在每年出产的phd数目就完爆旧时代经济学家总量,我倒觉得数学化降低了经济学门槛,因为数学化是一种“标准化”的手段,这让有基础的人受过训练就能从事这门学问。

首先,我觉得数学化最大的弊端是让经济学能研究的问题变窄了。

如果好好学过数学建模就明白,数学模型是 一种非常非常受到限制的工具。这是因为作为一个研究者,手头能控制的变量、函数、变换的个数是有限的,人类能理解的数学模式在上帝看来是极其愚蠢而简单的。所以每个建模者都明白,建模不是为了完全复述发生的事情,而是在极其简单的假设、推导的情况下,保留现实中那么一点点真谛。一个简单的模型才是好模型。这倒并不是说简化问题的假设本身不好,而是说,学者会规避那些可能导致模型复杂化的“想法”

第二,是数学化的过程中,人类损失、遗忘了很多旧时代经济学家非常深刻的想法。基本上现在训练出来的经济学家,都极少会再去阅读1970年之前的文章(除非研究经济史啊),更别提书了。

最后回到为什么经济学数学化变成了今天的帝国主义。直接原因是绝大多数学者们都在自发学习、使用这种数学化范式(这不是废话吗。)。上面的论述已经说明这种范式的巨大优势(逻辑严密、减少内生性错误、有效利用数据、降低使用门槛),但是这不够,如果仍然有一大群死脑筋的学者坚守阵地(如austrian school,张五常)那也不至于到今天这般模样。

这里说说体制问题。现代的学术圈,是非常自由化的:学者能自由选择研究的问题。学者通过“建树”来获得职位、金钱报酬和权力。针对一个问题,数学建模其实是一个较为困难的学问。但是学者可以先射出箭再画靶子。通过学习、发明某种数学模型,然后知道这个模型可以解决一类的问题,创造多篇paper。由于其过程的严密、规范化,peer review比较好过些。而如果直接从问题入手,像旧时代一样研究、搜集资料、推理,那很可能耗时长、做出来别人已经想出来的东西、做出来让人无法信服的东西。这种失败的概率极大。一旦大多数经济学学者都加入了数学阵营,由于peer review制度的存在,旧时代经济学家生存会更为困难。这大概是你能观察到这种趋势的原因。”

我认为以上看法是大致没有什么大偏颇的,只有认知上的略微不同之处。关键是,数学建模对机制的建模虽然有规避了言语论证的模糊和陷阱以及约束统计模型、减少内生性错误的好处,但是也约束了研究思考机制的本身。不只是上文说的变量、函数、变换的个数的有限,而是过简化对思维和观察可能会有很大的禁锢。数学建模的最底层基础仍是观察,而之后使用各种数学工具进行演化,但是一个完美自洽的高级模型或许并不帮助你安慰自己在观察上是完美无差的。事实上我曾经讨论过我认为经济学的观察基础的靠谱程度要远远低于物理学和数学。而另一方面在简化这个问题上事实上的话其实是反过来,简化是有限的,经济学者做的加法远远多于减法,但是模型上的加法又太容易让人在偏离现实的道路上越走越远。而回头却变得早已不再现实。

而在鄙视链的最底层,社科同学们强调统计计量分析未必严格优于案例分析:“这个应该说因具体研究内容而异。对于一些研究课题来说,做几个详细的规范的质性分析比跑个回归信息量大很多,社会学都有讨论如何做一个规范科学的案例分析,但经济学似乎毫不关心,尽管其研究范围如此之广(几乎逮着个问题一有机会就跑回归)”。更有甚者,精确而逻辑完美的数学未必就严格优于模糊而陷阱的言语论证。

凯恩斯:“把经济分析体系符号化的伪数学方法的一个重大错误是,他们明白地假定其中因素之间完全相互独立。当这个假设无法被接受时,数学方法的说服力和威信便荡然无存。然而,在普通论述中,当我们不是在盲目应付,而是始终知道我们正在做什么,知道词语的意思是什么的时候,我们可以“靠我们的头脑”保留一些必要的条件和限定,并在将来做出必要的调整。这是不可能靠几页复杂的偏微分方程运算做到的,因为这些保留条件都被假设掉了。近来的“数理”经济学大多是胡编乱造,像其所依据的初始假设一样不精确。在一堆自命不凡和无用的符号中,它使作者看不见现实世界的复杂性和相依性。”

萨伊:“依靠简化和随意压制,未能把这些问题系统地和清楚地变成分析语言,没有去除其本质上的复杂性,而是从本质上改变了问题的条件,结果适得其反。”

门格尔:“以如下陈述为例:(1)一种物品价格越高,与之相应的需求越小(或至少不会更大)。(2)如果用p记这种物品的价格,用q记对它的需求,那么,q=f(p),dq/dp=f'(p)<0.

认为公式(2)比语句(1)更为精确或“更为数学化”的人完全误解了……2和1的唯一区别是:2仅限于可微分的函数,从而其曲线有切线;陈述1更一般,但它同样精确:1和2具有同样的数学精确性。”

杨小凯:“纯粹使用文字语言逻辑的理论往往存在不说明假定的现象,逻辑分析师可能出现与假定矛盾的违背。文字语言的表达经常出现表达错位和逻辑混乱。经济学发展至今,在社会科学种占据了如此重要的位置的原因,恰恰是因为(数学)形式化的作用。也就是说,容易在课堂讲授,容易给出习题和标准答案,容易为后来者理解减少歧义并在此基础上继续研究,容易为其他学者发现漏洞提出改进结论。

(数学)形式化的有点恰恰在于便于发现理论缺点。语言文字的逻辑容易形成自我封闭的理论形式:产生歧义、拒绝批评、混乱争论、自成真理、无法检验、发展缓慢、难以创新。”

的确,相比去打猎这个目的,现代经济学家似乎太过于在意如何升级他们的武器一些了。

 

Update 2017/5/16
How should theory and evidence relate to each other?
Can’t we all just get along?, Econometrics edition

What Economics Models Really Say. A Review of Economics Rules: The Rights and Wrongs of the Dismal Science by Dani Rodrik (Norton, 2015)

Update 2017/9/03

“Theory vs. Data” in statistics too

The Role of Theory in an Age of Design and Big Data  Matthew O. Jackson Stanford University

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s