李治 2023-08-07发布 阅读:734次 ⋅ 威慑理论   ⋅

威慑理论被誉为“20世纪国际关系领域最重大、深奥的学术创造”,而博弈论在威慑理论的发展过程中起到了举足轻重的作用。

在二者的联系领域贡献最为突出的人物,非托马斯·谢林(Thomas Schelling)莫属。这位美国著名的经济学家,以其跨学科的视角,“通过博弈论分析改进了我们对冲突和合作的理解”,并因此荣获2005年诺贝尔经济学奖。

在他去世的时候,有学者写了缅怀文章,认为“他的思想塑造了冷战和世界格局”,这毫无疑问是对一位经济学家最好的褒奖。

数字孪生战场实验室推荐该文,其目的是为了帮助《联合作战白皮书》的读者更好了解美国军事思想的来源,更深入理解美国的综合威慑逻辑。

托马斯·谢林是美国著名学者、经济学家,外交事务、国家安全、核战略和军备控制领域的研究专家,有限战争理论的奠基人之一。1944年获得加州大学伯克利分校经济学学士学位,1951年获得哈佛大学经济学博士学位。1958年被聘为哈佛大学经济学教授,1969年加入哈佛大学肯尼迪政府学院,是该院知名的政治经济学教授,1992年当选为美国经济学联合会会长。曾获得在政治经济学领域著名的弗兰克·塞德曼杰出成就奖,并因其在“防止核战争行为研究”领域的杰出成就获美国国家科学院奖。2005年,谢林因“通过博弈论分析改进了我们对冲突和合作的理解”而与罗伯特·奥曼共同荣获当年的诺贝尔经济学奖。

托马斯·谢林教授人生阅历丰富,学术研究面广,各项成就斐然。曾为美国军备控制与裁军署、国务院、国防部、参谋长联席会议、耶鲁大学和兰德公司等机构工作或担任顾问。谢林是西方非主流经济学家的代表人物之一,他的思想主张超越了传统经济学的经济理性假设,突破了经济学理论数学表示的传统方法,开创并发展了“非数理博弈理论”。他的研究领域十分广泛,除经济学理论外,还涉及军事战略和军控、能源和环境政策、种族隔离和种族融合、冲突和讨价还价理论以及国家政策和商业战略中的道德问题等等。可以说,谢林是一位制度经济学和政治经济学领域的大师级人物。

托马斯·谢林教授的主要著作有:《冲突的战略》、《战略与军控》、《武器与影响》、《微观动机与宏观行为》、《选择与结果》等。

一、威慑理论的发展历程

威慑(deterrence)作为一种行为方式和政策手段,古已有之。但作为一种系统的战略理论和主导性军事政策,威慑却是随着核武器的出现和冷战的开始而产生,并首先在美国形成和发展起来。战后威慑理论正如罗伯特·杰维斯(Robert Jervis)所说,呈现“波浪形发展”的特点。概括来讲,大致分为四个阶段:1945年至1955年的“早期阶段”;1956年至1969年的“黄金时代”;1970年至1989年的“第三次浪潮”;以及1990年后的冷战后阶段。

(一)早期阶段:威慑思想形成阶段(1945-1955)

第一阶段,虽然原子弹在广岛和长崎的爆炸震惊了全世界,但威慑理论的发展并没有取得很大的进展。系统的威慑理论尚未形成,但以贾可布·维纳(Jacob Viner)、伯纳德·布罗迪(Bernard Brodie)、凡纳瓦·布什(Vannevar Bush)以及威廉·波顿(William Borden)等为代表的学者敏锐地意识到了核武器对世界的影响。值得注意的是,伯纳德在其早期提出的核威慑思想中试图运用冯·诺依曼(John von Neumann)的两人零和博弈最小最大准则来强调“理性”,其他学者也开始在核威慑分析中使用博弈论(Game Theory)的方法。从现在反思威慑理论的发展过程来看,这一阶段的著作数量虽少,质量却很高。

(二)“黄金时代”:威慑理论成熟阶段(1956-1969)

所谓“黄金时代”,也就是威慑理论研究的繁荣期,其最显著的表现就是大量相关著作的发表。在这一阶段,威慑理论研究的基本内容、主要对象和重要议题被确定下来,该理论的一套独特的学术概念和学术语言也由此形成。这一时期的威慑理论主要是通过理论演绎方式推导出来的,而不是通过历史归纳方法总结出来的。由于正处在冷战最紧张的时期,威慑理论的核心内容便自然指向了如何解决美苏之间的核冲突。威慑理论研究对博弈论的强烈需求推动了早期博弈论的发展,催生出了后来非常有影响力的“囚徒困境”(Prisoner’s Dilemma)和“斗鸡博弈”(Chicken Game)等经典博弈模型。这一时期的代表人物主要有托马斯·谢林、阿尔伯特·沃尔斯泰特(Albert Wohlstetter)、赫尔曼·康恩(Herman Kahn)、亨利·基辛格(Henry Kissinger)等。

(三)“第三次浪潮”(1970-1989)

在经历了“黄金时代”的喧嚣之后,理论界开始对此前形成的大量概念和伦理学说进行反思和深化。首先是对研究方法的批判,批评者认为,此前单纯运用演绎推理方法进行研究的做法将复杂的威慑过程简单化、概念抽象化、理论一般化了,这势必会忽略许多重要的因素,不能满足解释、指导和预测现实的需要,因而必须将演绎推理与经验研究两种方法结合起来。其次是对理性的批判,批评者分别从理性概念的文化背景、官僚机构的非理性特征、决策者进行完全理性决策的障碍这三个方面,对先前的理性假设进行了反思。主要学者有罗伯特·杰维斯、亚历山大·乔治(Alexander George)、理查德·什莫克(Richard Smoke)等人。

(四)冷战后威慑理论的发展(1990至今)

冷战后,国际政治格局的变化与科学技术的迅速发展使得威慑现象有了新的特点。威慑不再仅仅局限于“核威慑”的范畴,常规武器在军事革命中的高技术化使得“常规威慑”研究开始兴起。这一时期,威慑理论的研究主要包括两个方面:在经验研究上,学者们在这一时期继续进行经验研究的工作,探究常规威慑得以成功或失败的条件。在方法论上,学者们通过发挥博弈论方法的强大逻辑推理功能、将博弈论方法与个案研究方法相结合、运用认知心理学视角等方法,为博弈论方法的运用开辟了新的领域。

二、谢林的威慑理论

(一)“可信承诺”与“核恐怖平衡”

通过对博弈论的运用,谢林为威慑理论的研究提供了一个有效的方法,并在此基础上提出了与传统核裁军理论不同的观点。传统的核裁军理论主张国家通过裁减核武器、开放核设施等手段减少对手的敌意,以防止遭到对手的突然袭击。而在谢林看来,核裁军并不一定会导致战略的稳定,而一定程度上的核军备竞赛也不一定会导致战略的不稳定,问题的核心不在于核裁军,而在于让对手相信本国没有首先攻击对手的动机。为此,国家应尽力做出“可信承诺”(credible commitment),以减少对手的猜疑。在这样的要求下,主动地向对手透露一些相关信息,将有利于降低对手发动突然袭击的可能性。

谢林认为,要想使对手放弃发动突然袭击,其最有效的办法便是消除对手首先发动突然袭击的优势,使对手认识到这样的冒险将不会得到任何好处。因此,威慑的成功与否,并不取决于本国当前所具有的毁灭对手的能力,而是取决于本国在经受对手打击后还能具有的毁灭对手的能力,也就是报复能力(retaliatory capability)。在威慑行为中,报复能力比抵御攻击的能力更加重要。在任何一方都不具备一次性毁灭对手还击能力的前提下,一国只有保护好本国具有报复能力的武器,其威慑才会真正发挥作用。从这个意义上说,“核恐怖平衡”(balance of nuclear terror)才是防止核大战的唯一稳定的有效机制。

(二)非数理博弈理论的创建

主流的数理博弈理论是现代经济学的基本范式,几乎所有的现代经济理论都是在博弈论的框架内产生和完善的。在博弈论的发展过程中,以约翰·纳什(John Nash)、约翰·豪尔绍尼(John Harsanyi)、莱因哈德·泽尔腾(Reinhard Selten)为代表的经济学家坚持采用数学语言和公理化的方法进行科学研究,而谢林却独辟蹊径,开创了非数理博弈理论(Non-Mathematical Game Theory)这一新的领域。谢林认为,在双方或多方相互影响的情况下,博弈是不可能通过建立模型的方法加以表述和研究的,因为决策主体的期望与行为无法通过纯粹的逻辑和数学的推导而得。因此,混合动机博弈的决定因素与其说是数学的,不如说是经验的,其参与者在选择自己的博弈战略时,不仅会有数学上的考虑,还会考虑到创造声誉、沿袭传统、建立自信、显示大度等许多非数学因素。非数理博弈理论正是基于这种更接近现实的观察而得出的。谢林运用其优美的语言和尽可能少的模型,而非严格的逻辑论证,将他的理论通过实际应用分析的形式表述出来。

非数理博弈理论分析的是这样一种状态下的社会和经济行为,即每个参与者的行为取决于他是如何预期其他人将如何应对他的行为的,而其他人对该人将如何应对他们行为的预期也同样会影响到其他人自身的行为。谢林建构了一套概念框架来描述这种相互预期的困境,并借此将各种零散的理论整合在一起。非数理博弈理论不仅应用于经济学的研究之中,还对政治学、社会学、心理学及国际关系等其他领域的研究产生了广泛的影响,从而发展成为社会科学的经典理论。

(三)非数理博弈理论在国际关系领域的应用

谢林最有影响的一个贡献,就是他将非数理博弈理论成功地运用于国际关系的研究之中。在《冲突的战略》一书中,他运用博弈理论对国家间的讨价还价(bargaining)和冲突管理理论做出了具体的分析。谢林所说的“讨价还价”实际上是一种非零和博弈,指博弈的一方通过自身的努力,影响对手的行为以避免双方的两败俱伤。在效率曲线上,博弈双方的利益是相互对立的,没有帕累托改进(Pareto Optimality)的余地(即任何一方的趋向自身利益的变动都必然会损害到另一方的利益),但这种对立只是一种逻辑上的可能,在效率曲线上的所有点中,必然存在着一个使博弈双方利益一致的点,这一点即为“聚焦点”(focus point),也称“谢林点”(Schelling Point)。在博弈过程中,双方避免两败俱伤的共同想法,就体现在他们试图在效率曲线上找到这个利益一致的点,并通过公开的讨价还价以达成最终协议。而这一过程在很大程度上取决于双方的直觉,而不是逻辑的思维推理。从这一点上来说,有人将谢林的理论归结到自由主义的理论阵营之中,并非没有道理。

三、对谢林贡献的评价

(一)《冲突的战略》

“谢林教授的《冲突的战略》一书理性地分析了政治学中的一个重要分支,即当今流行的国际威慑政治学。此书语言清晰易懂,颇富吸引力。在该领域,作者的分析超过了此前的所有相关学者。在众多的国际威慑政治学著作中,《冲突的战略》无疑是迄今为止最优秀、最具说服力和最精彩的一部。”

上面这段话是《美国科学院年鉴》对《冲突的战略》一书的评价,该书是托马斯·谢林教授为我们带来的一部国际关系威慑理论的巨大宝藏,被认为是1945年以来西方最有影响力的100本书之一。书中发展出来的最重要的思想是关于“可信承诺”在冲突或谈判过程中的重要作用的探讨。这一思想最早源于他的一篇名为《论谈判》的论文(1956年发表于《美国经济评论》,后收入本书,成为第2章的内容),其基本内涵是:在谈判和冲突的过程中,博弈一方以可信和可观察的方式限制自身的某些选择自由的做法会提升自身的谈判地位,而赋予自身相机决策权的做法却反而可能伤害自身的利益。

在《冲突的战略》一书中,谢林首次定义并阐明了威慑、强制性威胁与承诺、战略移动等概念,开始把关于博弈论的洞察力作为一个统一的分析框架用来研究社会科学问题,并对讨价还价和冲突管理理论作了非常细致的分析。其中讨价还价理论是谢林早期的主要贡献所在。尽管当时谢林并没有刻意强调正式建立模型的问题,但是他的很多观点后来随着博弈论的新发展而逐步定形,而他所定义的这些概念也成为了博弈论中最基本的概念,比如,完美均衡(perfect equilibrium)概念中的不可置信威胁(incredible threat)就源自谢林的可行均衡(feasible equilibrium)概念。

(二)走向现实的博弈论

《冲突的战略》一书中所阐述的原则几乎可以用来研究世界上的一切冲突情势,从孩子们的游戏到核大国之间的对抗,只要有可能存在对双方都不利的结果及一方实现其目标的能力依赖于另一方所做出的决定,非数理博弈理论都可以对其做出解释。托马斯·谢林以博弈者的眼光观察世界,将权力、制度、文化等要素在博弈论的分析框架之内统一起来,自由地游弋于日常现象与深奥的真理之间,使我们能更客观地比较各个流派的优点与不足。他真正将博弈论从抽象的数学王国带回到我们的现实生活之中,使之成为我们更好地理解我们自己以及我们所生活于其中的世界的强大工具。

在一篇庆祝谢林获得诺贝尔经济学奖的文章中,迈克尔·金斯利(Michael Kinsley,《华盛顿邮报》的一位专栏作家)以及一位谢林以前的学生有趣地总结了托马斯·谢林所重新定义的博弈理论:“你正站在悬崖的边缘,和另一个人的脚踝捆在了一起。你们两个被捆在一起的脚将会被分开,而且只要你们其中的一个人让步,另一个人将会获得一份很诱人的奖赏。那么,你将如何说服另一个人放弃这份奖赏呢?答案是:你开始跳舞,并且越来越靠近悬崖边缘。这样,你并不需要让他认为你将会做出一些完全不理性的行为——将他和自己一同带下悬崖,你只需要让他相信:你已经准备好了采取比他想采取的行动更高风险的行动。如果你这么做了,那么你将赢得这场游戏。”

四、谢林的其他成就

(一)“谢林隔离模型”

在谢林看来,人类生活在一个相互关联的网络之中,个体的选择与行为常常要取决于他人的选择与行为。换言之,在个体与其所生存的环境之间存在着一个“互动的体系”(system of interaction)。在这个互动体系中,个体的选择与行为完全指向其自身的利益,这使得互动的结果往往“十分令人吃惊”:为什么听讲座时,人们都会不自觉地坐到后排?为什么电话会接连不断?为什么交通事故会导致比人们所预想到的严重得多的交通堵塞?在《微观动机与宏观行为》一书中,谢林对这些问题进行了深入分析,并提出了许多具有说服力的解释模型,这其中最为引人注目的就是“谢林隔离模型”(Schelling Segregation Model)。

通常人们会认为,隔离是同压迫联系在一起的。但是在发达国家,尽管人们采取种种方式消除隔离,并且也并不存在人为的压迫,但隔离现象却依旧存在,这又该如何解释呢?在谢林看来,即使所有的个体都足够宽容——他们或许并不反对与不同文化、宗教或肤色的人居住在同一个社区,这也并不能消除城市中存在的隔离现象。因为在个体看来,他们的邻居中必须至少有一部分是和自己特征相近的人。如果这个条件不能得到满足的话,他们将不得不迁出社区,去寻找那些和自己特征相近的群体。因此,如果社区内某个群体的规模持续下降,就会产生多米诺骨牌效应(Domino Effect),最终导致这个群体的成员全部迁出社区,原先各种族平安相处的社区就会变成一个“种族隔离”的社区,这就是著名的“谢林隔离模型”。这一模型表明,人们在微观层面上的细微偏好会导致宏观层面上的极端后果。

(二)人类的自制现象

谢林还对人类的自制现象进行了研究。谢林注意到,人们经常会做一些自己本来不愿意做的事情,比如吸烟、酗酒、锻炼不足、花钱大手大脚等。在此基础上,他探讨了自制的限度以及与此相关的公共政策问题,并指出:可信承诺对个人内心冲突的重要性并不小于其对人际冲突的重要性。近年来,随着行为经济学的兴起,自制的限度等问题已经得到学者们越来越多的关注。此外,谢林在能源和环境政策等领域也取得了一定的成就,在此不再赘述。

总之,托马斯·谢林——这位“游侠经济学家”(正如谢林自称的那样)——已经成为一名卓越的思想开创者。由于研究领域的广泛性,谢林常常会成为不同学科的争论焦点。为此,谢林往往这样澄清自己的身份:“有人以为我是一位社会学家,有人以为我是一位政治学家,实际上我只不过是一位经济学家。”



评论

您不能发表评论,可能是以下原因
1、登录后才能评论
2、作者关闭了评论