博弈论分析

中美军备竞赛的博弈分析

1.理论介绍

1.1博弈论的概念

博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

1.2博弈论的主要特点博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

1.3博弈的分类

博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者

采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（sub game perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium）。

博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型等等。

1.4纳什均衡纳什均衡的定义：在博弈G=﹛S1，„，Sn：u1，„，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*，„，sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*，„s*i-1,s*i+1，„，sn*）的最佳对策，也即ui（s1*，„s*i-1,si*,s*i+1，„，sn*）≥ui（s1*，„

s*i-1,sij*,s*i+1，„，sn*）对任意sij∈Si都成立，则称（s1*，„，sn*）为G的一个纳什均衡。

假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质

上说，是一种非合作博弈状态。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

1.5囚徒困境 1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。若二人都互相检举（相关术语称互相“背叛”），则二人同样判监8年。用表格概述如下：

由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

若对方沉默、背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。

2.军备竞赛

军备竞赛是指和平时期敌对国家或潜在敌对国家互为假想敌、在军事装备方面展开的质量和数量上的竞赛。各国之间为了应对未来可能发生的战争，竞相扩充军备，增强军事实力。是一种预防式的军事对抗。近代比较著名的是第一次世界大战前20年中欧洲列强之间开展的军备竞赛（如“无畏舰”建造竞赛，详情请参阅第一次世界大战列强军备竞赛）、北大西洋公约组织与华沙条约组织从第二次世界大战结束后到苏联解体前展开的长期军备竞赛。

每个国家必须对自身和对手的基本情况有充分的了解才能赢得军备竞赛。这一点是相当重要的。激烈军备竞赛必须选择在必要的时候进行。没有必要的激烈军备竞赛一来会延缓自身经济的发展，二来也会一定程度上引发不必要的敌意。

军备竞赛的反方面也就是裁减军备实际上也是一种可执行的策略。在大国较量中没有永远的朋友只有永远的利益。军事实力和军事力量给别人的感觉是不一样的。军事力量并不是纯军事实力，其大部分需要经过动员才能转化为军事实力。

因此，军事潜力是一种潜在的资源。潜在资源的发挥时间就是其他国家采取非针对性态度的一个诱导因素。当然，裁减军备的行动必须是在有利于自身国家整体战略的前提之下进行的。需要保留的力量要足以对潜在敌人形成足够威慑又能够通过时间作用转移潜在敌人的矛头，以换取自身的更大生存空间。

2.1美苏军备竞赛在冷战的40多年里，美苏的军备竞赛不断升级，都试图超过对方。战后美苏军备竞赛的历程大体划分为三个阶段。

1945-1957年使第一阶段，美苏双方主要进行了研制核武器竞赛。1945年7月16日，美国第一颗原子弹爆炸成功。1949年8月29日，苏联第一颗原子弹也爆炸成功，打破了美国在战后初期的核垄断地位。1952年10月31日，美国第一颗氢弹试验成功，1953年8月12日苏联也进行第一次氢弹试验。随后，美苏在核武器的实战化、高质量、小型化方面展开竞赛。据统计，1945～1985年，全世界共进行了1570次核爆炸试验，美苏分别占80次和562次，合占世界总数的80%以上。两国储存的核弹头总数达4.5万枚以上，战后世界核弹头总数90%以上。

军备竞赛的第二阶段为1957-1983年，双方以研制核弹头的运载工具以及新型核弹头的竞赛。1957年10月4日，苏联将人造地球卫星发射上太空。1958年1月31日，美国也成功发射了人造地球卫星。1961年4月12日，苏联“东方1号”宇宙飞船在加加林的操控下，首次球绕地球飞行并返回地面。1969年7月20日，美国“阿波罗11号”宇宙飞船登上了月球。同时，美苏又进行了多次洲际导弹、中短核导弹发射实验。从1957~1984年，在全世界发射的3000多颗人造卫星中，美苏两国占90%以上，且70%是军用卫星。1986年洲际导弹、潜射导弹、重型轰炸三种战略武器合计数：美国1989件，苏联为2594件。核弹拥有量，美国为1.3万余枚，苏联为9640枚。

第三阶段，80年代初到90年代初，以研制和建立战略防御系统为主要内容。如1981年4月12日枚发射航天飞机“哥伦比亚号”。此后又多次进行了同类的飞行。苏联于1983年进行了首次小型航天飞机试验，此后两次试飞成功。美国在航天飞机方面领先苏联，但苏联在反卫星武器系统和建立航天站方面则领导美国。

在常规武器发展方面的竞赛也相当激烈。美苏两国的飞机、舰船、坦克、装甲车、火炮、导弹等更新于3—5代，而且性能不断提高。

80年代军备竞赛转向太空和其他高技术领域，美国制定的星球大战计划即是例证。军事预算的迅速增长、武器质量性能优势的争夺以及军事战略的不断变化，是美、苏军备竞赛的主要特点。90年代世界经济不断国际化、各国间相互依存关系的加强，以及由于美、苏政治战略的调整，带来了国际局势的缓和，使军备竞赛的势头趋缓。在实现实质性裁军的同时，美、苏的竞争更多地转向了以经济为中心的综合国力方面。但美国依旧发展了如隐形飞机等的新式武器装备。1991年苏联解体，持续40多年的美、苏军备竞赛结束。但80年代后期至90年代初期军备竞赛出现了一些新特点，地区间的中小国家为推行地区霸权主义，大力加强军备，造成局部战争和地区冲突，成为影响国际和平的一个因素。第五十九届联大三日以压倒性多数通过了“防止外层空间军备竞赛”决议。一百七十八个国家投支持票，美国等四国弃权，没有国家反对。决议确认全人类在和平利用外空方面具有共同利益，重申防止外空军备竞赛的重要性和紧迫性，呼吁所有国家，特别是拥有强大空间能力的国家为和平利用外空和防止外空军备竞赛做出积极贡献。决议重申日内瓦裁军谈判会议在谈判防止外空军备竞赛多边协定方面的重要作用，希望裁军谈判会议于二00五年尽早设立外空问题特设委员会。决议充分反映了国际社会反对外空军备竞赛的共同意愿。

3.美苏军备竞赛的囚徒困境分析

在美苏军备竞赛中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

美苏军备竞双方希望在未知对方举措的情况下，达到自身利益的最大化，因此采取了非理性的选择，增加军备。在这种情况下，美苏冷战加剧，在军费上的过分投入，增加了各自经济的负担，最终拖垮了苏联的经济，并且加剧了苏联解体。二十世纪七十年代，苏联经济出现了上升的势头，石油和钢铁的产量一度超过了美国。苏联国家领导人勃列日涅夫于是高估了形势。利用美国的战略收缩之

际，在中东，中美洲和非洲进行渗透，甚至出兵阿富汗。美国忍无可忍，终于很快又抡起了经济大棒，在1979年对苏联进行一轮严厉的制裁，包括冻结约1.55亿元对苏高级技术出口的申请，终结对苏联的谷物出口，等等。在军事和政治不占压倒优势的情况下，经济优势就是打破平衡的砝码。而苏联因为战线太广，经济困难过大，尤其是小小的阿富汗战争，更使苏联经济失血过多，四百多亿扔在了阿富汗，伤的不轻。

军事输出和扩张行动从来都是军备竞赛的发展性必然。拥有武力的强权政治，绝不会满足于光秀肌肉，而是要非得折腾到严重肾亏为止。没有强有力经济支撑的军事扩张必然是短命的。经济发展的弊端在苏联已经是隐存已久的疾患，1978年，苏联的军费开支超过了美国，这意味着苏联开动了没有刹车制动的高速战车。而长时间漠视民生的后果也造成了越来越广泛的政治离心心理。这可能是导致苏联最终解体的最基础的原因。

在已知对方举措的前提下，为了达到风险最小，美国采用了不同的军备竞赛模式：美国用的是市场经济的全民体制，把军工订单交给民间的企业去开发。比如波音公司在军工业中举足轻重，又是民用航空业的老大。这样，军工技术的前沿开发的新技术马上可以转化到民用工业上来，军工的投资刺激了商用的发展，两者互相照应相得益彰。苏联则采取计划经济的“举国体制”，把全国的资源集中起来，在那些被封闭的无人区秘密研发军工技术。军工和民用工业被隔离起来，军工技术的成就无法回馈整个国民经济。不仅如此，因为军工耗资巨大而挤占了民用工业的发展空间，两者成了角逐国家财力的有你没我的“零和游戏”，军工越发展，国民经济的负担就越大，拖累了前苏联的发展进程。结果，虽然在军备竞赛上苏联可以和美国一时打成平手，但长期竞赛下去，输不起的是苏联。当美国设计了“星球大战”的圈套，让苏联投入无尽的国家资源，落得血本赔尽时，美国不费一抢一弹最终竟让第一个社会主义国家惨然谢幕。

相关文章

热门内容

标签