囚徒的困境与出路

来源 :经济师 | 被引量 : 0次 | 上传用户:lionados
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 囚徒困境作为博弈论的经典案例,说明了个人理性与集体理性之间的冲突。文 章将心理过程应用于博弈分析,得出了不同于传统囚徒困境的结论。在此基础上提出博弈分 析中应考虑心理、文化、制度的影响。这一研究对于博弈理论在社会科学中的应用及实验经 济学的理论发展具有一定的启示。
  关键词:博弈论 囚徒困境 心理过程
  中图分类号:C912 文献标识码:A
  文章编号:1004-4914(2008)02-261-02
  
  一、引言
  
   囚徒困境可谓是博弈论的典型案例,几乎每一本博弈论教材都用此案例说明个人理性与 集体理性之间的冲突。其模型如图1所示,b>d>a>c,2d>b+c,即存在合作剩余。为便于分析 ,我们取a=-8,b=0,c=-10,d=-1,将数字代入得到博弈矩阵如图2所示,博弈的均衡解为 (背叛,背叛),即双方都将面临能否得到合作利益的囚徒困境。
  


  囚徒是否总是处于困境之中?基于多重博弈条件下的囚徒决策机制的报复模型(Taylor ,1987)和声誉模型(Kreps,1990)的研究认为存在促进合作的激励,即通过报复、声誉等 机制,能形成合作的均衡。然而,对于一次性博弈(这也许是最可能的情形),囚徒能否走 出困境?博弈论给出了否定的答复。而这一明确的结论似乎与审讯实践的复杂性有一定出入 。要弄清楚这个问题,必须理解囚徒的决策机制。
  在面临图2所示的决策时,有两种极端的决策方案,其一是两人都只关心自己的支付, 因(背叛,背叛)是均衡策略。另一极端则是根据演化稳定策略即制度决定。如果合作是演 化稳定策略,即选择合作,否则,选择背叛。
  实际的囚徒决策过程可能较以上两种方式更为复杂。一般而言,人在博弈中采取策略是 一个心理过程。囚徒在面临审讯中不可能采用演化稳定策略,因为对大多数囚徒而言,这是 一个一次性博弈,本次博弈对自己的影响重大。而囚徒只关心支付结构而简单选择背叛也不 大可能,因为作为同案犯,他们会存在友情、共同利益等,也会存在对对方选择的猜测,其 决策会是一个对于情感评价以及对对方决策的猜测的心理过程,因而进入决策的不仅是支付 ,也存在对于支付结构的评价,这一决策的复杂性也得到了审讯实践的检验。
  
  二、影响囚徒决策的因素分析
  
  本文从囚徒对本人支付、对方支付以及对于可能出现的均衡结果的主观评价等因素分析 囚徒的决策。
  
  (一)囚徒对于本人支付的主观评价
  囚徒对于处罚值的主观评价即将外在的支付内化为个人损益值的过程。对同一支付值 ,不同的人会有不同的主观评价。比如1年的监禁,对于有些人来说是很重的处罚,因为他 们在狱中会感到度日如年,而对于多次入狱的累犯形成的心理压力要小得多。法律上有关累 犯从重处理便是这一问题的印证。
  现在,我们将图1所示博弈一般化为图3,并对囚徒1,2对于支付的主观评价分别赋予 权重α1,α2,(α1,α2>0),这个赋值过程将外在博弈内化为内在博弈,得到 图4所示博弈支付结构 。显然,博弈的均衡策略没有改变,因为博弈双方对于自己在各种情况下的处罚值的评价为 同一系数。但由于博弈双方心理特征的差异,使得博弈由对称博弈转化为非对称博弈。
  


  
  (二)囚徒对于对方支付的主观评价
  在绝大多数情况下,囚徒双方都会对于对方支付赋予一定权重,内化到本人的支付函数 中,这一心理现象可以理解为双方的感情因素所致。一个极端的例子是父子同案,父亲可能 会对儿子的支付赋予高于本人支付的权重,即自己即使受到处罚,也只是认为罪有应得,而 儿子受到处罚,则会痛心不已。这里,假设囚徒1,2对于对方支付赋予权重β1,β2( β1,β2≥0),此时,支付矩阵如图5所示。
  为了便于分析,我们将外在博弈的支付代入得支付矩阵如图6所示。
  


  根據图6,可以得出如下结论:
  对于囚徒1,当β1<1/9α1,无论对方作何选择,都选择背叛,这种情况可理解 为囚徒1虽然也同情和关心囚徒2,但更关心本人,因此,不会因为怜悯对方而改变自利的信 念;
  当1/4α11>1/9α1时,对方合作就选择合作,对方背叛选择背叛。即具有互惠利 他的动机,但在对方不合作的情况下是利己的;当β1>1/4α1时选择合作,无论对方作 何选择,都选择合作。即具有纯粹利他动机,即 使牺牲本人,也不会背叛。
  同样,对于囚徒2,当β2<1/9α2,无论对方作何选择,都选择背叛;当1/4α2> β2>1/9α2时;对方合 作就选择合作,对方背叛选择背叛;当β1>1/4α2,无论对方作何选择,都选择合作。 图7给出了在各种情况下的均衡。可以看出,由于对他人支付的关切,使囚徒已部分走出了 困境。
  


  
  (三)对于可能均衡结果的主观评价
  以上分析了囚徒对于本人支付及对方支付的主观评价对于博弈的影响,这种评价只是对 于外在博弈的一种自然反应,即对于处罚值本身的敏感性,尚未涉及对于博弈结果的主观评 价,即用道德和价值观念对可能出现的均衡结果的评价。
  囚徒在(背叛,背叛),(合作,合作)的均衡中不会有道德与正义的反差,而在两人 做出不同的选择时,这种社会道德价值会发挥评判作用。在自己选择合作,对方选择背叛时 , 会忌恨对方而后悔自己的选择,后悔值与自己的损失成正比。而在他人选择合作,自己选择 背叛时会产生内疚,内疚值与对方的损失成正比。而后悔权重和内疚权重受个体所处的制度 文化背景影响。这里,分别对囚徒1,2赋予后悔权重γ1,γ2,内疚权重δ1,δ2 ,则对于囚徒1,其后 悔值为γ1(A11-A21),内疚值为δ1(B22-B12)。同理得 囚徒2的后悔值γ2(B11-B12),内疚 值为δ2(A22-A21)。由此得出博弈矩阵如图8所示,将图2所示外在博弈确 定的支付代入得博弈矩阵如图9所示。
  


  与图6比较,图9中的策略(背叛,背叛)与(合作,合作)的支付并没有发生变化,策 略(背叛,合作),(合作,背叛)的支付变小,由此可以得出如下结论:由于对公平偏好 的影响,(背叛,背叛)与(合作,合作)的均衡概率增加。
  
  三、结论与启示
  
  外在博弈确定的支付结构不同于参与人面临的博弈,参与人的内在博弈是对外在博弈的 支付进行评价后形成的博弈。因此,对外在博弈求纳什均衡解并无意义,因为对于同一外在 博弈,不同的决策者,其面临的内在博弈并不相同,因此,均衡解可能是多样的。
  从决策者的认知模式及情境出发求得特定的均衡解是博弈分析的关键,求解博弈的均衡 解需要了解人的心理过程。由于进入囚徒决策的不仅是支付,也包含他对于支付的主观评价 ,所以决策过程是反复评价支付以确定其权重的过程,囚徒面临的困境是权重的确定。一旦 各种权重确定,均衡随之确定。
  应用博弈论分析社会现象要充分考虑社会现象的复杂性。一个博弈中支付的主观评价的 权重往往外生于本博弈,它可能是由制度文化确定,或者说由其它相关博弈(特别是发生频 率较高的博弈)的均衡策略确定,即流行规范内部化为个人的偏好。因此,博弈之间具有关 联性,非均衡结果在其它博弈的影响下可能成为均衡结果。本文仍以完全信息为前提,不完 全信息条件下的囚徒决策更为复杂。
  [本文为中国制度经济学会2007年年会暨海峡两岸经济发展学术研讨会入选论文]
  
  参考文献:
  1.萨缪•鲍尔斯.微观经济学:行为,制度和演化.北京:中国人民大学出版社,2006
  2.张维迎.博弈论与信息经济学.上海:上海三联书店,上海人民出版社,1996
  3.青木昌彦.比较制度分析.上海:上海远东出版社,2001
  4.Kreps, David M. 1990.” Corporate Culture and Economic Theory.” pp.90-14 3 in Perspectives on Positive Political Economy. James Alt and Kenneth Shepsle,eds. Cambridge : Cambridge University Press
  (作者单位:华中农业大学经济管理学院湖北武汉430070)
  (责编:纪毅)
其他文献
摘 要: 文章以各地相继出现的城市户外广告资源的有偿使用办法为切入点,以法经济学的视角 解读地方政府经营户外广告资源的相关政策,并从理论上阐释了户外广告资源的产权 归属问题,给出明确的产权安排,确保发挥出户外广告资源的最大效用,从而为经济发展提 供支持。  关键词:户外广告资源 法经济学 产权  中图分类号:D922.294文献标识码:A  文章编号:1004-4914(2008)02-083-0
期刊
本论文共分三章,第一章综述了苯乙腈类化合物反应的研究进展;第二章研究了KI/I<,2>体系促进的苯甲酸酯的合成;第三章研究了由苯乙腈类化合物与萘甲醛反应合成α-苯代-β-萘代丙烯腈系列化合物及其发光性质。 第一章分类综述了苯乙腈类化合物参与的有机反应,其中包括苯乙腈的α-烷基化反应,α-芳基化反应,锂化苯乙腈等,成环反应与在医药合成中的应用,以及苯乙腈在生物学上的研究成果。 在第二章,综述了芳香羧酸酯的间接合成方法,研究了一种新的芳香甲酸酯合成方法,产物结构经IR,<1>HNMR确证,
摘 要: 总部经济作为经济全球化大趋势下产生的新生事物而备受世人瞩目,它已经逐步成为 企业集团特别是跨国企业集团的一种主流的资源配置模式,并成为许多国家和地区所追求的 新的经济形态。文章通过对北京、上海、广州等国内主要中心城市总部经济发展现状的描述 ,分析我国总部经济发展过程中存在的问题和不足,并提出相应对策。最后,针对厦门市的 实际情况,提出厦门市打造成海峡西岸区域性研发中心总部,并重点发展几个
期刊
摘 要: 大学生是一个特殊的社会群体,社会发展与经济增长给大学生的消费观念带来巨 大的冲击,引导和教育大学生树立正确的消费观念,进行正确的消费行为引导已是一个刻不 容缓的问题。文章对华桥大学大学生的消费状况进行了随机抽样调查和深入采访,详细地分 析了大学生的消费水平、消费特点及其影响因素,并提出了改进办法。  关键词:大学生 消费状况 调查 分析  中图分类号:G645文献标识码:A  文章编号:
期刊
摘 要:同一事件的陈述介绍在语篇分析之下可折射出不同的语篇意义;一个文本的语言组织 是否得当,可通过对其进行语篇分析得出客观的评价。文章从及物性、人际功能与文本主题 三个方面,对大英百科全书以及前“911”委员会对这一恐怖事件的陈述分别进行纵向 分析和 横向比较,进一步佐证文本的语言与组织是以其根本目的为基础和依托,必须能为其目的服 务。文本分析的过程及结果,无论是从语言学研究角度还是从教学的角度
期刊
摘 要: 影响外语教学效果的因素很多,而情感因素就是影响TELF的重要因素之一。因 此,在TELF中如何运用积极的情感策略,提高外语教学的效果就显得十分重要。文章以克拉 申(Krashen)的情感过滤假说 (the Affective Filter Hypothesis)理论为依托,归纳了影 响TELF的主要情感障碍,并提出了相应的解决对策。  关键词:TELF情感因素障碍策略  中图分类号:G6
期刊
摘 要: 讨论教学法符合教育规律并且具有深远的意义,但是由于讨论教学法存在种种困境,所以当 前高校讨论课的实 效性和普及性不高。主要的困境有:冷场;教师定位暧昧;目的流失和优等生垄断。要破解 这些困境,必须做到有的放矢、对症下药。  关键词:讨论教学 困境 破解  中图分类号:G642文献标识码:A  文章编号:1004-4914(2008)02-133-02  结构主义理论认为:教师的作用要从传
期刊
摘 要: 文章从资本结构入手,通过对在深证及上证上市的124家家族企业的实证分析表明:家 族企业负债与托宾Q值正相关,与净资产收益率呈负相关,与企业成长性无显著关系;且不 存在一个理论临界值及负债区间。  关键词:家族企业 资本结构企业绩效负债率  中图分类号:F830.91文献标识码:A  文章编号:1004-4914(2008)02-093-03  20世纪90年代以来,伴随着世界范围的科技进
期刊
摘 要: 企业要想赢得忠诚的顾客,首先要赢得忠诚的员工。文章以CRM理论为基础,首先,提出了员工关系发展的过程;接着,构建了员工关系管理分析模型框架,并从三个不同阶段分析了其组成要素;然后,设计了员工关系评价体系。  关键词:CRM理论 员工关系管理 员工满意度 评价体系  中图分类号:F243文献标识码:A  文章编号:1004-4914(2008)02-172-02    近年来,日趋激烈的市
期刊
摘 要: 通过运用数学层次分析法,建立区域金融稳定评价指标体系及模型。对温州区域金融稳定进行实证对比分析,从而判断温州区域金融稳定状况,具有一定实践意义。    关键词:层次分析法 金融稳定 分析  中图分类号:F830文献标识码:A  文章编号:1004-4914(2008)02-211-02    一、关于层次分析法    层次分析法(Analytic Hierarchy Process,简称
期刊