论文部分内容阅读
摘 要: 囚徒困境作为博弈论的经典案例,说明了个人理性与集体理性之间的冲突。文 章将心理过程应用于博弈分析,得出了不同于传统囚徒困境的结论。在此基础上提出博弈分 析中应考虑心理、文化、制度的影响。这一研究对于博弈理论在社会科学中的应用及实验经 济学的理论发展具有一定的启示。
关键词:博弈论 囚徒困境 心理过程
中图分类号:C912 文献标识码:A
文章编号:1004-4914(2008)02-261-02
一、引言
囚徒困境可谓是博弈论的典型案例,几乎每一本博弈论教材都用此案例说明个人理性与 集体理性之间的冲突。其模型如图1所示,b>d>a>c,2d>b+c,即存在合作剩余。为便于分析 ,我们取a=-8,b=0,c=-10,d=-1,将数字代入得到博弈矩阵如图2所示,博弈的均衡解为 (背叛,背叛),即双方都将面临能否得到合作利益的囚徒困境。

囚徒是否总是处于困境之中?基于多重博弈条件下的囚徒决策机制的报复模型(Taylor ,1987)和声誉模型(Kreps,1990)的研究认为存在促进合作的激励,即通过报复、声誉等 机制,能形成合作的均衡。然而,对于一次性博弈(这也许是最可能的情形),囚徒能否走 出困境?博弈论给出了否定的答复。而这一明确的结论似乎与审讯实践的复杂性有一定出入 。要弄清楚这个问题,必须理解囚徒的决策机制。
在面临图2所示的决策时,有两种极端的决策方案,其一是两人都只关心自己的支付, 因(背叛,背叛)是均衡策略。另一极端则是根据演化稳定策略即制度决定。如果合作是演 化稳定策略,即选择合作,否则,选择背叛。
实际的囚徒决策过程可能较以上两种方式更为复杂。一般而言,人在博弈中采取策略是 一个心理过程。囚徒在面临审讯中不可能采用演化稳定策略,因为对大多数囚徒而言,这是 一个一次性博弈,本次博弈对自己的影响重大。而囚徒只关心支付结构而简单选择背叛也不 大可能,因为作为同案犯,他们会存在友情、共同利益等,也会存在对对方选择的猜测,其 决策会是一个对于情感评价以及对对方决策的猜测的心理过程,因而进入决策的不仅是支付 ,也存在对于支付结构的评价,这一决策的复杂性也得到了审讯实践的检验。
二、影响囚徒决策的因素分析
本文从囚徒对本人支付、对方支付以及对于可能出现的均衡结果的主观评价等因素分析 囚徒的决策。
(一)囚徒对于本人支付的主观评价
囚徒对于处罚值的主观评价即将外在的支付内化为个人损益值的过程。对同一支付值 ,不同的人会有不同的主观评价。比如1年的监禁,对于有些人来说是很重的处罚,因为他 们在狱中会感到度日如年,而对于多次入狱的累犯形成的心理压力要小得多。法律上有关累 犯从重处理便是这一问题的印证。
现在,我们将图1所示博弈一般化为图3,并对囚徒1,2对于支付的主观评价分别赋予 权重α1,α2,(α1,α2>0),这个赋值过程将外在博弈内化为内在博弈,得到 图4所示博弈支付结构 。显然,博弈的均衡策略没有改变,因为博弈双方对于自己在各种情况下的处罚值的评价为 同一系数。但由于博弈双方心理特征的差异,使得博弈由对称博弈转化为非对称博弈。

(二)囚徒对于对方支付的主观评价
在绝大多数情况下,囚徒双方都会对于对方支付赋予一定权重,内化到本人的支付函数 中,这一心理现象可以理解为双方的感情因素所致。一个极端的例子是父子同案,父亲可能 会对儿子的支付赋予高于本人支付的权重,即自己即使受到处罚,也只是认为罪有应得,而 儿子受到处罚,则会痛心不已。这里,假设囚徒1,2对于对方支付赋予权重β1,β2( β1,β2≥0),此时,支付矩阵如图5所示。
为了便于分析,我们将外在博弈的支付代入得支付矩阵如图6所示。

根據图6,可以得出如下结论:
对于囚徒1,当β1<1/9α1,无论对方作何选择,都选择背叛,这种情况可理解 为囚徒1虽然也同情和关心囚徒2,但更关心本人,因此,不会因为怜悯对方而改变自利的信 念;
当1/4α1>β1>1/9α1时,对方合作就选择合作,对方背叛选择背叛。即具有互惠利 他的动机,但在对方不合作的情况下是利己的;当β1>1/4α1时选择合作,无论对方作 何选择,都选择合作。即具有纯粹利他动机,即 使牺牲本人,也不会背叛。
同样,对于囚徒2,当β2<1/9α2,无论对方作何选择,都选择背叛;当1/4α2> β2>1/9α2时;对方合 作就选择合作,对方背叛选择背叛;当β1>1/4α2,无论对方作何选择,都选择合作。 图7给出了在各种情况下的均衡。可以看出,由于对他人支付的关切,使囚徒已部分走出了 困境。

(三)对于可能均衡结果的主观评价
以上分析了囚徒对于本人支付及对方支付的主观评价对于博弈的影响,这种评价只是对 于外在博弈的一种自然反应,即对于处罚值本身的敏感性,尚未涉及对于博弈结果的主观评 价,即用道德和价值观念对可能出现的均衡结果的评价。
囚徒在(背叛,背叛),(合作,合作)的均衡中不会有道德与正义的反差,而在两人 做出不同的选择时,这种社会道德价值会发挥评判作用。在自己选择合作,对方选择背叛时 , 会忌恨对方而后悔自己的选择,后悔值与自己的损失成正比。而在他人选择合作,自己选择 背叛时会产生内疚,内疚值与对方的损失成正比。而后悔权重和内疚权重受个体所处的制度 文化背景影响。这里,分别对囚徒1,2赋予后悔权重γ1,γ2,内疚权重δ1,δ2 ,则对于囚徒1,其后 悔值为γ1(A11-A21),内疚值为δ1(B22-B12)。同理得 囚徒2的后悔值γ2(B11-B12),内疚 值为δ2(A22-A21)。由此得出博弈矩阵如图8所示,将图2所示外在博弈确 定的支付代入得博弈矩阵如图9所示。

与图6比较,图9中的策略(背叛,背叛)与(合作,合作)的支付并没有发生变化,策 略(背叛,合作),(合作,背叛)的支付变小,由此可以得出如下结论:由于对公平偏好 的影响,(背叛,背叛)与(合作,合作)的均衡概率增加。
三、结论与启示
外在博弈确定的支付结构不同于参与人面临的博弈,参与人的内在博弈是对外在博弈的 支付进行评价后形成的博弈。因此,对外在博弈求纳什均衡解并无意义,因为对于同一外在 博弈,不同的决策者,其面临的内在博弈并不相同,因此,均衡解可能是多样的。
从决策者的认知模式及情境出发求得特定的均衡解是博弈分析的关键,求解博弈的均衡 解需要了解人的心理过程。由于进入囚徒决策的不仅是支付,也包含他对于支付的主观评价 ,所以决策过程是反复评价支付以确定其权重的过程,囚徒面临的困境是权重的确定。一旦 各种权重确定,均衡随之确定。
应用博弈论分析社会现象要充分考虑社会现象的复杂性。一个博弈中支付的主观评价的 权重往往外生于本博弈,它可能是由制度文化确定,或者说由其它相关博弈(特别是发生频 率较高的博弈)的均衡策略确定,即流行规范内部化为个人的偏好。因此,博弈之间具有关 联性,非均衡结果在其它博弈的影响下可能成为均衡结果。本文仍以完全信息为前提,不完 全信息条件下的囚徒决策更为复杂。
[本文为中国制度经济学会2007年年会暨海峡两岸经济发展学术研讨会入选论文]
参考文献:
1.萨缪•鲍尔斯.微观经济学:行为,制度和演化.北京:中国人民大学出版社,2006
2.张维迎.博弈论与信息经济学.上海:上海三联书店,上海人民出版社,1996
3.青木昌彦.比较制度分析.上海:上海远东出版社,2001
4.Kreps, David M. 1990.” Corporate Culture and Economic Theory.” pp.90-14 3 in Perspectives on Positive Political Economy. James Alt and Kenneth Shepsle,eds. Cambridge : Cambridge University Press
(作者单位:华中农业大学经济管理学院湖北武汉430070)
(责编:纪毅)
关键词:博弈论 囚徒困境 心理过程
中图分类号:C912 文献标识码:A
文章编号:1004-4914(2008)02-261-02
一、引言
囚徒困境可谓是博弈论的典型案例,几乎每一本博弈论教材都用此案例说明个人理性与 集体理性之间的冲突。其模型如图1所示,b>d>a>c,2d>b+c,即存在合作剩余。为便于分析 ,我们取a=-8,b=0,c=-10,d=-1,将数字代入得到博弈矩阵如图2所示,博弈的均衡解为 (背叛,背叛),即双方都将面临能否得到合作利益的囚徒困境。

囚徒是否总是处于困境之中?基于多重博弈条件下的囚徒决策机制的报复模型(Taylor ,1987)和声誉模型(Kreps,1990)的研究认为存在促进合作的激励,即通过报复、声誉等 机制,能形成合作的均衡。然而,对于一次性博弈(这也许是最可能的情形),囚徒能否走 出困境?博弈论给出了否定的答复。而这一明确的结论似乎与审讯实践的复杂性有一定出入 。要弄清楚这个问题,必须理解囚徒的决策机制。
在面临图2所示的决策时,有两种极端的决策方案,其一是两人都只关心自己的支付, 因(背叛,背叛)是均衡策略。另一极端则是根据演化稳定策略即制度决定。如果合作是演 化稳定策略,即选择合作,否则,选择背叛。
实际的囚徒决策过程可能较以上两种方式更为复杂。一般而言,人在博弈中采取策略是 一个心理过程。囚徒在面临审讯中不可能采用演化稳定策略,因为对大多数囚徒而言,这是 一个一次性博弈,本次博弈对自己的影响重大。而囚徒只关心支付结构而简单选择背叛也不 大可能,因为作为同案犯,他们会存在友情、共同利益等,也会存在对对方选择的猜测,其 决策会是一个对于情感评价以及对对方决策的猜测的心理过程,因而进入决策的不仅是支付 ,也存在对于支付结构的评价,这一决策的复杂性也得到了审讯实践的检验。
二、影响囚徒决策的因素分析
本文从囚徒对本人支付、对方支付以及对于可能出现的均衡结果的主观评价等因素分析 囚徒的决策。
(一)囚徒对于本人支付的主观评价
囚徒对于处罚值的主观评价即将外在的支付内化为个人损益值的过程。对同一支付值 ,不同的人会有不同的主观评价。比如1年的监禁,对于有些人来说是很重的处罚,因为他 们在狱中会感到度日如年,而对于多次入狱的累犯形成的心理压力要小得多。法律上有关累 犯从重处理便是这一问题的印证。
现在,我们将图1所示博弈一般化为图3,并对囚徒1,2对于支付的主观评价分别赋予 权重α1,α2,(α1,α2>0),这个赋值过程将外在博弈内化为内在博弈,得到 图4所示博弈支付结构 。显然,博弈的均衡策略没有改变,因为博弈双方对于自己在各种情况下的处罚值的评价为 同一系数。但由于博弈双方心理特征的差异,使得博弈由对称博弈转化为非对称博弈。

(二)囚徒对于对方支付的主观评价
在绝大多数情况下,囚徒双方都会对于对方支付赋予一定权重,内化到本人的支付函数 中,这一心理现象可以理解为双方的感情因素所致。一个极端的例子是父子同案,父亲可能 会对儿子的支付赋予高于本人支付的权重,即自己即使受到处罚,也只是认为罪有应得,而 儿子受到处罚,则会痛心不已。这里,假设囚徒1,2对于对方支付赋予权重β1,β2( β1,β2≥0),此时,支付矩阵如图5所示。
为了便于分析,我们将外在博弈的支付代入得支付矩阵如图6所示。

根據图6,可以得出如下结论:
对于囚徒1,当β1<1/9α1,无论对方作何选择,都选择背叛,这种情况可理解 为囚徒1虽然也同情和关心囚徒2,但更关心本人,因此,不会因为怜悯对方而改变自利的信 念;
当1/4α1>β1>1/9α1时,对方合作就选择合作,对方背叛选择背叛。即具有互惠利 他的动机,但在对方不合作的情况下是利己的;当β1>1/4α1时选择合作,无论对方作 何选择,都选择合作。即具有纯粹利他动机,即 使牺牲本人,也不会背叛。
同样,对于囚徒2,当β2<1/9α2,无论对方作何选择,都选择背叛;当1/4α2> β2>1/9α2时;对方合 作就选择合作,对方背叛选择背叛;当β1>1/4α2,无论对方作何选择,都选择合作。 图7给出了在各种情况下的均衡。可以看出,由于对他人支付的关切,使囚徒已部分走出了 困境。

(三)对于可能均衡结果的主观评价
以上分析了囚徒对于本人支付及对方支付的主观评价对于博弈的影响,这种评价只是对 于外在博弈的一种自然反应,即对于处罚值本身的敏感性,尚未涉及对于博弈结果的主观评 价,即用道德和价值观念对可能出现的均衡结果的评价。
囚徒在(背叛,背叛),(合作,合作)的均衡中不会有道德与正义的反差,而在两人 做出不同的选择时,这种社会道德价值会发挥评判作用。在自己选择合作,对方选择背叛时 , 会忌恨对方而后悔自己的选择,后悔值与自己的损失成正比。而在他人选择合作,自己选择 背叛时会产生内疚,内疚值与对方的损失成正比。而后悔权重和内疚权重受个体所处的制度 文化背景影响。这里,分别对囚徒1,2赋予后悔权重γ1,γ2,内疚权重δ1,δ2 ,则对于囚徒1,其后 悔值为γ1(A11-A21),内疚值为δ1(B22-B12)。同理得 囚徒2的后悔值γ2(B11-B12),内疚 值为δ2(A22-A21)。由此得出博弈矩阵如图8所示,将图2所示外在博弈确 定的支付代入得博弈矩阵如图9所示。

与图6比较,图9中的策略(背叛,背叛)与(合作,合作)的支付并没有发生变化,策 略(背叛,合作),(合作,背叛)的支付变小,由此可以得出如下结论:由于对公平偏好 的影响,(背叛,背叛)与(合作,合作)的均衡概率增加。
三、结论与启示
外在博弈确定的支付结构不同于参与人面临的博弈,参与人的内在博弈是对外在博弈的 支付进行评价后形成的博弈。因此,对外在博弈求纳什均衡解并无意义,因为对于同一外在 博弈,不同的决策者,其面临的内在博弈并不相同,因此,均衡解可能是多样的。
从决策者的认知模式及情境出发求得特定的均衡解是博弈分析的关键,求解博弈的均衡 解需要了解人的心理过程。由于进入囚徒决策的不仅是支付,也包含他对于支付的主观评价 ,所以决策过程是反复评价支付以确定其权重的过程,囚徒面临的困境是权重的确定。一旦 各种权重确定,均衡随之确定。
应用博弈论分析社会现象要充分考虑社会现象的复杂性。一个博弈中支付的主观评价的 权重往往外生于本博弈,它可能是由制度文化确定,或者说由其它相关博弈(特别是发生频 率较高的博弈)的均衡策略确定,即流行规范内部化为个人的偏好。因此,博弈之间具有关 联性,非均衡结果在其它博弈的影响下可能成为均衡结果。本文仍以完全信息为前提,不完 全信息条件下的囚徒决策更为复杂。
[本文为中国制度经济学会2007年年会暨海峡两岸经济发展学术研讨会入选论文]
参考文献:
1.萨缪•鲍尔斯.微观经济学:行为,制度和演化.北京:中国人民大学出版社,2006
2.张维迎.博弈论与信息经济学.上海:上海三联书店,上海人民出版社,1996
3.青木昌彦.比较制度分析.上海:上海远东出版社,2001
4.Kreps, David M. 1990.” Corporate Culture and Economic Theory.” pp.90-14 3 in Perspectives on Positive Political Economy. James Alt and Kenneth Shepsle,eds. Cambridge : Cambridge University Press
(作者单位:华中农业大学经济管理学院湖北武汉430070)
(责编:纪毅)