论文部分内容阅读
博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。需要把博弈双方每个阶段的情况都罗列出来,然后再去按阶段进行分析,最终找到我们想要的均衡的最佳点。本文将介绍学校生活中的两个例子,以博弈论的角度来分析,以此说明博弈论就在我们的学校生活中。
逃课博弈 食堂博弈
逃课博弈
逃课现象已经算是高校里面独特的一景了,学校已经注意到这个问题了,且对这个问题很是头疼,但始终找不到一个合适的解决方法。
逃课现象的根本原因在于人心中的惰性,当有第一个人开始逃课的之后,其他人发现其逃课可以去做自己想做的事情,使其自己那个时间的收益达到了最大化,这种现象可以采用“同时博弈”来分析。
假设存在参与人甲同学和乙同学,各自的策略组合都是上课与逃课两种,假设两人均上课的收益各自是5,逃课的收益各自是10(从人的惰性分析),如果一人上课一人逃课的话,那么逃课的收益是12,上课的收益是3(从人的幸灾乐祸和嫉妒分析)。在这些假设前提下,可以构造出一个博弈矩阵:
矩阵的左边表示甲同学的策略,即上课或逃课,上边表示乙同学的策略,也是逃课和上课,矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中,每一个数字组合的第一个数字是甲同学得到的支付,第二个数字是乙同学得到的支付。例如,当甲选择上课时,乙也选择上课时,结果得到矩阵左上角单元格里的数字组合(5,5),其中第一个数字5是甲同学得到的支付,第二个数字5是乙同学得到的支付,如此等等。
从这个矩阵中可以看出,无论对于甲和乙来说,逃课都是严格优博弈。所以,一个懒惰的理性参与者都会选择逃课。基于这种分析,逃课现象就可以得到很好的解释了。这个博弈的纳什均衡很容易找到,那就是(逃课,逃课)。按照常理来说,如果双方都不逃课的话,那么就没有逃课现象了,很明显,这个解是不稳定的,总有人不愿意去上课,内心不坚定的人看到别人逃课去做了短时期内使自己收益最大的事情,那么他自己也会去效仿;其次,逃课也没有什么严重的后果,没有什么明确的惩罚机制,没有严格约束的环境。所以,这个博弈最终解都是去选择逃课这一纳什均衡。
要解决这个问题,就需要设计出一个好的机制:可以采用第三方干涉,学校充当第三方的角色,对于逃课建立严格的奖惩机制,再配合上实地查课,可以让同学们相互监督,对于举报逃课的同学进行奖励,对逃课的同学严厉惩罚,让上课老师对上课的同学进行期末考试的加分,逃课的同学进行扣分,使其对自己逃课的行为进行负责,承担一定的责任。
买饭博弈
每次中午下课之后,食堂就拥挤不堪,可谓是人生人海。每个人都想着早点打饭,为此就会经常听到不和谐的声音,有的同学为了省事就插队,进而与别人发生争吵,结果是损人不利己,自己没有在插队中得到收益,还对别人造成了麻烦。其实,这种生活现象也可以用博弈论中的序贯博弈来分析。所谓的“序贯博弈”是指参与者选择策略有时间先后的博弈形式,特别地,后行动的参与人可以观察到先行动的参与人已经采取了的策略。
假设只有甲和乙两个参与人,甲的选择是两种,排队和不排队,而乙会根据甲的选择做出自己的选择,如果甲选择了排队,那么乙不会說什么,双方不会发生争吵;相反,如果甲选择了不排队,直接插队到前面的话,那么乙要么妥协,,要么抵抗,双方可能引发冲突。这种情况下,就存在一种博弈行为,可用下面的博弈树来表示这个博弈。
博弈树是自左向右伸展的,由一下“点”和“线段”(组成。其中包括“起点”、“中间点”和“终点”;点与点之间由线段连接;在点和线段旁边文字和数字进一步说明了它们的具体含义。
容易看到,(自上而下数起的)第一个终点(排队,妥协)是一个纳什均衡。在该策略组合上,没有那个人愿意单独来改变自己的策略,首先,乙不会单独改变自己的策略。如果他单独改变策略,即将原来的妥协变为抵抗,这是不符合逻辑的。其次,当甲选择不排队时,乙为了自己的利益,必然会选择抵抗。
除了第一个是纳什均衡外,其余的策略组合均不是纳什均衡。首先,由第二个中点所代表的策略组合(排队,妥协)不是纳什均衡——此时,乙将单独改变自己的策略将使自己的支付从-1提高到4,甲单独改变自己的策略使自己的支付从3提高到4;其次,由第三个终点所代表的策略组合(不排队,妥协)不是纳什均衡——此时,乙会单独改变自己的策略,使自己的的支付从1提高到3;最后,由第四个终点所代表的策略组合(不排队,抵抗)不是纳什均衡——此时,甲会单独改变自己的策略将使自己的支付从2提高到4。
根据逆向归纳法,如果甲选择排队,则乙当然会妥协——妥协的支付是4,大于抵抗的支付-1。于是就可以删除第二条线段;另一方面,如果甲选择不排队,则乙显然应当抵抗—妥协的支付是3,大于妥协的支付1。于是又可以删除第三调线段。再看甲的选择,必然会选择排队,所以最终得到的博弈均衡是(排队,妥协)收益是(4,4)。
结束语
在以上的两个例子中,可以看出博弈就存在于我们的校园生活中。在逃课博弈中,应该认识到,逃课的机会成本过大,长久下去逃课的收益是远小于其机会成本的,而且,作为学生应该知道,学习是第一要务,不能为了短期的收益而把自己的本业抛掷脑后,认识到这一点,逃课现象就不会存在了。另外学校应该是一个和谐的学习生活环境,我们生活在开放的校园中,应遵守“先来后到”这约定俗成的准则,退一步海阔天空,别为了小事而破坏和谐的环境,想着插队是为了节省时间,其实是浪费了时间,类似于食堂打饭不排队的不和谐现象就不应该存在与我们的校园中。
[1] 高鸿业.西方经济学(第五版)[M].中国人民大学出版社,2010.
[2] 阚燕、方晓.《博弈论在生活中的应用》[J].管理学家,2011.
逃课博弈 食堂博弈
逃课博弈
逃课现象已经算是高校里面独特的一景了,学校已经注意到这个问题了,且对这个问题很是头疼,但始终找不到一个合适的解决方法。
逃课现象的根本原因在于人心中的惰性,当有第一个人开始逃课的之后,其他人发现其逃课可以去做自己想做的事情,使其自己那个时间的收益达到了最大化,这种现象可以采用“同时博弈”来分析。
假设存在参与人甲同学和乙同学,各自的策略组合都是上课与逃课两种,假设两人均上课的收益各自是5,逃课的收益各自是10(从人的惰性分析),如果一人上课一人逃课的话,那么逃课的收益是12,上课的收益是3(从人的幸灾乐祸和嫉妒分析)。在这些假设前提下,可以构造出一个博弈矩阵:
矩阵的左边表示甲同学的策略,即上课或逃课,上边表示乙同学的策略,也是逃课和上课,矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中,每一个数字组合的第一个数字是甲同学得到的支付,第二个数字是乙同学得到的支付。例如,当甲选择上课时,乙也选择上课时,结果得到矩阵左上角单元格里的数字组合(5,5),其中第一个数字5是甲同学得到的支付,第二个数字5是乙同学得到的支付,如此等等。
从这个矩阵中可以看出,无论对于甲和乙来说,逃课都是严格优博弈。所以,一个懒惰的理性参与者都会选择逃课。基于这种分析,逃课现象就可以得到很好的解释了。这个博弈的纳什均衡很容易找到,那就是(逃课,逃课)。按照常理来说,如果双方都不逃课的话,那么就没有逃课现象了,很明显,这个解是不稳定的,总有人不愿意去上课,内心不坚定的人看到别人逃课去做了短时期内使自己收益最大的事情,那么他自己也会去效仿;其次,逃课也没有什么严重的后果,没有什么明确的惩罚机制,没有严格约束的环境。所以,这个博弈最终解都是去选择逃课这一纳什均衡。
要解决这个问题,就需要设计出一个好的机制:可以采用第三方干涉,学校充当第三方的角色,对于逃课建立严格的奖惩机制,再配合上实地查课,可以让同学们相互监督,对于举报逃课的同学进行奖励,对逃课的同学严厉惩罚,让上课老师对上课的同学进行期末考试的加分,逃课的同学进行扣分,使其对自己逃课的行为进行负责,承担一定的责任。
买饭博弈
每次中午下课之后,食堂就拥挤不堪,可谓是人生人海。每个人都想着早点打饭,为此就会经常听到不和谐的声音,有的同学为了省事就插队,进而与别人发生争吵,结果是损人不利己,自己没有在插队中得到收益,还对别人造成了麻烦。其实,这种生活现象也可以用博弈论中的序贯博弈来分析。所谓的“序贯博弈”是指参与者选择策略有时间先后的博弈形式,特别地,后行动的参与人可以观察到先行动的参与人已经采取了的策略。
假设只有甲和乙两个参与人,甲的选择是两种,排队和不排队,而乙会根据甲的选择做出自己的选择,如果甲选择了排队,那么乙不会說什么,双方不会发生争吵;相反,如果甲选择了不排队,直接插队到前面的话,那么乙要么妥协,,要么抵抗,双方可能引发冲突。这种情况下,就存在一种博弈行为,可用下面的博弈树来表示这个博弈。
博弈树是自左向右伸展的,由一下“点”和“线段”(组成。其中包括“起点”、“中间点”和“终点”;点与点之间由线段连接;在点和线段旁边文字和数字进一步说明了它们的具体含义。
容易看到,(自上而下数起的)第一个终点(排队,妥协)是一个纳什均衡。在该策略组合上,没有那个人愿意单独来改变自己的策略,首先,乙不会单独改变自己的策略。如果他单独改变策略,即将原来的妥协变为抵抗,这是不符合逻辑的。其次,当甲选择不排队时,乙为了自己的利益,必然会选择抵抗。
除了第一个是纳什均衡外,其余的策略组合均不是纳什均衡。首先,由第二个中点所代表的策略组合(排队,妥协)不是纳什均衡——此时,乙将单独改变自己的策略将使自己的支付从-1提高到4,甲单独改变自己的策略使自己的支付从3提高到4;其次,由第三个终点所代表的策略组合(不排队,妥协)不是纳什均衡——此时,乙会单独改变自己的策略,使自己的的支付从1提高到3;最后,由第四个终点所代表的策略组合(不排队,抵抗)不是纳什均衡——此时,甲会单独改变自己的策略将使自己的支付从2提高到4。
根据逆向归纳法,如果甲选择排队,则乙当然会妥协——妥协的支付是4,大于抵抗的支付-1。于是就可以删除第二条线段;另一方面,如果甲选择不排队,则乙显然应当抵抗—妥协的支付是3,大于妥协的支付1。于是又可以删除第三调线段。再看甲的选择,必然会选择排队,所以最终得到的博弈均衡是(排队,妥协)收益是(4,4)。
结束语
在以上的两个例子中,可以看出博弈就存在于我们的校园生活中。在逃课博弈中,应该认识到,逃课的机会成本过大,长久下去逃课的收益是远小于其机会成本的,而且,作为学生应该知道,学习是第一要务,不能为了短期的收益而把自己的本业抛掷脑后,认识到这一点,逃课现象就不会存在了。另外学校应该是一个和谐的学习生活环境,我们生活在开放的校园中,应遵守“先来后到”这约定俗成的准则,退一步海阔天空,别为了小事而破坏和谐的环境,想着插队是为了节省时间,其实是浪费了时间,类似于食堂打饭不排队的不和谐现象就不应该存在与我们的校园中。
[1] 高鸿业.西方经济学(第五版)[M].中国人民大学出版社,2010.
[2] 阚燕、方晓.《博弈论在生活中的应用》[J].管理学家,2011.