最近,我看到一张非常有趣的美剧截屏:
美剧截屏
中国科学院理论物理研究所真的有这么一篇论文吗?真的有,2014年发的,他们的官网有一篇文章介绍这个成果。
这篇论文的标题是《Social cycling and conditional responses in the Rock-Paper-Scissors game》(《石头-布-剪刀游戏中的社交循环和条件响应》),在《Scientific Reports》 杂志上发表。(原文链接:http://www.itp.cas.cn/xwzx/kydt/201407/t20140730_4169491.html)
你也许会问,这个游戏连三岁的小朋友都会玩,有什么可研究的?
答案是,他们发现了玩家选择下一次出什么时的“定向转动行为”。
论文报告了在浙江大学实验社会学实验室进行的跨度近四年的实验(2010月12月—2014月3月)。实验一共招募了浙江大学的360位学生,将他们分成 60 组,每组6 名学生,每一组都玩石头-剪刀-布的游戏 300 轮,每一轮都是这同样 6 名学生随机两两配对厮杀以攒取点数。游戏结束后,每名学生根据其赢得的总点数获得相应的真实报酬。
从这些实验结果,三位作者发现每个学生的游戏策略似乎很符合经典博弈论的纳什均衡理论,即石头、剪刀、布三种动作在每轮被选中的概率大约是三分之一。这完全是意料之中的。
但出人意料的是,由 6 名学生组成的群体的行为在统计上表现出偏离完全随机的定向转动行为。即如果上一轮的结果是赢,那么下一轮有最高的概率仍然采取上一轮已经采用过的动作;如果上一轮的结果是平,那么下一轮保持同样动作的概率也较高,但也有较高的概率逆时针改变动作(即从石头变为布、或从布变为剪刀、或从剪刀变为石头,即能赢上一轮跟自己持平的对手的那一个);但是,如果上一轮的结果是输,那么下一轮就有最高的概率顺时针改变动作(即从石头变为剪刀、或从剪刀变为布、或者从布变为石头,即能赢上一轮打败自己的对手的那一个)。三位研究者将这样的统计模式称为条件反应模式。
研究者们基于条件反应模式进行了理论建模,发现只考虑了条件反应模式的理论模型能够定量地解释几乎所有的实验观察事实,例如群体层次的定向转动行为、个体层次的动作选择惯性效应等等。
这项研究说明,人们看上去非常复杂的个体决策行为和群体动力学行为实际上可以基于很简单的条件反应模式进行理解。而且理论计算表明,通过优化条件反应模式的决策参数,群体有可能获得比采用纳什均衡策略更高的平均收益,因而实现更高的群体效益。
由此人们可以想到许多深入的问题。例如,条件反应模式到底是人脑的一种基本决策机制呢?还是只不过是更为根本的微观神经机制的后果和表现?
责任编辑:杨玉露
文章来源:风云之声微信公众号