von Neumann, Life and Evolution

Evolutionary Game Theory and Development Dynamics（PDF下载链接）

John von Neumann

先看标题中提到的John von Neumann（冯诺伊曼）是何许人也？他最为众所周知的一个身份就是“电子计算机之父”。他在参与曼哈顿计划时遇到了复杂的计算问题，后来听说了ENIAC计算机的计划后就投身了这个事业，在1945年提出了第一个冯诺伊曼结构（二进制和内存）的计算机EDVAC的设计，宣告了电子计算机时代的开始。第二个身份则是“博弈论之父“，这也是今天也要主要介绍的内容，在1944年同Oskar Morgenstern合著了《博弈论和经济行为》。他最主要的身份其实是一位大数学家，对基础数学、应用数学和理论物理等领域都做出了大量杰出的贡献。他晚年研究自动机（Automata），即能够进行自我复制的机器，提出了“转录”和“翻译”的概念；闲暇时曾用计算机对进化进行数值模拟。再加上他早年由于家庭压力，选择了容易就业的化学专业，可谓是一位通才中的天才。

博弈论

博弈论中通常有两个策略，A和B，用支付矩阵描述如下

	A	B
A	a	b
B	c	d

支付矩阵的含义是：当A与A相遇时，A获得的收益是a；当A与B相遇时，A获得的收益是b；当B与A相遇时，B获得的收益是c；当B与B相遇时，B获得的收益是d。进化博弈理论的核心思想是考虑一个包含A和B两种类型个体的种群，并将支付和适合度等同起来。

零和博弈可能是博弈论中最广为人知的概念了。在零和博弈中，双方都希望自己能够获取最大收益，阻止对方获得任何收益。球赛就是一种零和博弈：A队的胜利必定意味着B队的失利。但对手之间并非总是你死我活的关系。比如，在公司里使用零和博弈去寻求职业发展是不理智的。尽管两个同事竞争同一个岗位，他们仍然需要为了业务而彼此合作，因为工作的成功对他们自己至关重要。在这类冲突中，双方需要关注怎样使双方的收益最大化，至少使损失最小化。大多数博弈论的场景都假设，为了让一方得到最大化的收益，必须影响另一方的决策。

Case1

以一对新人夫妻为例。想象妻子和丈夫刚刚搬进了新家，正准备想个好办法来处理他们最讨厌的家务活。博弈论自然会认为，妻子和丈夫会像美国和苏联那样彼此不信任。这纯属无稽之谈。在通常情况下，新婚夫妇和刚刚再婚的夫妇都会比较谨慎。因为这些关系中缺乏历史记录，他们会相互奉献，尝试着去彼此信任。作为理性博弈者，妻子和丈夫知道他们只有4种处理家务的方法：没人做、一起做、某一个人做而另一个人不做。双方都想采用那个对自己更有利的方案——至于是否对对方有利并不重要。双方都认为让对方做家务就是让自己收益的最大化的方式。下边左边的表展示了妻子是怎样排列她的选择的。她把这4种情况看作是可以自由选择的，然后用0~10分对收益进行逐项评估。

屏幕快照 2018-11-23 上午1.18.35

妻子不想生活在猪圈里，所以如果双方都不打扫，对她来说没有任何收益，所以她给这个选项0分。如果只有她一个人打扫，她就不得不花费大量的时间去做自己讨厌的事情——尽管这确实可以让她获得一点收益（一套干净的寓所）。这个选项得2分。她给丈夫一个人打扫评4分。她知道他做不好家务，因为他总是对面前的灰尘和杂乱视而不见。尽管如此，她还是宁愿让丈夫来打扫厨房，这总比她自己干要好。最后一个选项，分担家务活，让她既可以保持居所清洁，又不必承担过多的家务。所以她给这个选项打了最高分：10分。

从博弈论的角度看，可以从表中得到很多有趣的结果。至少，它说明不管妻子做出什么理性选择（做不做家务），她的最高收益都必须有丈夫的参与，至少需要他分担一点家务。请看表最右边一栏。如果丈夫做家务，妻子的总收益是14分。如果不管妻子有多累，丈夫连扫帚都不碰一下，妻子的收益会直降到2分。换句话说，丈夫的行为可以给妻子的收益造成12分的差异。这个差距是巨大的。要让妻子要获得最大收益，最重要的就是，她必须让丈夫和她一起做家务。右边的表显示了她丈夫的情况。

丈夫的收益丈夫的收益和他妻子类似，尽管不完全一致。和妻子一样，丈夫不想让家里太乱，但他当然不愿自己做家务。他只给自己做家务这个选项打了2分。他给妻子一个人做家务打了更高的分数，7分，但不是最高分。他知道如果让妻子一个人干活，她会不高兴，会发脾气，会不愿跟他做爱（他的收益）。我们再看看这张表就会发现，他的两项最佳选择都是妻子干活。从表中最下面的一栏可以看出，造成丈夫收益差异的根源在于妻子是否干活，他自己干不干不重要。妻子干活时，丈夫给出15分。妻子不干活时，下降到4分。如果他改变自己的行为，则只改变了1分（10减9），相反，如果改变妻子的行为，他就能多得11分（15减4）。为了使丈夫的利益最大化，他就要说服妻子做家务。

丈夫和妻子如果保持不合作的态度，将以永无止境的冲突而告终。结果只要一句总结就够了——如果没人打扫或只有一个人打扫，之后不可避免会出现问题。妻子和丈夫分担家务的故事看起来不太合乎逻辑，但它精确地说明了不信任的后果。如果你不信任你的伴侣，就会改变对方而使自己利益最大化。同样，你的伴侣也希望改变你来达到其自私的目的。当你们缺乏信任时，就不会再考虑对方的利益了。将这个描述颠倒过来，就是我对信任的定义。信任不是一种在两个人之间生长的模糊不清的品质。当双方愿意为了对方的利益去改变自己的行为时，信任就产生了。你们的关系之中信任越多，对彼此的关爱就越多。你会得到爱人的支持，反之亦然。在信任的关系中，你会为伴侣的成功而高兴，会为他的忧伤而烦恼。损他利己的事情，你怎么也高兴不起来。

一旦丈夫和妻子更信任彼此，他们就不会再把洗衣篮当作烫手的山芋了。他们会合作，一起做家务，因为合作可以让对方获得更高的收益。丈夫关于利益最大化的想法不会再是“我最好吸一吸尘，这样待会儿妻子会愿意跟我做爱”，相反，他会想：“我得去吸一吸尘，我可不希望妻子担心自己变成她母亲那样的家庭主妇。我可不希望让她有那种感觉。”同样，妻子的决定也会考虑到她丈夫的想法和需要。相信彼此并不意味着丈夫和妻子会把对方的需要放在自己的之前——这不健康。但这意味着他们的幸福是彼此联系的。他们会通过改变自己的行为来增加对方的收益。在博弈论中，伴侣作出共同承担家务的决定实现了“纳什均衡”，它是由获得诺贝尔经济学奖的数学家John Forbes Nash Jr.（约翰·纳什，电影《美丽心灵》的原型）提出的。在“纳什均衡”中，双方最终会停止在一个点上，这时他们的收益均达到最大，而即使稍作改变也不会增加。

关于纳什均衡还可以举一个有趣的例子（毕竟人们好像对感情问题比科学问题更感兴趣，哈哈哈）。如果一个男孩喜欢一个女孩，但是现在女孩把男孩当很好很好的朋友。如果男孩表白，女孩觉得这样当朋友太尴尬了，那以后可能一起玩的机会都没有了。如果女孩把男孩拒绝了，她也就失去了一个很好的朋友，这一点对现在的她来说也不是好的结果。于是两个人，谁都不愿主动做出改变，即纳什均衡。两个人在信息不完全下达到了各自的最优，但对于外人来看却不是。

屏幕快照 2018-11-23 上午6.24.33

（对于上述两策略的支付矩阵：如果a>c，那么A策略是纳什均衡；如果d>b，那么B策略是纳什均衡。）

Case2

同种动物之间为争夺食物、领地、配偶等资源而发生冲突，许多冲突是及其残忍乃至致命的。当然，人类社会中的冲突强度更是有过之而无不及，凶杀、战争、种族屠杀等事实令人触目惊心。但是通常情况下，动物之间的冲突只是在受一定条件制约的个体之间发生，并不会升级扩大，即所谓的常规斗争（conventional fight）。J. Maynard Smith（他提出了进化稳定策略ESS这一概念，与纳什均衡十分相似）首次从个体选择的角度对常规斗争进行了解释。假设有两种策略，鹰策略（H）和鸽策略（D）。鹰策略是使斗争升级，鸽策略是在对手使斗争升级使撤退。这个斗争中获胜者的收益是b，失败者的损失是c。如果两个鹰策略者相遇，斗争则会升级。最终只有一方获胜，一方受伤。假设每个鹰策略者具有相同的实力，那么它们获胜或失败的概率都是1/2，因此，它们各自的期望收益是（b-c)/2。如果鹰策略者与鸽策略者相遇，那么鹰策略者获胜得到收益b，鸽撤退且收益是0。如果两个鸽策略者相遇，二者都没有损失。最终，其中一个会获胜，期望收益是b/2。由此，支付矩阵如下

屏幕快照 2018-11-23 上午6.25.19

如果b<c，那么任何单一策略都不是纳什均衡。如果所有其他个体都使用“鹰”，那么最好使用“鸽”；如果其他个体都使用“鸽”，则最好使用“鹰”。因此，鹰鸽共存，这种选择动态最终促成一个混合种群。在稳定平衡点，鹰的频率是b/c。如果受伤的代价c远远大于获胜的收益b，那么，在达到平衡时，鹰的频率会很低。

Case3

再举一个求偶策略博弈的例子，也是J. Maynard Smith最早提出的，他认为雄性有忠诚（faithful）和薄情（philanderer）两个策略，雌性有羞愧（coy）和放荡（fast）两个策略。

屏幕快照 2018-11-23 上午2.11.45

现在我们设想有一个种群，其中所有的雌性个体都羞怯忸怩，而所有的雄性个体都忠诚不罚这是一个一雌一雄配偶制的理想社会。在每一对配偶中，雄性个体和雌性个体所得的平均盈利都相等。每抚养一个幼儿，它们各获得＋15分，并共同承担所付出的代价（-20分），平均分摊，每方各为-10。它们共J. Maynard Smith同支付拖长求爱时间的代价（罚分-3）。因此，每抚养一个幼儿的平均盈利是:+15-10-3=＋2。

现在我们假设有一个放荡的雌性个体溜进了这个种群。它干的很出色。它不必支付因拖延时间而化费的代价，因为它不沉湎于那种旷日持久的卿卿我我的求爱。由于种群内的所有雄性个体都是忠诚的，它不论跟哪一个结合都可以为它的子女找到一个好父亲。因此，它每抚养一个幼儿的盈利是+15-10=+ 5。同它的羞怯忸怩的对手相比较，它要多收益3个单位。于是放荡的基因开始散布开来。

如果放荡的雌性个体竟获得很大成功，致使它们在种群内占据了统治地位，那么，雄性个体的营垒中，情况也会随之开始发生变化。截至目前为止，种群内忠诚的雄性个体占有垄断地位。但如果现在种群中出现了一个薄情的雄性个体，它的景况会比其他的忠诚的对手好些。在一个雌性个体都放荡不羁的种群内，对一个薄情的雄性个体来讲，这类货色比比皆是，唾手可得。如果能顺利地抚养一个幼儿，它净得盈利+15分，而对两种代价却分文不付。对雄性个体来说，这种不付任何代价指的主要是，它可以不受约束地离开并同其他雌性个体进行交配。它的每一个不幸的妻子都得独自和幼儿挣扎着生活下去，承担起-20分的全部代价，尽管她并没因在求爱期间浪费时间而付出代价。一个放荡的雌性个体结交一个薄情的雄性个体，其净收益为＋15－20=-5；而薄情的雄性个体的收益却是＋15。在一个雌性个体都放荡不羁的种群中，薄情的雄性基因就会像野火一样蔓延开来。

如果薄情的雄性个体得以大量地迅速增长，以致在种群的雄性成员中占了绝对优势，放荡的雌性个体将陷于可怕的困难处境。任何羞忸怩的雌性个体都会享有很大的有利条件。如果羞怯忸怩的雌性个体同薄情的雄性个体相遇，它们之间绝不会有什么结果。她坚持要把求爱的时间拉长；而他却断然拒绝并去寻找另外的雌性个体。双方都没有因浪费时间而付出代价。双方也各无所得，因为没有幼儿出生。在所有雄性个体都是薄情郎的种群中，羞怯忸怩的雌性个体的净收益是零。零看上去微不足道，但比放荡不羁的雌性个体的平均得分-5要好得多。即使放荡的雌性个体在被薄情郎遗弃之后，决定抛弃她的幼儿，但她的一颗卵子仍旧是她所付出的一笔相当大的代价。因此，羞怯忸怩的基因开始在种群内再次散布开来。

现在让我们来谈谈这一循环性假设的最后一部分。当羞怯忸怩的雌性个体大量增加并占据统治地位时，那些和放荡的雌性个体本来过着纵欲生活的薄情雄性个体，开始感到处境艰难。一个个的雌性个体都坚持求爱时间要长，要长期考验对方的忠诚。薄情的雄性个体时而找这个雌性个体，时而又找那个雌性个体，但结果总是到处碰壁。因此，在一切雌性个体都忸怩作态的情况下，薄情雄性个体的净收益是零。如果一旦有一个忠诚的雄性个体出现，它就会成为同羞怯忸怩的雌性个体交配的唯一雄性个体。那么他的净收益是＋2，比薄情的雄性个体要好。所以，忠诚的基因就开始增长，至此，我们就完成了这一周而复始的循环。像分析进犯行为时的情况一样，这似乎是一种无止境的摇摆现象。但实际上，像那种情况一样，不存在任何摇摆现象，这是能够加以证明的。整个体系能够归到一种稳定状态上。如果你运算一下，就可证明，凡是羞怯忸怩的雌性个体占全部雌性个体的5/6，忠诚的雄性个体占全部雄性个体的5/8的种群在遗传上是稳定的。

当然，这仅仅是根据我们开始时任意假定的那些特定数值计算出来的，但对其他任何随意假定的数值，我们同样可以轻而易举地算出新的稳定比率。同史密斯所进行的分析一样，我们没有必要认为存在两种不同种类的雄性个体以及两种不同种类的雌性个体。如果每一雄性个体能在5/8的时间里保持忠诚，其余的时间去寻花问柳；而每一雌性个体有5/6的时间羞怯忸怩，1/6的时间纵情放荡，那同样可以实现进化上的稳定状态。不管你怎样看待ESS，它的含义是：凡一种性别的成员偏离其适中的稳定比率时，这种倾向必然受到另一种性别在策略比率方面相应变化的惩罚，这种变化对原来的偏离行为发生不利的影响。进化上的稳定策略（ESS）因之得以保持。可以得出这样的结论，主要由羞怯忸怩的雌性个体和忠诚的雄性个体组成的种群，能够进化是肯定无疑的。在这样的情况下，家庭幸福策略对于雌性个体来说，实际上看来是行之有效的。我们就不必再考虑什么由羞怯忸怩的雌性个体组成的集团了，其实羞怯忸怩对雌性个体的自私基因是有利的。

囚徒困境

再来看一个经典的囚徒困境的例子：警方逮捕了两个犯罪嫌疑人，但是没有足够的证据指控他们犯罪。于是警方把他们分别关押在两个房间，以避免他们串供。州检察官分别和两人见面并约定：供认罪行，成为控方证人，那么就有可能避免牢狱之灾。具体如下：如果一个人认罪，而另一个人保持沉默，那么认罪一方将当即获释，沉默一方将被判刑十年监禁；如果双方都认罪。那么两人都被判七年监禁；如果双方都不认罪，则警方无法指控他们犯罪，两人都将被判一年监禁。它对应的支付矩阵如下

屏幕快照 2018-11-23 上午2.27.57

来分析一下该做何选择呢？合作还是背叛。如果对方合作，那么选择合作被判1年，选择背叛则被释放；如果对方选择背叛，那么选择合作则被判10年，选择背叛则是背叛7年。无论如何，背叛策略都是最佳选择，即纳什均衡。

事实上，生物学中的囚徒困境问题伴随着生命的诞生而出现在进化生物学中，尽管驱动力主要源于变异和选择，但是在生命有机体的每一个层面，合作都是一个基本的原则，新特征的产生往往需要原有简单部件之间互相合作。例如，能够进行自我复制的分子只有彼此合作才能形成最早的细胞；单细胞生物依赖于各细胞器之间的合作，多细胞有机体的生存依赖于各细胞之间的合作，社会性昆虫依赖于个体之间的合作，而人类社会的许多方面则是基于倡导合作的机制，而且合作的尺度更大，从而形成了城市乃至国家。合作使每个个体不必万事皆通，能够促进个体的专业化。从进化的角度来看，合作对新生事物（多细胞机制和人类语言）的产生必不可少。因此，我们也可以说进化是建立在合作的基础之上。合作行为有很多种不同的机制，以下则分别介绍直接互惠、间接互惠、亲缘选择、群体选择和网络选择五种。在一定的条件下，以上任何一种机制都能够促进合作行为的出现。

#####直接互惠

合作者往往会受到背叛者的利用。如果仅仅是囚徒困境那样子，在一个合作者和背叛者组成的混合种群中，背叛者的收益更高，即拥有更高的适合度（繁殖率），自然选择青睐背叛，但是这样子种群的平局收益（适合度）会下降，所以需要特定的机制来支持合作。1971年，Robert Trivers发表了里程碑式的论文“互惠利他行为的进化”，提出了直接互惠的模型。

对于非重复的囚徒困境模型来说，在一个充分混合的种群中，背叛者将最终淘汰合作者。如果两两个体之间的博弈可以重复地进行，那么合作行为就有可能被保留下来。假设两个个体间的博弈局数为m。用ALLD对策代表始终选择背叛的对策，用GRIM对策代表这样一种对策：首先选择合作，一直合作直到对方背叛，并在此后一直选择背叛。先定义通用的囚徒困境：如果两人都选择合作，将分别收益R；如果两人都选择背叛，将分别付出代价P；如果一人合作一人背叛，合作者将付出代价S，同时背叛者将获得收益T；满足T>R>P>S，且R>(T+S)/2。这样囚徒困境和ALLD对抗GRIM分别对应的支付矩阵如下

屏幕快照 2018-11-23 上午4.40.34

当mR>T+(m-1)P时，即m>(T-P)/(R-P)时，GRIM对策可以抵抗ALLD对策的入侵。有趣的是，Robert Trivers把这一想法来源归结为“Hamilton的个人通信”。以上分析存在一个小问题：当已知可重复的博弈局数时，最优的对策是在最后一轮选择背叛。以此类推，倒数第二轮背叛将获得第二高的收益。直到我们得到ALLD策略，所以ALLD是唯一的纳什均衡和进化稳定策略。但是事实上并非如此，可能因为人们不知道什么时候结束博弈，计划中总会存留着希望，历史有开始，但是没有结束。这样可以考虑回合数不确定的情况，w代表一局结束再来一局的概率，期望的回合数m=1/(1-w)，令T = b、R = b - c、P = 0和S = - c，可得不等式 w>c/b，即重复博弈的概率w必须大于利他行为的成本/收益率。

显然，可重复的囚徒困境博弈有利于合作行为的保存，那么在重复博弈中，什么样的对策才是一个好对策呢？政治学家Robert Axelrod提出了这个问题并且组织了一个有关重复囚徒困境博弈的电脑程序比赛。出人意料的是，最后的赢家竟然是最简单的“针锋相对“对策（tit-for-tat，TFT），即在第一局选择合作，随后选择对方在前一局使用的对策：如果对方背叛，就选择背叛；如果对方合作，就选择合作。

之后人们发现TFT对策缺乏自动纠错的功能，因为比赛是在没有噪声干扰的情况下进行的。Karl Sigmund和Martin Nowak则组织了存在随机噪声的进化博弈竞赛，他们利用突变和选择去扩展重复囚徒困境博弈的对策空间。最初以随机的方式组合起来的对策很快就被ALLD对策所控制，但是一小群TFT个体则能够成功的入侵一个ALLD种群。事实上，TFT是促使合作行为出现在ALLD种群中最有效的途径。然而，由于随机因素，TFT将很快被GTFT所替代，GTFT（TFT基础上以一定的概率在对方选择背叛后继续合作）在偶然的错误发生之后仍然能够重新建立合作。如果每一个个体都使用GTFT，对其而言，ALLC（无条件合作）就是一个中性变异。随机漂变将使得一个GTFT种群演变成ALLC种群。一个ALLC种群又很容易被ALLD对策所入侵。另一方面，ALLC种群也会被WSLS（成功，收益为R或T时保留对策；失败，收益为S或P时淘汰对策）对策所控制，同TFT及其变种对策相比，WSLS对策会导致更稳定的合作。合作行为并不是进化的最终阶段，它总是在一段时间后被背叛所取代，随后又被重新建立起来。这也多少反映了人类历史上和平与战争交替的趋势。

间接互惠

间接互惠是以所谓的名誉为基础的，一方对另一方的影响是通过第三方实现的。在一个二元道德标准的社会中，对贡献者的最基本的评价方式有4种：总是认为他是好人，总是认为他是坏人，当他拒绝帮助时认为他是好人，或者他愿意帮助时他是好人。评级方式如果在贡献者的行为基础上，再考虑收益者的分数和贡献者的分数，则有256种评价规则。下图展示其中四种。

G代表好人，B代表坏人，以上展示了作为一个旁观者如何通过贡献者和受益者的行为来判断他们的好坏。对于评比（scoring）来说，合作行为（用C表示）将赢得好名声而背叛行为（用D表示）则会招致骂名。“声誉”（standing）和“评比”十分类似，其区别在于当声誉好的贡献者拒绝帮助声誉差的贡献者时，并不会影响自身的声誉。需要注意的是，“评比”往往和有偿的惩罚联系在一起，而对于“声誉”来说，惩罚并不会付出任何代价。就“判断“（Judging）而言，帮助臭名昭著的受益者将损害自身的声誉；”逃避“（shunning）则视任何与臭名昭著收益者的接触为自身声誉的破坏。

行为规则则是根据贡献者和收益者的分数来决定是否给予帮助，则一共16种。将评价规则和行为规则的组合看作是对策，则一共有4096种。Ohtsuki和Iwasa计算了全部对策，并证明只有8种对策在特定条件下是进化稳定的，并且能够导致合作的出现。“声誉”和“判断”都属于这8种之一，这里”评比“的作用则类似TFT在直接互惠中的作用。这种眼见为实的对策是最简单的安全机制，只对行为作出判断，却忽略了行为背后的意义，不过也有实验证据表明，和“声誉”相比，人类往往更倾向于使用“评比”。“间接互惠”要求关注其他个体的相互作用并给出评价，追踪社交网络的变化，所以这和语言可能是协同进化的（语言有助于收集信息和作出判断）。

亲缘选择

J. Maynard Smith的老师J. B. S. Haldane（种群遗传学之父）喝醉时曾说道：“如果我的两个亲兄弟和八个堂兄弟同时掉到河里，我跳下去时去救两个亲兄弟还是八个堂兄弟呢？”。W. D. Hamilton在理论上给出了完整的结果，提出了一种激进的进化理论，他称之为“广义适应度理论”，被J. Maynard Smith成为亲缘选择理论。其冠军方程可以描述如下：如果贡献者和接受者之间的遗传亲缘系数（遗传相关度，比如兄弟姐妹间为0.50，祖父母与孙女孙子间为0.25，堂兄弟姐妹间为0.125）r大于贡献者的成本c与接受者的收益b之比，即 r > c / b，则自然选择将有利于亲缘个体之间的合作。“广义适应度理论”开启了一个被称之为“基因之眼看世界”的新纪元，不过很多贡献来也在George C. Williams和Richard Dawkins等人的著作将其数学化的理论用浅显易懂的文字表述出来。但是可不要用这个理论去回答女生“我和你妈掉水里先救谁”的问题哟。

群体选择

群体选择理论认为，不同群体在生存和繁殖方面的成功率存在差异，适应器之所以在进化过程中产生是因为对整个群里有利。例如，据此理论，一个动物个体可能会限制自己的繁殖率，使整个群体的数量维持在较低的水平。从而避免耗尽整个群体赖以生存的资源。1966年，George C. Williams的著作《适应与自然选择》对当时流行的群体选择理论提出了挑战。他认为其作用比较微弱，理由如下。试想，如果鸟群中有两种不同倾向的鸟：一种为了避免浪费，资源耗竭而自我牺牲地选择了自杀；另一种则不管食物剩余量，都自私地狂吃不止。那么，到了下一代，哪种鸟可能拥有更多的后代呢？答案是显然的，自杀的鸟会绝种，也就是作用于群体内的个体差异的选择力量超过了作用于群体的选择力量。

屏幕快照 2018-11-23 下午4.42.42

网络选择

传统的进化博弈动力学模型假定种群是充分混合的，这意味着所有个体讲以相同的概率相遇并发生相互作用。然而，在现实社会中，个体间的相互联系收到空间因素和社交网络的制约。不妨用图的顶点代表群体中的个体，而连接顶点的边则代表了个体间的相互作用。考虑一个特定的例子：合作者（C）与背叛者（D）的竞争。合作者为每一个连接付出成本c，其邻居获得收益b。每个个体的适合度是一个常数，包括基准适合度和博弈获得的收益两部分。对于进化博弈动力学，我们假设每一局随机挑一个个体死亡，相邻个体根据适合度的高低竞争死亡个体留下的空位。一个简单的法则：如果b/c>k成立，则自然选择将有利于合作战胜背叛，其中k为每个个体的平均邻居数。

假设群体中的所有成员都被排列在一个二维阵列中。在每一回合，任意一个位置上的个体都与其相邻位置上的个体对弈。随后，在博弈中获胜的个体会占据其对手原先的位置。上述过程就是一个确定的元胞自动机运作机理。尽管von Neumann开创了博弈论和元胞自动机理论，但在空间博弈理论中，两者才首次被结合起来。空间博弈的规则：在本例子中，每个细胞有8个近邻。计算每个个体的支付。每个个体都会比较其自身的支付和其近邻的支付，然后采取能够获得最高支付的策略。细胞的命运取决于以其为中心的5*5的正方形里25个细胞的状态。

但是线虫毕竟只是线虫。人类更感兴趣的，是更高等一些的多细胞动物，比如果蝇，小鼠，斑马鱼，乃至人类自身的细胞谱系发生树。这可是个浩大的工程。拿果蝇来说，成体的果蝇，光神经细胞的数目就有10万个。而人类全体的细胞数目，是40万亿个到60万亿个，真真正正是天文数字。线虫的近千个细胞，尚且可以用原始而暴力的做法一个一个地破解开—John Sulston是用显微镜把线虫从单个细胞到成体发育的整个过程给记录下来的。这样的事情，在果蝇身上，根本就不可能—细胞的数目太多了，成体的果蝇也不透明。更别说细胞数目更多的小鼠和人类。想要咬开这颗坚果，必须另寻他途。

早期的发育生物学家们，尚且想在原有的显微镜观察上稍作改良，看看是否能够各个击破。简单地说，他们利用不同颜色的荧光蛋白标记早期的胚胎细胞，理论上，由同一个细胞发育而来的细胞会带上相同的颜色。当生物体发育完成后，把感兴趣的组织的细胞分离出来，观察这些细胞的颜色，可以大致猜到这些细胞来自早期胚胎的哪个细胞。然而，这么做能够拆分的精度十分有限，理论上，有多少种荧光蛋白，你就能标记多少个早期胚胎细胞—也就能把最终的细胞分成多少个类群。荧光蛋白的总数，也就十几个。即使是通过把这些荧光蛋白进行组合（比如大名鼎鼎的脑虹（Brainbow）技术），产生的可分辨的组合色，大概不容易超过一千。因此使用显微镜进行细胞谱系追踪的工作，进展缓慢，步履维艰。

以色列魏斯曼科学研究所（Weizmann Institute of Science）的Ehud Shapiro的一个想法给这个问题的解决带来了曙光

Ehud Shapiro敏锐地把细胞谱系树联系到演化生物学家熟悉得不能再熟悉的另一棵“树”上。这棵树就是描绘物种形成的系统发生树（phylogenetic tree）。系统发生树描述现存的生物如何从最初的共同祖先演化而来。树的最顶端代表所有生物的共同祖先，每一次分叉代表一次物种形成事件。

这棵树是怎么绘制的呢？通常来说，是利用现存物种的DNA序列。在慢慢的演化长河中，生物会积累突变。要点在于，当物种形成使一个物种分化为两个物种以后，两个物种会独立地积累突变—他们之间再也没有基因交流使他们的DNA序列重新变得一致。一般来说，物种形成事件发生得越近，他们的独立积累突变的历史越短，他们的DNA序列也就越像。利用这个特征，我们可以推测物种形成事件发生的时间，确定历史的行程。

同样的事情，发生在多细胞生物从单个细胞发育成为整个生物个体的过程中。细胞在分裂的过程中，由于复制的不完全精确，或多或少地会积累突变。分裂事件发生得越近的细胞，它们的DNA序列会更像。通过这个关系，我们可以比对终端分化细胞的DNA序列，构建细胞谱系树。Ehud Shapiro最初的想法，是利用单细胞基因组测序的方法，获得成体终端分化细胞的基因组序列，以期重构生物的谱系发生树。当然，这么做在当时还是非常昂贵的。

Von neumann, life and evolution