纳什均衡与博弈论-第28章

小说：纳什均衡与博弈论字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　另一方面，博弈论在遗传力量的倡导者和人类自由的捍卫者之间提供了一种可能的和解。博弈论追求另一种不同的通往“自然法典”的道路。它承认进化的力量——实际上，它有助于解释进化产生生命复杂性的能力。但博弈论也解释了为什么对人类天性植根于生物学的信仰，虽然一般意义上是正确的，但并不是事情的全部。博弈论提出的不是人类社会行为的一般基因决定论，而是需要，如纳什数学所展示的，一种混合的策略。它要求人们从很多可能的行为中做出选择。

　　我想博弈论潜在的科学力量是巨大的，因为它在理论上是如此的包容——不狭隘或偏颇，而是可以容纳很多看似矛盾的观点。这就是为什么它可以提供一个框架来解释世界上所有的多样性——个体行为和个性的混合体，多元的人类文化，永不完结的生命物种列表。博弈论包容了自私和同情、竞争和合作、战争和和平的共存。博弈论解释了基因和环境、遗传和文化间的相互影响。博弈论通过调解进化改变和稳态之间的紧张关系来连接简单和复杂。博弈论将单个个体的选择和人类社会集体行为相联系。博弈论在心灵的科学和那些没有思想的物质的科学之间搭建了桥梁。

　　博弈论把这些都放到了一起。它提供了一剂数学处方来使得看起来无法理清一团混乱的世界变得有意义，提供了一个确实的信号表明“自然法典”对于科学家来说并非一个毫无意义不可企及的目标。不管其他人是否看好最后的成功，毫无疑问，科学家们在追逐那个目标。

　　“我们想要了解人类本性，”来自普林斯顿的神经科学家和哲学家约瑟华·格林纳（Joshua　Greene）说，“我想，这是根本的目标。”

　　到成功也许还有很长一段路要走。但是在阿西莫夫的心理史学的想象中，存在着一个不容置疑的真理——这个世界所有的复杂网络，个人的和社会的，以各种方式交互来产生一个独一无二的未来。从人类到城市，从公司到政府，所有这些社会元素最终必须契合。人们看似疯狂的行为背后必定存在着一种规律，博弈论的成功表明了这是一种科学可以发现的规律。

　　“想法是最终能真正拥有对宇宙的完整理解，从最基本的物理元素、化学、生物化学、神经生物学，到个体人类行为，到宏观经济行为——完全一体的整合，”格林纳说，“尽管，不在我的有生之年。”

　　附　录　纳什均衡计算

　　考虑一下第二章中提到的简单博弈，爱丽丝和鲍勃竞争来看看鲍勃该还给爱丽丝多少债。这是一个零和博弈；爱丽丝得到的正是鲍勃所失去的，反之亦然。在这个博弈矩阵里，收益是鲍勃付给爱丽丝的总和，因此鲍勃在每种条件下得到的“收益”是所显示的数字的负值。

　　想要计算纳什均衡，你必须找到一种对每个玩家来说，当其他人也选择最佳混合策略时，他的期望收益最高的混合策略。在这个例子中，爱丽丝选择巴士的概率是p，步行的概率为1－p（因为概率加起来必须等于1）。鲍勃选择巴士的概率为q，而步行的概率为1－q。

　　爱丽丝可以计算她选择巴士或步行的“期望收益”，方法如下。她选择巴士的期望收益是以下的总和：

　　当鲍勃选择巴士时她选择巴士的收益，乘以鲍勃会选择巴士的概率，或表示为3×q

　　加上

　　当鲍勃选择步行时她选择巴士的收益，乘以鲍勃选择步行的概率，或表示为6×（1－q）

　　她选择步行的期望收益是以下的总和：

　　当鲍勃选择巴士时她选择步行的收益，乘以鲍勃会选择巴士的概率，或表示为5×q

　　加上

　　当鲍勃选择步行时她选择步行的收益，乘以鲍勃选择步行的概率，或表示为4×（1－q）

　　加起来，

　　爱丽丝选择巴士的期望收益＝3q＋6（1－q）

　　爱丽丝选择步行的期望收益＝5q＋4（1－q）

　　用相似的推理来计算鲍勃的期望收益可以得到：

　　鲍勃选择巴士的期望收益＝…3p＋［…5（1－p）］

　　鲍勃选择步行的期望收益＝…6p＋［…4（1－p）］

　　现在，爱丽丝在这个游戏中的总期望收益是她选择巴士的概率乘以她选择巴士的期望收益，加上她选择步行的概率乘以她选择步行的期望收益。对鲍勃来说也是相似的。要达到纳什均衡，他们做两种选择的概率必须使得对这两个概率的任何改变都无法带来更多收益。换句话说，对每种选择的期望收益（巴士或步行）必须是相等的（如果对一种选择的期望收益比另一种大，那么多做这种选择就会更好一些，那样，就增加了做这种选择的概率）。

　　对鲍勃来说，他不该改变策略如果

　　…3p＋［…5（1－p）］＝…6p＋［…4（1－p）］

　　运用一些基础的代数运算，方程可以被表示为：

　　…3p－5＋5p＝…6p－4＋4p

　　或者

　　2p＝1－2p

　　所以

　　4p＝1

　　p的解，表示爱丽丝选择巴士的最优概率是

　　p＝1/4

　　因此爱丽丝应该在1/4的情况中选择巴士，3/4选择步行。

　　现在，爱丽丝不会想要改变策略，当

　　3q＋6（1－q）＝5q＋4（1－q）

　　解出q，得到鲍勃选择巴士的最优概率：

　　因此鲍勃应该在一半的时间里选择巴士，一半选择步行。

　　现在让我们假定爱丽丝和鲍勃决定玩鹰鸽游戏，收益结构会变得更复杂一些，因为一个人赢得的并不一定等于另一人失去的。在这个博弈矩阵中，方格里的第一个数字给出爱丽丝的收益，第二个数字给出鲍勃的收益。

　　爱丽丝玩鹰的概率是p，玩鸽的概率为1－p；鲍勃玩鹰的概率是q，而玩鸽的概率是1－q。爱丽丝玩鹰的期待收益是…2q＋2（1－q）；她玩鸽的期待收益是0q＋1（1－q）。鲍勃玩鹰的期待收益是…2p＋2（1－p）；他玩鸽的期待收益是0p＋1（1－p）。

　　鲍勃不会想要改变策略，当

　　因此，爱丽丝玩鹰的概率p，是1/3。

　　爱丽丝不会想要改变策略如果

　　因此鲍勃玩鹰的概率q，也是1/3。因此在这种收益结构下的纳什均衡是在1/3的情况下玩鹰，2/3的情况下玩鸽。

　　　………　【松鼠爱吃肉】整理

　　

第28章

纳什均衡与博弈论-第28章

你可能喜欢的