14 博弈论Game Theory动态竞争分析法

为什么肯德基和麦当劳喜欢挤在一起开店？

残酷的市场竞争导致的动态平衡。

什么是博弈论？

维基百科的定义是：1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》，标志着现代系统博弈理论的的初步形成，博弈论被认为是20世纪经济学最伟大的成果之一。主要研究公式化了的激励结构（游戏或者博弈）间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论研究什么？

第一，有几个人，第二，各自什么行动，第三，组合出什么结果，第四，每个人有什么样的习惯和策略。这就是基本的博弈论框架。

博弈论把相对复杂的事，解构解析，处理成一个相对可解的问题。

博弈论是一种哲学视角的思维模型。

学习博弈论的176模型。1个终极目标，7个重要概念，6种应对场景。

博弈论一个终极目标：

达到纳什均衡，纳什均衡是谋略计算的终点。

博弈论七个重要概念

「纳什均衡]」如果博弈各方都是足够聪明的人，大家最终的策略选择一定是这样一个局面：在这个局里面大家都认命了，谁也无法单方面改变策略去谋求一个对自己更好的结局。如果一个现象能够在社会中长期稳定地存在，它对参与的各方来说就一定是纳什均衡。纳什均衡告诉我们评价一个局面不能只看他是不是对整体最好，它必须得让每个参与者都不愿意单方面改变才行。

「帕累托最优」帕累托是一位意大利经济学家，拍累托提出改进策略能在不伤害任何一个人利益的同时，使得至少一个人的境遇变的更好。如果一个局面已经好到没有帕累托改进的余地了，这个局面叫做“拍累托最优”。

「压倒性策略」Dominant Strategy 。在博弈论局面中，你有一个策略压倒其他一切策略，不管对手怎么做，这个策略对你来说都是最好的。反之，“被压倒性策略”Dominated Strategy就是不管别人怎么做，你这么做都是不好的。

「囚徒困境」合作则两利、背叛则两伤。经济学中所谓“负的外部性”、“公地悲剧”、“价格战”，国际政治中的军备竞赛，动物世界中的互助行为，体育比赛中的使用禁药，医学中的抗生素滥用，包括心理学中的上瘾现象，都是囚徒困境。

「博弈演化论」专门研究策略的流行规律的学问。博弈的演化，是策略的竞争。如果使用一个策略能带来好的报偿，人们就会模仿这个策略，这个策略就会流行开来。

「KMRW定理」用四个经济学家名字的首字母命名。在不完全的信息博弈中，参与者不知道对方是好人还是理性人，那么只要博弈重复的次数足够多，合作能带来足够的好处，双方都会愿意维护自己是好人这样一个声誉，前提尽可能地保持合作，到最后才选择背叛。

「Player」在游戏中叫玩家，在体育比赛中叫选手，在博弈论中叫参与者——其实都是一个意思，博弈论Game Theory说的都是Game，有一点参与游戏的精神，你就有权在规则范围内采取对自己最有利的行动，你就是积极主动的，你就会平等对待对手——你就既不是一个浑浑噩噩整天根据别人设定做事的人，也不会有整个世界围绕自己转的幻觉。

博弈论的六个博弈局面及对策

博弈局面一：各方有强烈合作意愿，而博弈有不止一个纳什均衡。

1.一个博弈中会有多个纳什均衡。比如交通规则中“右侧通行”和“左侧通行”，都是纳什均衡。

2.聚焦点就是在众多可能的纳什均衡中最显眼的那一个，人们会自动在这一点上达成合作。聚焦点的作用是协调。

3.聚焦点例子：度量衡、键盘、限速牌、指导价、平均年薪……可以是生活习惯，可以是历史传承，可以是传统文化，可以是先下手为强，可以是政府指导，可能是随便找到什么借口，是在不行还可以抽签。

博弈局面一对策：（装）好人

1.在残酷世界里选择做好人表面上看是非理性的——但KMRW定理告诉我们只要博弈比较多，哪怕只是有限次重复，做好人其实是有利的。

2.但博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一项情愿的期待。博弈论专家会说这种想法非常危险。事实上，如果你身处一个比较险恶的社会环境，那你不但不应该做好人，而且应该装坏人。

3.但好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉，但是没有办法，想象共同体是最强大的社会力量。这其实也是一种理性。

博弈局面二：囚徒困境——合作对所有人都有好处，单背叛对背叛者有直接的好处。

采取策略：如果博弈是可以重复的，应该寻求对背叛者进行惩罚。防止背叛，最直观的办法就是把单次博弈变成重复博弈。重复博弈之所以有效，是因为背叛者会受到惩罚。如果博弈是可重复的，应该寻求对背叛者进行惩罚。“以牙还牙”是最经典的做法，但适当的宽度更能促成合作。

1.有效的惩罚必须得满足3个条件：你得能发现背叛行为；惩罚必须得是可信的，对方知道他一定会受到惩罚；惩罚的力度得足够。

2.“以牙还牙”是个保守的策略：1>不管跟谁，第一轮我都选择合作；2>第一轮过后，我选择复制对手上一轮的做法。你上一轮要是跟我合作，我下一轮也跟你合作。你要是背叛了我，我下一轮也背叛你。如果你在那一轮又选择合作了，那我还继续和你合作。我合作，我报复，我原谅，我只是模仿你上一轮的动作。

3.“以牙还牙”其实是个脆弱的策略：对错误不够友好，它不够宽容。改进版的以牙还牙策略是：对方背叛我一次，我继续合作，只有当对方连续背叛我两次，我再报复。

博弈局面二对策：寻求监管

1.一个破解囚徒困境的直观解决方案：让第三方监管。

2.监管的本质是改变了博弈的报偿（payoff）。有了有效的监管，不合作就不断没有好处，而且还会受到惩罚，不合作的行为自然就会大大减少。

3.比自己管、私有化和政府管这三种监管方式更新颖的是让博弈各方之外的“第四方”监管。更高级的监管是监管者和被监管者合作。

4.你应该把政府也当作一个player。而且政府也应该把自己视为一个player。既然是参加博弈的player，政府也需要博弈论。

博弈局面三：参加博弈的人数比较少，合作的利益比较大，各方就会形成串通和“合谋”，尽管这样做不一定对社会有好处。

1.戴比尔斯公司的钻石垄断、美国商店的价格匹配、商家之间通过比价网站价格协调、包括大型募捐活动，都是这样的局面。

2.合作的利益大就不会竞争，背叛的成本低才会背叛。

3.打破这个局面的一个办法就是扩大市场准入，让更多的参与者进来，让商家的协调没那么容易。另外一个办法就是依靠政府的力量反垄断，相当于全体消费者联合起来去对付那些巨头。

博弈局面三对策：先下手为强+后发者优势

1.动态博弈

2.小鸡博弈：只要你能确定对手的底线，那么先发制人，造成既成事实，就能逼迫对手就范。

3.悬崖策略是动态进行的小鸡游戏。双方每一步都在推动危机升级，这是一个危险的边缘游戏。

4.最好的办法给对方一个威慑，让它根本不敢出手。威慑有三个要素：实力、决心和让对手知道。

5.先发者暴露信息，后发者利用信息。

6.后发优势=先发者的信息+后发者的出手权。信息是模仿计划，出手权是创新机会。

博弈局面四：信息不对称

采取策略：传达信息最好的办法是“发信号”，这意味着你要用行动去证明自己。

1.一种常见的博弈局面是有一方参与者知道一个关键信息，而另外一方不知道。一方强烈滴想让另一方知道他的信息，但是又怕对方不信。一方强烈地想知道对方的信息，但是又怕对方说谎。这就叫“信息不对称”。

2.花钱、花时间、或者花的是脸面，但又都没什么直接的用处——在博弈论看来，人们做这样的事情，都是为了解决信息的不对称。

博弈局面四对策：威胁和承诺

1.威胁和承诺都是在博弈双方都没有采取实质性行动之前，一方通知另一方的声明。所谓威胁，就是我要求你不要做某事——我说如果你做了，我就会对你进行惩罚。所谓承诺。就是我要求你去做某件事——如果你做了，我就会给你一个奖励。

2.只有可信的威胁和承诺才有意义。

3.可信=别无选择。发出可信的威胁或者承诺有三个办法：给别人惩罚你的权力；主动取消自己的选项；建立声望。

博弈局面五：最高级的应用：设计博弈

1.学习博弈论的确有一个比作player更高级的视角。那就是做为规则的制定者，去给人设计博弈局面。

2.房产经纪人薪酬设计、竞拍规则设计，都可以改变局面。但用于真实世界的制度设计，它未必有实用价值。

3.一般人遵守规则，少数人违反规则，有的人制定规则。设计一个博弈，比参加一个博弈要难得多，这是管理者的学问。

博弈局面五对策：随机选择策略

1.只说谎话就等于只说实话。想要真的迷惑对手，你必须把谎话和实话混合起来。

2.你的混合概率选择，应该把对手能得到的最大报偿给最小化。你要按照一定的概率，混合自己的打法。你混合打法的这个规律，必须是让对手无法利用的。

3.不是真随机，就会被破解。随机性，才是真正的“诡道”。

博弈局面六：纳什均衡是博弈结局，可是真实世界从来都没有结局——这是因为博弈论总在变化，我们甚至可以主动改变博弈。

博弈局面六对策：最高视角：观察不同博弈策略在人群中的演化。博弈永无休止。

1.即便纳什均衡并不知有一种，冥冥之中仍然存在一些规律，在限制我们选择策略的自由。这些规律决定了社会的演化。

2.如果使用一个策略能带来好的报偿，人们就会模仿这个策略，这个策略就会流行开来。

3.策略的优势不是永恒的。你必须考虑当前社会的博弈格局，特别是其他人都在使用什么策略，才知道自己的最佳策略是什么。到底要在什么比例的情况下随大流，甚至要不要随大流，都取决于具体的博弈格局。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

相关文章