14 博弈论Game Theory动态竞争分析法
为什么肯德基和麦当劳喜欢挤在一起开店?
残酷的市场竞争导致的动态平衡。
什么是博弈论?
维基百科的定义是:1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,博弈论被认为是20世纪经济学最伟大的成果之一。主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论研究什么?
第一,有几个人,第二,各自什么行动,第三,组合出什么结果,第四,每个人有什么样的习惯和策略。这就是基本的博弈论框架。
博弈论把相对复杂的事,解构解析,处理成一个相对可解的问题。
博弈论是一种哲学视角的思维模型。
学习博弈论的176模型。1个终极目标,7个重要概念,6种应对场景。
博弈论一个终极目标:
达到纳什均衡,纳什均衡是谋略计算的终点。
博弈论七个重要概念
「纳什均衡]」如果博弈各方都是足够聪明的人,大家最终的策略选择一定是这样一个局面:在这个局里面大家都认命了,谁也无法单方面改变策略去谋求一个对自己更好的结局。如果一个现象能够在社会中长期稳定地存在,它对参与的各方来说就一定是纳什均衡。纳什均衡告诉我们评价一个局面不能只看他是不是对整体最好,它必须得让每个参与者都不愿意单方面改变才行。
「帕累托最优」帕累托是一位意大利经济学家,拍累托提出改进策略能在不伤害任何一个人利益的同时,使得至少一个人的境遇变的更好。如果一个局面已经好到没有帕累托改进的余地了,这个局面叫做“拍累托最优”。
「压倒性策略」Dominant Strategy 。在博弈论局面中,你有一个策略压倒其他一切策略,不管对手怎么做,这个策略对你来说都是最好的。反之,“被压倒性策略”Dominated Strategy就是不管别人怎么做,你这么做都是不好的。
「囚徒困境」合作则两利、背叛则两伤。经济学中所谓“负的外部性”、“公地悲剧”、“价格战”,国际政治中的军备竞赛,动物世界中的互助行为,体育比赛中的使用禁药,医学中的抗生素滥用,包括心理学中的上瘾现象,都是囚徒困境。
「博弈演化论」专门研究策略的流行规律的学问。博弈的演化,是策略的竞争。如果使用一个策略能带来好的报偿,人们就会模仿这个策略,这个策略就会流行开来。
「KMRW定理」用四个经济学家名字的首字母命名。在不完全的信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人这样一个声誉,前提尽可能地保持合作,到最后才选择背叛。
「Player」在游戏中叫玩家,在体育比赛中叫选手,在博弈论中叫参与者——其实都是一个意思,博弈论Game Theory说的都是Game,有一点参与游戏的精神,你就有权在规则范围内采取对自己最有利的行动,你就是积极主动的,你就会平等对待对手——你就既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界围绕自己转的幻觉。
博弈论的六个博弈局面及对策
博弈局面一:各方有强烈合作意愿,而博弈有不止一个纳什均衡。
1.一个博弈中会有多个纳什均衡。比如交通规则中“右侧通行”和“左侧通行”,都是纳什均衡。
2.聚焦点就是在众多可能的纳什均衡中最显眼的那一个,人们会自动在这一点上达成合作。聚焦点的作用是协调。
3.聚焦点例子:度量衡、键盘、限速牌、指导价、平均年薪……可以是生活习惯,可以是历史传承,可以是传统文化,可以是先下手为强,可以是政府指导,可能是随便找到什么借口,是在不行还可以抽签。
博弈局面一对策:(装)好人
1.在残酷世界里选择做好人表面上看是非理性的——但KMRW定理告诉我们只要博弈比较多,哪怕只是有限次重复,做好人其实是有利的。
2.但博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一项情愿的期待。博弈论专家会说这种想法非常危险。事实上,如果你身处一个比较险恶的社会环境,那你不但不应该做好人,而且应该装坏人。
3.但好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没有办法,想象共同体是最强大的社会力量。这其实也是一种理性。
博弈局面二:囚徒困境——合作对所有人都有好处,单背叛对背叛者有直接的好处。
采取策略:如果博弈是可以重复的,应该寻求对背叛者进行惩罚。防止背叛,最直观的办法就是把单次博弈变成重复博弈。重复博弈之所以有效,是因为背叛者会受到惩罚。如果博弈是可重复的,应该寻求对背叛者进行惩罚。“以牙还牙”是最经典的做法,但适当的宽度更能促成合作。
1.有效的惩罚必须得满足3个条件:你得能发现背叛行为;惩罚必须得是可信的,对方知道他一定会受到惩罚;惩罚的力度得足够。
2.“以牙还牙”是个保守的策略:1>不管跟谁,第一轮我都选择合作;2>第一轮过后,我选择复制对手上一轮的做法。你上一轮要是跟我合作,我下一轮也跟你合作。你要是背叛了我,我下一轮也背叛你。如果你在那一轮又选择合作了,那我还继续和你合作。我合作,我报复,我原谅,我只是模仿你上一轮的动作。
3.“以牙还牙”其实是个脆弱的策略:对错误不够友好,它不够宽容。改进版的以牙还牙策略是:对方背叛我一次,我继续合作,只有当对方连续背叛我两次,我再报复。
博弈局面二对策:寻求监管
1.一个破解囚徒困境的直观解决方案:让第三方监管。
2.监管的本质是改变了博弈的报偿(payoff)。有了有效的监管,不合作就不断没有好处,而且还会受到惩罚,不合作的行为自然就会大大减少。
3.比自己管、私有化和政府管这三种监管方式更新颖的是让博弈各方之外的“第四方”监管。更高级的监管是监管者和被监管者合作。
4.你应该把政府也当作一个player。而且政府也应该把自己视为一个player。既然是参加博弈的player,政府也需要博弈论。
博弈局面三:参加博弈的人数比较少,合作的利益比较大,各方就会形成串通和“合谋”,尽管这样做不一定对社会有好处。
1.戴比尔斯公司的钻石垄断、美国商店的价格匹配、商家之间通过比价网站价格协调、包括大型募捐活动,都是这样的局面。
2.合作的利益大就不会竞争,背叛的成本低才会背叛。
3.打破这个局面的一个办法就是扩大市场准入,让更多的参与者进来,让商家的协调没那么容易。另外一个办法就是依靠政府的力量反垄断,相当于全体消费者联合起来去对付那些巨头。
博弈局面三对策:先下手为强+后发者优势
1.动态博弈
2.小鸡博弈:只要你能确定对手的底线,那么先发制人,造成既成事实,就能逼迫对手就范。
3.悬崖策略是动态进行的小鸡游戏。双方每一步都在推动危机升级,这是一个危险的边缘游戏。
4.最好的办法给对方一个威慑,让它根本不敢出手。威慑有三个要素:实力、决心和让对手知道。
5.先发者暴露信息,后发者利用信息。
6.后发优势=先发者的信息+后发者的出手权。信息是模仿计划,出手权是创新机会。
博弈局面四:信息不对称
采取策略:传达信息最好的办法是“发信号”,这意味着你要用行动去证明自己。
1.一种常见的博弈局面是有一方参与者知道一个关键信息,而另外一方不知道。一方强烈滴想让另一方知道他的信息,但是又怕对方不信。一方强烈地想知道对方的信息,但是又怕对方说谎。这就叫“信息不对称”。
2.花钱、花时间、或者花的是脸面,但又都没什么直接的用处——在博弈论看来,人们做这样的事情,都是为了解决信息的不对称。
博弈局面四对策:威胁和承诺
1.威胁和承诺都是在博弈双方都没有采取实质性行动之前,一方通知另一方的声明。所谓威胁,就是我要求你不要做某事——我说如果你做了,我就会对你进行惩罚。所谓承诺。就是我要求你去做某件事——如果你做了,我就会给你一个奖励。
2.只有可信的威胁和承诺才有意义。
3.可信=别无选择。发出可信的威胁或者承诺有三个办法:给别人惩罚你的权力;主动取消自己的选项;建立声望。
博弈局面五:最高级的应用:设计博弈
1.学习博弈论的确有一个比作player更高级的视角。那就是做为规则的制定者,去给人设计博弈局面。
2.房产经纪人薪酬设计、竞拍规则设计,都可以改变局面。但用于真实世界的制度设计,它未必有实用价值。
3.一般人遵守规则,少数人违反规则,有的人制定规则。设计一个博弈,比参加一个博弈要难得多,这是管理者的学问。
博弈局面五对策:随机选择策略
1.只说谎话就等于只说实话。想要真的迷惑对手,你必须把谎话和实话混合起来。
2.你的混合概率选择,应该把对手能得到的最大报偿给最小化。你要按照一定的概率,混合自己的打法。你混合打法的这个规律,必须是让对手无法利用的。
3.不是真随机,就会被破解。随机性,才是真正的“诡道”。
博弈局面六:纳什均衡是博弈结局,可是真实世界从来都没有结局——这是因为博弈论总在变化,我们甚至可以主动改变博弈。
博弈局面六对策:最高视角:观察不同博弈策略在人群中的演化。博弈永无休止。
1.即便纳什均衡并不知有一种,冥冥之中仍然存在一些规律,在限制我们选择策略的自由。这些规律决定了社会的演化。
2.如果使用一个策略能带来好的报偿,人们就会模仿这个策略,这个策略就会流行开来。
3.策略的优势不是永恒的。你必须考虑当前社会的博弈格局,特别是其他人都在使用什么策略,才知道自己的最佳策略是什么。到底要在什么比例的情况下随大流,甚至要不要随大流,都取决于具体的博弈格局。
本文出自天天悦读,转载时请注明出处及相应链接。
本文永久链接: https://yuedu.biz/game-theory/