《策略思维——商界、政界及日常生活中的策略竞争(大师细说博弈论)》

版权声明:本文为博主原创,如需转载请注明出处。

2012年8月14日,京东商城的首席执行官刘强东在其实名认证的微博上面声明:京东商城的所有大型家电将在未来三年里保持零毛利,“保证比苏宁、国美连锁店便宜至少10%以上”。苏宁立即以微博接招,宣布所有产品价格必然低于京东,否则将给予消费者两倍差价赔付。于是,硝烟还没有升起,京东便偃旗息鼓了。苏宁简单搬用疯狂艾迪的策略便一招致命,击退了京东的挑战

混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手的博弈。在人们的生活中,谈恋爱就是一种混合策略博弈。在谈恋爱的过程中,女孩子通常会对于男孩子的追求反应含糊。因为如果女孩子说她爱男孩子,男孩子就认为已经搞定,就不会继续狠追女孩子了,女孩子会因此失去被追的愉悦。如果女孩子说她不爱男孩子,男孩子就会放弃,女孩子就会失去继续考察男孩子的机会。所以,女孩子总是对于男孩子的追求若即若离,不轻易说她对他爱与不爱。这是混合策略的运用

高个子是发送优良基因的信号,所以人们在谈对象的时候,一般喜欢高个子,这是因为他们或许载有更加优良的基因,可以通过与他们结合把自己的基因遗传下去,因为既然高个子生存更加困难,但是当他们还生存着时,就意味着他们具有更加强大的生存基因。表面看起来,喜欢高个子是因为我们觉得高个子赏心悦目,是美的元素。其实,人类的美感是与生存能力联系起来的。这是所谓进化博弈论的发现

朝鲜知道,美国其实是不会打击朝鲜的。如果美国对朝鲜进行核打击,则东北亚会出现核污染,会伤及驻日本和韩国的美军。美国政府在选民的压力下不得不从东北亚撤出。这样,美国在东北亚核战争中不仅一无所得,而且还会遭到全世界的责骂,并且灰溜溜地从长期盘踞的东北亚撤出。如果美国用高科技常规武器打击朝鲜,朝鲜会用核武器反击,美军大败,加上东北亚的核污染,导致美国同样会从东北亚撤出,朝鲜会崛起,统一半岛。所以,美国人并不会对朝鲜进行打击,无论是用核武器还是常规武器

1969年,当时因为中国与苏联在珍宝岛的冲突,苏联打算对中国进行核打击,被美国的尼克松总统干预制止了。尼克松并不是要帮中国的忙,而是怕中国与苏联的核战争污染了驻日本和韩国的美军,导致美军不得不撤出东北亚。由此,朝鲜核爆反美是它的占优策略——这是博弈论的术语,即在任何情况下都是最优的策略

社会科学当中,研究策略性决策制定过程的分支称为博弈论,原意为游戏理论

橄榄球和扑克是零和博弈:一个人的得就是另一个人的失

我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决策树”留做描述只有一个人参加的情形

假设每提出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化

教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好

相比之下,寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂冠诗人艾尔弗雷德·丁尼生爵士(Alfred,Lord Tennyson)那令人耳熟能详的名句:“爱过之后失去总比从来没有爱过好。”[1] 换言之,爱是一种优势策略

以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈

由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略

另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹

法则2:假如你有一个优势策略,请照办

不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法

法则3:剔除所有劣势策略,不予考虑,如此一步一步做下去

法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应

在同时行动的博弈中,我们有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,与此同时假设你的对手也在这么做;三是寻找和运用均衡

中国古代战略家孙子曾经给过这样的提示:“围师遗阙”[5]。只要留下出口,敌人就会认定还有逃生机会。假如敌人看不到任何逃跑的出口,就会迸发破釜沉舟般的勇气,顽抗到底。孙子的目的就是不给敌人对自己做出一个拼死战斗的非常可信的承诺的机会

不错,你若不听话,别人就不会给你好果子吃,但这一事实并不能作为你坐等对方发出一个威胁的借口。注意,这句格言只限于允许对方发出威胁而已。假如对方同时做出威胁和许诺,那么双方都会得到更好的结果

能奏效的最小而又最恰当的威胁应该成为美国的首要选择,务必使惩罚与罪行相适应

第一个原则是改变博弈的结果,意思是说,务必使遵守你的承诺成为符合你自身利益的选择:把威胁变成警告,把许诺变成保证

(1)建立和利用一种信誉。 (2)写下合同。 这两种手段都能使破坏承诺的代价高于遵守承诺的代价

第二个原则是改变博弈,使你背弃承诺的能力大受限制。在这方面,我们考察三种可能性。最极端的做法莫过于剥夺自己反悔的机会,比如禁止自己走到反悔的地步,或断绝一切反悔的后路。甚至还有一种可能性,就是离开决策位置,听天由命

第三个原则是充分利用别人,帮助自己遵守承诺。一个团队也许会比单独一个人更容易建立可信度。又或者,你可以考虑雇用其他人来做你的代表

这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺依曼(John von Neumann)与奥斯卡·摩根斯坦(Oscar Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡

赫鲁晓夫的目光越过了核导弹事件的边缘,却看到了他不想看到的景象,因此宣布撤退。“边缘政策”一词看来就是为这么一种策略设计的,这种策略将你的对手带到灾难的边缘,迫使他撤退。注67肯尼迪在古巴导弹危机中采取的行动,被普遍视为成功运用边缘政策的典范

在目前这个案例的具体情况下,动用一个自动装置看来就是最有把握的一个办法。注69这个办法就是影片《万无一失》(Failsafe)和《奇爱博士》的基础。在《奇爱博士》一片中,苏联安装了一个“末日毁灭机”,专门监测美国有没有越界,并由一套稳定的电脑程序确定了一系列具体条件,一旦满足这些条件,这个装置就会自动从苏联方面实施报复行动。而在《万无一失》一片中,则是美国人拥有这样的“末日毁灭机”。读者若是看过这两部电影,一定明白肯尼迪总统为什么不能借助一个类似装置使他的威胁听上去更加可信。(我们强烈推荐没有看过这两部电影的读者去看。

大多数打字机的键盘设计就是一个很好的例子。直到19世纪后期,对于打字机键盘的字母应该怎样排列仍然没有一个标准模式。1873年,克里斯托弗·斯科尔斯(Christopher Scholes)协助设计了一种“新的改进了的”排法。这种排法取其左上方第一行头六个字母而称为QWERTY。选择QWERTY排法的目的是使最常用的字母之间的距离最大化。这在当时确实是一个很好的解决方案:有意降低打字员的速度,从而减少手工打字机各个字键出现卡位的现象。到了1904年,纽约雷明顿缝纫机公司(Remington Sewing Machine Company of New York)已经大规模生产使用这一排法的打字机,而这种排法实际上也成为产业标准。不过,今天的电子打字机和文字处理器已经不存在字键卡位的问题。工程师们已经发明了一些新的键盘排法,比如DSK(德沃夏克简化键盘),能使打字员的手指移动距离缩短50%以上。同样一份材料,用DSK输入要比用QWERTY输入节省5%~10%的时间。[1] 但QWERTY是一种存在已久的排法。几乎所有打字机都用这种排法,我们原来学习的也是这种排法,因此不大愿意再去学习接受一种新的键盘排法。于是,打字机和键盘生产商继续沿用QWERTY。一个包含错误的恶性循环就此形成。[2

来自博弈论的重要启迪在于,早日发现潜力,为明天取得优势做好准备,这是因为,一旦某项技术取得了足够大的先行优势,其他技术哪怕更胜一筹,恐怕也难以赶上。因此,假如早期花更多时间不仅研究什么技术能适应今天的需要,而且考虑什么技术最能适应未来,那么未来就可能获得很大的收获

假如行动是一点一点推进的,那么,随着行动的逐步推进,每一步都有可能在绝大多数决策者眼里显得很有吸引力。但最后结果却使每一个人落得还不如原来的下场。理由在于,投票忽略了偏好的强度

心理学家在其他场合也见过这样的行为。有些人害怕正视自己的能力的极限。在这种情况下,他们的做法是提高自己失败的机会,从而回避自己能力的极限问题。比如,一个成绩处在及格线边缘的学生可能不肯在一场测验前夕复习,这样的话,若是他考不及格,人们只会说那是因为他没花时间学习,不是能力不足。虽然这么做不正当,还会引起反效果,但在你和你自己进行博弈的时候,并不会有“看不见的手”保护你

天神宠爱者英年早逝

实际上,这么一个威胁曾在1853年使用过。美国海军上将马修·C·佩里(Matthew C.Perry)的黑漆漆的庞大战舰编队成功地说服了日本幕府时代的将军,使后者同意向美国商界开放日本市场。今天,日本把美国由于要求开放日本市场而施加的过分压力称为“黑色舰队再次到访”