本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 X; U7 a, Y* u. M( y! M
* k. B$ n, j* M, M- D3 t. L' s严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 v7 N5 k" v' ~, T' g
以下三个定义:& B* D) [( Z6 G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , E" o+ @1 G {$ |
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 L5 L/ ~4 W8 j ?6 x6 Y
所谓的双方优势策略则是指双方利益总和最大的策略。
/ m8 q. O E% Z- A. [+ o[编辑本段]严格优势策略举例分析; `9 ^/ `) _% R: {5 E& z
一、经典的囚徒困境
+ t* j/ A' S5 }$ S 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ [$ m' C! ^2 \9 w) z5 I1 H. Q1 c 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; W8 G3 w: h. O5 Z0 @% t- K& a, k8 |
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 ]9 j0 O) W- B8 C. }5 t# P0 i5 i
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / `0 V: }4 }; c! c; p' H* x' B
若二人都互相检举(互相“背叛”),则二人同样判监2年。; T1 x0 B& f# }$ O" s
. b- J- V' j+ Y! M
用表格概述如下:0 w$ {5 I) L0 e5 m
* A6 n' n! B0 u8 n! b9 W F 甲沉默(合作) 甲认罪(背叛)
5 E/ K2 |, B! V# s# J乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" D( J1 c: M5 z/ n' j. N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 r4 }1 H3 u! Z2 E
: g5 X4 q" @/ f, n 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( E9 R: l( K+ H4 S- t& h 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 ?$ k8 B% q* F5 @0 ? 若对方沉默、背叛会让我获释,所以会选择背叛。 : {' ~" w* s2 `) }& Q2 @) i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 f- [* a d5 K+ ^% F 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # F ?' a. @. g0 Z0 a, q% F4 w4 S1 G! l
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 t, P( L4 y& R% {- s6 H
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 G$ W( `! g+ I8 f
[编辑本段]二、智猪博弈理论3 c% u, O( Z i& @/ g' L( |% q/ Q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 E* S7 a) Q6 X& U3 F3 @9 y& K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 C; H' ^8 N! ~* z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, {% m5 f) v( t) Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 N4 e0 L6 N6 X- v# L3 W; D9 T! N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : D' \$ \" s3 h% M% G) J0 X. m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ a- n& ]2 o# ^0 y: Q( u 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. l4 ]. V7 H; k. @7 T# t2 @4 E
, ]2 ~1 q9 @0 ?7 T" d三、关于企业价格策略3 p9 a' i# N7 k5 ~! l o( J) ?; ~
( `; M+ H1 G |. q % R; f3 S0 o: _# w* ? L
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ E: M& B' Z7 J
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; l# P: V$ X) ~% E6 |, I, U
以下三个定义:
( f6 h. \2 g0 L; a1 B% d 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' v* X7 x+ R: Y9 ]( x( y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 P' f9 Q. Q( z. Q+ ^0 u. a
所谓的双方优势策略则是指双方利益总和最大的策略。
8 S3 p+ O( f# c4 I- Q- S[编辑本段]严格优势策略举例分析
0 q' y) }$ ~: z" A; y4 Y 一、经典的囚徒困境 7 P; k! C! f9 s. @) @$ S
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) p: j7 x( X& y) q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; W1 }$ E; f/ ^- L 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 q4 ?' r$ J) K( ^9 `5 c/ V) ?/ O 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . Q: H a9 {2 r, m8 V# \2 c) x
若二人都互相检举(互相“背叛”),则二人同样判监2年。1 P! X# g: t; S2 f) r% i( A
, H/ M, Y9 \1 l g- E! \
用表格概述如下:, l% y' a/ l0 ]8 @$ U
3 \$ M/ M2 i9 K! m 甲沉默(合作) 甲认罪(背叛)
0 U% B% |% R8 R7 x- s: \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 / M1 s+ ]1 e4 _/ d5 P' M$ {/ J7 \
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# _8 e+ M! z/ p' i! `
* D1 X% k6 P! R- K* I! Y' j2 H' A 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 s6 j8 T( ~% i: @( x( `* D
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! V5 @5 @( G+ q8 e/ A. A 若对方沉默、背叛会让我获释,所以会选择背叛。 7 A( g \: }3 a& q o3 u; c
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 / l, F' e6 E" v6 D. n6 E: E; V$ m: M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 @) A! u: ^- \" l
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 \ o' q3 f4 H 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! ]: S6 V, s5 ~[编辑本段]二、智猪博弈理论
+ G& U- i" ^6 Z2 s+ R 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 c. Q. l% u( M7 ]7 Q0 n
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 Q/ r8 G: d. Y 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: h/ j! j4 i, B$ N, n 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . y* x+ h/ i% i* f
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 w0 L) f R; }0 n; k1 f8 a
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( s! M9 C9 U+ K
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ g9 O. X% ?9 f% K6 I+ j * A& e9 \- d9 Y- O" n! }' y
三、关于企业价格策略
* O( R& H+ I, }8 U7 W1 K) P1 {0 x9 s% ~0 S# h
: v3 B. E: p K/ u1 L& x: k9 s& K7 J 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * W3 E: z" d5 \' P" q) _' C3 o- b9 G
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' f' G1 Q, Z7 k- u) c! Q: D
以下三个定义:( P! J; W" h" f7 v, v2 E
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, `5 C O8 R* i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 C# E; Z3 F) B! k# O5 L& { 所谓的双方优势策略则是指双方利益总和最大的策略。 " w+ W% t+ f; C6 g5 `* X
[编辑本段]严格优势策略举例分析3 {4 }& h3 ^$ a6 o) b& P
一、经典的囚徒困境 " m4 _1 x& w( ~2 H& ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 U' g& u2 w3 {/ N* B. t 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 I( F$ b& f+ }6 a' T! u
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 O- d5 V9 a( S; |; A9 I( H/ U 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( s% p: C5 i; D
若二人都互相检举(互相“背叛”),则二人同样判监2年。
W1 D: D7 X l: z }5 t
4 x G- x |9 J$ K; y U# H' X用表格概述如下:6 |" A7 |- `8 k% Q2 j
$ C( Y0 W+ q. K. M
甲沉默(合作) 甲认罪(背叛)
" V! t6 N/ I, C* b乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 v Q3 w) P; ^8 g+ }乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 3 S% X+ P, F& U7 d7 g c/ F
' U8 p- F' h: l- _3 j8 B/ b
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * y0 q( s- P$ |' u: }7 o2 F
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; t: g9 F, X# s* t$ X# O 若对方沉默、背叛会让我获释,所以会选择背叛。
! p' w0 C6 k O* g 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 m1 u. U5 G" R; B% Y( @" T 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, Q* b# `9 s- B3 |5 a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & `8 Y- n: P' o C/ ~4 R' N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 A! B) g% O d2 [5 I7 L3 Q
[编辑本段]二、智猪博弈理论) r" X2 t9 V: j; J5 q: l
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! a' j+ k) z! d" A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; d7 B% r1 G, {/ `% M0 T. O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# S7 x* W& W! x 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / _& U0 b5 c% O$ |( l
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # F3 r9 j3 k$ P. ?3 |
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * K# W5 W3 m! \% _: N6 H" q6 `
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ d- e& ?* S4 e( O+ B% n5 e+ Q/ S, u( n6 q
$ Y7 l+ X/ g8 H) U" O1 l ]& p4 e三、关于企业价格策略
. a0 v. _2 B$ H3 w3 e+ r$ l) p7 w+ T5 f
* g7 g6 b3 \( Q4 L' X. a$ j
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- Q& Q G. B$ T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, S; J* \( ^) c ^ L# R
以下三个定义:
) @# C4 l( }- M0 Y' f 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
V0 Y% {# i9 ]& } 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) r4 W( {* Z) \! J" O6 T 所谓的双方优势策略则是指双方利益总和最大的策略。
1 U' v- T% I! i( K8 l1 p[编辑本段]严格优势策略举例分析9 M" a4 @9 b, j+ x+ T
一、经典的囚徒困境 : K! y* z6 @# Y" k; j& D
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( h+ k+ l' `/ H# u3 s8 \ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # Q2 c ~! C0 h: K: d0 H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; y/ y, x6 h# X, }; v, [+ {
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, b% V* W$ }( W' v* f9 T% j 若二人都互相检举(互相“背叛”),则二人同样判监2年。
- b( v6 H9 _* I. ]0 I+ Q
- Q: u6 ?+ S2 e用表格概述如下:
+ l+ F- s0 I8 k
$ s% V9 Q u8 R" K, I' C! L 甲沉默(合作) 甲认罪(背叛) ; |% ~, t7 V6 L, \6 h
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ~- B4 v; W: | {4 f
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , a4 v% ]' c4 `) m
0 N* \7 A" z$ M8 m
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- Q! N5 f) R& r! I 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' R/ U4 x* k) s8 T* y
若对方沉默、背叛会让我获释,所以会选择背叛。
5 ]# }) X z3 y5 q. [! b 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + \9 D8 z/ a+ W
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 S! H3 P K! X6 _
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
@6 j! ~4 z: M4 W 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 Z( D) d- A2 I4 X. C[编辑本段]二、智猪博弈理论1 Y3 m h1 ~' Q% i2 s8 Z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 a7 \# i X( N! m8 d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 p- R/ I/ a0 t) }) t6 v. s 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 X9 x; u4 T" p) D! m
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 R* o) R$ w0 {2 O “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 n2 ]' Z+ p1 X( z$ V* y' c& T 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 r) c0 f4 z& o) I* J0 ~0 F5 r
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 A: o0 Z6 R1 f6 \
) V" x' v4 _, m, ^" f
三、关于企业价格策略) p, T% D- w; R. r% C5 K
1 a6 S- F6 h5 B: z2 F6 w
9 s# r3 m" c. R t 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 X' H$ u' U) ]8 v; U 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |