额……怎么来说这个东东呢?是在有些困难,虽然博弈无时无刻都在发生,可以这样说有人的地方就有博弈。但是对于如何定义博弈这个概念就比较困难。博弈论一般定论是指意识到将会相互影响的决策者的行为。这里的决策者也就是参与者,就是做出决策的个体。在博弈论中,参与人对自然和其他参与人的行为做出反应,这个反应就是来自于策略,在某时候策略等于行动,但是有时又不是总是相等的。因为策略告诉参与人该怎样做,就算参与人并没有期望这种情况会出现或发生。额……好像鬼扯远了,回到原点,怎样理解博弈的定义呢?
其实细想也是很简单的:在脑里想象这么一个场景(要是有条件可以亲身去看看),在菜场里,有两个人,一个是大妈级的人,另一个是奸商级的人。大妈想买奸商的菜但是想以最低的价格,奸商肯定不肯了,他卖菜不是为了赚更多的钱吗?于是,他们之间就展开了口水战,两个人这样的目的是为实现各自的利益最最大化(在经济学上的定义),于是……他们就发生了博弈(“口水战”博弈)。在博弈上讲实现自己利益最大化是靠参与人的支付( )来体现,所谓参与人的支付,不是说那个参与人给另一个参与人多少钱或是多少有价值的东西。这里的支付是指在所有参与人和自然都选择了自己的策略且博弈已经结束,则参与人得到的效用,同时也可以指期望效用。而自然指的是非人参与人俗称虚拟参与人,就是以一种机械的方式来采取行动。这样的话就凑齐了1.参与人2.支付3.行动,但是这样还不是完整的博弈,在真正的博弈中除了上述三个还有一个,也是博弈最最重要的:信息。信息就是参与人掌握的对这场博弈有用的数据,它可以指对自然和其他参与人的了解。这四个就是博弈的规则,有了这四个就构成了博弈。上面的那个例子,参与人有两个:大妈and奸商。支付呢,很显然,大妈想少付钱奸商想多赚钱。行动:两个人的口水战。信息:这个就比较复杂,要考虑天时地利人和,假设,时间为菜场快收摊的时候,大妈的信息里面知道奸商急欲收摊,而且那菜是最后的一捆了,那么大妈就会选择继续和他进行口水战。如果,再假设奸商的信息里知道大妈很想买这捆菜,那么他也会选继续和大妈进行口水战。由此可以看出信息在很大程度上决定了博弈的进行。在这里可以先忽略信息对博弈的作用,同时这是一个零和博弈,零和博弈是指所有的参与人的支付总和是0或者是一个定值。在这里,菜的价格是一定,假如大妈用原价买,那她就是失去了钱,而奸商是得到钱。但是,他们的支付总和是零,假如大妈成功了,那么大妈就少付的钱,也就是奸商少赚了,就算这样他们的总和还是定值。
说了这么多,可能对于博弈还是很抽象,这是很正常的,其实我也是一样……
下面就讲一下一个经典博弈:囚徒困境。
就是说两个人犯了法被警察抓了,警察对他们进行分开审问,他们有以下的策略可以做选择:抵赖或者招供。如果两个同时招了的话,每个人做8年牢;如果一个人招了而另一个人没招则没招的那个人做10年牢招了的不坐牢;如果他们选择同时抵赖,那么他们每人做1年牢。对于这个博弈可以做成图表,这样更容易去分析。
甲招 不招
招 -8,-8 0,-10
乙不招 -10,0 -1,-1
这是一个矩阵博弈,具有四个数字的2X2博弈。
这里,肯定会有人认为甲乙会选择都抵赖,这样对于两个人都是皆大欢喜,只做一年的牢,但是在这个博弈中我们忘了一件事情,那就是信息。他们是分开审问的,也就是说甲乙不知道他们对方的选择,假如他们之前先相互通一下气,或许在这儿他们会选(不招,不招)。但是这里我们没有假设这个。如何分析这个呢?总共有2种方法:1.先看甲,他在选择时,他会考虑乙的选法,假如甲选择不招,那么假如乙也选择不招那固然好,但是如果乙选择招了,那么完蛋了,甲自己要做十年的牢,假如甲选择招了,那么若乙选择不招,那么他可以走人,假如乙也选择招了,那么没办法做八年吧,要知道前面已经假定了信息是不通的,也就是说乙无法拉着甲说他上有八十岁的老母,下有吃奶的孩子。甲凭什么要吃这个亏呢?且博弈假设每个参与人都是理性的,所以他最好的选择是招,因为这里是一个对称博弈,所以对甲的一系列推论同样适用于乙,那么乙也会选择招。那么就形成了策略组合(博弈中的所有参与人选择自己的策略所组成的有序集)(招,招),也就是大家做八年的牢。2.就是采用纳什均衡,首先我们要知道什么事均衡:博弈中的N个参与人每人选取的最佳策略所组成的一个策略集。均衡策略:参与人在最大化各自的支付时所选取的策略。纳什均衡:一个策略组合S*中,在其他参与人都不会改变已有的策略的条件下,没有参与人有激励改变自身的策略。而这个囚徒困境的博弈的纳什均衡有两个一个是(招,招)和(不招,不招)但是相对于来说(不招,不招)是弱纳什均衡,所以(招,招)是两个人的最好选择。
|