首页 > 正文

纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。

谁能把纳什均衡给讲清楚点

为了解释这个问题,我们举两个最典型的例子:囚徒困境和智猪博弈。

谁能把纳什均衡给讲清楚点

囚徒困境囚徒困境是说:有两个小偷集体作案,然后被警察捉住。

谁能把纳什均衡给讲清楚点

谁能把纳什均衡给讲清楚点

警察对两个人分别审讯,并且告诉他们政策:

如果两个人都交代坦白,就可以定罪,两个人各判八年。

如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。

如果两个人都不交代,没法定罪,每个人判一年意思一下。

两个人的收益情况如下所示:

首先我们考虑A的决策。A会想,我如何才能获得更大收益呢? 如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。

显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。

这与我国开车夹塞的例子很像。如果大家都不夹塞,是整体的最优解,但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否夹塞,我夹塞都可以使自己的收益变大。于是最终大家都会夹塞,加剧拥堵,反而不如大家都不加塞走的快。

那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。

在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。

智猪博弈智猪博弈是这样一个例子:有一个食槽中装有十份食物,但是按钮在另一端。需要到另一段按一下按钮食物才能掉下来。大猪和小猪都在食槽一端,他们两个人都可以跑到另一端按按钮然后再回来,速度相同,并且都要消耗一定的体力,并且会造成另一只猪先吃食物。

我们假设每只猪跑去按按钮都要消耗2份食物的体力,并且大猪比小猪吃食物快,所以:

如果大猪先吃食物,二者吃食物的比例为9:1

如果小猪先吃食物,二者吃食物的比例为6:4

如果二者同时吃食物,吃食物的比例为7:3

两只猪都可以选择去按按钮,也可以选择等待。在考虑了两只猪消耗的体力因素后,各种决策对应的收益如下所示:

我们来考虑均衡点。小猪会思考:如果大猪去,我跟着去获得收益1,我等着获得收益4,因此我应该等着。如果大猪不去我去,我获得收益-1,如果我们都等着我收益为0,因此我还是应该等着,这样一来,小猪的决策一定是等待。

在小猪等待的情况下,如果大猪去按按钮,获得收益4,如果大猪不去按按钮,获得收益0,因此大猪会选择去按按钮。这个(4,4)的收益就是纳什均衡点。

这和国家或者公司进行基础研究研发新产品很像。比如一款新的芯片研发需要花很多钱,成功后也能获得更大的收益。在这样的情况下,小国家小公司是没有动力进行研发的,他们会等待大国大公司研发好了之后,直接利用现成的技术获得收益。

我们的芯片产业就是这样一个局面,多年以来我们一直认为自己是发展中国家,没有大力推动半导体产业的基础研究,许多人秉着做不如买,买不如租的观点。现在美国对中国展开贸易战,禁止芯片出口,一下子就卡主我们的脖子了。

约翰纳什是一位传奇人物,前两年出车祸去世了。想了解纳什的一生,可以去看看电影《美丽心灵》

猜你喜欢
发表评论

电子邮件地址不会被公开。 必填项已用*标注

评论信息