囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。(×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。( √) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。( √) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。( √) 如果阶段博弈 G={A1, A2, …,An; u1, u2, …,un) 具有多重 Nash 均衡,那么可能(但不必)存在重复博弈 G(T) 的子博弈完美均衡结局,其中对于任意的 t<T ,在t阶段的结局并不是 G的Nash 均衡。( √)(或:如果阶段博弈 G={A1, A2, …,An; u1, u2, …,un) 具有多重 Nash 均衡,那么该重复博弈 G(T) 的子博弈完美均衡结局,对于任意的 t<T ,在 t阶段的结局一定是 G的Nash 均衡。) 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。( √)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×)) 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。( √) 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。( √)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×)) 根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game) 和动态博弈(dynamic game) 。如果阶段博弈 G有唯一的 Nash 均衡,那么对任意有限次 T,重复博弈 G(T) 有唯一的子博弈完美结局:在每一阶段取 G的Nash 均衡策略。( √) 1、无限次重复博弈与有限重复博弈的区别: 。在有限次重复博弈中, 存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。 b. 无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题, 必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。 c. 无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。 4、根据两人博弈的支付矩阵回答问题: ab A2,3 0,0 B0,0 4,2 (1) 写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈( 6分) (2) 找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是 Pareto 有效。(3) 求出该博弈的混合策略纳什均衡。(7分) (1) 策略甲:A B 乙:a b 博弈树(草图如下: (2)Pure NE(A, a); (B, b) 都是 Pareto 有效,仅(B, b)是K-H有效。(3)Mixed NE((2/5, 3/5); (2/3, 1/3)) 5、用反应函数法求出下列博弈的所有纯
博弈论复习题及研讨 来自淘豆网m.daumloan.com转载请标明出处.